CN1795269A

CN1795269A - 用于将需要的性状迅速赋予生物的方法和系统

Info

Publication number: CN1795269A
Application number: CNA200480014300XA
Authority: CN
Inventors: 古泽满
Original assignee: Neo Morgan Laboratory Inc
Current assignee: Neo Morgan Laboratory Inc
Priority date: 2003-03-28
Filing date: 2004-03-26
Publication date: 2006-06-28
Also published as: US20070077560A1; US20050003536A1

Abstract

提供了调节细胞的遗传性状的转化率的方法，包括调节细胞的基因复制的倾向于错误的频率的步骤。提供了生产具有受调节的遗传性状的细胞的方法，包括下述步骤：(a)调节细胞的基因复制的倾向于错误的频率，和(b)繁殖得到的细胞。提供了生产具有受调节的遗传性状的生物的方法，包括下述步骤(a)调节生物的基因复制的倾向于错误的频率，和(b)繁殖得到的生物。

Description

用于将需要的性状迅速赋予生物的方法和系统

技术领域

本发明涉及迅速改变生物的遗传性状的方法，和通过该方法得到的生物和产物。

背景技术

有史以来，人类一直在尝试改变生物的遗传性状。在出现所谓的遗传工程之前，已经尝试用杂交育种等来得到具有需要的性状的生物，或者，已经由辐射随机地造成突变，和已经分离出具有改变的遗传性状的突变生物。

新发展起来的遗传工程更大程度地促进了获取具有改变的遗传性状的生物。遗传工程已经广泛地用于生产遗传地修饰的生物，其中外源基因被导入生物中。但是，仅仅向其中导入了外源基因的生物并不总能获得需要的遗传性状。与自然进化过程不同的操作可能导致意外的结果。因此，政府当局对源自遗传地修饰的生物(GMO)的食物的管理比常规食物更严格。

因此，本领域日益需要符合自然进化地将需要的遗传性状赋予生物的方法和生产这样的生物的方法。

迄今为止，已经出现了下面的已知的诱变方法。

(1)自然突变：生物在通常的环境下正常生长时发生的突变称作自然突变。认为自然突变的主要原因是DNA复制的错误和内源诱变物(核苷酸类似物)(Maki，“Shizenheni To Shufukukiko[NaturalMutation And Repair Mechanism]”，Saibo Kogaku[CellEngineering]，Vol.13，No.8，pp.663-672，1994)。

(2)用辐射、诱变物等处理：通过辐射处理，例如紫外光、X-射线等，或用人工诱变物处理，例如烷化剂等，会损害DNA。这样的损害可能在DNA复制的过程中作为突变固定下来。

(3)使用PCR(聚合酶链反应)：在PCR中，由于DNA是进行体外扩增，所以PCR系统缺少一部分胞内突变抑制机制。因此，可以高频率地诱导突变。如果将DNA改组(shuffling)(Stemmer，Nature，Vol.370，pp.389-391，Aug.1994)与PCR结合，则可以避免有害突变的积累，且可以在基因中积累许多有益的突变。

(4)使用突变因子(或增变株)：在几乎所有的生物中，通过突变抑制机制来将自然突变的频率维持在相当低的速度。突变抑制机制包括许多涉及10个或更多个基因的阶段。突变在其中破坏了一个或多个基因的生物中高频率地发生。这些生物称作增变株。这些基因称作增变基因(Maki，同上，和Horst等，Trends in Microbiology，Vol.7，No.1，pp.29-36，Jan.1999)。

使用增变株的方法是不一致的方法(Furusawa M.和Doi H.，J.Theor.Biol.157，pp.127-133，1992和Furusawa M.和Doi H.，Genetica 103，pp.333-347，1998；日本专利公开8-163986；日本专利公开8-163987；日本专利公开9-23882；WO00/28015)。在该不一致的方法中，尚未阐明实际上生成的生物(更具体地，高等生物(例如，真核生物)是否能表现出正常的生长曲线。另外，尚未证实该不一致的方法能加速自然进化。

在模仿“高等生物”(例如，真核生物)，例如具有二倍体或更多套含有多个复制位点的染色体的真核生物的不平衡突变模型时，可能发生致死的突变。尚不清楚该不一致的方法是否可以用于实际的情形中。

在模仿不平衡突变模型时，将突变随机地导入例如具有较低复制精确度的不连续链中。尚不清楚这样的突变是否有助于进化。

在尝试使用具有导入的增变基因的大肠杆菌(E.coli)突变株的抗药性实验中，已经得到了抗药的菌株。但是，仍没有提示可以任意地改变或控制进化速度的系统。

尚无实验能通过可提供进化速度测量的基因组水平的分析，来确定是否以不均衡的方式实际上插入了突变。考虑到可以容易地实现测序技术本身，可以认为还没有报道鉴别出了突变位点的实例。

发明内容

本发明的发明人已经解决了上述问题，他们发现生物的进化速度不是时间的函数，且可以通过调节生物的倾向于错误的频率来调节，并证实了具有改变的进化速度的真实生物能以与自然进化的生物基本上相同的速度增殖。根据本发明，可以证实错误阈值不会显著影响生物的进化。

在本发明的另一方面，发明人研究了具有不同复制精确度的准种(quasispecies)的错误阈值。发明人证实了无错误的和倾向于错误的聚合酶的共存会增加错误阈值，而不破坏性地遗失遗传信息。发明人还指出复制子(replicores)(复制剂)会影响错误阈值。结果，发明人发现，具有不同复制精确度的准种会降低参与生成各种突变体的选择性进化的遗传成本。

适当的进化需要遗传多样性和有利突变体的稳定繁殖。基因组的精确复制能保证稳定的繁殖，尽管在复制过程中的错误会生成遗传多样性。因此，进化的一个关键是复制精确度所固有的。复制精确度依赖于核苷酸聚合酶。认为胞内聚合酶具有相似的复制精确度。进化模型的大多数研究还已经以相似的复制精确度为基础。但是，已经证实无错误的和倾向于错误的聚合酶在自然产生的生物中共存。本发明因此能与自然相容。

本发明提供了下述内容。

1.调节细胞的遗传性状的转化率的方法，包括下述步骤：

(a)调节细胞的基因复制的倾向于错误的频率。

2.根据项目1的方法，其中存在至少2种在基因复制中起作用的倾向于错误的频率的试剂。

3.根据项目2的方法，其中至少约30％的倾向于错误的频率的试剂具有更少的倾向于错误的频率。

4.根据项目1的方法，其中在基因复制中起作用的试剂具有不同的倾向于错误的频率。

5.根据项目1的方法，其中具有更少的倾向于错误的频率的试剂基本上是无错误的。

6.根据项目2的方法，其中该倾向于错误的频率彼此存在至少101的不同。

7.根据项目2的方法，其中该倾向于错误的频率彼此存在至少102的不同。

8.根据项目2的方法，其中该倾向于错误的频率彼此存在至少103的不同。

9.根据项目1的方法，其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的试剂的倾向于错误的频率：能去除异常碱基的修复试剂和能修复错配的碱基对的修复试剂，该试剂存在于细胞中。

10.根据项目1的方法，其中调节倾向于错误的频率的步骤包含提供细胞中的双链基因组DNA的一条链和另一条链之间的错误数目的差异。

11.根据项目1的方法，其中调节倾向于错误的频率的步骤包含调节细胞的DNA聚合酶的倾向于错误的频率。

12.根据项目11的方法，其中该DNA聚合酶具有校对功能。

13.根据项目11的方法，其中该DNA聚合酶包含至少一种选自下述的聚合酶：真核细胞的DNA聚合酶α、DNA聚合酶β、DNA聚合酶γ、DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。

14.根据项目1的方法，其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的聚合酶的校对活性：真核细胞的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。

15.根据项目1的方法，其中调节倾向于错误的频率包含调节原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的校对活性。

16.根据项目1的方法，其中调节倾向于错误的频率包含将DNA聚合酶变体导入细胞中。

17.根据项目16的方法，其中通过选自同源重组和使用基因导入或质粒的转化的方法，将DNA聚合酶变体导入细胞中。

18.根据项目1的方法，其中调节倾向于错误的频率包含导入原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体。

19.根据项目18的方法，其中该原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体包含缺失了其校对活性的突变。

20.根据项目1的方法，其中调节倾向于错误的频率的步骤包含将倾向于错误的频率提高到高于野生型细胞的频率。

21.根据项目12的方法，其中该DNA聚合酶的校对功能低于野生型DNA聚合酶。

22.根据项目12的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，至少1个错配的碱基的数目比野生型DNA聚合酶至少大1。

23.根据项目12的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基。

24.根据项目12的方法，其中该DNA聚合酶的校对功能能提供至少2个错配的碱基。

25.根据项目12的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，其比率为10^-6。

26.根据项目12的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，其比率为10^-3。

27.根据项目12的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，其比率为10^-2。

28.根据项目1的方法，其中该细胞是革兰氏阳性的或真核的细胞。

29.根据项目1的方法，其中该细胞是真核细胞。

30.根据项目1的方法，其中该细胞是单细胞的或多细胞的生物。

31.根据项目1的方法，其中该细胞是动物、植物、真菌或酵母细胞。

32.根据项目1的方法，其中该细胞是哺乳动物细胞。

33.根据项目1的方法，其中在遗传性状转化后，该细胞基本上具有与野生型细胞相同的生长。

34.根据项目1的方法，其中该细胞天然地具有至少2种聚合酶。

35.根据项目1的方法，其中该细胞天然地具有至少2种聚合酶，这至少2种聚合酶具有不同的倾向于错误的频率。

36.根据项目1的方法，其中该细胞具有至少2种聚合酶，这至少2种聚合酶中的一种参与后随链的倾向于错误的频率，且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。

37.根据项目1的方法，其中该细胞具有对环境的抗性，且转化之前的细胞不具有该抗性。

38.根据项目37的方法，其中作为参数的环境包含至少一种选自下述的因素：温度，湿度，pH，盐浓度，营养物，金属，气体，有机溶剂，压力，大气压力，粘度，流速，光强度，光波长，电磁波，辐射，重力，张力，声波，该细胞以外的细胞，化学试剂，抗生素，天然物质，心理应激和机体应激，或其组合。

39.根据项目1的方法，其中该细胞包括癌细胞。

40.根据项目1的方法，其中该细胞构成组织。

41.根据项目1的方法，其中该细胞构成生物。

42.根据项目1的方法，还包括：

在转化细胞的遗传性状后，使细胞分化成组织或生物。

43.根据项目1的方法，其中在预定条件下调节倾向于错误的频率。

44.根据项目43的方法，其中通过调节至少一种选自下述的因素来调节倾向于错误的频率：温度，湿度，pH，盐浓度，营养物，金属，气体，有机溶剂，压力，大气压力，粘度，流速，光强度，光波长，电磁波，辐射，重力，张力，声波，该细胞以外的细胞，化学试剂，抗生素，天然物质，心理应激和机体应激，或其组合。

45.生产具有受调节的遗传性状的细胞的方法，包括下述步骤：

(a)调节细胞的基因复制的倾向于错误的频率；和

(b)繁殖得到的细胞。

46.根据项目45的方法，还包括：

筛选具有需要的性状的繁殖细胞。

47.根据项目45的方法，其中存在至少2种在基因复制中起作用的倾向于错误的频率的试剂。

48.根据项目45的方法，其中至少约30％的倾向于错误的频率的试剂具有更少的倾向于错误的频率。

49.根据项目45的方法，其中在基因复制中起作用的试剂具有不同的倾向于错误的频率。

50.根据项目45的方法，其中具有更低的倾向于错误的频率的试剂基本上是无错误的。

51.根据项目45的方法，其中该倾向于错误的频率彼此存在至少101的不同。

52.根据项目45的方法，其中该倾向于错误的频率彼此存在至少102的不同。

53.根据项目45的方法，其中该倾向于错误的频率彼此存在至少103的不同。

54.根据项目45的方法，其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的试剂的倾向于错误的频率：能去除异常碱基的修复试剂和能修复错配的碱基对的修复试剂，该试剂存在于细胞中。

55.根据项目45的方法，其中调节倾向于错误的频率的步骤包含提供细胞中的双链基因组DNA的一条链和另一条链之间的错误数目的差异。

56.根据项目45的方法，其中调节倾向于错误的频率的步骤包含调节细胞的DNA聚合酶的倾向于错误的频率。

57.根据项目56的方法，其中该DNA聚合酶具有校对功能。

58.根据项目56的方法，其中该DNA聚合酶包含至少一种选自下述的聚合酶：真核细胞的DNA聚合酶α、DNA聚合酶β、DNA聚合酶γ、DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。

59.根据项目45的方法，其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的聚合酶的校对活性：真核细胞的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。

60.根据项目45的方法，其中调节倾向于错误的频率包含调节原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的校对活性。

61.根据项目45的方法，其中调节倾向于错误的频率包含将DNA聚合酶变体导入细胞中。

62.根据项目61的方法，其中通过选自同源重组和使用基因导入或质粒的转化的方法，将DNA聚合酶变体导入细胞中。

63.根据项目45的方法，其中调节倾向于错误的频率包含导入原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体。

64.根据项目63的方法，其中该原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体包含仅仅缺失了其校对活性的突变。

65.根据项45的方法，其中调节倾向于错误的频率的步骤包含将倾向于错误的频率提高到高于野生型细胞的频率。

66.根据项目57的方法，其中该DNA聚合酶的校对功能低于野生型DNA聚合酶。

67.根据项目57的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，至少1个错配的碱基的数目比野生型DNA聚合酶至少大1。

68.根据项57的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基。

69.根据项目57的方法，其中该DNA聚合酶的校对功能能提供至少2个错配的碱基。

70.根据项目57的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，其比率为10^-6。

71.根据项目57的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，其比率为10^-3。

72.根据项目57的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，其比率为10^-2。

73.根据项目45的方法，其中该细胞是革兰氏阳性的或真核的细胞。

74.根据项目45的方法，其中该细胞是真核细胞。

75.根据项目45的方法，其中该细胞是单细胞的或多细胞的生物。

76.根据项目45的方法，其中该细胞是动物、植物、真菌或酵母细胞。

77.根据项目45的方法，其中该细胞是哺乳动物细胞。

78.根据项目45的方法，其中在遗传性状转化后，该细胞基本上具有与野生型细胞相同的生长。

79.根据项目45的方法，其中该细胞天然地具有至少2种聚合酶。

80.根据项目45的方法，其中该细胞天然地具有至少2种聚合酶，这至少2种聚合酶具有不同的倾向于错误的频率。

81.根据项目45的方法，其中该细胞具有至少2种聚合酶，这至少2种聚合酶中的一种参与后随链的倾向于错误的频率，且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。

82.根据项目45的方法，其中该细胞具有对环境的抗性，且转化之前的细胞不具有该抗性。

83.根据项目82的方法，其中作为参数的环境包含至少一种选自下述的因素：温度，湿度，pH，盐浓度，营养物，金属，气体，有机溶剂，压力，大气压力，粘度，流速，光强度，光波长，电磁波，辐射，重力，张力，声波，该细胞以外的细胞，化学试剂，抗生素，天然物质，心理应激和机体应激，或其组合。

84.根据项目45的方法，其中该细胞包括癌细胞。

85.根据项目45的方法，其中该细胞构成组织。

86.根据项目45的方法，其中该细胞构成生物。

87.根据项目45的方法，还包括：

在转化细胞的遗传性状后，使细胞分化成组织或生物。

88.根据项目45的方法，其中在预定条件下调节倾向于错误的频率。

89.根据项目88的方法，其中通过调节至少一种选自下述的因素来调节倾向于错误的频率：温度，湿度，pH，盐浓度，营养物，金属，气体，有机溶剂，压力，大气压力，粘度，流速，光强度，光波长，电磁波，辐射，重力，张力，声波，该细胞以外的细胞，化学试剂，抗生素，天然物质，心理应激和机体应激，或其组合。

90.生产具有受调节的遗传性状的生物的方法，包括下述步骤：

(a)调节生物的基因复制的倾向于错误的频率；和

(b)繁殖得到的生物。

91.通过根据项目90的方法生产的具有受调节的遗传性状的细胞。

92.根据项目91的细胞，其中该细胞基本上具有与野生型细胞相同的生长。

93.通过根据项目90的方法生产的具有受调节的遗传性状的生物。

94.根据项目93的生物，其中该生物基本上具有与野生型生物相同的生长。

95.生产能编码具有受调节的遗传性状的基因的核酸分子的方法，包括下述步骤：

(a)改变生物的基因复制的倾向于错误的频率；

(b)繁殖得到的生物；

(c)鉴别生物中的突变；和

(d)生产能编码具有鉴别出的突变的基因的核酸分子。

96.通过根据项目95的方法生产出的核酸分子。

97.生产由具有受调节的遗传性状的基因编码的多肽的方法，包括下述步骤：

(a)改变生物的基因复制的倾向于错误的频率；

(b)繁殖得到的生物；

(c)鉴别生物中的突变；和

(d)生产由具有鉴别出的突变的基因编码的多肽。

98.通过根据项目97的方法生产出的多肽。

99.生产具有受调节的遗传性状的生物的代谢物的方法，包括下述步骤：

(a)改变生物的基因复制的倾向于错误的频率；

(b)繁殖得到的生物；

(c)鉴别生物中的突变；和

(d)生产具有鉴别出的突变的代谢物。

100.通过根据项目99的方法生产出的代谢物。

101.用于调节生物的遗传性状的核酸分子，包含：能编码具有受调节的倾向于错误的频率的DNA聚合酶的核酸序列。

102.根据项目101的核酸分子，其中该DNA聚合酶是真核生物的DNA聚合酶δ或ε，或革兰氏阳性的细菌的与其对应的DNA聚合酶。

103.根据项目101的核酸分子，其中该DNA聚合酶是真核生物的DNA聚合酶δ或ε，或革兰氏阳性的细菌的与其对应的DNA聚合酶的变体，该变体包含仅仅缺失了其校对活性的突变。

104.根据项目101的核酸分子，其中该DNA聚合酶是真核生物的DNA聚合酶δ，或革兰氏阳性的细菌的与其对应的DNA聚合酶的变体，该变体包含仅仅缺失了其校对活性的突变。

105.载体，其包含根据项目101的核酸分子。

106.细胞，其包含根据项目101的核酸分子。

107.根据项目106的细胞，其中该细胞是真核细胞。

108.根据项目107的细胞，其中该真核细胞选自植物、动物和酵母。

109.根据项目106的细胞，其中该细胞是革兰氏阳性的细菌细胞。

110.根据项目106的细胞，其中该细胞用于调节遗传性状的转化率。

111.生物，其包含根据项目101的核酸分子。

112.通过根据项目106的细胞或其一部分生产的产物物质。

113.核酸分子，其包含在根据项目106的细胞或其一部分中。

114.根据项目113的核酸分子，其能编码涉及受调节的遗传性状的基因。

115.测试药物的方法，包括下述步骤：

使用根据项目106的细胞作为疾病模型，测试药物的效果；

使用野生型细胞作为对照，测试药物的效果；和

对比疾病模型和对照。

116.测试药物的方法，包括下述步骤：

使用根据项目111的生物作为疾病模型，测试药物的效果；

使用野生型生物作为对照，测试药物的效果；和

对比疾病模型和对照。

117.用于调节生物的遗传性状的转化率的至少2种聚合酶的组，其中该聚合酶具有不同的倾向于错误的频率。

118.根据项目117的组，其中至少2种聚合酶中的一种参与后随链的倾向于错误的频率，且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。

119.根据项目117的组，其中该聚合酶的组源自相同的物种。

120.用于生产具有受调节的遗传性状的生物的至少2种聚合酶的组，其中该聚合酶具有不同的倾向于错误的频率。

121.根据项目120的组，其中至少2种聚合酶中的一种参与后随链的倾向于错误的频率，且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。

122.根据项目121的组，其中该聚合酶的组源自相同的生物物种。

123.至少2种聚合酶在调节生物的遗传性状的转化率中的用途，其中该聚合酶具有不同的倾向于错误的频率。

124.至少2种聚合酶在生产具有受调节的遗传性状的生物中的用途，其中聚合酶具有不同的倾向于错误的频率。

因而，本文所述的发明使得提供符合自然进化地将需要的遗传性状赋予生物的方法的优点成为可能。

在阅读和理解了下面参考附图的详细描述后，本领域的技术人员能明白本发明的这些和其它的优点。

附图简述

图1表明，本发明实施例1的突变体和其野生型具有基本上相同的生长曲线。

图2显示了被赋予了高温抗性的本发明的实施例1。

图3A显示了被赋予了高温抗性的本发明的实施例1的照片。从po13突变株(缺少外切核酸酶的DNA聚合酶δ)分离出了能在高温生长的突变株。标记*指示亲本株(AMY128-1)，且7个其它的菌落是高温抗性株。

图3B显示了被赋予了高温抗性的本发明的实施例1的另一张照片。从po12突变株(缺少外切核酸酶的DNA聚合酶ε)分离出了能在高温生长的突变株。标记*指示亲本株(AMY2-6)，且7个其它的菌落是高温抗性株。

图4A显示了被赋予了高温抗性的本发明的实施例1的照片。箭标指示死亡的、且具有泡的细胞。对高温抗性株1和2进行单独的实验。在亲本株中，没有细胞能在41℃存活。通过本发明的方法得到的高温抗性株可以在41℃存活。

图4B显示了被赋予了高温抗性的本发明的实施例1的另一张照片。从啤酒糖酵母(S.cerevisiae)的po12突变株(缺少外切核酸酶活性的DNA聚合酶ε)中，分离出了能在被认为酵母不能存活的41℃高温生长的突变株。顶部显示了亲本株(AMY2-6)，且其它的7个菌落是高温抗性的突变株。

图5显示了具有类似的复制精确度和不同的复制精确度的准种的实例。

图6显示了错误的突然大变动(catastrophe)。

图7显示了在各种数目的复制剂时，作为无错误的聚合酶的相对浓度的函数的错误阈值。

图8显示了基于大肠杆菌的参数的可允许的错误率的实例。

图9示意性地显示了要导入转基因小鼠中的载体。

图10显示了用于确认外源基因的PCR方法。从左依次是：有mPGK2Tg，无mPGK2Tg，有Fthl17Tg，mPGK2Tg载体，和仅仅pBluescript(对照)(对于每个，都是转基因小鼠#1)，和无#2小鼠Tg，有#2小鼠Tg，#2Tg载体，和pBluescript(对于每个，都是转基因小鼠#2)。标记显示在右端。

图11显示了Cre重组酶在小鼠睾丸中的表达。a显示了mPGK2，b显示了Fthl17，且c显示了对照。线条代表50μm。

图12显示了mPGK2启动子的表达区。

图13显示了Fthl17启动子的表达区。

图14示意性地显示了靶向载体。

图15示意性地显示了组织特异性的重组反应。

图16示意性地显示了使用愈伤组织的筛选方法。

图17示意性地显示了在实施例8的ES细胞的实验中使用的载体。

图18示意性地显示了使用Cre重组酶的重组(靶向)载体。

(序列的描述)

SEQ ID NO.1：酵母DNA聚合酶δ核酸序列

SEQ ID NO.2：酵母DNA聚合酶δ氨基酸序列

SEQ ID NO.3：酵母DNA聚合酶ε核酸序列

SEQ ID NO.4：酵母DNA聚合酶ε氨基酸序列

SEQ ID NO.5：DnaQ部分序列(大肠杆菌)

SEQ ID NO.6：DnaQ部分序列(流感嗜血菌(Haemophilusinfluenzae))

SEQ ID NO.7：DnaQ部分序列(鼠伤寒沙门氏菌(Salmonellatyphimurium))

SEQ ID NO.8：DnaQ部分序列(霍乱弧菌(Vibrio cholerae))

SEQ ID NO.9：DnaQ部分序列(铜绿假单胞菌(Pseudomonasaeruginosa))

SEQ ID NO.10：DnaQ部分序列(脑膜炎奈瑟氏球菌(Neisseriameningitides))

SEQ ID NO.11：DnaQ部分序列(砂眼衣原体(Chlamydiatrachomatis))

SEQ ID NO.12：DnaQ部分序列(天蓝色链霉菌(streptomycescoelicolor))

SEQ ID NO.13：DnaQ部分序列(弗氏志贺氏菌(Shigellaflexneri)2a菌株301)

SEQ ID NO.14：PolC部分序列(金黄色葡萄球菌(Staphylococcusaureus))

SEQ ID NO.15：PolC部分序列(枯草芽孢杆菌(Bacillussubtilis))

SEQ ID NO.16：PolC部分序列(肺枝原体(Mycoplasmapulmonis))

SEQ ID NO.17：PolC部分序列(生殖道枝原体(Mycoplasmagenitalium))

SEQ ID NO.18：PolC部分序列(肺炎枝原体(Mycoplasmapneumoniae))

SEQ ID NO.19：Pol III部分序列(啤酒糖酵母)

SEQ ID NO.20：Pol II部分序列(啤酒糖酵母)

SEQ ID NO.21：Polδ部分序列(小鼠)

SEQ ID NO.22：Polε部分序列(小鼠)

SEQ ID NO.23：Polδ部分序列(人)

SEQ ID NO.24：Polε部分序列(人)

SEQ ID NO.25：Polδ部分序列(稻)

SEQ ID NO.26：Polδ部分序列(拟南芥(Arabidopsis thaliana))

SEQ ID NO.27：Polε部分序列(拟南芥)

SEQ ID NO.28：Polδ部分序列(大鼠)

SEQ ID NO.29：Polδ部分序列(牛)

SEQ ID NO.30：Polδ部分序列(大豆)

SEQ ID NO.31：Polδ部分序列(果蝇)

SEQ ID NO.32：Polε部分序列(果蝇)

SEQ ID NO.33：Polδ酵母改变的核酸序列

SEQ ID NO.34：Polδ酵母改变的氨基酸序列

SEQ ID NO.35：Polε酵母改变的核酸序列

SEQ ID NO.36：Polε酵母改变的氨基酸序列

SEQ ID NO.37：Polδ正向引物

SEQ ID NO.38：Polδ反向引物

SEQ ID NO.39：Polε正向引物

SEQ ID NO.40：Polε反向引物

SEQ ID NO.41：大肠杆菌DnaQ核酸序列

SEQ ID NO.42：大肠杆菌DnaQ氨基酸序列

SEQ ID NO.43：枯草芽孢杆菌PolC核酸序列

SEQ ID NO.44：枯草芽孢杆菌PolC氨基酸序列

SEQ ID NO.45：拟南芥Polδ氨基酸序列

SEQ ID NO.46：拟南芥Polε氨基酸序列

SEQ ID NO.47：稻Polδ核酸序列

SEQ ID NO.48：稻Polδ氨基酸序列

SEQ ID NO.49：大豆Polδ核酸序列

SEQ ID NO.50：大豆Polδ氨基酸序列

SEQ ID NO.51：人Polδ核酸序列

SEQ ID NO.52：人Polδ氨基酸序列

SEQ ID NO.53：人Polε核酸序列

SEQ ID NO.54：人Polε氨基酸序列

SEQ ID NO.55：小鼠Polδ核酸序列

SEQ ID NO.56：小鼠Polδ氨基酸序列

SEQ ID NO.57：小鼠Polε核酸序列

SEQ ID NO.58：小鼠Polε氨基酸序列

SEQ ID NO.59：大鼠Polδ核酸序列

SEQ ID NO.60：大鼠Polδ氨基酸序列

SEQ ID NO.61：牛Polδ核酸序列

SEQ ID NO.62：牛Polδ氨基酸序列

SEQ ID NO.63：果蝇Polδ核酸序列

SEQ ID NO.64：果蝇Polδ氨基酸序列

SEQ ID NO.65：果蝇Polε核酸序列

SEQ ID NO.66：果蝇Polε氨基酸序列

SEQ ID NO.67：Pold1基因的5′末端引物SpeI-5′Pold1

SEQ ID NO.68：Pold1基因的3′末端引物EcoRI-3′Pold1

SEQ ID NO.69：用于将突变导入Pold1基因的引物序列(实施例4)

SEQ ID NO.70：Pold1基因的突变的cDNA序列(实施例4)

SEQ ID NO.71：mPGK2的5′mPGK2-sacII引物

SEQ ID NO.72：mPGK2的3′mPGK2-SpeI引物

SEQ ID NO.73：Fthl17的5′Fthl17-sacII引物

SEQ ID NO.74：Fthl17的3′Fthl17-SpeI引物

SEQ ID NO.75：转基因小鼠#1的Cre-F引物

SEQ ID NO.76：转基因小鼠#1的Cre-R引物

SEQ ID NO.77：转基因小鼠#2的Neo-F引物

SEQ ID NO.78：转基因小鼠#2的Neo-R引物

SEQ ID NO.79：用于在实施例4中确认mRNA的表达的Neo-F引物

SEQ ID NO.80：用于在实施例4中确认mRNA的表达的Neo--R引物

SEQ ID NO.81：Fthl17k游的约5.7kbp序列

SEQ ID NO.82：用于扩增源自拟南芥的Polδ的Xba1-42120-F

SEQ ID NO.83：用于扩增源自拟南芥的Polδ的2g42120-Sacl-R

SEQ ID NO.84：用于扩增突变体polδ基因Polδ(D316A)的2g42120-D316A-F

SEQ ID NO.85：用于扩增突变体polδ基因Polδ(D316A)的2g42120R

SEQ ID NO.86：含有源自小鼠睾丸的Kozak序列的Pold1基因(核酸序列)

SEQ ID NO.87：含有源自小鼠睾丸的Kozak序列的Pold1基因(氨基酸序列)

SEQ ID NO.88：小鼠Polδ基因突变体(D400A)的核酸序列

SEQ ID NO.89：小鼠Polδ基因突变体(D400A)的氨基酸序列

SEQ ID NO.90：Polδ(Atlg42120)的核酸序列

SEQ ID NO.91：Polδ(Atlg42120)的氨基酸序列

SEQ ID NO.92：突变体polδ基因Polδ(D316A)(核酸序列)

SEQ ID NO.93：突变体polδ基因Polδ(D316A)(氨基酸序列)

SEQ ID NO.94：455-bp mPGK2启动子片段

SEQ ID NO.95：Fthl17基因上游的5725-bp DNA片段

实施本发明的最佳模式

(发明详述)

在下文中，将参考附图，以解释性的实例描述本发明。

应当理解，在本说明书中，单数形式的“一个(a)”、“一种(an)”和“该(the)”包括复数的指示物，除非上下文另有清楚的说明。还应当理解，如本文所用的术语具有本领域一般使用的定义，除非另有说明。

(术语)

在本说明书和下面的权利要求书中，将提及许多术语，它们应当定义为具有下述的含义：

术语“生物”在这里使用其在本领域最广泛的含义，指能实现生命过程的机体，其具有各种性质，例如，代表性地，细胞结构，增殖(自我繁殖)，生长，调节，代谢，修复能力，等。一般地，生物具有基本性质，例如由核酸控制的遗传和其中涉及蛋白控制的代谢的增殖。生物包括病毒，原核生物，真核生物(例如，单细胞生物(例如，酵母，等)和多细胞生物(例如，植物，动物，等))，等。应当明白，本发明的方法可以应用于任何生物，包括高等生物，例如革兰氏阳性的细菌，真核生物，等。

术语“真核生物”在这里使用其普通含义，指具有带有核膜的明显核结构的生物。真核生物的实例包括但不限于：单细胞生物(例如，酵母，等)，植物(例如，稻，小麦，玉米，大豆，等)，动物(例如，小鼠，大鼠，牛，马，猪，猴，等)，昆虫(例如，蝇，蚕，等)，等。酵母、线虫、果蝇、蚕、稻、小麦、大豆、玉米、拟南芥、人、小鼠、大鼠、牛、马、猪、蛙、鱼(例如，斑马鱼，等)可以在这里用作模型，但是用途不限于此。

如本文所使用的，术语“原核生物”在这里使用其普通含义，指由不具有明显的核结构的细胞构成的生物。原核生物的实例包括革兰氏阴性的细菌(例如，大肠杆菌，沙门氏菌属(Salmonella)，等)，革兰氏阳性的细菌(例如，枯草芽孢杆菌，放线菌，葡萄球菌属(Staphylococcus)，等)，蓝细菌，氢细菌，等。代表性地，除了大肠杆菌以外，革兰氏阳性的细菌可以用在这里，但是用途不限于此。

术语“单细胞生物”在这里使用其普通含义，指由单个细胞组成的生物。单细胞生物包括真核生物和原核生物。单细胞生物的实例包括但不限于：细菌(例如，大肠杆菌，枯草芽孢杆菌，等)，酵母，蓝细菌，等。

如本文所使用的，术语“多细胞生物”指由多个细胞(一般地，多个不同类型的细胞)组成的单个生物。由于多细胞生物是由不同类型的细胞组成的，所以维持该生物的生命需要高水平的与单细胞生物不同的稳态机制。大多数真核生物是多细胞生物。多细胞生物包括动物，植物，昆虫，等。应当指出，本发明可以令人惊奇地应用于多细胞生物。

术语“动物”在这里使用其最广泛的含义，指脊椎动物和无脊椎动物(例如，节肢动物)。动物的实例包括但不限于：任何哺乳纲(Mammalia)，鸟纲(Aves)，爬行纲(Reptilia)，两栖纲(Amphibia)，鱼纲(Pisces)，昆虫纲(Insecta)，蠕虫纲(Vermes)，等。优选地，动物可以是但不限于：脊椎动物(例如，盲鳗目(Myxiniformes)，七鳃鳗目(Petronyzoniformes)，软骨鱼纲(Chondrichthyes)，硬骨鱼纲(Osteichthyes)，两栖动物，爬行动物，鸟类，哺乳动物，等)。在特定的实施方案中，动物可以是但不限于：哺乳动物(例如，单孔目(monotremata)，有袋目(marsupialia)，无齿类动物(edentate)，皮翼目(dermoptera)，翼手目(chiroptera)，食肉动物，食虫动物，长鼻目(proboscidae)，奇蹄目(perissodactyla)，偶蹄目(artiodactyla)，管齿目(tubulidentata)，鳞甲目(pholidota)，海牛目(sirenia)，鲸类动物，灵长目(primates)，啮齿目(rodentia)，兔形目(lagomorpha)，等)。更优选地，动物可以是但不限于：灵长目(例如，黑猩猩，日本猴，人)或任何可以用作模型动物的物种(例如，奇蹄目，偶蹄目，啮齿目(小鼠，等)，兔形目，等)。本发明首次证实了本发明的方法可以应用于任何生物。应当明白，任何生物都可以用于本发明。

如本文所使用的，术语“植物”指属于植物界(Plantae)的特征如下的任何生物：叶绿素，硬细胞壁，存在丰富的永久的未成熟组织，和没有移动能力。代表性地，术语“植物”指能形成细胞壁和通过叶绿素进行同化的开花植物。术语“植物”指任何单子叶植物和双子叶植物。优选的植物包括但不限于：有用的植物，例如稻科的单子叶植物(例如，小麦，玉米，稻，大麦，高粱，等)。优选的植物的实例包括烟草，青椒，茄子，瓜，番茄，甘薯，卷心菜，韭菜，椰菜，胡萝卜，黄瓜，柑桔，大白菜，莴苣，桃子，马铃薯，和苹果。优选的植物不限于农作物，还包括开花植物，树，草坪，野草，等。除非另有说明，术语“植物”指任意的植物体，植物器官，植物组织，植物细胞和种子。植物器官的实例包括根、叶、茎、花等。植物细胞的实例包括愈伤组织、悬浮培养的细胞等。本发明首次证实了本发明的方法可以应用于任何生物。应当明白，任何生物都可以用于本发明。

在特定的实施方案中，可以用于本发明中的植物种类的实例包括但不限于下述科的植物：茄科(Solanaceae)，禾本科(Poaceae)，十字花科(Brassicaceae)，蔷薇科(Rosaceae)，豆科(Leguminosae)，葫芦科(Cucurbitaceae)，唇形科(Lamiaceae)，百合科(Liliaceae)，藜科(Chenopodiaceae)和伞形科(Umbelliferae)。

如本文所使用的，术语“遗传性状”也称作基因型，指基因控制的生物的形态要素。遗传性状的实例包括但不限于：对环境参数的抗性，所述参数例如，温度，湿度，pH，盐浓度，营养物，金属，气体，有机溶剂，压力，大气压力，粘度，流速，光强度，光波长，电磁波，辐射，重力，张力，声波，其它生物，化学试剂，抗生素，天然物质，心理应激，机体应激，等。

如本文所使用的，术语“基因”指具有预定长度的序列的细胞中存在的核酸。基因可以定义或不定义遗传性状。如本文所使用的，术语“基因”一般指存在于基因组中的序列，且可以指染色体外的序列、线粒体中的序列等。基因一般排列在染色体上的特定序列中。能定义蛋白的初级结构的基因称作结构基因。能调节结构基因的表达的基因称作调节基因(例如，启动子)。除非另有说明，本文中的基因包括结构基因和调节基因。因此，例如，术语“DNA聚合酶基因”一般指DNA聚合酶的结构基因和它的转录和/或翻译调节序列(例如，启动子)。在本发明中，应当明白，转录和/或翻译的调节序列以及结构基因可以用作本发明靶向的基因。如本文所使用的，“基因”可以指“多核苷酸”、“寡核苷酸”、“核酸”和“核酸分子”和/或“蛋白”、“多肽”、“寡肽”和“肽”。如本文所使用的，“基因产物”包括“多核苷酸”、“寡核苷酸”、“核酸”和“核酸分子”和/或由基因表达的“蛋白”、“多肽”、“寡肽”和“肽”。本领域的技术人员根据上下文能够明白基因产物是什么。

如本文所使用的，与基因有关的术语“复制”是指遗传材料、DNA或RNA再生它自身的拷贝，其中亲本核酸链(DNA或RNA)用作形成新的具有与亲本核酸相同的结构和功能的核酸分子(分别是DNA或RNA)的模板。在真核细胞中，会形成包含复制酶(DNA聚合酶α)的复制起始复合物，以在双链DNA分子的许多复制起点处启动复制，且复制反应从复制起点向相反的反向进行。根据细胞周期控制复制的起始。在酵母中，将自主复制序列视作复制起点。在原核细胞(例如大肠杆菌等)中，复制起点(ori)存在于基因组的双链环状DNA分子上。复制起始复合物在ori形成，且反应从ori向相反的反向进行。复制起始复合物具有包含10个或更多个蛋白元件(包括复制酶(DNA聚合酶III))的复杂结构。在复制反应中，部分地重绕双链DNA的螺旋结构；合成短的DNA引物；从引物的3′-OH基延伸新的DNA链；在互补链模板上合成冈崎片段；连接冈崎片段；进行校对，以比较新复制的链和模板链；等。因而，通过许多反应步骤进行复制反应。

储存着生物的遗传信息的基因组DNA的复制机制详细地描述在例如Kornberg A.和Baker T.，“DNA Replication”，New York，Freeman，1992中。一般地，将能使用DNA的一条链作为模板合成互补链、形成双链DNA的酶称作DNA聚合酶(DNA复制酶)。DNA复制需要至少2种DNA聚合酶。这是因为，一般地，同时合成前导链和后随链。从DNA上的称作复制起点(ori)的预定位置处开始DNA复制。例如，细菌在它们的环状基因组DNA上具有至少一个双向复制起点。因而，一般地，在其复制过程中，需要4种DNA聚合酶同时作用于一个基因组DNA上。在本发明中，优选地，可以仅仅在前导链和后随链中的一条上有利地调节复制错误，或者，这2条链之间的复制错误的频率可以有利地存在差异。

如本文所使用的，术语“复制错误”指在基因(DNA，等)复制过程中导入错误的核苷酸。一般地，复制错误的频率低至10⁸至10¹²配对中出现一个。复制错误频率较低的原因是，复制过程中的核苷酸添加是由模板DNA和导入的核苷酸之间的互补碱基配对决定的；酶(例如DNA聚合酶δ、ε等)的3′→5′外切核酸酶活性(校对功能)能识别和去除错配的与模板不互补的核苷酸；等。因此，在本发明中，通过破坏特定的碱基对的形成、校对功能等，可以调节复制中的倾向于错误的频率。

如本文所使用的，与遗传性状有关的术语“转化率”指在原始生物繁殖或分裂后，原始生物和其祖先之间的遗传性状之间发生差异的比率。这样的转化率可以例如由在每次分裂或每代中具有遗传性状变化的生物的数目代表。这样的遗传性状的转化在本文中可替换地称作“进化”。

如本文所使用的，与遗传性状的转化率有关的术语“调节”是指，通过人工操作，而不是通过自然产生的因素，改变遗传性状的转化率。因此，调节遗传性状的转化率包括减慢和加速遗传性状的转化率。通过减慢生物的遗传性状的转化率，该生物基本上不改变遗传性状。换言之，通过减慢该生物的遗传性状的转化率，使该生物的进化速度变慢。相反地，通过加速生物的遗传性状的转化率，该生物比正常水平更频繁地改变遗传性状。换言之，通过加速生物的遗传性状的转化率，使该生物的进化速度变快。

如本文所使用的，术语“无错误的”指在基因(DNA，等)的复制中存在较少的或基本上没有错误的性质。校对酶(例如，DNA聚合酶δ和ε，等)的校对功能的精确度会影响无错误的水平。

如本文所使用的，术语“倾向于错误的”指在基因(DNA，等)的复制中可能发生错误的性质(即，可能发生复制错误)。校对酶(例如，DNA聚合酶δ和ε，等)的校对功能的精确度会影响倾向于错误的水平。

倾向于错误的状态和无错误的状态可以绝对地分开(即，可以用倾向于错误的频率的水平等决定)，或者，可以相对地分开(即，当在基因复制中起作用的2个或更多个试剂是分开的时，将具有更高的倾向于错误的频率的试剂归类为倾向于错误的基因，而将具有更低的倾向于错误的频率的试剂归类为无错误的试剂)。

如本文所使用的，术语“倾向于错误的频率”指倾向于错误的性质的水平。倾向于错误的频率可以由例如基因序列中的突变的绝对数目(突变本身的数目)或基因序列中的突变的相对数目(突变的数目与全长的比率)来表示。或者，当提及特定的生物或酶时，倾向于错误的频率可以由每次繁殖或分裂时基因序列中的突变的绝对或相对数目来表示。除非另有说明，倾向于错误的频率是由一次复制过程中基因序列中的错误数目来表示的。倾向于错误的频率在本文中可以称作“精确度”，作为相反的量度。一致的倾向于错误的频率是指，当提及在许多基因的复制中起作用的试剂(聚合酶，等)时，它们的倾向于错误的频率基本上彼此相等。相反地，不同的倾向于错误的频率是指，在许多基因的复制中起作用的许多试剂(聚合酶，等)中存在显著的倾向于错误的频率的差异。

如本文所使用的，与倾向于错误的频率有关的术语“调节”是指，改变倾向于错误的频率。这样调节倾向于错误的频率包括增加和减少倾向于错误的频率。调节倾向于错误的频率的方法的实例包括但不限于：修饰具有校对功能的DNA聚合酶，插入能抑制或阻抑复制过程中的聚合或延伸反应的试剂，抑制或阻抑能促进这些反应的因素，缺失一个或多个碱基，缺失双链体DNA修复酶，修饰能去除异常碱基的修复试剂，修饰能修复错配的碱基对的修复试剂，降低复制本身的精确度，等。可以在双链DNA的2条链或1条链上调节倾向于错误的频率。优选地，可以有利地在1条链上调节倾向于错误的频率。这是因为，会减少不利的突变发生。

如本文所使用的，术语“DNA聚合酶”或“Po1”指能从4个脱氧核糖核苷5′-三磷酸释放出焦磷酸、从而聚合DNA的酶。DNA聚合酶反应需要模板DNA、引物分子、Mg²⁺等。将互补的核苷酸依次添加到引物的3′-OH末端，以延伸分子链。

已知大肠杆菌具有至少3种DNA聚合酶I、II和III。DNA聚合酶I参与修复受损的DNA、基因重组和DNA复制。认为DNA聚合酶II和III具有辅助功能。这些酶的每种都具有包含几个蛋白的亚基结构，且根据结构分成核心酶或全酶。核心酶由α、ε和θ亚基组成。全酶除了α、ε和θ亚基以外，包含τ、γ、δ和β组分。已知真核细胞具有许多DNA聚合酶。在高等生物中，存在许多DNA聚合酶α、β、γ、δ、ε等。在动物中，存在已知的聚合酶：DNA聚合酶α，它参与核DNA的复制，并在细胞生长期的DNA复制中起作用；DNA聚合酶β，它参与核中的DNA修复，并在生长期和静止期的受损DNA的修复中起作用，等；DNA聚合酶γ，它参与复制和修复线粒体DNA，且具有外切核酸酶活性)；DNA聚合酶δ，它参与DNA延长，且具有外切核酸酶活性；DNA聚合酶ε，它参与复制后随链之间的缺口，且具有外切核酸酶活性；等。

在革兰氏阳性的细菌、革兰氏阴性的细菌、真核生物等中具有校对功能的DNA聚合酶中，认为具有ExoI基序的氨基酸序列在3′→5′外切核酸酶活性中心起作用，且会影响校对功能的精确度。

SEQ ID NO.5：DnaQ：8-QIVLDTETTGMN-19(大肠杆菌)；

SEQ ID NO.6：DnaQ：7-QIVLDTETTGMN-18(流感嗜血菌)；

SEQ ID NO.7：DnaQ：8-QIVLDTETTGMN-19(鼠伤寒沙门氏菌)；

SEQ ID NO.8：DnaQ：12-IVVLDTETTGMN-23(霍乱弧菌)；

SEQ ID NO.9：DnaQ：3-SVVLDTETTGMP-14(铜绿假单胞菌)；

SEQ ID NO.10：DnaQ：5-QI ILDTETTGLY-16(脑膜炎奈瑟氏球菌)；

SEQ ID NO.11：DnaQ：9-FVCLDCETTGLD-20(砂眼衣原体)；

SEQ ID NO.12：DnaQ：9-LAAFDTETTGVD-20(天蓝色链霉菌)；

SEQ ID NO.13：dnaQ：11-QIVLDTETTGMN-22(弗氏志贺氏菌2a菌株301)；

SEQ ID NO.14：PolC：420-YVVFDVETTGLS-431(金黄色葡萄球菌)

SEQ ID NO.15：PolC：421-YVVFDVETTGLS-432(枯草芽孢杆菌)；

SEQ ID NO.16：PolC：404-YVVYDIETTGLS-415(肺枝原体)；

SEQ ID NO.17：PolC：416-FVIFDIETTGLH-427(生殖道枝原体)；

SEQ ID NO.18：PolC：408-FVIFDIETTGLH-419(肺炎枝原体)；

SEQ ID NO.19：PolIII：317-IMSFDIECAGRI-328(啤酒糖酵母)；

SEQ ID NO.20：PolII：286-VMAFDIETTKPP-297(啤酒糖酵母)；

SEQ ID NO.21：Polδ：310-VLSFDIECAGRK-321(小鼠)；

SEQ ID NO.22：Polε：271-VLAFDIETTKLP-282(小鼠)；

SEQ ID NO.23：Polδ：312-VLSFDIECAGRK-323(人)；

SEQ ID NO.24：Polε：271-VLAFDIETTKLP-282(人)；

SEQ ID NO.25：Polδ：316-ILSFDIECAGRK-327(稻)；

SEQ ID NO.26：Polδ：306-VLSFDIECAGRK-317(拟南芥)；

SEQ ID NO.27：Polε：235-VCAFDIETVKLP-246(拟南芥)；

SEQ ID NO.28：Polδ：308-VLSFDIECAGRK-319(大鼠)；

SEQ ID NO.29：Polδ：311-VLSFDIECAGRK-322(牛)；

SEQ ID NO.30：Polδ：273-ILSFDIECAGRK-284(大豆)；

SEQ ID NO.31：Polδ：296-ILSFDIECAGRK-307(果蝇)；和

SEQ ID NO.32：Polε：269-VLAFDIETTKLP-280(果蝇)。

显然，具有校对功能的DNA聚合酶具有相当保守的天冬氨酸(例如，在人DNA聚合酶δ的位置316)和谷氨酸(例如，在人DNA聚合酶δ的位置318)。含有这样的天冬氨酸和谷氨酸的区域在本文中可以视作校对功能的活性部位。

在革兰氏阴性细菌(例如大肠杆菌)中，存在2种DNA聚合酶蛋白，即具有外切核酸酶活性的分子和具有DNA合成活性的分子。因此，通过调节外切核酸酶活性，可以调节校对功能。

但是，在革兰氏阳性细菌(例如，枯草芽孢杆菌，等)和真核生物(例如，酵母，动物，植物，等)中，一种DNA聚合酶具有DNA合成活性和外切核酸酶活性。因此，需要能在调节外切核酸酶活性的同时保留正常的DNA合成活性的分子来调节校对功能。本发明提供了各种真核生物和革兰氏阳性细菌的DNA聚合酶，其能在调节外切核酸酶活性的同时保留正常的DNA合成活性，且其可以用于生物的进化中。由此，得到了与大肠杆菌不同的且意外的效果。因此，可以认为，通过发现上述的校对功能的活性部位在真核生物和革兰氏阳性细菌、特别是在真核生物中被出乎意料地确定，本发明部分地得以实现。而且，本发明的重大作用是获得遗传性状，其在下面的实例中予以出乎意料地显示。

已经在细菌等以及人中发现了许多倾向于错误的DNA聚合酶。许多复制的DNA聚合酶一般具有校对功能，即，通过3′→5′外切核酸酶活性去除错误，以进行无错误的复制。但是，倾向于错误的DNA聚合酶不具有校对功能，且不能绕过DNA损害，从而导致突变。倾向于错误的DNA聚合酶的存在会参与癌症的发作、进化、抗体进化等。许多DNA聚合酶具有变成倾向于错误的可能性。通过破坏它们的校对功能，可以使这些DNA聚合酶倾向于错误。因此，通过修饰上述的校对功能的活性部位，可以调节复制的精确度。通过使用该模型，一旦得到了新的性质，就可以有利地无畸形地进化。在这方面，与原始的不一致模型相比，本发明可以得到意外的不利和效果。

在准种理论中，Eigen提出了一个进化模型，其中仅仅考虑了倾向于错误的复制(M.Eigen，Naturwissenschaften 58，465(1971)，等)。该准种理论使用各种修饰。可以将准种定义为最适序列的稳定的系统，且其突变体有选择地分布在序列空间中的最适序列周围。自然选择不是发生在单一序列中，而是在整个准种分布中。如下发生准种的进化：具有比主序列更高的适合度的突变体出现在准种中，该突变体有选择地替换旧的主序列，然后新的准种分布围绕着突变体组织。

准种理论认为和总结出，存在维持遗传信息的错误阈值。因此，常规地，认为准种仅仅可以在该阈值之下进化(M.Eigen等，Adv.Chem.Phys.75，149(1989))。这意味着，进化速度的上限受到错误阈值的上限的限制。准种理论在RNA病毒的研究中似乎得到了证实，其以接近错误阈值的高速度进化。但是，认为在突变试剂的表型中具有增加的错误率的试剂在该过程中起重要作用。

尽管细菌的基因组具有单一的复制起点，但真核生物的基因组具有许多复制起点。这意味着，基因组的序列含有许多复制单元(复制剂，复制子)。因此，许多聚合酶同时参与基因组的复制。在本发明中，可以考虑许多复制剂对错误阈值的影响。

在一个优选的实施方案中，通过将能破坏3′→5′外切核酸酶活性的突变导入到能编码DNA聚合酶的基因(DNA聚合酶基因)中，可以提供能编码具有降低的校对功能(即，更高的倾向于错误的频率)的DNA聚合酶的核酸分子和多肽。注意到在单一的DNA聚合酶基因(PolC，POL2，CDC2，等)中，3′→5′外切核酸酶活性(校对功能)是包含在具有DNA聚合活性的分子中的(例如，真核生物，革兰氏阳性细菌，等)，或者是由与能编码DNA聚合活性的基因(例如，dnaE)不同的基因(例如，dnaQ)编码的(例如，革兰氏阴性细菌，等)(Kornberg A.和Baker T.，“DNA Replication”，New York，Freeman，1992)。基于对上述性质的理解，本领域的技术人员可以根据本发明调节倾向于错误的频率。例如，在真核生物中，优选地将能改变校对功能而基本上不改变DNA聚合活性的突变导入DNA聚合酶中。在该情况中，改变了2个与上述的校对功能有关的酸性氨基酸(优选地，不保守的取代(例如，丙氨酸、缬氨酸等的取代))(Derbyshire等，EMBO J.10，pp.17-24，Jan.1991；Fijalkowska和Schaaper，“Mutants in theExo I motif of Escherichia coli dnaQ：Defective proofreadingand inviability due to error catastrophe”，Proc.Natl.Acad.Sci.USA，Vol.93，pp.2856-2861，Apr.1996)。本发明不限于此。

如本文所使用的，术语“校对功能”指检测和修复细胞DNA中的损伤和/或错误的功能。通过在脱嘌呤位点或脱嘧啶位点插入碱基，或者，用脱嘌呤-脱嘧啶(A-P)内切核酸酶切割一条链，然后用5′→3′外切核酸酶去除该位点，可以实现这样的功能。在去除的部分，用DNA聚合酶合成和补充DNA，并通过DNA连接酶将合成的DNA与正常的DNA相连接。该反应称作切除修复。对于由烷化剂、异常的碱基、辐射、紫外光等的化学修饰造成的受损DNA，通过上述的反应，在修复之前用DNA糖苷酶去除受损的部分(期外DNA合成)。具有这样的校对功能的DNA聚合酶的实例包括但不限于真核生物等的DNA聚合酶δ、DNA聚合酶ε等。如本文所使用的，术语“保真性”也可以用于代表校对功能的水平。术语“保真性”指DNA复制精确度。普通的DNA聚合酶一般具有高水平的保真性。由于修饰具有降低的校对功能的DNA聚合酶可能具有低水平的保真性。

DNA聚合酶的上述校对功能描述在，例如，Kunkel，T.A.：J.Biol.Chem.，260，12866-12874(1985)；Kunkel，T.A.，Sabotino，R.D.& Bambara，R.A.：Proc.Natl.Acad.Sci.USA，84，4865-4869(1987)；Wu，C.I.& Maeda，N.：Nature，327，167-170(1987)；Roberts，J.D.& Kunkel，T.A.：Proc.Natl.Acad.Sci.USA，85，7064-7068(1988)；Thomas，D.C.，Fitzgerald，M.P.& Kunkel，T.A.：Basic Life Sciences，52，287-297(1990)；Trinh，T.Q.& Siden，R.R.，Nature，352，544-547(1991)；Weston-Hafer，K.& Berg，D.E.，Genetics，127，649-655(1991)；Veaute，X.& Fuchs，R.P.P.：Science，261，598-600(1993)；Roberts，J.D.，Izuta，S.，Thomas，D.C.& Kunkel，T.A.：J.Biol.Chem.，269，1711-1717(1994)；Roche，W.A.，Trinh，T.Q.& Siden，R.R.，J.Bacteriol.，177，4385-4391(1995)；Kang，S.，Jaworski，A.，Ohshirna，K.& Wells，Nat.Genet.，10，213-218(1995)；Fijalkowska，I.J.，Jonczyk，P.，Maliszewska-Tkaczyk，M.，Bialoskorska，M.& Schaaper，R.M.，Proc.Natl.Acad.Sci.USA.，95，10020-10025(1998)；Maliszewska-Tkaczyk，M.，Jonezyk，P.，Bialoskorska，M.，Schaaper，M.& Fijalkowska，I.：Proc.Natl.Acad.Sci.USA，97，12678-12683(2000)；Gwel，D.，Jonezyk，P.，Bialoskorska，M.，Schaaper，R.M.& Fijalkowska，I.J.：Mutation Research，501，129-136(2002)；Roberts，J.D.，Thomas，D.C.& Kunkel，T.A.：Proc.Natl.Acad.Sci.USA，88，3465-3469(1991)；Roberts，J.D.，Nguyen，D.&Kunkel，T.A.：Biochemistry，32，4083-4089(1993)；Francino，M.P.，Chac，L.，Riley，M.A.& Ochman，H.：Science，272，107-109(1996)；A.Boulet，M.Simon，G.Faye，G.A.Bauer &P.M.Burgers，EMBO J.，8，1849-1854，(1989)；Morrison A.，ArakiH.，Clark A.B.，Hamatake R.K.，& Sugino A.，Cell，62(6)，1143-1151(1990)，等。

如本文所使用的，术语真核生物的“DNA聚合酶δ”指参与DNA延长的酶，认为其具有产生校对功能的外切核酸酶活性。代表性的DNA聚合酶δ具有如SEQ ID NO.1和2所述的序列(分别是核酸序列和氨基酸序列；Polδ：X61920 gi/171411/gb/M61710.1/YSCDPB2[171411])。通过修饰如SEQ ID NO.2所述的氨基酸序列的位置322处的氨基酸，可以调节该DNA聚合酶δ的校对功能。DNA聚合酶δ描述在Simon，M.等，EMBO J.，10，2163-2170，1991中，其内容在这里引作参考。DNA聚合酶δ的实例包括但不限于下述的：拟南芥(SEQID NO.45)，稻(SEQ ID NO.47和48)，大豆(SEQ ID NO.49和50)，人(SEQ ID NO.51和52)，小鼠(SEQ ID NO.55和56)，大鼠(SEQ IDNO.59和60)，牛(SEQ ID NO.61和62)，果蝇(SEQ ID NO.63和64)，等。

如本文所使用的，术语真核生物的“DNA聚合酶ε”指参与复制后随链之间的缺口的酶，认为其具有产生校对功能的外切核酸酶活性。代表性的DNA聚合酶ε具有如SEQ ID NO.3和4所述的序列(分别是核酸序列和氨基酸序列；Polε：M60416gi/171408/gb/M60416.1/YSCDNA POL[171408])。通过修饰如SEQ IDNO.4所述的氨基酸序列的位置391处的氨基酸，可以调节该DNA聚合酶ε的校对功能。DNA聚合酶ε描述在，例如，Morrison，A.等，MGG.242，289-296，1994；Araki H.，等.Nucleic Acids Res.19，4857-4872，1991；和Ohya T.，等，Nucleic Acids Res.28，3846-3852，2000，其内容在这里引作参考。DNA聚合酶ε的实例包括但不限于下述的：拟南芥(SEQ ID NO.46)，人(SEQ ID NO.53和54)，小鼠(SEQID NO.57和58)，果蝇(SEQ ID NO.65和66)，等。

根据HUGO分类，将DNA聚合酶δ和ε分别称作POLD1/POL3和POLE/POL2。在本文中可以使用两种命名。

其它的DNA聚合酶描述在，例如，Lawrence C.W.等，J.Mol.Biol.，122，1-21，1978；Lawrence C.W.等，Genetics 92，397-408；Lawrence C.W.等，MGG，195，487-490，1984；Lawrence G.W.等，MGG.200，86-91，1985(DNA聚合酶β和DNA聚合酶ζ)；Maher V.M.等，Nature 261，593-595，1976；McGregor，W.G.等，Mol.Cell.Biol.19，147-154，1999(DNA聚合酶η)；Strand M.等，Nature 365，275-276，1993；Prolla T.A.等，Mol.Cell.Biol.15，407-415，1994；Kat A.等，Proc.Natl.Acad.Sci.USA 90，6424-6428；Bhattacharyya N.P.等，Proc.Natl.Acad.Sci.USA 91，6319-6323，1994；Faber F.A.等，Hum.Mol.Genet.3，253-256，1994；Eshleman，J.R.等，Oncogene 10，33-37，1995；Morrison A.等，Proc.Natl.Acad.Sci.USA 88，9473-9477，1991；Morrison A.等，EMBO J.12，1467-1473，1993；Foury F.等，EMBO J.11，2717-2726，1992(DNA聚合酶λ，DNA聚合酶μ，等)；等，其内容在这里引作参考。

如本文所使用的，与能编码DNA聚合酶等的基因和生物(例如，酵母，等)有关的术语“野生型”以其最广泛的含义指，具有自然产生的能编码DNA聚合酶等的基因和生物(例如，酵母，等)所来源的物种的大多数成员的特征的类型。因此，一般地，可以认为在某些物种中首先鉴别出的能编码DNA聚合酶等的基因和生物(例如，酵母，等)的类型是野生型。野生型也称作“自然的标准型”。野生型DNA聚合酶δ具有如SEQ ID NO.1和2所述的序列。野生型DNA聚合酶ε具有如SEQ ID NO.3和44所述的序列。具有如SEQ ID NO.41-66所述的序列的DNA聚合酶也是野生型。野生型生物可能具有正常的酶活性、正常的性状、正常的行为、正常的生理学、正常的繁殖和正常的基因组。

如本文所使用的，与酶的校对功能等有关的术语“低于野生型”是指，该酶的校对功能低于野生型酶的校对功能(即，在该酶校对加工后保留的突变的数目大于野生型酶的)。通过相对的或绝对的表达，可以进行与野生型的对比。使用倾向于错误的频率等，可以进行这样的对比。

如本文所使用的，与基因有关的术语“突变”是指改变了该基因的序列，或者指改变的该基因的核酸或氨基酸序列的状态。例如，术语“突变”在本文中指会导致校对功能的改变的基因的序列中的改变。除非另有定义，术语“突变”和“变异”在本说明书中具有相同的含义。

为了生产它们的有用的突变体，最常见地对生物进行诱变。术语“突变”一般指能编码基因的碱基序列中的变化，包含DNA序列中的变化。根据其对具有突变的个体的影响，将突变大致分成下面的3组：A)中性的突变(大多数突变都归入这组中，且基本上对生物的生长和代谢没有影响)；B)有害的突变(它的频率低于中性的突变的。这类突变会抑制生物的生长和代谢。有害的突变包括会破坏对于生长必须的基因的致死的突变。在微生物的情况中，有害的突变的比例一般是总突变的约1/10至1/100，尽管因物种而异)；和C)有益的突变(该突变对于生物的育种是有益的。其发生频率明显低于中性的突变。因此，需要大量的生物和较长的时间段来得到具有有益的突变的个别生物。通过单一突变难以得到足以对生物进行育种的效果，且经常需要积累许多有益的突变)。

如本文所使用的，与某种生物有关的术语“生长”指个体生物的量上的增加。通过测量值(例如身体大小(身高)、体重等)的量上的增加，可以识别出生物的生长。个体的量上的增加依赖于每个细胞的增大和细胞数目的增加。

如本文所使用的，与生物有关的术语“基本上相同的生长”是指，该生物的生长速度与参考生物(例如，转化前的生物)相比基本上没有变化。认为不是显著改变的生长速度的示例性的范围包括但不限于一般生长的统计分布中的1个偏差的范围。在本发明的生物中，术语“基本上相同的生长”是指，例如，(1)祖先的数目没有显著变化；(2)尽管形态学有所变化，但基本上没有产生与一般的人工突变不同的紊乱。尽管有相当高的突变率，但认为外观是“漂亮的”(尽管该特征与生长无直接关系，但该特征是通过本发明的方法建立的突变体特有的)；和(3)一旦获得就不会退化的性状、基因型或表型。

如本文所使用的，术语“抗药性”是指对药物(包括生理活性物质，例如噬菌体，细菌素，等)的耐受性或抗性。当改变了它的药物受体时，或者改变了许多参与药物作用的过程中的一个或多个时，敏感的宿主就会获得抗药性。或者，当敏感的宿主获得使抗生素本身失活的能力时，就可以获得抗药性。在抗药的生物中，染色体DNA中的突变可能改变药物发生作用的酶和/或核糖体蛋白，从而使得通常浓度的药物不再有效。或者，生物可能获得来自其它生物的抗药的质粒(例如，R质粒)，从而获得使药物失活的酶活性。或者，可能降低药物的膜渗透性，以得到对药物的抗性。本发明不限于此。

如本文所使用的，术语“癌细胞”具有与术语“恶性肿瘤细胞”(包括肉瘤)相同的含义，指具有永久增殖能力的且不灭的细胞。癌细胞会获得永久增殖能力，且以以下方式变得不灭。正常的细胞会在基因水平上发生某些不可逆的变化。结果，正常的细胞转化成了异常的细胞，即癌细胞。

如本文所使用的，与生物有关的术语“生产”是指生成了个体生物。

如本文所使用的，与生物有关的术语“繁殖”是指，从亲本个体生成了下一代的新个体。繁殖包括但不限于：自然倍增，增殖，等；通过人工技术进行的人工倍增，增殖，等，例如克隆技术(核移植，等)。繁殖技术的实例包括但不限于：在植物的情况下，单个细胞的培养；插条的嫁接；插条的生根；等。繁殖的生物一般具有源自它们的亲本的遗传性状。有性繁殖的生物一般具有源自两性的遗传性状。一般地，这些遗传性状以基本上相等的比例源自两性。无性繁殖的生物具有源自它们的亲本的遗传性状。

术语“细胞”在本文中使用其在本领域最广泛的含义，指多细胞生物的组织的结构单元，其能自我复制，具有遗传信息和表达它的机制，且被膜结构围绕，该膜结构将活体与外界分离开。这里使用的细胞可以是自然产生的细胞或人工修饰的细胞(例如，融合细胞，遗传修饰的细胞，等)。细胞来源的实例包括但不限于：正常生长的转基因动物的单细胞培养物、胚胎、血液或身体组织，细胞混合物，例如来自正常生长的细胞系的细胞，等。

用于本发明的细胞可以源自任意的生物(例如，任意的单细胞生物(例如，细菌，酵母，等)或任意的多细胞生物(例如，动物(例如，脊椎动物，无脊椎动物)，植物(例如，单子叶植物，双子叶植物，等)，等))。例如，使用源自脊椎动物(例如，盲鳗目，七鳃鳗目，软骨鱼纲，硬骨鱼纲，两栖动物，爬行动物，鸟类，哺乳动物，等)的细胞。更具体地，使用源自哺乳动物(例如，单孔目，有袋目，无齿类动物，皮翼目，翼手目，食肉动物，食虫动物，长鼻目，奇蹄目，偶蹄目，管齿目，鳞甲目，海牛目，鲸类动物，灵长目，啮齿目，兔形目，等)的细胞。在一个实施方案中，可以使用源自灵长目(例如，黑猩猩，日本猴，人，等)，特别是人的细胞。本发明不限于此。用于本发明的细胞可以是干细胞或体细胞。上述的细胞可以用于移植目的。可以使用源自开花植物(单子叶植物或双子叶植物)的细胞。优选地，使用双子叶植物细胞。更优选地，使用源自禾本科(Gramineae)、茄科、葫芦科、十字花科(Cruciferae)、伞形科、蔷薇科、豆科和紫草科(Boraginaceae)的细胞。优选地，使用源自小麦、玉米、稻、大麦、高粱、烟草、青椒、茄子、瓜、番茄、草莓、甘薯、芸苔属(Brassica)、卷心菜、韭菜、椰菜、大豆、苜蓿、亚麻、胡萝卜、黄瓜、柑桔、大白菜、莴苣、桃子、马铃薯、紫草(Lithospermumeythrohizon)、黄连根茎(Coptis Rhizom)、白杨和苹果的细胞。植物细胞可以是一部分植物体、器官、组织、培养细胞等。转化细胞、组织、器官或个体的技术是本领域众所周知的。这些技术详细地描述在本文引用的文献等中。可以将核酸分子短暂地或稳定地导入生物细胞中。用于短暂地或稳定地导入基因的技术是本领域众所周知的。用于分化用于本发明的细胞、从而生成转化的植物的技术也是本领域众所周知的。应当明白，这些技术详细地描述在本文引用的文献等中。用于从转化的植物得到种子的技术也是本领域众所周知的。这些技术描述在本文提及的文献中。

如本文所使用的，术语“干细胞”指能自我复制和具有多能性的细胞。一般地，干细胞可以再生受伤的组织。这里使用的干细胞可以是但不限于：胚胎干(ES)细胞或组织干细胞(也称作组织性干细胞，组织特异性的干细胞，或体干细胞)。干细胞可以是人工生产的细胞，只要它能具有上述的能力。术语“胚胎干细胞”指源自早期胚胎的多能干细胞。与胚胎干细胞不同，组织干细胞的分化方向受到限制。胚胎干细胞位于组织中的特定位置，且具有未分化的胞内结构。因此，组织干细胞具有低水平的多能性。在组织干细胞中，核/胞质比率较高，且有很少的胞内细胞器。组织干细胞一般具有多能性，细胞周期较长，且可以维持超过个体寿命的增殖能力。这里使用的干细胞可以是胚胎干细胞或组织干细胞，只要它们能调节基因复制的倾向于错误的频率。

可以将组织干细胞分类为细胞来源的位点的种类，例如皮系统、消化系统、骨髓系统、神经系统等。皮系统中的组织干细胞包括表皮干细胞，毛囊干细胞，等。消化系统中的组织干细胞包括胰腺(普通的)干细胞，肝干细胞，等。骨髓系统中的组织干细胞包括造血干细胞，间充质干细胞，等。神经系统中的组织干细胞包括神经干细胞，视网膜干细胞，等。

如本文所使用的，术语“体细胞”指生殖细胞(例如卵细胞，精子等)以外的任意细胞，其不能将其DNA转移到下一代中。一般地，体细胞具有有限的或没有多能性。这里使用的体细胞可以是自然产生的或遗传修饰的，只要它们能调节基因复制的倾向于错误的频率。

将干细胞的来源分成外胚层、内胚层或中胚层。外胚层来源的干细胞大多存在于脑中，包括神经干细胞。内胚层来源的干细胞大多存在于骨髓中，包括血管干细胞，造血干细胞，间充质干细胞，等。中胚层来源的干细胞大多存在于器官中，包括肝干细胞，胰腺干细胞，等。如本文所使用的体细胞可以源自任意的胚层，只要它们能调节基因复制的倾向于错误的频率。

如本文所使用的，术语“分离的”表示减少了、优选地基本上排除了至少一种一般环境中的天然伴随物。因此，术语“分离的细胞”指基本上不含有一般环境中的天然伴随物(例如，其它细胞，蛋白，核酸，等)的细胞。与核酸或多肽有关的术语“分离的”指核酸或多肽，例如，当通过重组DNA技术生产时，其基本上不含有细胞物质或培养基，或者当化学合成时，其基本上不含有前体化学物质或其它化学物质。优选地，分离的核酸不含有天然地在生物中的核酸侧翼的序列(核酸的5′或3′末端)。

如本文所使用的，与细胞有关的术语“建立”指其中维持了细胞的特定性质(多能性)，且该细胞在培养条件下会经历稳定的增殖的细胞状态。因此，建立的干细胞会维持多能性。

如本文所使用的，术语“分化的细胞”指具有专门功能和形式的细胞(例如，肌肉细胞，神经元，等)。与干细胞不同，分化的细胞没有或具有很少的多能性。分化的细胞的实例包括表皮细胞，胰腺实质细胞，胰管细胞，肝细胞，血细胞，心肌细胞，骨骼肌细胞，成骨细胞，骨骼成肌细胞，神经元，血管内皮细胞，色素细胞，平滑肌细胞，脂肪细胞，骨细胞，软骨细胞，等。这里使用的细胞可以是任意的上述细胞，只要它们能调节基因复制的倾向于错误的频率。如本文所使用的，术语“分化”或“细胞分化”指，在源自单个细胞分裂的子代细胞群体中发生在形态和/或功能上具有定性差异的2种或更多种细胞的现象。因此，“分化”包括这样的过程，其中一群(家族树)原始地不具有特定的可检测的特征的细胞获得了特征，例如生成特定的蛋白，等。

如本文所使用的，与细胞、生物等有关的术语“状态”指细胞、生物等的参数(例如，细胞周期、对外源试剂的反应、信号转导、基因表达、基因转录等)的状况或模式。这样的状态的实例包括但不限于：分化的状态，未分化的状态，细胞对外源试剂的反应，细胞周期，增殖状态，等。在这里可以使用目标生物对下述参数(特征是生物的环境)的反应性或抗性作为生物状态的量度：温度，湿度(例如，绝对湿度，相对湿度，等)，pH，盐浓度(例如，所有盐或特定盐的浓度)，营养物(例如，碳水化合物的量，等)，金属(例如，所有金属或特定金属(例如，重金属，等)的量或浓度)，气体(例如，所有气体或特定气体的量)，有机溶剂(例如，所有有机溶剂或特定有机溶剂(例如，乙醇，等)的量)，压力(例如，局部的或总的压力，等)，大气压力，粘度，流速(例如，存在生物的介质的流速，等)，光强度(例如，特定波长的光的量，等)，光波长(例如，可见光，紫外光，红外光，等)，电磁波，辐射，重力，张力，声波，目标生物以外的其它生物(例如，寄生物，病原性细菌，等)，化学试剂(例如，药物，等)，抗生素，自然产生的物质，心理应激，机体应激，等。

如本文所使用的，与实体有关的术语“环境”(或德语中的“Umgebung”)指围绕着该实体的环境。在环境中，识别出了多种组分和一定量的状态，它们称作环境因素。环境因素的实例包括上述的参数。环境因素一般大致分成非生物的环境因素和生物的环境因素。非生物的环境因素(无机环境因素)可以分成物理因素和化学因素，或者，气候因素和土壤因素。各种环境因素不总是独立地作用于生物，而是可以与另一种相关联。因此，在这里可以逐个地或作为整体地(各种参数的整体)观察环境因素。

如本文所使用的，术语“组织”指多细胞生物中的具有基本上相同的功能和/或形式的细胞的聚集体。“组织”一般是相同来源的细胞的聚集体，但是可以是不同来源的细胞的聚集体，只要这些细胞具有相同的功能和/或形式。因此，当本发明的干细胞用于再生组织时，该组织可以由2种或更多种不同来源的细胞的聚集体组成。一般地，组织构成器官的一部分。在形态的、功能的或发育的基础上，可以将动物组织分成表皮组织，结缔组织，肌肉组织，神经组织，等。根据构成组织的细胞的发育状态，可以将植物组织大致分成分生组织和永久组织。或者，根据构成组织的细胞的类型，可以将组织分成单一组织和复合组织。因而，可以将组织分成各种类别。这里可以使用任意的组织，只要其中能调节基因复制的倾向于错误的频率。

任意的器官或其一部分都可以用于本发明。要在本发明中注射的组织或细胞可以源自任意的器官。如本文所使用的，术语“器官”指位于发挥特定功能的个体生物的特定部分中的形态上独立的结构。在多细胞生物(例如，动物，植物)中，器官由空间上以特定方式排列的几种组织组成，每种组织由许多细胞组成。这样的器官的实例包括与血管系统有关的器官。在一个实施方案中，本发明靶向的器官包括但不限于：皮肤，血管，角膜，肾，心，肝，脐带，肠，神经，肺，胎盘，胰腺，脑，外周肢(peripheral limb)，视网膜，等。任意的器官或其一部分都可以用于本发明，只要其中能调节基因复制的倾向于错误的频率。

如本文所使用的，术语“产物物质”指目标生物或其一部分生成的物质。这样的产物物质的实例包括但不限于：基因的表达产物、代谢物、粪便等。根据本发明，通过调节遗传性状的转化率，可以使目标生物改变产物物质的类型和/或量。应当明白，本发明包括这样改变的产物物质。优选地，产物物质可以是但不限于代谢物。

如本文所使用的，与生物有关的术语“疾病模型”指可以在其中重建对生物特异性的疾病、症状、紊乱、状况等的生物模型。通过本发明的方法，可以生成这样的疾病模型。这样的疾病模型的实例包括但不限于：癌症的动物模型，心脏病(例如，心肌梗塞，等)的动物模型，心血管病(例如，动脉硬化，等)的动物模型，中枢神经病(例如，痴呆，脑梗塞，等)的动物模型，等。

(普通生物化学和分子生物学)

(一般技术)

如本文所使用的分子生物学技术、生物化学技术、微生物学技术和细胞生物学技术是本领域众所周知的和常用的，且描述在，例如，Sambrook J.等(1989)，Molecular Cloning：A Laboratory Manual，Cold Spring Harbor和其第3版.(20D1)；Ausubel，F.M.(1987)，Current Protocols in Molecular Biology，Greene Pub.Associatesand Wiley-Interscience；Ausubel，F.M.(1989)，Short Protocolsin Molecular Biology：A Compendium of Methods from CurrentProtocols in Molecular Biology，Greene Pub.Associates andWiley-Interscience；Innis，M.A.(1990)，PCR Protocols：A Guideto Methods and Applications，Academic Press；Ausubel，F.M.(1992)，Short Protocols in Molecular Biology：A Compendiumof Methods from Current Protocols in Molecular Biology，GreenePub.Associates；Ausubel，F.M.(1995)，Short Protocols inMolecular Biology：A Compendium of Methods from CurrentProtocols in Molecular Biology，Greene Pub.Associates；Innis，M.A.等(1995)，PCR Strategies，Academic Press；Ausubel，F.M.(1999)，Short Protocols in Molecular Biology：ACompendium of Methods from Current Protocols in MolecularBiology，Wiley，and annual updates；Sninsky，J.J.等(1999)，PCR Applications：Protocols for Functional Genomics，AcademicPress；Special issue，Jikken Igaku[Experimental Medicine]“Idenshi Donyu & Hatsugen Kaiseki Jikkenho[ExperimentalMethods for Gene Introduction & Expression Analysis]”，Yodo-sha，1997，等。这些出版物中的每一篇的相关部分(或可能是整体)均在这里引作参考。

用于制备人工合成的基因的DNA合成技术和核酸化学描述在，例如，Gait，M.J.(1985)，Oligonucleotide Synthesis：A PracticalApproach，IRL Press；Gait，M.J.(1990)，OligonucleotideSynthesis：A Practical Approach，IRL Press；Eckstein，F.(1991)，Oligonucleotides and Analogues：A Practical Approac，IRL Press；Adams，R.L.等(1992)，The Biochemistry of the Nucleic Acids，Chapman & Hall；Shabarova，Z.等(1994)，Advanced OrganicChemistry of Nucleic Acids，Weinheim；Blackburn，G.M.等(1996)，Nucleic Acids in Chemistry and Biology，Oxford UniversityPress；Hermanson，G.T.(1996)，Bioconjugate Techniques，Academic Press；等，其相关部分在这里引作参考。

如本文所使用的术语“蛋白”、“多肽”、“寡肽”和“肽”具有相同的含义，是指具有任意长度的氨基酸聚合物。该聚合物可以是直链、分支或环状链。氨基酸可以是自然产生的或非自然产生的氨基酸，或变体氨基酸。该术语可以包括组装进许多多肽链的复合物中的那些。该术语还包括自然产生的或人工改变的氨基酸聚合物。这样的修饰包括，例如，二硫键形成，糖基化，脂化(lipidation)，乙酰化，磷酸化，或任意的其它操作或修饰(例如，与标记部分缀合)。该定义包括例如含有至少一种氨基酸类似物(例如，非自然产生的氨基酸，等)的多肽、肽样化合物(例如，类肽)和本领域已知的其它变体。本发明的基因产物一般是多肽形式。多肽形式的本发明的产物物质可以用作药物组合物等。

如本文所使用的术语“多核苷酸”、“寡核苷酸”和“核酸”具有相同的含义，是指具有任意长度的核苷酸聚合物。该术语还包括“寡核苷酸衍生物”或“多核苷酸衍生物”。“寡核苷酸衍生物”或“多核苷酸衍生物”包括核苷酸衍生物，或指具有与一般连接不同的核苷酸间连接的寡核苷酸或多核苷酸，它们可互换地使用。这样的寡核苷酸的实例具体地包括2′-O-甲基-核糖核苷酸，其中的寡核苷酸的磷酸二酯键被转化成硫代磷酸酯键的寡核苷酸衍生物，其中的寡核苷酸的磷酸二酯键被转化成N3′-P5′氨基磷酸酯键的寡核苷酸衍生物，其中的寡核苷酸的核糖和磷酸二酯键被转化成肽-核酸键的寡核苷酸衍生物，其中的寡核苷酸的尿嘧啶被取代为C-5丙炔基尿嘧啶的寡核苷酸衍生物，其中的寡核苷酸的尿嘧啶被取代为C-5噻唑尿嘧啶的寡核苷酸衍生物，其中的寡核苷酸的胞嘧啶被取代为C-5丙炔基胞嘧啶的寡核苷酸衍生物，其中的寡核苷酸的胞嘧啶被取代为吩噁嗪修饰的胞嘧啶的寡核苷酸衍生物，其中的DNA的核糖被取代为2′-O-丙基核糖的寡核苷酸衍生物，和其中的寡核苷酸的核糖被取代为2′-甲氧基乙氧基核糖的寡核苷酸衍生物。除非另有说明，特定的核酸序列还隐含地包括其保守地修饰的变体(例如简并的密码子取代)和互补的序列以及明确指出的序列。具体地，通过生成其中的一个或多个选定的(或全部)密码子的第3位取代为混合碱基和/或去氧肌苷残基的序列，可以生成简并的密码子取代(Batzer等，Nucleic Acid Res.19：5081(1991)；Ohtsuka等，J.Biel.Chem.260：2605-2608(1985)；Rossolini等，Mol.Cell.Probes 8：91-98(1994))。本发明的基因一般是多核苷酸形式。多核苷酸形式的本发明的基因或基因产物可以用于本发明的方法。

如本文所使用的，术语“核酸分子”还与术语“核酸”、“寡核苷酸”和“多核苷酸”可互换地使用，包括cDNA、mRNA、基因组DNA等。如本文所使用的，核酸和核酸分子可以包含在术语“基因”的概念中。能编码给定基因的序列的核酸分子包括“剪接突变体(变体)”。类似地，由核酸编码的特定蛋白包括由该核酸的剪接变体编码的任意蛋白。如其名字所暗示的，“剪接突变体”是基因的可变剪接的产物。转录后，可以剪接初始的核酸转录物，从而使得不同的(可变的)核酸剪接产物能编码不同的多肽。生成剪接变体的机制可以有变化，但是包括外显子的可变剪接。该定义还包括通过连读转录源自相同核酸的可变多肽。该定义包括剪接反应的任意产物，包括剪接产物的重组形式。因此，本发明的基因可以包括这里的剪接突变体。

如本文所使用的，基因(例如，核酸序列，氨基酸序列，等)的“同源性”指2个或更多个基因序列之间的同一性的比例。如本文所使用的，序列(核酸序列，氨基酸序列，等)的同一性指2个或更多个可比较的序列之间的相同序列(单个的核酸，氨基酸，等)的比例。因此，2个特定的基因之间的同源性越大，它们的序列之间的同一性或相似性越大。通过直接比较它们的序列，或者通过在严格条件下的杂交方法，可以确定2个基因是否具有同源性。当将2个基因序列直接彼此对比时，如果基因的DNA序列代表性地彼此具有至少50％的同一性，优选地至少70％的同一性，更优选地至少80％，90％，95％，96％，97％，98％或99％的同一性，则这些基因具有同源性。如本文所使用的，当保守取代在上述的同源性中视作正的(相同的)时，基因(例如，核酸序列，氨基酸序列，等)的“相似性”指2个或更多个序列之间的同一性的比例。因此，同源性和相似性在存在保守取代时彼此不同。如果不存在保守取代，则同源性和相似性具有相同的值。

这里使用默认参数的PSI-BLAST(序列分析工具)，对比氨基酸序列和碱基序列的相似性、同一性和同源性。另外，可以使用FASTA(使用默认参数)代替PSI-BLAST。

如本文所使用的，术语“氨基酸”可以指自然产生的或非自然产生的氨基酸，只要它能满足本发明的目的。术语“氨基酸衍生物”或“氨基酸类似物”指与自然产生的氨基酸不同的氨基酸，且其具有与原始氨基酸类似的功能。这样的氨基酸衍生物和氨基酸类似物是本领域众所周知的。

术语“自然产生的氨基酸”指自然产生的氨基酸的L-异构体。自然产生的氨基酸是甘氨酸，丙氨酸，缬氨酸，亮氨酸，异亮氨酸，丝氨酸，甲硫氨酸，苏氨酸，苯丙氨酸，酪氨酸，色氨酸，半胱氨酸，脯氨酸，组氨酸，天冬氨酸，天冬酰胺，谷氨酸，谷氨酰胺，γ-羧基谷氨酸，精氨酸，鸟氨酸和赖氨酸。除非另有说明，如本文所使用的所有氨基酸是L-异构体，尽管使用D-氨基酸的实施方案也在本发明的范围内。术语“非自然产生的氨基酸”指通常在自然界不会发现的氨基酸。非自然产生的氨基酸的实例包括正亮氨酸，对硝基苯丙氨酸，高苯丙氨酸(homophenylalanine)，对氟苯丙氨酸，3-氨基-2-苯偶酰丙酸，D-或L-高精氨酸和D-苯丙氨酸。术语“氨基酸类似物”指具有与氨基酸类似的物理性质和/或功能的非氨基酸的分子。氨基酸类似物的实例包括，例如，乙硫氨酸，刀豆氨酸，2-甲基谷氨酰胺等。氨基酸模仿物指具有与氨基酸的一般化学结构不同的结构、但是以与自然产生的氨基酸类似的方式起作用的化合物。

如本文所使用的，术语“核苷酸”可以是自然产生的或非自然产生的。术语“核苷酸衍生物”或“核苷酸类似物”指与自然产生的核苷酸不同、且具有与原始核苷酸类似的功能的核苷酸。这样的核苷酸衍生物和核苷酸类似物是本领域众所周知的。这样的核苷酸衍生物和核苷酸类似物的实例包括但不限于：硫代磷酸酯，氨基磷酸酯，甲基膦酸酯，手性的-甲基膦酸酯，2-O-甲基核糖核苷酸，和肽-核酸(PNA)。

在本文中可以用它们的普遍知道的三字母符号或IUPAC-IUB生物化学命名委员会(Biochemical Nomenclature Commission)推荐的单字母符号来指示氨基酸。同样地，可以用它们的普遍接受的单字母编码来指示核苷酸。

如本文所使用的，术语“对应的”氨基酸或核酸指特定的多肽或多核苷酸分子中的氨基酸或核苷酸，其具有或预期其具有与作为对比参考的多肽或多核苷酸中的预定的氨基酸或核苷酸类似的功能。具体地，在酶分子的情况下，该术语指存在于活性部位(例如，提供DNA聚合酶的校对功能的范围)的相似位置的氨基酸，且类似地提供催化活性。例如，在反义分子的情况下，该术语指与反义分子的特定部分相对应的直向同源体(ortholog)中的相似部分。使用本领域已知的比对技术，可以鉴别出对应的氨基酸和核酸。这样的比对技术描述在，例如，Needleman，S.B.和Wunsch，C.D.，J.Mol.Biol.48，443-453，1970中。

如本文所使用的，术语“对应的”基因(例如，多肽或多核苷酸分子)指给定物种中的基因(例如，多肽或多核苷酸分子)，其具有或预期其具有与作为对比参考的物种中的预定的基因类似的功能。当存在许多具有这样的功能的基因时，该术语指具有相同的进化起源的基因。因此，与特定的基因相对应的基因可以是特定的基因的直向同源体。因此，可以在其它的动物(人，大鼠，猪，牛，等)中发现与小鼠DNA聚合酶基因等相对应的基因。通过本领域熟知的技术，可以鉴别出这样对应的基因。因此，例如，使用参考基因(例如，小鼠DNA聚合酶基因等)的序列作为查询序列，通过搜索动物(例如，人，大鼠)的序列数据库，可以发现特定的动物中的对应的基因。

如本文所使用的，术语“核苷酸”可以是自然产生的或非自然产生的。术语“核苷酸衍生物”或“核苷酸类似物”指与自然产生的核苷酸不同、且具有与原始核苷酸相似的功能的核苷酸。这样的核苷酸衍生物和核苷酸类似物是本领域众所周知的。这样的核苷酸衍生物和核苷酸类似物的实例包括但不限于：硫代磷酸酯，氨基磷酸酯，甲基膦酸酯，手性的-甲基膦酸酯，2-O-甲基核糖核苷酸和肽-核酸(PNA)。

如本文所使用的，术语“片段”指相对于参考多肽或多核苷酸的全长(长度n)具有1至n-1的序列长度的多肽或多核苷酸。片段的长度可以根据目的相应地改变。例如，在多肽的情况中，片段长度的下限包括3，4，5，6，7，8，9，10，15，20，25，30，40，50或更多的核苷酸。这里没有指出的整数(例如，11等)代表的长度可以是适当的下限。例如，在多核苷酸的情况下，片段长度的下限包括5，6，7，8，9，10，15，20，25，30，40，50，75，100或更多的核苷酸。这里没有指出的整数(例如，11等)代表的长度可以是适当的下限。如本文所使用的，多肽或多核苷酸的长度可以分别由氨基酸或核酸的数目表示。但是，上述的数字不是绝对的。上述的作为上限或下限的数字意在包括一些更大的或更小的数字(例如，±10％)，只要能维持相同的功能即可。为了该目的，可以在数字前加上“约”。但是，应当明白，数字的解释不受本说明书中是否存在“约”的影响。根据是否维持了作为片段参考的全长蛋白的功能中的至少一种功能(例如，与其它分子的特异性相互作用，等)，可以决定有用片段的长度。

如本文所使用的，术语能与生物试剂(例如多核苷酸、多肽等)“特异性地相互作用的试剂”指具有对生物试剂(例如多核苷酸、多肽等)的亲和力的试剂，其代表性地比对其它不相关的生物试剂(例如多核苷酸、多肽等)(更具体地，具有低于30％的同一性的那些)的亲和力更高或相等，优选地显著(例如，统计上显著地)更高。使用例如杂交实验、结合实验等，可以检测这样的亲和力。如本文所使用的，“试剂”可以是任意的物质或其它因素(例如，能量，例如光，辐射，热，电，等)，只要可以实现想要的目的即可。这样的物质的实例包括但不限于：蛋白，多肽，寡肽，肽，多核苷酸，寡核苷酸，核苷酸，核酸(例如，DNA，例如cDNA，基因组DNA，等；和RNA，例如mRNA)，多糖，寡糖，脂类，小分子量的有机分子(例如，激素，配体，信息传递物质，通过组合化学合成的分子，小分子量的分子(例如，药学上可接受的小分子量的配体等)，等)，和这些分子的组合。对多核苷酸特异性的试剂的实例包括但不限于：代表性地，与具有预定的序列同源性(例如，70％或更高的序列同一性)的多核苷酸的序列具有互补性的多核苷酸，多肽，例如能结合启动子区的转录试剂，等。对多肽特异性的试剂的实例包括但不限于：代表性地，特异性地针对多肽或其衍生物或类似物的抗体(例如，单链抗体)；当该多肽是受体或配体时，特异性的配体或受体；当多肽是酶时的底物等。这些试剂在这里可以用于调节生物的倾向于错误的频率。

如本文所使用的，术语“小分子量的有机分子”指具有相对较小的分子量的有机分子；通常，小分子量的有机分子指约1,000或更小的分子量，或可以指大于1,000的分子量。通过本领域已知的方法或其组合，可以一般地合成小分子量的有机分子。生物可以生成这些小分子量的有机分子。小分子量的有机分子的实例包括但不限于：激素，配体，信息传递物质，通过组合化学合成的分子，药学上可接受的小分子量的分子(例如，小分子量的配体等)，等。这些试剂在这里可以用于调节生物的倾向于错误的频率。

如本文所使用的，术语“抗体”包括多克隆抗体，单克隆抗体，人抗体，人源化的抗体，多功能抗体，嵌合抗体，和抗独特型抗体，和其片段(例如，F(ab′)₂和Fab片段)，和其它重组缀合物。这些抗体可以通过共价键或通过重组与酶(例如，碱性磷酸酶，辣根过氧化物酶，α-半乳糖酶，等)融合。

如本文所使用的，术语“抗原”指抗体分子可以特异性地结合的任意底物。如本文所使用的，术语“免疫原”指能启动淋巴细胞的抗原-特异性的免疫反应的活化的抗原。

如本文所使用的，术语“单链抗体”指通过肽交联剂连接Fv区的重链片段和轻链片段形成的单链多肽。

如本文所使用的，术语“复合分子”指这样的分子，其中许多分子，例如多肽、多核苷酸、脂类、糖、小分子量的分子等连接在一起。这样的复合分子的实例包括但不限于：糖脂，糖肽，等。这些分子在这里可以用作基因或其产物(例如，DNA聚合酶，等)或本发明的试剂，只要该分子具有与该基因或其基因产物(例如，DNA聚合酶，等)或本发明的试剂基本上相同的功能。

如本文所使用的，术语“分离的”生物试剂(例如，核酸，蛋白，等)指基本上与自然产生的生物的细胞中的其它生物试剂(例如，在核酸的情况下，核酸以外的试剂和具有与目标核酸不同的核酸序列的核酸；和在蛋白的情况下，蛋白以外的试剂和具有与目标蛋白不同的氨基酸序列的蛋白)分离或纯化的生物试剂。“分离的”核酸和蛋白包括通过标准纯化方法纯化出的核酸和蛋白。分离的核酸和蛋白还包括化学合成的核酸和蛋白。

如本文所使用的，术语“纯化的”生物试剂(例如，核酸，蛋白，等)指从中去除了至少一部分天然伴随的试剂的试剂。因此，通常，纯化的生物试剂的纯度高于正常状态的生物试剂(即，浓缩的)。

如本文所使用的，术语“纯化的”和“分离的”是指，存在优选地至少75重量％、更优选地至少85重量％、甚至更优选地至少95重量％和最优选地至少98重量％的相同类型的生物试剂。

如本文所使用的，术语基因产物(例如基因，多核苷酸，多肽，等)的“表达”是指，该基因等受到预定的体内作用的影响以改变成其它形式。优选地，术语“表达”是指，将基因、多核苷酸等转录和翻译成多肽。在本发明的一个实施方案中，基因可以转录成mRNA。更优选地，这些多肽可以具有翻译后的加工修饰。

如本文所使用的，术语基因、多核苷酸、多肽等的“表达的减少”是指，在存在本发明的试剂的作用时，表达水平比没有该试剂的作用时显著降低。优选地，表达的减少包括多肽(例如，DNA聚合酶等)的表达量的减少。如本文所使用的，术语基因、多核苷酸、多肽等的“表达的增加”是指，在存在本发明的试剂的作用时，表达水平比没有该试剂的作用时显著增加。优选地，表达的增加包括多肽(例如，DNA聚合酶等)的表达量的增加。如本文所使用的，术语基因的“表达的诱导”是指，通过将特定的试剂应用到特定的细胞，增加基因的表达量。因此，表达的诱导包括：当不能观察到基因的表达时，使基因表达，和当能观察到基因的表达时，增加基因的表达量。这些基因或基因产物(多肽或多核苷酸)的增加或减少可以用于调节例如，在本发明中复制中倾向于错误的频率。

如本文所使用的，在基因的情况下的术语“特异性地表达”是指，基因在特定位点表达或表达特定的时间段，其水平与在其它位点或时间段的不同(优选地更高)。术语“特异性地表达”是指，基因可以仅仅在给定的位点(特定位点)表达或可以在其它位点表达。优选地，术语“特异性地表达”是指，基因仅仅在给定的位点表达。因此，根据本发明的一个实施方案，DNA聚合酶可以特异性地或局部地在需要的部分表达。

如本文所使用的，术语“生物活性”是指生物内的试剂(例如，多核苷酸，蛋白，等)所具有的活性，包括表现出各种功能的活性(例如，转录促进活性)。例如，当2种试剂彼此相互作用时(例如，DNA聚合酶结合特异性的序列)，生物活性包括DNA聚合酶和特异性的序列之间的连接，连接造成的生物变化(例如，特异性的核苷酸聚合反应；发生复制错误；去除核苷酸的能力；识别错配的碱基对；等)。例如，当特定的试剂是酶时，其生物活性包括其酶促活性。在其它的实例中，当特定的试剂是配体时，其生物活性包括该试剂与该配体的受体的结合。使用本领域众所周知的技术，可以测量这样的生物活性。

如本文所使用的，术语“反义(活性)”是指允许特异性地阻抑或减少靶基因的表达的活性。通常，使用与靶基因(例如，DNA聚合酶等)的核酸序列互补的、具有至少8个邻接核苷酸的长度的核酸序列来实现该反义活性。这样的核酸序列优选地具有至少9个邻接核苷酸的长度，更优选地至少10个邻接核苷酸的长度，且甚至更优选地至少11个邻接核苷酸的长度，至少12个邻接核苷酸的长度，至少13个邻接核苷酸的长度，至少14个邻接核苷酸的长度，至少15个邻接核苷酸的长度，至少20个邻接核苷酸的长度，至少30个邻接核苷酸的长度，至少40个邻接核苷酸的长度，和至少50个邻接核苷酸的长度。这些核酸序列包括与其具有至少70％、更优选地至少80％、甚至更优选地至少90％、且再更优选地至少95％同源性的核酸序列。反义活性优选地与靶基因的核酸序列的5′末端序列互补。这样的反义核酸序列包括具有一个或几个、或至少一个核苷酸取代、添加和/或缺失的上述序列。具有这样的反义活性的分子在这里可以用于调节生物的倾向于错误的频率。

如本文所使用的，术语“RNAi”是RNA干扰的缩写，是指下述现象：将用于造成RNAi的试剂、例如双链RNA(也称作dsRNA)导入细胞中，并特异性地降低与其同源的mRNA，从而抑制基因产物的合成，和使用该现象的技术。如本文所使用的，RNAi可以具有与能造成RNAi的试剂相同的含义。

如本文所使用的，术语“能造成RNAi的试剂”指能造成RNAi的任意试剂。如本文所使用的，“能造成基因的RNA i的试剂”是指试剂能造成与该基因有关的RNAi和达到RNAi的效果(例如，抑制该基因的表达，等)。这样的能造成RNAi试剂的实例包括但不限于：与靶基因的核酸序列具有至少约70％同源性的序列或可在严格条件下杂交的序列，含有具有至少10个核苷酸长度的双链部分的RNA或其变体。在这里，该试剂可以优选地是含有3′突出端的DNA，且更优选地该3′突出端具有2个或更多个核苷酸的长度(例如，2-4个核苷酸的长度)。RNAi在这里可以用于调节生物的倾向于错误的频率。

如本文所使用的，“在严格条件下杂交的多核苷酸”指常用的且本领域众所周知的条件。通过使用从本发明的多核苷酸中选择出的多核苷酸，通过进行菌落杂交、噬菌斑杂交、DNA印迹杂交等，可以得到这样的多核苷酸。具体地，在有0.7-1.0M NaCl存在的情况下，使用在其上面固定了源自菌落或噬菌斑的DNA的滤器在65℃进行杂交。此后，在65℃，使用0.1-2倍浓度的SSC(盐水-柠檬酸钠)溶液(1-倍浓度的SSC溶液由150mM氯化钠和15mM柠檬酸钠组成)洗涤滤器。将通过该方法鉴别出的多核苷酸称作“在严格条件下杂交的多核苷酸”。可以根据描述在下述文献中的方法进行杂交，例如，Molecular Cloning第2版，Current Protocols in MolecularBiology，Supplement 1-38，DNA Cloning 1：Core Techniques，APractical Approach，第2版，0xford University Press(1995)等。在这里，在严格条件下杂交的序列优选地排除仅仅含有A(腺嘌呤)或T(胸腺嘧啶)的序列。“可杂交的多核苷酸”是指可以在上述的杂交条件下与其它多核苷酸杂交的多核苷酸。具体地，可杂交的多核苷酸至少包括与能编码具有本文具体公开的氨基酸序列的多肽的DNA的碱基序列具有至少60％同源性的多核苷酸，优选具有至少80％同源性的多核苷酸，且更优选具有至少95％同源性的多核苷酸。

术语“高度严格的条件”指用于使序列高度互补的DNA链进行杂交、且能排除明显错配的DNA的杂交的条件。杂交严格性主要由温度、离子强度、变性剂(例如甲酰胺)的浓度决定。用于杂交和洗涤的“高度严格的条件”的实例是0.0015M氯化钠，0.0015M柠檬酸钠，在65-68℃，或0.015M氯化钠，0.0015M柠檬酸钠，和50％甲酰胺，在42℃。见Sambrook，Fritsch & Maniatis，Molecular Cloning：A Laboratory Manual(第2版，Cold Spring Harbor Laboratory，N.Y.，1989)；Anderson等，Nucleic Acid Hybridization：APractical Approach Ch.4(IRL Press Limited)(Oxford Express)。可以任选地使用更严格的条件(例如更高的温度，更低的离子强度，更高的甲酰胺或其它变性剂)。为了减少非特异性的和/或背景杂交的目的，在杂交和洗涤缓冲液中可以包含其它试剂。实例是0.1％牛血清清蛋白，0.1％聚乙烯吡咯烷酮，0.1％焦磷酸钠，0.1％十二烷基硫酸钠(NaDodSO₄或SDS)，Ficoll，Denhardt氏溶液，超声波处理的鲑精DNA(或另一种非互补的DNA)和葡聚糖硫酸酯，尽管还可以使用其它合适的试剂。可以改变这些添加剂的浓度和类型，而基本上不影响杂交条件的严格性。杂交实验通常在pH6.8-7.4进行；但是，在一般的离子强度条件下，杂交速度几乎与pH无关。见Anderson等，Nucleic Acid Hybridization：A Practical Approach Ch.4(IRLPress Limited，Oxford，英国)。

能影响DNA双链体的稳定性的因素包括碱基组成、长度和碱基对错配的程度。本领域的技术人员可以调节杂交条件，以使这些变量适应，并使不同序列相关性的DNA形成杂交物。通过下面的方程，可以估计出较好地配对的DNA双链体的解链温度：

Tm(℃)＝81.5+16.6(log[Na⁺])+0.41(％G+C)-600/N-0.72(％甲酰胺)

其中N是形成的双链体的长度，[Na⁺]是杂交或洗涤溶液中的钠离子的摩尔浓度，％G+C是杂交物中的(鸟嘌呤+胞嘧啶)碱基百分比。对于较不好地配对的杂交物，每1％的错配，解链温度会降低约1℃。

术语“中等严格的条件”指能形成具有比“高度严格的条件”下发生的碱基对错配更大的程度的DNA双链体的条件。一般的“中等严格的条件”的实例是0.015M氯化钠，0.0015M柠檬酸钠，在50-65℃，或0.015M氯化钠，0.0015M柠檬酸钠，和20％甲酰胺，在37-50℃。作为实例，在0.015M钠离子中、50℃的“中等严格的条件”允许约21％错配。

本领域的技术人员能够明白，“高度严格的条件”和“中等严格的条件”之间没有绝对的区别。例如，在0.015M钠离子(无甲酰胺)时，较好地配对的长DNA的解链温度是约71℃。在65℃(在相同的离子强度)洗涤时，会允许约6％错配。为了捕获相关性更差的序列，本领域的技术人员可以简单地降低温度或升高离子强度。

通过下式可以较好地估计最高达约20个核苷酸的寡核苷酸探针在1M NaCl中的解链温度：

Tm＝(2℃/A-T碱基对)+(4℃/G-C碱基对)。

应当注意6X盐柠檬酸钠(SSC)中的钠离子浓度是1M。见Suggs等，Developmental Biology Using Purified Genes 683(Brown和Fox，编，1981)。

从具有PCR引物和杂交探针(其含有例如SEQ ID NO.1，3，41，43，47，49，51，53，55，57，59，61，63，65，等所示的核酸序列的一部分)的cDNA文库中，容易地分离出了能编码DNA聚合酶蛋白的自然产生的核酸。在基本上含有1％牛血清清蛋白(BSA)、500mM磷酸钠(NaPO₄)、1mM EDTA和7％SDS、在42℃的杂交缓冲液和基本上含有2xSSC(600mM NaCl；60mM柠檬酸钠)和0.1％SDS、在50℃的洗涤缓冲液定义的低严格条件下；更优选地在基本上含有1％牛血清清蛋白(BSA)、500mM磷酸钠(NaPO₄)、15％甲酰胺、1mM EDTA和7％SDS、在50℃的杂交缓冲液和基本上含有1xSSC(300mM NaCl；30mM柠檬酸钠)和1％SDS、在50℃的洗涤缓冲液定义的低严格条件下；最优选地在基本上含有1％牛血清清蛋白(BSA)、200mM磷酸钠(NaPO₄)、15％甲酰胺、1mM EDTA和7％SDS、在50℃的杂交缓冲液和基本上含有0.5xSSC(150mM NaCl；15mM柠檬酸钠)和0.1％SDS、在65℃的洗涤缓冲液定义的低严格条件下，优选的能编码DNA聚合酶的核酸或其变体或片段等可与如SEQ ID NO.1，3，41，43，47，49，51，53，55，57，59，61，63，65，等所述序列中的全部或部分杂交。

如本文所使用的，术语“探针”指在生物实验中用于搜索的物质，例如体外和/或体内筛选等，包括但不限于，例如，具有特定的碱基序列的核酸分子或含有特定的氨基酸序列的肽。

作为普通探针的核酸分子的实例包括具有至少8个邻接的核苷酸的长度的核酸序列的、且与目标基因的核酸序列同源或互补的核酸分子。这样的核酸序列可以优选地是具有至少9个邻接的核苷酸的长度、更优选地至少10个邻接的核苷酸的长度、且更优选地至少11个邻接的核苷酸的长度、至少12个邻接的核苷酸的长度、至少13个邻接的核苷酸的长度、至少14个邻接的核苷酸的长度、至少15个邻接的核苷酸的长度、至少20个邻接的核苷酸的长度、至少25个邻接的核苷酸的长度、至少30个邻接的核苷酸的长度、至少40个邻接的核苷酸的长度或至少50个邻接的核苷酸的长度的核酸序列。用作探针的核酸序列包括与上述序列具有至少70％、更优选地至少80％、且更优选地至少90％或至少95％同源性的核酸序列。

如本文所使用的，术语“搜索”是指，使用特定的核酸序列来电子地或生物地，或使用其它的方法发现具有特定的功能和/或性质的其它核酸碱基序列。电子搜索的实例包括但不限于：BLAST(Altschul等，J.Mol.Biol.215：403-410(1990))，FASTA(Pearson & Lipman，Proc.Natl.Acad.Sci.，USA 85：2444-2448(1988))，Smith和Waterman方法(Smith和Waterman，J.Mol.Biol.147：195-197(1981))，和Needleman和Wunsch方法(Needleman和Wunsch，J.Mol.Biol.48：443-453(1970))，等。生物搜索的实例包括但不限于：其中使基因组DNA附着到尼龙膜等上的微阵列，或其中在严格杂交、PCR和原位杂交中使基因组DNA附着到玻璃板上的微阵列(微测定)，等。这里意味着，在本发明中使用的DNA聚合酶等包括通过这样的电子的或生物的搜索鉴定出的对应基因。

如本文所使用的，通过在对比窗口中对比2个最佳比对的序列，可以确定“(氨基酸，核苷酸，等)序列同一性、同源性或相似性的百分比”，其中，在与用于2个序列的最佳比对的参考序列(其不包含添加或缺失(如果其它序列包含添加，则可能产生缺口))相比时，对比窗口中的部分多核苷酸或多肽序列可以包含添加或缺失(即缺口)。通过测定2个序列中出现相同核酸碱基或氨基酸残基的位置的数目，以得到匹配位置的数目，用匹配位置的数目除以参考序列中的位置的总数(即窗口大小)，将结果乘以100，得到序列同一性的百分比，可以计算出百分比。当在搜索中使用时，通过选自本领域众所周知的各种序列对比算法和程序的合适技术，可以评价同源性。这样的算法和程序的实例包括但不限于：TBLASTN，BLASTP，FASTA，TFASTA和CLUSTALW(Pearson和Lipman，1988，Proc.Natl.Acad.Sci.USA85(8)：2444-2448，Altschul等，1990，J.Mol.Biol.215(3)：403-410，Thompson等，1994，Nucleic acid Res.22(2)：4673-4680，Higgins等，1996，Methods Enzymol.266：383-402，Altschul等，1990，J.Mol.Biol.215(3)：403-410，Altschul等，1993，Nature Genetics 3：266-272)。在一个特别优选的实施方案中，使用本领域众所周知的基础的局部比对搜索工具(BasicLocal Alignment Search Tool)(BLAST)，评价了蛋白或核酸序列的同源性(例如，见Karlin和Altschul，1990，Proc.Natl.Acad.Sci.USA 87：2267-2268，Altschul等，1990，J.Mol.Biol.215：403-410，Altschul等，1993，Nature Genetics 3：266-272，Altschul等，1997，Nuc.Acids Res.25：3389-3402)。具体地，5个特化的-BLAST程序可以用于执行下述的任务，以实现对比或搜索：

(1)使用BLASTP和BLAST3，对比氨基酸查询序列和蛋白序列数据库；

(2)使用BLASTN，对比核苷酸查询序列和核苷酸序列数据库；

(3)使用BLASTX，对比概念地翻译的产物(其中核苷酸查询序列(两条链)被转变(convert)了超过6个阅读框)和蛋白序列数据库；

(4)使用TBLASTN，对比所有被转变了超过6个阅读框的蛋白查询序列(两条链)和核苷酸序列数据库；和

(5)使用TBLASTX，对比被转变了超过6个阅读框的核苷酸查询序列和核苷酸序列数据库。

通过指定氨基酸查询序列或核酸查询序列和优选地从蛋白序列数据库或核酸序列数据库得到的实验序列之间的称作“高分片段对”的类似的片段，BLAST程序能鉴定出同源序列。使用本领域众所周知的评分矩阵，可以优选地鉴定(比对)大量的高分片段对。优选地，评分矩阵是BLOSUM62矩阵(Gonnet等，1992，Science 256：1443-1445，Henikoff和Henikoff，1993，Proteins 17：49-61)。可以使用PAM或PAM250矩阵，尽管它们不是象BLOSUM62矩阵一样优选的(例如，见，Schwartz和Dayhoff，编，1978，Matrices for DetectingDistance Relationships：Atlas of Protein Sequence andStructure，Washington：National Biomedical ResearchFoundation)。BLAST程序能评价所有鉴定出的高分片段对的统计显著性，并优选地选择能满足使用者独立地定义的显著性阈值水平的片段，例如，使用者设定的同源性。优选地，使用Karlin公式评价高分片段对的统计显著性(见Karlin和Altschul，1990，Proc.Natl.Acad.Sci.USA 87：2267-2268)。

如本文所使用的，术语“引物”指能在大分子合成酶促反应中起始要合成的大分子化合物的反应所需的物质。在合成核酸分子的反应中，可以使用与要合成的大分子化合物的一部分互补的核酸分子(例如，DNA，RNA，等)。

经常用作引物的核酸分子包括具有至少8个邻接的核苷酸的长度的核酸序列、且与目标基因的核酸序列互补的核酸分子。这样的核酸序列优选地具有至少9个邻接的核苷酸的长度，更优选地至少10个邻接的核苷酸的长度，甚至更优选地至少11个邻接的核苷酸的长度，至少12个邻接的核苷酸的长度，至少13个邻接的核苷酸的长度，至少14个邻接的核苷酸的长度，至少15个邻接的核苷酸的长度，至少16个邻接的核苷酸的长度，至少17个邻接的核苷酸的长度，至少18个邻接的核苷酸的长度，至少19个邻接的核苷酸的长度，至少20个邻接的核苷酸的长度，至少25个邻接的核苷酸的长度，至少30个邻接的核苷酸的长度，至少40个邻接的核苷酸的长度，和至少50个邻接的核苷酸的长度。用作引物的核酸序列包括与上述序列具有至少70％、更优选地至少80％、甚至更优选地至少90％和最优选地至少95％同源性的核酸序列。作为引物的合适序列可以根据要合成(扩增)的序列的性质而变化。本领域的技术人员可以根据目标序列设计出合适的引物。这样的引物设计是本领域众所周知的，且可以手工地或使用计算机程序(例如，LASERGENE，Primer Select，DNAStar)进行。

如本文所使用的，术语“表位”指其详细结构尚未被必要地定义的抗原决定簇，只要它能引起抗原-抗体反应即可。因此，术语“表位”包括一组氨基酸残基，其能参与特定免疫球蛋白的识别，或者在T细胞的情形中，这些残基是T细胞受体蛋白和/或主要组织相容性复合体(MHC)受体的识别所必需的。该术语也与“抗原决定簇”或“抗原决定簇位点”可互换地使用。在免疫学领域，体内地或体外地，表位是分子的特征(例如，初级、二级和三级肽结构和电荷)，其形成能被免疫球蛋白、T细胞受体或HLA分子识别的位点。包括肽的表位包含3个或更多个氨基酸，其空间构象是该表位所独有的。通常，表位由至少5个这样的氨基酸组成，更常见地，由至少6，7，8，9或10个这样的氨基酸组成。表位的长度越大，表位与原始肽的相似性越大，即，更长的表位一般是优选的。当考虑构象时，情况未必是这样的。确定氨基酸的空间构象的方法是本领域已知的，且包括，例如，X-射线结晶学和二维核磁共振光谱学。而且，使用本领域众所周知的技术，可以容易地鉴定出特定蛋白中的表位。还参见，Geysen等，Proc.Natl.Acad.Sci.USA(1984)81：3998(general method forrapidly synthesizing peptides to determine the location ofimmunogenic epitopes in a given antigen)；美国专利号4,708,871(procedures for identifying and chemically synthesizingepitopes of antigens)；和Geysen等，Molecular Immunology(1986)23：709(technique for identifying peptides with high affinityfor a given antibody)。在简单的免疫测定中，可以鉴别出能识别相同表位的抗体。因而，测定包含肽的表位的方法是本领域众所周知的。如果提供了表位的初级核酸或氨基酸序列，则使用本领域的技术人员众所周知的常见技术，可以测定出这样的表位。

因此，包含肽的表位需要具有至少3个氨基酸、优选地至少4个氨基酸、更优选地至少5个氨基酸、至少6个氨基酸、至少7个氨基酸、至少8个氨基酸、至少9个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸和至少25个氨基酸的长度的序列。表位可以是线性的或构象的。

(基因的修饰)

在特定的蛋白分子(例如，DNA聚合酶，等)中，包含在序列中的特定的氨基酸可以被蛋白结构中的另一个氨基酸取代，例如阳离子区或底物分子结合位点，而不显著减少或损失相互作用的结合能力。蛋白的相互作用能力或其它性质决定了蛋白的特定的生物功能。因此，可以在氨基酸序列中或在DNA编码序列水平进行特定氨基酸取代，以在取代后生成能维持原始性质的蛋白。因此，可以对如本文所公开的肽和能编码这种肽的DNA进行各种修饰，而不显著损失生物有效性。或者，可以修饰能编码DNA聚合酶的核酸序列，从而修饰DNA聚合酶的校对功能。

当设计上述的修饰时，可以考虑氨基酸的疏水性指数。疏水氨基酸指数在为蛋白提供相互作用的生物功能中起重要作用，这是本领域普遍公认的(Kyte.J和Doolittle，R.F.，J.Mol.Biol.157(1)：105-132，1982)。氨基酸的疏水性质有助于蛋白的二级结构，从而调节蛋白和其它分子(例如，酶，底物，受体，DNA，抗体，抗原，等)之间的相互作用。基于其疏水性和电荷性质，为每种氨基酸指定如下的疏水性指数：异亮氨酸(+4.5)；缬氨酸(+4.2)；亮氨酸(+3.8)；苯丙氨酸(+2.8)；半胱氨酸/胱氨酸(+2.5)；甲硫氨酸(+1.9)；丙氨酸(+1.8)；甘氨酸(-0.4)；苏氨酸(-0.7)；丝氨酸(-0.8)；色氨酸(-0.9)；酪氨酸(-1.3)；脯氨酸(-1.6)；组氨酸(-3.2)；谷氨酸(-3.5)；谷氨酰胺(-3.5)；天冬氨酸(-3.5)；天冬酰胺(-3.5)；赖氨酸(-3.9)和精氨酸(-4.5)。

众所周知，如果特定的氨基酸被具有相似的疏水性指数的另一种氨基酸取代，得到的蛋白仍然可能具有与原始蛋白相似的生物功能(例如，具有等价酶活性的蛋白)。对于这样的氨基酸取代，疏水性指数优选地在±2内，更优选地在±1内，且甚至更优选地在±0.5内。本领域认为，这样的基于疏水性的氨基酸取代是有效的。

在修饰本发明的基因时，可以考虑亲水性指数。如美国专利号4,554,101所述，为氨基酸残基指定下面的亲水性指数：精氨酸(+3.0)；赖氨酸(+3.0)；天冬氨酸(+3.0±1)；谷氨酸(+3.0±1)；丝氨酸(+0.3)；天冬酰胺(+0.2)；谷氨酰胺(+0.2)；甘氨酸(0)；苏氨酸(-0.4)；脯氨酸(-0.5±1)；丙氨酸(-0.5)；组氨酸(-0.5)；半胱氨酸(-1.0)；甲硫氨酸(-1.3)；缬氨酸(-1.5)；亮氨酸(-1.8)；异亮氨酸(-1.8)；酪氨酸(-2.3)；苯丙氨酸(-2.5)和色氨酸(-3.4)。应当明白，氨基酸可以被具有相似亲水性指数的另一种氨基酸取代，且仍然可以提供生物等价物。对于这样的氨基酸取代，亲水性指数优选地在±2内，更优选地±1，且甚至更优选地±0.5。

如本文所使用的术语“保守取代”指氨基酸取代，其中被取代的氨基酸和取代氨基酸具有相似的亲水性指数或/和疏水性指数。例如，在亲水性或疏水性指数在±2内、优选地在±1内，且更优选地在±0.5内的氨基酸之间进行保守取代。保守取代的实例包括但不限于在每种下述的残基对内的取代：精氨酸和赖氨酸；谷氨酸和天冬氨酸；丝氨酸和苏氨酸；谷氨酰胺和天冬酰胺；和缬氨酸、亮氨酸和异亮氨酸，这是本领域的技术人员众所周知的。

如本文所使用的，术语“变体”指部分地与原始物质不同的物质，例如多肽、多核苷酸等。这样的变体的实例包括取代变体、添加变体、缺失变体、截短的变体、等位基因的变体，等。这样的变体的实例包括但不限于：相对于参考核酸分子或多肽具有一个或几个取代、添加和/或缺失的核苷酸或多肽，或具有至少一个取代、添加和/或缺失的核苷酸或多肽。变体可以具有或不具有参考分子(例如，野生型分子，等)的生物活性。根据目的，可以给变体赋予其它的生物活性，或者缺失部分生物活性。使用本领域众所周知的技术，可以进行这样的设计。或者，通过从生物中分离，以生产变体，可以得到已知其性质的变体，且可以扩增该变体的核酸序列，以得到序列信息。因此，对于宿主细胞，将源自异源物种的对应基因或其产物视作“变体”。

如本文所使用的，术语“等位基因”指位于与对应的基因等同的基因座处的遗传变体，这2个基因在这里彼此区别开。因此，本文所使用的术语“等位基因变体”指与特定的基因具有等位基因关系的变体。这样的等位基因变体通常具有与对应的等位基因相同或非常相似的序列，或者通常具有几乎相同的生物活性，尽管它很少具有不同的生物活性。如本文所使用的术语“物种同系物”或“同系物”指与特定物种的特定基因具有氨基酸或核苷酸同源性的物质(优选地至少60％同源性，更优选地至少80％、至少85％、至少90％和至少95％同源性)。从本说明书的描述中，可以清楚地明白得到这样的物种同系物的方法。术语“直向同源体”(也称作直向同源基因)指源自共同祖先的不同物种中的基因(由于物种形成)。例如，在具有多基因结构的血红蛋白基因家族的情况下，人和小鼠α-血红蛋白基因是直向同源体，而人α-血红蛋白基因和人β-血红蛋白基因是共生同源体(paralog)(由基因复制生成的基因)。直向同源体可以用于估计分子进化系统树。通常，在不同物种中的直向同源体可以具有与原始物种相似的功能。因此，本发明的直向同源体可以用于本发明。

如本文所使用的，术语“保守的(或保守地修饰的)变体”应用于氨基酸和核酸序列。关于特定的核酸序列，保守地修饰的变体指那些能编码相同的或基本上相同的氨基酸序列的核酸。因为遗传密码的简并性，大量的功能上相同的核酸可以编码任意的特定蛋白。例如，密码子GCA、GCC、GCG和GCU都能氨基酸丙氨酸。因而，在用密码子限定丙氨酸的每个位点，可以将密码子改成所述的对应密码予中的任一个，而不改变编码的多肽。这样的核酸变异是“沉默变异”，其代表着保守地修饰的变异的一个种类。能编码多肽的每个核酸序列在这里也描述了该核酸的每个可能的沉默变异。本领域的技术人员能够认识到，可以修饰核酸中的每个密码子(AUG除外，它通常是甲硫氨酸的唯一密码子；TGG除外，它通常是色氨酸的唯一密码子)，以生成功能上相同的分子。因此，在每个所述的序列中，都暗示着能编码多肽的核酸的每个沉默变异。优选地，可以进行这样的修饰，同时避免取代半胱氨酸，后者是能极大地影响多肽的高级结构的氨基酸。这样修饰碱基序列的方法的实例包括使用限制酶切割等；通过使用DNA聚合酶、克列诺(Klenow)片段、DNA连接酶等处理进行连接等；和使用合成的寡核苷酸进行位点特异性的碱基取代的方法(特异性的定位诱变；Mark Zoller和Michael Smith，Methods in Enzymology，100，468-500(1983))。使用分子生物学领域常用的方法，可以进行修饰。

为了制备功能上等同的多肽，除了氨基酸取代以外，可以进行氨基酸添加、缺失和/或修饰。氨基酸取代指将原始肽链的至少一个氨基酸替换为不同的氨基酸，例如用不同的氨基酸替换1-10个氨基酸，优选地1-5个氨基酸，更优选地1-3个氨基酸。氨基酸添加指向原始肽链添加至少一个氨基酸，例如向原始肽链添加1-10个氨基酸，优选地1-5个氨基酸，和更优选地1-3个氨基酸。氨基酸缺失指缺失至少一个氨基酸，例如缺失1-10个氨基酸，优选地1-5个氨基酸，和更优选地1-3个氨基酸。氨基酸修饰包括但不限于：酰胺化，羧基化，硫酸化，卤化，烷化，糖基化，磷酸化，羟基化，酰化(例如，乙酰化)，等。要取代的或添加的氨基酸可以是自然产生的或非自然产生的氨基酸或氨基酸类似物。自然产生的氨基酸是优选的。

如本文所使用的，术语“肽类似物”或“肽衍生物”指与肽不同、但是具有至少一种与该肽等同的化学或生物功能的化合物。因此，肽类似物包括相对于原始肽具有至少一种氨基酸类似物或氨基酸衍生物添加或取代的那些。肽类似物具有上述的添加或取代，从而使其功能基本上与原始肽的功能相同(例如，相似的pKa值，相似的官能团，相似的与其它分子的结合方式，相似的水溶性，等)。使用本领域众所周知的技术，可以制备出这样的肽类似物。因此，肽类似物可以是含有氨基酸类似物的聚合物。

类似地，如本文所使用的，术语“多核苷酸类似物”或“核酸类似物”指与多核苷酸或核酸不同、但是具有至少一种与多核苷酸或核酸等同的化学或生物功能的化合物。因此，多核苷酸或核酸类似物包括相对于原始多核苷酸或核酸具有至少一种核苷酸类似物或核苷酸衍生物添加或取代的那些。

如本文所使用的核酸分子包括这样的核酸分子，其中缺失了该核酸的一部分序列，或者被其它碱基取代，或者插入了其它的核酸序列，只要该核酸表达的多肽基本上具有与如上所述的自然产生的多肽相同的活性即可。或者，可以将其它核酸连接到该核酸的5′末端和/或3′末端。核酸分子可以包括可在严格的条件下与能编码多肽的基因杂交、且能编码具有基本上相同功能的多肽的那些。这样的基因是本领域已知的，且可以用于本发明。

通过众所周知的PCR方法(即，化学合成)，可以得到上述的核酸。该方法可以与例如定位诱变、杂交等组合。

如本文所使用的，关于多肽或多核苷酸的术语“取代”、“添加”或“缺失”指氨基酸或其取代基或核苷酸或其取代基分别相对于原始多肽或多核苷酸的取代、添加或缺失。这可以通过本领域众所周知的技术来实现，包括定位诱变技术等。多肽或多核苷酸可以具有任意数目(＞0)的取代、添加或缺失。该数目可以与具有这样数目的取代、添加或缺失的变体一样大，所述变体维持目的功能(例如激素和细胞因子的信息传递功能，等)。例如，这样的数目可以是1个或几个，优选地在全长的20％或10％内，或不超过100，不超过50，不超过25，等。

(遗传工程)

通过遗传工程技术，可以生产出如本文所使用的蛋白(例如DNA聚合酶和其片段和变体等)，并导入细胞中。

当在本文中提及基因时，术语“载体”或“重组载体”指能将目标多核苷酸序列转移到靶细胞中的载体。这样的载体能自我复制或整合进宿主细胞(例如，原核细胞，酵母，动物细胞，植物细胞，昆虫细胞，个体动物，和个体植物，等)的染色体中，且含有位于适合转录本发明的多核苷酸的位点处的启动子。将适用于克隆的载体称作“克隆载体”。这样的克隆载体通常含有包含许多限制位点的多克隆位点。限制位点和多克隆位点是本领域众所周知的，且可以根据目的适当地或任选地使用。该技术描述在如这里所述的文献中(例如，Sambrook等(同上))。这样的载体包括例如质粒。

如本文所使用的，术语“质粒”指存在于染色体外、且能自主复制的遗传因子。当特别提出时，将包含在细胞核的线粒体、叶绿体等中的DNA一般地称作细胞器DNA，且不同于质粒，即不包括在质粒中。

质粒的实例包括但不限于：

大肠杆菌：pET(TAKARA)，pUC(TOYOBO)，pBR322(TOYOBO)，pBluescriptII(TOYOBO)；

酵母：pAUR(TAKARA)，pESP(TOYOBO)，pESC(TOYOBO)；

枯草芽孢杆菌：pHY300PLK(TAKARA)；

真菌病：pPRTI(TAKARA)，pAUR316(TAKARA)；

动物细胞：pCMV(TOYOBO)，pBK-CMV(TOYOBO)；等。

如本文所使用的，术语“表达载体”指包含结构基因和用于调节其表达的启动予以及各种调节元件的核酸序列，所述调节元件的状态允许它们在宿主细胞中运行。调节元件可以优选地包括终止子，选择性标记例如抗药性基因，和沉默予和/或增强子。本领域的技术人员熟知，生物(例如，植物)表达载体的类型和调节元件的类型可以依赖于宿主细胞而异。通过将特定的启动子导入细胞，可以在特定条件下调节细胞的倾向于错误的频率。

如本文所使用的，用于原核细胞的“重组载体”包括，例如，pcDNA3(+)，pBluescript-SK(+/-)，pGEM-T，pEF-BOS，pEGFP，pHAT，pUC18，pFT-DEST^TM，42GATEWAY(Invitrogen)，等。

如本文所使用的，用于动物细胞的“重组载体”包括，例如，pcDNAI/Amp，pcDNA I，pCDM8(都商业上购自Funakoshi，Tokyo，日本)，pAGE107[日本公开号3-229(Invitrogen)]，pAGE103[J.Biochem.，101，1307(1987)]，pAMo，pAMoA[J.Biol.Chem.，268，22782-22787(1993)]，基于鼠干细胞病毒(MSCV)的逆转录病毒表达载体，pEF-BOS，pEGFP，等。

用于植物细胞的重组载体的实例包括Ti质粒，烟草花叶病毒载体，花椰菜花叶病毒载体，双生病毒组载体，等。

用于昆虫细胞的重组载体的实例包括杆状病毒载体，等。

如本文所使用的，术语“终止子”指位于基因的蛋白编码区的下游的序列，且其参与在DNA转录成mRNA时的转录的终止和聚腺苷酸(poly A)序列的添加。已知终止子有助于mRNA的稳定性，且对基因表达的量有影响。

如本文所使用的，术语“启动子”指能决定基因转录的起始位点的碱基序列，它是能直接调节转录频率的DNA区。结合到启动子上的RNA聚合酶会启动转录。因此，起启动子作用的特定基因的一部分在本文中称作“启动子部分”。启动子区通常位于推定的蛋白编码区的第一个外显子上游约2kbp内。因此，使用DNA分析软件，通过预测基因组的碱基序列中的蛋白编码区，可以估计启动子区。推定的启动子区通常位于结构基因的上游，但是依赖于结构基因，即推定的启动子区可能位于结构基因的下游。优选地，推定的启动子区位于第一个外显子的翻译起始位点上游约2kbp。

如本文所使用的，术语“增强子”指用于增强目标基因的表达效率的序列。这样的增强子是本领域众所周知的。可以使用1个或多个增强子，也可以不使用增强子。

如本文所使用的，术语“沉默子”指具有抑制或终止基因表达的功能的序列。在本发明中，可以使用任意的具有这样的功能的沉默子，也可以不使用沉默子。

如本文所使用的，术语“可操作地连接”是指设置需要的序列的位置，使其表达(运行)在转录和翻译调节序列(例如，启动子，增强子，等)或翻译调节序列的控制下。为了使启动子可操作地连接到基因上，一般使启动子紧邻该基因的上游。启动子无需临近结构基因。

在本文中可以使用任意的技术将能编码具有修饰的校对功能等的DNA聚合酶的核酸分子导入细胞中，包括，例如，转化，转导，转染，等。这样的核酸分子导入技术是本领域众所周知的和常用的，且描述在，例如，Ausubel F.A.等，编，(1988)，Current Protocolsin Molecular Biology，Wiley，New York，NY；Sambrook.J.等(1987)Molecular Cloning：A Laboratory Manual，第2版和其第3版.(2001)，Cold Spring Harbor Laboratory Press，Cold SpringHarbor，NY；Special issue，Jikken Igaku[Experimental Medicine]″Experimental Method for Gene Introduction & ExpressionAnalysis″，Yodo-sha，1997等。通过本文所述的方法，例如RNA印迹分析和蛋白印迹分析或其它众所周知的常见技术，可以确认基因导入。

任一种上述的将DNA导入细胞的方法都可以用作载体导入方法，包括，例如，转染，转导，转化，等(例如，磷酸钙方法，脂质体方法，DEAE葡聚糖方法，电穿孔方法，粒子枪(基因枪)方法，等)。

如本文所使用的，术语“转化体”指通过转化得到的生物的全部或部分(例如细胞)。转化体的实例包括原核细胞、酵母、动物细胞、植物细胞、昆虫细胞等。根据受试者，可以将转化体称作转化的细胞、转化的组织、转化的宿主等。这里使用的细胞可以是转化体。

当这里使用原核细胞进行遗传操作等时，原核细胞可以是，例如，埃希氏菌属(Escherichia)，沙雷氏菌属(Serratia)，芽孢杆菌属(Bacillus)，短杆菌属(Brevibacterium)，棒杆菌属(Corynebacterium)，微杆菌属(Microbacterium)，假单胞菌属(Pseudomonas)，等。更具体地，原核细胞可以是，例如，大肠杆菌XL1-Blue，大肠杆菌XL2-Blue，大肠杆菌DHl，等。

如本文所使用的动物细胞的实例包括小鼠骨髓瘤细胞，大鼠骨髓瘤细胞，小鼠杂交瘤细胞，中国仓鼠卵巢(CHO)细胞，幼仓鼠肾(BHK)细胞，非洲绿猴肾细胞，人白血病细胞，HBT5637(日本公开号63-299)，人结肠癌细胞系，等。小鼠骨髓瘤细胞包括ps20，NSO，等。大鼠骨髓瘤细胞包括YB2/0等。人胚胎肾细胞包括HEK293(ATCC：CRL-1573)等。人白血病细胞包括BALL-1等。非洲绿猴肾细胞包括COS-1，COS-7，等。人结肠癌细胞系包括HCT-15，等。人成神经细胞瘤包括SK-N-SH，SK-N-SH-5Y，等。小鼠成神经细胞瘤包括Neuro2A，等。

用于导入DNA的任何方法在这里都可以用作导入重组载体的方法，包括，例如，氯化钙方法，电穿孔方法(Methods.Enzymol.，194，182(1990))，脂转染方法，原生质球方法(Proc.Natl.Acad.Sci.USA，84，1929(1978))，醋酸锂方法(J.Bacteriol.，153，163(1983))，Proc.Natl.Acad.Sci.USA，75，1929(1978)所述的方法，等。

如本文所使用的逆转录病毒感染方法是本领域众所周知的，描述在，例如，Current Protocols in Molecular Biology(同上)(更具体地，第9.9-9.14单元)，等。具体地，例如，用胰蛋白酶将胚胎干细胞处理成单细胞悬浮液，随后与能生产病毒的细胞(包装细胞系)的培养物上清液共培养1-2小时，由此得到足够量的感染细胞。

当本发明应用于植物时，使用本领域众所周知的方法，例如使用土壤杆菌(Agrobacterium)的方法和直接插入方法，可以将植物表达载体导入植物细胞中。使用土壤杆菌的方法的实例可以包括记载在例如Nagel等(1990)，Microbiol.Lett.，67，325)中的方法。在该方法中，例如，通过电穿孔将适用于植物的表达载体插入土壤杆菌中，且通过描述在例如Gelvin等，编，(1994)，Plant MolecularBiology Manual(Kluwer Academic Press Publishers))中的方法，将转化的土壤杆菌导入植物细胞中。将植物表达载体直接导入细胞的方法的实例包括电穿孔(Shimamoto等(1989)，Nature，338：274-276；和Rhodes等(1989)，Science，240：204-207)，粒子枪方法(Christou等(1991)，Bio/Technology 9：957-962)，和聚乙二醇方法(PEG)方法(Datta等(1990)，Bio/Technology 8：736-740)。这些方法是本领域众所周知的，其中，可以合适地选择适用于要转化的植物的方法。

在本发明中，可以将目标核酸分子(导入的基因)导入或不导入转化体的染色体中。优选地，将目标核酸分子(导入的基因)导入转化体的染色体中，更优选地导入一对染色体中。

通过本领域众所周知的方法，可以使转化的细胞分化成植物组织，植物器官，和/或植物体。

使用本领域已知的技术和培养基，培养、分化和繁殖植物细胞、植物组织和植物体。培养基的实例包括但不限于：Murashige-Skoog(MS)培养基，Gamborg B5(B)培养基，White培养基，Nitsch & Nitsch培养基，等。这些培养基一般补充了适当量的植物生长调节物质(植物激素)等。

如本文所使用的，与植物有关的术语“再分化”指一种现象，其中从个体植物的一部分恢复整个植物。例如，组织片段，例如细胞、叶子、根等，可以再分化成器官或植物体。

使转化体再分化成植物体的方法是本领域众所周知的。这些方法描述在，例如，Rogers等，Methods in Enzymology 118：627-640(1986)；Tabata等，Plant Cell Physiol.，28：73-82(1987)；Shaw，Plant Molecular Biology：A practical approach，IRL press(1988)；Shimamoto等，Nature 338：274(1989)；Maliga等，Methodsin Plant Molecular Biology：A laboratory course，Cold SpringHarbor Laboratory Press(1995)；等。因此，根据转化的目标植物，本领域的技术人员可以适当地选择和采用上述的众所周知的方法以再分化植物。转化的植物具有导入的目标基因。通过本文所述的方法和其它众所周知的普通技术，例如RNA印迹，蛋白印迹分析，等，可以确认导入的基因。

可以从转化的植物得到种子。通过RNA印迹或PCR，可以检测导入的基因的表达。如果需要，通过例如蛋白印迹，可以确认基因产物蛋白的表达。

已经证实，本发明可以应用于任何生物，且特别适用于植物。本发明还可以应用于其它生物。用于本发明的分子生物学技术是本领域众所周知的和常用的，且描述在，例如，Ausubel F.A.，等，编(1988)，Current Protocols in Molecular Biology，Wiley，NewYork，NY；Sambrook J.，等(1987)，Molecular Cloning：ALaboratory Manual，第2版和第3版，Cold Spring HarborLaboratory Press，Cold Spring Harbor，NY；Special issue，Jikken Igaku[Experimental Medicine]″Idenshi Donyu & HatsugenKaiseki Jikkenho[Experimental Methods for Gene Introduction& Expression Analysis]″，Yodo-sha，1997；等。

通过合适的方法，包括mRNA测量和免疫学的测量方法，可以“检测”或“定量”基因表达(例如，mRNA表达，多肽表达)。分子生物学的测量方法的实例包括RNA印迹方法，斑点印迹方法，PCR方法，等。免疫学的测量方法的实例包括ELISA方法，RIA方法，荧光抗体方法，蛋白印迹方法，免疫组织学染色方法，等，其中可以使用微量滴定板。定量方法的实例包括ELISA方法，RIA方法，等。可以使用应用阵列(例如，DNA阵列、蛋白阵列等)的基因分析方法。在Shujun-sha编的Saibo-Kogaku[Cell Engineering]，specialissue，″DNA Microarray and Up-to-date PCR Method″中广泛地综述了DNA阵列。蛋白阵列详细描述在Nat genet.2002 Dec；32 Suppl：526-32中。分析基因表达的方法的实例除上述技术之外包括但不限于：RT-PCR方法，RACE方法，SSCP方法，免疫沉淀方法，双杂交物系统，体外翻译方法，等。其它分析方法描述在，例如，″Genome AnalysisExperimental Method，Yusuke Nakamura′s Labo-Manual，YusukeNakamura编，Yodo-sha(2002)，等中。所有上述的出版物都在这里引作参考。

如本文所使用的，术语“表达量”指在受试者细胞中表达的多肽或mRNA的量。表达量包括，通过使用本发明的抗体的任意的适当方法，包括免疫学的测量方法(例如，ELISA方法，RIA方法，荧光抗体方法，蛋白印迹方法，免疫组织学染色方法，等)评价的本发明的多肽在蛋白水平上的表达量，或通过任意的适当方法，包括分子生物学的测量方法(例如，RNA印迹方法，斑点印迹方法，PCR方法，等)评价的本发明的多肽在mRNA水平上的表达量。术语“表达量的变化”是指通过适当方法，包括上述的免疫学测量方法或分子生物学测量方法评价的本发明的多肽在蛋白或mRNA水平上的表达量的增加或减少。因而，根据本发明，通过改变某些试剂(例如，DNA聚合酶，等)的表达量，可以调节倾向于错误的频率。

如本文所使用的，关于多核苷酸的术语“上游”是指，该位置比特定的参考点更临近5′末端。

如本文所使用的，关于多核苷酸的术语“下游”是指，该位置比特定的参考点更临近3′末端。

如本文所使用的，术语“碱基配对”和“沃森-克里克(Watson &Crick)碱基配对”具有相同的含义，指可以通过氢键结合到一起的核苷酸，这基于下述的序列同一性：腺嘌呤残基(A)通过2个氢键结合胸腺嘧啶残基(T)或尿嘧啶残基(U)，胞嘧啶残基(C)通过3个氢键结合鸟嘌呤残基(G)，如在双链DNA中所见到的(见Stryer，L.，Biochemistry，第4版，1995)。

如本文所使用的，术语“互补的”和“互补体”指多核苷酸序列，其整个互补区能与另一个特定的多核苷酸进行沃森-克里克碱基配对。在本发明中，当第一个多核苷酸的每个碱基与对应的互补碱基配对时，将第一个多核苷酸视作与第二个多核苷酸互补。互补的碱基通常是A和T(或A和U)或C和G。如本文所使用的，术语“互补体”作为术语“互补的多核苷酸”、“互补的核酸”和“互补的核苷酸序列”的同义词使用。这些术语适用于一对基于序列的多核苷酸，但不是实际上结合到一起的2个多核苷酸的特定组。

通过胚胎干(ES)细胞的同源重组生产和分析转基因动物和敲除(knockout)的动物，能提供重要的手段。通过例如使用同源重组的阳性-阴性选择方法(见，美国专利号5,464,764；美国专利号5,487,992；美国专利号5,627,059；Proc.Natl.Acad.Sci.USA，Vol.86，8932-8935，1989；Nature，Vol.342，435-438，1989；等)，可以生成转基因动物或敲除的哺乳动物。敲除的动物(也称作基因靶向)的生产综述在，例如，Masami Murayama，Masashi Yamamoto，编Jikken Igaku Bessatsu[Special Issue of ExperimanetalMedicine]，″Shintei Idenshi Kogaku Handobukku[Newly RevisedGenetic Engineering Handbook]″，Ver.3，1999，Yodo-sha，particularly pp.239-256；Shinichi Aizawa，(1995)，JikkenIgaku Bessatsu [Special Issue of ExperimanetalMedicine]，″Jintagettingu-ES Saibo Wo Motiita Heni Mausu NoSakusei[Gene Targeting-Production of Mutant Mouse Using ESCell]；等。转基因动物或敲除的哺乳动物已经被广泛使用。在本发明中，如果需要，采用上述的方法。

例如，在高等生物的情况下，通过使用新霉素抗性基因的阳性选择和使用HSV的胸苷激酶基因或白喉毒素基因的阴性选择，可以有效地筛选出重组体。使用敲除PCR或DNA印迹来筛选同源重组体。具体地，对于阳性选择，将一部分靶基因取代为新霉素抗性基因等，将用于阴性选择的HSVTK基因等连接到其末端，从而生成靶向载体。通过电穿孔，将该靶向载体导入ES细胞。在有G418和丙氧鸟苷存在的情况下，筛选ES细胞。分离存活的菌落，随后进行PCR或DNA印迹，以筛选同源重组体。

在上述的方法中，破坏靶向的内源基因，以得到转基因或敲除(靶基因重组体，破坏的基因)的小鼠，其缺少或具有低水平的对应功能。该方法可以用于分析基因功能，因为突变仅仅导入了目标基因中。

筛选出了需要的同源重组体后，通过胚泡注射方法或聚集体嵌合方法(aggregation chimera method)，将得到的重组ES细胞与正常的胚胎混合，以生成ES细胞和宿主胚胎的嵌合小鼠。在胚泡注射方法中，使用玻璃移液管，将ES细胞注射进胚泡中。在聚集体嵌合方法中，ES细胞块附着到8-细胞期的无透明带的胚胎上。将具有导入的ES细胞的胚泡植入假孕代孕母亲的子宫中，以得到嵌合小鼠。ES细胞具有全能性，且可以体内地分化成任意种类的细胞，包括生殖细胞。如果将具有源自ES细胞的生殖细胞的嵌合小鼠与正常小鼠杂交，杂合地得到具有ES细胞的染色体的小鼠。将得到的小鼠彼此杂交，得到具有纯合的修饰的ES细胞染色体的敲除小鼠。为了从嵌合小鼠纯合地得到具有修饰的染色体的敲除小鼠，将雄性嵌合小鼠与雌性野生型小鼠杂交，以生成F1杂合小鼠。使得到的雄性和雌性杂合小鼠杂交，并选择F2纯合小鼠。使用常用的方法，例如DNA印迹，PCR，碱基测序，等，以及关于重组ES细胞的测定，可以确定需要的基因突变是否导入了F1和F2中。

作为用于克服不能选择性地分析各种基因功能的问题的另一种技术，有条件的敲除技术已经引起注意，其中将Cre重组酶的细胞类型-特异性的表达与Cre-loxP的位点-特异性的重组相结合。为了使用Cre-loxP得到有条件的敲除小鼠，将新霉素抗性基因导入不能抑制靶基因的表达的位点；将靶向载体导入ES细胞中，其中loxP序列以下述的方式整合：以后将要去除的外显子打断loxP序列；此后，分离同源重组体。从分离的克隆得到嵌合小鼠。因而，生成了遗传地修饰的小鼠。接着，使其中以组织特异性的方式表达大肠杆菌的源自P1噬菌体的位点-特异性的重组酶Cre的转基因小鼠与该小鼠杂交。在该情况下，仅仅在能表达Cre的组织中破坏了基因(Cre能特异性地识别loxP序列(34bp)，且使2个loxP序列之间的序列进行重组，并被破坏)。通过与具有连接到器官-特异性的启动子上的Cre基因的转基因小鼠杂交，或者通过使用具有Cre基因的病毒载体，可以表达Cre(Stanford W.L.，等，Nature Genetics 2：756-768(2001))。

因而，可以生成本发明的生物。

(多肽生产方法)

根据普通的培养方法，培养通过本发明的方法生产的源自微生物、动物细胞等的转化体。生成并积累本发明的多肽。从培养物中收集本发明的多肽，由此可能生产本发明的多肽。

根据培养宿主细胞的普通方法，可以在培养基上培养本发明的转化体。用于从作为宿主的原核生物(例如，大肠杆菌)或真核生物(例如，酵母)得到的转化体的培养基可以是自然产生的培养基或合成的培养基，只要培养基含有本发明的生物可以同化的碳源、氮源、无机盐等、且培养基能有效地培养转化体即可。

碳源包括生物可以被生物同化的任意的碳源，例如碳水化合物(例如，葡萄糖，果糖，蔗糖，含有它们的糖蜜，淀粉，淀粉水解物，等)，有机酸(例如，醋酸，丙酸，等)，醇(例如，乙醇，丙醇，等)，等。

氮源包括无机酸或有机酸的铵盐(例如，氨，氯化铵，硫酸铵，醋酸铵，磷酸铵，等)，和其它含氮的物质(例如，蛋白胨，肉提取物，酵母提取物，玉米浆，酪蛋白水解物，大豆饼，和大豆饼水解物，各种发酵细菌和其消化产物)，等。

可以使用无机酸的盐，例如磷酸钾(I)，磷酸钾(II)，磷酸镁，氯化钠，硫酸铁(I)，硫酸锰，硫酸铜，碳酸钙，等。对于振荡培养、深通气搅拌培养等，在通气条件下进行培养。

培养温度优选地是15-40℃，且可以使用其它温度。具体地，如果根据本发明生产温度抗性的生物或细胞，则其它温度可以是最合适的。培养时间通常是5小时至7天。培养基的pH维持在3.0-9.0。具体地，如果根据本发明生产酸或碱抗性的生物或细胞，则其它pH可以是最合适的。使用无机酸或有机酸、碱溶液，脲，碳酸钙，氨，等调节pH。在培养过程中，可以将抗生素例如氨苄青霉素、四环素等任选地加入培养基中。

当培养已经使用含有诱导型启动子的表达载体转化的微生物时，可以给培养基任选地补充诱导物。例如，当培养已经使用含有lac启动子的表达载体转化的微生物时，可以向培养基中加入异丙基-β-D-硫代吡喃型半乳糖苷等。当培养已经使用含有trp启动子的表达载体转化的微生物时，可以向培养基中加入吲哚丙烯酸等。可以使用发酵罐大规模地培养已经向其中导入了基因的细胞或器官。培养基的实例包括但不限于：常用的MurashigeMurashige-Skoog(MS)培养基，White培养基，或添加了植物激素(例如生长素，细胞因子等)的这些培养基。

例如，当使用动物细胞时，用于培养细胞的本发明的培养基包括常用的RPMI1640培养基(The Journal of the American MedicalAssociation，199，519(1967))，Eagle′s MEM培养基(Science，122，501(1952))，DMEM培养基(Virology，8，396(1959))，199培养基(Proceedings of the Society for the Biological Medicine，73，1(1950))或补充了胎牛血清的这些培养培养基等。

培养一般在例如25-40℃、5％CO₂的气氛下，在pH6-8的培养基中进行1-7天。在培养过程中，可以任选地向培养基中加入抗生素，例如卡那霉素、青霉素、链霉素等。

使用本领域众所周知的和常用的分离或纯化酶的普通方法，可以从已经转化了能编码多肽的核酸序列的转化体的培养物中分离或纯化出本发明的多肽。例如，当本发明的多肽分泌到用于生产多肽的转化体外时，对培养物进行离心等，以得到可溶的级分。通过如下技术，例如溶剂提取，用硫酸铵等进行盐析/脱盐，用有机溶剂进行沉淀，用树脂(例如，二乙氨乙基(DEAE)-琼脂糖，DIAION HPA-75(Mitsubishi Chemical Corporation)，等)进行阴离子交换层析，用树脂(例如，S-琼脂糖FF(Pharmacia)，等)进行阳离子交换层析，用树脂(例如，丁基琼脂糖，苯基琼脂糖，等)进行疏水层析，具有分子筛的凝胶过滤，亲和层析，层析聚焦，电泳(例如，等电聚焦电泳，等)等，可以从可溶级分得到纯化样品。

当本发明的多肽以溶解形式积累在用于生产多肽的本发明的转化体细胞中时，离心培养物，以收集培养物中的细胞。洗涤细胞，然后使用超声波粉碎机、弗氏压碎器、MANTON GAULIN匀浆器、Dinomil，等来粉碎细胞，以得到无细胞的提取液。通过离心无细胞的提取液，或通过如下技术，例如溶剂提取，用硫酸铵等进行盐析/脱盐，用有机溶剂进行沉淀，用树脂(例如，二乙氨乙基(DEAE)-琼脂糖，DIAIONHPA-75(Mitsubishi Chemical Corporation)，等)进行阴离子交换层析，用树脂(例如，S-琼脂糖FF(Pharmacia)，等)进行阳离子交换层析，用树脂(例如，丁基琼脂糖，苯基琼脂糖，等)进行疏水层析，具有分子筛的凝胶过滤，亲和层析，层析聚焦，电泳(例如，等电聚焦电泳，等)等，可以从上清液得到纯化样品。

当本发明的多肽已经表达、且已经在细胞内形成不溶体时，收获细胞，粉碎，并离心。使用常用的方法，从得到沉淀级分中，收集本发明的多肽。使用多肽变性剂，使不溶的多肽溶解。稀释得到的溶解液，或在无变性剂的溶液或稀释溶液(其中多肽变性剂的浓度很低，不会使多肽变性)中透析。使本发明的多肽形成正常的三维结构，并通过如上所述的分离和纯化，得到纯化样品。

可以根据常用的蛋白纯化方法进行纯化(J.Evan.Sadler等：Methods in Enzymology，83，458)。或者，可以将本发明的多肽与其它蛋白融合，以生成融合蛋白，并使用对融合蛋白具有亲和力的物质，通过亲和层析纯化融合蛋白(Akio Yamakawa，ExperimentalMedicine，13，469-474(1995))。例如，根据Lowe等，Proc.Natl.Acad.Sci.，USA，86，8227-8231(1989)，Genes Develop.，4，1288(1990))所述的方法，生产本发明的多肽与A蛋白的融合蛋白，然后用使用免疫球蛋白G的亲和层析进行纯化。

生产本发明的多肽与FLAG肽的融合蛋白，然后通过使用抗-FLAG抗体的亲和层析进行纯化(Proc.Natl.Acad.Sci.，USA，86，8227(1989)，Genes Develop.，4，1288(1990))。

通过使用能结合多肽的抗体的亲和层析，可以纯化本发明的多肽。根据已知的方法，可以使用体外转录/翻译系统生产本发明的多肽(J.Biomolecular NMR，6，129-134；Science，242，1162-1164；J.Biochem.，110，166-168(1991))。

还可以通过化学合成方法，例如Fmoc方法(芴基甲氧基羰基方法)、tBoc方法(叔丁氧基羰基方法)，等，基于其氨基酸信息，生产本发明的多肽。可以使用肽合成仪(由下述公司生产：AdvancedChemTech，Applied Biosystems，Pharmacia Biotech，ProteinTechnology Instrument，Synthecell-Vega，PerSeptive，Shimazu，等)化学地合成肽。

通过蛋白化学中常用的方法(见，例如，Hisashi Hirano.″Protein Structure Analysis for Gene Cloning″，Tokyo KagakuDojin出版，1993)，可以分析纯化的本发明的多肽的结构。通过已知的测量技术(Cell，75，1389(1993)；J.Cell Bio.，1146，233(1999)；Cancer Res.58，1238(1998)；Neuron 17，1157(1996)；Science 289，1197(2000)；等)，可以测量本发明的新的ps20-样肽的生理活性。

(筛选)

如本文所使用的，术语“筛选”指使用特异性的操作/评价方法，从含有许多元素的群体中，选择具有给定的特定目标性质的靶，例如生物、物质等。为了筛选，可以使用本发明的试剂(例如，抗体)、多肽或核酸分子。可以使用体外地、体内地等(利用使用真实物质的系统)或者计算机地(in silico)(利用使用计算机的系统)得到的文库进行筛选。应当明白，本发明包括通过筛选得到的具有需要的活性的化合物。本发明还意在提供基于本发明的公开内容、通过计算机建模生成的药物。

筛选或鉴定方法是本领域众所周知的，且可以用例如微量滴定板、分子(例如DNA、蛋白等)的阵列或芯片等实现。要筛选的含有样品的受试者的实例包括但不限于基因文库、使用组合文库合成的化合物文库等。

因此，在本发明的一个优选的实施方案中，提供了用于鉴别能调节障碍或疾病的试剂的方法。这样的调节试剂可以用作用于该疾病的药物或其前体。本发明包括这样的调节剂、含有调节剂的药物和使用它们的疗法。

因此，认为本发明提供了根据本发明的公开内容、通过计算机建模得到的药物。

在本发明的另一个实施方案中，本发明包括通过计算机辅助的定量结构活性关系(QSAR)建模技术得到的化合物，该技术用作筛选具有有效调节活性的本发明的化合物的工具。在这里，计算机技术包括通过计算机制备出的几种底物模板、药效团、本发明的活性部分的同源性模型，等。一般地，基于体外得到的数据，为能与另一种物质相互作用的物质的一般的特征组建模的方法包括近来的CATALYST^TM药效团方法(Ekins等，Pharmacogenetics，9：477-489，1999；Ekins等，J.Pharmacol.& Exp.Ther.，288：21-29，1999；Ekins等，J.Pharmacol.& Exp.Ther.，290：429-438，1999；Ekins等，J.Pharmacol.& Exp.Ther.，291：424-433，1999)，可比较的分子场分析(CoMFA)(Jones等，Drug Metabolism & Disposition，24：1-6，1996)，等。在本发明中，可以使用分子建模软件(例如，CATALYST^TM第4版(Molecular Simulations，Inc.，San Diego，CA)，等)进行计算机建模。

使用本领域已知的各种计算机建模技术中的任一种，可以进行化合物关于活性部位的匹配。使用程序，例如QUANTA(MolecularSimulations，Burlington，MA，1992)，SYBYL(Molecular ModelingSoftware，Tripos Associates，Inc.，St.Louis，MO，1992)，AMBER(Weiner等，J.Am.Chem.Soc.，106：765-784，1984)，CHARMM(Brooks等，J.Comp.Chem.，4：187-217，1983)，等，可以进行化合物的关于活性部位的视觉检查和手工操作。另外，使用标准力场，例如CHARMM，AMBER，等，可以进行能量最小化。其它的专业的计算机建模方法的实例包括GRID(Goodford等，J.Med.Chem.，28：849-857，1985)，MCSS(Miranker和Karplus，Function andGenetics，11：29-34，1991)，AUTODOCK(Goodsell和Olsen，Proteins：Structure，Function and Genetics，8：195 to202，1990)，DOCK(Kuntz等，J.Mol.Biol.，161：269to 288，1982)，等。而且，利用计算机程序，例如LUDI(Bohm，J.Comp.Aid.Molec.Design，6：61 to 78，1992)，LEGEND(Nishibata和Itai，Tetrahedron，47：8985，1991)，LeapFrog(Tripos Associates，St.Louis，MO)等，使用空的活性部位、已知的小分子化合物的活性部位，可以新构建出结构化合物。上述的建模方法是本领域常用的。基于本说明书的公开内容，本领域的技术人员可以适当地设计出本发明包括的化合物。

(疾病)

本发明可以靶向目标生物可能患有的疾病和障碍(例如，模型动物的生产，等)。

在一个实施方案中，本发明靶向的疾病和障碍可能与循环系统(血液细胞，等)有关。疾病或障碍的实例包括但不限于：贫血(例如，再生障碍性贫血(具体地，严重的再生障碍性贫血)，肾贫血，癌性贫血，继发性贫血，难治性贫血，等)，癌症或肿瘤(例如，白血病)；和为此进行化学治疗后的，造血失败，血小板减少，急性髓细胞性白血病(具体地，首次缓和(高危组)，二次缓和和其后)，急性淋巴细胞性白血病(具体地，首次缓和，二次缓和和其后)，慢性髓细胞性白血病(具体地，慢性阶段，迁移阶段)，恶性淋巴瘤(具体地，首次缓和(高危组)，二次缓和和其后)，多发性骨髓瘤(具体地，发作后的早期阶段)，等。

在另一个实施方案中，本发明靶向的疾病和障碍可能与神经系统有关。这样的疾病或障碍的实例包括但不限于：痴呆，脑中风和其后遗症，脑肿瘤，脊髓损伤，等。

在另一个实施方案中，本发明靶向的疾病和障碍可能与免疫有关。这样的疾病或障碍的实例包括但不限于：T-细胞缺陷综合征，白血病，等。

在另一个实施方案中，本发明靶向的疾病和障碍可能与运动器官和骨骼系统有关。这样的疾病或障碍的实例包括但不限于：骨折，骨质疏松症，关节脱位，半脱位，扭伤，韧带损伤，骨关节炎，骨肉瘤，尤因肉瘤，故生成缺陷，骨软骨发育不良，等。

在另一个实施方案中，本发明靶向的疾病和障碍可能与皮肤系统有关。这样的疾病或障碍的实例包括但不限于：毛发缺乏，黑素瘤，cutis matignant lympoma，血管肉瘤，组织细胞增多病，水疱病，脓疱病，皮炎，湿疹，等。

在另一个实施方案中，本发明靶向的疾病和障碍可能与内分泌系统有关。这样的疾病或障碍的实例包括但不限于：下丘脑/垂体病，甲状腺病，副甲状腺(甲状旁腺)病，肾上腺皮质/髓质病，糖代谢异常，脂代谢异常，蛋白代谢异常，核酸代谢异常，先天性代谢错误(苯丙酮酸尿，半乳糖血症，高胱氨酸尿，枫糖尿症)，无清蛋白血，缺少抗坏血酸合成能力，高胆红素血，高胆红素尿，激肽释放酶缺乏，肥大细胞缺乏，尿崩症，血管升压素分泌异常，侏儒，Wolman氏病(酸性脂肪酶缺乏))，黏多糖贮积病VI，等。

在另一个实施方案中，本发明靶向的疾病和障碍可能与呼吸系统有关。这样的疾病或障碍的实例包括但不限于：肺病(例如，肺炎，肺癌，等)，支气管病，等。

在另一个实施方案中，本发明靶向的疾病和障碍可能与消化系统有关。这样的疾病或障碍的实例包括但不限于：食道病(例如，食道癌，等)，胃/十二指肠病(例如，胃癌，十二指肠癌，等)，小肠病/大肠病(例如，结肠息肉，结肠癌，直肠癌，等)，胆管病，肝病(例如，肝硬化，肝炎(甲型、乙型、丙型、丁型、戊型等)，暴发型肝炎，慢性肝炎，原发型肝癌，酒精性肝病，药物诱导的肝障碍，等)，胰腺病(急性胰腺炎，慢性胰腺炎，胰腺癌，囊性胰腺病，等)，腹膜/腹壁/隔膜病(疝，等)，Hirschsprung氏病，等。

在另一个实施方案中，本发明靶向的疾病和障碍可能与泌尿系统有关。这样的疾病或障碍的实例包括但不限于：肾病(例如，肾衰竭，原发性肾小球病，肾血管障碍，肾小管功能异常，间质肾病，由于全身病引起的肾病，肾癌，等)，膀胱病(例如，膀胱炎，膀胱癌，等)，等。

在另一个实施方案中，本发明靶向的疾病和障碍可能与生殖系统有关。这样的疾病或障碍的实例包括但不限于：雄性生殖器官病(例如，雄性不育，前列腺肥大，前列腺癌，睾丸癌，等)，雌性生殖器官病(例如，雌性不育，卵巢功能障碍，子宫肌瘤，子宫内膜异位，子宫癌，子宫内膜炎，卵巢癌，长柔毛性病，等)，等。

在另一个实施方案中，本发明靶向的疾病和障碍可能与循环系统有关。这样的疾病或障碍的实例包括但不限于：心衰竭，心绞痛(angina pectoris)，心肌梗塞，心律失常，心瓣炎，心肌/心包病，先天性心脏病(例如，房间隔缺损，动脉管不闭合(arterial canalpatency)，Fallot四联症，等)，动脉病(例如，动脉硬化，动脉瘤)，静脉病(例如，静脉曲张，等)，淋巴管病(例如，淋巴水肿，等)，等。

本发明靶向的疾病(损害)和障碍可以包括植物的疾病和障碍。疾病和障碍的实例包括但不限于：稻瘟病，寒冷天气导致的障碍，等。

当根据本发明得到的产物物质等用作药物时，该药物还可以包含药学上可接受的载体。任意的本领域已知的药学上可接受的载体可以用在本发明的药物中。

药学上可接受的载体或合适的制剂材料的实例包括但不限于：抗氧化剂，防腐剂，着色剂，调味剂，稀释剂，乳化剂，悬浮剂，溶剂，填充剂，增量剂(bulky agent)，缓冲液，送递载体，和/或药物佐剂。代表性地，以组合物的形式施用本发明的药物，该组合物包含脂联素(adiponectin)或其变体或片段，或其变体或衍生物和至少一种生理上可接受的载体、赋形剂或稀释剂。例如，适当的载体可以是注射液、生理溶液或人工脑脊液，其可以补充常用于肠胃外送递的组合物中的其它物质。

这里使用的可接受的载体、赋形剂或稳定剂优选地是对受体无毒的，且优选地在采用的剂量和浓度是惰性的，优选地包括磷酸盐，柠檬酸盐，或其它有机酸；抗坏血酸，α-生育酚；小分子量的多肽；蛋白(例如，血清清蛋白，明胶或免疫球蛋白)；亲水的聚合物(例如，聚乙烯吡咯烷酮)；氨基酸(例如，甘氨酸，谷氨酰胺，天冬酰胺，精氨酸或赖氨酸)；单糖，二糖，和其它碳水化合物(葡萄糖，甘露糖，或糊精)；螯合剂(例如，EDTA)；糖醇(例如，甘露醇或山梨醇)；成盐平衡离子(例如，钠)；和/或非离子型表面活性剂(例如，Tween，普流罗尼类(pluronics)或聚乙二醇(PEG))。

适当的载体的实例包括中性的缓冲盐水或与血清清蛋白混合的盐水。优选地，使用适当的赋形剂(例如，蔗糖)，将产物制成冻干剂。根据需要，可以包含其它标准载体、稀释剂和赋形剂。其它示例性的组合物包含约pH7.0-8.5的Tris缓冲液或约pH4.0-5.5的醋酸盐缓冲液，其还可以包含山梨醇或其合适的替代品。

在下文中，将描述本发明的药物的常用的制备方法。应当注意，使用已知的制备方法，可以制备出动物药物组合物、类药品(quasi-drug)、海洋药物组合物、食品组合物、化妆品组合物等。

可以将本发明的产物等与药学上可接受的载体混合，并可以作为固体制剂(例如，片剂，胶囊，颗粒，强散剂，粉末，栓剂，等)或液体制剂(例如，糖浆，注射剂，悬浮液，溶液，喷雾剂，等)经口地或肠胃外地施用。药学上可接受的载体的实例包括固体制剂中的赋形剂，润滑剂，粘合剂，崩解剂，崩解抑制剂，吸收促进剂，吸附剂，湿润剂，增溶剂，稳定剂等；和液体制剂中的溶剂，增溶剂，悬浮剂，等渗剂，缓冲剂，光滑剂等。可以任选地使用制剂的添加剂，例如防腐剂，抗氧化剂，着色剂，增甜剂，等。可以将本发明的组合物与本发明的产物物质等以外的物质混合。肠胃外的施用途径的的实例包括但不限于：静脉内注射，肌内注射，鼻内的，直肠，阴道，经皮，等。

固体制剂中的赋形剂的实例包括葡萄糖，乳糖，蔗糖，D-甘露醇，结晶纤维素，淀粉，碳酸钙，轻硅酸酐，氯化钠，高岭土，脲，等。

固体制剂中的润滑剂的实例包括但不限于：硬脂酸镁，硬脂酸钙，硼酸粉末，胶态二氧化硅，滑石，聚乙二醇，等。

固体制剂中的粘合剂的实例包括但不限于：水，乙醇，丙醇，蔗糖，D-甘露醇，结晶纤维素，葡聚糖，甲基纤维素，羟丙基纤维素，羟丙基甲基纤维素，羧甲基纤维素，淀粉溶液，明胶溶液，聚乙烯吡咯烷酮，磷酸钙，磷酸钾，虫胶，等。

固体制剂中的崩解剂的实例包括但不限于：淀粉，羧甲基纤维素，羧甲基纤维素钙，琼脂粉，昆布多糖粉，交联甲羧纤维素钠，羧甲基淀粉钠，藻酸钠，碳酸氢钠，碳酸钙，聚氧乙烯山梨聚糖脂肪酸酯，月桂基硫酸钠，淀粉，单硬脂酸甘油酯，乳糖，甘醇酸纤维素钙，等。

固体制剂中的崩解抑制剂的实例包括但不限于：加氢油，蔗糖，硬脂精，可可脂，氢化油，等。

固体制剂中的吸收促进剂的实例包括但不限于：季铵盐，月桂基硫酸钠，等。

固体制剂中的吸收剂的实例包括但不限于：淀粉，乳糖，高岭土，膨润土，胶态二氧化硅，等。

固体制剂中的湿润剂的实例包括但不限于：甘油，淀粉，等。

固体制剂中的增溶剂的实例包括但不限于：精氨酸，谷氨酸，天冬氨酸，等。

固体制剂中的稳定剂的实例包括但不限于：人血清清蛋白，乳糖，等。

当制作片剂、丸剂等作为固体制剂时，它们可以任选地包被可溶于胃或肠中的物质膜(蔗糖，明胶，羟丙基纤维素，邻苯二甲酸羟丙基甲基纤维素酯，等)。片剂包括任选地带有一般的包衣的那些(例如，糖衣片，明胶包衣的片剂，肠溶衣包衣的片剂，薄膜包衣的片剂或双片剂，多层片剂，等)。胶囊包括硬胶囊和软胶囊。当将片剂制成栓剂的形式时，除了上述的添加剂以外，可以加入高级醇、高级醇酯、半合成的甘油酯等。本发明不限于此。

优选的液体制剂中的溶液的实例包括注射液，醇，丙二醇，聚乙二醇，芝麻油，玉米油，等。

优选的液体制剂中的增溶剂的实例包括但不限于：聚乙二醇，丙二醇，D-甘露醇，苯甲酸苄酯，乙醇，trisaminomethane，胆固醇，三乙醇胺，碳酸钠，柠檬酸钠，等。

优选的液体制剂中的悬浮剂的实例包括表面活性剂(例如，硬脂酰三乙醇胺，月桂基硫酸钠，月桂基氨基丙酸，卵磷脂，苯扎氯铵，苄索氯铵，单硬脂酸甘油酯，等)，亲水的大分子(例如，聚乙烯醇，聚乙烯吡咯烷酮，羧甲基纤维素钠，甲基纤维素，羟甲基纤维素，羟乙基纤维素，羟丙基纤维素，等)，等。

优选的液体制剂中的等渗剂的实例包括但不限于：氯化钠，甘油，D-甘露醇，等。

优选的液体制剂中的缓冲剂的实例包括但不限于：磷酸盐，醋酸盐，碳酸盐，柠檬酸盐，等。

优选的液体制剂中的光滑剂的实例包括但不限于：苯甲醇，苯扎氯铵，盐酸普鲁卡因，等。

优选的液体制剂中的防腐剂的实例包括但不限于：对羟基苯甲酸酯，氯丁醇，苯甲醇，2-苯乙醇，脱氢醋酸，山梨酸，等。

优选的液体制剂中的抗氧化剂的实例包括但不限于：亚硫酸盐，抗坏血酸，α-生育酚，半胱氨酸，等。

当制备液体试剂和悬浮液作为注射剂时，它们是灭过菌的，且优选地与血液等渗。一般地，通过使用截留细菌的过滤器等的过滤、与杀细菌剂混合或辐射等，使这些试剂无菌。在这些处理后，通过冻干等可以将这些试剂制成固体。在即将使用之前，可以加入无菌水或无菌注射稀释剂(盐酸利多卡因水溶液，生理盐水，葡萄糖水溶液，乙醇或其混合溶液，等)。

本发明的药物组合物还可以包含着色剂、防腐剂、调味剂、芳香化合物、增甜剂或其它药物。

本发明的药物可以经口地或肠胃外地施用。或者，本发明的药物可以静脉内地或皮下地施用。当全身施用时，用于本发明的药物可以是无致热原的药学上可接受的水溶液形式。制备这样的药学上可接受的组合物(适当考虑pH，等渗性，稳定性等)在本领域的技术范围内。施用方法在这里可以包括经口施用和肠胃外施用(例如，静脉内的，肌内的，皮下的，皮内的，粘膜的，直肠内的，阴道的，对于作用位点、皮肤局部的，等)。可以以任意的制剂形式提供用于这样的施用的处方。这样的制剂形式包括液体制剂、注射剂、持续的制剂等。

通过将具有需要的纯度的糖链组合物与任选的生理上可接受的载体、赋形剂或稳定剂混合，可以制备便于以冻干饼或水溶液的形式储存的本发明的药物(Japanese Pharmacopeia第14版或最新版；Remington′s Pharmaceutical Sciences，第18版，A.R.Gennaro，编，Mack Publishing Company，1990；等)

各种送递系统是已知的，且可以用于施用本发明的化合物(例如，脂质体，微粒，微胶囊)。导入方法包括但不限于：皮内的，肌内的，腹膜内的，静脉内的，皮下的，鼻内的，硬膜外的，和经口的途径。化合物或组合物可以通过任意的方便途径施用(例如，通过输注或快速灌注，通过经表皮的或粘膜皮肤衬层(例如，口腔粘膜，直肠和肠粘膜，等)的吸收，且可以与其它生物活性剂一起施用。施用可以是全身的或局部的。另外，通过任意的合适途径(包括心室内的和鞘内的注射；心室内的注射可以由心室内导管促进，例如，该导管附着到贮器，例如奥马耶贮器)，可以理想地将本发明的药物化合物或组合物导入中枢神经系统。还可以采用肺部施用，例如，通过施用吸入器或喷雾器，或与喷雾剂配制。

在一个具体的实施方案中，可以理想地将本发明的产物物质或包含它的组合物局部地施用于需要治疗的区域(例如，中枢神经系统，脑，等)；这可以通过例如但不限于手术过程中的局部的输注、局部应用(例如，与手术后的伤口敷料结合)，通过注射，通过导管，通过栓剂，或通过植入物(该植入物是多孔的、无孔的或胶质材料，包括膜，例如sialastic膜，或纤维)来实现。优选地，当施用本发明的蛋白(包括抗体)时，必须小心地使用该蛋白不会吸收于其上的材料。

在另一个实施方案中，可以在小泡(特别是脂质体)中送递化合物或组合物(见Langer，Science 249：1527-1533(1990)；Treat等，Liposomes in the Therapy of Infectious Disease and Cancer，Lopez-Berestein和Fidler(编)，Liss，New York，第353-365第(1989)；Lopez-Berestein，同上，第317-327第；一般地见同上)。

在另一个实施方案中，可以在控释系统中送递化合物或组合物。在一个实施方案中，可以使用泵(见Langer，同上；Sefton，CRC Crit.Ref.Biomed.Eng.14：201(1987)；Buchwald等，Surgery 88：507(1980)；Saudek等，N.Engl.J.Med.321：574(1989))。在另一个实施方案中，可以使用聚合物材料(见Medical Applications ofControlled Release，Langer和Wise(编.)，CRC Pres.，Boca Raton，Florida(1974)；Controlled Drug Bioavailability，Drug ProductDesign and Performance，Smolen和Ball(编.)，Wiley，New York(1984)；Ranger和Peppas，J.，Macromol.Sci.Rev.Macromol.Chem.23：61(1983)；也见Levy等，Science 228：190(1985)；During等，Ann.Neurol.25：351(1989)；Howard等，J.Neurosurg.71：105(1989))。

在另一个实施方案中，可以将控释系统置于治疗靶(即脑)附近，因而仅仅需要全身剂量的一部分(见，例如，Goodson，in MedicalApplications of Controlled Release，同上，vol.2，pp.115-138(1984))。

Langer(Science 249：1527-1533(1990))的综述中讨论了其它的控释系统。

根据使用目的、靶疾病(类型、严重性等)、患者的年龄、体重、性别和病史、细胞的形式或类型等，本领域的技术人员可以容易地确定在本发明的治疗方法中使用的化合物的量。根据使用目的、靶疾病(类型、严重性等)、患者的年龄、体重、性别和病史、治疗的进程等，本领域的技术人员也可以确定应用于受试者(患者)的本发明的治疗方法的频率。频率的实例包括每天一次至数月一次(例如，每周一次至每月一次)。优选地，根据进程，每周一次至每月一次地进行施用。

本发明的产物物质等的剂量随受试者的年龄、体重和状况或施用方法等而异，通常包括但不限于，在成年人经口施用的情况下，每天0.01mg-10g，优选地0.1mg-1g，1mg-100mg，0.1mg-10mg，等；在肠胃外施用的情况下，0.01mg-1g，优选地0.01mg-100mg，0.1mg-100mg，1mg-100mg，0.1mg-10mg，等。本发明不限于此。

如本文所使用的，术语“施用”指使本发明多肽、多核苷酸等或含有它们的药物组合物单独地或于其它治疗剂组合地整合进生物的细胞组织中。可以伴随地(例如，作为混合物)、分开地但是同时地或并发地、或顺序地施用组合。这包括将组合的试剂一起作为治疗混合物施用的表现形式，也包括分开地但是同时地施用组合的试剂的方法(例如，经分开的静脉内衬层进入相同的个体)。“组合”施用还包括分开施用特定的化合物或试剂中的一种，然后施用第二种。

如本文所使用的，“说明书”为施用或受用该药物等的人或诊断或受诊的人(例如，医生，患者等)描述了施用本发明的药物的方法、诊断的方法等。说明书描述了指示施用本发明的诊断、药物等的适当方法的状态。根据本发明所应用的国家的主管部门(例如，日本的Health，Labor and Welfare Ministry，美国的Food and DrugAdministration(FDA)，等)限定的格式，制备了说明书，其明确地记述到，说明书得到了主管部门的批准。说明书是所谓的包装插页，且一般提供在纸介质上。说明书不限于此，且可以以电子介质的形式提供(例如，因特网上提供的网站和电子邮件)。

使用可商业上获得的测定或设备进行的标准临床实验室的结果或表征目标疾病的临床症状的消失，可以支持使用本发明的方法治疗结束的判断。目标疾病复发后，可以恢复治疗。

本发明还提供了药物包或试剂盒，其包含一个或多个装有一种或多种药物组合物的容器。可以将由管理药物产品或生物产品的生产、使用或销售的政府机关规定的形式的说明任意地贴在这样的容器上，表明关于施用于人的生产、使用或销售的政府机关的批准。

(本发明的优选实施方案的描述)

在下文中，将通过实施例描述本发明。下面描述的实施例仅仅用于解释目的。因此，本发明的范围除了如所附的权利要求书所示之外不受限制。

在本发明的一个方面，提供了调节生物或细胞的遗传性状的转化率的方法。该方法包括下述步骤：(a)调节生物或细胞的基因在复制中倾向于错误的频率。在该情况下，可以通过调节DNA聚合酶的校对功能来调节倾向于错误的频率，例如，或者可选择地，通过增加DNA聚合酶的聚合反应中的错误。使用本领域众所周知的技术，可以实现这样的倾向于错误的频率的调节。倾向于错误的频率的调节，可以提供快速诱变，其程度不能常规地实现，且接近自然的进化。另外，与本领域已知的使用UV、化学物质等的任意的诱变方法相比，可以基本上减少比有益突变更频率地发生的有害突变。这是因为，在发明的方法中，导入的突变是与自然产生的进化现象相同的现象。

在本发明的使细胞或生物进化的方法中，可以分开进行调节倾向于错误的频率的步骤和筛选得到的细胞或生物的需要的性状的步骤。通过分开进行2个步骤，可以在不施加选择压力的条件下调节倾向于错误的频率(或进化速度)；可以使个体的数目增加至特定的数目；并筛选和鉴别变体。类似地在第2次和此后重复这些步骤，从而可以经济地和有效地得到进化的细胞或目标生物。

在常规方法中，有益突变的发生频率随着生物或细胞的突变频率的增加而增加。但是，同时也会发生有害突变。一般地，有害突变的发生频率较高，以致与本领域已知的使用UV、化学物质等的任意的诱变方法提供的有害突变的发生频率相比，有益突变的发生频率显著降低。因此，在常规方法中，不可能诱导生物或细胞中的许多有益的突变，同时使与本领域已知的使用UV、化学物质等的任意的诱变方法相比，有害突变的发生频率可以显著降低。

在一些常规的诱变方法中，采用自然突变。但是，在该情况下，自然突变的发生频率相当低(例如，对于大肠杆菌，10^-10突变(每个碱基，每次复制)，等)。因此，自然突变的速度难以进行实践。另外，有益的突变很少自然发生。因此，依赖于自然突变的育种需要大量的生物群体和较长的时间段。与使用自然突变的方法不同，本发明的方法只需要少量的生物群体和与约1代至数代相对应的时间。本发明的效果是巨大的。

在定位诱变中，仅仅可以诱导预定的突变。尽管可靠性良好，但定位诱变还是不适用于大规模使用，且突变的性质也不是对整个生物都有影响。因而，定位诱变不一定造成有益的突变。因此，不能认为定位诱变是模仿自然进化，且其具有缺点，因为与其伴随着由于基因重组造成的负作用。本发明可以提供与自然诱变基本上相同的诱变，但不是人工诱变。

作为其它的诱变方法，还有使用辐射、诱变物等的方法。这些方法可以以比自然突变更高的频率产生突变。但是，有效剂量的辐射或有效浓度的诱变物可能杀死大多数处理的细胞。换言之，有害的突变对生物是致死的。在使用诱变物的方法中，不能无有害突变地诱导诱变。通过本发明的方法，与上述例如UV、化学物质等的方法相比，有害突变的发生频率可以显著降低。本发明的方法只需要少量的生物群体和与约1代至数代相对应的时间。

在根据本发明使用不一致理论调节遗传性状的转化率的方法中，通过使用具有受调节的校对功能的DNA聚合酶，在双链基因组DNA的一条链中比在另一条链中导入了更大量的突变。本发明首次在实验水平证实，可以积累许多有益的突变，而不积累有害的突变。因此，本发明驳斥了不一致理论，所述理论认为预期许多突变导入了生物中，但是不能维持生物的正常生长(代谢，等)。因而，本发明是划时代的发明。具体地，真核生物具有许多双向复制起点。如果基因组DNA具有双向复制起点，那么不一致方法不能积累许多有益的突变，而不积累有害的突变。根据本发明的方法，证实了即使在真核生物中，也可以积累许多有益的突，而不积累有害的突变。

在一个优选的实施方案中，可以有利地将具有改变的校对功能的DNA聚合酶仅仅导入后随链和前导链中的一条。

认为通过本发明实现的令人满意的育种，能实现高速度的生物进化。高速度的生物进化一般需要群体的大量的遗传多样性和有益突变株的稳定扩展。通过精确的DNA复制，可以实现稳定扩展，同时在DNA复制过程中由错误造成的突变会产生遗传多样性。

本发明的效果是，即使在真核生物中也可以实现高速度的进化。真核生物具有明确的核结构，且它们的基因组由许多染色体组成，这与大肠杆菌不同。因此，可以认为本发明具有从常规技术不能预见到的效果。即使在大肠杆菌中可以调节进化速度，也不能预见到在真核生物或革兰氏阳性的细菌中可以调节进化速度，直到这被本文的实例所证实。

在一个优选的实施方案中，在基因复制中起作用的试剂包括至少2种倾向于错误的频率的试剂。这2种倾向于错误的频率的试剂优选地是DNA聚合酶。这些DNA聚合酶具有不同的倾向于错误的频率。在一个优选的实施方案中，倾向于错误的频率的试剂可以有利地包括至少约30％的具有更低的倾向于错误的频率的试剂，更优选地至少约20％，且甚至更优选地至少约15％。利用该特征，存在渐增的由急剧进化生成突变体、同时进行稳定复制的可能。

在另一个优选的实施方案中，根据本发明在基因复制中起作用的试剂(例如，DNA聚合酶，等)有利地具有不同的倾向于错误的频率。不一致的倾向于错误的频率会增加与常规技术相比的进化速度和去除错误阈值的上限。

在一个优选的实施方案中，具有较低的倾向于错误的频率的试剂基本上是无错误的。但是，可以优选地使用具有倾向于错误的频率，以致于每个基因组基本上无错误的试剂。

因此，在一个优选的实施方案中，至少2种倾向于错误的频率一般彼此相差至少10¹，优选地至少10²，且更优选地至少10³。利用这样的频率差异，可以有效地调节进化速度。

在本发明的一个实施方案中，调节倾向于错误的频率的步骤包含调节生物的DNA聚合酶的倾向于错误的频率。通过直接修饰存在于生物中的DNA聚合酶，或者通过将外部地具有修饰的倾向于错误的频率的DNA聚合酶导入生物中，可以调节目标生物的DNA聚合酶的倾向于错误的频率。通过本领域众所周知的生物技术，可以这样修饰DNA聚合酶。该技术描述在本说明书的其它部分。在一个非限制性的实例中，通过使其中已经导入了突变的生物品系进行杂交，可以直接修饰DNA聚合酶。

在另一个实施方案中，DNA聚合酶具有校对功能。在目标生物中，一般存在具有校对功能的DNA聚合酶。这样的具有校对功能的DNA聚合酶的实例包括但不限于：DNA聚合酶δ和ε，DnaQ，具有修复功能的DNA聚合酶β，θ和λ，等。通过直接修饰存在于生物中的DNA聚合酶，或者通过将外部地具有修饰的校对功能的DNA聚合酶导入生物中，可以调节DNA聚合酶的校对功能。通过本领域众所周知的生物技术，可以这样修饰DNA聚合酶。该技术描述在本说明书的其它部分。在一个非限制性的实例中，通过使其中已经导入了突变的生物品系进行杂交，可以直接修饰DNA聚合酶。优选地，使能编码修饰的DNA聚合酶的核酸分子整合进质粒中，并将该质粒导入生物中，从而使该核酸分子暂时地表达。由于质粒等的暂时表达性质等，质粒等会消失。因而，当不再需要调节遗传性状的转化率后，可以恢复与野生型相同的转化率。

在另一个实施方案中，本发明的DNA聚合酶包括至少一种选自下述的聚合酶：真核生物的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。在另一个优选的实施方案中，仅仅可以修饰一种用于本发明的DNA聚合酶，其选自真核生物的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。通过修饰仅仅一种DNA聚合酶的倾向于错误的频率，可以保留曾经出现的基因型(包括野生型)；可以允许高速度的突变；可以改善基因组中的广范围(基因)；可以保证原始性状，且可以增加多样性；可以使进化加速至超过常规水平的速度；且突变的性状是稳定的。

在本发明的另一个实施方案中，调节倾向于错误的频率的步骤包含调节至少一种选自下述的聚合酶：真核生物的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。通过修饰例如聚合酶的3′→5′外切核酸酶活性中心(或者，ExoI基序，校对功能的活性部位)(例如，在位置316处的天冬氨酸和在位置318处的谷氨酸和在人DNA聚合酶δ附近的位点)，可以调节这样的校对活性。本发明不限于此。

在本发明的一个优选的实施方案中，调节倾向于错误的频率的步骤包含使倾向于错误的频率增加至高于野生型的水平。通过使倾向于错误的频率增加至高于野生型的水平，可以提高生物的遗传性状转化率(即，进化速度)，而不负面影响生物。不能常规地预见到这样的改进。本发明具有极好的效果。

在另一个优选的实施方案中，用于本发明的DNA聚合酶具有低于野生型的校对功能。这样的DNA聚合酶可以是自然产生的，或者，可以是修饰的DNA聚合酶。

在一个实施方案中，(修饰的)用于本发明的DNA聚合酶有利地具有能提供错配的碱基(突变)的校对功能，其数目比野生型DNA聚合酶大至少1。通过提供错配的碱基(突变)，其数目比野生型DNA聚合酶大至少1，可以提高生物的遗传性状转化率(即，进化速度)，而不负面影响生物。如果突变的碱基的数目大于野生型DNA聚合酶的，则遗传性状转化率趋向于增加。因此，为了提高转化率，优选地进一步降低校对功能。用于测定校对功能的方法是本领域已知的。例如，对通过适当的适用于目标DNA聚合酶的测定系统(通过对复制的产物进行测序来确定；通过测量校对活性来确定)得到的产物直接或间接地进行测序(例如，通过测序仪或DNA芯片)。

在另一个优选的实施方案中，用于本发明的DNA聚合酶有利地具有这样的校对功能，其能提供至少1个错配的碱基(突变)。一般地，野生型DNA聚合酶经常在得到的产物的碱基序列中不提供突变。因此，在这样的情况下，用于本发明的DNA聚合酶变体可能需要具有更低水平的校对功能，其能提供至少1个错配的碱基(突变)。通过上述的测定系统，可以测量这样的校对功能。更优选地，用于本发明的DNA聚合酶具有这样的校对功能，其能提供至少2个错配的碱基(突变)，更优选地至少3，4，5，6，7，8，9和10个错配的碱基，更优选地至少15，20，25，50和100个错配的碱基。认为生物的遗传性状转化率(即，进化速度)随着校对功能水平的降低而增加，即碱基序列中错配的碱基(突变)数目的增加。

在另一个实施方案中，用于本发明的DNA聚合酶具有这样的校对功能，其能在碱基序列中提供错配的碱基(突变)，其比率为10^-6。一般地，在自然产生的生物中以10^-12至10^-8的比率诱导了突变。因此，在本发明中，优选地采用具有显著降低的校对功能的DNA聚合酶。更优选地，用于本发明的DNA聚合酶具有这样的校对功能，其能在碱基序列中提供错配的碱基(突变)，其比率为10^-3，甚至更优选地，其比率为10^-2。认为生物的遗传性状转化率(即，进化速度)随着校对功能水平的降低而增加，即碱基序列中错配的碱基(突变)数目的增加。

在特定的实施方案中，本发明靶向的生物可以是真核生物。真核生物具有赋予校对功能的机制，其与大肠杆菌的不同。因此，以与大肠杆菌用作模型时不同的方式讨论或解释进化速度。意外地，本发明证实了可以修饰所有生物(包括真核生物)的遗传性状转化率(即，进化速度)。因此，本发明提供了通过常规技术不能预见到的效果。具体地，由于本发明可以调节真核生物的进化速度，所以可以实现下述的各种应用：阐明进化的机制；阐明基因组和性状之间的关系；改良各种高等生物，包括动物和植物；研究现存生物的进化能力；预测将来的生物；生产疾病的动物模型；等。本发明靶向的真核生物的实例包括但不限于：单细胞生物(例如，酵母，等)和多细胞生物(例如，动物和植物)。这样的生物的实例包括但不限于：盲鳗目，七鳃鳗目，软骨鱼纲，硬骨鱼纲，哺乳纲(例如，单孔目，有袋目，无齿类动物，皮翼目，翼手目，食肉动物，食虫动物，长鼻目，奇蹄目，偶蹄目，管齿目，鳞甲目，海牛目，鲸类动物，灵长目，啮齿目，兔形目，等)，鸟纲，爬行纲，两栖纲，鱼纲，昆虫纲，蠕虫纲，双子叶植物，单子叶植物(例如、禾本科，例如小麦，玉米，稻，大麦，高粱，等)，蕨类植物，苔藓植物，真菌，蓝细菌，等。优选地，本发明靶向的生物可以是多细胞生物。在另一个优选的实施方案中，本发明靶向的生物可以是单细胞生物。在另一个优选的实施方案中，本发明靶向的生物可以是动物、植物或酵母。在一个更优选的实施方案中，本发明靶向的生物可以是但不限于哺乳动物。

在另一个实施方案中，用于本发明的生物或细胞自然地具有至少2种聚合酶。如果存在至少2种聚合酶，则可以容易地提供会产生不同的倾向于错误的频率的环境。更优选地，有利的是，生物或细胞天然地具有至少2种聚合酶，且其倾向于错误的频率彼此不同。这样的生物或细胞可以用于提供修饰的生物或细胞。

在一个优选的实施方案中，在已经转化了需要的性状后，通过本发明的方法得到的修饰的生物或细胞具有与野生型基本上相同的生长。该特征只有在本发明无负作用地调节遗传性状的转化率后才能得到。该特征不能通过常规的诱变方法得到。因而，该特征是本发明提供的有利的效果。可以以与野生型相同的方式处理具有与野生型基本上相同的生长的生物或细胞。

在另一个实施方案中，通过本发明的方法修饰的生物或细胞具有对环境的抗性，修饰前的(即，野生型)生物或细胞对该环境没有抗性。这样的环境的实例包括作为参数的至少一种因素，其选自：温度，湿度，pH，盐浓度，营养物，金属，气体，有机溶剂，压力，大气压力，粘度，流速，光强度，光波长，电磁波，辐射，重力，张力，声波，该生物以外的其它生物(例如，寄生物，等)，化学试剂，抗生素，天然物质，心理应激，和机体应激，和其任意组合。因而，可以使用这些因素的任意组合。可以组合任意的2种或更多种因素。

温度的实例包括但不限于：高温，低温，非常高的温度(例如，95℃，等)，非常低的温度(例如，-80℃，等)，大范围的温度(例如，150至-270℃，等)，等。

湿度的实例包括但不限于：100％的相对湿度，0％的相对湿度，0％至100％的任意点，等。

pH的实例包括但不限于：0至14的任意点，等。

盐浓度的实例包括但不限于：NaCl浓度(例如，3％，等)，0至100％的其它盐浓度的任意点，等。

营养物的实例包括但不限于：蛋白，葡萄糖，脂类，维生素，无机盐，等。

金属的实例包括但不限于：重金属(例如，汞，镉，等)，铅，金，铀，银，等。

气体的实例包括但不限于：氧，氮，二氧化碳，一氧化碳，和其混合物，等。

有机溶剂的实例包括但不限于：乙醇，甲醇，二甲苯，丙醇，等。

压力的实例包括但不限于：0至10吨/cm²的任意点，等。

大气压力的实例包括但不限于：0至100大气压力的任意点，等。

粘度的实例包括但不限于：任意流体(例如，水，甘油，等)或其混合物的粘度，等。

流速的实例包括但不限于：0至光速的任意点。

光强度的实例包括但不限于：黑暗和日光水平之间的点。

光波长的实例包括但不限于：可见光，紫外光(UV-A，UV-B，UV-C，等)，红外光(远红外光，近红外光，等)，等。

电磁波的实例包括具有任意波长的。

辐射的实例包括具有任意强度的。

重力的实例包括但不限于：任意的地球重力，或从0重力至地球重力的任意点，或大于或等于地球重力的任意重力。

张力的实例包括具有任意强度的。

声波的实例包括具有任意强度和波长的。

目标生物以外的其它生物的实例包括但不限于：寄生物，病原性细菌，昆虫，线虫，等。

化学物质的实例包括但不限于：盐酸，硫酸，氢氧化钠，等。

抗生素的实例包括但不限于：青霉素，卡那霉素，链霉素，喹啉，等。

自然产生的物质的实例包括但不限于：河豚毒素，蛇毒，生物碱，等。

心理应激的实例包括但不限于：饥饿，密度，狭窄的空间，高空，等。

机体应激的实例包括但不限于：振动，噪音，电，冲击，等。

在另一个实施方案中，本发明的方法靶向的生物或细胞具有癌细胞。通过本发明实现的癌症的生物或细胞模型会根据与自然产生的癌症相同的机制产生癌症，这与常规方法不同。因而，癌症的生物或细胞模型可以视作癌症的精确生物或细胞模型。因此，癌症的生物或细胞模型对于开发药物特别有用。

在本发明的另一方面，提供了生产具有受调节的遗传性状的生物或细胞的方法。该方法包含下述步骤：(a)调节或改变生物或细胞中的基因复制的倾向于错误的频率；和(b)繁殖得到的生物或细胞。在该情况下，与调节遗传性状的转化率有关的技术如上所述。因此，上述的技术可以用于改变生物或细胞中的基因复制的倾向于错误的频率的步骤。与调节遗传性状的转化率的方法有关的如上所述的生物或细胞可以用于调节倾向于错误的频率的步骤。

如果生物或细胞具有受调节的遗传性状，则使用本领域已知的任意方法，可以进行繁殖得到的生物或细胞的步骤。繁殖技术包括但不限于：自然现象，例如繁殖，增殖，等；人工技术，例如克隆技术；从培养细胞向个体植物的繁殖；等。通过例如，通过测定碱基序列来证实；鉴别抗原性等；当使用载体时，检测载体；性状恢复实验；和证实突变的高速度和未破坏的相容性，可以确定是否使用这样的技术。基于本说明书，本领域的技术人员可以容易地进行这些实验。

在一个优选的实施方案中，本发明的生物或细胞繁殖方法还包含筛选繁殖的生物或细胞中的具有需要的性状的个体。基于生物或细胞的遗传性状(例如，对上述的各种环境的抗性，等)，或在基因或代谢物水平，可以筛选出这样的具有需要的性状的个体。可以通过各种技术确定筛选的结果，包括但不限于肉眼检查、测序、各种生化实验、显微镜观察、染色、免疫测定、行为分析，等。这些技术是本领域已知的，且本领域的技术人员根据本说明书能容易地实现。

在本发明的另一方面，提供了根据本发明生产的、调节了其遗传性状的生物或细胞。以常规技术不能实现的高进化速度得到了该生物或细胞。因此，该生物或细胞的存在本身显然是新颖的。该生物或细胞的特征在于，例如：突变的高速度和无破坏的相容性；SNP(单核苷酸多态性)的偏分布；依赖于个体，突变倾向于甚至在基因组的相同区域中以不同方式积累(具体地，该趋势在没有选择压力的区域更明显)；在相同个体的基因组的特定区域(具体地，丰余区)中的突变分布不是随机的，而是明显偏倚的；等。本发明的生物或细胞优选地具有与野生型基本上相同的生长。一般地，已经经历了快速诱变的生物不可能具有与野生型相同的生长。但是，本发明的生物或细胞可以具有与野生型基本上相同的生长。因此，本发明具有这样显著的效果。确认这样的性质的实验是本领域已知的，且本领域的技术人员根据本说明书能容易地实现。

在本发明的另一方面，提供了用于生产能编码具有受调节的遗传性状的基因的核酸分子的方法。该方法包含下述步骤：(a)改变生物或细胞的基因复制的倾向于错误的频率；(b)繁殖得到的生物或细胞；(c)鉴别生物或细胞中的突变；和(d)生产能编码含有鉴别出的突变的基因的核酸分子。在该情况下，用于改变倾向于错误的频率和用于繁殖得到的生物或细胞的技术如上所述，且本领域的技术人员根据本说明书能适当地实现。使用这些技术可以实现本发明的实施方案。

使用本领域众所周知的技术，可以鉴定出生物或细胞中的突变。鉴定技术的实例包括但不限于：分子生物学技术(例如，测序，PCR，DNA印迹，等)，免疫化学技术(例如，蛋白印迹，等)，显微镜观察，肉眼观察，等。

一旦鉴定出了携带突变的基因，则使用本领域众所周知的技术，本领域的技术人员可以生产出能编码鉴定出的携带突变的基因的核酸分子。生产方法的实例包括但不限于：使用核苷酸合成仪的合成；半合成方法(例如，PCR，等)；等。使用本领域众所周知的技术，通过测序或DNA芯片，可以确定是否合成的核酸分子具有目标序列。

因此，本发明提供了通过本发明的方法生成的核酸分子。这些核酸分子是源自以不能通过常规技术实现的进化速度得到的生物或细胞的基因。因此，能编码该基因的核酸分子的存在本身显然是新颖的。核酸分子的特征在于但不限于：SNP的分布是偏倚的；具有大量积累的突变的区域和其它区域倾向于以镶嵌模式分布在基因组中；依赖于个体，突变倾向于甚至在基因组的相同区域中以不同方式积累(具体地，该趋势在没有选择压力的区域更明显)；在相同个体的基因组的特定区域(具体地，丰余区)中的突变分布不是随机的，而是明显偏倚的；等。确认这样的性质的实验是本领域已知的，且本领域的技术人员根据本说明书能容易地实现。

在本发明的另一方面，提供了用于生产由具有受调节的遗传性状的基因编码的多肽的方法。该方法包含下述步骤：(a)改变生物或细胞的基因复制的倾向于错误的频率；(b)繁殖得到的生物或细胞；(c)鉴别生物或细胞中的突变；和(d)生产由含有鉴别出的突变的基因编码的多肽。在该情况下，用于改变倾向于错误的频率和用于繁殖得到的生物或细胞的技术如上所述，且本领域的技术人员根据本说明书能适当地实现。使用这些技术可以实现本发明的实施方案。

使用本领域众所周知的技术，可以鉴别出生物或细胞中的突变。鉴别技术的实例包括但不限于：分子生物学技术(例如，测序，PCR，DNA印迹，等)，免疫化学技术(例如，蛋白印迹，等)，显微镜观察，肉眼观察，等。

一旦鉴别出了携带突变的基因，则使用本领域众所周知的技术，本领域的技术人员可以生产出由鉴别出的携带突变的基因编码的多肽。生产方法的实例包括但不限于：使用肽合成仪的合成；使用基因操纵技术合成能编码上述基因的核酸分子，使用该核酸分子转化细胞，表达基因，并回收表达产物；从修饰的生物或细胞纯化多肽；等。使用本领域众所周知的技术，通过测序、蛋白芯片等，可以确定得到的多肽是否具有目标序列。

在本发明的另一方面，提供了通过本发明的方法生产的多肽。这些多肽是由源自以不能通过常规技术实现的进化速度得到的生物或细胞的基因编码的。因此，由该基因编码的多肽的存在本身显然是新颖的。多肽的特征在于，例如氨基酸序列具有下述遗传性状：SNP的分布是偏倚的；具有大量积累的突变的区域和其它区域倾向于以镶嵌模式分布在基因组中；依赖于个体，突变倾向于甚至在基因组的相同区域中以不同方式积累(具体地，该趋势在没有选择压力的区域更明显)；在相同个体的精子基因组的特定区域(具体地，丰余区)中的突变分布不是随机的，而是明显偏倚的；等。本发明不限于此。确认这样的性质的实验是本领域已知的，且本领域的技术人员根据本说明书能容易地实现。

在本发明的另一方面，提供了生产具有受调节的遗传性状的生物的代谢物的方法。该方法包含下述步骤：(a)改变生物或细胞的基因复制的倾向于错误的频率；(b)繁殖得到的生物或细胞；(c)鉴别生物或细胞中的突变；和(d)生产含有鉴别出的突变的代谢物。在该情况下，用于改变倾向于错误的频率和用于繁殖得到的生物或细胞的技术如上所述，且本领域的技术人员根据本说明书能适当地实现。使用这些技术可以实现本发明的实施方案。

如本文所使用的，术语“代谢物”指细胞为了存活通过活性(代谢)得到的分子。代谢物的实例包括但不限于：化合物，例如氨基酸，脂肪酸和其衍生物，类固醇，单糖，嘌呤，嘧啶，核苷酸，核酸，蛋白，等。另外，通过水解这些聚合化合物或氧化碳水化合物或脂肪酸得到的物质也称作代谢物。代谢物可以存在于细胞中，或者可以从细胞分泌。

在本发明的方法中，使用本领域众所周知的技术，可以鉴别出生物或细胞中的突变。鉴别技术的实例包括但不限于：鉴别代谢物(成分分析)，分子生物学技术(例如，测序，PCR，DNA印迹，等)，免疫化学技术(例如，蛋白印迹，等)，显微镜观察，肉眼观察，等。根据代谢物，本领域的技术人员可以适当地选择代谢物鉴别技术。

在本发明的另一方面，提供了通过本发明的方法生产的代谢物。这些代谢物也源自以不能通过常规技术实现的进化速度得到的生物或细胞，且代谢物的存在本身显然是新颖的。代谢物的特征在于但不限于：对自身毒性较低；优先于自然进化的代谢物；等。确认这样的性质的实验是本领域已知的，且本领域的技术人员根据本说明书能容易地实现。

在本发明的另一方面，提供了用于调节生物或细胞的遗传性状的核酸分子。该核酸分子包含能编码具有修饰的倾向于错误的频率的DNA聚合酶的核酸序列。该DNA聚合酶可以是至少一种选自下述的聚合酶：真核生物的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶，其校对活性受到调节。通过修饰例如聚合酶的3′→5′外切核酸酶活性中心(或者，ExoI基序，校对功能的活性部位)(例如，在位置316处的天冬氨酸和在位置318处的谷氨酸和在人DNA聚合酶δ附近的位点)，可以调节这样的校对活性。本发明不限于此。

优选地，能编码包含在本发明的核酸分子中的DNA聚合酶的序列有利地编码DNA聚合酶δ或ε。这是因为，这些DNA聚合酶自然地具有校对功能，且能相对容易地修饰该功能。

在本发明的另一方面，提供了包含用于根据本发明调节生物或细胞的遗传性状的核酸分子的载体。该载体可以是质粒载体。如果需要，该载体可以优选地包含启动子序列、增强子序列等。该载体可以整合进用于调节生物或细胞的遗传性状的试剂盒中，或可以销售。

在本发明的另一方面，提供了包含用于根据本发明调节生物或细胞的遗传性状的核酸分子的细胞。本发明的核酸分子可以以载体形式整合进细胞中。本发明不限于此。该细胞可以整合进用于调节生物或细胞的遗传性状的试剂盒中，或可以销售。在一个优选的实施方案中，该细胞可以有利地是但不限于真核细胞。如果细胞仅仅用于扩增核酸分子，则可以优选地使用原核细胞。

在本发明的另一方面，提供了包含用于根据本发明调节生物或细胞的遗传性状的核酸分子的生物或细胞。该生物可以整合进用于调节生物或细胞的遗传性状的试剂盒中。

在另一方面，本发明提供了由通过本发明的方法得到的生物或细胞或其一部分(例如，器官，组织，细胞，等)生产的产物物质。通过常规方法不能得到通过本发明得到的生物或其部分，且它们的产物物质可以包括新物质。

在本发明的另一方面，提供了测试药物的方法，其包含下述步骤：使用作为疾病模型的本发明的生物或细胞，测试药物的效果；使用野生型生物或细胞作为对照，测试药物的效果；和对比疾病模型和对照。这样的疾病模型是通过常规方法不能实现的自发的疾病进程模型。因此，通过在测试药物的方法中使用这样的疾病模型，实验结果接近于通过常规方法不能实现的自然条件下进行的实验，从而导致高水平的实验可靠性。因此，可能缩短药物等的开发时间。或者，可能在实验结果中得到更准确的信息，例如副作用等。

在另一方面，本发明涉及一组至少2种聚合酶，其用于调节生物或细胞的遗传性状的转化率，其中聚合酶具有不同的倾向于错误的频率。这样的一组聚合酶尚未常规地用于上述的方法中，且是非常新颖的。可以使用任意的聚合酶，只要它们能在导入的生物或细胞中发挥功能即可。因此，聚合酶可以源自2个或更多个物种，优选地源自相同的动物物种。通过基因导入，可以将用于上述用途的聚合酶导入生物或细胞。

在本发明的另一方面，提供了一组至少2种聚合酶，其用于生产具有修饰的遗传性状的生物或细胞，其中聚合酶具有不同的倾向于错误的频率。这样的一组聚合酶尚未常规地用于上述的方法中，且是非常新颖的。可以使用任意的聚合酶，只要它们能在导入的生物或细胞中发挥功能即可。因此，聚合酶可以源自2个或更多个物种，优选地源自相同的动物物种。通过基因导入，可以将用于上述用途的聚合酶导入生物或细胞。

在另一方面，本发明涉及一组至少2种聚合酶在调节生物或细胞的遗传性状的转化率中的用途，其中聚合酶具有不同的倾向于错误的频率。用于上述用途的聚合酶如上所述，且在下面的实施例中使用和生产。

在另一方面，本发明涉及一组至少2种聚合酶在生产具有修饰的遗传性状的生物或细胞中的用途，其中聚合酶具有不同的倾向于错误的频率。用于上述用途的聚合酶如上所述，且在下面的实施例中使用和生产。

(不一致准种杂合体模型)

A.具有不同复制精确度的准种的突变分布

在本发明的另一方面，准种由大量基因组组成，假定每个基因组由长度为n的二重碱基序列表示，其具有2ⁿ种可能的基因型(或序列空间)。这里将具有最佳适合度的序列称作“主序列”。选择非常大和稳定的群体大小。一个模板序列的复制会生成一个直接拷贝序列，因而通一个步骤将复制错误固定到突变。仅仅发生碱基取代，因而序列长度是恒定的。忽略序列降解。为了易于处理，发明人将主序列(I₀)的所有i-错误突变体的总和归入突变体类I_i(i＝0，1，...，n)。对应的相对浓度的总和表示为x_i。x_i中的变化的速度表示为：

x_{i} = (A_{i} Q_{ii} - f) x_{i} + \underset{j = 1}{Σ} A_{j} Q_{ij} x_{j} - - - (1)

其中A_i是突变体类I_i的复制速度常数(或适合度)；f保持总浓度恒定；且从而是∑_iA_jX_i；Q_ii是复制精确度，或通过I_j的完全无错误的复制生成I_i的可能性；且Q_ij是通过I_j的错误复制生成I_i的可能性。

聚合酶复制基因组序列。E_k表示p种具有不同精确度(k＝1，2，...，p)的聚合酶。E_k的相对浓度表示为C_k。聚合酶E_k的单碱基精确度表示为0≤q_k≤1，所以每个碱基的错误率是1-q_k。因为相同的聚合酶一致地复制一个序列，所以每个碱基的错误率E_k是n(1-q_k)。准种的每个基因组的平均错误率表示为n∑_kC_k(1-q_k)＝m。通过转化均一的复制精确度(例如，M.Eigen，1971(同上))，可以通过下式得到不同的复制精确度：

Q_{ij} - \underset{k}{Σ} c_{k} q_{k}^{n} Σ_{h = 0}^{i} {(\frac{1 - q_{k}}{q_{k}})}^{2 h + | j - i |} (\overset{n - j}{h + \frac{1}{2} (| j - i | - j + i)})

\times (\overset{j}{h + \frac{1}{2} (| j - i | + j - i)}), - - - (2)

l = [\frac{1}{2} (\min {i + i, 2 n - (j + i)} - | j - i |)] . - - - (3)

静态突变分布，lim_t→∞X_i＝Y_i，是准种。这由矩阵W＝{A_jQ_ij}的特征向量表示。图5显示了具有均一和不同复制精确度的准种的实例。在这里，使用了简单的单峰适合度空间。将复制速度常数A₀指定给主序列，且所有其它突变体类具有相同的适合度。

具有低于错误阈值的均一复制精确度的同等准种位于主序列周围(图5的(a))。在接近m＝2.3的错误阈值，过渡非常尖锐，主序列的相对浓度降低了超过约10个量级(在c＝0，图6)。这样的现象称作错误的突然大变动。在高于错误阈值时，准种的位置被替换为一致的分布，其中各个浓度都非常小(例如，Y_i＝8.88×10^-16)。在现实的有限的群体中，更难以随着错误的积累，通过选择来维持主序列的遗传信息。仅仅在低于错误阈值时，准种才能进化，且进化速度似乎达到了它的接近错误阈值的最大值。

假定本发明的不一致模型(图5中的(b)至(d))具有2种聚合酶，每种具有不同的精确度。聚合酶E₁是无错误的，q₁＝1，E₂是倾向于错误的，0≤q₂≤1；每种以c和1-c的相对浓度存在。假定完全无错误的聚合酶似乎不是现实的，但是，基于DNA的微生物中的校对聚合酶的错误率非常小，每个基因组每次复制0.003个错误，因而在该情况下可以忽略。

当无错误的聚合酶的相对浓度较低时，0＜c＜1，随着c的增加，错误阈值转换成更高的平均错误率，且错误的突然大变动的量级降低(图5的(b)和图6)。在c＝0.1，错误阈值成为0(图5的(c))。主序列的相对浓度逐渐降低，且最终在比同等一致的分布高10⁷倍的浓度稳定(在c＝0.1，图6)。当c＞0.1时，独立于平均错误率，主序列以足够的浓度存在(图5的(d)和图6)。图6显示了在C_crit＝0.1附近的准种动力学的急剧变化。在不一致准种模型中，远离主序列的突变体可以存在，而不引起准种位置的损失。这意味着，进化速度可以增加，而无错误的突然大变动。

B.具有许多复制剂的准种的错误阈值

考虑到不一致模型的错误阈值，发明人遇到了下面的2个困难：(i)基因组大小实际上过大，病毒：n＞10³，细菌：n＞10⁶，以致于难以精确计算；和(ii)基因组复制实际上分配在超过一个单元(复制试剂)中，且超过一种聚合酶同时参与。多种复制剂似乎会影响错误阈值。通过使用主序列的相对静态浓度的近似值，发明人计算了错误阈值。

y_{0} = \frac{A_{0} Q_{00} - A_{i &NotEqual; 0}}{A_{0} - A_{i &NotEqual; 0}}, - - - (4)

其中A₀是主序列的复制速度常数，A_i≠0是其它突变序列的总平均值；Q₀₀是主序列的完全无错误复制的复制精确度。该近似值依赖于考虑表达式(1)中的从突变体至主序列的回复突变的忽略。与精确解的一致随着基因组大小的增加而增加。对于能满足下式的临界错误率，主序列的相对静态浓度成为0：

{(Q_{00})}_{\min} = \frac{A_{i &NotEqual; 0}}{A_{0}} = s^{- 1}, - - - (5)

其中s是主序列的选择优势。为了使用许多复制剂得到不一致模型的Q₀₀，发明人假定存在2种聚合酶E₁和E₂，每种以c和1-c的相对浓度存在。校对聚合酶的错误率非常小，且是可以忽略的。因而，聚合酶E₁是无错误的，q₁＝1，且E₂是倾向于错误的，0≤q₂≤1。那么每个基因组的平均错误率是：

m＝n(1-c)(1-q₂). (6)

通过二项式分布，得到了倾向于错误的聚合酶E₂复制基因组的可能性。从泊松近似值，得到了倾向于错误的聚合酶E₂的无错误的可能性，其中假设基因组大小与复制剂的数目相比非常大。使它们相乘，得到：

Q_{00} = Σ_{b = 0}^{a} (\begin{matrix} a \\ b \end{matrix}) c^{a - b} {(1 - c)}^{b} e^{- mb / a (1 - c)}

= {[c + (1 - c) e^{- m / a (1 - c)}]}^{a}, - - - (7)

其中a是基因组中的所有复制剂的数目。组合表达式(5)和(7)，得到不一致模型的错误阈值：

m_{\max} = c (1 - c) \ln (\frac{1 - c}{s^{- 1 / s} - c}) . - - - (8)

图7显示了错误阈值，其是无错误的聚合酶在各种数目的复制剂时的相对浓度的函数。同等模型(c＝0)的错误阈值不受复制剂数目的影响。在不一致模型(c＞0)中，在无错误的聚合酶的临界浓度发生的异常，

c_{crit} = s^{- 1 / m}, - - - (9)

导致错误阈值的非常急剧的增加。这意味着，在c≥c_crit，错误阈值成为0。c_crit随着复制剂数目的增加而增加。

因而，从表达式(6)和(8)得到了可允许的错误率：

m_{pms} = \{\begin{matrix} < c (1 - c) \ln (\frac{1 - c}{s^{- 1 / s} - c}), c < z \\ \leq n (1 - c) (1 - q_{\min}), c &GreaterEqual; z \end{matrix}, - - - (10)

z = \frac{\exp (n q_{\min} / a) - \exp (n / a) s^{- 2 / s}}{\exp (n q_{\min} / a) - \exp (n / a)} = s^{- 2 / s}

当c≥c_crit时，有2个约束条件：(i)基因组大小n是有限的；和(ii)倾向于错误的聚合酶在真实的生物中具有非零的精确度q_min。假设大肠杆菌的完全无校对的DNA聚合酶的错误率是1-q_min＝10^-5。图8显示了基于大肠杆菌的参数的可允许的错误率的实例。该图的形状类似于λ过渡。对于s＝10，大肠杆菌的m_pms的最大值变成每个基因组每次复制31个错误。与同等模型的错误阈值相比，该错误率足够高(1n(s)＝2.3)。

发明人提供了不一致-准种杂合体模型，其中存在无错误的和倾向于错误的聚合酶。结果，证实了不仅通过错误率，而且通过具有不同精确度的聚合酶的比例和通过能改变基因组的复制剂的数目，可以确定准种的动力学。形成的一个值得注意的发现是，与常规的同等模型相比，无错误的和倾向于错误的聚合酶的共存可以显著增加准种的错误阈值。这是常规技术未能揭示的本发明的效果。

许多生物实质上生活在不断改变的环境中。对于避开宿主免疫系统的微生物病原体和癌细胞，这是特别正确的。因为突变体数目的大幅度增加，和由此引起的可能的具有较大距离的候选物，所以发现有利突变体的机会随着主序列的Hamming距离的增加而增加。

简单的错误率的均一增加会导致有害突变的相当可观的成本，即使它是暂时的。同等准种的错误阈值如此小，以致于突变体的分布范围限于离主序列较短的距离。同等准种会陷入局部的低峰，且永远不会达到远离主序列的更高峰。另一方面，不一致准种会增加错误阈值，而不损失遗传信息，由此生成大量的远离主序列的有利突变体。不一致准种可以在序列空间中搜索较长的距离，并最终发现更高峰。

倾向于错误的聚合酶的持续合成能力似乎低于具有校对能力的主要复制性聚合酶。利用许多复制剂的不一致模型考虑了该发现。在该模型中，错误集中在许多复制剂的区域，其中有倾向于错误的聚合酶参与。如果倾向于错误的复制限制在特定的基因区域内，那么在将其它基因的成本保持在最小时，该区域的错误率极大地增加。

因此，根据本发明，证实了如果在生物中提供能实现至少2种倾向于错误的频率的DNA复制剂(例如，聚合酶)，那么该生物可以表现出与常规技术相比显著增加的进化速度，同时保持个体生物正常。这样的效果尚未常规地实现。

在本文中提及的所有专利、专利申请、期刊文章和其它参考文献，都整体引作参考。

此前，参考优选的实施方案描述了本发明，以利于理解本发明。在下文中，将通过实施例描述本发明。下面描述的实施例仅仅用于解释目的。因此，本发明的范围除了如所附权利要求书所示之外不受限制。

(实施例)

在下文中，将通过实施例更详细地描述本发明。本发明不限于下面的实施例。在下面的实施例中使用的试剂、支持物等购自Sigma(St.Louis，美国)，Wako Pure Chemical Industries(Osaka，日本)，等，有一些例外。根据日本大学(Japanese Universities)制定的规则，处理和测试动物。

(实施例1：生产酵母的抗药株和抗高温株)

在实施例1中，酵母用作代表性的真核生物，以证实根据本发明可以调节不一致突变酵母中的遗传性状的转化率。

为了证实不一致突变在育种领域的有用性，生产了具有抗药性和/或高温抗性的酵母。

将突变导入DNA聚合酶δ和DNA聚合酶ε的校对功能，以调节校对功能(Alan Morrison & Akio Sugino，Mol.Gen.genet.(1994)242：289-296)。

(材料)

在实施例1中，酵母(啤酒糖酵母)用作目标生物。使用AMY52-3D：MATα，ura3-52leu2-1ade2-1his1-7hom3-10trp1-289canR(从Sugino教授(Osaka University)得到)作为正常株。

作为正常的酵母株，从美国典型培养物保藏中心(ATCC)得到了MYA-868(CG378)。

通过改变DNA聚合酶δ或ε的校对功能，可以调节倾向于错误的频率。通过生产不一致突变株，其具有DNA聚合酶δ或ε的校对部分的缺失，改变了校对功能。为了生产突变株，使用普通技术(Sambrook等，Molecular Cloning：A Laboratory Manual，第2版，Cold SpringHarbor Laboratory(Cold Spring Harbor，N.Y.，1989)，同上)，使用定位诱变来在正常株的DNA聚合酶Polδ或Polε的特定位点进行碱基取代(Morrison A.& Sugino A.，Mol.Gen.Genet.(1994)242：289-296)。具体地，在下述位置进行转化：在Polδ中，322(D)→(A)，和324(E)→(A)；和在Polε中，291(D)→(A)和293(E)→(A)。这些突变体是DNA聚合酶δ突变株(AMY128-1：Pol3-01MATα，ura3-52 leu2-1 lys1-1 ade2-1 his1-7 hom3-10 trp1-289 canR；从Sugino教授(Osaka University)得到，和DNA聚合酶ε突变株(AMY2-6：pol2-4MATα，ura3-52 leu2-1 lys1-1 ade2-6 his1-7hom3-10 try1-289 canR；从Sugino教授(Osaka University)得到。应当明白，使用定位诱变来诱导突变，例如在Polδ中，322(D)→(A)和324(E)→(A)；和在Polε中，291(D)→(A)和293(E)→(A)，本领域的技术人员可以生产出这些株的等同物。

(生产抗药株的方法)

将上述的3株铺平板到含有完全培养基(YPD培养基：10g酵母提取物(Difco)，20g BactoPepton(Difco)，和20g葡萄糖(wako))的琼脂平板上。为每株随机收集5个单个菌落。将菌株接种到3ml YPD液体培养基中，随后在30℃振荡培养至约1×10⁶的终浓度。

稀释菌株，并接种到含有1mg/L放线菌酮(Sigma，St.Louis，MO，美国)的YPD平板上。作为对照，将菌株接种到不含药物的YPD平板上。将菌株在30℃培养2天。计数得到的菌落。

(得到抗高温株的方法)

将上述的3株从单个菌落转移到液体培养基中，随后进行适应培养，同时逐渐升高培养温度。适应培养规程如下：

37℃，2天→28℃，1天→38℃，2天→28℃，1天→39℃，2天→28℃，1天→40℃，2天→28℃，1天；冷冻保藏最后的培养物(“适应培养”)。

如下继续进行适应培养：

37℃，2天→28℃，1天→38℃，2天→28℃，1天→39℃，2天→28℃，1天→40℃，2天→28℃，1天→41℃，2天→28℃，1天；冷冻保藏最后的培养物(“适应培养II”)。

(测量生长曲线)

在完全液体培养基(YPD)中进行振荡培养。基于在530nm的光密度(OD)，测量生长(即，细胞密度)。使用分光光度计(Hitachi)，测定光密度。在28℃测试正常株和抗药突变体，得到生长曲线，同时在38.5℃测试抗高温株。

(抗药株的结果)

在DNA聚合酶δ和DNA聚合酶ε突变体中，当细胞在没有任何药物的培养基中生长时，出现了放线菌酮抗性的细菌，但是在野生型中没有。

表1：放线菌酮抗性的菌落的数目

	菌落数目^*					平均值^*
	菌落数目^*					平均值^*	polδ	60	81	81	111	744	215
polyε	3	39	138	0	0	36	polδ	60	81	81	111	744	215
polyε	3	39	138	0	0	36	WT	0	0	0	0	0	0

^*单位：×10⁶

发现从Polδ突变体得到的抗性株能在最高达10ml/L放线菌酮下生长。

对比了野生型和突变体的生长特征。基本上没有发现生长速度的差异(表2和图1)。

表2：Polδ和polε突变体的生长曲线

生长时间	polδ	polε	WT
生长时间	polδ	polε	WT	0	0.13	0.13	0.13
2	0.9	0.8	0.9	0	0.13	0.13	0.13
2	0.9	0.8	0.9	4	2.2	2.1	2.1
6	4.1	4.0	4.1	4	2.2	2.1	2.1
6	4.1	4.0	4.1	8	5.9	5.7	6.0
10	7.9	7.8	8.1	8	5.9	5.7	6.0
10	7.9	7.8	8.1	12	10.5	10.8	11.1
22	20.1	19.8	21.7	12	10.5	10.8	11.1
22	20.1	19.8	21.7	32	19.6	19.5	20.3
44	18.9	19.2	19.8	32	19.6	19.5	20.3

(小时) OD：530nm

(抗高温株的结果)

在40℃进行适应培养2天，然后接种到琼脂平板上，随后在38.5℃培养。尽管亲本株不能在高温生长，但证实了突变体能在高温下生长(图3A和3B(照片))。

对比了野生型株和突变体在高温条件下的生长特征。证实了野生型株的生长已经停止(表3和图2)。

而且，在41℃继续适应培养。结果，发现会产生能在41℃生长的突变体(图4A和4B)。

表3：抗高温株的生长曲线

生长时间	克隆1	克隆2	WT
生长时间	克隆1	克隆2	WT	0	0.131	0.125	0.134
2	0.154	0.174	0.177	0	0.131	0.125	0.134
2	0.154	0.174	0.177	4	0.203	0.227	0.264
6	0.258	0.314	0.327	4	0.203	0.227	0.264
6	0.258	0.314	0.327	8	0.327	0.447	0.365
10	0.462	0.6	0.358	8	0.327	0.447	0.365
10	0.462	0.6	0.358	12	0.93	1.12	0.352
22	1.463	1.486	0.346	12	0.93	1.12	0.352

(小时) OD：530nm

克隆1：源自Polδ的抗性株

克隆2：源自Polε的抗性株

酵母具有与革兰氏阴性的细菌(例如大肠杆菌)不同的基因复制机制。因此，尚不清楚是否可以根据本发明通过调节遗传性状的转化率来调节酵母的倾向于错误的频率，而不影响该生物的存活。

在实施例1中，证实了可以通过调节遗传性状的转化率来调节酵母(即，一种真核生物)的倾向于错误的频率，而不影响该生物的存活。

(实施例2：使用质粒导入突变)

在实施例2，证实了使用质粒载体可以调节真核生物的遗传性状的转化率(“不一致诱变质粒”)。

类似于实施例1，通过将突变导入DNA聚合酶δ和DNA聚合酶ε的校对功能，来调节校对功能(Alan Morrison & Akio Sugino，Mol.Gen.Genet.(1994)242：289-296)。

生产了能表达突变的DNA聚合酶(pol)δ或DNA聚合酶ε的质粒载体。通过用该载体转染，转化了酵母细胞，以生产突变的细胞。在含有药物例如放线菌酮等的平板培养基中培养突变体。计数出现的抗药菌落。

(材料)

在实施例2中，酵母(酿酒酵母)用作目标生物。使用AMY52-3D：MATα，ura3-52 leu2-1 ade2-1 his1-7 hom3-10 trp1-289 canR(ATCC，同上)作为正常株。通过将突变的DNA聚合酶δ或ε导入野生型正常株，来调节酵母的倾向于错误的频率。

使用如实施例1所使用的DNA聚合酶δ突变株(AMY128-1：Pol3-01 MATα，ura3-52 leu2-1 lys1-1 ade2-1 his1-7 hom3-10trpl-289 canR)或DNA聚合酶ε突变株(AMY2-6：pol2-4 MATα，ura3-52 leu2-1 lys1-1 ade2-6 his1-7 hom3-10 try1-289 canR))，生产了能编码突变的DNA聚合酶δ或ε的序列。

该质粒载体含有启动子Gal和分别编码突变的DNA聚合酶δ和ε的核酸序列(SEQ ID NO.33和35)。该核酸序列可操作地连接到启动子上。

(方法)

(生产载体)

这里使用的分子生物学技术记载在，例如，Sambrook，J.，等(同上)中。通过PCR，扩增Polδ和Polε突变株(DNA聚合酶δ突变株(AMY128-1：Pol3-01 MATα，ura3-52 leu2-1 lys1-1 ade2-1 his1-7hom3-10 trp1-289 canR)和DNA聚合酶ε突变株(AMY2-6：pol2-4MATα，ura3-52 leu2-1 lys1-1 ade2-6 his1-7 hom3-10 try-289 canR))的pol位点，并回收Polδ和polε。用于回收pol位点的引物具有下面的序列：

polδ(正向)：

SEQ ID NO.37：5′-CCCGAGCTCATGAGTGAAAAAAGATCCCTT-′3(δ)；

pol3(反向)：

SEQ ID NO.38：5′-CCCGCGGCCGCTTACCATTTGCTTAATTGT-′3(δ)；

Polε(正向)：

SEQ ID NO.39：5′-CCCGAGCTCATGATGTTTGGCAAGAAAAAA-′3(ε)；和

pol2(反向)：

SEQ ID NO.40：5′-CCCGCGGCCGCTCATATGGTCAAATCAGCA-′3(8)。

将PCR产物整合进具有GAL启动子的载体中。

(转化)

使用磷酸钾方法，用质粒载体转染正常的酵母株。

(突变导入)

在振荡时，在28℃、含有半乳糖的液体培养基中培养转化的酵母48-72小时。

(确认抗药性)

在28℃，在含有放线菌酮的平板培养基(补充了半乳糖)中培养细胞24小时。计数生长的菌落。

(结果)

(实施例3：生产突变的生物，包括小鼠等动物)

在实施例3中，使用小鼠(动物)作为代表性的真核生物来生产不一致突变的生物。

使用基因靶向技术，生产了具有复制复合物(具有不同DNA复制校对能力)的小鼠。

通过调节DNA聚合酶δ(SEQ ID NO.55(核酸序列)和56(氨基酸序列))和/或DNA聚合酶ε(SEQ ID NO.57(核酸序列)和58(氨基酸序列))的校对功能，来调节复制校对功能。如下进行突变：在polδ中，315(D)→(A)，317(E)→(A)；在polε中，275(D)→(A)，277(E)→(A)。

(基因靶向技术)

基因靶向技术描述在，例如，Yagi T.等，Proc.Natl.Acad.Sci.USA，87：9918-9922，1990；″Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]″，Takeshi Yagi，编，Special issue，Jikken Igaku[Experimental Medicine]，2000，4。使用具有突变体pol的靶向载体，生产了同源重组小鼠ES细胞。

将重组ES细胞导入小鼠早期胚胎中，以形成胚泡。将胚泡植入假孕的小鼠中，以生产嵌合小鼠。

使嵌合小鼠杂交。选择已经导入了突变的具有生殖细胞的小鼠。继续杂交，直到得到具有同源突变的小鼠。

在实施例3中，选择目标性状作为癌症发作的量度。

(方案)

(1.制备ES细胞)

使用饲养细胞(小鼠胎儿成纤维细胞；从Osaka University的Yagi教授得到)在补充了20-30％牛胎儿血清的Dulbecco氏改进的Eagle培养基(DMEM)中，在37℃、5％CO₂中，培养从胚胎(从Centerfor Animal Resources and Development，Kumamoto University，Kumamoto，日本得到)中的细胞块制备出的小鼠ES细胞。

使用描述在例如“Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]”，Takeshi Yagi，编，Specialissue，Jikken Igaku[Experimental Medicine，2000，4中的技术，制备饲养细胞。从小鼠胎儿成纤维细胞的原代培养物得到了饲养细胞。

(2.使用靶向载体同源重组pol基因)

通过正/负方法(positive/negative method)(Evans，M.J.，Kaufman，M.H.，Nature，292，154-156(1981))，制备了靶向载体，以有效地得到同源重组ES细胞(Capecchi，M.R.，Science 244：1288-1292(1989))。

制备靶向载体：通过描述在例如，Molecular Cloning，第2版，Sambrook，J.，等，同上，和Ausubel，F.M.，Current Protocols inMolecular Biology，Green Publishing Associates and Wiley-Interscience，NY，1987，同上中的技术，制备了靶向载体。

在靶向载体中，将突变Polδ和/或polε基因插入正基因和负基因之间。新霉素抗性基因用作正基因，而白喉毒素用作负基因。

对于Pol突变，将一个碱基的突变导入Polδ和Polε的校对活性位点中(SEQ ID NO.55和56(δ)；SEQ ID NO.57和58(ε))，以缺失校对活性：在Polδ中，315(D)→(A)，317(E)→(A)；在Polε中，275(D)→(A)，277(E)→(A)(Morrison A.& Sugino A.，Mol.Gen.Genet.242：289-296，1994；Goldsby R.E.，等，Proc.Natl.Acad.Sci.USA，99：15560-15565，2002)。

(3.将载体导入ES细胞)

通过电穿孔将载体导入ES细胞中。使用含有G418(Sigma，St.Louis，MO，美国)的DMEM培养基(Flow Laboratory)进行培养。

(4.回收重组ES细胞)

在有G418存在的情况下培养后，将出现的菌落转移到平板(DMEM培养基；Flow Laboratory)。

(5.确认同源重组体)

从ES细胞提取基因组DNA。通过DNA印迹和/或PCR，确定突变体pol是否成功地导入了ES细胞。

(6.制备嵌合小鼠-将重组ES细胞导入胚胎)

通过显微注射方法，将上述的重组细胞导入胚泡中。通过描述在例如，″Gintagettingu no Saishingijyutsu[Up-to-date GeneTargeting Technology]″，Takeshi Yagi，编，Special issue，Jikken Igaku[Experimental Medicine]，2000，4中的普通方法，选择与ES细胞不同的宿主小鼠胚胎作为胚泡。

(7.生产嵌合小鼠-将胚胎移植进假孕的小鼠)

当ES细胞源自129-系小鼠时，将ES细胞注射进C57BL/6小鼠的胚泡中。当ES细胞是TT-2细胞时，将ES细胞注射进ICR小鼠的8-细胞期的胚胎中，以生产假孕的小鼠。将具有注射的ES细胞的小鼠胚胎植入代孕母亲的子宫或输卵管中，以生产嵌合小鼠。

(8.生产嵌合小鼠-使小鼠杂交)

使嵌合小鼠杂交。通过PCR和/或DNA测序等，确定突变体pol是否成功地导入了生殖细胞。继续杂交，直到得到具有同源突变体pol的小鼠。

(结果)

从在实施例3中制备的小鼠中，选择患有癌症的小鼠。该小鼠以比常规技术明显更高的速度自然地生成癌症。修饰的细胞具有与自然产生的细胞基本上相同的生长速度，但是，修饰的细胞的突变率是每代2个或更多个，这与常规的突变显著不同。

(其它性状)

类似地，关于糖尿病，高血压，动脉硬化，肥胖，痴呆，神经障碍，等进行筛选。本发明可以提供这样的模型，其中极大地加速了这些疾病的发作，但是每种疾病都自然地产生。因此，本发明的方法可以应用于动物。

(其它动物)

接着，使用大鼠作为模型进行了相似的实验。通过将突变导入polδ(在如SEQ ID NO.60所述的氨基酸序列中，在位置315处的D和在位置317处的E被取代为丙氨酸)，可以快速地制备出癌症的大鼠模型。

(实施例4：使用其它方法生产突变的生物)

接着，使用另一个小鼠模型来确定是否可以生成突变的生物。使用的方法如下所述。

(材料和方法)

<制备Pold1的cDNA>

使用TRIzol试剂(Invitrogen)，从4周龄的新生C57BL/6小鼠(Charles River日本)的睾丸中提取mRNA。使用SuperScript III(Invitrogen)和Oligo-dT引物，通过逆转录提取的mRNA，生产小鼠睾丸的总cDNA。利用总cDNA，使用Pold1基因(SEQ ID NO.86(核酸序列)和SEQ ID NO.87(氨基酸序列))的5′-末端引物SpeI-5′Pold1(GACTAGTGGCTATCTTGTGGCGGGAA)(SEQ ID NO.67)和3′-末端引物EcoRI-3′Pold1(GGAATTCCTTGTCCCGTGTCAGGTCA)(SEQ ID NO.68)，它们设计成含有Kozak序列，通过PCR扩增Pold1基因的cDNA片段。在该方式中，得到了野生型Pold1的cDNA。将突变(D400A)导入cDNA中，以从Pold1基因(SEQ ID NO.88(核酸序列)和SEQ ID NO.89(氨基酸序列))缺失3′-5′外切核酸酶活性。为了实现该目的，对能导入突变的引物序列(CAGAACTTTGCCCTCCCATACCTC)(SEQ ID NO.69)和与其互补的引物进行PCR连接，以生成Pold1突变体的cDNA。使用ABI3100测序仪(Applied Biosystems，CA，美国)阅读cDNA的全长序列(SEQ ID NO.70)，并与数据库对比，以发现相同的序列。该cDNA用于所有的实验。使用KOD DNA聚合酶(TOYOBO，Osaka，日本)，进行制备野生型和突变型Pold1 cDNA的PCR。

<克隆启动子序列>

使用C57BL/6小鼠的基因组DNA的5′mPGK2-sacII引物(TCCCCGCGGCTGCAGAGGATTTTCCACAG)(SEQ ID NO.71)和3′mPGK2-SpeI引物(GGACTAGTATGGTATGCACAACAGCCTC)(SEQ ID NO.72)，克隆了mPGK2：455-bp的mPGK2启动子片段(SEQ ID NO.94)。使用KOD DNA聚合酶(TOYOBO，Osaka，日本)，进行PCR。

使用5′Fthl17-sacII引物(TCCCCGCGGAGTGGTTGTGGGAGACTTAC)(SEQ ID NO.73)和3′Fthl17-SpeI引物(GGACTAGTCAGTCCCACAGTCCCAAAGT)(SEQ ID NO.74)，克隆了DNA片段(SEQ ID NO.95)，它是Fthl17：5725-bp的上游序列。使用LA Taq聚合酶(TAKARA)和GC缓冲液(由生产商提供)，进行PCR。

<生产转基因小鼠>

使用显微操作器，将制备的用于生产转基因小鼠的载体DNA(2ng/μl)注射进C57BL/6小鼠的受精卵的原核中。在导入了基因的受精卵中，将2-细胞期(次日)的胚胎移植进假孕的雌性ICR小鼠的输卵管中，由此生产转基因小鼠。

<确认是否存在转基因>

将小鼠的尾巴切成小块，将其依次置于含有蛋白酶K(NacaliTesque)的增溶缓冲液(50mM Tris-HCl，10mM EDTA，200mM NaCl，1％SDS)中，并在55℃温育过夜。此后，通过进行2次苯酚/氯仿提取和乙醇沉淀，制备出小鼠的基因组DNA。对于每只小鼠的基因组DNA，通过PCR确定是否存在转基因：对于转基因小鼠#1，使用Cre-F引物(CTGAGAGTGATGAGGTTC)(SEQ ID NO.75)和Cre-R 引物(CTAATCGCCATCTTCCAGCAG)(SEQ ID NO.76)，对于转基因小鼠#2，使用Neo-F引物(GCTCGACGTTGTCACTGAAG)(SEQ ID NO.77)和Neo-R引物(CCAACGCTATGTCCTGATAG)(SEQ ID NO.78)。使用Ex-Taq聚合酶(TAKARA，Kyoto，日本)，进行PCR。

<免疫染色>

使用mPGK2(出生后14周龄)和Fthl17(出生后13周龄)的F0-代转基因小鼠进行实验。用戊巴比妥(50mg/ml，DainipponPharmaceutical)麻醉小鼠，进行剖腹术。最初，切除2个附睾中的1个。此后，用4％仲甲醛灌注固定小鼠。提取2个附睾，并在4％仲甲醛中浸泡4小时。用PBS(NaCl 8g，Na₂HPO₄ 1.15g，KCl 0.2g，和KH₂PO₄ 0.2g，溶解在水中；终体积：1L)简单地洗涤附睾，并浸入20％蔗糖磷酸盐缓冲液(0.1M磷酸盐(钠)缓冲液(pH7.3)，20％蔗糖)中在4℃过夜。此后，将组织浸入OCT化合物(Tissue-Tek，Sakura Fineteck日本)中，并立即冷却。使用恒冷切片机将组织切成5-μm厚的切片。将切片在含有20％Blocking One(Nacali Tesque)和0.05％Tween20的PBS中温育。此后，将切片与4000倍稀释的小鼠抗-Cre重组酶单克隆抗体(MAB3120，Chemicon)一起温育。使用生物素化的抗-小鼠IgG抗体(Vector Laboratories Inc.)作为第二抗体。使用3，3-二氨基联苯胺(DAB)(Dojindo Laboratories)和过氧化物酶(Nacali Tesque)，进行显色。用DAB显色后，使用甲基绿(Merck)进行对比染色。

<人工授精>

将怀孕母马的血清促性腺激素(PMSG)(CALBIOCHEM)腹膜内地注射进雌性C57BL/6小鼠(Charles River日本)(5IU/小鼠)。46-48小时后，类似于PMSG，将人绒毛膜促性腺素(hCG)(Teikoku HormoneMFG.)腹膜内地注射进小鼠(5IU/小鼠)。12小时后，通过颈脱位法处死小鼠，取出卵块。将取出的卵块在含有0.3mg/ml透明质酸酶(SIGMA)的M2培养基中在37℃温育10分钟，收集未受精卵。在灌注固定前，从用于免疫染色的mPGK2和Fthl17的转基因小鼠提取附睾。从附睾的尾部收集精子。将收集的精子置于37℃、5％CO₂培养箱中的TYH培养基(体外受精培养基)中，并进行活化。此后，将精子加入含有未受精卵的TYH培养基中。使混合物在相同的5％CO₂培养箱中静置6小时。此后，洗涤卵，并转移至胚胎培养基WM，随后在37℃、5％CO₂培养箱中温育过夜。次日，仅将处于2-细胞期的卵移植进假孕的ICR小鼠的输卵管中。

<使用mRNA确认基因表达>

使用TRIzol试剂(Invitrogen)，从转基因小鼠#2的尾巴提取mRNA。使用SuperScript III(Invitrogen)和Oligo-dT引物，通过逆转录提取的mRNA，得到cDNA，随后使用Neo-F引物(GCTCGACGTTGTCACTGAAG)(SEQ ID NO.79)和Neo-R引物(CCAACGCTATGTCCTGATAG)(SEQ ID NO.80)进行PCR。由此，确定是否存在mRNA表达。使用Ex-Taq聚合酶(TAKARA)进行PCR。

<使用Cre重组酶分析重组效率>

利用pBluescript II，生产了lox66和lox71之间的区域的序列作为靶向载体(图18)。在有1mg/ml BSA存在的情况下，使生产的200ng载体与Cre重组酶(BD Biosciences)在Cre反应缓冲液(BDBiosciences)中在室温反应2小时。反应后，在70℃温育5分钟，以灭活Cre重组酶。对反应溶液进行热激，以将细胞转化成感受态细胞。将转化的细胞铺平板到LB-Amp平板(将1.5％琼脂粉(NacaliTesque)加入LB培养基中，随后高压灭菌，然后补充100μg/mL氨苄青霉素(SIGMA))上。次日，挑取菌落。在LB-Amp培养基中培养菌落，然后提取质粒。使用ABI测序仪3100，基于质粒的测序结果，确认重组。

生产转基因小鼠的一个目的是，确定对精子发生阶段特异性的突变型Pold1的超表达是否可以调节进化速度。

而且，认为通表达Cre重组酶，可以在具有loxP序列的小鼠中控制对精子发生阶段特异性的表达。因此，尝试生产了2种转基因小鼠：转基因小鼠#1，其可以特异性地在精子发生阶段表达突变型Pold1和Cre重组酶，和转基因小鼠#2，其利用loxP序列，允许组织-特异性地超表达突变型Pold1(图9)。

(a)转基因小鼠#1

转基因小鼠#1特异性地在精子发生阶段表达突变型Pold1和Cre重组酶。为了生产这样的小鼠，重要的是选择能在精予发生阶段引起基因表达的启动子。已经表明，在小鼠的睾丸中，DNA聚合酶δ是在精原细胞阶段表达的，且从初级精母细胞阶段直到减数分裂的前半部分时(Dia Kamel，等，(1997)Biology of Reproduction，57，1367-1374)。

因此，设想利用能在精原细胞阶段或初级精母细胞阶段引起表达的启动子。小鼠磷酸甘油酸激酶2(mPGK2)基因启动子经常用于初级精母细胞中的超表达(Nadia A.Higgy，等，(1995)Dev.Genetics，16，190-200)。mPGK2启动予用作能特异性地在精子发生阶段引起表达的启动子的候选物。还设想利用能促进比mPGK2启动子更早的精子发生的精原细胞阶段的表达的启动子。但是，基本上没有报道能实现精原细胞阶段或初级精母细胞阶段特异性地表达的启动子。因此，通过PCR克隆已经报道能特异性地在精原细胞中表达的基因上游的序列，尝试开发对精子发生阶段特异性的新启动子。在已经通过cDNA扣除方法(P.Jeremy Wang，等，(2001)，Nature Genetics，27，422-426)发现的能特异性地在精原细胞中表达的基因中，选择了铁蛋白重型多肽样17(Fthl17)基因。使用位于该基因上游的约5.7kbp的序列(SEQID NO.81)作为能特异性地在精原细胞阶段表达的启动子。使用上述的2个对精子发生阶段特异性的启动子来为转基因小鼠#1生产载体。图9示意性地显示了实际生产的载体。生产了这样的载体，其中突变型Pold1基因和Cre重组酶通过IRES(内部核糖体进入位点)的序列相连，且该基因由预期会特异性地在精子发生阶段引起表达的启动子同时表达。

将生产的载体的DNA显微注射进受精卵的原核中，以生成转基因小鼠。使用对Cre重组酶特异性的引物，通过PCR确定在新生的小鼠中是否存在转基因(图10)。结果，对于mPGK2启动子，存在2个转基因小鼠系(在46个新生儿中)，而对于Fthl17上游的序列，存在一个转基因小鼠系(在27个新生儿中)。从它们的外观，不能将新生的转基因小鼠与正常的小鼠区分开。为了分析启动子的表达区，提取mPGK2(出生后14周龄)和Fthl17(出生后13周龄)的F₀代中的转基因小鼠的睾丸，随后使用小鼠抗-Cre重组酶单克隆抗体进行免疫染色(图11)。在图11中，使用DAB进行第二抗体的显色(黑褐色)，随后用甲基绿进行对比染色，以对细胞中的RNA染色(蓝绿色)。同样在对照中，在生精小管的基板中观察到了强烈的黑褐色显色。这是背景色，因为第一抗体是小鼠的。在该免疫染色的结果中，生精小管内的黑褐色显色指示着外源Cre重组酶的表达位点。根据图儿，确认了Cre重组酶在使用mPGK2启动子的转基因小鼠和使用Fthl17上游的序列的转基因小鼠的睾丸的生精小管中表达。因而，这暗示着Fthl17上游的5.7-kbp区序列具有启动子活性的可能性。另外，在使用Fthl17上游的序列的转基因小鼠的睾丸中的Cre重组酶的染色结果中，显色比使用mPGK2启动子时弱。因而暗示着，Fthl17上游的序列具有低于mPGK2启动子的启动子活性(表达能力)。Russel等进行了小鼠、大鼠和狗的睾丸的组织学分析，并总结出了将精子发生阶段彼此区别开的标准(Russell LD，Ettlin RA，Hikim APS，Cleggand ED.(1990)，Histological and HistopathologicalEvaluation of Testis.，Clearwater，FL：Cache River Press)。据此，进行了深入分析，以确定在精子发生的什么阶段，上述的2个启动子在转基因小鼠#1的染色图像中表达。在mPGK2启动子的情况下，主要在初级精母细胞的第二阶段观察到表达(图12)。在与常规考虑区不同的区域，观察到了表达。在Fthl17上游的序列用作启动子的情况下，从初级精母细胞阶段至精原细胞阶段观察到了表达(图13)。根据染色的结果，难以将精原细胞中的表达与背景(染色的基板)区分开，所以不能确定是否存在表达。

上述的新生的F₀代包括使用mPGK2启动子的转基因小鼠(雄性1，雌性2)和使用Fthl17上游的序列的转基因小鼠(雄性1)。将每只雄性的睾丸用作免疫染色的样品。F₀代雄性用于从出生后9周龄开始繁殖交配的免疫染色。实际交配的结果总结在表4(A)中。

表4(A)

	交配的雌性的数目	怀孕的雌性的数目	怀孕率
	交配的雌性的数目	怀孕的雌性的数目	怀孕率	mPGK2	10	0	0％
Fthl17	10	6	60％	mPGK2	10	0	0％

在表4(A)中，将腹部变大的雌性记作怀孕的雌性。在使用mPGK2启动子的雄性转基因小鼠的情况下，尽管确定了有些雌性在交配后怀孕，但该雌性最终没有产下新生儿。当进一步进行免疫染色时，麻醉转基因小鼠，并在灌注固定前提取其附睾。使用从附睾得到的精子进行人工授精(表4(B))。

表4(B)

	未受精卵的数目	2-细胞期的数目	新生儿的数目
	未受精卵的数目	2-细胞期的数目	新生儿的数目	mPGK2	23	0	0
Fthl17	22	8	？	mPGK2	23	0	0

从任一种小鼠收集的精子都能侵入未受精卵。在观察的任何精子中，都没有发现异常。在使用Fthl17上游的序列的转基因小鼠的情况下，有些卵在人工授精后以低于通常的速度发展到2-细胞期。确认了新生儿是由已经移植进了卵的替代母亲所生。但是，在使用mPGK2启动子的转基因小鼠的情况下，有些受精卵在人工授精后发展到原核期，但是没有卵在人工授精后达到2-细胞期。因此，暗示着使用用于免疫染色的mPGK2启动子的雄性转基因小鼠在精子发生中具有异常的可能性。应当注意，在以与正常的小鼠类似的方式生育新生儿的使用mPGK2启动子的F₀代雌性中没有特别地发现异常。

(b)转基因小鼠#2

通过与能以组织特异性的方式表达Cre重组酶的小鼠交配，得到了转基因小鼠#2，从而使突变型Pold1以组织特异性的方式超表达。为此，生产了这样的载体，其序列包含用于全身超表达的CAG启动子、被2个loxP序列夹在中间的新霉素抗性基因和与其相连的突变型Pold1(图9)。将指示着转录终止的聚腺苷酸信号添加到新霉素抗性基因的末端。因此，通过Cre重组酶的组织-特异性的表达，可以启动突变型Pold1的表达。如在转基因小鼠#1中那样，生产转基因小鼠#2。利用PCR，使用对新霉素抗性基因特异性的引物(图10)，确认了4个系(在20个新生儿中)是转基因小鼠。在4个转基因小鼠系中，3个系的F₀代小鼠表现出与正常的小鼠类似的生长。因此，可以认为在小鼠中基本上没有发生异常，即使根据本发明调节了遗传性状的转化率。

从转基因小鼠#2的3个存活系的尾巴提取mRNA，随后使用对新霉素抗性基因特异性的引物，进行RT-PCR。结果，确认了新霉素抗性基因的表达。

(生产靶向小鼠)

尝试生产有条件的靶向小鼠，其中正常的Pold1基因被以组织-或时间-特异性的方式替换为突变型Pold1基因，且尽可能地维持原始DNA聚合酶δ的表达方式。在使用Cre重组酶的重组情况下，如果连接了2个loxP序列，从而使它们彼此相向，则在这2个loxP序列之间会发生重组，从而使被loxP序列夹在中间的区域可以反转，即替换为反向区。但是，如果这2个loxP序列仅仅彼此相向，则替换是可逆的反应过程。为了使重组反应过程不可逆，可以将突变导入loxP序列-(lox66，lox71)的一部分，如Kimi Araki，等，(1997)，Nucleic Acids Res.，25，868-872所述。

使用突变的loxP序列，生产了有条件的靶向小鼠。提供了lox66和lox71，并使其彼此相向。将正常的外显子10的序列和与含有突变型Pold1的突变位点的突变型外显子10互补的序列连接到序列中(图14)。使用这样的载体来生产靶向小鼠。预期，如果由于Cre重组酶的表达，在2个lox序列之间发生重组，那么在剪接中使用的外显子10会从正常型变成突变型(图15)。由此，由于Cre重组酶的表达，正常型内源DNA聚合酶δ会被替换为突变型。当生产靶向载体时，制备了外显子10，从而使位于其相对末端的内含子部分含有剪接所必需的序列。

但是，lox66和lox71序列含有突变。因此，认为由于Cre重组酶造成的重组效率低于使用正常的loxP序列时的重组效率。为了研究当lox66和lox71序列彼此相向时，是否适当地发生反应，使用Cre重组酶自身进行重组。为此，利用pBluescript II生产了含有位于lox66和lox71(称作lox66-71重组体序列)之间的2个外显子10的序列。通过使序列与Cre重组酶反应，研究了重组效率。使用用于转基因小鼠#2的载体序列作为关于反应发生的阳性对照实验。结果，使用Cre重组酶的反应在15分钟内造成了50％的质粒的重组，在2小时内为100％。当反应相对于lox66-71重组体序列进行了2小时时，确认了正常的重组处于较低的频率(1/3)。因而，确信重组发生在lox66-71重组体序列中。

(调节遗传性状的转化率)

当使这些小鼠暴露于转化遗传性状的步骤(例如，高温，高湿度，高盐浓度，等)时，与正常的小鼠相比，能适应环境的个体的数目显著增加。

根据该实施例的方法，揭示了通过缺失DNA聚合酶δ的校对活性，可以使不均衡突变积累在前导的和后随的DNA链。还揭示了通特异性地在精子发生阶段表达具有突变的DNA聚合酶，可以尽可能多地降低小鼠全身发生突变的速度。还揭示了可以尽可能多地抑制遗传操纵等造成的二次影响。在该实施例中，实现了能满足上述要求的不均衡进化小鼠。

在转基因小鼠#1的情况下，可能研究特异性地在精子发生阶段表达的启动子。大多数目前已知特异性地在精子发生阶段表达的启动子是特异性地在减数分裂后的精子细胞阶段表达的。在该实施例中，意在使用特异性地在复制DNA链的精原细胞阶段或初级精母细胞阶段的雄性生殖细胞中表达的启动子。mPGK2启动子是能满足该条件的唯一启动子。因此，在该实施例中，尝试使用Fthl17基因上游的序列作为新的启动子。结果，确认至少在初级精母细胞阶段表达。对于精原细胞，使转基因小鼠#1与可得到的CAG-CAT-GFP转基因小鼠(使用具有与这里生产的转基因小鼠#2相似的结构的载体，生产的转基因小鼠；且在该小鼠中，GFP的表达是由Cre重组酶的表达启动的)交配，以便认为GFP能在表达Cre重组酶的转基因小鼠#1的区域表达。因此，结合GFP表达区和Cre重组酶表达区的结果，可能分析该实施例的启动子的表达区。应当指出，Fthl17上游的序列不含有基础转录因子结合序列，例如TATA盒等。

在mPGK2启动子的表达中，没有观察到在与常规报告相比较迟阶段的精子发生阶段后的表达。

暗示着用转基因小鼠#1生产的2种转基因小鼠具有不同的表达区。因此，认为为了调节转化率，使用这些小鼠来对比各区域的表达效率是有用的。生产能特异性地在精子发生阶段表达Cre重组酶的转基因小鼠，使利用以组织特异性的方式发生的loxP序列的重组得到调节基因缺陷型小鼠成为可能。因此，这样的小鼠可以用作研究生殖细胞的材料。

可以使转基因小鼠#2与能以组织特异性的方式表达Cre重组酶的小鼠交配，以实现以组织特异性的方式超表达突变型Pold1。在转基因小鼠#1中，当启动子的表达停止时，突变型Pold1的表达不再发生。通过上述的交配，突变型Pold1的表达可以在启动子的表达结束后继续进行。另外，通过与转基因小鼠(其中特异性地在组织例如脑、肝等中表达Cre重组酶)交配，可以在体细胞水平研究超表达的影响。

根据该实施例的结果，应当明白可以在敲除的小鼠中调节遗传性状的转化率。

(实施例5：使用稻作为植物，生产突变的生物)

接着，在实施例5中，使用稻(植物)作为代表性的真核生物来生产不一致突变的生物。

基因靶向技术描述在，例如，Yagi T.等，Proc.Natl.Acad.Sci.USA，87：9918-9922，1990；″Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]″，Takeshi Yagi，编，Special issue，Jikken Igaku[Experimental Medicine]，2000，4。在实施例4中，生产了含有具有不一致DNA复制校对能力的复制复合物的植物(Morrison，A.，等，Mol.Gen.Genet.，242：289-296，1994)。

要修饰的遗传性状是疾病抗性(稻瘟病)和低温抗性。

(基因靶向技术)

制备了具有突变的DNA聚合酶(pol)的靶向载体(Morrison，A.，等，Mol.Gen.Genet.，242：289-296，1994)。使植物细胞(例如愈伤组织等)进行关于植物细胞的pol基因的同源重组。此后，使细胞分化成植物体。

(方案)

(1.制备愈伤组织细胞)

以描述在例如Plant Tissue Culture：Theory and Practice，Bhojwani，S.S.和Razdan，N.K.，Elsevier，Amsterdam，1983中的众所周知的技术，制备了愈伤组织细胞。具体地，从植物体制备了愈伤组织细胞(Davies，R.，1981，Nature，291：531-532和Luo，Z.，等，Plant Mol.Bio.Rep.，7：69-77，1989)。

(2.pol基因的同源重组)

为了有效地得到同源重组细胞，使用用于小鼠的基因靶向方法(即，正/负方法)进行同源重组(Yagi，T.，等，Proc.Natl.Acad.Sci.USA，87：9918-9922，1990；Capecchi M.R.，Science，244(16)，1288-1292，1989)。

制备靶向载体：通过描述在例如Molecular Cloning，第2版，Sambrook，J.，等，同上，和Ausubel，F.M.，Current Protocols inMolecular Biology，Green Publishing Associates and Wiley-Interscience，NY，1987，同上中的技术，制备了靶向载体。

在靶向载体中，将突变Polδ和/或polε基因插入在正基因和负基因之间。将潮霉素抗性基因用作正基因，而将白喉毒素用作负基因(Terada R.，等，Nature Biotech.，20：1030-1034，2002)。

对于Pol突变，将碱基突变导入Polδ的校对活性位点，以缺失校对活性(在SEQ ID NO.48的位置320处的D和在位置322处的E被取代为丙氨酸(A))(Morrison A.& Sugino Al，Mol.Gen.Genet.242：289-296，1994；Goldsby R.E.，等，Pro.Natl.Acad.Sci.USA，99：15560-15565，2002)。

(3.将载体导入愈伤组织细胞)

通过描述在例如“Shokubutsu BaiotekunorojiII[PlantBiotechnology II]”，Yasuyuki & Kanji Ooyama，编，TokyoKagakudojin，1991中的技术，将载体导入愈伤组织细胞。在实施例5中，通过电穿孔方法、土壤杆菌方法等，将载体导入愈伤组织细胞。在含有潮霉素(100μg/ml，Invitrogen)的DMEM培养基(FlowLaboratory)中进行培养。

(4.回收重组细胞)

在有潮霉素存在的情况下培养后，回收重组细胞(Terada R.，等，Nature Biotech.，20：1030-1034，2002)。

(5.确认同源重组体)

从重组体提取基因组DNA。通过DNA印迹和/或PCR，确定突变体pol是否成功地导入了ES细胞(″Gintagettingu noSaishingijyutsu[Up-to-date Gene Targeting Technology]″，Takeshi Yagi，编，Special issue，Jikken Igaku[ExperimentalMedicine]，2000，4)。

(6.生产植物体)

以描述在例如“Shokubutsu Baiotekunoroji II[PlantBiotechnology II]”，Yasuyuki & Kanji Ooyama，编，TokyoKagakudojin，1991；和″Shokubutsu Soshikibaiyo no Gijyutsu[Plant Tissue Culture Technique]″，Masayuki Takeuti，TetsuoNakajima，& Riki Kotani，编，Asakura Shoten，1988中的方法，生产了植物体。在实施例5中，使愈伤组织分化成植物体。此后，使用源自花药、种子等的单倍体细胞和/或通过杂交植物制备出的同型二倍体细胞，使用本领域众所周知的技术(Maki，H.等，J.Bacteriology，153(3)，1361-1367，1983；Miller，J.H.，1992，A Short course in bacterial genetics，Cold Spring HarberLaboratory Press，Cold Spring Harber，N.Y.)，确认pol突变(增变株突变)的性质。

(结果)

发现在实施例5中得到的具有突变的植物与通过常规技术得到的植物相比可以迅速获得低温抗性和疾病抗性(例如，稻瘟病，等)。修饰的细胞具有与自然产生的细胞基本上相同的生长速度，但是，修饰的细胞的突变率是每代2个或更多个，这与常规的突变显著不同。

(实施例6：在拟南芥中示范)

接着，使用拟南芥生产突变的生物。

(方法和材料)

(PolδcDNA克隆)

使用下列来自源自拟南芥根的总mRNA的引物，通过PCR扩增polδ(Atlg42120)(SEQ ID NO.90(核酸序列)和SEQ ID NO.91(氨基酸序列))，并亚克隆进pBluescript SK2(TOYOBO)。

Xba1-42120-F：5′-CTGAGTCTAGATTTCCCGCCATGGAAATCG-3′(SEQID NO.：82)

2g42120-Sac1-R：5′-AGCAACGAGCTCTTATGATTGGTTTATCTG-3′(SEQ ID NO.：83)

(生产突变型Polδ基因Polδ(D316A)(SEQ ID NO.92(核酸序列)和SEQ ID NO.93(氨基酸序列)))

使用下列引物，导入点突变，以将polδcDNA中氨基酸316从D改变至A。

2g42120-D316A-F：5′-ATTTGCTGTCGATAATATCAGATTTCTTGG-3′(SEQ ID NO.：84)

2g42120R：5′-GAGTGAGGATTTGTACATGATCTGAAGG-3′(SEQ IDNO.：85)

(生产用于转化的载体)

通过修饰pBI121(CLONTECH)，生产了能在植物中始终如一地表达基因的二元质粒。使用限制酶XbaI和SacI，提取pBI121的β-葡糖醛酸糖苷酶基因，并取代为Polδ(D316A)(下文称作Polδ(D316A))。

生产了上述的pBIl21(下文称作GUS)和含有取代5-葡糖醛酸糖苷酶基因的GTP的pBIl21(下文称作GTP)，作为转化对照的载体。

(生产愈伤组织)

在发芽培养基上散布拟南芥(副本：Columbia)的种子，随后在4℃低温处理2或3天。此后，将平板转移进培养箱(22℃)。使种子在暗处生长10天。将伸长的下胚轴切成约1-cm长的片段，依次将其置于CIM培养基上10天。得到愈伤组织。

(使用土壤杆菌转化愈伤组织)

将含有具有GUS或GTP或Polδ(D316A)的二元质粒的土壤杆菌pMP90接种到补充了50mg/L卡那霉素的LB培养基中，随后在28℃振荡培养2天。在台式离心机中离心1.4ml土壤杆菌培养物(OD600＝约0.8)5分钟，以收集细菌。将细菌悬浮到1ml AIM(下述)中。将愈伤组织化的下胚轴片段转移到含有5ml AIM的60-mm培养皿中。向培养皿中加入1ml土壤杆菌悬浮液，随后在室温振荡培养约20分钟。将愈伤组织置于无菌滤器上，以除去多余的水分，此后，转移到新的CIM平板上。3天后，将转化的愈伤组织转移到含有AIM的60-mm培养皿中。将培养皿在60rpm旋转25分钟，随后洗涤5次。

洗涤后，将愈伤组织置于滤器上，以去除水分，并在含有50mg/L羧苄青霉素和50mg/L卡那霉素的CIM培养基中生长(下述)(CIM培养基由发明人制备)。

应当指出，愈伤组织的转化率是95％或更高(仅测量了其中导入了GTP的愈伤组织；并检查了GTP荧光是否存在)。

(传代培养愈伤组织和筛选突变体)

每10天将愈伤组织转入新的CIM平板。在该情况下，一块愈伤组织被分成2块。一半置于CIM平板中进行传代培养，而另一半则置于平板中，用于在各种条件下筛选抗性突变体。

将200mM或300mM NaCl加入筛选平板。每10天进行传代培养和筛选。

(培养基的组成)

发芽培养基(1升)：

Murashige最低有机培养基(GIBCO BRL) 1/2包

蔗糖 10g

Gelllan Gum(Wako Pure Chemical Industries) 5g

(CIM(1升))

Gamborg氏B5培养基盐混合物(Nihon Pharmaceutical) 1包

葡萄糖 20g

肌醇 100mg

5％Mes-KOH(pH5.7) 10ml

Gelllan Gum 5g

高压灭菌后，加入下列物质：

盐酸硫胺素 20mg

烟酸 1mg

盐酸吡哆醇 1mg

生物素 10mg

2，4-D 0.5mg

激动素 0.05mg

(AIM(1升))

Gamborg氏B5培养基盐混合物(Nihon Pharmaceutical) 1包

葡萄糖 20g

5％Mes-KOH(pH5.7) 10ml

(结果)

结果，使用的上述基因(GFP，GUS(转化对照)，polδ(D316A))中的每一种都有95％或更高的转化率(仅测量了其中导入了GTP的个体；并检查了GTP荧光是否存在)。

(进化条件)

使在该实施例中得到的植物暴露于用于改变下列遗传性状的条件。

在下述条件下，筛选突变体。

1)37℃，将平板置于37℃的培养箱中。

2)200mM NaCl，将200mM NaCl加入培养基中，并使植物在22℃生长。

3)300mM NaCl，将300mM NaCl加入培养基中，并使植物在22℃生长。

(筛选突变体的结果)

下面将描述每种处理的结果。下表中从左向右的数字表示：像未处理的愈伤组织一样生长的愈伤组织的数目(抗性的)/不能良好生长但是也不会死亡的愈伤组织的数目(弱抗性的)/死亡的愈伤组织的数目(易感的)。

处理	GFP	polδ
处理	GFP	polδ	37℃200mM NaCl300mM NaCl	0/24/270/20/1450/0/165	1/18/100/58/1120/4/146

如上所述，对高温抗性的植物的数目有所增加。另外，对于盐浓度，对200mM NaCl抗性的愈伤组织(polδ)的数目大于对照。因此，表明本发明的方法可以赋予植物对高盐浓度的抗性。具体地，在300mM NaCl的情况下，对照不能获得抗性，而本发明的方法能赋予抗性。

(实施例7：使用拟南芥的系列抗性实验)

接着，确定了遗传性状(例如抗性)是否能在数代中传递。进行该实验的条件与在实施例6中使用的相同。

下面描述了个体的数目。

表5使用拟南芥愈伤组织的盐抗性实验的结果

<实验的愈伤组织的数目>

质粒的类型	200mM NaCl	300mM NaCl
质粒的类型	200mM NaCl	300mM NaCl	突变体polδ	75	75
GTP	96	95	突变体polδ	75	75
GTP	96	95	GUS	75	68

<筛选方法>

生产了愈伤组织。将生长至一定程度的愈伤组织分成2半。一半在正常培养基中生长至原始大小，而在选择性培养基中培养另一半，以测试抗性的获得。当在正常培养基中的愈伤组织生长良好时，将一半转移到正常培养基中，而将另一半转移到选择性培养基中，进行第二次筛选。共进行6次筛选。在300mM NaCl的情况下，没有得到抗性愈伤组织。因此，所有实验都是关于200mM NaCl进行的。

图16示意性地显示了实验。

<不连续实验>

计数在6次筛选中不连续发生的抗性愈伤组织的数目。将曾经获得抗性但会丢失的愈伤组织视作假阳性的。

表6不连续实验的结果

质粒的类型	200mM NaCl抗性愈伤组织的数目
质粒的类型	200mM NaCl抗性愈伤组织的数目	突变体polδ	8
GTP	6	突变体polδ	8
GTP	6	GUS	6

<连续实验>

为了去除假阳性结果，计数连续获得抗性的愈伤组织的数目。在高达第6次筛选中具有抗性的愈伤组织的数目如下表所示。

表7

质粒的类型	200mM NaCl抗性愈伤组织的数目
质粒的类型	200mM NaCl抗性愈伤组织的数目	突变体polδ	1
GTP	0	突变体polδ	1
GTP	0	GUS	0

因而，仅仅具有突变体polδ的株连续表现出抗性。该株维持抗性超过了第6代。这表明本发明在稳定性以及遗传性状的转化率方面优于常规技术。

(实施例8：使用ES细胞的实验)

接着，确定了本发明是否可以应用于ES细胞。方法如下所述。

<制备ES细胞>

培养源自C57BL/6和CBA F1小鼠胚胎的ES细胞系(TT-2细胞)(由Osaka University的Yagi实验室根据一般方案制备)，并在ES细胞培养基(ESM)(含有20％FBS、0.1mM NEAA、1mM丙酮酸、LIF(ESGRO^_，Amrad)和巯基乙醇的DMEM)中、在饲养细胞上繁殖。

如下所述制备导入的载体(图17)。将突变体pold1、正常的Pold1或EGTP基因的cDNA整合进pcDNA 3.1(+)中，后者是蛋白表达载体。进行限制酶消化，以得到线性的DNA片段，后者再用于要导入的基因。使用0.25％胰蛋白酶溶液，取出繁殖的ES细胞。将ES细胞置于比色皿(cuvette)中，其比率为2.0×10⁶ES细胞/比色皿。使细胞与100μl 25nM载体DNA溶液混合，随后通过电穿孔进行基因导入。

电穿孔后，使用ESM培养细胞48小时。此后，在补充了G418(终浓度：200μg/mL)(SIGMA)的ESM培养基中培养细胞。由此，将导入了基因的细胞分组。在明胶包被的平板上进行培养。此后，在有青霉素-链霉素(可商业上获得的产品(GIBCO)的100倍稀释物)存在的情况下，培养ES细胞。

<6TG测定>

将繁殖的和胰蛋白酶(2.5％，GIBCO)处理过的ES细胞散布到10-cm培养皿上，达到5.0×10⁶细胞/培养皿。在有6-TG(终浓度：2μg/ml；Sigma，测试的杂交瘤)和G418存在的情况下，将抗性菌落分组。在该分组中，在明胶包被的培养皿(将0.1％明胶溶液置于FALCON353003细胞培养皿中，随后在37℃温育30分钟(明胶可从SIGMA得到))上培养细胞。每2天更换一次培养基。将散布细胞的当天当作第0天。在第11天计数菌落数目。只计数繁殖良好且生长的菌落。

<实验结果>

有指定为#1和#2的2批突变体pold1，对它们分别进行电穿孔。在每种情况下，使用6个10-cm培养皿，并记录抗性菌落的外观。菌落的数目如下所示(0×6代表着其上面没有出现菌落的6个培养皿)。

突变体pold1 3×1，1×2，0×9

野生型Pold1 0×6

EGTP对照 0×6

根据该实施例的结果，仅仅在突变体Pold1的情况下观察到了生长的菌落。对于得到的菌落，可以对HGPRT基因(它是突变的靶)进行部分测序，以确认突变的导入。

因而，表明突变体Pold1基因的超表达有利于将突变导入小鼠ES细胞。因此，证实了可能调节ES细胞的遗传性状的转化率，并增加比率和稳定性。

(实施例9：革兰氏阳性的细菌)

在该实施例中，作为示例性的革兰氏阳性的细菌，将枯草芽孢杆菌用作导入突变的宿主细胞。在突变中，分别位于位置425和427的天冬氨酸和谷氨酸在如SEQ ID NO.15所述的聚合酶C中突变。通过质粒(pHY300PLK，TAKARA)，将该聚合酶C突变体导入枯草芽孢杆菌中。此后，在进化条件下，暴露细菌。

生产突变体后，例如，将中等高温(例如，42℃)逐渐增加到50℃或更高。

枯草芽孢杆菌是一种已经得到充分研究的土壤细菌。其生长温度是20-50℃(该细菌在pH6-7、30分钟倍增)。

如上所述，在进化条件下，该实施例的有些芽孢杆菌株可以在高达55℃存活。该株能在传代培养中维持该性质。

因此，表明可可能节具有与大肠杆菌不同的DNA复制机制的细菌的进化速度。

(实施例10：分离基因)

在实施例10中，分离了在改变遗传性状中起作用的基因。分离了实施例1的获得抗药性的生物。此后，在修饰前的原始生物和修饰的生物中，确定了参与抗药性的基因的序列。结果，发现修饰了促旋酶(或拓扑异聚合酶(topoisopolmerase)II)亚基A和拓扑异构酶IV基因。使用合适的引物，通过PCR扩增这些序列，并分离全长基因。从原始的和修饰的基因中，合成了多肽，并测量了其活性。结果，发现的确改变了活性。因而，已经证实，本发明的方法可以在基因水平迅速导入突变。

(实施例11：分离新产物物质)

在实施例11中，分离了通过修饰得到的新产物物质。分离了实施例1的获得抗药性的生物。此后，通过色谱分析(例如，HPLC，等)，鉴别出在修饰前的原始生物中不存在、但是在修饰的生物中存在的物质。分离新产物物质。结果，发现促旋酶(或拓扑异聚合酶II)亚基A和拓扑异构酶IV基因产物是新产物物质。因而，已经证实，本发明的方法实际上可以用于生产新产物物质。

(实施例12：修饰倾向于错误的频率的其它方法)

除了上述的突变外，可能导入会削弱聚合酶δ和ε的聚合酶部分的活性的突变，以减少DNA复制的精确度。

(实施例13：倾向于错误的频率和进化速度之间的关系)

作为对照，在如实施例1所述的酵母获得抗药性、乙醇抗性和高温抗性的实验中，进行了导入突变的常规方法(辐射，化学处理，等)。结果，本发明的抗性获得速度显著高于常规技术。当同时开始2个实验时，通过本发明可以比常规技术更早地获得抗性株。

在实施例13中，使用包含逐步改变的突变率的方法来对比获得抗性所需的时间。结果，可以得到进化速度。

尽管本文已经描述了某些优选的实施方案，但并不意味着这些实施方案可以用于限制本发明的范围，除了如所附的权利要求书所述的之外。在阅读本说明书后，各种其它修饰和等同方案对本领域的技术人员而言是显然的，且能容易地实现，而不脱离本发明的范围和精神。本文引用的所有专利、公开的专利申请和出版物都引作参考，如同在本文中完整描述。

工业适用性

根据本发明，与常规方法相比，可以将需要的性状迅速地赋予生物，且基本上没有副作用。另外，根据本发明，通过简单的操作可以修饰生物的遗传性状。由此，可能有效地获得通过常规方法不能得到的有用的生物、基因、基因产物、代谢物等。

序列表

<110>Neo-Morgan Laboratories Inc。

FURUSAWA，Mitsuru

<120>用于将需要的性状迅速赋予生物的方法和系统

<130>NE0001PCT

<150>JP 2003-92898

<151>2003-03-28

<150>US 10/684,141

<151>2003-10-10

<160>95

<170>PatentIn Ver.2.1

<210>1

<211>3551

<212>DNA

<213>啤酒糖酵母(Saccharomyces cerevisiae)

<400>1

acgcgtaact ttttattcta taaaatgttc aatgaggaca tctgctattc gcttatgaag 60

aacaaacact cagtactact gatctaaggc aattttcaag gataaaggaa aatagatatt 120

gagcacttgc tattaagcat taatctttat acatatacgc acagcaatga gtgaaaaaag 180

atcccttccc atggttgatg tgaagatcga tgacgaggat actccccagt tggaaaagaa 240

aatcaaacgg caatcaatag atcatggtgt tggaagtgaa cctgtttcaa caatagagat 300

tattccgagt gattcttttc gaaaatataa tagtcaaggc ttcaaagcaa aggatacaga 360

tttaatgggt acgcaattag agtctacttt tgaacaagag ctatcgcaaa tggaacatga 420

tatggccgac caagaagagc atgacctgtc atcattcgag cgtaagaaac ttccaaccga 480

ttttgaccca agtttgtatg atatttcttt ccaacaaatt gatgcggaac agagcgtact 540

gaatggtatc aaagatgaaa atacatctac cgtggtaagg ttttttggtg tcactagtga 600

aggacactct gtactttgta atgttacagg gttcaagaac tatctttacg tcccagcgcc 660

caattcttcc gacgctaacg atcaggagca aatcaacaag tttgtgcact atttaaacga 720

aacatttgac cacgctattg attcgattga agttgtatct aaacagtcta tctggggtta 780

ttccggagat accaaattac cattctggaa aatatacgtc acctatccgc atatggtcaa 840

caaactgcgt actgcgtttg aaagaggtca tctttcattc aactcgtggt tttctaacgg 900

cacgactact tatgataaca ttgcctacac tttaaggtta atggtagatt gtggaattgt 960

cggtatgtcc tggataacat taccaaaagg aaagtattcg atgattgagc ctaataacag 1020

agtttcctct tgtcagttgg aagtttcaat taattatcgt aacctaatag cacatcctgc 1080

tgagggtgat tggtctcata cagctccatt gcgtatcatg tcctttgata tcgagtgtgc 1140

tggtaggatt ggcgtctttc cggaacctga atacgatccc gtcatccaaa ttgccaacgt 1200

tgtgagtatt gctggcgcta agaaaccatt cattcgtaat gtgtttactc tgaatacatg 1260

ctcacccata acaggttcaa tgattttttc ccacgccact gaagaggaaa tgttgagcaa 1320

ttggcgtaac tttatcatca aagttgatcc tgatgttatc attggttata atactacaaa 1380

ttttgatatc ccttatcttt taaaccgtgc aaaggcgcta aaggtgaatg atttcccata 1440

ttttggaagg ttaaaaaccg ttaagcaaga aattaaagag tctgtgttct cttcgaaggc 1500

ttatggtaca agagaaacca aaaatgtcaa tattgacggc cgattacagt tggatctttt 1560

gcaatttatt cagcgtgagt ataaactaag atcctacacg ttgaatgcag tctctgcgca 1620

ctttttaggt gaacagaagg aggatgtaca ttatagcatc atttctgatc tacaaaatgg 1680

cgatagtgaa acaagaagaa ggttggccgt ttactgtttg aaagacgcct acctgccttt 1740

aaggcttatg gaaaaactaa tggcgttagt taactataca gaaatggctc gtgttacagg 1800

tgtgccattt tcatatttac tagctcgtgg tcaacaaatt aaagttgttt ctcaactatt 1860

tcgaaagtgc ctggagattg atactgtgat acctaacatg caatctcagg cctctgatga 1920

ccaatatgag ggtgccactg ttattgagcc tattcgtggt tattacgatg taccgattgc 1980

aactttggat ttcaattctt tatatccaag tattatgatg gcgcacaacc tatgttatac 2040

aacactttgt aacaaagcta ctgtagagag attgaatctt aaaattgacg aagactacgt 2100

cataacacct aatggagatt attttgttac cacaaaaaga aggcgtggta tattaccaat 2160

tattctggat gaattaataa gtgctagaaa acgcgctaaa aaagatctga gagatgagaa 2220

ggatccattc aaaagagatg ttttaaatgg tagacaattg gctttgaaga tttcagctaa 2280

ctctgtctat ggttttacag gagcgacggt gggtaaattg ccatgtttag ccatttcttc 2340

atctgttact gcttatggtc gtaccatgat tttaaaaact aaaaccgcag tccaagaaaa 2400

atattgtata aagaatggtt ataagcacga tgccgttgtg gtttacggtg acactgattc 2460

cgttatggta aagtttggta caacagattt aaaggaagct atggatcttg gtaccgaagc 2520

tgccaaatat gtctccactc tattcaaaca tccgattaac ttagaatttg aaaaagcata 2580

cttcccttac cttttgataa ataaaaagcg ttatgcaggt ttattctgga ctaatcctga 2640

caagtttgac aagttggacc aaaaaggcct tgcttctgtc cgtcgtgatt cctgttcctt 2700

ggtttctatt gttatgaata aagttttaaa gaaaatttta attgaaagaa atgtagatgg 2760

tgctttagct tttgtcagag aaactatcaa tgatattctg cataatagag tagatatttc 2820

aaagttgatt atatcaaaga cgttagcccc aaattacaca aatccacagc cgcacgccgt 2880

tttggctgaa cgtatgaaga ggagagaggg cgttggtcca aatgttggtg atcgtgtgga 2940

ctatgtcatt atcggtggta atgataaact ttacaataga gcagaagatc cattatttgt 3000

actagaaaac aatattcaag tggattcgcg ctattattta actaatcaat tacaaaatcc 3060

aatcattagt attgttgcac ctattattgg cgacaaacag gcgaacggta tgttcgttgt 3120

gaaatccatt aaaattaaca caggctctca aaaaggaggc ttgatgagct ttattaaaaa 3180

agttgaggct tgtaaaagtt gtaaaggtcc gttgaggaaa ggtgaaggcc ctctttgttc 3240

aaactgtcta gcaaggtctg gagaattata cataaaggca ttatacgatg tcagagattt 3300

agaggaaaaa tactcaagat tatggacaca atgccaaagg tgcgctggta acttacatag 3360

tgaagttttg tgttcaaata agaactgtga cattttttat atgcgggtta aggttaaaaa 3420

agagctgcag gagaaagtag aacaattaag caaatggtaa aaaacgatag ggtggcacat 3480

catattagga ttaagaaagg ctaacaactt tttgcatgtt ggtggatata tatgtatata 3540

taaatagata c 3551

<210>2

<211>1097

<212>PRT

<213>啤酒糖酵母(Saccharomyces cerevisiae)

<400>2

Met Ser Glu Lys Arg Ser Leu Pro Met Val Asp Val Lys Ile Asp Asp

1 5 10 15

Glu Asp Thr Pro Gln Leu Glu Lys Lys Ile Lys Arg Gln Ser Ile Asp

20 25 30

His Gly Val Gly Ser Glu Pro Val Ser Thr Ile Glu Ile Ile Pro Ser

35 40 45

Asp Ser Phe Arg Lys Tyr Asn Ser Gln Gly Phe Lys Ala Lys Asp Thr

50 55 60

Asp Leu Met Gly Thr Gln Leu Glu Ser Thr Phe Glu Gln Glu Leu Ser

65 70 75 80

Gln Met Glu His Asp Met Ala Asp Gln Glu Glu His Asp Leu Ser Ser

85 90 95

Phe Glu Arg Lys Lys Leu Pro Thr Asp Phe Asp Pro Ser Leu Tyr Asp

100 105 110

Ile Ser Phe Gln Gln Ile Asp Ala Glu Gln Ser Val Leu Asn Gly Ile

115 120 125

Lys Asp Glu Asn Thr Ser Thr Val Val Arg Phe Phe Gly Val Thr Ser

130 135 140

Glu Gly His Ser Val Leu Cys Asn Val Thr Gly Phe Lys Asn Tyr Leu

145 150 155 160

Tyr Val Pro Ala Pro Asn Ser Ser Asp Ala Asn Asp Gln Glu Gln Ile

165 170 175

Asn Lys Phe Val His Tyr Leu Asn Glu Thr Phe Asp His Ala Ile Asp

180 185 190

Ser Ile Glu Val Val Ser Lys Gln Ser Ile Trp Gly Tyr Ser Gly Asp

195 200 205

Thr Lys Leu Pro Phe Trp Lys Ile Tyr Val Thr Tyr Pro His Met Val

210 215 220

Asn Lys Leu Arg Thr Ala Phe Glu Arg Gly His Leu Ser Phe Asn Ser

225 230 235 240

Trp Phe Ser Asn Gly Thr Thr Thr Tyr Asp Asn Ile Ala Tyr Thr Leu

245 250 255

Arg Leu Met Val Asp Cys Gly Ile Val Gly Met Ser Trp Ile Thr Leu

260 265 270

Pro Lys Gly Lys Tyr Ser Met Ile Glu Pro Asn Asn Arg Val Ser Ser

275 280 285

Cys Gln Leu Glu Val Ser Ile Asn Tyr Arg Asn Leu Ile Ala His Pro

290 295 300

Ala Glu Gly Asp Trp Ser His Thr Ala Pro Leu Arg Ile Met Ser Phe

305 310 315 320

Asp Ile Glu Cys Ala Gly Arg Ile Gly Val Phe Pro Glu Pro Glu Tyr

325 330 335

Asp Pro Val Ile Gln Ile Ala Asn Val Val Ser Ile Ala Gly Ala Lys

340 345 350

Lys Pro Phe Ile Arg Asn Val Phe Thr Leu Asn Thr Cys Ser Pro Ile

355 360 365

Thr Gly Ser Met Ile Phe Ser His Ala Thr Glu Glu Glu Met Leu Ser

370 375 380

Asn Trp Arg Asn Phe Ile Ile Lys Val Asp Pro Asp Val Ile Ile Gly

385 390 395 400

Tyr Asn Thr Thr Asn Phe Asp Ile Pro Tyr Leu Leu Asn Arg Ala Lys

405 410 415

Ala Leu Lys Val Asn Asp Phe Pro Tyr Phe Gly Arg Leu Lys Thr Val

420 425 430

Lys Gln Glu Ile Lys Glu Ser Val Phe Ser Ser Lys Ala Tyr Gly Thr

435 440 445

Arg Glu Thr Lys Asn Val Asn Ile Asp Gly Arg Leu Gln Leu Asp Leu

450 455 460

Leu Gln Phe Ile Gln Arg Glu Tyr Lys Leu Arg Ser Tyr Thr Leu Asn

465 470 475 480

Ala Val Ser Ala His Phe Leu Gly Glu Gln Lys Glu Asp Val His Tyr

485 490 495

Ser Ile Ile Ser Asp Leu Gln Asn Gly Asp Ser Glu Thr Arg Arg Arg

500 505 510

Leu Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Met

515 520 525

Glu Lys Leu Met Ala Leu Val Asn Tyr Thr Glu Met Ala Arg Val Thr

530 535 540

Gly Val Pro Phe Ser Tyr Leu Leu Ala Arg Gly Gln Gln Ile Lys Val

545 550 555 560

Val Ser Gln Leu Phe Arg Lys Cys Leu Glu Ile Asp Thr Val Ile Pro

565 570 575

Asn Met Gln Ser Gln Ala Ser Asp Asp Gln Tyr Glu Gly Ala Thr Val

580 585 590

Ile Glu Pro Ile Arg Gly Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp

595 600 605

Phe Asn Ser Leu Tyr Pro Ser Ile Met Met Ala His Asn Leu Cys Tyr

610 615 620

Thr Thr Leu Cys Asn Lys Ala Thr Val Glu Arg Leu Asn Leu Lys Ile

625 630 635 640

Asp Glu Asp Tyr Val Ile Thr Pro Asn Gly Asp Tyr Phe Val Thr Thr

645 650 655

Lys Arg Arg Arg Gly Ile Leu Pro Ile Ile Leu Asp Glu Leu Ile Ser

660 665 670

Ala Arg Lys Arg Ala Lys Lys Asp Leu Arg Asp Glu Lys Asp Pro Phe

675 680 685

Lys Arg Asp Val Leu Asn Gly Arg Gln Leu Ala Leu Lys Ile Ser Ala

690 695 700

Asn Ser Val Tyr Gly Phe Thr Gly Ala Thr Val Gly Lys Leu Pro Cys

705 710 715 720

Leu Ala Ile Ser Ser Ser Val Thr Ala Tyr Gly Arg Thr Met Ile Leu

725 730 735

Lys Thr Lys Thr Ala Val Gln Glu Lys Tyr Cys Ile Lys Asn Gly Tyr

740 745 750

Lys His Asp Ala Val Val Val Tyr Gly Asp Thr Asp Ser Val Met Val

755 760 765

Lys Phe Gly Thr Thr Asp Leu Lys Glu Ala Met Asp Leu Gly Thr Glu

770 775 780

Ala Ala Lys Tyr Val Ser Thr Leu Phe Lys His Pro Ile Asn Leu Glu

785 790 795 800

Phe Glu Lys Ala Tyr Phe Pro Tyr Leu Leu Ile Asn Lys Lys Arg Tyr

805 810 815

Ala Gly Leu Phe Trp Thr Asn Pro Asp Lys Phe Asp Lys Leu Asp Gln

820 825 830

Lys Gly Leu Ala Ser Val Arg Arg Asp Ser Cys Ser Leu Val Ser Ile

835 840 845

Val Met Asn Lys Val Leu Lys Lys Ile Leu Ile Glu Arg Asn Val Asp

850 855 860

Gly Ala Leu Ala Phe Val Arg Glu Thr Ile Asn Asp Ile Leu His Asn

865 870 875 880

Arg Val Asp Ile Ser Lys Leu Ile Ile Ser Lys Thr Leu Ala Pro Asn

885 890 895

Tyr Thr Asn Pro Gln Pro His Ala Val Leu Ala Glu Arg Met Lys Arg

900 905 910

Arg Glu Gly Val Gly Pro Asn Val Gly Asp Arg Val Asp Tyr Val Ile

915 920 925

Ile Gly Gly Asn Asp Lys Leu Tyr Asn Arg Ala Glu Asp Pro Leu Phe

930 935 940

Val Leu Glu Asn Asn Ile Gln Val Asp Ser Arg Tyr Tyr Leu Thr Asn

945 950 955 960

Gln Leu Gln Asn Pro Ile Ile Ser Ile Val Ala Pro Ile Ile Gly Asp

965 970 975

Lys Gln Ala Asn Gly Met Phe Val Val Lys Ser Ile Lys Ile Asn Thr

980 985 990

Gly Ser Gln Lys Gly Gly Leu Met Ser Phe Ile Lys Lys Val Glu Ala

995 1000 1005

Cys Lys Ser Cys Lys Gly Pro Leu Arg Lys Gly Glu Gly Pro Leu Cys

1010 1015 1020

Ser Asn Cys Leu Ala Arg Ser Gly Glu Leu Tyr Ile Lys Ala Leu Tyr

1025 1030 1035 1040

Asp Val Arg Asp Leu Glu Glu Lys Tyr Ser Arg Leu Trp Thr Gln Cys

1045 1050 1055

Gln Arg Cys Ala Gly Asn Leu His Ser Glu Val Leu Cys Ser Asn Lys

1060 1065 1070

Asn Cys Asp Ile Phe Tyr Met Arg Val Lys Val Lys Lys Glu Leu Gln

1075 1080 1085

Glu Lys Val Glu Gln Leu Ser Lys Trp

1090 1095

<210>3

<211>7505

<212>DNA

<213>啤酒糖酵母(Saccharomyces cerevisiae)

<400>3

cgctctgccc tagttggaat gccatcgaac cacgaggatc ttggaatgga aaaccaccgc 60

cactgccatt tacgtttgca ttcatattcg cattaccttg gccattcacg ggcgtgttcc 120

tcggaatttg cattggtcgt tgctgttgtg gagtgtggga aaagcgatcg ttaacgccat 180

tctgctcact tgttgcatat gcgtacggat tataagacat cttggtatgg gcctttggtt 240

ttcgttttct gctattgata ctcagtagcg aggtcttaca atcgaaaagt caaaaagatg 300

agttgtagta taaaacaaca gctctggtgt gcaatatgga tcttgataca gagtctcgga 360

tatgctgttt tagcactgag aaaaagtaat agtaacactg tcagtgttcg tcaaaggccc 420

aagtttattg tcatttgaat tgtcagaatg gtttattttc aggtagggta accagaacgc 480

gtaagtttct tgcatctttt accattttaa ctggaagagg acctatcaaa aagagcatat 540

gatgatgaaa gagcacattc tatcaagata acactctcag gggacaagta tatgatgttt 600

ggcaagaaaa aaaacaacgg aggatcttcc actgcaagat attcagctgg caacaagtac 660

aacacactct caaataatta tgcgcttagc gcgcaacagc tcttaaatgc tagtaagatc 720

gatgacatcg attcgatgat gggatttgaa agatacgtac cgccgcaata caatggcagg 780

tttgatgcga aggatataga tcagattcca ggccgcgtag ggtggctgac gaacatgcac 840

gcaacgctgg tctctcagga aaccttatcc agtggtagta atggcggcgg caattcgaat 900

gacggagaac gtgtaacgac caaccaaggt atttccggag ttgacttcta ctttttagat 960

gaagagggtg ggagcttcaa gtcgacagtt gtctatgacc catacttctt tattgcgtgt 1020

aacgatgaat caagagtaaa tgatgtggag gaactagtga aaaaatatct ggaatcttgt 1080

ctcaaaagct tacaaatcat tagaaaggaa gatcttacca tggacaatca ccttttaggg 1140

ctgcagaaga cacttattaa gttatcattt gtaaattcca atcagttatt cgaggccagg 1200

aaactcctga ggccaatctt gcaggataat gccaataata atgtgcaaag aaatatatat 1260

aacgttgctg caaatggctc ggaaaaagtt gacgccaaac atctgatcga agatatcagg 1320

gaatatgatg tgccgtatca tgtccgagta tctatagaca aggacattag agtcggtaaa 1380

tggtataagg taactcaaca gggattcatt gaagatacta ggaaaattgc atttgccgac 1440

cctgtggtaa tggcatttga tatagaaacc acgaagccgc ctttaaaatt cccggattcc 1500

gccgtagatc aaataatgat gatttcgtat atgatcgatg gggaaggttt tttgataaca l560

aatagggaga taatctctga ggatattgaa gactttgagt atacaccgaa accggagtat 1620

cctggttttt tcaccatatt taacgaaaac gatgaagtgg cgcttctaca aaggtttttt 1680

gaacatataa gagatgtacg acccactgtt atatccacct tcaatggtga ctttttcgat 1740

tggcctttta tacataacag aagtaagatt cacggcttgg acatgttcga tgaaattggt 1800

ttcgctccag atgctgaagg tgagtacaag tcctcatact gctctcacat ggattgtttc 1860

cgttgggtga agcgtgattc ttatttacca caaggttccc agggtttaaa agctgttact 1920

caatctaagc taggttataa cccaattgaa ctggatcccg aattaatgac gccgtatgca 1980

tttgaaaagc cacagcacct ttccgaatat tctgtttccg atgcagtcgc tacgtattac 2040

ctttacatga aatatgttca tccttttatc ttttcccttt gtactattat tcctttgaac 2100

ccggatgaaa cattgagaaa gggtaccggt actttgtgtg aaatgttgtt gatggttcaa 2160

gcttatcaac ataatattct tctaccaaat aagcatacag atcccattga gaggttctat 2220

gatggacatc ttctagaatc cgagacttac gtgggtggac atgtggagtc attagaagct 2280

ggtgttttta ggagtgattt gaagaatgaa ttcaagatag atccttctgc cattgatgaa 2340

ttattacaag aattaccaga agctttgaaa tttagtgtgg aagttgaaaa taagtccagt 2400

gtagataaag taacgaattt tgaggaaata aaaaaccaga taacgcagaa attattagag 2460

ttgaaggaaa acaatataag aaacgaacta cctttgatct atcatgtaga tgtcgcctct 2520

atgtacccaa acatcatgac tacaaataga ctacaaccag atagtatcaa agcagagcgc 2580

gattgtgcta gttgcgattt taatagaccc ggaaaaacct gtgcaagaaa gttaaaatgg 2640

gcttggagag gagaattctt tcccagtaag atggatgagt ataacatgat caagcgtgca 2700

ttacaaaatg agacttttcc caacaaaaac aagttttcta aaaagaaagt tttgacattt 2760

gatgaactaa gttacgcaga ccaagttatc cacataaaaa aacgtttaac tgaatattca 2820

aggaaagttt atcatagggt taaagtatca gaaattgtcg aacgagaagc cattgtctgc 2880

caaagagaaa atccattcta cgtcgatacc gtgaaatcct ttcgtgatag gcgttacgaa 2940

ttcaaaggtt tagccaagac ttggaaggga aatctgtcca aaattgaccc atctgataag 3000

catgcgagag acgaggccaa aaagatgatt gtgctttatg actcattaca attagctcac 3060

aaagttattt tgaattcgtt ttatgggtat gttatgagga aaggctctcg ttggtattcc 3120

atggaaatgg cggggattac gtgtttaaca ggtgccacga tcattcaaat ggcgagagct 3180

ttagtagaaa gggtaggaag accattagaa ttagatactg atggtatttg gtgtatctta 3240

ccaaaatctt tccctgaaac ttactttttt acattagaaa atggtaaaaa gctttatctc 3300

tcctacccat gttccatgct gaattacaga gttcaccaaa agtttacgaa tcaccaatac 3360

caagaattaa aagacccatt gaactatata tatgagacgc acagtgaaaa cacgattttt 3420

ttcgaagttg acggaccata taaggccatg attttgccta gttccaagga agaaggaaaa 3480

ggtataaaga aaagatatgc tgtcttcaat gaagacggct cacttgctga actgaaaggt 3540

tttgaattga agaggcgtgg tgaattacaa ctaataaaaa attttcaaag tgatattttc 3600

aaggtctttt tggaaggtga tacattagaa ggatgttaca gtgctgtagc aagcgtatgt 3660

aaccgttggt tagatgttct tgattcacat ggtcttatgt tagaagatga agacttggtc 3720

agtttgattt gtgaaaatag aagtatgtca aaaactttaa aggaatatga agggcaaaaa 3780

tctacttcta ttacgacggc aaggagattg ggggattttt tgggtgaaga tatggtaaaa 3840

gataaaggtc tacaatgtaa atatattatt agttcaaaac ctttcaatgc acctgttact 3900

gaacgagcca ttccagtcgc aatattttca gcggacattc ccatcaaaag gtcttttctg 3960

aggcgatgga cattagatcc atctttggaa gatctggata tcagaaccat aatcgattgg 4020

ggttattata gagaaagact tggatctgct atacaaaaga taattactat tccagcagca 4080

ttacaagggg tttccaatcc tgttccaagg gttgaacatc cagattggct aaaaagaaaa 4140

atcgctacaa aggaggataa gtttaagcag acttcactaa ccaaattttt ttcgaagaca 4200

aagaatgtac caacaatggg caagataaaa gatatcgagg atttgtttga accaactgta 4260

gaagaagata acgccaaaat taaaattgca agaactacta aaaagaaagc cgtatccaag 4320

aggaaaagaa atcagcttac aaatgaagaa gatccactag tattgccctc ggagattcct 4380

tccatggacg aggactatgt tgggtggcta aattatcaaa aaattaaatg gaaaatccaa 4440

gcaagagata gaaagcgtcg agaccaatta tttggtaata caaacagctc ccgtgaaaga 4500

agtgcactag gaagtatgat taggaagcaa gctgaatcat atgcgaactc cacttgggag 4560

gtcttacaat acaaggattc cggtgagcca ggggttttgg aagtatttgt aacaattaat 4620

ggcaaagtcc agaacatcac cttccatata ccaaaaacta tttatatgaa attcaaatct 4680

caaacaatgc cgctacaaaa gattaagaat tgccttattg aaaaatcttc tgcatcgtta 4740

ccaaataatc ccaaaacgtc taatccagca ggcggtcagc tattcaaaat tactctaccg 4800

gaatctgtct ttctggaaga aaaggaaaac tgcactagta tcttcaacga tgaaaatgta 4860

cttggtgtat ttgagggcac tatcactcct catcaaagag cgatcatgga tttgggagct 4920

tcggtaacgt tccgctcaaa agcaatgggt gcgttaggca agggaataca gcagggtttt 4980

gaaatgaagg atctttcaat ggcggaaaat gaaaggtatc tgagtggatt ttcaatggac 5040

attggctatt tactacattt cccaacatca attgggtatg aatttttttc attattcaag 5l00

tcatggggag atactattac tatattagtt ttgaaaccat ccaaccaggc tcaggaaata 5160

aatgcctcat cattaggaca aatatacaaa caaatgtttg aaaaaaagaa aggtaaaata 5220

gaaacatatt cttacttggt tgatattaaa gaagatatca attttgagtt tgtatatttt 5280

acagatatct caaaattgta cagaagacta tcacaggaaa ctactaaatt aaaagaagaa 5340

agaggtctgc agtttttact cttgttacaa tctccgttta tcactaagct cttaggcaca 5400

atccggcttc taaaccagat gcccattgtt aagctttcct tgaatgaagt tcttctaccc 5460

caattgaact ggcaaccgac attattgaag aaacttgtta accacgtttt atccagtggt 5520

tcgtggattt ctcacttgat caagttatcc cagtatagta acattccaat ctgtaatttg 5580

aggctggata gtatggatta tattattgat gttctttatg caagaaaact aaaaaaagag 5640

aacatcgtgc tttggtggaa tgagaaagct ccacttccag atcatggagg cattcaaaat 5700

gattttgatt taaatacatc atggataatg aatgattcag aatttcccaa aattaataac 5760

tcaggtgtgt atgacaatgt agttctcgat gttggtgttg ataatttaac agtgaacaca 5820

attttgacat cagcattaat caatgatgct gaaggcagtg atctagttaa caataatatg 5880

ggtatagatg acaaagatgc cgttattaac tcgccatctg aattcgtgca cgacgccttt 5940

tctaatgacg ctttgaatgt tttaagaggt atgttaaagg agtggtggga tgaggcccta 6000

aaagaaaatt caaccgcaga tttgttggta aattccctgg caagttgggt tcaaaacccg 6060

aatgcgaaac tattcgacgg attactaaga tatcacgttc ataacttaac aaaaaaagcc 6120

ttacttcaat tagtaaatga atttagtgca cttggctcaa ctattgtata tgcagacagg 6180

aatcaaattc taataaagac aaacaagtac tcacctgaaa actgttacgc ctacagccaa 6240

tatatgatga aggcagttag aacaaatcca atgtttagtt atctggactt aaatatcaaa 6300

cgttattggg atctgctaat atggatggat aagtttaatt ttagtggatt agcatgtatt 6360

gaaatagagg aaaaggaaaa tcaggattat accgctgttt cgcaatggca actaaagaag 6420

tttctgtcac caatatatca gcccgaattt gaggattgga tgatgatcat attggatagt 6480

atgctaaaga caaagcagag ctatctaaaa ttgaattcag ggacgcaaag acctacccaa 6540

atagttaatg taaaaaaaca agataaggaa gatagtgttg aaaactcgtt gaacggattt 6600

tctcaccttt tttccaaacc actaatgaaa agagtcaaaa agctttttaa aaaccagcaa 6660

gagttcattt tagatcctca gtatgaggca gactatgtta ttcctgttct tcctggttcc 6720

catctgaatg tgaaaaatcc ccttctagaa cttgtcaaat cactctgcca tgtcatgtta 6780

ctttcaaaga gtacaatttt agaaatcagg accctgagaa aagaactgct gaagatattt 6840

gaattgcgtg agtttgctaa agtagcggaa ttcaaagatc caagtttgag tctcgtggtg 6900

ccggattttt tatgtgaata ctgttttttc atttctgata ttgacttttg taaggcagct 6960

cctgaatcta ttttttcatg cgtcagatgt cacaaagcct ttaatcaagt attgttgcaa 7020

gaacacctga ttcaaaaact acgttctgat atcgaatcct atttaattca agatttgaga 7080

tgctccagat gtcataaagt gaaacgtgac tatatgagtg cccactgtcc atgtgccggc 7140

gcgtgggaag gaactctccc cagagaaagc attgttcaaa agttaaatgt gtttaagcaa 7200

gtagccaagt attacggttt tgatatatta ttgagttgta ttgctgattt gaccatatga 7260

gtaagcagta tataacgcga ggttcaatgg cctctttacc atgaaaaaaa aaaaaaaaaa 7320

aaaaaaaagg taaggaaaaa gagtattttc aattcgtttc tgaacatata aatataaata 7380

accgaaaaat tagcccttga acataattaa cactcttctt tgatatttaa atcacaagta 7440

cttttctttt attttcttct taatactttt ggaaataaaa tgaatgtgac cactccggaa 7500

gttgc 7505

<210>4

<211>2222

<212>PRT

<213>啤酒糖酵母(Saccharomyces cerevisiae)

<400>4

Met Met Phe Gly Lys Lys Lys Asn Asn Gly Gly Ser Ser Thr Ala Arg

1 5 10 15

Tyr Ser Ala Gly Asn Lys Tyr Asn Thr Leu Ser Asn Asn Tyr Ala Leu

20 25 30

Ser Ala Gln Gln Leu Leu Asn Ala Ser Lys Ile Asp Asp Ile Asp Ser

35 40 45

Met Met Gly Phe Glu Arg Tyr Val Pro Pro Gln Tyr Asn Gly Arg Phe

50 55 60

Asp Ala Lys Asp Ile Asp Gln Ile Pro Gly Arg Val Gly Trp Leu Thr

65 70 75 80

Asn Met His Ala Thr Leu Val Ser Gln Glu Thr Leu Ser Ser Gly Ser

85 90 95

Asn Gly Gly Gly Asn Ser Asn Asp Gly Glu Arg Val Thr Thr Asn Gln

100 105 110

Gly Ile Ser Gly Val Asp Phe Tyr Phe Leu Asp Glu Glu Gly Gly Ser

115 120 125

Phe Lys Ser Thr Val Val Tyr Asp Pro Tyr Phe Phe Ile Ala Cys Asn

130 135 140

Asp Glu Ser Arg Val Asn Asp Val Glu Glu Leu Val Lys Lys Tyr Leu

145 150 155 160

Glu Ser Cys Leu Lys Ser Leu Gln Ile Ile Arg Lys Glu Asp Leu Thr

165 170 175

Met Asp Asn His Leu Leu Gly Leu Gln Lys Thr Leu Ile Lys Leu Ser

180 185 190

Phe Val Asn Ser Asn Gln Leu Phe Glu Ala Arg Lys Leu Leu Arg Pro

195 200 205

Ile Leu Gln Asp Asn Ala Asn Asn Asn Val Gln Arg Asn Ile Tyr Asn

210 215 220

Val Ala Ala Asn Gly Ser Glu Lys Val Asp Ala Lys His Leu Ile Glu

225 230 235 240

Asp Ile Arg Glu Tyr Asp Val Pro Tyr His Val Arg Val Ser Ile Asp

245 250 255

Lys Asp Ile Arg Val Gly Lys Trp Tyr Lys Val Thr Gln Gln Gly Phe

260 265 270

Ile Glu Asp Thr Arg Lys Ile Ala Phe Ala Asp Pro Val Val Met Ala

275 280 285

Phe Asp Ile Glu Thr Thr Lys Pro Pro Leu Lys Phe Pro Asp Ser Ala

290 295 300

Val Asp Gln Ile Met Met Ile Ser Tyr Met Ile Asp Gly Glu Gly Phe

305 310 315 320

Leu Ile Thr Asn Arg Glu Ile Ile Ser Glu Asp Ile Glu Asp Phe Glu

325 330 335

Tyr Thr Pro Lys Pro Glu Tyr Pro Gly Phe Phe Thr Ile Phe Asn Glu

340 345 350

Asn Asp Glu Val Ala Leu Leu Gln Arg Phe Phe Glu His Ile Arg Asp

355 360 365

Val Arg Pro Thr Val Ile Ser Thr Phe Asn Gly Asp Phe Phe Asp Trp

370 375 380

Pro Phe Ile His Ash Arg Ser Lys Ile His Gly Leu Asp Met Phe Asp

385 390 395 400

Glu Ile Gly Phe Ala Pro Asp Ala Glu Gly Glu Tyr Lys Ser Ser Tyr

405 410 415

Cys Ser His Met Asp Cys Phe Arg Trp Val Lys Arg Asp Ser Tyr Leu

420 425 430

Pro Gln Gly Ser Gln Gly Leu Lys Ala Val Thr Gln Ser Lys Leu Gly

435 440 445

Tyr Asn Pro Ile Glu Leu Asp Pro Glu Leu Met Thr Pro Tyr Ala Phe

450 455 460

Glu Lys Pro Gln His Leu Ser Glu Tyr Ser Val Ser Asp Ala Val Ala

465 470 475 480

Thr Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ser Leu

485 490 495

Cys Thr Ile Ile Pro Leu Asn Pro Asp Glu Thr Leu Arg Lys Gly Thr

500 505 510

Gly Thr Leu Cys Glu Met Leu Leu Met Val Gln Ala Tyr Gln His Asn

515 520 525

Ile Leu Leu Pro Asn Lys His Thr Asp Pro Ile Glu Arg Phe Tyr Asp

530 535 540

Gly His Leu Leu Glu Ser Glu Thr Tyr Val Gly Gly His Val Glu Ser

545 550 555 560

Leu Glu Ala Gly Val Phe Arg Ser Asp Leu Lys Asn Glu Phe Lys Ile

565 570 575

Asp Pro Ser Ala Ile Asp Glu Leu Leu Gln Glu Leu Pro Glu Ala Leu

580 585 590

Lys Phe Ser Val Glu Val Glu Asn Lys Ser Ser Val Asp Lys Val Thr

595 600 605

Asn Phe Glu Glu Ile Lys Asn Gln Ile Thr Gln Lys Leu Leu Glu Leu

610 615 620

Lys Glu Asn Asn Ile Arg Asn Glu Leu Pro Leu Ile Tyr His Val Asp

625 630 635 640

Val Ala Ser Met Tyr Pro Asn Ile Met Thr Thr Asn Arg Leu Gln Pro

645 650 655

Asp Ser Ile Lys Ala Glu Arg Asp Cys Ala Ser Cys Asp Phe Asn Arg

660 665 670

Pro Gly Lys Thr Cys Ala Arg Lys Leu Lys Trp Ala Trp Arg Gly Glu

675 680 685

Phe Phe Pro Ser Lys Met Asp Glu Tyr Asn Met Ile Lys Arg Ala Leu

690 695 700

Gln Asn Glu Thr Phe Pro Asn Lys Asn Lys Phe Ser Lys Lys Lys Val

705 710 715 720

Leu Thr Phe Asp Glu Leu Ser Tyr Ala Asp Gln Val Ile His Ile Lys

725 730 735

Lys Arg Leu Thr Glu Tyr Ser Arg Lys Val Tyr His Arg Val Lys Val

740 745 750

Ser Glu Ile Val Glu Arg Glu Ala Ile Val Cys Gln Arg Glu Asn Pro

755 760 765

Phe Tyr Val Asp Thr Val Lys Ser Phe Arg Asp Arg Arg Tyr Glu Phe

770 775 780

Lys Gly Leu Ala Lys Thr Trp Lys Gly Asn Leu Ser Lys Ile Asp Pro

785 790 795 800

Ser Asp Lys His Ala Arg Asp Glu Ala Lys Lys Met Ile Val Leu Tyr

805 810 815

Asp Ser Leu Gln Leu Ala His Lys Val Ile Leu Asn Ser Phe Tyr Gly

820 825 830

Tyr Val Met Arg Lys Gly Ser Arg Trp Tyr Ser Met Glu Met Ala Gly

835 840 845

Ile Thr Cys Leu Thr Gly Ala Thr Ile Ile Gln Met Ala Arg Ala Leu

850 855 860

Val Glu Arg Val Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile Trp

865 870 875 880

Cys Ile Leu Pro Lys Ser Phe Pro Glu Thr Tyr Phe Phe Thr Leu Glu

885 890 895

Asn Gly Lys Lys Leu Tyr Leu Ser Tyr Pro Cys Ser Met Leu Asn Tyr

900 905 910

Arg Val His Gln Lys Phe Thr Asn His Gln Tyr Gln Glu Leu Lys Asp

915 920 925

Pro Leu Asn Tyr Ile Tyr Glu Thr His Ser Glu Asn Thr Ile Phe Phe

930 935 940

Glu Val Asp Gly Pro Tyr Lys Ala Met Ile Leu Pro Ser Ser Lys Glu

945 950 955 960

Glu Gly Lys Gly Ile Lys Lys Arg Tyr Ala Val Phe Asn Glu Asp Gly

965 970 975

Ser Leu Ala Glu Leu Lys Gly Phe Glu Leu Lys Arg Arg Gly Glu Leu

980 985 990

Gln Leu Ile Lys Asn Phe Gln Ser Asp Ile Phe Lys Val Phe Leu Glu

995 1000 1005

Gly Asp Thr Leu Glu Gly Cys Tyr Ser Ala Val Ala Ser Val Cys Asn

1010 1015 1020

Arg Trp Leu Asp Val Leu Asp Ser His Gly Leu Met Leu Glu Asp Glu

1025 1030 1035 1040

Asp Leu Val Ser Leu Ile Cys Glu Asn Arg Ser Met Ser Lys Thr Leu

1045 1050 1055

Lys Glu Tyr Glu Gly Gln Lys Ser Thr Ser Ile Thr Thr Ala Arg Arg

1060 1065 1070

Leu Gly Asp Phe Leu Gly Glu Asp Met Val Lys Asp Lys Gly Leu Gln

1075 1080 1085

Cys Lys Tyr Ile Ile Ser Ser Lys Pro Phe Asn Ala Pro Val Thr Glu

1090 1095 1100

Arg Ala Ile Pro Val Ala Ile Phe Ser Ala Asp Ile Pro Ile Lys Arg

1105 1110 1115 1120

Ser Phe Leu Arg Arg Trp Thr Leu Asp Pro Ser Leu Glu Asp Leu Asp

1125 1130 1135

Ile Arg Thr Ile Ile Asp Trp Gly Tyr Tyr Arg Glu Arg Leu Gly Ser

1140 1145 1150

Ala Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu Gln Gly Val Ser

1155 1160 1165

Asn Pro Val Pro Arg Val Glu His Pro Asp Trp Leu Lys Arg Lys Ile

1170 1175 1180

Ala Thr Lys Glu Asp Lys Phe Lys Gln Thr Ser Leu Thr Lys Phe Phe

1185 1190 1195 1200

Ser Lys Thr Lys Asn Val Pro Thr Met Gly Lys Ile Lys Asp Ile Glu

1205 1210 1215

Asp Leu Phe Glu Pro Thr Val Glu Glu Asp Asn Ala Lys Ile Lys Ile

1220 1225 1230

Ala Arg Thr Thr Lys Lys Lys Ala Val Ser Lys Arg Lys Arg Asn Gln

1235 1240 1245

Leu Thr Asn Glu Glu Asp Pro Leu Val Leu Pro Ser Glu Ile Pro Ser

1250 1255 1260

Met Asp Glu Asp Tyr Val Gly Trp Leu Asn Tyr Gln Lys Ile Lys Trp

1265 1270 1275 1280

Lys Ile Gln Ala Arg Asp Arg Lys Arg Arg Asp Gln Leu Phe Gly Asn

1285 1290 1295

Thr Asn Ser Ser Arg Glu Arg Ser Ala Leu Gly Ser Met Ile Arg Lys

1300 1305 1310

Gln Ala Glu Ser Tyr Ala Asn Ser Thr Trp Glu Val Leu Gln Tyr Lys

1315 1320 1325

Asp Ser Gly Glu Pro Gly Val Leu Glu Val Phe Val Thr Ile Asn Gly

1330 1335 1340

Lys Val Gln Asn Ile Thr Phe His Ile Pro Lys Thr Ile Tyr Met Lys

1345 1350 1355 1360

Phe Lys Ser Gln Thr Met Pro Leu Gln Lys Ile Lys Asn Cys Leu Ile

1365 1370 1375

Glu Lys Ser Ser Ala Ser Leu Pro Asn Asn Pro Lys Thr Ser Asn Pro

1380 1385 1390

Ala Gly Gly Gln Leu Phe Lys Ile Thr Leu Pro Glu Ser Val Phe Leu

1395 1400 1405

Glu Glu Lys Glu Asn Cys Thr Ser Ile Phe Asn Asp Glu Asn Val Leu

1410 1415 1420

Gly Val Phe Glu Gly Thr Ile Thr Pro His Gln Arg Ala Ile Met Asp

1425 1430 1435 1440

Leu Gly Ala Ser Val Thr Phe Arg Ser Lys Ala Met Gly Ala Leu Gly

1445 1450 1455

Lys Gly Ile Gln Gln Gly Phe Glu Met Lys Asp Leu Ser Met Ala Glu

1460 1465 1470

Asn Glu Arg Tyr Leu Ser Gly Phe Ser Met Asp Ile Gly Tyr Leu Leu

1475 1480 1485

His Phe Pro Thr Ser Ile Gly Tyr Glu Phe Phe Ser Leu Phe Lys Ser

1490 1495 1500

Trp Gly Asp Thr Ile Thr Ile Leu Val Leu Lys Pro Ser Asn Gln Ala

1505 1510 1515 1520

Gln Glu Ile Asn Ala Ser Ser Leu Gly Gln Ile Tyr Lys Gln Met Phe

1525 1530 1535

Glu Lys Lys Lys Gly Lys Ile Glu Thr Tyr Ser Tyr Leu Val Asp Ile

1540 1545 1550

Lys Glu Asp Ile Asn Phe Glu Phe Val Tyr Phe Thr Asp Ile Ser Lys

1555 1560 1565

Leu Tyr Arg Arg Leu Ser Gln Glu Thr Thr Lys Leu Lys Glu Glu Arg

1570 1575 1580

Gly Leu Gln Phe Leu Leu Leu Leu Gln Ser Pro Phe Ile Thr Lys Leu

1585 1590 1595 1600

Leu Gly Thr Ile Arg Leu Leu Asn Gln Met Pro Ile Val Lys Leu Ser

1605 1610 1615

Leu Asn Glu Val Leu Leu Pro Gln Leu Asn Trp Gln Pro Thr Leu Leu

1620 1625 1630

Lys Lys Leu Val Asn His Val Leu Ser Ser Gly Ser Trp Ile Ser His

1635 1640 1645

Leu Ile Lys Leu Ser Gln Tyr Ser Asn Ile Pro Ile Cys Asn Leu Arg

1650 1655 1660

Leu Asp Ser Met Asp Tyr Ile Ile Asp Val Leu Tyr Ala Arg Lys Leu

1665 1670 1675 1680

Lys Lys Glu Asn Ile Val Leu Trp Trp Asn Glu Lys Ala Pro Leu Pro

1685 1690 1695

Asp His Gly Gly Ile Gln Asn Asp Phe Asp Leu Asn Thr Ser Trp Ile

1700 1705 1710

Met Asn Asp Ser Glu Phe Pro Lys Ile Asn Asn Ser Gly Val Tyr Asp

1715 1720 1725

Asn Val Val Leu Asp Val Gly Val Asp Asn Leu Thr Val Asn Thr Ile

1730 1735 1740

Leu Thr Ser Ala Leu Ile Asn Asp Ala Glu Gly Ser Asp Leu Val Asn

1745 1750 1755 1760

Asn Asn Met Gly Ile Asp Asp Lys Asp Ala Val Ile Asn Ser Pro Ser

1765 1770 1775

Glu Phe Val His Asp Ala Phe Ser Asn Asp Ala Leu Asn Val Leu Arg

1780 1785 1790

Gly Met Leu Lys Glu Trp Trp Asp Glu Ala Leu Lys Glu Asn Ser Thr

1795 1800 1805

Ala Asp Leu Leu Val Asn Ser Leu Ala Ser Trp Val Gln Asn Pro Asn

1810 1815 1820

Ala Lys Leu Phe Asp Gly Leu Leu Arg Tyr His Val His Asn Leu Thr

1825 1830 1835 1840

Lys Lys Ala Leu Leu Gln Leu Val Asn Glu Phe Ser Ala Leu Gly Ser

1845 1850 1855

Thr Ile Val Tyr Ala Asp Arg Asn Gln Ile Leu Ile Lys Thr Asn Lys

1860 1865 1870

Tyr Ser Pro Glu Asn Cys Tyr Ala Tyr Ser Gln Tyr Met Met Lys Ala

1875 1880 1885

Val Arg Thr Asn Pro Met Phe Ser Tyr Leu Asp Leu Asn Ile Lys Arg

1890 1895 1900

Tyr Trp Asp Leu Leu Ile Trp Met Asp Lys Phe Asn Phe Ser Gly Leu

1905 1910 1915 1920

Ala Cys Ile Glu Ile Glu Glu Lys Glu Asn Gln Asp Tyr Thr Ala Val

1925 1930 1935

Ser Gln Trp Gln Leu Lys Lys Phe Leu Ser Pro Ile Tyr Gln Pro Glu

1940 1945 1950

Phe Glu Asp Trp Met Met Ile Ile Leu Asp Ser Met Leu Lys Thr Lys

1955 1960 1965

Gln Ser Tyr Leu Lys Leu Asn Ser Gly Thr Gln Arg Pro Thr Gln Ile

1970 1975 1980

Val Asn Val Lys Lys Gln Asp Lys Glu Asp Ser Val Glu Asn Ser Leu

1985 1990 1995 2000

Asn Gly Phe Ser His Leu Phe Ser Lys Pro Leu Met Lys Arg Val Lys

2005 2010 2015

Lys Leu Phe Lys Asn Gln Gln Glu Phe Ile Leu Asp Pro Gln Tyr Glu

2020 2025 2030

Ala Asp Tyr Val Ile Pro Val Leu Pro Gly Ser His Leu Asn Val Lys

2035 2040 2045

Asn Pro Leu Leu Glu Leu Val Lys Ser Leu Cys His Val Met Leu Leu

2050 2055 2060

Ser Lys Ser Thr Ile Leu Glu Ile Arg Thr Leu Arg Lys Glu Leu Leu

2065 2070 2075 2080

Lys Ile Phe Glu Leu Arg Glu Phe Ala Lys Val Ala Glu Phe Lys Asp

2085 2090 2095

Pro Ser Leu Ser Leu Val Val Pro Asp Phe Leu Cys Glu Tyr Cys Phe

2100 2105 2110

Phe Ile Ser Asp Ile Asp Phe Cys Lys Ala Ala Pro Glu Ser Ile Phe

2115 2120 2125

Ser Cys Val Arg Cys His Lys Ala Phe Asn Gln Val Leu Leu Gln Glu

2130 2135 2140

His Leu Ile Gln Lys Leu Arg Ser Asp Ile Glu Ser Tyr Leu Ile Gln

2145 2150 2155 2160

Asp Leu Arg Cys Ser Arg Cys His Lys Val Lys Arg Asp Tyr Met Ser

2165 2170 2175

Ala His Cys Pro Cys Ala Gly Ala Trp Glu Gly Thr Leu Pro Arg Glu

2180 2185 2190

Ser Ile Val Gln Lys Leu Asn Val Phe Lys Gln Val Ala Lys Tyr Tyr

2195 2200 2205

Gly Phe Asp Ile Leu Leu Ser Cys Ile Ala Asp Leu Thr Ile

2210 2215 2220

<210>5

<211>12

<212>PRT

<213>大肠杆菌(Escherichia coli)

<400>5

Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn

1 5 10

<210>6

<211>12

<212>PRT

<213>流感嗜血菌(Haemophilus influenzae)

<400>6

Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn

1 5 l0

<210>7

<211>12

<212>PRT

<213>鼠伤寒沙门氏菌(Salmonella typhimurium)

<400>7

Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn

1 5 10

<210>8

<211>12

<212>PRT

<213>霍乱弧菌(Vibrio cholerae)

<400>8

Ile Val Val Leu Asp Thr Glu Thr Thr Gly Met Asn

1 5 10

<210>9

<211>12

<212>PRT

<213>铜绿假单胞菌(Pseudomonas aeruginosa)

<400>9

Ser Val Val Leu Asp Thr Glu Thr Thr Gly Met Pro

1 5 10

<210>10

<211>12

<212>PRT

<213>脑膜炎奈瑟氏球菌(Neisseria meningitidis)

<400>10

Gln Ile Ile Leu Asp Thr Glu Thr Thr Gly Leu Tyr

1 5 10

<210>11

<211>12

<212>PRT

<213>砂眼衣原体(Chlamydia trachomatis)

<400>11

Phe Val Cys Leu Asp Cys Glu Thr Thr Gly Leu Asp

1 5 10

<210>12

<211>12

<212>PRT

<213>天蓝色链霉菌(Streptomyces coelicolor)

<400>12

Leu Ala Ala Phe Asp Thr Glu Thr Thr Gly Val Asp

1 5 10

<210>13

<211>12

<212>PRT

<213>弗氏志贺氏菌(Shigella flexneri)2a菌株301

<400>13

Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn

1 5 10

<210>14

<211>12

<212>PRT

<213>金黄色葡萄球菌(Staphylococcus aureus)

<400>14

Tyr Val Val Phe Asp Val Glu Thr Thr Gly Leu Ser

1 5 10

<210>15

<211>12

<212>PRT

<213>枯草芽孢杆菌(Bacillus subtilis)

<400>15

Tyr Val Val Phe Asp Val Glu Thr Thr Gly Leu Ser

1 5 10

<210>16

<211>12

<212>PRT

<213>肺枝原体(Mycoplasma pulmonis)

<400>16

Tyr Val Val Tyr Asp Ile Glu Thr Thr Gly Leu Ser

1 5 10

<210>17

<211>12

<212>PRT

<213>生殖道枝原体(Mycoplasma genitalium)

<400>17

Phe Val Ile Phe Asp Ile Glu Thr Thr Gly Leu His

1 5 10

<210>18

<211>12

<212>PRT

<213>肺炎枝原体(Mycoplasma pneumoniae)

<400>18

Phe Val Ile Phe Asp Ile Glu Thr Thr Gly Leu His

1 5 10

<210>19

<211>12

<212>PRT

<213>啤酒糖酵母(Saccharomyces cerevisiae)

<400>19

Ile Met Ser Phe Asp Ile Glu Cys Ala Gly Arg Ile

1 5 10

<210>20

<211>12

<212>PRT

<213>啤酒糖酵母(Saccharomyces cerevisiae)

<400>20

Val Met Ala Phe Asp Ile Glu Thr Thr Lys Pro Pro

1 5 10

<210>21

<211>12

<212>PRT

<213>小鼠(Mus musculus)

<400>21

Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys

1 5 10

<210>22

<211>12

<212>PRT

<213>小鼠(Mus musculus)

<400>22

Val Leu Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro

1 5 10

<210>23

<211>12

<212>PRT

<213>智人(Homo sapiens)

<400>23

Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys

1 5 10

<210>24

<211>12

<212>PRT

<213>智人(Homo sapiens)

<400>24

Val Leu Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro

1 5 10

<210>25

<211>12

<212>PRT

<213>稻(Oryza sativa)

<400>25

Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys

1 5 10

<210>26

<211>12

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>26

Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys

1 5 10

<210>27

<211>12

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>27

Val Cys Ala Phe Asp Ile Glu Thr Val Lys Leu Pro

1 5 10

<210>28

<211>12

<212>PRT

<213>大鼠(Rattus norvegicus)

<400>28

Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys

1 5 10

<210>29

<211>12

<212>PRT

<213>牛(Bos taurus)

<400>29

Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys

1 5 10

<210>30

<211>12

<212>PRT

<213>大豆(Glycine max)

<400>30

Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys

1 5 10

<210>31

<211>12

<212>PRT

<213>黑腹果蝇(Drosophila melanogaster)

<400>31

Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys

1 5 10

<210>32

<211>12

<212>PRT

<213>黑腹果蝇(Drosophila melanogaster)

<400>32

Val Leu Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro

1 5 10

<210>33

<211>36

<212>DNA

<213>人工序列

<220>

<223>人工序列描述：突变的polδ

<400>33

atcatgtcct ttgctatcgc ttgtgctggt aggatt 36

<210>34

<211>12

<212>PRT

<213>人工序列

<220>

<223>人工序列描述：突变的polδ

<400>34

Ile Met Ser Phe Ala Ile Ala Cys Ala Gly Arg Ile

1 5 10

<210>35

<211>36

<212>DNA

<213>人工序列

<220>

<223>人工序列描述：突变的polε

<400>35

gtaatggcat ttgctatagc taccacgaag ccgcct 36

<210>36

<211>12

<212>PRT

<213>人工序列

<220>

<223>人工序列描述：突变的polε

<400>36

Val Met Ala Phe Ala Ile Ala Thr Thr Lys Pro Pro

1 5 10

<210>37

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列描述：引物

<400>37

CCCGAGCTCA TGAGTGAAAA AAGATCCCTT 30

<210>38

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列描述：引物

<400>38

CCCGCGGCCG CTTACCATTT GCTTAATTGT 30

<210>39

<21l>30

<212>DNA

<213>人工序列

<220>

<223>人工序列描述：引物

<400>39

CCCGAGCTCA TGATGTTTGG CAAGAAAAAA 30

<210>40

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列描述：引物

<400>40

CCCGCGGCCG CTCATATGGT CAAATCAGCA 30

<210>41

<211>1592

<212>DNA

<213>大肠杆菌(Escherichia coli)

<400>41

gaattcaaat acaaaaaaac cgcaaaatta aaaatcttgc ggctctctga actcattttc 60

atgagtgaat agtggcggaa cggacgggac tcgaacccgc gaccccctgc gtgacaggca 120

ggtattcaac cgactgaact accgctccgc gttgtgttcc gttgggaacg aggcgaatag 180

ttacgaattg cctcgacctc gtcaacggtt tttctatctt ttgaatcgtt tgctgcaaaa 240

atcgcccaag tcgctatttt tagcgccttt cacaggtatt tatgctcgcc agaggcaact 300

tccgcctttc ttctgcacca gatcgagacg ggcttcatga gctgcaatct cttcatctgt 360

cgcaaaaaca acgcgtaact tacttgcctg acgtacaatg cgctgaattg ttgcttcacc 420

ttgttgctgt tgtgtctctc cttccatcgc aaaagccatc gacgtttgac caccggtcat 480

cgccagataa acttccgcaa ggatctgggc atcgagtaat gccccgtgca gcgttcgttt 540

actgttatct atttcgtagc gagcacataa cgcatcgagg ctgttgcgct taccgggaaa 600

cattttcctc gccaccgcaa ggctatcggt gaccttacag aaagtattgg tcttcggaat 660

atcgcgctta agcaacgaaa actcgtagtc cataaagccg atatcgaacg ctgcgttatg 720

gatcaccaac tccgcgccgc gaatatagtc catgaactca tcggctactt cggcaaacgt 780

gggcttatcg agcaaaaatt catcggcaat accatgtacg ccaaaggctt ccggatccac 840

cagccgatcg ggtttgagat aaacatggaa gttattgccc gtcaggcgac ggttcaccac 900

ttcaacggca ccaatctcaa tgatcttgtg gccttcatag tgcgcaccaa tctggttcat 960

accggtggtt tcggtatcga gaacgatctg gcgtgtaatt gcagtgctca tagcggtcat 1020

ttatgtcaga cttgtcgttt tacagttcga ttcaattaca ggaagtctac cagagatgct 1080

taaacaggta gaaattttca ccgatggttc gtgtctgggc aatccaggac ctgggggtta 1140

cggcgctatt ttacgctatc gcggacgcga gaaaaccttt agcgctggct acacccgcac 1200

caccaacaac cgtatggagt tgatggccgc tattgtcgcg ctggaggcgt taaaagaaca 1260

ttgcgaagtc attttgagta ccgacagcca gtatgtccgc cagggtatca cccagtggat 1320

ccataactgg aaaaaacgtg gctggaaaac cgcagacaaa aaaccagtaa aaaatgtcga 1380

tctctggcaa cgtcttgatg ctgcattggg gcagcatcaa atcaaatggg aatgggttaa 1440

aggccatgcc ggacacccgg aaaacgaacg ctgtgatgaa ctggctcgtg ccgcggcgat 1500

gaatcccaca ctggaagata caggctacca agttgaagtt taagcctgtg gtttacgaca 1560

ttgccgggtg gctccaaccg cctagcgaat tc 1592

<210>42

<211>243

<212>PRT

<213>大肠杆菌(Escherichia coli)

<400>42

Met Ser Thr Ala Ile Thr Arg Gln Ile Val Leu Asp Thr Glu Thr Thr

1 5 10 15

Gly Met Asn Gln Ile Gly Ala His Tyr Glu Gly His Lys Ile Ile Glu

20 25 30

Ile Gly Ala Val Glu Val Val Asn Arg Arg Leu Thr Gly Asn Asn Phe

35 40 45

His Val Tyr Leu Lys Pro Asp Arg Leu Val Asp Pro Glu Ala Phe Gly

50 55 60

Val His Gly Ile Ala Asp Glu Phe Leu Leu Asp Lys Pro Thr Phe Ala

65 70 75 80

Glu Val Ala Asp Glu Phe Met Asp Tyr Ile Arg Gly Ala Glu Leu Val

85 90 95

Ile His Asn Ala Ala Phe Asp Ile Gly Phe Met Asp Tyr Glu Phe Ser

100 105 110

Leu Leu Lys Arg Asp Ile Pro Lys Thr Asn Thr Phe Cys Lys Val Thr

115 120 125

Asp Ser Leu Ala Val Ala Arg Lys Met Phe Pro Gly Lys Arg Asn Ser

130 135 140

Leu Asp Ala Leu Cys Ala Arg Tyr Glu Ile Asp Asn Ser Lys Arg Thr

145 150 155 160

Leu His Gly Ala Leu Leu Asp Ala Gln Ile Leu Ala Glu Val Tyr Leu

165 170 175

Ala Met Thr Gly Gly Gln Thr Ser Met Ala Phe Ala Met Glu Gly Glu

180 185 190

Thr Gln Gln Gln Gln Gly Glu Ala Thr Ile Gln Arg Ile Val Arg Gln

195 200 205

Ala Ser Lys Leu Arg Val Val Phe Ala Thr Asp Glu Glu Ile Ala Ala

210 215 220

His Glu Ala Arg Leu Asp Leu Val Gln Lys Lys Gly Gly Ser Cys Leu

225 230 235 240

Trp Arg Ala

<210>43

<211>4866

<212>DNA

<213>枯草芽孢杆菌(Bacillus subtilis)

<400>43

ggtaccgctt cacttatgat gtttttaggg agggatactg tcttaatgga acagttatca 60

gtaaacagaa ggcagtttca aattcttctg cagcagatta atatgacaga tgataccttc 120

atgacatact ttgaacatgg cgagattaaa aagctgacaa ttcacaaagc ttctaagtct 180

tggcattttc attttcaatt taaatctttg ctgccttttc aaatatatga cacattaaca 240

acgaggctga cgcaatcgtt tgcccacata gcaaaagtga catcttcaat tgaagttcag 300

gatgccgagg tcagtgaaag tatcgttcaa gactactggt cacgctgcat tgaagaactg 360

cagggcattt cgccgccgat tatcagtctt ttaaaccagc aaaaaccgaa gctgaagggc 420

aataaactga ttgtcaaaac caaaacagat acagaagcgg ctgcgctaaa gaacaaatac 480

agttccatga ttcaagcaga ataccgtcaa tttggctttc cggatcttca gcttgatgct 540

gaaatatttg tatccgagca agaagttcaa aagtttcggg agcaaaagct tgcggaagac 600

caagagcggg ctatgcaggc cttgattgaa atggagaaga aagataaaga aagtgatgaa 660

gaccaagcac catctggtcc tcttgttatc ggttatcaaa ttaaagataa cgaggaaatc 720

cgaacacttg acagcatcat ggacgaagaa cggagaatta cggtccaagg ttatgtgttt 780

gatgtggaga cgcgcgagct gaagagcggg cgcacgctgt gtatcttcaa aattacagac 840

tatacaaata gtattttgat caaaatgttt gcacgtgaaa aagaagatgc ggcgctgatg 900

aagtctctga aaaaaggaat gtgggtaaaa gcacgcggaa gcattcaaaa tgatacattt 960

gtcagagacc ttgtcatgat cgcaaatgac gtaaacgaaa taaaagcaaa aacccgtgaa 1020

gattcagcac ctgaaggaga aaaaagagtg gaattgcatc ttcattcccc aatgagccaa 1080

atggatgctg ttacgggtat cggaaagctt gtcgaacagg cgaaaaaatg ggggcatgag 1140

gccatcgctt tgaccgacca tgctgtcgtt caatccttcc ctgatgcgta ttctgcggcc 1200

aaaaagcatg gaattaaaat gatttacggg atggaagcga atctcgtgga tgatggcgtg 1260

ccaattgctt ataatgccgc acatcgtctg ctcgaagaag aaacatatgt tgtttttgac 1320

gttgagacga caggattgtc tgctgtatac gataccatta ttgagctggc tgcagtaaaa 1380

gtaaaaggcg gagaaattat tgataaattt gaggcgtttg cgaacccgca tcgtccgctt 1440

tccgccacaa tcatagagct gacagggatc acagatgata tgctacaaga cgctccggat 1500

gtcgtagatg taataagaga tttcagagaa tggattggcg atgatattct tgtcgctcat 1560

aatgcaagct ttgatatggg attcttaaat gtagcctata aaaaacttct tgaagtcgaa 1620

aaagctaaaa acccagtcat tgatacgctt gaacttggac gttttctcta tccggaattt 1680

aagaaccacc ggttgaacac actttgtaaa aagtttgata tcgagctcac acagcatcac 1740

cgtgcgatct atgatactga ggcaaccgct tatttgcttc tgaaaatgct gaaagacgca 1800

gctgaaaaag gtattcagta ccatgatgag ttgaatgaaa atatgggtca gtccaatgct 1860

tatcaaagat caagaccgta tcatgcaaca ttacttgccg tgaacagcac gggacttaaa 1920

aatttattta agcttgtgtc actttctcat attcattatt tttacagagt gccgcgtatt 1980

ccgagatctc agcttgagaa atacagggaa gggcttctga tcggttctgc ttgtgacagg 2040

ggagaggttt ttgagggaat gatgcaaaaa tcgcctgaag aggtggaaga tatcgcgtca 2100

ttctatgatt accttgaggt tcagccgcct gaagtgtatc gtcacttgct ggagcttgaa 2160

ctggtccgtg atgaaaaagc gctgaaagaa attattgcga atatcacgaa gctgggggaa 2220

aagcttaata aaccggttgt tgctacggga aatgttcatt acttgaatga tgaggataaa 2280

atctacagaa agattttaat atcctcacaa ggcggggcaa atccgctgaa taggcatgaa 2340

ctgccgaaag tgcatttcag aacgacagac gaaatgcttg aagctttttc tttcttaggt 2400

gaagaaaaag cgaaggagat cgtagtcacc aatacccaaa aggttgcttc tttagttgat 2460

gacatcaagc cgattaaaga tgatttatat acgccgaaaa tcgaaggcgc tgatgaagag 2520

atcagagaaa tgagctatca gcgtgcaaga agcatttacg gggaagagct gcctgaaatt 2580

gtcgaagcgc ggattgaaaa agagttaaag agtattattg gccacggatt tgctgttatt 2640

tacttgatct ctcacaaact tgtaaaacgt tcactagatg acgggtatct cgttggttcc 2700

cgtggttccg taggatcttc attagttgcg acacttactg agattactga ggtaaacccg 2760

ctgccgccgc actatgtttg tcctgagtgc cagcattctg agttctttaa tgacggttct 2820

gtcggttctg gttttgacct gcctgacaag acatgccctc attgcggaac gcctttgaaa 2880

aaagacggcc atgatattcc atttgaaacg ttcttaggat ttaaagggga caaagtacct 2940

gatatcgatt tgaacttctc aggggaatat cagccgcaag cacacaatta cacaaaagta 3000

ttgttcggag aagacaatgt atatcgtgcg ggaacaatag gcacggtggc agaaaaaaca 3060

gcctacggtt atgtaaaagg ctatgccgga gacaacaatc ttcatatgcg cggtgccgaa 3120

atagatcggc tcgtacaggg atgcacaggt gtaaaacgta caactggaca gcaccctggc 3180

ggtattatcg tagttccgga ttatatggat atttatgatt tttcaccgat ccagttcccg 3240

gcagatgcca caggttcaga gtggaaaacg actcattttg atttccactc catccatgac 3300

aacctgttaa aacttgatat tctcggacac gatgacccga ctgttattcg gatgcttcaa 3360

gacttaagcg gaatagatcc gaaaacaatt ccgacggatg atcctgaagt gatgaagatc 3420

ttccagggaa ccgaatcact cggtgtgact gaagaacaga ttggctgtaa aacgggcact 3480

cttggaattc ctgaattcgg aacccgattt gtccggcaga tgcttgaaga tacaaagccg 3540

accacttttt ctgagctcgt tcagatttca ggcttgtctc acggaactga tgtatggctt 3600

ggcaatgcac aggagctcat ccacaataat atttgtgagc tgagtgaggt tatcggctgc 3660

cgtgatgaca ttatggttta tttaatctat caaggccttg agccgtccct tgcctttaaa 3720

atcatggaat tcgtgcgtaa aggaaaagga ttaacgcctg aatgggaaga agaaatgaaa 3780

aataacaatg tcccagactg gtatattgat tcctgtaaaa agattaaata catgttcccg 3840

aaagcccacg ccgcggcata tgtcttaatg gcagtccgca ttgcttactt taaagtgcat 3900

catgctcttt tgtattatgc ggcttatttt accgttcgtg cagatgactt tgatattgat 3960

acaatgatca agggctctac agcaatcaga gcggtaatgg aggatataaa cgctaaagga 4020

cttgatgctt caccgaagga aaagaacctt ctgactgttt tagaattagc gcttgagatg 4080

tgtgagagag gctattcatt ccaaaaagtc gatttatatc gctccagcgc cacagagttt 4140

attattgacg gcaacagtct tattccgccg tttaactcta ttccagggtt agggacgaac 4200

gctgctttga acattgtaaa agctcgcgaa gaaggcgaat tcctctcaaa agaagatttg 4260

caaaagagag ggaaagtatc aaaaacgatt ttagagtact tagatcgcca tggctgtctg 4320

gagtcactgc ctgatcaaaa ccaattgtca ctgttctaat atggaaagca gaatttctca 4380

gaaattctgc ttctatgcat acataagcgc aaaaagtgcc atcgtaatat tagagtttct 4440

gtcacttgct taggtatgaa ggtaagcgta tatccatttg caataaaaat atggttatgg 4500

tatagtttta ttggaaatgc taacgattac cgaggcaaag agtggggaaa cccgctcttt 4560

tgtattgaac aggagaattt tgtctcgaca tgttcatcgt ttacttttta gcccctgctc 4620

ttttgaagca gggtttttat gcagagtgac gagacgaata tgagatcgac agcacaagga 4680

ggaagaacat gagcaaaaaa gtgactgaca ccgttcaaga aatggctcag ccaatcgtag 4740

acagccttca gctggaactc gttgacattg aatttgtcaa agagggccaa agctggttcc 4800

ttcgcgtgtt tattgattcc gatgacggtg tggatattga ggaatgtgcc aaagtaagcg 4860

aagctt 4866

<210>44

<211>1437

<212>PRT

<213>枯草芽孢杆菌(Bacillus subtilis)

<400>44

Met Glu Gln Leu Ser Val Asn Arg Arg Gln Phe Gln Ile Leu Leu Gln

1 5 10 15

Gln Ile Asn Met Thr Asp Asp Thr Phe Met Thr Tyr Phe Glu His Gly

20 25 30

Glu Ile Lys Lys Leu Thr Ile His Lys Ala Ser Lys Ser Trp His Phe

35 40 45

His Phe Gln Phe Lys Ser Leu Leu Pro Phe Gln Ile Tyr Asp Thr Leu

50 55 60

Thr Thr Arg Leu Thr Gln Ser Phe Ala His Ile Ala Lys Val Thr Ser

65 70 75 80

Ser Ile Glu Val Gln Asp Ala Glu Val Ser Glu Ser Ile Val Gln Asp

85 90 95

Tyr Trp Ser Arg Cys Ile Glu Glu Leu Gln Gly Ile Ser Pro Pro Ile

100 105 110

Ile Ser Leu Leu Asn Gln Gln Lys Pro Lys Leu Lys Gly Asn Lys Leu

115 120 125

Ile Val Lys Thr Lys Thr Asp Thr Glu Ala Ala Ala Leu Lys Asn Lys

130 135 140

Tyr Ser Ser Met Ile Gln Ala Glu Tyr Arg Gln Phe Gly Phe Pro Asp

145 150 155 160

Leu Gln Leu Asp Ala Glu Ile Phe Val Ser Glu Gln Glu Val Gln Lys

165 170 175

Phe Arg G1u Gln Lys Leu Ala Glu Asp Gln Glu Arg Ala Met Gln Ala

180 185 190

Leu Ile Glu Met Glu Lys Lys Asp Lys Glu Ser Asp Glu Asp Gln Ala

195 200 205

Pro Ser Gly Pro Leu Val Ile Gly Tyr Gln Ile Lys Asp Asn Glu Glu

210 215 220

Ile Arg Thr Leu Asp Ser Ile Met Asp Glu Glu Arg Arg Ile Thr Val

225 230 235 240

Gln Gly Tyr Val Phe Asp Val Glu Thr Arg Glu Leu Lys Ser Gly Arg

245 250 255

Thr Leu Cys Ile Phe Lys Ile Thr Asp Tyr Thr Asn Ser Ile Leu Ile

260 265 270

Lys Met Phe Ala Arg Glu Lys Glu Asp Ala Ala Leu Met Lys Ser Leu

275 280 285

Lys Lys Gly Met Trp Val Lys Ala Arg Gly Ser Ile Gln Asn Asp Thr

290 295 300

Phe Val Arg Asp Leu Val Met Ile Ala Asn Asp Val Asn Glu Ile Lys

305 310 315 320

Ala Lys Thr Arg Glu Asp Ser Ala Pro Glu Gly Glu Lys Arg Val Glu

325 330 335

Leu His Leu His Ser Pro Met Ser Gln Met Asp Ala Val Thr Gly Ile

340 345 350

Gly Lys Leu Val Glu Gln Ala Lys Lys Trp Gly His Glu Ala Ile Ala

355 360 365

Leu Thr Asp His Ala Val Val Gln Ser Phe Pro Asp Ala Tyr Ser Ala

370 375 380

Ala Lys Lys His Gly Ile Lys Met Ile Tyr Gly Met Glu Ala Asn Leu

385 390 395 400

Val Asp Asp Gly Val Pro Ile Ala Tyr Asn Ala Ala His Arg Leu Leu

405 410 415

Glu Glu Glu Thr Tyr Val Val Phe Asp Val Glu Thr Thr Gly Leu Ser

420 425 430

Ala Val Tyr Asp Thr Ile Ile Glu Leu Ala Ala Val Lys Val Lys Gly

435 440 445

Gly Glu Ile Ile Asp Lys Phe Glu Ala Phe Ala Asn Pro His Arg Pro

450 455 460

Leu Ser Ala Thr Ile Ile Glu Leu Thr Gly Ile Thr Asp Asp Met Leu

465 470 475 480

Gln Asp Ala Pro Asp Val Val Asp Val Ile Arg Asp Phe Arg Glu Trp

485 490 495

Ile Gly Asp Asp Ile Leu Val Ala His Asn Ala Ser Phe Asp Met Gly

500 505 510

Phe Leu Asn Val Ala Tyr Lys Lys Leu Leu Glu Val Glu Lys Ala Lys

515 520 525

Asn Pro Val Ile Asp Thr Leu Glu Leu Gly Arg Phe Leu Tyr Pro Glu

530 535 540

Phe Lys Asn His Arg Leu Asn Thr Leu Cys Lys Lys Phe Asp Ile Glu

545 550 555 560

Leu Thr Gln His His Arg Ala Ile Tyr Asp Thr Glu Ala Thr Ala Tyr

565 570 575

Leu Leu Leu Lys Met Leu Lys Asp Ala Ala Glu Lys Gly Ile Gln Tyr

580 585 590

His Asp Glu Leu Asn Glu Asn Met Gly Gln Ser Asn Ala Tyr Gln Arg

595 600 605

Ser Arg Pro Tyr His Ala Thr Leu Leu Ala Val Asn Ser Thr Gly Leu

610 615 620

Lys Asn Leu Phe Lys Leu Val Ser Leu Ser His Ile His Tyr Phe Tyr

625 630 635 640

Arg Val Pro Arg Ile Pro Arg Ser Gln Leu Glu Lys Tyr Arg Glu Gly

645 650 655

Leu Leu Ile Gly Ser Ala Cys Asp Arg Gly Glu Val Phe Glu Gly Met

660 665 670

Met Gln Lys Ser Pro Glu Glu Val Glu Asp Ile Ala Ser Phe Tyr Asp

675 680 685

Tyr Leu Glu Val Gln Pro Pro Glu Val Tyr Arg His Leu Leu Glu Leu

690 695 700

Glu Leu Val Arg Asp Glu Lys Ala Leu Lys Glu Ile Ile Ala Asn Ile

705 710 715 720

Thr Lys Leu Gly Glu Lys Leu Asn Lys Pro Val Val Ala Thr Gly Asn

725 730 735

Val His Tyr Leu Asn Asp Glu Asp Lys Ile Tyr Arg Lys Ile Leu Ile

740 745 750

Ser Ser Gln Gly Gly Ala Asn Pro Leu Asn Arg His Glu Leu Pro Lys

755 760 765

Val Hys Phe Arg Thr Thr Asp Glu Met Leu Glu Ala Phe Ser Phe Leu

770 775 780

GIy Glu Glu Lys Ala Lys Glu Ile Val Val Thr Asn Thr Gln Lys Val

785 790 795 800

Ala Ser Leu Val Asp Asp Ile Lys Pro Ile Lys Asp Asp Leu Tyr Thr

805 810 815

Pro Lys Ile Glu Gly Ala Asp Glu Glu Ile Arg Glu Met Ser Tyr Gln

820 825 830

Arg Ala Arg Ser Ile Tyr Gly Glu Glu Leu Pro Glu Ile ValGlu Ala

835 840 845

Arg Ile Glu Lys Glu Leu Lys Ser Ile Ile Gly His Gly Phe Ala Val

850 855 860

Ile Tyr Leu Ile Ser His Lys Leu Val Lys Arg Ser Leu Asp Asp Gly

865 870 875 880

Tyr Leu Val Gly Ser Arg Gly Ser Val Gly Ser Ser Leu Val Ala Thr

885 890 895

Leu Thr Glu Ile Thr Glu Val Asn Pro Leu Pro Pro His Tyr Val Cys

900 905 910

Pro Glu Cys Gln His Ser Glu Phe Phe Asn Asp Gly Ser Val Gly Ser

915 920 925

Gly Phe Asp Leu Pro Asp Lys Thr Cys Pro His Cys Gly Thr Pro Leu

930 935 940

Lys Lys Asp Gly His Asp Ile Pro Phe Glu Thr Phe Leu Gly Phe Lys

945 950 955 960

Gly Asp Lys Val Pro Asp Ile Asp Leu Asn Phe Ser Gly Glu Tyr Gln

965 970 975

Pro Gln Ala His Asn Tyr Thr Lys Val Leu Phe Gly Glu Asp Asn Val

980 985 990

Tyr Arg Ala Gly Thr Ile Gly Thr Val Ala Glu Lys Thr Ala Tyr Gly

995 1000 1005

Tyr Val Lys Gly Tyr Ala Gly Asp Asn Asn Leu His Met Arg Gly Ala

1010 1015 1020

Glu Ile Asp Arg Leu Val Gln Gly Cys Thr Gly Val Lys Arg Thr Thr

1025 1030 1035 1040

Gly Gln His Pro Gly Gly Ile Ile Val Val Pro Asp Tyr Met Asp Ile

1045 1050 1055

Tyr Asp Phe Ser Pro Ile Gln Phe Pro Ala Asp Ala Thr Gly Ser Glu

1060 1065 1070

Trp Lys Thr Thr His Phe Asp Phe His Ser Ile His Asp Asn Leu Leu

1075 1080 1085

Lys Leu Asp Ile Leu Gly His Asp Asp Pro Thr Val Ile Arg Met Leu

1090 1095 1100

Gln Asp Leu Ser Gly Ile Asp Pro Lys Thr Ile Pro Thr Asp Asp Pro

1105 1110 1115 1120

Glu Val Met Lys Ile Phe Gln Gly Thr Glu Ser Leu Gly Val Thr Glu

1125 1130 1135

Glu Gln Ile Gly Cys Lys Thr Gly Thr Leu Gly Ile Pro Glu Phe Gly

1140 1145 1150

Thr Arg Phe Val Arg Gln Met Leu Glu Asp Thr Lys Pro Thr Thr Phe

1155 1160 1165

Ser Glu Leu Val Gln Ile Ser Gly Leu Ser His Gly Thr Asp Val Trp

1170 1175 1180

Leu Gly Asn Ala Gln Glu Leu Ile His Asn Asn Ile Cys Glu Leu Ser

1185 1190 1195 1200

Glu Val Ile Gly Cys Arg Asp Asp Ile Met Val Tyr Leu Ile Tyr Gln

1205 1210 1215

Gly Leu Glu Pro Ser Leu Ala Phe Lys Ile Met Glu Phe Val Arg Lys

1220 1225 1230

Gly Lys Gly Leu Thr Pro Glu Trp Glu Glu Glu Met Lys Asn Asn Asn

1235 1240 1245

Val Pro Asp Trp Tyr Ile Asp Ser Cys Lys Lys Ile Lys Tyr Met Phe

1250 1255 1260

Pro Lys Ala His Ala Ala Ala Tyr Val Leu Met Ala Val Arg Ile Ala

1265 1270 1275 1280

Tyr Phe Lys Val His His Ala Leu Leu Tyr Tyr Ala Ala Tyr Phe Thr

1285 1290 1295

Val Arg Ala Asp Asp Phe Asp Ile Asp Thr Met Ile Lys Gly Ser Thr

1300 1305 1310

Ala Ile Arg Ala Val Met Glu Asp Ile Asn Ala Lys Gly Leu Asp Ala

1315 1320 1325

Ser Pro Lys Glu Lys Asn Leu Leu Thr Val Leu Glu Leu Ala Leu Glu

1330 1335 1340

Met Cys Glu Arg Gly Tyr Ser Phe Gln Lys Val Asp Leu Tyr Arg Ser

1345 1350 1355 1360

Ser Ala Thr G1u Phe Ile Ile Asp Gly Asn Ser Leu Ile Pro Pro Phe

1365 1370 1375

Asn Ser Ile Pro Gly Leu Gly Thr Asn Ala Ala Leu Asn Ile Val Lys

1380 1385 1390

Ala Arg Glu Glu Gly Glu Phe Leu Ser Lys Glu Asp Leu Gln Lys Arg

1395 1400 1405

Gly Lys Val Ser Lys Thr Ile Leu Glu Tyr Leu Asp Arg His Gly Cys

1410 1415 1420

Leu Glu Ser Leu Pro Asp Gln Asn Gln Leu Ser Leu Phe

1425 1430 1435

<210>45

<211>1081

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>45

Met Asn Arg Ser Gly Ile Ser Lys Lys Arg Pro Pro Pro Ser Asn Thr

1 5 10 15

Pro Pro Pro Ala Gly Lys His Arg Ala Thr Gly Asp Ser Thr Pro Ser

20 25 30

Pro Ala Ile Gly Thr Leu Asp Asp Glu Phe Met Met Glu Glu Asp Val

35 40 45

Phe Leu Asp Glu Thr Leu Leu Tyr Gly Asp Glu Asp Glu Glu Ser Leu

50 55 60

Ile Leu Arg Asp Ile Glu Glu Arg Glu Ser Arg Ser Ser Ala Trp Ala

65 70 75 80

Arg Pro Pro Leu Ser Pro Ala Tyr Leu Ser Asn Ser Gln Ile Phe Gln

85 90 95

Gln Leu Glu Ile Asp Ser Ile Ile Ala Glu Ser His Lys Glu Leu Leu

100 105 110

Pro Gly Ser Ser Gly Gln Ala Pro Ile Ile Arg Met Phe Gly Val Thr

115 120 125

Arg Glu Gly Asn Ser Val Cys Cys Phe Val His Gly Phe Glu Pro Tyr

130 135 140

Phe Tyr Ile Ala Cys Pro Pro Gly Met Gly Pro Asp Asp Ile Ser Asn

145 150 155 160

Phe His Gln Ser Leu Glu Gly Arg Met Arg Glu Ser Asn Lys Asn Ala

165 170 175

Lys Val Pro Lys Phe Val Lys Arg Ile Glu Met Val Gln Lys Arg Ser

180 185 190

Ile Met Tyr Tyr Gln Gln Gln Lys Ser Gln Thr Phe Leu Lys Ile Thr

195 200 205

Val Ala Leu Pro Thr Met Val Ala Ser Cys Arg Gly Ile Leu Asp Arg

210 215 220

Gly Leu Gln Ile Asp Gly Leu Gly Met Lys Ser Phe Gln Thr Tyr Glu

225 230 235 240

Ser Asn Ile Leu Phe Val Leu Arg Phe Met Val Asp Cys Asp Ile Val

245 250 255

Gly Gly Asn Trp Ile Glu Val Pro Thr Gly Lys Tyr Lys Lys Asn Ala

260 265 270

Arg Thr Leu Ser Tyr Cys Gln Leu Glu Phe His Cys Leu Tyr Ser Asp

275 280 285

Leu Ile Ser His Ala Ala Glu Gly Glu Tyr Ser Lys Met Ala Pro Phe

290 295 300

Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly His Phe

305 310 315 320

Pro Glu Ala Lys His Asp Pro Val Ile Gln Ile Ala Asn Leu Val Thr

325 330 335

Leu Gln Gly Glu Asp His Pro Phe Val Arg Asn Val Met Thr Leu Lys

340 345 350

Ser Cys Ala Pro Ile Val Gly Val Asp Val Met Ser Phe Glu Thr Glu

355 360 365

Arg Glu Val Leu Leu Ala Trp Arg Asp Leu Ile Arg Asp Val Asp Pro

370 375 380

Asp Ile Ile Ile Gly Tyr Asn Ile Cys Lys Phe Asp Leu Pro Tyr Leu

385 390 395 400

Ile Glu Arg Ala Ala Thr Leu Gly Ile Glu Glu Phe Pro Leu Leu Gly

405 410 415

Arg Val Lys Asn Ser Arg Val Arg Val Arg Asp Ser Thr Phe Ser Ser

420 425 430

Arg Gln Gln Gly Ile Arg Glu Ser Lys Glu Thr Thr Ile Glu Gly Arg

435 440 445

Phe Gln Phe Asp Leu Ile Gln Ala Ile His Arg Asp His Lys Leu Ser

450 455 460

Ser Tyr Ser Leu Asn Ser Val Ser Ala His Phe Leu Ser Glu Gln Lys

465 470 475 480

Glu Asp Val His His Ser Ile Ile Thr Asp Leu Gln Asn Gly Asn Ala

485 490 495

Glu Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu

500 505 510

Pro Gln Arg Leu Leu Asp Lys Leu Met Phe Ile Tyr Asn Tyr Val Glu

515 520 525

Met Ala Arg Val Thr Gly Val Pro Ile Ser Phe Leu Leu Ala Arg Gly

530 535 540

Gln Ser Ile Lys Val Leu Ser Gln Leu Leu Arg Lys Gly Lys Gln Lys

545 550 555 560

Ash Leu Val Leu Pro Asn Ala Lys Gln Ser Gly Ser Glu Gln Gly Thr

565 570 575

Tyr Glu Gly Ala Thr Val Leu Glu Ala Arg Thr Gly Phe Tyr Glu Lys

580 585 590

Pro Ile Ala Thr Leu Asp Phe Ala Ser Leu Tyr Pro Ser Ile Met Met

595 600 605

Ala Tyr Asn Leu Cys Tyr Cys Thr Leu Val Thr Pro Glu Asp Val Arg

610 615 620

Lys Leu Asn Leu Pro Pro Glu His Val Thr Lys Thr Pro Ser Gly Glu

625 630 635 640

Thr Phe Val Lys Gln Thr Leu Gln Lys Gly Ile Leu Pro Glu Ile Leu

645 650 655

Glu Glu Leu Leu Thr Ala Arg Lys Arg Ala Lys Ala Asp Leu Lys Glu

660 665 670

Ala Lys Asp Pro Leu Glu Lys Ala Val Leu Asp Gly Arg Gln Leu Ala

675 680 685

Leu Lys Ile Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala Thr Val

690 695 700

Gly Gln Leu Pro Cys Leu Glu Ile Ser Ser Ser Val Thr Ser Tyr Gly

705 710 715 720

Arg Gln Met Ile Glu Gln Thr Lys Lys Leu Val Glu Asp Lys Phe Thr

725 730 735

Thr Leu Gly Gly Tyr Gln Tyr Ash Ala Glu Val Ile Tyr Gly Asp Thr

740 745 750

Asp Ser Val Met Val Gln Phe Gly Val Ser Asp Val Glu Ala Ala Met

755 760 765

Thr Leu Gly Arg Glu Ala Ala Glu His Ile Ser Gly Thr Phe Ile Lys

770 775 780

Pro Ile Lys Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu Leu Ile

785 790 795 800

Asn Lys Lys Arg Tyr Ala Gly Leu Leu Trp Thr Asn Pro Gln Gln Phe

805 810 815

Asp Lys Met Asp Thr Lys Gly Ile Glu Thr Val Arg Arg Asp Asn Cys

820 825 830

Leu Leu Val Lys Asn Leu Val Thr Glu Ser Leu Asn Lys Ile Leu Ile

835 840 845

Asp Arg Asp Val Pro Gly Ala Ala Glu Asn Val Lys Lys Thr Ile Ser

850 855 860

Asp Leu Leu Met Asn Arg Ile Asp Leu Ser Leu Leu Val Ile Thr Lys

865 870 875 880

Gly Leu Thr Lys Thr Gly Asp Asp Tyr Glu Val Lys Ser Ala His Gly

885 890 895

Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Ala Ala Thr Ala Pro Asn

900 905 910

Val Gly Asp Arg Val Pro Tyr Val Ile Ile Lys Ala Ala Lys Gly Ala

915 920 925

Lys Ala Tyr Glu Arg Ser Glu Asp Pro Ile Tyr Val Leu Gln Asn Asn

930 935 940

Ile Pro Ile Asp Pro Asn Tyr Tyr Leu Glu Asn Gln Ile Ser Lys Pro

945 950 955 960

Leu Leu Arg Ile Phe Glu Pro Val Leu Lys Asn Ala Ser Lys Glu Leu

965 970 975

Leu His Gly Ser His Thr Arg Ser Ile Ser Ile Thr Thr Pro Ser Asn

980 985 990

Ser Gly Ile Met Lys Phe Ala Lys Lys Gln Leu Ser Cys Val Gly Cys

995 1000 1005

Lys Val Pro Ile Arg Tyr Phe Val Gln Trp Asn Thr Met Arg Lys Leu

1010 1015 1020

Gln Gly Lys Arg Ser Arg Val Ile Leu Gln Lys Arg Val Ser Arg Tyr

1025 1030 1035 1040

Ala Ala Trp Leu Ser Leu Lys Arg Phe Leu Gly Gly Cys Gly His Ser

1045 1050 1055

Ala Arg Ser Val Lys Ala Leu Phe Ile Lys Met Ser Cys Ala Pro Val

1060 1065 1070

Glu Ile Val Gln Tyr Phe Thr Gly Glu

1075 1080

<210>46

<211>2154

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>46

Met Ser Gly Arg Arg Cys Asp Arg Arg Leu Asn Val Gln Lys Val Ser

1 5 10 15

Ala Ala Asp Glu Leu Glu Thr Lys Leu Gly Phe Gly Leu Phe Ser Gln

20 25 30

Gly Glu Thr Arg Leu Gly Trp Leu Leu Thr Phe Ala Ser Ser Ser Trp

35 40 45

Glu Asp Ala Asp Thr Gly Lys Thr Phe Ser Cys Val Asp Leu Phe Phe

50 55 60

Val Thr Gln Asp Gly Ser Ser Phe Lys Thr Lys Tyr Lys Phe Arg Pro

65 70 75 80

Tyr Leu Tyr Ala Ala Thr Lys Asp Asn Met Glu Leu Glu Val Glu Ala

85 90 95

Tyr Leu Arg Arg Arg Tyr Glu Arg Gln Val Ala Asp Ile Gln Ile Val

100 105 110

His Lys Glu Asp Leu Tyr Leu Lys Asn His Leu Ser Gly Leu Gln Lys

115 120 125

Lys Tyr Leu Lys Val Ser Phe Asp Thr Val Gln Gln Leu Val Glu Val

130 135 140

Lys Arg Asp Leu Leu His Ile Val Glu Arg Asn Leu Ala Lys Phe Asn

145 150 155 160

Ala Leu Glu Ala Tyr Glu Ser Ile Leu Ser Gly Lys Arg Glu Gln Arg

165 170 175

Pro Gln Asp Cys Leu Asp Ser Val Val Asp Leu Arg Glu Tyr Asp Val

180 185 190

Pro Tyr His Val Arg Phe Ala Ile Asp Asn Asp Val Arg Ser Gly Gln

195 200 205

Trp Tyr Asn Val Ser Ile Ser Ser Thr Asp Val Ile Leu Glu Lys Arg

210 215 220

Thr Asp Leu Leu Gln Arg Ala Glu Val Arg Val Cys Ala Phe Asp Ile

225 230 235 240

Glu Thr Val Lys Leu Pro Leu Lys Phe Pro Asp Ala Glu Tyr Asp Gln

245 250 255

Ile Met Met Ile Ser Tyr Met Val Asp Gly Gln Gly Phe Leu Ile Thr

260 265 270

Asn Arg Glu Cys Val Gly Lys Asp Ile Glu Asp Leu Glu Tyr Thr Pro

275 280 285

Lys Pro Glu Phe Glu Gly Tyr Phe Lys Val Thr Asn Val Thr Asn Glu

290 295 300

Val Glu Leu Leu Arg Lys Trp Phe Ser His Met Gln Glu Leu Lys Pro

305 310 315 320

Gly Ile Tyr Val Thr Tyr Asn Gly Asp Phe Phe Asp Trp Pro Phe Ile

325 330 335

Glu Arg Arg Ala Ser His His Gly Ile Lys Met Asn Glu Glu Leu Gly

340 345 350

Phe Arg Cys Asp Gln Asn Gln Gly Glu Cys Arg Ala Lys Phe Val Cys

355 360 365

His Leu Asp Cys Phe Ser Trp Val Lys Arg Asp Ser Tyr Leu Pro Gln

370 375 380

Gly Ser Gln Gly Leu Lys Ala Val Thr Lys Val Lys Leu Gly Tyr Asp

385 390 395 400

Pro Leu Glu Val Asn Pro Glu Asp Met Val Arg Phe Ala Met Glu Lys

405 410 415

Pro Gln Thr Met Ala Ser Tyr Ser Val Ser Asp Ala Val Ala Thr Tyr

420 425 430

Tyr Leu Tyr Met Thr Tyr Val His Pro Phe Val Phe Ser Leu Ala Thr

435 440 445

Ile Ile Pro Met Val Pro Asp Glu Val Leu Arg Lys Gly Ser Gly Thr

450 455 460

Leu Cys Glu Met Leu Leu Met Val Glu Ala Tyr Lys Ala Asn Val Val

465 470 475 480

Cys Pro Asn Lys Asn Gln Ala Asp Pro Glu Lys Phe Tyr Gln Gly Lys

485 490 495

Leu Leu Glu Ser Glu Thr Tyr Ile Gly Gly His Val Glu Cys Leu Gln

500 505 510

Ser Gly Val Phe Arg Ser Asp Ile Pro Thr Ser Phe Lys Leu Asp Ala

515 520 525

Ser Ala Tyr Gln Gln Leu Ile Asp Asn Leu Gly Arg Asp Leu Glu Tyr

530 535 540

Ala Ile Thr Val Glu Gly Lys Met Arg Met Asp Ser Val Ser Asn Phe

545 550 555 560

Asp Glu Val Lys Glu Val Ile Arg Glu Lys Leu Glu Lys Leu Arg Asp

565 570 575

Asp Pro Ile Arg Glu Glu Gly Pro Leu Ile Tyr His Leu Asp Val Ala

580 585 590

Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu Gln Pro Pro Ser

595 600 605

Ile Val Thr Asp Glu Val Cys Thr Ala Cys Asp Phe Asn Gly Pro Glu

610 615 620

Lys Thr Cys Leu Arg Lys Leu Glu Trp Val Trp Arg Gly Val Thr Phe

625 630 635 640

Lys Gly Asn Lys Ser Glu Tyr Tyr His Leu Lys Lys Gln Ile Glu Ser

645 650 655

Glu Ser Val Asp Ala Gly Ala Asn Met Gln Ser Ser Lys Pro Phe Leu

660 665 670

Asp Leu Pro Lys Val Glu Gln Gln Ser Lys Leu Lys Glu Arg Leu Lys

675 680 685

Lys Tyr Cys Gln Lys Ala Tyr Ser Arg Val Leu Asp Lys Pro Ile Thr

690 695 700

Glu Val Arg Glu Ala Gly Ile Cys Met Arg Glu Asn Pro Phe Tyr Val

705 710 715 720

Asp Thr Val Arg Ser Phe Arg Asp Arg Arg Tyr Glu Tyr Lys Thr Leu

725 730 735

Asn Lys Val Trp Lys Gly Lys Leu Ser Glu Ala Lys Ala Ser Gly Asn

740 745 750

Leu Ile Lys Ile Gln Glu Ala His Asp Met Val Val Val Tyr Asp Ser

755 760 765

Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr Gly Tyr Val

770 775 780

Met Arg Lys Gly Ala Arg Trp Tyr Ser Met Glu Met Ala Gly Val Val

785 790 795 800

Thr Tyr Thr Gly Ala Lys Ile Ile Gln Asn Ala Arg Leu Leu Ile Glu

805 810 815

Arg Ile Gly Lys Pro Leu Glu Leu Asp Thr Asp Gly Ile Trp Cys Ala

820 825 830

Leu Pro Gly Ser Phe Pro Glu Asn Phe Thr Phe Lys Thr Ile Asp Met

835 840 845

Lys Lys Phe Thr Ile Ser Tyr Pro Cys Val Ile Leu Asn Val Asp Val

850 855 860

Ala Lys Asn Asn Ser Asn Asp Gln Tyr Gln Thr Leu Val Asp Pro Val

865 870 875 880

Arg Lys Thr Tyr Asn Ser Arg Ser Glu Cys Ser Ile Glu Phe Glu Val

885 890 895

Asp Gly Pro Tyr Lys Ala Met Ile Ile Pro Ala Ser Lys Glu Glu Gly

900 905 910

Ile Leu Ile Lys Lys Arg Tyr Ala Val Phe Asn His Asp Gly Thr Ile

915 920 925

Ala Glu Leu Lys Gly Phe Glu Met Lys Arg Arg Gly Glu Leu Lys Leu

930 935 940

Ile Lys Val Phe Gln Ala Glu Leu Phe Asp Lys Phe Leu His Gly Ser

945 950 955 960

Thr Leu Glu Glu Cys Tyr Ser Ala Val Ala Ala Val Ala Asn Arg Trp

965 970 975

Leu Asp Leu Leu Glu Gly Gln Gly Lys Asp Ile Ala Asp Ser Glu Leu

980 985 990

Leu Asp Tyr Ile Ser Glu Ser Ser Thr Met Ser Lys Ser Leu Ala Asp

995 1000 1005

Tyr Gly Gln Gln Lys Ser Cys Ala Val Thr Thr Ala Lys Arg Leu Ala

1010 1015 1020

Asp Phe Leu Gly Asp Thr Met Val Lys Asp Lys Gly Leu Arg Cys Gln

1025 1030 1035 1040

Tyr Ile Val Ala Arg Glu Pro Glu Gly Thr Pro Val Ser Glu Arg Ala

1045 1050 1055

Val Pro Val Ala Ile Phe Gln Thr Asp Asp Pro Glu Lys Lys Phe Tyr

1060 1065 1070

Leu Gln Lys Trp Cys Lys Ile Ser Ser Tyr Thr Gly Ile Arg Ser Ile

1075 1080 1085

Ile Asp Trp Met Tyr Tyr Lys Gln Arg Leu His Ser Ala Ile Gln Lys

1090 1095 1100

Val Ile Thr Ile Pro Ala Ala Met Gln Lys Val Ala Asn Pro Val Leu

1105 1110 1115 1120

Arg Val Arg His Pro Tyr Trp Leu Glu Lys Lys Val Cys Asp Lys Phe

1125 1130 1135

Arg Gln Gly Lys Ile Val Asp Met Phe Ser Ser Ala Asn Lys Asp His

1140 1145 1150

Ser Thr Thr Gln Asp Asn Val Val Ala Asp Ile Glu Glu Phe Cys Lys

1155 1160 1165

Glu Asn Arg Pro Ser Val Lys Gly Pro Lys Pro Val Ala Arg Ser Phe

1170 1175 1180

Glu Val Asp Arg Asn His Ser Glu Gly Lys Gln Gln Glu Ser Trp Asp

1185 1190 1195 1200

Pro Glu Phe His Asp Ile Ser Leu Gln Asn Val Asp Lys Asn Val Asp

1205 1210 1215

Tyr Gln Gly Trp Leu Glu Leu Glu Lys Arg Lys Trp Lys Met Thr Leu

1220 1225 1230

Thr Asn Lys Lys Lys Arg Arg Phe Asp Asp Leu Lys Pro Cys Asn Gln

1235 1240 1245

Ile Asp Ala His Lys Ile Asn Lys Lys Val Cys Lys Gly Arg Val Gly

1250 1255 1260

Val Gly Ser Tyr Phe Arg Arg Pro Glu Glu Ala Leu Thr Ser Ser Tyr

1265 1270 1275 1280

Leu Gln Ile Ile Gln Leu Val Gln Ser Pro Gln Ser Gly Gln Phe Phe

1285 1290 1295

Ala Trp Val Val Val Glu Gly Leu Met Leu Lys Ile Pro Leu Thr Ile

1300 1305 1310

Pro Arg Val Phe Tyr Ile Asn Ser Lys Ala Ser Ile Ala Gly Asn Phe

1315 1320 1325

Thr Gly Lys Cys Ile Asn Lys Ile Leu Pro His Gly Lys Pro Cys Tyr

1330 1335 1340

Asn Leu Met Glu Ala Arg His Leu His Asn Thr His Ile Leu Leu Leu

1345 1350 1355 1360

Val Asn Ile Gln Glu Asp Gln Phe Ile Lys Glu Ser Lys Lys Leu Ala

1365 1370 1375

Ala Leu Leu Ala Asp Pro Glu Ile Glu Gly Ile Tyr Glu Thr Lys Met

1380 1385 1390

Pro Leu Glu Phe Ser Ala Ile Cys Gln Ile Gly Cys Val Cys Lys Ile

1395 1400 1405

Glu Asp Thr Ala Lys His Arg Asn Thr Gln Asp Gly Trp Lys Leu Gly

1410 1415 1420

Glu Leu His Arg Ile Thr Thr Thr Glu Cys Arg Tyr Leu Glu Asn Ser

1425 1430 1435 1440

Ile Pro Leu Val Tyr Leu Tyr His Ser Thr Ser Thr Gly Arg Ala Val

1445 1450 1455

Tyr Val Leu Tyr Cys His Ala Ser Lys Leu Met Ser Val Val Val Val

1460 1465 1470

Asn Pro Tyr Gly Asp Lys Glu Leu Leu Ser Ser Ala Leu Glu Arg Gln

1475 1480 1485

Phe Arg Asp Arg Cys Gln Glu Leu Ser Pro Glu Pro Phe Ser Trp Asp

1490 1495 1500

Gly Ile Leu Phe Gin Val Glu Tyr Val Asp His Pro Glu Ala Ala Thr

1505 1510 1515 1520

Lys Phe Leu Gln Lys Ala Leu Cys Glu Tyr Arg Glu Glu Asn Cys Gly

1525 1530 1535

Ala Thr Val Ala Val Ile Glu Cys Pro Asp Phe Asn Thr Thr Lys Glu

1540 1545 1550

Gly Val Lys Ala Leu Glu Asp Phe Pro Cys Val Arg Ile Pro Phe Asn

1555 1560 1565

Asp Asp Asp Asn Ser Tyr Gln Pro Val Ser Trp Gln Arg Pro Ala Ala

1570 1575 1580

Lys Ile Ala Val Leu Arg Cys Ala Ser Ala Ile Gln Trp Leu Asp Arg

1585 1590 1595 1600

Arg Ile Ala Gln Ser Arg Tyr Ala His Val Pro Leu Gly Asn Phe Gly

1605 1610 1615

Arg Asp Trp Leu Thr Phe Thr Val Asp Ile Phe Leu Ser Arg Ala Leu

1620 1625 1630

Arg Asp Gln Gln Gln Val Leu Trp Val Ser Asp Asn Gly Val Pro Asp

1635 1640 1645

Leu Gly Asp Ile Asn Asn Glu Glu Thr Phe Leu Ala Asp Glu Leu Gln

1650 1655 1660

Glu Thr Ser Leu Leu Phe Pro Gly Ala Tyr Arg Lys Val Ser Val Glu

1665 1670 1675 1680

Leu Lys Val His Arg Leu Ala Val Asn Ala Leu Leu Lys Ser Asp Leu

1685 1690 1695

Val Ser Glu Met Glu Gly Gly Gly Phe Leu Gly Val Asn Ser Arg Gly

1700 1705 1710

Ser Ser Leu Asn Asp Asn Gly Ser Phe Asp Glu Asn Asn Gly Cys Ala

1715 1720 1725

Gln Ala Phe Arg Val Leu Lys Gln Leu Ile Lys Arg Leu Leu His Asp

1730 1735 1740

Ala Cys Asn Ser Gly Asn Ile Tyr Ala Asp Ser Ile Leu Gln His Leu

1745 1750 1755 1760

Ser Trp Trp Leu Arg Ser Pro Ser Ser Lys Leu His Asp Pro Ala Leu

1765 1770 1775

His Leu Met Leu His Lys Val Met Gln Lys Val Phe Ala Leu Leu Leu

1780 1785 1790

Thr Asp Leu Arg Arg Leu Gly Ala Ile Ile Ile Tyr Ala Asp Phe Ser

1795 1800 1805

Lys Val Ile Ile Asp Thr Gly Lys Phe Asp Leu Ser Ala Ala Lys Thr

1810 1815 1820

Tyr Cys Glu Ser Leu Leu Thr Val Met Gly Ser Arg Asp Ile Phe Lys

1825 1830 1835 1840

Leu Ile Leu Leu Glu Pro Val His Tyr Trp His Ser Leu Leu Phe Met

1845 1850 1855

Asp Gln His Asn Tyr Ala Gly Ile Arg Ala Thr Gly Asp Glu Ile Ser

1860 1865 1870

Gly Asn Glu Val Thr Ile Glu Pro Lys Trp Ser Val Ala Arg His Leu

1875 1880 1885

Pro Glu Tyr Ile Gln Lys Asp Phe Ile Ile Ile Val Ala Thr Phe Ile

1890 1895 1900

Phe Gly Pro Trp Lys Phe Ala Leu Glu Lys Lys Arg Gly Ser Ala Glu

1905 1910 1915 1920

Ser Leu Glu Ala Glu Met Val Glu Tyr Leu Lys Glu Gln Ile Gly Thr

1925 1930 1935

Arg Phe Ile Ser Met Ile Val Glu Lys Ile Gly Asn Ile Arg Ser His

1940 1945 1950

Ile Lys Asp Ile Asn Val Ser Asp Ala Ser Trp Ala Ser Gly Gln Ala

1955 1960 1965

Pro Lys Gly Asp Tyr Thr Phe Glu Phe Ile Gln Ile Ile Thr Ala Val

1970 1975 1980

Leu Ala Leu Asp Gln Asn Val Gln Gln Asp Val Leu Val Met Arg Lys

1985 1990 1995 2000

Ile Leu Leu Lys Tyr Ile Lys Val Lys Glu Cys Ala Ala Glu Ala Glu

2005 2010 2015

Phe Ile Asp Pro Gly Pro Ser Phe Ile Leu Pro Asn Val Ala Cys Ser

2020 2025 2030

Asn Cys Gly Ala Tyr Arg Asp Leu Asp Phe Cys Arg Asp Ser Ala Leu

2035 2040 2045

Leu Thr Glu Lys Glu Trp Ser Cys Ala Asp Pro Gln Cys Val Lys Ile

2050 2055 2060

Tyr Asp Lys Glu Gln Ile Glu Ser Ser Ile Ile Gln Met Val Arg Gln

2065 2070 2075 2080

Arg Glu Arg Met Tyr Gln Leu Gln Asp Leu Val Cys Asn Arg Cys Asn

2085 2090 2095

Gln Val Lys Ala Ala His Leu Thr Glu Gln Cys Glu Cys Ser Gly Ser

2100 2105 2110

Phe Arg Cys Lys Glu Ser Gly Ser Asp Phe His Lys Arg Ile Glu Ile

2115 2120 2125

Phe Leu Asp Ile Ala Lys Arg Gln Lys Phe Arg Leu Leu Glu Glu Cys

2130 2135 2140

Ile Ser Trp Ile Leu Phe Ala Thr Ser Cys

2145 2150

<210>47

<211>3706

<212>DNA

<213>稻(Oryza sativa)

<400>47

ctctcttccc gcgttcccct ctccctcccc ctcccccctc tccggcgatg agctcaggcg 60

gacgcggcgg caagcggcga ggggcgccgc ccccggggcc atccggggcg gcggcgaagc 120

gggcccaccc cggtggcacc ccgcagccgc ctccgcccgc cgcgacggcg gcggcgcccg 180

tggcggagga ggaggacatg atggacgagg acgtcttcct cgacgagacc atcctggcgg 240

aggacgagga ggcgttgctg ctgctcgacc gggacgaggc cctcgcctca cgcctctccc 300

gctggaggcg ccccgcgctc cccgccgacc tagcgtccgg ctgctcgcgc aatgttgctt 360

ttcagcagct ggagaragat tatgttattg gtgagagcca caaagtactg ctccccaact 420

catctggtcc tgcagctata ctcaggatat ttggcgtaac tagagaaggt cacagtgtat 480

gctgccaagt gcatggattt gagccatatt tttacatcag ttgtccaatg gggatgggcc 540

ctgatgatat ttcacgcttc caccaaacac tagaggggag gatgaaggat tcaaatagga 600

acagcaacgt gccaaggttt gtgaagagaa tcgaacttgt gcagaagcag acaatcatgc 660

attaccaacc acagcaatct cagcctttcc tcaagatagt ggttgctttg ccaacaatgg 720

ttgctagttg tcgcggcatc ctggaaaggg gcataacaat tgaaggcctt ggttcgaaga 780

gttttctgac atatgaaagc aacattcttt ttgcacttcg cttcatgatt gactgcaata 840

ttgttggtgg taattggatt gaagttcctg ccggaaagta tatgaaggca gctcgtatca 900

tgtcctattg tcagctagag ttggattgcc tatattcgga tttggtaagc catgctgctg 960

aaggagaaca ttctaagatg gctccatttc gcatattaag ttttgatatt gaatgtgccg 1020

gtcgcaaagg tcacttccca gaaccaactc atgatcccgt tattcagata gctaacttgg 1080

tcacccttca aggagaagga caaccttttg tacgcaatgt tatgacgctt aaatcatgtt 1140

ctcccattgt tggagttgat gttatgtcat ttgacacaga gagggatgtt ctacttgctt 1200

ggagggattt catacgtgaa gtggaccctg atattattat tggatacaat atctgcaaat 1260

ttgacttacc ctatcttatt gagagagctg aagttcttaa gatagtagag tttccaatac 1320

ttggacgaat cagaaatagt cgtgttcgtg tccgtgacac aactttctct tcaaggcaat 1380

atggtatgcg tgaaagtaaa gatgtagcag tggaaggaag agtacaattt gatcttctgc 1440

aggctatgca acgggattac aagcttagtt cttattcatt aaactctgta tctgcacatt 1500

tcctcgggga gcaaaaagag gatgttcatc actcaattat atctgatctt caaaatggga 1560

attcagagac acgaagacgg cttgcggttt attgtttgaa ggatgcctat cttccacaac 1620

gactgctaga taagttgatg tatatctaca actatgtgga aatggcaaga gtcactggag 1680

ttcccatttc atttcttctt tcaaggggac agagcattaa ggtcctctca cagctactca 1740

ggaaagcaaa acagaaaaac cttgttatac caaatataaa gggtcaagcg tctggacagg 1800

atacctttga aggtgcaact gttttggagg caagggctgg attttatgag aaacccattg 1860

cgactttgga ctttgcttcg ttgtatccat ccatcatgat ggcatataac ctatgctact 1920

gtactttggt cccccctgag gatgcccgca aactcaacct gcctccagaa agtgtcaaca 1980

aaaccccatc tggtgaaaca tttgtgaaac cagatgtgca aaagggtata cttcctgaaa 2040

tccttgaaga attgttggct gctcggaaaa gggcgaaagc agatttgaag gaagcaaagg 2100

atccatttga aagggccgtt cttgatggtc gtcagcttgc cctaaaaata agcgcaaact 2160

ctgtctatgg ttttactgga gcgactgttg gtcaattacc ttgtttagaa atttcttcaa 2220

gtgtgaccag ctatggtcga cagatgattg aacatacaaa aaagcttgtt gaagataaat 2280

tcacgacact tggaggctat gagcacaatg cagaggtcat ctatggagat actgattctg 2340

taatggtaca gttcggtgtt tctactgttg aggacgcaat gaagctagga agagaagctg 2400

cagactacat tagtggaaca tttattaagc ccatcaagct tgagtttgag aagatctatt 2460

tcccttatct actgattagc aagaagagat atgctggttt gtactggaca aatcctgaga 2520

aatttgacaa aatggacacg aaaggtattg aaacagtgag aagggacaac tgtttattag 2580

taaagaacct ggttactgag tgccttcata aaatactagt ggacagagat gttcctggtg 2640

cagttcaata tgtcaagaac accatttctg atctactaat gaaccgtgta gacttatctc 2700

ttctagttat aacaaagggt ttgactaaaa caggagagga ttatgctgtc aaagctgccc 2760

atgtggagct tgctgagaga atgcgaaaga gggacgctgc tactgctcct actgttggtg 2820

accgggttcc ttatgttata atcaaagcag caaaaggggc aaaggcatat gagaggtcag 2880

aagatcctat ttatgttttg gataataaca taccaataga tccccaatac taccttgaga 2940

accaaatcag caaaccactt ttgaggatct ttgagccgat tctgaagaat gccagtagag 3000

agctgcttca tggaagtcac accagggctg tttcaatctc aactccttca aatagtggaa 3060

taatgaaatt tgcaaagaaa caattgacat gcctcggatg caaagcagtt ataagtggtt 3120

ccaatcaaac gctttgcttt cattgcaagg gaagagaagc agagttatac tgcaaaactg 3180

taggaaacgt ttctgagctg gagatgctct ttgggaggct ctggacgcag tgccaggagt 3240

gccaaggctc ccttcatcag gacgttctct gcacaagccg ggattgtcct attttctacc 3300

gccgaagaaa ggcgcagaag gatatggctg aagctagagt acagcttcaa cgttgggact 3360

tctgagtcct ctcatactga cggagtacta ctttccccaa atattgcgaa accattactg 3420

tgaggcacgc cattgcggga tcatgtgatt gcatcttcat gcatgatggc tctggcttgt 3480

ttagttggat cggctgaaat agctttgttc tacggtcagt ttgttgtatt tttaggtggt 3540

aggttatctg tacctctagc cgctaacagg gtaatctagt tgcttccctt ggtgcattga 3600

tgcagccatg tgtaaggtag ataaacaatt ttttttcatc atcttttaac ttcatgaggt 3660

gattgaggct gagaagcacc cattcaagaa aaaaaaaaaa aaaaaa 3706

<210>48

<211>1105

<212>PRT

<213>稻(Oryza sativa)

<400>48

Met Ser Ser Gly Gly Arg Gly Gly Lys Arg Arg Gly Ala Pro Pro Pro

1 5 10 15

Gly Pro Ser Gly Ala Ala Ala Lys Arg Ala His Pro Gly Gly Thr Pro

20 25 30

Gln Pro Pro Pro Pro Ala Ala Thr Ala Ala Ala Pro Val Ala Glu Glu

35 40 45

Glu Asp Met Met Asp Glu Asp Val Phe Leu Asp Glu Thr Ile Leu Ala

50 55 60

Glu Asp Glu Glu Ala Leu Leu Leu Leu Asp Arg Asp Glu Ala Leu Ala

65 70 75 80

Ser Arg Leu Ser Arg Trp Arg Arg Pro Ala Leu Pro Ala Asp Leu Ala

85 90 95

Ser Gly Cys Ser Arg Asn Val Ala Phe Gln Gln Leu Glu Ile Asp Tyr

100 105 110

Val Ile Gly Glu Ser His Lys Val Leu Leu Pro Asn Ser Ser Gly Pro

115 120 125

Ala Ala Ile Leu Arg Ile Phe Gly Val Thr Arg Glu Gly His Ser Val

130 135 140

Cys Cys Gln Val His Gly Phe Glu Pro Tyr Phe Tyr Ile Ser Cys Pro

145 150 155 160

Met Gly Met Gly Pro Asp Asp Ile Ser Arg Phe His Gln Thr Leu Glu

165 170 175

Gly Arg Met Lys Asp Ser Asn Arg Asn Ser Asn Val Pro Arg Phe Val

180 185 190

Lys Arg Ile Glu Leu Val Gln Lys Gln Thr Ile Met His Tyr Gln Pro

195 200 205

Gln Gln Ser Gln Pro Phe Leu Lys Ile Val Val Ala Leu Pro Thr Met

210 215 220

Val Ala Ser Cys Arg Gly Ile Leu Glu Arg Gly Ile Thr Ile Glu Gly

225 230 235 240

Leu Gly Ser Lys Ser Phe Leu Thr Tyr Glu Ser Asn Ile Leu Phe Ala

245 250 255

Leu Arg Phe Met Ile Asp Cys Asn Ile Val Gly Gly Asn Trp Ile Glu

260 265 270

Val Pro Ala Gly Lys Tyr Met Lys Ala Ala Arg Ile Met Ser Tyr Cys

275 280 285

Gln Leu Glu Leu Asp Cys Leu Tyr Ser Asp Leu Val Ser His Ala Ala

290 295 300

Glu Gly Glu His Ser Lys Met Ala Pro Phe Arg Ile Leu Ser Phe Asp

305 310 315 320

Ile Glu Cys Ala Gly Arg Lys Gly His Phe Pro Glu Pro Thr His Asp

325 330 335

Pro Val Ile Gln Ile Ala Asn Leu Val Thr Leu Gln Gly Glu Gly Gln

340 345 350

Pro Phe Val Arg Asn Val Met Thr Leu Lys Ser Cys Ser Pro Ile Val

355 360 365

Gly Val Asp Val Met Ser Phe Asp Thr Glu Arg Asp Val Leu Leu Ala

370 375 380

Trp Arg Asp Phe Ile Arg Glu Val Asp Pro Asp Ile Ile Ile Gly Tyr

385 390 395 400

Asn Ile Cys Lys Phe Asp Leu Pro Tyr Leu Ile Glu Arg Ala Glu Val

405 410 415

Leu Lys Ile Val Glu Phe Pro Ile Leu Gly Arg Ile Arg Asn Ser Arg

420 425 430

Val Arg Val Arg Asp Thr Thr Phe Ser Ser Arg Gln Tyr Gly Met Arg

435 440 445

Glu Ser Lys Asp Val Ala Val Glu Gly Arg Val Gln Phe Asp Leu Leu

450 455 460

Gln Ala Met Gln Arg Asp Tyr Lys Leu Ser Ser Tyr Ser Leu Asn Ser

465 470 475 480

Val Ser Ala His Phe Leu Gly Glu Gln Lys Glu Asp Val His His Ser

485 490 495

Ile Ile Ser Asp Leu Gln Asn Gly Asn Ser Glu Thr Arg Arg Arg Leu

500 505 510

Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu Pro Gln Arg Leu Leu Asp

515 520 525

Lys Leu Met Tyr Ile Tyr Asn Tyr Val Glu Met Ala Arg Val Thr Gly

530 535 540

Val Pro Ile Ser Phe Leu Leu Ser Arg Gly Gln Ser Ile Lys Val Leu

545 550 555 560

Ser Gln Leu Leu Arg Lys Ala Lys Gln Lys Asn Leu Val Ile Pro Asn

565 570 575

Ile Lys Gly Gln Ala Ser Gly Gln Asp Thr Phe Glu Gly Ala Thr Val

580 585 590

Leu Glu Ala Arg Ala Gly Phe Tyr Glu Lys Pro Ile Ala Thr Leu Asp

595 600 605

Phe Ala Ser Leu Tyr Pro Ser Ile Met Met Ala Tyr Asn Leu Cys Tyr

610 615 620

Cys Thr Leu Val Pro Pro Glu Asp Ala Arg Lys Leu Asn Leu Pro Pro

625 630 635 640

Glu Ser Val Asn Lys Thr Pro Ser Gly Glu Thr Phe Val Lys Pro Asp

645 650 655

Val Gln Lys Gly Ile Leu Pro Glu Ile Leu Glu Glu Leu Leu Ala Ala

660 665 670

Arg Lys Arg Ala Lys Ala Asp Leu Lys Glu Ala Lys Asp Pro Phe Glu

675 680 685

Arg Ala Val Leu Asp Gly Arg Gln Leu Ala Leu Lys Ile Ser Ala Asn

690 695 700

Ser Val Tyr Gly Phe Thr Gly Ala Thr Val Gly Gln Leu Pro Cys Leu

705 710 715 720

Glu Ile Ser Ser Ser Val Thr Ser Tyr Gly Arg Gln Met Ile Glu His

725 730 735

Thr Lys Lys Leu Val Glu Asp Lys Phe Thr Thr Leu Gly Gly Tyr Glu

740 745 750

His Asn Ala Glu Val Ile Tyr Gly Asp Thr Asp Ser Val Met Val Gln

755 760 765

Phe Gly Val Ser Thr Val Glu Asp Ala Met Lys Leu Gly Arg Glu Ala

770 775 780

Ala Asp Tyr Ile Ser Gly Thr Phe Ile Lys Pro Ile Lys Leu Glu Phe

785 790 795 800

Glu Lys Ile Tyr Phe Pro Tyr Leu Leu Ile Ser Lys Lys Arg Tyr Ala

805 810 815

Gly Leu Tyr Trp Thr Asn Pro Glu Lys Phe Asp Lys Met Asp Thr Lys

820 825 830

Gly Ile Glu Thr Val Arg Arg Asp Asn Cys Leu Leu Val Lys Asn Leu

835 840 845

Val Thr Glu Cys Leu His Lys Ile Leu Val Asp Arg Asp Val Pro Gly

850 855 860

Ala Val Gln Tyr Val Lys Asn Thr Ile Ser Asp Leu Leu Met Asn Arg

865 870 875 880

Val Asp Leu Ser Leu Leu Val Ile Thr Lys Gly Leu Thr Lys Thr Gly

885 890 895

Glu Asp Tyr Ala Val Lys Ala Ala His Val Glu Leu Ala Glu Arg Met

900 905 910

Arg Lys Arg Asp Ala Ala Thr Ala Pro Thr Val Gly Asp Arg Val Pro

915 920 925

Tyr Val Ile Ile Lys Ala Ala Lys Gly Ala Lys Ala Tyr Glu Arg Ser

930 935 940

Glu Asp Pro Ile Tyr Val Leu Asp Asn Asn Ile Pro Ile Asp Pro Gln

945 950 955 960

Tyr Tyr Leu Glu Asn Gln Ile Ser Lys Pro Leu Leu Arg Ile Phe Glu

965 970 975

Pro Ile Leu Lys Asn Ala Ser Arg Glu Leu Leu His Gly Ser His Thr

980 985 990

Arg Ala Val Ser Ile Ser Thr Pro Ser Asn Ser Gly Ile Met Lys Phe

995 1000 1005

Ala Lys Lys Gln Leu Thr Cys Leu Gly Cys Lys Ala Val Ile Ser Gly

1010 1015 1020

Ser Asn Gln Thr Leu Cys Phe His Cys Lys Gly Arg Glu Ala Glu Leu

1025 1030 1035 1040

Tyr Cys Lys Thr Val Gly Asn Val Ser Glu Leu Glu Met Leu Phe Gly

1045 1050 1055

Arg Leu Trp Thr Gln Cys Gln Glu Cys Gln Gly Ser Leu His Gln Asp

1060 1065 1070

Val Leu Cys Thr Ser Arg Asp Cys Pro Ile Phe Tyr Arg Arg Arg Lys

1075 1080 1085

Ala Gln Lys Asp Met Ala Glu Ala Arg Val Gln Leu Gln Arg Trp Asp

1090 1095 1100

Phe

1105

<210>49

<211>3427

<212>DNA

<213>大豆(Glycine max)

<400>49

tgattaccct cccactccac actctccgct gtctctccct cccaattccg atgagcaaca 60

acgcctcccg gaagcgcgcg ccgccgcctc cgtcccaacc tccgccggcg aacaagccct 120

aatgactcag gaagaagagt tcatggacga agacgtgttc ataaacgaaa ccctcgtctc 180

cgaggacgaa gaatccctca ttctccgcga cattgagcag cgccaggccc tcgccaaccg 240

cctctccaag tggacacgtc ctcctctctc cgccggctac gtcgcccaat ctcgtagcgt 300

cctttttcag cagctagaga ttgattacgt gattgcagag agtcacgggg agttgctgcc 360

gaactcgtct ggacctgtcg ccattatcag aatatttgga gttactaagg aaggacacag 420

tgtttgttgc aatgttcatg ggtttgaacc atatttctac atctgttgcc ctcctggaat 480

gggtccagat gatatctccc attttcatca aactctcgag ggaaggatga gagaagccaa 540

tagaaacagt aatgtgggaa aattcgttcg ccgtattgaa atggtgcaga gaaggagtat 600

tatgtactat cagcaatcca attcccaacc ctttctcaaa attgtagttg cactcccaac 660

aatggttgcc agctgccgtg gtattcttga taggggtatt caacttgatg gtctgggaat 720

gaagagcttc ttgacttatg aaagcaatgt actttttgcc cttcgcttca tgattgattg 780

taacatagtt ggtggaaatt ggattgggat tcctgccgga aaatataaga aaacagcgaa 840

aagcttgtct tactgccagt tagagtttga ttgcttgtat tctgaattga ttagtcatgc 900

tccagaaggg gaatattcaa agatggctcc gtttcgcatt ttgagttttg acatcgagtg 960

tgctggtcgt aaaggtcatt ttcctgagcc tacccatgat cctgttatcc agattgctaa 1020

tttggttact ttacaaggag aagaccagcc atttattcgt aatgtgatga cccttaaatc 1080

atgttctcct atcgttggtg ttgatgtgat gccatttgaa acagaaagag aagtcctgct 1140

ggcttggagg gattttattc gtgaagtgga ccctgatatt attattggat acaacatttg 1200

caaatttgac ttgccatatc ttattgagag agctttgaac ctgaagatag cagaatttcc 1260

aattctgggt cgtatcagga acagtagagt tcgagtaaag gatacaactt tctcatcaag 1320

gcagtacgga accagggaaa gtaaagaagt tgcagtagaa gggagagtta cgtttgattt 1380

actccaggtt atgcaaagag actacaaatt aagttcttat tcactgaatt ctgtgtcatc 1440

acacttcctt tctgagcaga aagaggatgt tcatcattca attatatccg atcttcagaa 1500

tggaaatgca gaaactagga ggcgccttgc tgtgtattgt ttgaaggatg catatctccc 1560

tcagcggctt ttggataaat tgatgttcat ttacaattat gtggagatgg ctcgagtaac 1620

aggtgtccca atttcttttc tactttccag aggccaaagc attaaggtac tttctcaact 1680

tcttaggagg gcaaggcaga agaatctggt cattcctaat gccaaacagg ctgggtctga 1740

acaaggaaca tttgaaggtg ccactgtatt ggaggcaagg gctggatttt atgaaaaacc 1800

aattgctact ttagattttg catccttgta tccatctatt atgatggcct ataacttatg 1860

ttattgcact ctggtgatcc ctgaagatgc tcgcaagctc aacatacctc cagagtctgt 1920

gaacagaact ccatctggtg aaacatttgt taaatcaaat ttgcagaagg gaatacttcc 1980

tgaaatactt gaagagctat taacagcccg taaaagggca aaagcagact taaaggaggc 2040

caaggatccc ctggagaagg cagtgctaga tggtagacag ctagccctga agattagtgc 2100

caattctgtg tatgggttta caggggctac cattggtcag ttaccatgtt tagagatatc 2160

atcgagtgta acaagctatg gtcgacaaat gatcgagcac acgaaaaaac ttgtggaaga 2220

taaatttacg acacttaatg gctatgaaca caatgccgag gtaatatatg gagacacaga 2280

ttcagtcatg gtacaatttg gtgtttctgc tgtagaagag gctatgaact tggggagaga 2340

agctgctgaa catattagtg gaactttcac aaaacccatc aaactagaat ttgagaaggt 2400

ttactatcca tatctcctga ttagcaagaa gagatatgct ggtttgtttt ggacaaaacc 2460

agacaacttt gacaaaatgg acactaaagg tattgaaaca gttcgaagag acaattgttt 2520

attggtcaaa aacctggtga acgattgcct tcacaaaata ttgattgaca gggacattcc 2580

tggggcagtc cagtatgtca agaatgcaat ttcagatctt ctcatgaatc gtatggactt 2640

atcacttctg gttattacaa agggtttaac gaagacagga gatgattacg aagtaaaggc 2700

agctcatgtt gaacttgctg aaaggatgcg caagcgagat gctgccactg ctccaaatgt 2760

tggagacaga gtaccatatg ttattattaa agctgcaaaa ggtgcaaagg catatgagag 2820

atcagaggat cctatctatg tgctagagaa caacataccc atagatcctc attactatct 2880

tgagaatcaa attagcaagc caattctgag aatttttgag ccaattctga agaatgctag 2940

caaagagctt ctccatggaa gtcatacaag atctatttct atttctacac cgtcaaacag 3000

tggcatattg agatttgcta agaaacagct acctgcattg gttgtaaagc tttacttggc 3060

aagggttatc acactctctg ttcacattgc aaaggaaggg aggctgagct gtactgtaaa 3120

acagtatctc aagtgtctga gctggagatg ctttttggga ggttgtggac acagtgtcag 3180

gagtgccaag gttcacttca tcaggatgtt ctctgcacca gtcgggattg tccaattttc 3240

tatcgacgaa aaaaggcaca gaaagatatg ggtgaagcaa agttgcaatt ggacagatgg 3300

aacttctaag ttttgccaag aatttgacct tgcggatctc ttcgaaccaa tggacacaaa 3360

tacaatctgg tgtttgccac aatcctgaca tttgtaatgt gagtaaaagc ccacaatttg 3420

tttactg 3427

<210>50

<211>1088

<212>PRT

<213>大豆(Glycine max)

<400>50

Met Thr Gln Glu Glu Glu Phe Met Asp Glu Asp Val Phe Ile Asn Glu

1 5 10 15

Thr Leu Val Ser Glu Asp Glu Glu Ser Leu Ile Leu Arg Asp Ile Glu

20 25 30

Gln Arg Gln Ala Leu Ala Asn Arg Leu Ser Lys Trp Thr Arg Pro Pro

35 40 45

Leu Ser Ala Gly Tyr Val Ala Gln Ser Arg Ser Val Leu Phe Gln Gln

50 55 60

Leu Glu Ile Asp Tyr Val Ile Ala Glu Ser His Gly Glu Leu Leu Pro

65 70 75 80

Asn Ser Ser Gly Pro Val Ala Ile Ile Arg Ile Phe Gly Val Thr Lys

85 90 95

Glu Gly His Ser Val Cys Cys Asn Val His Gly Phe Glu Pro Tyr Phe

100 105 110

Tyr Ile Cys Cys Pro Pro Gly Met Gly Pro Asp Asp Ile Ser His Phe

115 120 125

His Gln Thr Leu Glu Gly Arg Met Arg Glu Ala Asn Arg Asn Ser Asn

130 135 140

Val Gly Lys Phe Val Arg Arg Ile Glu Met Val Gln Arg Arg Ser Ile

145 150 155 160

Met Tyr Tyr Gln Gln Ser Asn Ser Gln Pro Phe Leu Lys Ile Val Val

165 170 175

Ala Leu Pro Thr Met Val Ala Ser Cys Arg Gly Ile Leu Asp Arg Gly

180 185 190

Ile Gln Leu Asp Gly Leu Gly Met Lys Ser Phe Leu Thr Tyr Glu Ser

195 200 205

Asn Val Leu Phe Ala Leu Arg Phe Met Ile Asp Cys Asn Ile Val Gly

210 215 220

Gly Asn Trp Ile Gly Ile Pro Ala Gly Lys Tyr Lys Lys Thr Ala Lys

225 230 235 240

Ser Leu Ser Tyr Cys Gln Leu Glu Phe Asp Cys Leu Tyr Ser Glu Leu

245 250 255

Ile Ser His Ala Pro Glu Gly Glu Tyr Ser Lys Met Ala Pro Phe Arg

260 265 270

Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly His Phe Pro

275 280 285

Glu Pro Thr His Asp Pro Val Ile Gln Ile Ala Asn Leu Val Thr Leu

290 295 300

Gln Gly Glu Asp Gln Pro Phe Ile Arg Asn Val Met Thr Leu Lys Ser

305 310 315 320

Cys Ser Pro Ile Val Gly Val Asp Val Met Pro Phe Glu Thr Glu Arg

325 330 335

Glu Val Leu Leu Ala Trp Arg Asp Phe Ile Arg Glu Val Asp Pro Asp

340 345 350

Ile Ile Ile Gly Tyr Ash Ile Cys Lys Phe Asp Leu Pro Tyr Leu Ile

355 360 365

Glu Arg Ala Leu Asn Leu Lys Ile Ala Glu Phe Pro Ile Leu Gly Arg

370 375 380

lle Arg Asn Ser Arg Val Arg Val Lys Asp Thr Thr Phe Ser Ser Arg

385 390 395 400

Gln Tyr Gly Thr Arg Glu Ser Lys Glu Val Ala Val Glu Gly Arg Val

405 410 415

Thr Phe Asp Leu Leu Gln Val Met Gln Arg Asp Tyr Lys Leu Ser Ser

420 425 430

Tyr Ser Leu Asn Ser Val Ser Ser His Phe Leu Ser Glu Gln Lys Glu

435 440 445

Asp Val His His Ser Ile Ile Ser Asp Leu Gln Asn Gly Asn Ala Glu

450 455 460

Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu Pro

465 470 475 480

Gln Arg Leu Leu Asp Lys Leu Met Phe Ile Tyr Asn Tyr Val Glu Met

485 490 495

Ala Arg Val Thr Gly Val Pro Ile Ser Phe Leu Leu Ser Arg Gly Gln

500 505 510

Ser Ile Lys Val Leu Ser Gln Leu Leu Arg Arg Ala Arg Gln Lys Asn

515 520 525

Leu Val Ile Pro Asn Ala Lys Gln Ala Gly Ser Glu Gln Gly Thr Phe

530 535 540

Glu Gly Ala Thr Val Leu Glu Ala Arg Ala Gly Phe Tyr Glu Lys Pro

545 550 555 560

Ile Ala Thr Leu Asp Phe Ala Ser Leu Tyr Pro Ser Ile Met Met Ala

565 570 575

Tyr Asn Leu Cys Tyr Cys Thr Leu Val Ile Pro Glu Asp Ala Arg Lys

580 585 590

Leu Asn Ile Pro Pro Glu Ser Val Asn Arg Thr Pro Ser Gly Glu Thr

595 600 605

Phe Val Lys Ser Asn Leu Gln Lys Gly Ile Leu Pro Glu Ile Leu Glu

610 615 620

Glu Leu Leu Thr Ala Arg Lys Arg Ala Lys Ala Asp Leu Lys Glu Ala

625 630 635 640

Lys Asp Pro Leu Glu Lys Ala Val Leu Asp Gly Arg Gln Leu Ala Leu

645 650 655

Lys Ile Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala Thr Ile Gly

660 665 670

Gln Leu Pro Cys Leu Glu Ile Ser Ser Ser Val Thr Ser Tyr Gly Arg

675 680 685

Gln Met Ile Glu His Thr Lys Lys Leu Val Glu Asp Lys Phe Thr Thr

690 695 700

Leu Asn Gly Tyr Glu His Asn Ala Glu Val Ile Tyr Gly Asp Thr Asp

705 710 715 720

Ser Val Met Val Gln Phe Gly Val Ser Ala Val Glu Glu Ala Met Asn

725 730 735

Leu Gly Arg Glu Ala Ala Glu His Ile Ser Gly Thr Phe Thr Lys Pro

740 745 750

Ile Lys Leu Glu Phe Glu Lys Val Tyr Tyr Pro Tyr Leu Leu Ile Ser

755 760 765

Lys Lys Arg Tyr Ala Gly Leu Phe Trp Thr Lys Pro Asp Asn Phe Asp

770 775 780

Lys Met Asp Thr Lys Gly Ile Glu Thr Val Arg Arg Asp Asn Cys Leu

785 790 795 800

Leu Val Lys Asn Leu Val Asn Asp Cys Leu His Lys Ile Leu Ile Asp

805 810 815

Arg Asp Ile Pro Gly Ala Val Gln Tyr Val Lys Asn Ala Ile Ser Asp

820 825 830

Leu Leu Met Asn Arg Met Asp Leu Ser Leu Leu Val Ile Thr Lys Gly

835 840 845

Leu Thr Lys Thr Gly Asp Asp Tyr Glu Val Lys Ala Ala His Val Glu

850 855 860

Leu Ala Glu Arg Met Arg Lys Arg Asp Ala Ala Thr Ala Pro Asn Val

865 870 875 880

Gly Asp Arg Val Pro Tyr Val Ile Ile Lys Ala Ala Lys Gly Ala Lys

885 890 895

Ala Tyr Glu Arg Ser Glu Asp Pro Ile Tyr Val Leu Glu Asn Asn Ile

900 905 910

Pro Ile Asp Pro His Tyr Tyr Leu Glu Asn Gln Ile Ser Lys Pro Ile

915 920 925

Leu Arg Ile Phe Glu Pro Ile Leu Lys Asn Ala Ser Lys Glu Leu Leu

930 935 940

His Gly Ser His Thr Arg Ser Ile Ser Ile Ser Thr Pro Ser Asn Ser

945 950 955 960

Gly Ile Leu Arg Phe Ala Lys Lys Gln Leu Pro Ala Leu Val Val Lys

965 970 975

Leu Tyr Leu Ala Arg Val Ile Thr Leu Ser Val His Ile Ala Lys Glu

980 985 990

Gly Arg Leu Ser Cys Thr Val Lys Gln Tyr Leu Lys Cys Leu Ser Trp

995 1000 1005

Arg Cys Phe Leu Gly Gly Cys Gly His Ser Val Arg Ser Ala Lys Val

1010 1015 1020

His Phe Ile Arg Met Phe Ser Ala Pro Val Gly Ile Val Gln Phe Ser

1025 1030 1035 1040

Ile Asp Glu Lys Arg His Arg Lys Ile Trp Val Lys Gln Ser Cys Asn

1045 1050 1055

Trp Thr Asp Gly Thr Ser Lys Phe Cys Gln Glu Phe Asp Leu Ala Asp

1060 1065 1070

Leu Phe Glu Pro Met Asp Thr Asn Thr Ile Trp Cys Leu Pro Gln Ser

1075 1080 1085

<210>51

<211>3435

<212>DNA

<213>智人(Homo sapiens)

<400>51

acggcggcgt aggctgtggc gggaaacgct gtttgaagcg ggatggatgg caagcggcgg 60

ccaggcccag ggcccggggt gcccccaaag cgggcccgtg ggggcctctg ggatgatgat 120

gatgcacctc ggccatccca attcgaggag gacctggcac tgatggagga gatggaggca 180

gaacacaggc tgcaggagca ggaggaggag gagctgcagt cagtcctgga gggggttgca 240

gacgggcagg tcccaccatc agccatagat cctcgctggc ttcggcccac accaccagcg 300

ctggaccccc agacagagcc cctcatcttc caacagttgg agattgacca ttatgtgggc 360

ccagcgcagc ctgtgcctgg ggggccccca ccatcccacg gctccgtgcc tgtgctccgc 420

gccttcgggg tcaccgatga ggggttctct gtctgctgcc acatccacgg cttcgctccc 480

tacttctaca ccccagcgcc ccctggtttc gggcccgagc acatgggtga cctgcaacgg 540

gagctgaact tggccatcaa ccgggacagt cgcgggggga gggagctgac tgggccggcc 600

gtgctggctg tggaactgtg ctcccgagag agcatgtttg ggtaccacgg gcacggcccc 660

tccccgttcc tgcgcatcac cgtggcgctg ccgcgcctcg tggccccggc ccgccgtctc 720

ctggaacagg gcatccgtgt ggcaggcctg ggcacgccca gcttcgcgcc ctacgaggcc 780

aacgtcgact ttgagatccg gttcatggtg gacacggaca tcgtcggctg caactggctg 840

gagctcccag ccgggaaata cgccctgagg ctgaaggaga aggctacgca gtgccagctg 900

gaggcggaeg tgctgtggtc tgacgtggtc agtcacccac cggaagggcc atggcagcgc 960

attgcgccct tgcgcgtgct cagcttcgat atcgagtgcg ccggccgcaa aggcatcttc 1020

cctgagcctg agcgggaccc tgtcatccag atctgctcgc tgggcctgcg ctggggggag 1080

ccggagccct tcctacgcct ggcgctcacc ctgcggccct gtgcccccat cctgggtgcc 1140

aaggtgcaga gctacgagaa ggaggaggac ctgctgcagg cctggtccac cttcatccgt 1200

atcatggacc ccgatgtgat caccggttac aacatccaga acttcgacct tccgtacctc 1260

atctctcggg cccagaccct caaggtacaa acattccctt tcctgggccg tgtggccggc 1320

ctttgctcca acatccggga ctcttcattc cagtccaagc agacgggccg gcgggacacc 1380

aaggttgtca gcatggtggg ccgcgtgcag atggacatgc tgcaggtgct gctgcgggag 1440

tacaagctcc gctcctacac gctcaatgcc gtgagcttcc acttcctggg cgagcagaag 1500

gaggacgtgc agcacagcat catcaccgac ctgcagaatg ggaacgacca gacccgccgc 1560

cgcctggctg tgtactgcct aaaggatgct tacctgccac tgcggctgct ggagcggctc 1620

atggtgctgg tgaacgccgt ggagatggcg agggtcactg gcgtgcccct cagctacctg 1680

ctcagtcgtg gccagcaggt caaggtcgta tcccagctgt tgcggcaggc catgcacgag 1740

gggctgctga tgcccgtggt gaagtcagag ggcggcgagg actacacggg agccactgtc 1800

attgagcccc tcaaagggta ctacgacgtc cccatcgcca ccctggactt ctcctcgctg 1860

tacccgtcca tcatgatggc ccacaacctg tgttacacca cactccttcg gcccgggact 1920

gcacagaaac tgggcctgac tgaggatcag ttcatcagga cccccaccgg ggacgagttt 1980

gtgaagacct cagtgcgtaa ggggctgctg ccccagatcc tggagaacct gctcagtgcc 2040

cggaagaggg ccaaggccga gctggccaag gagacagacc ccctccggcg ccaggtcctg 2100

gatggacggc agctggcgct gaaggtgagc gccaactccg tatacggctt cactggcgcc 2160

caggtgggca agttgccgtg cctggagatc tcacagagcg tcacggggtt cggacgtcag 2220

atgatcgaga aaaccaagca gctggtggag tctaagtaca cagtggagaa tggctacagc 2280

accagcgcca aggtggtgta tggtgacact gactccgtca tgtgccgatt cggcgtgtcc 2340

tcggtggctg aggcgatggc cctgggcggg gaggccgcgg actgggtgtc aggtcacttc 2400

ccgtcgccca tccggctgga gtttgagaag gtctacttcc catacctgct tatcagcaag 2460

aagcgctacg cgggcctgct cttctcctcc cggcccgacg cccacgaccg catggactgc 2520

aagggcctgg aggcggtgcg cagggacaac tgccccctcg tggccaacct ggtcactgcc 2580

tcactgcgcc gcctgctcat cgaccgagac cctgagggcg cggtggctca cgcacaggac 2640

gtcatctcgg acctgctgtg caaccgcatc gatatctccc agctggtcat caccaaggag 2700

ctgacccgcg cggcctccga ctatgccggc aagcaggccc acgtggagct ggccgagagg 2760

atgaggaagc gggaccccgg gagtgcgccc agcctgggcg accgcgtccc ctacgtgatc 2820

atcagtgccg ccaagggtgt ggccgcctac atgaagtcgg aggacccgct gttcgtgctg 2880

gagcacagcc tgcccattga cacgcagtac tacctggagc agcagctggc caagcccctc 2940

ctgcgcatct tcgagcccat cctgggcgag ggccgtgccg aggctgtgct actgcggggg 3000

gaccacacgc gctgcaagac ggtgctcacg ggcaaggtgg gcggcctcct ggccttcgcc 3060

aaaegccgca actgctgcat tggctgccgc acagtgctca gccaccaggg agccgtgtgt 3120

gagttctgcc agccccggga gtctgagctg tatcagaagg aggtatccca tctgaatgcc 3180

ctggaggagc gcttctcgcg cctctggacg cagtgccagc gctgccaggg cagcctgcac 3240

gaggacgtca tctgcaccag ccgggactgc cccatcttct acatgcgcaa gaaggtgcgg 3300

aaggacctgg aagaccagga gcagctcctg cggcgcttcg gaccccctgg acctgaggcc 3360

tggtgacctt gcaagcatcc catggggcgg gggcgggacc agggagaatt aataaagttc 3420

tggacttttg ctaca 3435

<210>52

<211>1107

<212>PRT

<213>智人(Homo sapiens)

<400>52

Met Asp Gly Lys Arg Arg Pro Gly Pro Gly Pro Gly Val Pro Pro Lys

1 5 10 15

Arg Ala Arg Gly Gly Leu Trp Asp Asp Asp Asp Ala Pro Arg Pro Ser

20 25 30

Gln Phe Glu Glu Asp Leu Ala Leu Met Glu Glu Met Glu Ala Glu His

35 40 45

Arg Leu Gln Glu Gln Glu Glu Glu Glu Leu Gln Ser Val Leu Glu Gly

50 55 60

Val Ala Asp Gly Gln Val Pro Pro Ser Ala Ile Asp Pro Arg Trp Leu

65 70 75 80

Arg Pro Thr Pro Pro Ala Leu Asp Pro Gln Thr Glu Pro Leu Ile Phe

85 90 95

Gln Gln Leu Glu Ile Asp His Tyr Val Gly Pro Ala Gln Pro Val Pro

100 105 110

Gly Gly Pro Pro Pro Ser His Gly Ser Val Pro Val Leu Arg Ala Phe

115 120 125

Gly Val Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile His Gly Phe

130 135 140

Ala Pro Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Pro Glu His

145 150 155 160

Met Gly Asp Leu Gln Arg Glu Leu Asn Leu Ala Ile Asn Arg Asp Ser

165 170 175

Arg Gly Gly Arg Glu Leu Thr Gly Pro Ala Val Leu Ala Val Glu Leu

180 185 190

Cys Ser Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro

195 200 205

Phe Leu Arg Ile Thr Val Ala Leu Pro Arg Leu Val Ala Pro Ala Arg

210 215 220

Arg Leu Leu Glu Gln Gly Ile Arg Val Ala Gly Leu Gly Thr Pro Ser

225 230 235 240

Phe Ala Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val

245 250 255

Asp Thr Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys

260 265 270

Tyr Ala Leu Arg Leu Lys Glu Lys Ala Thr Gln Cys Gln Leu Glu Ala

275 280 285

Asp Val Leu Trp Ser Asp Val Val Ser His Pro Pro Glu Gly Pro Trp

290 295 300

Gln Arg Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala

305 310 315 320

Gly Arg Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln

325 330 335

Ile Cys Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg

340 345 350

Leu Ala Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val

355 360 365

Gln Ser Tyr Glu Lys Glu Glu Asp Leu Leu Gln Ala Trp Ser Thr Phe

370 375 380

Ile Arg Ile Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn

385 390 395 400

Phe Asp Leu Pro Tyr Leu Ile Ser Arg Ala Gln Thr Leu Lys Val Gln

405 410 415

Thr Phe Pro Phe Leu Gly Arg Val Ala Gly Leu Cys Ser Asn Ile Arg

420 425 430

Asp Ser Ser Phe Gln Ser Lys Gln Thr Gly Arg Arg Asp Thr Lys Val

435 440 445

Val Ser Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu

450 455 460

Arg Glu Tyr Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His

465 470 475 480

Phe Leu Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp

485 490 495

Leu Gln Ash Gly Asn Asp Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys

500 505 510

Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val

515 520 525

Leu Val Asn Ala Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Ser

530 535 540

Tyr Leu Leu Ser Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu

545 550 555 560

Arg Gln Ala Met His Glu Gly Leu Leu Met Pro Val Val Lys Ser Glu

565 570 575

Gly Gly Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly

580 585 590

Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro

595 600 605

Ser Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro

610 615 620

Gly Thr Ala Gln Lys Leu Gly Leu Thr Glu Asp Gln Phe Ile Arg Thr

625 630 635 640

Pro Thr Gly Asp Glu Phe Val Lys Thr Ser Val Arg Lys Gly Leu Leu

645 650 655

Pro Gln Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala

660 665 670

Glu Leu Ala Lys Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly

675 680 685

Arg Gln Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr

690 695 700

Gly Ala Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val

705 710 715 720

Thr Gly Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu

725 730 735

Ser Lys Tyr Thr Val Glu Asn Gly Tyr Ser Thr Ser Ala Lys Val Val

740 745 750

Tyr Gly Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val

755 760 765

Ala Glu Ala Met Ala Leu Gly Gly Glu Ala Ala Asp Trp Val Ser Gly

770 775 780

His Phe Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro

785 790 795 800

Tyr Leu Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser

805 810 815

Arg Pro Asp Ala His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val

820 825 830

Arg Arg Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ala Ser Leu

835 840 845

Arg Arg Leu Leu Ile Asp Arg Asp Pro Glu Gly Ala Val Ala His Ala

850 855 860

Gln Asp Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln

865 870 875 880

Leu Val Ile Thr Lys Glu Leu Thr Arg Ala Ala Ser Asp Tyr Ala Gly

885 890 895

Lys Gln Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro

900 905 910

Gly Ser Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Ser

915 920 925

Ala Ala Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe

930 935 940

Val Leu Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln

945 950 955 960

Gln Leu Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu

965 970 975

Gly Arg Ala Glu Ala Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys

980 985 990

Thr Val Leu Thr Gly Lys Val Gly Gly Leu Leu Ala Phe Ala Lys Arg

995 1000 1005

Arg Asn Cys Cys Ile Gly Cys Arg Thr Val Leu Ser His Gln Gly Ala

1010 1015 1020

Val Cys Glu Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu

1025 1030 1035 1040

Val Ser His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr

1045 1050 1055

Gln Cys Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr

1060 1065 1070

Ser Arg Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp

1075 1080 1085

Leu Glu Asp Gln Glu Gln Leu Leu Arg Arg Phe Gly Pro Pro Gly Pro

1090 1095 1100

Glu Ala Trp

1105

<210>53

<211>6912

<212>DNA

<213>智人(Homo sapiens)

<400>53

cgccaaattt ctcccctgaa gcagaggtgg tagccaacgg ctccatgtct ctgaggagcg 60

gcgggcggcg gcgcgcggac ccaggcgcgg atggcgaggc cagcagggat gatggcgcca 120

cttcctcagt ttcggcactc aagcgcctgg aacggagtca gtggacggat aagatggatt 180

tgcggtttgg ttttgagcgg ctgaaggagc ctggtgagaa gacaggctgg ctcattaaca 240

tgcatcctac cgagatttta gatgaagata agcgcttagg cagtgcagtg gattactact 300

ttattcaaga tgacggaagc agatttaagg tggctttgcc ctataaaccg tatttctaca 360

ttgcgaccag aaagggttgt gagcgagaag tttcatcttt tctctccaag aagtttcagg 420

gcaaaattgc aaaagtggag actgtcccca aagaggatct ggacttgcca aatcacttgg 480

tgggtttgaa gcgaaattac atcaggctgt ccttccacac tgtggaggat cttgtcaaag 540

tgaggaagga gatctcccct gccgtgaaga agaacaggga gcaggatcac gccagcgacg 600

cgtacacagc tctgctttcc agtgttctgc agaggggcgg tgtcattact gatgaagagg 660

aaacctctaa gaagatagct gaccagttgg acaacattgt ggacatgcgc gagtacgatg 720

ttccctacca catccgcctc tccattgacc tgaagatcca cgtggctcat tggtacaatg 780

tcagataccg aggaaatgct tttccggtag aaatcacccg ccgagatgac cttgttgaac 840

gacctgaccc tgtggttttg gcatttgaca ttgagacgac caaactgccc ctcaagtttc 900

ctgatgctga gacagaccag attatgatga tttcctacat gatcgatggc cagggctacc 960

tcatcaccaa cagggagatt gtttcagaag atattgaaga ttttgagttc acccccaagc 1020

cagaatatga aggccccttt tgtgtcttca atgaacccga tgaggctcat ctgatccaaa 1080

ggtggtttga acacgtccag gagaccaaac ccaccatcat ggtcacctac aacggggact 1140

tttttgactg gccatttgtg gaggcccggg cagcagtcca cggtctgagc atgcagcagg 1200

agataggctt ccagaaggac agccaggggg agtacaaggc gccccagtgc atccacatgg 1260

actgcctcag gtgggtgaag agggacagtt accttcctgt gggcagtcat aatctcaagg 1320

cggccgccaa ggccaagcta ggctatgatc ccgtggagct agacccggag gacatgtgcc 1380

ggatggccac ggagcagccc cagactctgg ccacgtattc tgtgtcagat gctgtcgcca 1440

cttactacct gtacatgaag tacgtccacc cattcatctt tgctctgtgc accattattc 1500

ccatggagcc cgacgaggtg ctgcggaagg gctctggcac tctgtgtgag gccttgctga 1560

tggtgcaggc cttccacgcc aacatcatct tccccaacaa gcaagagcag gagttcaata 1620

agctgacgga cgacggacac gtgctggact ctgagaccta cgtcgggggc cacgtggagg 1680

ccctcgagtc tggggttttc cgcagcgata tcccttgccg gtttaggatg aatcctgccg 1740

cctttgactt cctgctgcag cgggttgaga agaccttgcg ccacgccctt gaggaagagg 1800

agaaagtgcc tgtggagcaa gtcaccaact ttgaagaggt gtgtgatgag attaagagca 1860

agcttgcctc cctgaaggac gttcccagcc gcatcgagtg tccactcatc taccacctgg 1920

acgtgggggc catgtacccc aacatcatcc tgaccaaccg cctgcagccc tctgccatgg 1980

tggacgaagc cacctgtgct gcctgtgact tcaataagcc tggagcaaac tgccagcgga 2040

agatggcctg gcagtggagg ggcgagttca tgccagccag tcgcagcgaa taccatcgga 2100

tccagcacca gctggagtca gagaagttcc cccccttgtt cccagagggg ccagctcggg 2160

cctttcatga actgtcccgc gaggaacagg cgaaatacga gaagagaagg ctggcggatt 2220

actgccggaa agcctacaag aagatccaca tcaccaaggt ggaagagcgt ctcaccacca 2280

tctgccagcg ggaaaactcc ttctacgtgg acaccgtgcg tgccttccgg gacaggcgtt 2340

acgagttcaa agggctccac aaggtgtgga aaaagaagct ctcggcggcc gtggaggtgg 2400

gcgacgcggc tgaggtgaag cgctgcaaga acatggaggt gctgtatgac tcgctgcagc 2460

tggcccacaa gtgcatcctg aactccttct atggctatgt catgcgcaag ggggctcgct 2520

ggtactccat ggagatggct ggcatcgtct gcttcacagg ggccaacatc atcacccagg 2580

cacgggagct gatcgagcag attgggaggc ccttagagct ggacacagat ggtatatggt 2640

gcgtcctgcc caacagcttc ccagaaaatt ttgtcttcaa gacgaccaat gtgaagaagc 2700

ccaaagtgac catctcctac ccaggcgcca tgttgaacat catggtcaag gaaggcttca 2760

ccaatgacca gtaccaggag ctggctgagc cgtcctcact cacctacgtc acccgctcag 2820

agaacagcat cttttttgag gttgatgggc cctaccttgc catgattctt ccagcctcca 2880

aggaagaagg caagaaattg aagaagaggt atgctgtgtt caatgaagac ggttctctgg 2940

ctgagctcaa gggctttgag gtcaaacgcc gcggggaact gcagctgatt aagatcttcc 3000

aatcctcggt gtttgaggcc ttcctcaagg gcagcacgct ggaagaggtg tatggctctg 3060

tagccaaggt ggctgactac tggctggacg tgctgtacag caaggcagcc aacatgcctg 3120

actctgagct attcgagctc atctctgaga accgttccat gtctcggaag ctggaagatt 3180

acggggagca gaagtctaca tccatcagca cagcaaagcg cctggccgag ttcctgggag 3240

accagatggt caaggatgca gggctgagtt gccgctacat catctcccgc aagcccgagg 3300

gctcccctgt cacggagagg gccatcccac ttgccatttt ccaagcagag cccacggtga 3360

ggaagcactt tctccggaaa tggctcaaga gctcttccct tcaagacttt gatattcgag 3420

caattctgga ttgggactac tacattgagc ggctgggaag cgccatccag aagatcatca 3480

ccatccctgc ggccctgcag caggtaaaga acccagtgcc acgtgtcaaa caccccgact 3540

ggctgcacaa aaaactgctg gagaagaatg atgtctacaa gcagaagaag atcagtgagc 3600

tcttcaccct ggagggcagg agacaggtca cgatggccga ggcctcagaa gacagtccga 3660

ggccaagtgc tcctgacatg gaggacttcg gcctcgtaaa gctgcctcac ccagcagccc 3720

ctgtcactgt gaagaggaag cgagttcttt gggagagcca ggaggagtcc caggacctca 3780

cgccgactgt gccctggcag gaaatcttgg ggcagcctcc cgccctggga accagccagg 3840

aggaatggct tgtctggctc cggttccaca agaagaagtg gcagctgcag gcccggcagc 3900

gcctcgcccg caggaagagg cagcgtctgg agtcggcaga gggtgtgctc aggcccgggg 3960

ccatccggga tggtcctgcc acggggctgg ggagcttctt gcgaagaact gcccgcagca 4020

tcctggacct tccgtggcag attgtgcaga tcagcgagac cagccaggcc ggcctgttca 4080

ggctgtgggc gctcgttggc agtgacttgc actgcatcag gctgagcatc ccccgtgtgt 4140

tctacgtgaa ccagcgagtc gctaaagcgg aggagggtgc ttcgtatcgc aaggtaaatc 4200

gggtccttcc tcgctccaac atggtctaca atctctatga gtattcagtg ccagaggaca 4260

tgtaccagga acacatcaac gagatcaacg ctgagctgtc agcgccagac atcgagggcg 4320

tatatgagac tcaggttccg ttactgttcc gggccctggt gcacctgggc tgtgtgtgtg 4380

tggtcaataa acagctggtg aggcaccttt caggctggga agcagagacc tttgctcttg 4440

agcacctgga gatgcgctct ctggcccagt tcagctacct ggaaccaggg agtatccgcc 4500

atatctacct gtaccaccac gcacaggccc acaaagcgct cttcgggatc ttcatcccct 4560

cacagcgcag ggcatccgtc tttgtgctgg acactgtgcg cagcaaccag atgcccagcc 4620

ttggcgccct gtactcagca gagcacggcc tcctcctgga gaaggtgggc cctgagctcc 4680

tgccaccccc caaacacacc ttcgaagttc gggcagaaac tgacctgaag accatctgca 4740

gagccatcca gcgattcctg ctcgcctaca aggaggagcg ccgggggccc acactcatcg 4800

ctgttcagtc cagctgggag ctgaagaggc tggccagtga aattcctgtc ttggaggaat 4860

tcccactggt gcctatctgt gtggctgaca agatcaacta tggggtcctg gactggcagc 4920

gccatggagc ccggcgcatg atccgtcact acctcaacct ggacacctgc ctgtcgcagg 4980

ccttcgagat gagcaggtac tttcacattc ccattgggaa cctaccagag gacatctcca 5040

cattcggctc cgacctcttc tttgcccgcc acctccagcg ccacaaccac ctgctctggc 5100

tgtcccctac agcccgccct gacctgggtg gaaaggaggc tgatgacaac tgtcttgtca 5160

tggagttcga tgaccaagcc actgttgaga tcaacagttc aggctgttac tccacagtgt 5220

gtgtggagct ggaccttcag aacctggccg tcaacaccat tctccagtct caccatgtca 5280

acgacatgga gggggccgac agcatgggga tcagcttcga cgtgatccag caggcctccc 5340

tggaggacat gatcacgggt ggtcaggctg ccagtgcccc ggccagctac gatgagacag 5400

ccctgtgctc taacaccttc aggatcctga agagcatggt cgtgggctgg gtgaaggaga 5460

tcacccagta ccacaacatc tatgcagaca accaggtgat gcacttctac cgctggcttc 5520

ggtcgccatc ctctctgctt catgaccctg ccctgcaccg cacactccac aacatgatga 5580

agaagctctt cctgcagctc atcgctgagt tcaagcgcct ggggtcatca gtcatctacg 5640

ccaacttcaa ccgcatcatc ctctgtacaa agaagcgccg tgtggaagat gccatcgctt 5700

acgtggagta catcaccagc agcatccatt caaaggagac cttccattct ctgacaattt 5760

ctttctctcg atgctgggaa tttcttctct ggatggatcc atctaactat ggcggaatca 5820

aaggaaaagt ttcatctcgt attcactgtg gactgcaaga ctcccagaaa gcagggggag 5880

cagaggatga gcaggaaaat gaggacgatg aggaggaaag agatggggag gaggaggaag 5940

aggcggagga atccaacgtg gaggatttac tggaaaacaa ctggaacatt ttgcagtttt 6000

tgccacaggc agcctcctgc cagaactact tcctcatgat tgtttcagcg tacatcgtgg 6060

ccgtgtacca ctgcatgaag gacgggctga ggcgcagtgc tccagggagc acccccgtga 6120

ggaggagggg ggccagccag ctctcccagg aggccgaggg ggcggtcgga gcccttcccg 6180

gaatgatcac cttctctcag gattatgtcg caaatgagct cactcagagc ttcttcacca 6240

tcactcagaa gattcagaag aaagtcacag gctctcggaa ctccactgag ctctcagaga 6300

tgtttcctgt cctccccggt tcccacttgc tgctcaataa ccctgccctg gagttcatca 6360

aatacgtgtg caaggtgctg tccctggaca ccaacatcac aaaccaggtg aataagctga 6420

accgagacct gcttcgcctg gtggatgtcg gcgagttctc cgaggaggcc cagttccgag 6480

acccctgccg ctcctacgtg cttcctgagg tcatctgccg cagctgtaac ttctgccgcg 6540

acctggacct gtgtaaagac tcttccttct cagaggatgg ggcggtcctg cctcagtggc 6600

tctgctccaa ctgtcaggcg ccctacgact cctctgccat cgagatgacg ctggtggaag 6660

ttctacagaa gaagctgatg gccttcaccc tgcaggacct ggtctgcctg aagtgccgcg 6720

gggtgaagga gaccagcatg cctgtgtact gcacgtgcgc gggagacttc gccctcacca 6780

tccacaccca ggtcttcatg gaacagatcg gaatattccg gaacattgcc cagcactacg 6840

gcatgtcgta cctcctggag accctggagt ggctgctgca gaagaaccca cagctgggcc 6900

attagccagc cc 6912

<210>54

<211>2286

<212>PRT

<213>智人(Homo sapiens)

<400>54

Met Ser Leu Arg Ser Gly Gly Arg Arg Arg Ala Asp Pro Gly Ala Asp

1 5 10 15

Gly Glu Ala Ser Arg Asp Asp Gly Ala Thr Ser Ser Val Ser Ala Leu

20 25 30

Lys Arg Leu Glu Arg Ser Gln Trp Thr Asp Lys Met Asp Leu Arg Phe

35 40 45

Gly Phe Glu Arg Leu Lys Glu Pro Gly Glu Lys Thr Gly Trp Leu Ile

50 55 60

Asn Met His Pro Thr Glu Ile Leu Asp Glu Asp Lys Arg Leu Gly Ser

65 70 75 80

Ala Val Asp Tyr Tyr Phe Ile Gln Asp Asp Gly Ser Arg Phe Lys Val

85 90 95

Ala Leu Pro Tyr Lys Pro Tyr Phe Tyr Ile Ala Thr Arg Lys Gly Cys

100 105 110

Glu Arg Glu Val Ser Ser Phe Leu Ser Lys Lys Phe Gln Gly Lys Ile

115 120 125

Ala Lys Val Glu Thr Val Pro Lys Glu Asp Leu Asp Leu Pro Asn His

130 135 140

Leu Val Gly Leu Lys Arg Asn Tyr Ile Arg Leu Ser Phe His Thr Val

145 150 155 160

Glu Asp Leu Val Lys Val Arg Lys Glu Ile Ser Pro Ala Val Lys Lys

165 170 175

Asn Arg Glu Gln Asp His Ala Ser Asp Ala Tyr Thr Ala Leu Leu Ser

180 185 190

Ser Val Leu Gln Arg Gly Gly Val Ile Thr Asp Glu Glu Glu Thr Ser

195 200 205

Lys Lys Ile Ala Asp Gln Leu Asp Asn Ile Val Asp Met Arg Glu Tyr

210 215 220

Asp Val Pro Tyr His Ile Arg Leu Ser Ile Asp Leu Lys Ile His Val

225 230 235 240

Ala His Trp Tyr Asn Val Arg Tyr Arg Gly Asn Ala Phe Pro Val Glu

245 250 255

Ile Thr Arg Arg Asp Asp Leu Val Glu Arg Pro Asp Pro Val Val Leu

260 265 270

Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro Leu Lys Phe Pro Asp Ala

275 280 285

Glu Thr Asp Gln Ile Met Met Ile Ser Tyr Met Ile Asp Gly Gln Gly

290 295 300

Tyr Leu lle Thr Asn Arg Glu Ile Val Ser Glu Asp Ile Glu Asp Phe

305 310 315 320

Glu Phe Thr Pro Lys Pro Glu Tyr Glu Gly Pro Phe Cys Val Phe Asn

325 330 335

Glu Pro Asp Glu Ala His Leu Ile Gln Arg Trp Phe Glu His Val Gln

340 345 350

Glu Thr Lys Pro Thr Ile Met Val Thr Tyr Asn Gly Asp Phe Phe Asp

355 360 365

Trp Pro Phe Val Glu Ala Arg Ala Ala Val His Gly Leu Ser Met Gln

370 375 380

Gln Glu Ile Gly Phe Gln Lys Asp Ser Gln Gly Glu Tyr Lys Ala Pro

385 390 395 400

Gln Cys Ile His Met Asp Cys Leu Arg Trp Val Lys Arg Asp Ser Tyr

405 410 415

Leu Pro Val Gly Ser His Asn Leu Lys Ala Ala Ala Lys Ala Lys Leu

420 425 430

Gly Tyr Asp Pro Val Glu Leu Asp Pro Glu Asp Met Cys Arg Met Ala

435 440 445

Thr Glu Gln Pro Gln Thr Leu Ala Thr Tyr Ser Val Ser Asp Ala Val

450 455 460

Ala Thr Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ala

465 470 475 480

Leu Cys Thr lle Ile Pro Met Glu Pro Asp Glu Val Leu Arg Lys Gly

485 490 495

Ser Gly Thr Leu Cys Glu Ala Leu Leu Met Val Gln Ala Phe His Ala

500 505 510

Asn Ile Ile Phe Pro Asn Lys Gln Glu Gln Glu Phe Asn Lys Leu Thr

515 520 525

Asp Asp Gly His Val Leu Asp Ser Glu Thr Tyr Val Gly Gly His Val

530 535 540

Glu Ala Leu Glu Ser Gly Val Phe Arg Ser Asp Ile Pro Cys Arg Phe

545 550 555 560

Arg Met Asn Pro Ala Ala Phe Asp Phe Leu Leu Gln Arg Val Glu Lys

565 570 575

Thr Leu Arg His Ala Leu Glu Glu Glu Glu Lys Val Pro Val Glu Gln

580 585 590

Val Thr Asn Phe Glu Glu Val Cys Asp Glu Ile Lys Ser Lys Leu Ala

595 600 605

Ser Leu Lys Asp Val Pro Ser Arg Ile Glu Cys Pro Leu Ile Tyr His

610 615 620

Leu Asp Val Gly Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu

625 630 635 640

Gln Pro Ser Ala Met Val Asp Glu Ala Thr Cys Ala Ala Cys Asp Phe

645 650 655

Asn Lys Pro Gly Ala Asn Cys Gln Arg Lys Met Ala Trp Gln Trp Arg

660 665 670

Gly Glu Phe Met Pro Ala Ser Arg Ser Glu Tyr His Arg Ile Gln His

675 680 685

Gln Leu Glu Ser Glu Lys Phe Pro Pro Leu Phe Pro Glu Gly Pro Ala

690 695 700

Arg Ala Phe His Glu Leu Ser Arg Glu Glu Gln Ala Lys Tyr Glu Lys

705 710 715 720

Arg Arg Leu Ala Asp Tyr Cys Arg Lys Ala Tyr Lys Lys Ile His Ile

725 730 735

Thr Lys Val Glu Glu Arg Leu Thr Thr Ile Cys Gln Arg Glu Asn Ser

740 745 750

Phe Tyr Val Asp Thr Val Arg Ala Phe Arg Asp Arg Arg Tyr Glu Phe

755 760 765

Lys Gly Leu His Lys Val Trp Lys Lys Lys Leu Ser Ala Ala Val Glu

770 775 780

Val Gly Asp Ala Ala Glu Val Lys Arg Cys Lys Asn Met Glu Val Leu

785 790 795 800

Tyr Asp Ser Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr

805 810 815

Gly Tyr Val Met Arg Lys Gly Ala Arg Trp Tyr Ser Met Glu Met Ala

820 825 830

Gly Ile Val Cys Phe Thr Gly Ala Asn Ile Ile Thr Gln Ala Arg Glu

835 840 845

Leu Ile Glu Gln Ile Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile

850 855 860

Trp Cys Val Leu Pro Asn Ser Phe Pro Glu Asn Phe Val Phe Lys Thr

865 870 875 880

Thr Asn Val Lys Lys Pro Lys Val Thr Ile Ser Tyr Pro Gly Ala Met

885 890 895

Leu Asn Ile Met Val Lys Glu Gly Phe Thr Asn Asp Gln Tyr Gln Glu

900 905 910

Leu Ala Glu Pro Ser Ser Leu Thr Tyr Val Thr Arg Ser Glu Asn Ser

915 920 925

Ile Phe Phe Glu Val Asp Gly Pro Tyr Leu Ala Met Ile Leu Pro Ala

930 935 940

Ser Lys Glu Glu Gly Lys Lys Leu Lys Lys Arg Tyr Ala Val Phe Asn

945 950 955 960

Glu Asp Gly Ser Leu Ala Glu Leu Lys Gly Phe Glu Val Lys Arg Arg

965 970 975

Gly Glu Leu Gln Leu Ile Lys Ile Phe Gln Ser Ser Val Phe Glu Ala

980 985 990

Phe Leu Lys Gly Ser Thr Leu Glu Glu Val Tyr Gly Ser Val Ala Lys

995 1000 1005

Val Ala Asp Tyr Trp Leu Asp Val Leu Tyr Ser Lys Ala Ala Asn Met

1010 1015 1020

Pro Asp Ser Glu Leu Phe Glu Leu Ile Ser Glu Asn Arg Ser Met Ser

1025 1030 1035 1040

Arg Lys Leu Glu Asp Tyr Gly Glu Gln Lys Ser Thr Ser Ile Ser Thr

1045 1050 1055

Ala Lys Arg Leu Ala Glu Phe Leu Gly Asp Gln Met Val Lys Asp Ala

1060 1065 1070

Gly Leu Ser Cys Arg Tyr Ile Ile Ser Arg Lys Pro Glu Gly Ser Pro

1075 1080 1085

Val Thr Glu Arg Ala Ile Pro Leu Ala Ile Phe Gln Ala Glu Pro Thr

1090 1095 1100

Val Arg Lys His Phe Leu Arg Lys Trp Leu Lys Ser Ser Ser Leu Gln

1105 1110 1115 1120

Asp Phe Asp Ile Arg Ala Ile Leu Asp Trp Asp Tyr Tyr Ile Glu Arg

1125 1130 1135

Leu Gly Ser Ala Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu Gln

1140 1145 1150

Gln Val Lys Asn Pro Val Pro Arg Val Lys His Pro Asp Trp Leu His

1155 1160 1165

Lys Lys Leu Leu Glu Lys Asn Asp Val Tyr Lys Gln Lys Lys Ile Ser

1170 1175 1180

Glu Leu Phe Thr Leu Glu Gly Arg Arg Gln Val Thr Met Ala Glu Ala

1185 1190 1195 1200

Ser Glu Asp Ser Pro Arg Pro Ser Ala Pro Asp Met Glu Asp Phe Gly

1205 1210 1215

Leu Val Lys Leu Pro His Pro Ala Ala Pro Val Thr Val Lys Arg Lys

1220 1225 1230

Arg Val Leu Trp Glu Ser Gln Glu Glu Ser Gln Asp Leu Thr Pro Thr

1235 1240 1245

Val Pro Trp Gln Glu Ile Leu Gly Gln Pro Pro Ala Leu Gly Thr Ser

1250 1255 1260

Gln Glu Glu Trp Leu Val Trp Leu Arg Phe His Lys Lys Lys Trp Gln

1265 1270 1275 1280

Leu Gln Ala Arg Gln Arg Leu Ala Arg Arg Lys Arg Gln Arg Leu Glu

1285 1290 1295

Ser Ala Glu Gly Val Leu Arg Pro Gly Ala Ile Arg Asp Gly Pro Ala

1300 1305 1310

Thr Gly Leu Gly Ser Phe Leu Arg Arg Thr Ala Arg Ser Ile Leu Asp

1315 1320 1325

Leu Pro Trp Gln Ile Val Gln Ile Ser Glu Thr Ser Gln Ala Gly Leu

1330 1335 1340

Phe Arg Leu Trp Ala Leu Val Gly Ser Asp Leu His Cys lle Arg Leu

1345 1350 1355 1360

Ser Ile Pro Arg Val Phe Tyr Val Asn Gln Arg Val Ala Lys Ala Glu

1365 1370 1375

Glu Gly Ala Ser Tyr Arg Lys Val Asn Arg Val Leu Pro Arg Ser Asn

1380 1385 1390

Met Val Tyr Asn Leu Tyr Glu Tyr Ser Val Pro Glu Asp Met Tyr Gln

1395 1400 1405

Glu His Ile Asn Glu Ile Asn Ala Glu Leu Ser Ala Pro Asp Ile Glu

1410 1415 1420

Gly Val Tyr Glu Thr Gln Val Pro Leu Leu Phe Arg Ala Leu Val His

1425 1430 1435 1440

Leu Gly Cys Val Cys Val Val Asn Lys Gln Leu Val Arg His Leu Ser

1445 1450 1455

Gly Trp Glu Ala Glu Thr Phe Ala Leu Glu His Leu Glu Met Arg Ser

1460 1465 1470

Leu Ala Gln Phe Ser Tyr Leu Glu Pro Gly Ser Ile Arg His Ile Tyr

1475 1480 1485

Leu Tyr His His Ala Gln Ala His Lys Ala Leu Phe Gly Ile Phe lle

1490 1495 1500

Pro Ser Gln Arg Arg Ala Ser Val Phe Val Leu Asp Thr Val Arg Ser

1505 1510 1515 1520

Asn Gln Met Pro Ser Leu Gly Ala Leu Tyr Ser Ala Glu His Gly Leu

1525 1530 1535

Leu Leu Glu Lys Val Gly Pro Glu Leu Leu Pro Pro Pro Lys His Thr

1540 1545 1550

Phe Glu Val Arg Ala Glu Thr Asp Leu Lys Thr Ile Cys Arg Ala Ile

1555 1560 1565

Gln Arg Phe Leu Leu Ala Tyr Lys Glu Glu Arg Arg Gly Pro Thr Leu

1570 1575 1580

Ile Ala Val Gln Ser Ser Trp Glu Leu Lys Arg Leu Ala Ser Glu Ile

1585 1590 1595 1600

Pro Val Leu Glu Glu Phe Pro Leu Val Pro Ile Cys Val Ala Asp Lys

1605 1610 1615

Ile Asn Tyr Gly Val Leu Asp Trp Gln Arg His Gly Ala Arg Arg Met

1620 1625 1630

Ile Arg His Tyr Leu Asn Leu Asp Thr Cys Leu Ser Gln Ala Phe Glu

1635 1640 1645

Met Ser Arg Tyr Phe His Ile Pro Ile Gly Asn Leu Pro Glu Asp Ile

1650 1655 1660

Ser Thr Phe Gly Ser Asp Leu Phe Phe Ala Arg His Leu Gln Arg His

1665 1670 1675 1680

Asn His Leu Leu Trp Leu Ser Pro Thr Ala Arg Pro Asp Leu Gly Gly

1685 1690 1695

Lys Glu Ala Asp Asp Asn Cys Leu Val Met Glu Phe Asp Asp Gln Ala

1700 1705 1710

Thr Val Glu Ile Asn Ser Ser Gly Cys Tyr Ser Thr Val Cys Val Glu

1715 1720 1725

Leu Asp Leu Gln Asn Leu Ala Val Asn Thr Ile Leu Gln Ser His His

1730 1735 1740

Val Asn Asp Met Glu Gly Ala Asp Ser Met Gly Ile Ser Phe Asp Val

1745 1750 1755 1760

Ile Gln Gln Ala Ser Leu Glu Asp Met Ile Thr Gly Gly Gln Ala Ala

1765 1770 1775

Ser Ala Pro Ala Ser Tyr Asp Glu Thr Ala Leu Cys Ser Asn Thr Phe

1780 1785 1790

Arg Ile Leu Lys Ser Met Val Val Gly Trp Val Lys Glu Ile Thr Gln

1795 1800 1805

Tyr His Asn Ile Tyr Ala Asp Asn Gln Val Met His Phe Tyr Arg Trp

1810 1815 1820

Leu Arg Ser Pro Ser Ser Leu Leu His Asp Pro Ala Leu His Arg Thr

1825 1830 1835 1840

Leu His Asn Met Met Lys Lys Leu Phe Leu Gln Leu Ile Ala Glu Phe

1845 1850 1855

Lys Arg Leu Gly Ser Ser Val Ile Tyr Ala Asn Phe Asn Arg Ile Ile

1860 1865 1870

Leu Cys Thr Lys Lys Arg Arg Val Glu Asp Ala Ile Ala Tyr Val Glu

1875 1880 1885

Tyr Ile Thr Ser Ser Ile His Ser Lys Glu Thr Phe His Ser Leu Thr

1890 1895 1900

Ile Ser Phe Ser Arg Cys Trp Glu Phe Leu Leu Trp Met Asp Pro Ser

1905 1910 1915 1920

Asn Tyr Gly Gly Ile Lys Gly Lys Val Ser Ser Arg Ile His Cys Gly

1925 1930 1935

Leu Gln Asp Ser Gln Lys Ala Gly Gly Ala Glu Asp Glu Gln Glu Asn

1940 1945 1950

Glu Asp Asp Glu Glu Glu Arg Asp Gly Glu Glu Glu Glu Glu Ala Glu

1955 1960 1965

Glu Ser Asn Val Glu Asp Leu Leu Glu Asn Asn Trp Asn Ile Leu Gln

1970 1975 1980

Phe Leu Pro Gln Ala Ala Ser Cys Gln Asn Tyr Phe Leu Met Ile Val

1985 1990 1995 2000

Ser Ala Tyr Ile Val Ala Val Tyr His Cys Met Lys Asp Gly Leu Arg

2005 2010 2015

Arg Ser Ala Pro Gly Ser Thr Pro Val Arg Arg Arg Gly Ala Ser Gln

2020 2025 2030

Leu Ser Gln Glu Ala Glu Gly Ala Val Gly Ala Leu Pro Gly Met Ile

2035 2040 2045

Thr Phe Ser Gln Asp Tyr Val Ala Asn Glu Leu Thr Gln Ser Phe Phe

2050 2055 2060

Thr Ile Thr Gln Lys Ile Gln Lys Lys Val Thr Gly Ser Arg Asn Ser

2065 2070 2075 2080

Thr Glu Leu Ser Glu Met Phe Pro Val Leu Pro Gly Ser His Leu Leu

2085 2090 2095

Leu Asn Asn Pro Ala Leu Glu Phe Ile Lys Tyr Val Cys Lys Val Leu

2100 2105 2110

Ser Leu Asp Thr Asn Ile Thr Asn Gln Val Asn Lys Leu Asn Arg Asp

2115 2120 2125

Leu Leu Arg Leu Val Asp Val Gly Glu Phe Ser Glu Glu Ala Gln Phe

2130 2135 2140

Arg Asp Pro Cys Arg Ser Tyr Val Leu Pro Glu Val Ile Cys Arg Ser

2145 2150 2155 2160

Cys Asn Phe Cys Arg Asp Leu Asp Leu Cys Lys Asp Ser Ser Phe Ser

2165 2170 2175

Glu Asp Gly Ala Val Leu Pro Gln Trp Leu Cys Ser Asn Cys Gln Ala

2180 2185 2190

Pro Tyr Asp Ser Ser Ala Ile Glu Met Thr Leu Val Glu Val Leu Gln

2195 2200 2205

Lys Lys Leu Met Ala Phe Thr Leu Gln Asp Leu Val Cys Leu Lys Cys

2210 2215 2220

Arg Gly Val Lys Glu Thr Ser Met Pr0 Val Tyr Cys Thr Cys Ala Gly

2225 2230 2235 2240

Asp Phe Ala Leu Thr Ile His Thr Gln Val Phe Met Glu Gln Ile Gly

2245 2250 2255

Ile Phe Arg Asn Ile Ala Gln His Tyr Gly Met Ser Tyr Leu Leu Glu

2260 2265 2270

Thr Leu Glu Trp Leu Leu Gln Lys Asn Pro Gln Leu Gly His

2275 2280 2285

<210>55

<211>3390

<212>DNA

<213>小鼠(Mus musculus)

<400>55

atcttgtggc gggaaaagct gtttgaggcg atggattgta agcggcgaca aggaccaggc 60

cctggggtgc ccccaaagcg ggctcgaggg cacctctggg atgaggacga gccttcgccg 120

tcgcagtttg aggcgaacct ggcactgctg gaggaaatag aggctgagaa ccggctgcag 180

gaggcagagg aggagctgca gctgccccca gagggcaccg tgggtgggca gttttccact 240

gcagacattg accctcggtg gcggcggccc accctacgtg ccctggaccc cagcacggag 300

cccctcatct tccagcagct ggagattgac cactatgtgg gctcagcacc acccctgcca 360

gaacggcccc tgccatcccg gaactcagtg cccatactga gggcctttgg ggtcaccgat 420

gaaggcttct ccgtctgctg ccacatacag ggctttgccc cctacttcta cacccccgcg 480

cctcctggtt ttggggccga gcacctgagt gagctgcagc aggagctgaa cgcagccatc 540

agccgggacc agcgcggtgg gaaggagctc tcagggccgg cagtgctggc aatagagcta 600

tgctcccgtg agagcatgtt tgggtaccac ggtcatggcc cttctccatt tctccgcatc 660

accctggcac taccccgcct tatggcacca gcccgccgcc ttctggaaca gggtgtccga 720

gtgccaggcc tgggcacccc gagcttcgca ccctacgaag ccaacgtgga ctttgagatc 780

cggttcatgg tggatgctga cattgtggga tgcaactggt tggagctgcc agctggaaag 840

tacgttcgga gggcggagaa gaaggccacc ctgtgtcagc tggaggtgga cgtgctgtgg 900

tcagatgtga tcagtcaccc accggagggg cagtggcagc gcattgcacc cctgcgtgtg 960

cttagcttcg acatcgagtg tgctggccga aaaggcatct tccctgagcc tgagcgtgac 1020

cccgtgatcc agatctgttc tctggggctg cgctgggggg agccggagcc attcttgcgt 1080

ctggcactca cgctgcggcc ctgtgccccc atcctgggtg ccaaagtgca gagctatgag 1140

cgggaagaag acctgctcca ggcctgggcc gacttcatcc ttgccatgga ccctgacgtg 1200

atcaccggct acaacattca gaactttgac ctcccatacc tcatctctcg ggcacaggcc 1260

ctaaaggtgg accgcttccc tttcctgggc cgcgtgactg gtctccgctc caacatccgt 1320

gactcctcct tccaatcaag gcaggtcggc cggcgggaca gtaaggtgat cagcatggtg 1380

ggtcgcgttc agatggatat gctgcaggtg ctgcttcggg aacacaagct ccgctcctac 1440

acgctcaacg ctgtgagttt ccacttcctg ggcgagcaga aggaggacgt tcagcacagc 1500

atcatcaccg acctgcagaa tgggaacgaa cagacgcgcc gccgcctggc cgtgtactgc 1560

ctgaaggacg cctttctgcc actccgacta ctagagcgcc ttatggtgct ggtgaacaat 1620

gtggagatgg cgcgtgtcac cggtgtaccc cttgggtacc tgctcacccg gggccagcag 1680

gtcaaggtcg tgtctcagct gctgcgccag gccatgcgcc aggggctgct gatgcctgtg 1740

gtgaagaccg agggcggtga ggactacacg ggagccacag tcattgagcc cctcaaaggg 1800

tactatgacg tccccattgc caccctggac ttctcctcct tgtacccatc catcatgatg 1860

gcccataatc tgtgctacac cacgctgctc cgacctgggg ctgcccagaa gctgggcctt 1920

aaaccagatg agttcatcaa gacacccact ggggatgagt ttgtgaagtc atctgtacgg 1980

aagggcctcc tgccccagat cctggagaat ctgctgagtg cccgcaagag ggccaaggct 2040

gagctggctc aggagacgga ccccctgcgg cgacaggtct tggacggccg gcaactggca 2100

ctaaaagtga gtgccaactc cgtatatggc ttcactggtg cccaggtggg caagctgcca 2160

tgtttggaaa tctcccagag tgtcactggg ttcgggcggc agatgattga gaaaaccaag 2220

cagcttgtgg agtccaagta caccgtggaa aatggctacg atgccaacgc caaggtagtc 2280

tacggtgaca cggactctgt gatgtgccgg tttggcgtct cctctgtggc tgaagcaatg 2340

tctctggggc gggaggctgc aaactgggta tccagtcact tcccatcacc catccggctg 2400

gagttcgaga aggtttactt cccatacctg ctcatcagca agaagcgcta tgctggcctg 2460

ctcttctcct cccgctctga tgcccatgac aaaatggact gcaagggcct ggaggctgtg 2520

cgcagggaca actgtcccct ggtggccaac ctcgttacat cctccctgcg ccggatcctc 2580

gtggaccggg accctgatgg ggcagtagcc catgccaagg acgtcatctc ggacctgctg 2640

tgcaaccgca tagacatctc ccagctggtc atcaccaaag agttgacccg cgcagcagca 2700

gactatgctg gcaagcaggc tcacgtggag ctggctgaga ggatgaggaa gcgcgacccc 2760

ggcagtgcgc ccagcctggg tgaccgagtc ccctatgtga tcattggtgc tgctaagggt 2820

gtggccgcct acatgaagtc ggaggacccc ctgtttgtgc tggagcacag cctgcccatc 2880

gacactcagt actacctgga gcagcagctg gccaagccgc tcttgcgcat ctttgagccc 2940

atcctgggtg agggccgtgc agagtctgtg ctgctgcgcg gtgaccacac acgatgcaag 3000

actgtgctca ccagcaaggt gggcggcctc ttggccttca ccaagcgccg caactgttgc 3060

attggctgcc gctccgtaat cgaccatcaa ggagccgtgt gtaagttctg tcagccacgg 3120

gagtcggagc tctctcagaa ggaggtgtca cacctgaatg ccttggaaga acggttctct 3180

cgcctctgga cacagtgtca acgctgccag ggcagcttgc atgaggacgt catctgtacc 3240

agccgtgact gtcccatctt ctacatgcgc aagaaggtgc gcaaggacct ggaagaccag 3300

gaacggctgc tgcagcgctt tggaccgccc ggccctgagg cctggtgacc tgacacggga 3360

caaggaataa agttcagatc tttgctaaaa 3390

<210>56

<211>1105

<212>PRT

<213>小鼠(Mus musculus)

<400>56

Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys

1 5 10 15

Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln

20 25 30

Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg

35 40 45

Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val

50 55 60

Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro

65 70 75 80

Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln

85 90 95

Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Arg

100 105 110

Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val

115 120 125

Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro

130 135 140

Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser

145 150 155 160

Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly

165 170 175

Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser

180 185 190

Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu

195 200 205

Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu

210 215 220

Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala

225 230 235 240

Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala

245 250 255

Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val

260 265 270

Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val

275 280 285

Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg

290 295 300

Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg

305 310 315 320

Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys

325 330 335

Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala

340 345 350

Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser

355 360 365

Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu

370 375 380

Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Asp

385 390 395 400

Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe

405 410 415

Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser

420 425 430

Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser

435 440 445

Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu

450 455 460

His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu

465 470 475 480

Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln

485 490 495

Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys

500 505 510

Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val

515 520 525

Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu

530 535 540

Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln

545 550 555 560

Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Gly

565 570 575

Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr

580 585 590

Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile

595 600 605

Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala

610 615 620

Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr

625 630 635 640

Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln

645 650 655

Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu

660 665 670

Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln

675 680 685

Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala

690 695 700

Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly

705 710 715 720

Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys

725 730 735

Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly

740 745 750

Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu

755 760 765

Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe

770 775 780

Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu

785 790 795 800

Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser

805 810 815

Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg

820 825 830

Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg

835 840 845

Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp

850 855 860

Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val

865 870 875 880

Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln

885 890 895

Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser

900 905 910

Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala

915 920 925

Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu

930 935 940

Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu

945 950 955 960

Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg

965 970 975

Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val

980 985 990

Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn

995 1000 1005

Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys

1010 1015 1020

Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Ser Gln Lys Glu Val Ser

1025 1030 1035 1040

His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys

1045 1050 1055

Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg

1060 1065 1070

Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu

1075 1080 1085

Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala

1090 1095 1100

Trp

1105

<210>57

<211>7119

<212>DNA

<213>小鼠(Mus musculus)

<400>57

gccaaattct ccccggagcc tgagggagct ttggagcgtc gcaatggtcc tgaggaacag 60

tggacggagg caccccgagc cgggcgcgga tggcgaaggc agccgggatg atggtccctc 120

ttcctcagtc tcagcactca agcgtctgga acggagccag tggacagaca agatggactt 180

acggtttggt ttcgaaaggc tgaaagagcc tggagaaagg actggctggc tgatcaacat 240

gcaccctact gagatcttag atgaagacaa acgcttagtc agcgcggtgg attactactt 300

cattcaagat gatggaagca gatttaaggt ggccttgccc tatatgccgt atttctacat 360

tgcagcgaga aagggttgtg atcgagaagt ttcatctttt ctatccaaga agtttcaggg 420

aaaaattgca aagttagaga atgtgcccaa agaagatctg gacttgccaa atcacttggt 480

gggcttgaag cggagttaca tcaagctgtc cttccacact gtggaggacc ttgtcaaagt 540

gagaaaggag atctctcctg ctgtgaagaa gaaccgagag caggaccatg ctagtgatga 600

gtatacaaca atgctctcca gtattctgca aggtggcagt gtaattactg atgaggagga 660

aacctctaag aagatagctg accaattgga caacatagtg gacatgcggg agtatgatgt 720

tccctaccac attcgcctct ccattgacct cagaatccat gtggcccact ggtacaatgt 780

tagatttcga ggaaatgctt ttcctgtgga aatcacccga cgagatgatc ttgtggaacg 840

acctgaccct gtggttttgg catttgacat cgagacgacc aaactgcctc tcaaattccc 900

tgatgctgag accgatcaga tcatgatgat ctcctatatg attgatggcc agggctacct 960

catcactaac agggagattg tttcagaaga tattgaagat tttgagttca cccctaagcc 1020

agaatatgaa gggccctttt gtgttttcaa tgaacccgac gaggtccatc tgatccagag 1080

atggtttgag catatccagg agaccaaacc taccattatg gtcacctaca atggggattt 1140

ttttgactgg ccatttgtgg aggctagggc agcaattcat ggcctcagca tgtaccagga 1200

gataggcttc cagaaggata gccaggggga atataaggca ccacagtgca tccacatgga 1260

ctgcctcagg tgggtgaaga gggacagtta ccttcctgtg ggcagtcata atctcaaggc 1320

agctgccaag gccaaacttg gctatgaccc tgtagagctg gaccctgagg acatgtgtcg 1380

tatggccact gaacagcccc agactctggc cacttactca gtgtcagatg ctgtggctac 1440

ttactacctg tacatgaaat acgtccaccc cttcatattc gccctgtgca ccattattcc 1500

catggaacct gatgaggtgc tgcggaaggg ctccgggaca ctgtgtgaag ccttgctgat 1560

ggtgcaagct ttccatgcca acattatctt ccccaataag caagagcagg agttcaacaa 1620

gctgacagat gatggccacg tgctagatgc tgagacctac gttgggggcc acgtggaggc 1680

actagagtct ggtgtcttca gaagtgatat cccctgccgg tttaggatga atcctgcagc 1740

ctttgatttc ctgctgcaac gagtcgagaa gactatgcgc cacgccattg aagaagaaga 1800

gaaggtgcct gtggaacaag ccaccaactt tcaagaggtg tgtgagcaga ttaagaccaa 1860

gctcacctcc ctaaaagatg ttcctaacag aattgaatgt cctctaatct atcatctaga 1920

tgtgggggcc atgtatccta acataattct taccaaccgc ctacagcctt ctgccatagt 1980

ggatgaggcc acctgtgctg cctgtgactt caataagcct ggagcaagtt gtcagaggaa 2040

gatggcctgg cagtggaggg gagaattcat gccagccagt cgcagtgaat accatcggat 2100

tcagcatcag ctggagtcgg agaagtttcc ccctttgttt ccagaggggc cagcacgggc 2160

ctttcacgag ctgtcccgtg aagaacaggc taaatatgag aagaggaggc tggcagatta 2220

ttgccggaaa gcctataaga agatccatgt gaccaaggta gaagaacgtc taactaccat 2280

ctgccagcgg gaaaactcat tttatgtgga cacagtgcgg gccttcagag acaggcgcta 2340

tgagttcaaa ggactgcaca aggtgtggaa gaagaagctc tcggcagctg tagaggtggg 2400

cgatgcatca gaggtgaagc gctgcaagaa catggagatc ctttacgatt cactgcagct 2460

ggctcacaag tgcatcctga actccttcta cggctatgtc atgcgcaaag gagctcgctg 2520

gtattccatg gagatggctg gtatcgtctg ctttacagga gccaacatca tcacccaagc 2580

aagagaactg attgagcaga tcgggaggcc tttagaattg gacacggacg gaatatggtg 2640

cgtcctaccc aatagctttc ctgaaaattt tgtcatcaag acaaccaatg cgaagaaacc 2700

caaactgacc atctcctatc ctggtgccat gttgaacatc atggtcaagg aaggctttac 2760

caaccaccag taccaggaac taacagagcc ttcgtctctc acctatgtca cccactctga 2820

gaatagtatc ttttttgaag tcgatggacc ataccttgct atgatccttc cagcctccaa 2880

ggaagaaggc aagaagctga agaaaagata tgctgtgttc aatgaagatg gttccttggc 2940

tgaactgaaa ggttttgagg tgaaacgccg aggggagttg cagctgatta aaatattcca 3000

gtcctcagtt tttgaggcct tcctcaaggg cagcacactg gaggaagtgt atggctcggt 3060

ggccaaagtg gctgactact ggctagatgt gctctatagc aaggctgcta atatgcccga 3120

ttctgaattg tttgagctga tttctgagaa ccgctccatg tctcggaagc tggaagatta 3180

cggggagcag aagtctacat ccatcagcac agcaaagcgc ctggctgagt tcctgggaga 3240

ccagatggtc aaagatgctg gactgagctg ccgctatatc atctcccgaa agccagaggg 3300

gtctcctgtc actgagaggg ccattccact tgccattttc caagcagagc ctacagtgag 3360

gaaacatttt ctccggaaat ggctaaagag ttcatcactt caagactttg atattcggac 3420

aattctggac tgggactact acatagagag gctggggagt gccatccaga aaatcatcac 3480

catccccgca gctctgcagc aggtgaagaa cccagttcca cgtgtcaaac atccagactg 3540

gctacacaaa aaactactag agaagaatga tatctacaaa cagaagaaga tcagtgagct 3600

ctttgtgctt gaaggaaaga gacagattgt gatggcccag gcttcagaaa acagtctgag 3660

tctctgcact ccagacatgg aggacattgg actcacaaag ccacaccact ctacagtccc 3720

agttgctact aagaggaagc gagtctggga gacccaaaag gagtctcagg atattgcact 3780

aactgtgccc tggcaagagg tcttagggca gcctccctcc cttggaacca cacaggaaga 3840

gtggttggtc tggctccagt tccacaagaa aaagtggcag ctgcaggccc aacagcgcct 3900

agccctcagg aagaagcaac gcttagagtc agcagaagat atgccaaggc ttgggcctat 3960

ccgagaggag ccttccacag gactggggag ctttttgcga aggactgccc gcagcatcat 4020

ggaccttcca tggcagataa tacagatcag tgagaccaga caggctggtc tgttccggct 4080

gtgggctatc attggcaatg acttgcactg catcaagctg agtatccctc gagtattcta 4140

tgtaaaccag cgggttgcca aagcagagga tggacctgca tatcggaagg tgaatcgggg 4200

gctcttcctt cgttccaaca ttgtctacaa tctctatgag tattcagtac cagaggacat 4260

gtaccaagaa cacatcaacg agatcaacac tgagttgtca gtaccagaca ttgagggcgt 4320

gtatgagaca caggtcccat tgttattccg ggccctcgtg cagctgggct gtgtgtgtgt 4380

ggtcaacaag cagctgacaa ggcacctttc gggctgggaa gctgaaactt ttgccctcga 4440

gcaccttgaa atgcgttctc tggcccagtt cagctacttg gaaccaggga gtatccgcca 4500

tatctacctg taccatcaca ctcagggcca caaggcactc tttggggtct ttatcccctc 4560

acagcgaaga gcatctgtgt ttgtgttgga tactgtacga agcaaccaaa tgccagggct 4620

cagtgccctg tactcatcag aacacagcct gctgctggac aaggtggacc ccaagctcct 4680

gcctccccca aaacacacct ttgaagttcg tgctgaaacc aacctggaga ctatctgcag 4740

agccatccag cgcttcctgc ttgcctacaa ggaagagcgc cgagggccca cactcatcgc 4800

tgtccagtct agctgggagc tgtgtaggct gaccagtgag attccagtct tagaagagtt 4860

cccactagtg cctatccgag tggctgacaa gatcagctat gcagtcctag actggcagcg 4920

ccatggagct cgccgaatga tccggcacta cctcaattta gacttgtgcc tgtcgcaggc 4980

ctttgagatg agcaggtact tccacatccc tgttggaaac ctgccggaag acatctccat 5040

ctttggctca gacctctttt ttgcacgcca cctccagcac cataaccacc tgctttggct 5100

atcccctacc tctcggcctg acctgggtgg gaaggaagct gatgacaacc gccttgtcat 5160

ggagtttgat gaccgagcca ctgtggagat caatagttct ggctgttact ctactgtgtg 5220

cgtggaactg gacattcaaa atctggcagt caacaccatc ctccagtccc atcatgtcaa 5280

tgacatggag ggggctggca gcatgggcat cagcttcgat gtgatccagc aggcctccct 5340

agaggacatg gtaacaggca atcaagctgc cagtgccctg gccaactacg atgagacagc 5400

cctctgctct agtaccttca ggatcctgaa gagcatggtg gttggctggg taaaggaaat 5460

cacacagtac cacaacatct atgctgacaa ccaggtaatg cacttctacc gctggctcca 5520

gtcaccgtgc tctctgctcc acgacccagc ccttcaccgg acgctgcaca atatgatgaa 5580

gaagctcttc ctgcagctca ttgctgagtt caagcgcctg gggtcatcag tcgtctatgc 5640

caacttcaat cgcatcattc tctgtacaaa gaagcgccga atagaggatg cccttgccta 5700

tgtggaatat attaccaaca gcatccattc taaagagatc ttccattccc tgaccatctc 5760

tttctctcga tgctgggaat tccttctctg gatggatcca tccaactatg gtggaatcaa 5820

aggaaaagtt ccatctagta ttcactgtgg acaggtaaaa gagcaagact cccaggcaag 5880

agaggaaact gatgaagagg aggaggacaa ggaaaaggac gaggaggaag agggcatggg 5940

agagtccgag gttgaggact tactggagaa caactggaac attctacagt tcttgcccca 6000

ggcagcctct tgccagagct acttcctcat gattgtttca gcatacatcg tagctgtgta 6060

ccaaagcatg aaggaggagt tgagacacag tgccccgggc agtacccctg tgaagaggaa 6120

gggggccagc cagttctccc aggagtctga aggggcaact ggatctcttc ctggaatgat 6180

cactttctct caagattatg tggcaaatga gctcactcag agcttcttca ccattactca 6240

gaaaattcag aagaaagtca caggttctcg gaacaccact gagccctcag agatgttccc 6300

cgtcctccct ggttcacact tgctgctcaa taatcctgct ctggagttca tcaaatatgt 6360

gtgcaaggta ctatctcagg atacaaacat cacaaatcag gtgaataagc tgaacagaga 6420

ccttcttcgc ctggtagacg ttggtgaatt ctctgaggag gcccagttca gagacccctg 6480

ccactcctac gtgctccctg aggtaatctg ccacagctgt aatttctgcc gagacctgga 6540

cctgtgcaaa gattcctctt tctctcagga tggagccatc ctgcctcagt ggctctgctc 6600

caattgtcaa gccccctatg actcctctgc cattgagtca gccttggtgg aagccctgca 6660

gaggaaactg atggccttca cacttcagga cctggtatgc ctcaagtgcc gtggtatgaa 6720

agagacccat atgcctgtgt actgcagctg cgcaggggac tttactctca ccatccgcac 6780

tgaggtcttc atggaacaga ttagaatctt ccagaacatt gccaagtact acagcatgtc 6840

atatctccag gagaccatag aatggctgtt acagacaagc cctgtatcaa actgttagca 6900

agcctaggct aaagacactt tggtatccca cacctactgc ctgctccaaa aggcagaacc 6960

actgaccacc ttgcttttcc aaactcatga gcacagccca gaaggaacag aagacttctg 7020

ctaacgtcat catgccataa acagacagaa gcagggaatg gctctatccc tagctgcctg 7080

ctaagtaaac acggttttga agcgtctgaa aaaaaaaaa 7119

<210>58

<211>2284

<212>PRT

<213>小鼠(Mus musculus)

<400>58

Met Val Leu Arg Asn Ser Gly Arg Arg His Pro Glu Pro Gly Ala Asp

1 5 10 15

Gly Glu Gly Ser Arg Asp Asp Gly Pro Ser Ser Ser Val Ser Ala Leu

20 25 30

Lys Arg Leu Glu Arg Ser Gln Trp Thr Asp Lys Met Asp Leu Arg Phe

35 40 45

Gly Phe Glu Arg Leu Lys Glu Pro Gly Glu Arg Thr Gly Trp Leu Ile

50 55 60

Asn Met His Pro Thr Glu Ile Leu Asp Glu Asp Lys Arg Leu Val Ser

65 70 75 80

Ala Val Asp Tyr Tyr Phe Ile Gln Asp Asp Gly Ser Arg Phe Lys Val

85 90 95

Ala Leu Pro Tyr Met Pro Tyr Phe Tyr Ile Ala Ala Arg Lys Gly Cys

100 105 110

Asp Arg Glu Val Ser Ser Phe Leu Ser Lys Lys Phe Gln Gly Lys Ile

115 120 125

Ala Lys Leu Glu Asn Val Pro Lys Glu Asp Leu Asp Leu Pro Asn His

130 135 140

Leu Val Gly Leu Lys Arg Ser Tyr Ile Lys Leu Ser Phe His Thr Val

145 150 155 160

Glu Asp Leu Val Lys Val Arg Lys Glu Ile Ser Pro Ala Val Lys Lys

165 170 175

Asn Arg Glu Gln Asp His Ala Ser Asp Glu Tyr Thr Thr Met Leu Ser

180 185 190

Ser Ile Leu Gln Gly Gly Ser Val Ile Thr Asp Glu Glu Glu Thr Ser

195 200 205

Lys Lys Ile Ala Asp Gln Leu Asp Asn Ile Val Asp Met Arg Glu Tyr

210 215 220

Asp Val Pro Tyr His Ile Arg Leu Ser Ile Asp Leu Arg Ile His Val

225 230 235 240

Ala His Trp Tyr Asn Val Arg Phe Arg Gly Asn Ala Phe Pro Val Glu

245 250 255

Ile Thr Arg Arg Asp Asp Leu Val Glu Arg Pro Asp Pro Val Val Leu

260 265 270

Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro Leu Lys Phe Pro Asp Ala

275 280 285

Glu Thr Asp Gln Ile Met Met Ile Ser Tyr Met Ile Asp Gly Gln Gly

290 295 300

Tyr Leu Ile Thr Asn Arg Glu Ile Val Ser Glu Asp Ile Glu Asp Phe

305 310 315 320

Glu Phe Thr Pro Lys Pro Glu Tyr Glu Gly Pro Phe Cys Val Phe Asn

325 330 335

Glu Pro Asp Glu Val His Leu Ile Gln Arg Trp Phe Glu His Ile Gln

340 345 350

Glu Thr Lys Pro Thr Ile Met Val Thr Tyr Asn Gly Asp Phe Phe Asp

355 360 365

Trp Pro Phe Val Glu Ala Arg Ala Ala Ile His Gly Leu Ser Met Tyr

370 375 380

Gln Glu Ile Gly Phe Gln Lys Asp Ser Gln Gly Glu Tyr Lys Ala Pro

385 390 395 400

Gln Cys Ile His Met Asp Cys Leu Arg Trp Val Lys Arg Asp Ser Tyr

405 410 415

Leu Pro Val Gly Ser His Asn Leu Lys Ala Ala Ala Lys Ala Lys Leu

420 425 430

Gly Tyr Asp Pro Val Glu Leu Asp Pro Glu Asp Met Cys Arg Met Ala

435 440 445

Thr Glu Gln Pro Gln Thr Leu Ala Thr Tyr Ser Val Ser Asp Ala Val

450 455 460

Ala Thr Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ala

465 470 475 480

Leu Cys Thr Ile Ile Pro Met Glu Pro Asp Glu Val Leu Arg Lys Gly

485 490 495

Ser Gly Thr Leu Cys Glu Ala Leu Leu Met Val Gln Ala Phe His Ala

500 505 510

Asn Ile Ile Phe Pro Asn Lys Gln Glu Gln Glu Phe Asn Lys Leu Thr

515 520 525

Asp Asp Gly His Val Leu Asp Ala Glu Thr Tyr Val Gly Gly His Val

530 535 540

Glu Ala Leu Glu Ser Gly Val Phe Arg Ser Asp Ile Pro Cys Arg Phe

545 550 555 560

Arg Met Asn Pro Ala Ala Phe Asp Phe Leu Leu Gln Arg Val Glu Lys

565 570 575

Thr Met Arg His Ala Ile Glu Glu Glu Glu Lys Val Pro Val Glu Gln

580 585 590

Ala Thr Asn Phe Gln Glu Val Cys Glu Gln Ile Lys Thr Lys Leu Thr

595 600 605

Ser Leu Lys Asp Val Pro Asn Arg Ile Glu Cys Pro Leu Ile Tyr His

610 615 620

Leu Asp Val Gly Ma Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu

625 630 635 640

Gln Pro Ser Ala Ile Val Asp Glu Ala Thr Cys Ala Ala Cys Asp Phe

645 650 655

Asn Lys Pro Gly Ala Ser Cys Gln Arg Lys Met Ala Trp Gln Trp Arg

660 665 670

Gly Glu Phe Met Pro Ala Ser Arg Ser Glu Tyr His Arg Ile Gln His

675 680 685

Gln Leu Glu Ser Glu Lys Phe Pro Pro Leu Phe Pro Glu Gly Pro Ala

690 695 700

Arg Ala Phe His Glu Leu Ser Arg Glu Glu Gln Ala Lys Tyr Glu Lys

705 710 715 720

Arg Arg Leu Ala Asp Tyr Cys Arg Lys Ala Tyr Lys Lys Ile His Val

725 730 735

Thr Lys Val Glu Glu Arg Leu Thr Thr Ile Cys Gln Arg Glu Asn Ser

740 745 750

Phe Tyr Val Asp Thr Val Arg Ala Phe Arg Asp Arg Arg Tyr Glu Phe

755 760 765

Lys Gly Leu His Lys Val Trp Lys Lys Lys Leu Ser Ala Ala Val Glu

770 775 780

Val Gly Asp Ala Ser Glu Val Lys Arg Cys Lys Asn Met Glu Ile Leu

785 790 795 800

Tyr Asp Ser Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr

805 810 815

Gly Tyr Val Met Arg Lys Gly Ala Arg Trp Tyr Ser Met Glu Met Ala

820 825 830

Gly Ile Val Cys Phe Thr Gly Ala Asn Ile Ile Thr Gln Ala Arg Glu

835 840 845

Leu Ile Glu Gln Ile Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile

850 855 860

Trp Cys Val Leu Pro Asn Ser Phe Pro Glu Asn Phe Val Ile Lys Thr

865 870 875 880

Thr Asn Ala Lys Lys Pro Lys Leu Thr Ile Ser Tyr Pro Gly Ala Met

885 890 895

Leu Asn Ile Met Val Lys Glu Gly Phe Thr Asn His Gln Tyr Gln Glu

900 905 910

Leu Thr Glu Pro Ser Ser Leu Thr Tyr Val Thr His Ser Glu Asn Ser

915 920 925

Ile Phe Phe Glu Val Asp Gly Pro Tyr Leu Ala Met Ile Leu Pro Ala

930 935 940

Ser Lys Glu Glu Gly Lys Lys Leu Lys Lys Arg Tyr Ala Val Phe Asn

945 950 955 960

Glu Asp Gly Ser Leu Ala Glu Leu Lys Gly Phe Glu Val Lys Arg Arg

965 970 975

Gly Glu Leu Gln Leu Ile Lys Ile Phe Gln Ser Ser Val Phe Glu Ala

980 985 990

Phe Leu Lys Gly Ser Thr Leu Glu Glu Val Tyr Gly Ser Val Ala Lys

995 1000 1005

Val Ala Asp Tyr Trp Leu Asp Val Leu Tyr Ser Lys Ala Ala Asn Met

1010 1015 1020

Pro Asp Ser Glu Leu Phe Glu Leu Ile Ser Glu Asn Arg Ser Met Ser

1025 1030 1035 1040

Arg Lys Leu Glu Asp Tyr Gly Glu Gln Lys Ser Thr Ser Ile Ser Thr

1045 1050 1055

Ala Lys Arg Leu Ala Glu Phe Leu Gly Asp Gln Met Val Lys Asp Ala

1060 1065 1070

Gly Leu Ser Cys Arg Tyr Ile Ile Ser Arg Lys Pro Glu Gly Ser Pro

1075 1080 1085

Val Thr Glu Arg Ala Ile Pro Leu Ala Ile Phe Gln Ala Glu Pro Thr

1090 1095 1100

Val Arg Lys His Phe Leu Arg Lys Trp Leu Lys Ser Ser Ser Leu Gln

1105 1110 1115 1120

Asp Phe Asp Ile Arg Thr Ile Leu Asp Trp Asp Tyr Tyr Ile Glu Arg

1125 1130 1135

Leu Gly Ser Ala Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu Gln

1140 1145 1150

Gln Val Lys Asn Pro Val Pro Arg Val Lys His Pro Asp Trp Leu His

1155 1160 1165

Lys Lys Leu Leu Glu Lys Asn Asp Ile Tyr Lys Gln Lys Lys Ile Ser

1170 1175 1180

Glu Leu Phe Val Leu Glu Gly Lys Arg Gln Ile Val Met Ala Gln Ala

1185 1190 1195 1200

Ser Glu Asn Ser Leu Ser Leu Cys Thr Pro Asp Met Glu Asp Ile Gly

1205 1210 1215

Leu Thr Lys Pro His His Ser Thr Val Pro Val Ala Thr Lys Arg Lys

1220 1225 1230

Arg Val Trp Glu Thr Gln Lys Glu Ser Gln Asp Ile Ala Leu Thr Val

1235 1240 1245

Pro Trp Gln Glu Val Leu Gly Gln Pro Pro Ser Leu Gly Thr Thr Gln

1250 1255 1260

Glu Glu Trp Leu Val Trp Leu Gln Phe His Lys Lys Lys Trp Gln Leu

1265 1270 1275 1280

Gln Ala Gln Gln Arg Leu Ala Leu Arg Lys Lys Gln Arg Leu Glu Ser

1285 1290 1295

Ala Glu Asp Met Pro Arg Leu Gly Pro Ile Arg Glu Glu Pro Ser Thr

1300 1305 1310

Gly Leu Gly Ser Phe Leu Arg Arg Thr Ala Arg Ser Ile Met Asp Leu

1315 1320 1325

Pro Trp Gln Ile Ile Gln Ile Ser Glu Thr Arg Gln Ala Gly Leu Phe

1330 1335 1340

Arg Leu Trp Ala Ile Ile Gly Asn Asp Leu His Cys Ile Lys Leu Ser

1345 1350 1355 1360

Ile Pro Arg Val Phe Tyr Val Asn Gln Arg Val Ala Lys Ala Glu Asp

1365 1370 1375

Gly Pro Ala Tyr Arg Lys Val Asn Arg Gly Leu Phe Leu Arg Ser Asn

1380 1385 1390

Ile Val Tyr Asn Leu Tyr Glu Tyr Ser Val Pro Glu Asp Met Tyr Gln

1395 1400 1405

Glu His Ile Asn Glu Ile Asn Thr Glu Leu Ser Val Pro Asp Ile Glu

1410 1415 1420

Gly Val Tyr Glu Thr Gln Val Pro Leu Leu Phe Arg Ala Leu Val Gln

1425 1430 1435 1440

Leu Gly Cys Val Cys Val Val Asn Lys Gln Leu Thr Arg His Leu Ser

1445 1450 1455

Gly Trp Glu Ala Glu Thr Phe Ala Leu Glu His Leu Glu Met Arg Ser

1460 1465 1470

Leu Ala Gln Phe Ser Tyr Leu Glu Pro Gly Ser Ile Arg His Ile Tyr

1475 1480 1485

Leu Tyr His His Thr Gln Gly His Lys Ala Leu Phe Gly Val Phe Ile

1490 1495 1500

Pro Ser Gln Arg Arg Ala Ser Val Phe Val Leu Asp Thr Val Arg Ser

1505 1510 1515 1520

Asn Gln Met Pro Gly Leu Ser Ala Leu Tyr Ser Ser Glu His Ser Leu

1525 1530 1535

Leu Leu Asp Lys Val Asp Pro Lys Leu Leu Pro Pro Pro Lys His Thr

1540 1545 1550

Phe Glu Val Arg Ala Glu Thr Asn Leu Glu Thr Ile Cys Arg Ala Ile

1555 1560 1565

Gln Arg Phe Leu Leu Ala Tyr Lys Glu Glu Arg Arg Gly Pro Thr Leu

1570 1575 1580

Ile Ala Val Gln Ser Ser Trp Glu Leu Cys Arg Leu Thr Ser Glu Ile

1585 1590 1595 1600

Pro Val Leu Glu Glu Phe Pro Leu Val Pro Ile Arg Val Ala Asp Lys

1605 1610 1615

Ile Ser Tyr Ala Val Leu Asp Trp Gln Arg His Gly Ala Arg Arg Met

1620 1625 1630

Ile Arg His Tyr Leu Asn Leu Asp Leu Cys Leu Ser Gln Ala Phe Glu

1635 1640 1645

Met Ser Arg Tyr Phe His Ile Pro Val Gly Asn Leu Pro Glu Asp Ile

1650 1655 1660

Ser Ile Phe Gly Ser Asp Leu Phe Phe Ala Arg His Leu Gln His His

1665 1670 1675 1680

Asn His Leu Leu Trp Leu Ser Pro Thr Ser Arg Pro Asp Leu Gly Gly

1685 1690 1695

Lys Glu Ala Asp Asp Asn Arg Leu Val Met Glu Phe Asp Asp Arg Ala

1700 1705 1710

Thr Val Glu Ile Asn Ser Ser Gly Cys Tyr Ser Thr Val Cys Val Glu

1715 1720 1725

Leu Asp Ile Gln Asn Leu Ala Val Asn Thr lle Leu Gln Ser His His

1730 1735 1740

Val Asn Asp Met Glu Gly Ala Gly Ser Met Gly Ile Ser Phe Asp Val

1745 1750 1755 1760

Ile Gln Gln Ala Ser Leu Glu Asp Met Val Thr Gly Asn Gln Ala Ala

1765 1770 1775

Ser Ala Leu Ala Asn Tyr Asp Glu Thr Ala Leu Cys Ser Ser Thr Phe

1780 1785 1790

Arg Ile Leu Lys Ser Met Val Val Gly Trp Val Lys Glu Ile Thr Gln

1795 1800 1805

Tyr His Asn lle Tyr Ala Asp Asn Gln Val Met His Phe Tyr Arg Trp

1810 1815 1820

Leu Gln Ser Pro Cys Ser Leu Leu His Asp Pro Ala Leu His Arg Thr

1825 1830 1835 1840

Leu His Asn Met Met Lys Lys Leu Phe Leu Gln Leu Ile Ala Glu Phe

1845 1850 1855

Lys Arg Leu Gly Ser Ser Val Val Tyr Ala Asn Phe Asn Arg Ile Ile

1860 1865 1870

Leu Cys Thr Lys Lys Arg Arg Ile Glu Asp Ala Leu Ala Tyr Val Glu

1875 1880 1885

Tyr Ile Thr Asn Ser Ile His Ser Lys Glu Ile Phe His Ser Leu Thr

1890 1895 1900

Ile Ser Phe Ser Arg Cys Trp Glu Phe Leu Leu Trp Met Asp Pro Ser

1905 1910 1915 1920

Asn Tyr Gly Gly Ile Lys Gly Lys Val Pro Ser Ser Ile His Cys Gly

1925 1930 1935

Gln Val Lys Glu Gln Asp Ser Gln Ala Arg Glu Glu Thr Asp Glu Glu

1940 1945 1950

Glu Glu Asp Lys Glu Lys Asp Glu Glu Glu Glu Gly Met Gly Glu Ser

1955 1960 1965

Glu Val Glu Asp Leu Leu Glu Asn Asn Trp Asn Ile Leu Gln Phe Leu

1970 1975 1980

Pro Gln Ala Ala Ser Cys Gln Ser Tyr Phe Leu Met Ile Val Ser Ala

1985 1990 1995 2000

Tyr Ile Val Ala Val Tyr Gln Ser Met Lys Glu Glu Leu Arg His Ser

2005 2010 2015

Ala Pro Gly Ser Thr Pro Val Lys Arg Lys Gly Ala Ser Gln Phe Ser

2020 2025 2030

Gln Glu Ser Glu Gly Ala Thr Gly Ser Leu Pro Gly Met Ile Thr Phe

2035 2040 2045

Ser Gln Asp Tyr Val Ala Asn Glu Leu Thr Gln Ser Phe Phe Thr Ile

2050 2055 2060

Thr Gln Lys Ile Gln Lys Lys Val Thr Gly Ser Arg Asn Thr Thr Glu

2065 2070 2075 2080

Pro Ser Glu Met Phe Pro Val Leu Pro Gly Ser His Leu Leu Leu Asn

2085 2090 2095

Asn Pro Ala Leu Glu Phe Ile Lys Tyr Val Cys Lys Val Leu Ser Gln

2100 2105 2110

Asp Thr Asn Ile Thr Asn Gln Val Asn Lys Leu Asn Arg Asp Leu Leu

2115 2120 2125

Arg Leu Val Asp Val Gly Glu Phe Ser Glu Glu Ala Gln Phe Arg Asp

2130 2135 2140

Pro Cys His Ser Tyr Val Leu Pro Glu Val Ile Cys His Ser Cys Asn

2145 2150 2155 2160

Phe Cys Arg Asp Leu Asp Leu Cys Lys Asp Ser Ser Phe Ser Gln Asp

2165 2170 2175

Gly Ala Ile Leu Pro Gln Trp Leu Cys Ser Asn Cys Gln Ala Pro Tyr

2180 2185 2190

Asp Ser Ser Ala Ile Glu Ser Ala Leu Val Glu Ala Leu Gln Arg Lys

2195 2200 2205

Leu Met Ala Phe Thr Leu Gln Asp Leu Val Cys Leu Lys Cys Arg Gly

2210 2215 2220

Met Lys Glu Thr His Met Pro Val Tyr Cys Ser Cys Ala Gly Asp Phe

2225 2230 2235 2240

Thr Leu Thr Ile Arg Thr Glu Val Phe Met Glu Gln Ile Arg Ile Phe

2245 2250 2255

Gln Asn Ile Ala Lys Tyr Tyr Ser Met Ser Tyr Leu Gln Glu Thr Ile

2260 2265 2270

Glu Trp Leu Leu Gln Thr Ser Pro Val Ser Asn Cys

2275 2280

<210>59

<211>3325

<212>DNA

<213>大鼠(Rattus norvegicus)

<400>59

aggcgatgga tggtaaacgg cggcaagcgc ccagctctgg ggtgccccca aagcgggctt 60

gcaagggcct ctgggatgaa gatgagccgt cacagtttga ggagaacctg gcgctgctgg 120

aggagataga ggccgagaat cggctgcagg aggccgagga ggagctgcag ctgccccctg 180

agggcattgt gggtgggcag ttttccactg cagacattga cccacggtgg ctgcggccca 240

ccccacttgc cctggacccc agcacggagc ccctcatctt ccagcagctg gagattgacc 300

actatgtggg cacatcacct cccctgccag aaggaccccc cgcatctcgt aactcagtgc 360

ccatactgag ggcctttggg gtcaccgatg agggcttctc cgtctgctgc cacatccacg 420

gctttgcccc ctacttctac acccctgcac ctccgggttt tggggctgag cacctgagtg 480

aactacagcg ggagctgaat gcagccatca gccgggacca gcgtggtgga aaggagctct 540

cggggccggc agtgctagct atagagctgt gctcccgtga gagcatgttt gggtaccatg 600

gccacggccc ttctcccttt ctccgcatca ccctggcact accccgcctg atggcgccag 660

cccgccgcct cctggaacag ggtatccgag tgccaggcct gggcaccccg agctttgcac 720

cctatgaagc caatgtggac tttgagatcc ggttcatggt ggatgctgac attgtgggat 780

gcaactggtt ggagctccca gctggaaagt acgttcggag ggcagagaag aaggctacac 840

tgtgtcagct ggaggtggat gtgctgtggt cagacgtgat cagtcaccca ccagaagggc 900

agtggcagcg catcgcaccc ctgcgtgtgc ttagcttcga catcgagtgc gctggccgaa 960

aaggcatctt ccctgagcct gagcgtgacc ccgtgatcca gatctgttct ctggggctgc 1020

gctggggtga gccagagccc ttcttgcgcc tagcactcac gctgcggcct tgcgccccca 1080

tcctgggtgc caaagtacag agctatgaac gggaagaaga cctgctccag gcctgggcca 1140

ctttcatcct cgccatggac cctgacgtga tcaccggcta caacattcag aactttgacc 1200

tcccctacct catctctcgg gcacaaacct taaaggtgga ccgattccct ttcctgggcc 1260

gtgtgactgg tctccgctcc aacatccgtg actcctcctt ccaatcaagg caggtgggcc 1320

ggcgggacag taaggtggtc agcatggtgg gtcgcgttca gatggatatg ctgcaggtgc 1380

tgcttcggga gtacaagctc cgctcctaca cgctcaacgc tgtgagcttc cacttcctgg 1440

gtgagcagaa ggaggacgta cagcacagca tcatcactga cctacagaat gggaatgaac 1500

agacgcgtcg ccgcctggcc gtgtactgcc tgaaggatgc ctttctgcct cttcgcctac 1560

tcgagcgcct tatggtgctg gtgaacaatg tggagatggc gcgtgtcact ggtgtacccc 1620

ttgggtacct gctcagccga ggccagcagg tcaaggtcgt gtctcagctg ctgcgccagg 1680

ccatgcgcga ggggctgctg atgcctgtgg tgaagacgga gggaggtgag gactacacgg 1740

gagccactgt cattgagccc ctcaaagggt actatgatgt ccccattgcc accctggact 1800

tctcctctct gtacccatcc atcatgatgg cccacaatct gtgctacacc acattgctac 1860

ggcctggggc tgcccagaag ttgggcctta aaccagatga gttcatcaag acacccactg 1920

gggatgagtt tgtgaaggca tctgtgcgga agggcctcct gccccaaatc ctggagaatc 1980

tgctgagtgc ccggaagagg gccaaggctg agctggctca ggagacggac cccctgcggc 2040

gacaggtctt ggatggacgg cagctggcac taaaagtgag tcccaactct gtgtatggct 2100

tcactggtgc ccaggtgggc aagctgccgt gtttggagat ctcccagagt gtcactgggt 2160

tcgggcggca gatgattgag aaaaccaagc agctagtgga gaccaagtac actctggaaa 2220

atggctacga tgctaatgcc aaggtggtct acggtgacac tgactctgtg atgtgccgat 2280

ttggtgtctc ctctgtggct gaggcaatgt ctctggggcg ggaggctgca aactgggtat 2340

ccagtcactt cccatcaccc atccggctgg agttcgagaa ggtttacttt ccctacctgc 2400

tcatcagcaa gaagcgctat gccggcctac tcttctcctc ccgctctgat gcccatgaca 2460

gaatggactg caagggcctg gaggctgtgc gtagggacaa ctgtcccctg gtggccaacc 2520

ttgtcacatc ctctctgcgc agaatcctcg tggatcggga ccctgatggt gcagtagccc 2580

atgcaaagga tgtcatctcg gacctgctgt gcaaccgcat agacatctcc caactggtca 2640

tcaccaaaga gttgacccgc gcagcagcag actacgcggg caagcaggct catgtggagc 2700

tggctgagag gatgaggaag cgtgaccccg gcagtgcgcc caacttgggc gaccgagtac 2760

cctacgtgat cattggtgct gccaagggtg tggccgccta catgaagtcg gaggaccccc 2820

tgtttgtgct ggagcacagc ctgcccattg atactcagta ctacctggag cagcagctgg 2880

ccaagccgct attgcgcatc tttgagccca ttctgggtga gggccgcgcg gagtcagtgc 2940

tgctgcgcgg tgaccacaca cgctgcaaaa ccgtgctcac cagcaaggtg ggcggccttc 3000

tggccttcac caagcgccga aactcttgta ttggctgccg ctccgtaatc gaccatcaag 3060

gagccgtgtg taagttctgt cagccacggg agtctgagct ctatcagaag gaggtgtcac 3120

acctgaatgc cctggaggaa cgtttctcgc gcctctggac acagtgccag cgctgccagg 3180

gcagcttgca cgaggatgtc atctgtacca gccgcgactg tcccatcttc tacatgcgca 3240

agaaggtgcg caaggacctg gaggaccagg aacggctgct gcagcgcttt ggacctcctg 3300

gccctgaggc ctggtgacct gacaa 3325

<210>60

<211>1103

<212>PRT

<213>大鼠(Rattus norvegicus)

<400>60

Met Asp Gly Lys Arg Arg Gln Ala Pro Ser Ser Gly Val Pro Pro Lys

1 5 10 15

Arg Ala Cys Lys Gly Leu Trp Asp Glu Asp Glu Pro Ser Gln Phe Glu

20 25 30

Glu Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg Leu Gln

35 40 45

Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Ile Val Gly Gly

50 55 60

Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Leu Arg Pro Thr Pro

65 70 75 80

Leu Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln Leu Glu

85 90 95

Ile Asp His Tyr Val Gly Thr Ser Pro Pro Leu Pro Glu Gly Pro Pro

100 105 110

Ala Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val Thr Asp

115 120 125

Glu Gly Phe Ser Val Cys Cys His Ile His Gly Phe Ala Pro Tyr Phe

130 135 140

Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser Glu Leu

145 150 155 160

Gln Arg Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly Gly Lys

165 170 175

Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser Arg Glu

180 185 190

Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu Arg Ile

195 200 205

Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu Leu Glu

210 215 220

Gln Gly Ile Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala Pro Tyr

225 230 235 240

Glu Ala Ash Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala Asp Ile

245 250 255

Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val Arg Arg

260 265 270

Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val Leu Trp

275 280 285

Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg Ile Ala

290 295 300

Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly

305 310 315 320

Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys Ser Leu

325 330 335

Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala Leu Thr

340 345 350

Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser Tyr Glu

355 360 365

Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Thr Phe Ile Leu Ala Met

370 375 380

Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Asp Leu Pro

385 390 395 400

Tyr Leu Ile Ser Arg Ala Gln Thr Leu Lys Val Asp Arg Phe Pro Phe

405 410 415

Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser Ser Phe

420 425 430

Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Val Ser Met Val

435 440 445

Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu Tyr Lys

450 455 460

Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu Gly Glu

465 470 475 480

Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln Asn Gly

485 490 495

Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala

500 505 510

Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val Asn Asn

515 520 525

Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu Leu Ser

530 535 540

Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln Ala Met

545 550 555 560

Arg Glu Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Gly Glu Asp

565 570 575

Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr Asp Val

580 585 590

Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile Met Met

595 600 605

Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala Ala Gln

610 615 620

Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr Gly Asp

625 630 635 640

Glu Phe Val Lys Ala Ser Val Arg Lys Gly Leu Leu Pro Gln Ile Leu

645 650 655

Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu Ala Gln

660 665 670

Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln Leu Ala

675 680 685

Leu Lys Val Ser Pro Asn Ser Val Tyr Gly Phe Thr Gly Ala Gln Val

690 695 700

Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly Phe Gly

705 710 715 720

Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Thr Lys Tyr Thr

725 730 735

Leu Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly Asp Thr

740 745 750

Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu Ala Met

755 760 765

Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe Pro Ser

770 775 780

Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu Leu Ile

785 790 795 800

Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser Asp Ala

805 810 815

His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg Asp Asn

820 825 830

Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg Ile Leu

835 840 845

Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp Val Ile

850 855 860

Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val Ile Thr

865 870 875 880

Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln Ala His

885 890 895

Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser Ala Pro

900 905 910

Asn Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala Lys Gly

915 920 925

Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu Glu His

930 935 940

Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu Ala Lys

945 950 955 960

Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg Ala Glu

965 970 975

Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val Leu Thr

980 985 990

Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn Ser Cys

995 1000 1005

Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys Lys Phe

1010 1015 1020

Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val Ser His Leu

1025 1030 1035 1040

Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys Gln Arg

1045 1050 1055

Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg Asp Cys

1060 1065 1070

Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu Asp Gln

1075 1080 1085

Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala Trp

1090 1095 1100

<210>61

<211>3451

<212>DNA

<213>牛(Bos taurus)

<400>61

agtcaggggt cacggcggcg tgggctgtgg cgggaaacac tgtttgaagc gggatggatg 60

gtaagcggcg accaggcccg gggcctgggg tgcccccaaa gcgggcccgt gggggcctct 120

gggatgagga tgaggcatac cggccctcgc agttcgagga ggagctggcg ctgatggagg 180

agatggaagc agagcgcagg ctgcaggagc aggaggagga ggagctgcag tcggccctgg 240

aggcggcgga cgggcaattc tccccaacgg ccatagatgc ccgctggctt cggcccgccc 300

cgcccgcctt ggacccccag atggagcctc tcatcttcca gcagttggag atcgaccatt 360

acgtggcccc agcgcggccc ctgcctgggg cgcccccgcc atcccaggac tcagttccca 420

tcctccgcgc cttcggggtc accaacgagg gggtctccgt ctgctgccac atccatggct 480

ttgcacccta cttctacacc ccagcgcccc ctggttttgg acctgagcac ctgagcgagc 540

tgcagcggga gctgagtgca gccatcagcc gggaccagcg cgggggcaag gagctcaccg 600

ggccggccgt gctggcggta gagctgtgct cccgggagag catgttcggg taccatgggc 660

acggcccctc cccgtttctg cgtatcacct tggcactgcc ccgcctcatg gcacctgccc 720

gccgcctcct ggagcagggc atccgcctgg ccggcctcgg cacccccagc tttgcgccct 780

acgaggccaa cgttgacttt gagatccggt tcatggtgga cacggacatc gtgggctgca 840

actggctgga gctcccagcc gggaaataca tcctgaggcc ggaggggaag gccactctgt 900

gtcagctgga ggccgacgtg ctgtggtcag acgtgatcag ccacccgccg gaaggagagt 960

ggcagcgaat cgcccctctg cgcgtgctca gcttcgacat cgagtgcgct ggtcgcaaag 1020

gcatcttccc tgagcccgag cgggaccccg tgatccagat ctgctcactg ggcctgcgct 1080

ggggcgagcc ggagcccttc ctgcgcctgg cgctcaccct gcggccctgc gcccccatcc 1140

tgggcgccaa ggtgcagagc tatgagcggg aggaggacct gctccaggcc tggtcgacct 1200

tcatccgcat catggatccc gatgtgatca ccggctacaa tatccagagc tttgaccttc 1260

cctacctcat ctcccgggcc cagaccctca aggtgccagg cttccccttg ctgggccgtg 1320

tgattggcct ccgctccaac atccgggagt cgtccttcca gtccaggcag actggccggc 1380

gggacagcaa ggtggtcagc atggtgggcc gcgtgcagat ggacatgctg caggtgctgc 1440

tgcgggagta caagctccgg tcctacacgc tcaatgccgt gagcttccac ttcctgggcg 1500

agcagaagga ggacgtgcag cacagcatca tcacagacct gcagaacggt aacgaccaga 1560

cgcgccgccg cctggccgtg tactgcctca aggacgcctt cctacccctg cggctgctgg 1620

agcggctcat ggtgctggtg aacgccatgg agatggcgcg cgtcaccggc gtgcccctcg 1680

gctacctgct cagccgcggc cagcaggtca aggtcgtgtc ccagctgctg cgacaggcca 1740

tgcgccaggg gctgttgatg cccgtggtga agacggaggg tggtgaggac tataccgggg 1800

ccacggtcat cgagccgctg aaagggtact acgacgttcc catcgccacc ttggacttct 1860

cctcgctgta cccgtccatc atgatggccc acaacctgtg ctacaccaca ctcctgcggc 1920

ccggggccgc ccagaaactg ggcctgaccg aggatcagtt catcaagacg cccacggggg 1980

acgagtttgt gaaggcatcg gtgcggaagg ggctgctccc ccagatcctg gaaaacctgc 2040

tcagcgcccg gaagagggcc aaggccgagc tggccaagga gacagacccc ctacggcggc 2100

aagtgttgga cgggcgccag ctggcgctga aagtgagtgc taactctgtg tacggcttca 2160

ctggcgccca ggtgggcagg ctcccgtgcc tggaaatctc acagagtgtc accgggttcg 2220

ggcgccagat gattgagaag acaaagcagc ttgtggagac caagtacacg gtggaaaacg 2280

gctacagcac cagcgccaag gtggtgtatg gtgacacaga ctcggtcatg tgccgctttg 2340

gcgtctcatc cgtggctgag gcgatggctt tgggacggga ggctgcagac tgggtgtccg 2400

gccacttccc ctcgcccatc cggctagagt ttgagaaagt ctacttcccc tacctgctca 2460

tcagcaagaa gcgttacgca ggcctgctct tctcctcccg gccggacgcc cacgaccgca 2520

tggactgcaa gggcctggag gccgtgcgca gggacaactg ccccctggtg gccaacctcg 2580

tcaccgcctc gctgcgccgc ctgctcatcg accgagaccc ctcgggcgcc gtggctcatg 2640

cacaggacgt catctccgat ctgctgtgta atcgcattga catctcgcag ctggtcatta 2700

ccaaggagct gactcgcgct gccgccgatt acgcgggcaa gcaggcccac gtggagctgg 2760

ccgagaggat gaggaagcgg gaccccggga gcgcgcccag cctgggcgac cgcgtcccct 2820

acgtgatcat cagcgctgcc aagggcgtgg ccgcctacat gaagtccgag gaccccctgt 2880

tcgtactgga gcacagcctg cccatcgaca cgcagtacta cctggagcag cagctcgcca 2940

agccgctcct gcgcatcttc gagcccatcc tgggcgaggg ccgtgccgag gctgtgctgc 3000

tgcgcgggga ccacactcgc tgcaagacgg tgctcacggg gaaggtgggc ggcctcctgg 3060

ccttcgccaa acgccggaac tgctgcatcg gctgccgcac tgtcctcagc caccagggag 3120

ccgtgtgcaa gttctgccag ccccgggagt cagagctgta ccagaaggag gtgtcccacc 3180

tgagtgccct ggaggagcga ttctcacgcc tgtggacgca gtgccagcgc tgccagggca 3240

gcctgcacga ggacgtcatc tgcaccagcc gggactgtcc catcttctac atgcgcaaga 3300

aggtgcggaa ggacctggag gaccaggagc ggctgctgcg gcgctttgga ccccccggcc 3360

cagaggcttg gtgacctctg acctcaacga acttcccacc ttgggggcgc gggggggaca 3420

gacggggaat taataaagct caggcctttt g 3451

<210>62

<211>1106

<212>PRT

<213>牛(Bos taurus)

<400>62

Met Asp Gly Lys Arg Arg Pro Gly Pro Gly Pro Gly Val Pro Pro Lys

1 5 10 15

Arg Ala Arg Gly Gly Leu Trp Asp Glu Asp Glu Ala Tyr Arg Pro Ser

20 25 30

Gln Phe Glu Glu Glu Leu Ala Leu Met Glu Glu Met Glu Ala Glu Arg

35 40 45

Arg Leu Gln Glu Gln Glu Glu Glu Glu Leu Gln Ser Ala Leu Glu Ala

50 55 60

Ala Asp Gly Gln Phe Ser Pro Thr Ala Ile Asp Ala Arg Trp Leu Arg

65 70 75 80

Pro Ala Pro Pro Ala Leu Asp Pro Gln Met Glu Pro Leu Ile Phe Gln

85 90 95

Gln Leu Glu Ile Asp His Tyr Val Ala Pro Ala Arg Pro Leu Pro Gly

100 105 110

Ala Pro Pro Pro Ser Gln Asp Ser Val Pro Ile Leu Arg Ala Phe Gly

115 120 125

Val Thr Asn Glu Gly Val Ser Val Cys Cys His Ile His Gly Phe Ala

130 135 140

Pro Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Pro Glu His Leu

145 150 155 160

Ser Glu Leu Gln Arg Glu Leu Ser Ala Ala Ile Ser Arg Asp Gln Arg

165 170 175

Gly Gly Lys Glu Leu Thr Gly Pro Ala Val Leu Ala Val Glu Leu Cys

180 185 190

Ser Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe

195 200 205

Leu Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg

210 215 220

Leu Leu Glu Gln Gly Ile Arg Leu Ala Gly Leu Gly Thr Pro Ser Phe

225 230 235 240

Ala Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp

245 250 255

Thr Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr

260 265 270

Ile Leu Arg Pro Glu Gly Lys Ala Thr Leu Cys Gln Leu Glu Ala Asp

275 280 285

Val Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Glu Trp Gln

290 295 300

Arg Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly

305 310 315 320

Arg Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile

325 330 335

Cys Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu

340 345 350

Ala Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln

355 360 365

Ser Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ser Thr Phe Ile

370 375 380

Arg Ile Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe

385 390 395 400

Asp Leu Pro Tyr Leu Ile Ser Arg Ala Gln Thr Leu Lys Val Pro Gly

405 410 415

Phe Pro Leu Leu Gly Arg Val Ile Gly Leu Arg Ser Asn Ile Arg Glu

420 425 430

Ser Ser Phe Gln Ser Arg Gln Thr Gly Arg Arg Asp Ser Lys Val Val

435 440 445

Ser Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg

450 455 460

Glu Tyr Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe

465 470 475 480

Leu Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu

485 490 495

Gln Asn Gly Asn Asp Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu

500 505 510

Lys Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu

515 520 525

Val Asn Ala Met Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr

530 535 540

Leu Leu Ser Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg

545 550 555 560

Gln Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly

565 570 575

Gly Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr

580 585 590

Tyr Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser

595 600 605

Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly

610 615 620

Ala Ala Gln Lys Leu Gly Leu Thr Glu Asp Gln Phe Ile Lys Thr Pro

625 630 635 640

Thr Gly Asp Glu Phe Val Lys Ala Ser Val Arg Lys Gly Leu Leu Pro

645 650 655

Gln Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu

660 665 670

Leu Ala Lys Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg

675 680 685

Gln Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly

690 695 700

Ala Gln Val Gly Arg Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr

705 710 715 720

Gly Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Thr

725 730 735

Lys Tyr Thr Val Glu Asn Gly Tyr Ser Thr Ser Ala Lys Val Val Tyr

740 745 750

Gly Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala

755 760 765

Glu Ala Met Ala Leu Gly Arg Glu Ala Ala Asp Trp Val Ser Gly His

770 775 780

Phe Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr

785 790 795 800

Leu Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg

805 810 815

Pro Asp Ala His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val Arg

820 825 830

Arg Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ala Ser Leu Arg

835 840 845

Arg Leu Leu Ile Asp Arg Asp Pro Ser Gly Ala Val Ala His Ala Gln

850 855 860

Asp Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu

865 870 875 880

Val Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys

885 890 895

Gln Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly

900 905 910

Ser Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Ser Ala

915 920 925

Ala Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val

930 935 940

Leu Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln

945 950 955 960

Leu Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly

965 970 975

Arg Ala Glu Ala Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr

980 985 990

Val Leu Thr Gly Lys Val Gly Gly Leu Leu Ala Phe Ala Lys Arg Arg

995 1000 1005

Asn Cys Cys Ile Gly Cys Arg Thr Val Leu Ser His Gln Gly Ala Val

1010 1015 1020

Cys Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val

1025 1030 1035 1040

Ser His Leu Ser Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln

1045 1050 1055

Cys Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser

1060 1065 1070

Arg Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu

1075 1080 1085

Glu Asp Gln Glu Arg Leu Leu Arg Arg Phe Gly Pro Pro Gly Pro Glu

1090 1095 1100

Ala Trp

1105

<210>63

<211>3457

<212>DNA

<213>黑腹果蝇(Drosophila melanogaster)

<400>63

ctctaacgtg cctaccaaca aaagcgcgcc ttattttttg gcatcgctct tgtcttatgg 60

atttgcaagt aacatttcac caaggtaccc agaatggatg gcaagcgcaa gtttaatgga 120

acctccaatg gacatgccaa gaagcccagg aatcctgatg acgatgagga aatgggcttt 180

gaggcggagc tggccgcctt cgagaactcc gaggacatgg accagactct gctaatgggc 240

gatggacccg agaaccaaac gaccagtgag cgttggtccc gtccgccgcc cccagaacta 300

gatccctcca agcacaactt ggagtttcag cagctggacg tggaaaacta tttgggacag 360

ccgttgccgg gaatgccagg tgcccaaata ggacccgtgc cggtggtccg aatgtttggt 420

gtcaccatgg agggtaactc tgtgtgctgc catgtgcatg gtttctgtcc atacttctac 480

atagaggcgc ccagtcaatt cgaggagcac cattgcgaga aactacaaaa agccttggat 540

caaaaggtta ttgccgatat tcgcaacaac aaagataatg tccaggaggc tgtgcttatg 600

gtggaactgg tggagaagct gaacatccat ggatacaatg gagacaagaa gcagaggtac 660

atcaaaatat cggttacgct gcccagattt gtggctgcgg cctcacgtct cctcaaaaag 720

gaagtgatca tgtcggagat tgacttccag gactgtcgcg cctttgagaa taacatagac 780

tttgacattc gcttcatggt ggacactgat gtggtgggtt gcaattggat agagcttccc 840

atgggtcact ggcgaataag gaacagtcac agcaagccgt tgcctgaatc ccgctgccag 900

attgaagtag acgtggcctt cgacagattt atatcccacg agcccgaagg tgaatggtcc 960

aaggtggctc ccttccggat cctctccttt gatattgaat gcgctggtcg caaaggaata 1020

tttccggaag ccaaaataga tccagtcatc cagatagcca atatggtgat aaggcaggga 1080

gaacgagaac ctttcattag gaatgtcttt accctaaatg aatgcgctcc aatcataggc 1140

agccaggtgt tgtgccacga caaggagacc cagatgctgg acaagtggtc tgcctttgtc 1200

cgggaagttg acccggatat tttgaccgga tataatatca acaactttga cttcccctat 1260

ttgcttaacc gagcagctca cttgaaggtc aggaactttg agtatttggg caggattaag 1320

aacattcgtt cggtgatcaa ggaacagatg ttgcagtcga agcagatggg tcgcagggaa 1380

aaccagtacg ttaattttga gggtagagtt cccttcgatc tcctctttgt cctgctgcgc 1440

gactacaaac tacgctcgta cactctcaac gctgtgagct atcactttct gcaggagcaa 1500

aaggaggatg tgcatcatag cattatcaca gatcttcaga atggagacga gcagacacgt 1560

cgccgttcgg ccatgtactg cctaaaggat gcctacttac cgcttagatt gctggagaag 1620

ttaatggcca ttgttaacta catggagatg gccagggtga cgggtgtgcc actggagtcc 1680

ttgctcaccc gcggacaaca gataaaggtt ttaagtcaat tgctgcgcaa ggccaaaacc 1740

aagggattca tcatgccctc gtacacctct cagggatcgg atgaacagta tgaaggagcg 1800

actgtgattg aaccaaaacg tggctactat gcggacccca tctccacgct ggatttcgcc 1860

tctctgtatc caagtataat gatggcgcat aatttgtgct acaccacctt ggttttgggt 1920

ggaactcgtg agaagctgcg gcagcaggag aacctgcagg acgatcaagt ggaacgtacg 1980

cctgcaaaca actactttgt gaagtctgag gtgcgtcgtg gtctgctccc tgagattctg 2040

gaatctcttt tggcggccag aaagcgtgcc aaaaatgacc taaaagtgga aacagatccg 2100

tttaaaagaa aggtcctgga tggcagacag ctggcgctga agatttcggc taattccgtg 2160

tacggattta ctggcgcaca ggttggaaag ttgccatgct tagagatctc gggcagcgtc 2220

accgcctacg gtcgtaccat gatcgagatg acgaaaaacg aagtggaatc ccattacaca 2280

caggccaatg gctacgagaa caatgcagtg gtcatctacg gcgacactga ttctgtgatg 2340

gttaatttcg gagtaaaaac tctggagcgc agcatggagc tgggacgcga ggctgccgaa 2400

ctggtcagtt ccaagttcgt gcatcctatt aaattggaat tcgagaaagt ttactatcct 2460

tacctgctga ttaacaagaa acgctatgcg ggattatact ttacgcgccc agatacctac 2520

gataaaatgg attgcaaggg catagaaacc gtgaggagag ataactctcc gctggtggcc 2580

aacctgatga actcctgcct gcagaaacta ctcatcgaaa gggatcccga tggtgcagtt 2640

gcctatgtga aacaggtgat agccgatctc ctctgcaatc gcatcgacat ctcgcacttg 2700

gtcataacca aggagttggc caaaacggat tacgcagcca aacaggcaca cgttgagctg 2760

gccgccaaga tgaagaaaag agatcccggt acggcgccca aactggggga tcgagttccc 2820

tatgtgatct gtgcggcagc caaaaacaca cccgcttacc agaaggccga ggatccgctg 2880

tatgtgctgg aaaacagcgt gcccatcgat gccacttact acctggaaca gcagctgtct 2940

aagccgctgc taaggatctt tgaacctatt ttgggcgaca atgccgagtc aattttgtta 3000

aaaggagaac acacgcgcac acgaactgtg gtaacatcca aagtgggtgg acttgctgga 3060

tttatgacca agaaaacgtc gtgtttgggc tgcaaatccc tgatgcccaa gggctacgaa 3120

caggcctgtc tgtgtccaca ctgcgagcca cgaatgagtg agctgtatca gaaggaggtg 3180

ggtgcgaaga gggaactgga ggagaccttc tctcgcctgt ggaccgagtg ccagcgatgc 3240

caggaatcct tgcacgagga ggttatctgc tccaacagag attgccccat cttctacatg 3300

cgacagaagg ttcgcatgga tctggacaat caggagaagc gggtgttgcg attcggcctg 3360

gccgagtggt aaccattgca tgagtttact gaattgttta atcctataat ttaataatta 3420

tattactaga agttattaaa aaaaaaaaaa aaaaaaa 3457

<210>64

<211>1092

<212>PRT

<213>黑腹果蝇(Drosophila melanogaster)

<400>64

Met Asp Gly Lys Arg Lys Phe Asn Gly Thr Ser Asn Gly His Ala Lys

1 5 10 15

Lys Pro Arg Asn Pro Asp Asp Asp Glu Glu Met Gly Phe Glu Ala Glu

20 25 30

Leu Ala Ala Phe Glu Asn Ser Glu Asp Met Asp Gln Thr Leu Leu Met

35 40 45

Gly Asp Gly Pro Glu Asn Gln Thr Thr Ser Glu Arg Trp Ser Arg Pro

50 55 60

Pro Pro Pro Glu Leu Asp Pro Ser Lys His Asn Leu Glu Phe Gln Gln

65 70 75 80

Leu Asp Val Glu Asn Tyr Leu Gly Gln Pro Leu Pro Gly Met Pro Gly

85 90 95

Ala Gln Ile Gly Pro Val Pro Val Val Arg Met Phe Gly Val Thr Met

100 105 110

Glu Gly Asn Ser Val Cys Cys His Val His Gly Phe Cys Pro Tyr Phe

115 120 125

Tyr Ile Glu Ala Pro Ser Gln Phe Glu Glu His His Cys Glu Lys Leu

130 135 140

Gln Lys Ala Leu Asp Gln Lys Val Ile Ala Asp Ile Arg Asn Asn Lys

145 150 155 160

Asp Asn Val Gln Glu Ala Val Leu Met Val Glu Leu Val Glu Lys Leu

165 170 175

Asn Ile His Gly Tyr Asn Gly Asp Lys Lys Gln Arg Tyr Ile Lys Ile

180 185 190

Ser Val Thr Leu Pro Arg Phe Val Ala Ala Ala Ser Arg Leu Leu Lys

195 200 205

Lys Glu Val Ile Met Ser Glu Ile Asp Phe Gln Asp Cys Arg Ala Phe

210 215 220

Glu Asn Asn Ile Asp Phe Asp Ile Arg Phe Met Val Asp Thr Asp Val

225 230 235 240

Val Gly Cys Asn Trp Ile Glu Leu Pro Met Gly His Trp Arg Ile Arg

245 250 255

Asn Ser His Ser Lys Pro Leu Pro Glu Ser Arg Cys Gln Ile Glu Val

260 265 270

Asp Val Ala Phe Asp Arg Phe Ile Ser His Glu Pro Glu Gly Glu Trp

275 280 285

Ser Lys Val Ala Pro Phe Arg Ile Leu Ser Phe Asp Ile Glu Cys Ala

290 295 300

Gly Arg Lys Gly Ile Phe Pro Glu Ala Lys Ile Asp Pro Val Ile Gln

305 310 315 320

Ile Ala Asn Met Val Ile Arg Gln Gly Glu Arg Glu Pro Phe Ile Arg

325 330 335

Asn Val Phe Thr Leu Asn Glu Cys Ala Pro Ile Ile Gly Ser Gln Val

340 345 350

Leu Cys His Asp Lys Glu Thr Gln Met Leu Asp Lys Trp Ser Ala Phe

355 360 365

Val Arg Glu Val Asp Pro Asp Ile Leu Thr Gly Tyr Asn Ile Asn Asn

370 375 380

Phe Asp Phe Pro Tyr Leu Leu Asn Arg Ala Ala His Leu Lys Val Arg

385 390 395 400

Asn Phe Glu Tyr Leu Gly Arg Ile Lys Asn Ile Arg Ser Val Ile Lys

405 410 415

Glu Gln Met Leu Gln Ser Lys Gln Met Gly Arg Arg Glu Asn Gln Tyr

420 425 430

Val Asn Phe Glu Gly Arg Val Pro Phe Asp Leu Leu Phe Val Leu Leu

435 440 445

Arg Asp Tyr Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Tyr His

450 455 460

Phe Leu Gln Glu Gln Lys Glu Asp Val His His Ser Ile Ile Thr Asp

465 470 475 480

Leu Gln Asn Gly Asp Glu Gln Thr Arg Arg Arg Ser Ala Met Tyr Cys

485 490 495

Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Leu Glu Lys Leu Met Ala

500 505 5l0

Ile Val Asn Tyr Met Glu Met Ala Arg Val Thr Gly Val Pro Leu Glu

515 520 525

Ser Leu Leu Thr Arg Gly Gln Gln Ile Lys Val Leu Ser Gln Leu Leu

530 535 540

Arg Lys Ala Lys Thr Lys Gly Phe Ile Met Pro Ser Tyr Thr Ser Gln

545 550 555 560

Gly Ser Asp Glu Gln Tyr Glu Gly Ala Thr Val Ile Glu Pro Lys Arg

565 570 575

Gly Tyr Tyr Ala Asp Pro Ile Ser Thr Leu Asp Phe Ala Ser Leu Tyr

580 585 590

Pro Ser Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Val Leu

595 600 605

Gly Gly Thr Arg Glu Lys Leu Arg Gln Gln Glu Asn Leu Gln Asp Asp

610 615 620

Gln Val Glu Arg Thr Pro Ala Asn Asn Tyr Phe Val Lys Ser Glu Val

625 630 635 640

Arg Arg Gly Leu Leu Pro Glu Ile Leu Glu Ser Leu Leu Ala Ala Arg

645 650 655

Lys Arg Ala Lys Asn Asp Leu Lys Val Glu Thr Asp Pro Phe Lys Arg

660 665 670

Lys Val Leu Asp Gly Arg Gln Leu Ala Leu Lys Ile Ser Ala Asn Ser

675 680 685

Val Tyr Gly Phe Thr Gly Ala Gln Val Gly Lys Leu Pro Cys Leu Glu

690 695 700

Ile Ser Gly Ser Val Thr Ala Tyr Gly Arg Thr Met Ile Glu Met Thr

705 710 715 720

Lys Asn Glu Val Glu Ser His Tyr Thr Gln Ala Asn Gly Tyr Glu Asn

725 730 735

Asn Ala Val Val Ile Tyr Gly Asp Thr Asp Ser Val Met Val Asn Phe

740 745 750

Gly Val Lys Thr Leu Glu Arg Ser Met Glu Leu Gly Arg Glu Ala Ala

755 760 765

Glu Leu Val Ser Ser Lys Phe Val His Pro Ile Lys Leu Glu Phe Glu

770 775 780

Lys Val Tyr Tyr Pro Tyr Leu Leu Ile Asn Lys Lys Arg Tyr Ala Gly

785 790 795 800

Leu Tyr Phe Thr Arg Pro Asp Thr Tyr Asp Lys Met Asp Cys Lys Gly

805 810 815

Ile Glu Thr Val Arg Arg Asp Asn Ser Pro Leu Val Ala Asn Leu Met

820 825 830

Asn Ser Cys Leu Gln Lys Leu Leu Ile Glu Arg Asp Pro Asp Gly Ala

835 840 845

Val Ala Tyr Val Lys Gln Val Ile Ala Asp Leu Leu Cys Asn Arg Ile

850 855 860

Asp Ile Ser His Leu Val Ile Thr Lys Glu Leu Ala Lys Thr Asp Tyr

865 870 875 880

Ala Ala Lys Gln Ala His Val Glu Leu Ala Ala Lys Met Lys Lys Arg

885 890 895

Asp Pro Gly Thr Ala Pro Lys Leu Gly Asp Arg Val Pro Tyr Val Ile

900 905 910

Cys Ala Ala Ala Lys Asn Thr Pro Ala Tyr Gln Lys Ala Glu Asp Pro

915 920 925

Leu Tyr Val Leu Glu Asn Ser Val Pro Ile Asp Ala Thr Tyr Tyr Leu

930 935 940

Glu Gln Gln Leu Ser Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu

945 950 955 960

Gly Asp Asn Ala Glu Ser Ile Leu Leu Lys Gly Glu His Thr Arg Thr

965 970 975

Arg Thr Val Val Thr Ser Lys Val Gly Gly Leu Ala Gly Phe Met Thr

980 985 990

Lys Lys Thr Ser Cys Leu Gly Cys Lys Ser Leu Met Pro Lys Gly Tyr

995 1000 1005

Glu Gln Ala Cys Leu Cys Pro His Cys Glu Pro Arg Met Ser Glu Leu

1010 1015 1020

Tyr Gln Lys Glu Val Gly Ala Lys Arg Glu Leu Glu Glu Thr Phe Ser

1025 1030 1035 1040

Arg Leu Trp Thr Glu Cys Gln Arg Cys Gln Glu Ser Leu His Glu Glu

1045 1050 1055

Val Ile Cys Ser Asn Arg Asp Cys Pro Ile Phe Tyr Met Arg Gln Lys

1060 1065 1070

Val Arg Met Asp Leu Asp Asn Gln Glu Lys Arg Val Leu Arg Phe Gly

1075 1080 1085

Leu Ala Glu Trp

1090

<210>65

<211>9064

<212>DNA

<213>黑腹果蝇(Drosophila melanogaster)

<400>65

ctgcagcttg ggaaaatact tttggacacc ccaaaaaaag ttaagcgcga tattttccca 60

ccgtgaccat gacaaccact gtgcgttcga aaggctctct ctctctctct ctctttcgcg 120

caaatcaaaa acacaaacag gtttatgtgt gcggagagtg tgtgcgacag agagcggcga 180

tatggaactg aaacgactgc aatgttttta tattccggca acgcatttcg cataaattac 240

aaattacaca gcataagtga atgcaagtgc aggggcggca gtcaaatggc cagctgcacc 300

cagaaaaagg gcaataagat tcgggataac aaaacttgat ggcgttcccg attttcccgg 360

acaagggagc gtatatgtat gtacacacaa aaaaaaaact taaccagcct tgcataacga 420

aacacgtgca ataaaaatat gactgattgt caacctctgc tgcaacttaa ttgctgccgc 480

agaggtaaaa ctgaaaaaca taaaaggggg gcgacaagtg cagcaagcga aaaaataaag 540

aactcaaaga gcgcatgcgc gccgctctcc cactctctct ccctctctct ctgtcgctcc 600

actgcgctgg aatcttacaa ctcgtgtagg tgagccggat ttttatgatg atgcgcctgt 660

gtgcgtgact gcatgatgcc attgcagcgg agaactagta gaaaaaagtt cacatttcag 720

cagttggaaa acacatggcc aacaggccaa ctcaagtggc cagcagctgt ccttatattg 780

tcagcaaata ggtcatttaa tgcccattac acgaaaatta tagctaaaat ggtcaagctg 840

tgatgaaata aacataaata ttatatttta tgatttcatc agatttttag catttttttt 900

tttaatttgt gttaggtaga actacaaagc taagaataat tgaggatttc taggtaaaac 960

ttatattctt aaaaccattt aataattttc ttgttttctt ttatttgtag taacatttta 1020

aaattggcgc caaacgtgtt actttacagt gctgtgcaac agccaaatgt cagcattctc 1080

tgcaacgcgt tagcacattt ctgagacgtt tgcagatttt tggcggcaac aagttattta 1140

catttattta ttttatttct gctaaacagc acggaaatgt ccgactccgg caaaggcaaa 1200

gtgctgcaaa atacgggtaa attcgtcagc gagaatcgca cagaaggcgt gagtggtcaa 1260

agttcgtgga tttcacgctg aacaagggat ttttcaatct tatccacagg acgacttctt 1320

caatgaggcg ggctatcgtc aatcccggga gaacgataaa atcgattcga aatatggctt 1380

cgatcgggtt aaggacagcc aggagcggac gggctacctc atcaacatgc attcggtaag 1440

ttaggaagcc cataaaacgt tgaaaatcat atccaataat ggctatgcca attgcagaac 1500

gaagttttgg atgaggacag aagattgatt gctgccttgg acctgttctt catccaaatg 1560

gatggttccc gcttcaaatg cacggtggcc tatcagccat atttactcat ccgaccagag 1620

gataatatgc atctggaagt ggcgcgattt ctgggtcgca agtattccgg ccagatttct 1680

ggactggagc acataaccaa agaagatttg gatctgccca atcatctatc cggtttgcag 1740

cagcagtaca taaaactttc gtttctcaat cagacagcca tgaccaaggt tagaagggaa 1800

ctcatgtccg cggtgaagag aaatcaggag cgacagaaat ccaacacata ctacatgcaa 1860

atgctggcca cctcgctggc ccaatcctcc gcaggttccg aggatgccac attgggtaag 1920

aggcagcagg attacatgga ttgtattgtg gacataaggg agcatgatgt gccttaccac 1980

gtcagagtgt ccatcgattt gcgcatcttt tgtggacagt ggtacaatat caggtgcaga 2040

agtggcgtgg aattgcctac gatcacctgc cgaccggata ttctggacag acccgaaccc 2100

gtggtcctgg cctttgatat agaaaccact aagctgcccc ttaagtttcc cgatgcccag 2160

acggatcagg ttatgatgat ctcgtacatg atcgatggtc agggttatct gataaccaat 2220

cgtgagatta tatcatccaa tgtggacgat tttgagtaca ctcccaagcc ggaattcgag 2280

ggtaacttta tagtattcaa cgaagagaac gagatgcagc tgctccagcg cttcttcgat 2340

cacatcatgg aggtgcgtcc ccacatcatt gttacataca acggcgactt cttcgattgg 2400

cccttcgtgg agacgcgtgc tgcagtgtac gatctggaca tgaagcaaga gattggcttc 2460

tccaagctac gggatggcaa ttatctaagt cgccctgcca tacacatgga ttgcctatgt 2520

tgggtgaaac gagattctta tttacctgtt ggatctcaag gcttaaaggc ggtggccaag 2580

gctaaattac gctatgatcc tgtggaactc gatccggagg atatgtgccg catggccgtg 2640

gaacagcccc aagtgctggc caattactct gtatccgatg cggtggccac atactatctg 2700

tacatgaagt atgtgcatcc atttatcttc gccctaaata cgattattcc catggaaccc 2760

gatgagatcc taagaaaggg ttccggcaca ctctgtgaaa cgttgctgat ggtggaggct 2820

taccatgccc agattgtgta tcccaacaag catcagagtg agctgaataa gctctccaac 2880

gagggacacg tactggattc ggaaacctat gtgggtggtc atgtggaggc tttggaatcg 2940

ggtgttttcc gggcggacat accatgccgt tttcgtctag atcctgctat ggtcaagcaa 3000

ctgcaggagc aggttgatgc agttctgcgc cacgctatcg aagtggagga aggcataccg 3060

ctcgagaagg tcttgaatct ggatgaagtg cggcaggaga ttgtgcaggg gctacagggt 3120

ctgcacgata tacccaatcg cttggagcag ccggtcatct atcacttgga tgtgggtgcc 3180

atgtacccca acattatttt gaccaatcgc ctgcagccct cggcaatggt tagtgactta 3240

gattgtgccg cctgtgactt caacaagcca ggagttcggt gcaaacgttc catggactgg 3300

ttgtggcgcg gcgagatgtt gcccgcctcc aggaacgagt ttcagcgcat tcagcagcag 3360

ctggagaccg agaagtttcc accccttttc cctggcggac cacagcgagc ctttcacgag 3420

ctctccaagg aggatcaggc ggcgtacgag aagaaacgtc tgacggatta ctgccgcaag 3480

gcttacaaga agaccaagct aaccaaattg gaaacgcgca cttcgaccat ctgccagaag 3540

gagaacagct tctatgtgga cacggtgcga gcttttcgcg atcgtcgcta cgagtacaaa 3600

ggactaacca aagtggcaaa agcatcggtg aatgctgcgg tggcttcggg agacgcggca 3660

gagatcaagg cagccaaggg cagggaggtg ctctacgatt ccctgcagtt ggcccacaag 3720

tgcatcctga actccttcta tggctacgtg atgaggagag gagcccgttg gcattccatg 3780

cctatggccg gcattgtgtg cctcacgggc tcgaatatta tcaccaaggc gagggaaatt 3840

atcgagcgag ttggtcgacc actcgaattg gacactgatg gtatatggtg catattgcct 3900

ggctcctttc cgcaggagtt taccattcac acgagtcatg agaagaaaaa gaagattaac 3960

atatcatatc cgaatgcagt gctaaacact atggttaaag atcattttac caacgatcag 4020

taccacgagt tgaggaagga taaggaaaac aatctaccca aatacgatat tcgagatgag 4080

aactctatat tcttcgaggt ggatggaccc taccttgcca tggtgttacc cgctgccaaa 4140

gaggagggca agaagctgaa gaaaagatat gcggtcttta atttcgatgg cacactggct 4200

gaactcaagg gattcgaggt gaagcgacgc ggtgaactgc agctgatcaa aaatttccag 4260

agttccgtct tcgaagcttt cctcgctggt agcacacttg aggaatgcta tgcatctgtg 4320

gccaaggtgg cggattactg gcttgatgta ctctacagca gaggatcaaa tctacccgac 4380

tcggagctat tcgaacttat ttcggagaac aagagcatgt ccaagaagct tgaggagtat 4440

ggcgcccaaa agagtacgtc catctccacg gccaagcgat tggctgagtt cctgggcgag 4500

cagatggtaa aggatgcggg tctggcttgt aagtacatta tttcgaagaa acccgaagga 4560

gcacccgtca ccgagagagc tattcccttg gccattttcc aatccgaacc gagcgtgagg 4620

cgacatcacc tgcgtcgctg gcttaaggac aacaccatgg gcgatgcgga tatacgcgat 4680

gtgctcgatt ggaactacta catagagaga ttgggtggga ccattcagaa gatcataacc 4740

ataccggcgg cactgcaggg actggccaat ccagtgccca gagttcagca tccggattgg 4800

ttgcacaaga aaatgctgga gaagaacgat gtgctcaagc agcgtcgcat caatgagatg 4860

ttcaccagca gacccaaacc gaaacctcta gccacagagg aggacaagct ggccgatatg 4920

gaagatttgg ctggtaaaga tggcggtgag ggtgctgcag gctgtccgat agtcaccaag 4980

agaaagagaa tccagctgga ggagcacgat gaggaggagg cacagccgca ggccaccact 5040

tggcgtcagg ccttgggcgc tccaccgccc atcggtgaaa ccagaaagac catcgttgag 5100

tgggtgagat ttcagaagaa gaaatggaaa tggcagcagg atcagcgcca gcgtaatcgc 5160

caggcgagca agcgaactcg aggcgaggat ccacgctaca ctgggcggtt ccttagacgt 5220

gcacaacgca ccctgttgga ccagccgtgg cagatcgtac agttggtgcc cgtcgacgac 5280

ctgggccact tcactgtgtg ggccttaatc ggcgaagagt tgcacaagat caagttgacg 5340

gtaccgagga ttttctatgt taatcagcga agtgctgctc ctccagagga gggtcaactt 5400

tggcgcaagg tcaatcgagt tctgccacga tccagacctg ttttcaatct ctatcgatat 5460

agtgtgcccg aacagctctt ccgggataac tcgctgggca tgctggcgga tctggcgacg 5520

cccgacattg agggcatata cgagacgcag atgacgttgg aatttcgcgc cctcatggac 5580

atgggctgca tttgcggtgt ccagcgcgag gaggcacgtc gcttggccca attggccacc 5640

aaggatctgg aaacatttag catcgagcag ctggaacagg gccccagact caggtcaaat 5700

atttggctag cgccaacaat cgattgcgca aaatctactt gtatcagcat aacacaccga 5760

cggccaagaa ggagatctgt gtcactgatc ccaatgccta gcaagaaggc atttgttttt 5820

gccttggaca cagtgcgtgc caatcaaatg ccgaacatga ggcaattgta taccgccgag 5880

cgtttggccc tgctcaagaa tctgacggca gaggagcaag ataaaattcc tgtagaggat 5940

tacacatttg aggttctcat tgaggtggat gtcaaacaaa tttaccggca catacagcgg 6000

gcactgacca cctacaaaca ggagcatcag ggaccaccca ccattctgtg ccttcaaacg 6060

gcgctgtcgg cgcgtaaact cagcctggcc atgccgatcc tgctggagtt tccccaggct 6120

cagattcata tctccgatga cgctagtttg ctttctggcc ttgattggca gcgacagggc 6180

tccagggcag tgatacgcca ctttctgaat ctgaacaatg ttcttgattt gatgttggat 6240

cagtgtcgct actttcatgt gcccattggc aatatgccgc cggatactgt gcttttcgga 6300

gcggatcttt tcttcgctcg cttgctgcag cggcataact ttgtgctgtg gtggtcggcg 6360

agtaccagac cagatttggg tggccgggag gcggacgaca gccggctgtt ggcggaattc 6420

gaggagagca ttagtgtggt gcaaaacaag gccggtttct atccggatgt ttgcgtggag 6480

ctggctctgg atagcctggc ggtgagtgcc ctgctccaat cgactaggat tcaggaaatg 6540

gaaggcgcct catctgccat tacgttcgat gtgatgccgc aggtctcgct ggaggagatg 6600

attggcactg ttccggcggc caccttgccg agttatgatg aaacggccct ctgttccgcc 6660

gccttccgcg ttatgcgctc catggtgaat ggttggttgc gagaggtatc catcaatagg 6720

aacatcttct cggacttcca gatcgtgcac ttctatcgat gggtgcgctc cagtaatgca 6780

ctactctatg atcctgcttt gagaagatct ctgaataatc tgatgaggaa gatgttcttg 6840

cgcattatag cagagttcaa gagattgggc gccaccatta tctatgcgga ctttaacagg 6900

attatcctta gttcgggtaa gaaaaccgtt tccgatgccc tgggctatgt ggactacatt 6960

gtgcaaagct tgaggaacaa ggagatgttc cactccatcc aactgagctt cgagcaatgc 7020

tggaacttta tgctctggat ggaccaggca aatttctcgg gaattagggg aaagctacca 7080

aagggaatcg atgagacagt gtcgtcaata gtttccacta ccatgatacg ggattctgaa 7140

cgcaatcaag atgacgacga ggatgaagaa gaggattcgg aaaaccgtga tccagtggag 7200

agcaacgagg ccgagcagga tcaagaggat gagctgtccc tggagctcaa ctggacaatt 7260

ggcgaacatc tgcccgatga aaacgagtgc cgcgaaaagt ttgaatccct gctgaccctc 7320

tttatgcaat ctttggccga aaagaagacc accgagcagg ccatcaagga tatctcgcac 7380

tgcgcgttcg actttatcct gaaactgcac aaaaactacg gcaagggcaa gcccagcccg 7440

ggcctagaac ttatccgcac tctgatcaag gcgttgagtg tggacaaaac gctggcggag 7500

cagatcaacg agttgcgccg aaatatgctg cgtctggtgg ggattggtga gttctcggac 7560

ttggctgagt gggaggatcc ctgcgacagt cacatcatca acgaggtcat ctgcaaagcg 7620

tgtaatcact gcagggacct ggatctctgc aaggacaagc atcgcgccat gaaagatgga 7680

gtgtgagtta cacaaatcag tacacataat ttaccacaaa taattgatta atgttggatt 7740

tttcagaccc gtttggctgt gtgcccagtg ctatgtggcc tatgataacg aggagatcga 7800

aatgagaatg ctggatgcac tgcagcgcaa gatgatgtcc tatgtgctgc aggatttgcg 7860

ctgttcgcgc tgcagcgaga tcaagcgcga gaatctggca gagttctgca cttgcgctgg 7920

caactttgtg cccctcatca gcgggaagga catccagaca ctgctgggca cattcaacaa 7980

ggtggctgcc aaccacaaga tgcagttgct ccagcagact gttcatcagg cgctgaccac 8040

gccacgctag gacctagttt gttgttgttt tctagatcgt agggcttaaa tatattgtat 8100

ttataatgga atttaattcg attttaatga gttttgagtt tatgatgtcg cacaagacga 8160

atgtctgtgt taaggaatgg acgcgcttta taattcaatg agattcacac acttttagtg 8220

gctttcgcat acgaatcgct tgttgttttc ccgattttat tggttttttt tgttgacttg 8280

cccgcggttt ttgggggcgc acaggcgaaa tcagcagctg aacttaaagc aattagacta 8340

actcattcgc gaagagcgat ctctactgtg gggcctgggt gatgggatcg accttaacat 8400

cggggaactg gaattcgggg aacttcagca tgtcggtctt gccatcgctg ccaaactgct 8460

tggccacacg gtccagttcg gtcttcagct cccgctcaat atcgggattg gagtccacca 8520

gcttgccacc gctgcaggtg agcaaaacaa ggattatgtc gaggcacacc aacggatgaa 8580

ggagccagaa cttacgcgct cttctgcttg tactcgcgca ctttgtccag aaacagctgc 8640

tggatgggat cggaggcctt gttcagggca ggggcaacga ttccgaagtt acgacgggcc 8700

tctgtgcgca ggacacgcat gccactcagc agggattgcg acagcatctg gaattgatag 8760

atccatgtta gaatagcaat aaacggcctt cttcatatgt aaccttaaaa aggttatgta 8820

atacaattgt ttgtttcgac gtttcccaat cggttttcaa gccgactttg ctagcaacta 8880

tatcttgtat tcaaattgta ttccctcaat cgatttttat gtattttaaa tcttgttttc 8940

accttatttt cctttgcaaa tgctaacttt cgtgcggaaa agtgacaatt gtcagttcac 9000

aatggcagtt ggtgttagtg atgtgcgcgt gatgggtgta tgcgatacta tcgtatgtaa 9060

gctt 9064

<210>66

<211>2220

<212>PRT

<213>黑腹果蝇(Drosophila melanogaster)

<400>66

Met Ser Asp Ser Gly Lys Gly Lys Val Leu Gln Asn Thr Gly Lys Phe

1 5 10 15

Val Ser Glu Asn Arg Thr Glu Gly Asp Asp Phe Phe Asn Glu Ala Gly

20 25 30

Tyr Arg Gln Ser Arg Glu Asn Asp Lys Ile Asp Ser Lys Tyr Gly Phe

35 40 45

Asp Arg Val Lys Asp Ser Gln Glu Arg Thr Gly Tyr Leu Ile Asn Met

50 55 60

His Ser Asn Glu Val Leu Asp Glu Asp Arg Arg Leu Ile Ala Ala Leu

65 70 75 80

Asp Leu Phe Phe Ile Gln Met Asp Gly Ser Arg Phe Lys Cys Thr Val

85 90 95

Ala Tyr Gln Pro Tyr Leu Leu Ile Arg Pro Glu Asp Asn Met His Leu

100 105 110

Glu Val Ala Arg Phe Leu Gly Arg Lys Tyr Ser Gly Gln Ile Ser Gly

115 120 125

Leu Glu His Ile Thr Lys Glu Asp Leu Asp Leu Pro Asn His Leu Ser

130 135 140

Gly Leu Gln Gln Gln Tyr Ile Lys Leu Ser Phe Leu Asn Gln Thr Ala

145 150 155 160

Met Thr Lys Val Arg Arg Glu Leu Met Ser Ala Val Lys Arg Asn Gln

165 170 175

Glu Arg Gln Lys Ser Asn Thr Tyr Tyr Met Gln Met Leu Ala Thr Ser

180 185 190

Leu Ala Gln Ser Ser Ala Gly Ser Glu Asp Ala Thr Leu Gly Lys Arg

195 200 205

Gln Gln Asp Tyr Met Asp Cys Ile Val Asp Ile Arg Glu His Asp Val

210 215 220

Pro Tyr His Val Arg Val Ser Ile Asp Leu Arg Ile Phe Cys Gly Gln

225 230 235 240

Trp Tyr Asn Ile Arg Cys Arg Ser Gly Val Glu Leu Pro Thr Ile Thr

245 250 255

Cys Arg Pro Asp Ile Leu Asp Arg Pro Glu Pro Val Val Leu Ala Phe

260 265 270

Asp Ile Glu Thr Thr Lys Leu Pro Leu Lys Phe Pro Asp Ala Gln Thr

275 280 285

Asp Gln Val Met Met Ile Ser Tyr Met Ile Asp Gly Gln Gly Tyr Leu

290 295 300

Ile Thr Asn Arg Glu Ile Ile Ser Ser Asn Val Asp Asp Phe Glu Tyr

305 310 315 320

Thr Pro Lys Pro Glu Phe Glu Gly Asn Phe Ile Val Phe Asn Glu Glu

325 330 335

Asn Glu Met Gln Leu Leu Gln Arg Phe Phe Asp His Ile Met Glu Val

340 345 350

Arg Pro His Ile Ile Val Thr Tyr Asn Gly Asp Phe Phe Asp Trp Pro

355 360 365

Phe Val Glu Thr Arg Ala Ala Val Tyr Asp Leu Asp Met Lys Gln Glu

370 375 380

Ile Gly Phe Ser Lys Leu Arg Asp Gly Asn Tyr Leu Ser Arg Pro Ala

385 390 395 400

Ile His Met Asp Cys Leu Cys Trp Val Lys Arg Asp Ser Tyr Leu Pro

405 410 415

Val Gly Ser Gln Gly Leu Lys Ala Val Ala Lys Ala Lys Leu Arg Tyr

420 425 430

Asp Pro Val Glu Leu Asp Pro Glu Asp Met Cys Arg Met Ala Val Glu

435 440 445

Gln Pro Gln Val Leu Ala Asn Tyr Ser Val Ser Asp Ala Val Ala Thr

450 455 460

Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ala Leu Asn

465 470 475 480

Thr Ile Ile Pro Met Glu Pro Asp Glu Ile Leu Arg Lys Gly Ser Gly

485 490 495

Thr Leu Cys Glu Thr Leu Leu Met Val Glu Ala Tyr His Ala Gln Ile

500 505 510

Val Tyr Pro Asn Lys His Gln Ser Glu Leu Asn Lys Leu Ser Asn Glu

515 520 525

Gly His Val Leu Asp Ser Glu Thr Tyr Val Gly Gly His Val Glu Ala

530 535 540

Leu Glu Ser Gly Val Phe Arg Ala Asp Ile Pro Cys Arg Phe Arg Leu

545 550 555 560

Asp Pro Ala Met Val Lys Gln Leu Gln Glu Gln Val Asp Ala Val Leu

565 570 575

Arg His Ala Ile Glu Val Glu Glu Gly Ile Pro Leu Glu Lys Val Leu

580 585 590

Asn Leu Asp Glu Val Arg Gln Glu Ile Val Gln Gly Leu Gln Gly Leu

595 600 605

His Asp Ile Pro Asn Arg Leu Glu Gln Pro Val Ile Tyr His Leu Asp

610 615 620

Val Gly Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu Gln Pro

625 630 635 640

Ser Ala Met Val Ser Asp Leu Asp Cys Ala Ala Cys Asp Phe Asn Lys

645 650 655

Pro Gly Val Arg Cys Lys Arg Ser Met Asp Trp Leu Trp Arg Gly Glu

660 665 670

Met Leu Pro Ala Ser Arg Asn Glu Phe Gln Arg Ile Gln Gln Gln Leu

675 680 685

Glu Thr Glu Lys Phe Pro Pro Leu Phe Pro Gly Gly Pro Gln Arg Ala

690 695 700

Phe His Glu Leu Ser Lys Glu Asp Gln Ala Ala Tyr Glu Lys Lys Arg

705 710 715 720

Leu Thr Asp Tyr Cys Arg Lys Ala Tyr Lys Lys Thr Lys Leu Thr Lys

725 730 735

Leu Glu Thr Arg Thr Ser Thr Ile Cys Gln Lys Glu Asn Ser Phe Tyr

740 745 750

Val Asp Thr Val Arg Ala Phe Arg Asp Arg Arg Tyr Glu Tyr Lys Gly

755 760 765

Leu Thr Lys Val Ala Lys Ala Ser Val Asn Ala Ala Val Ala Ser Gly

770 775 780

Asp Ala Ala Glu Ile Lys Ala Ala Lys Gly Arg Glu Val Leu Tyr Asp

785 790 795 800

Ser Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr Gly Tyr

805 810 815

Val Met Arg Arg Gly Ala Arg Trp His Ser Met Pro Met Ala Gly Ile

820 825 830

Val Cys Leu Thr Gly Ser Asn Ile Ile Thr Lys Ala Arg Glu Ile Ile

835 840 845

Glu Arg Val Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile Trp Cys

850 855 860

Ile Leu Pro Gly Ser Phe Pro Gln Glu Phe Thr Ile His Thr Ser His

865 870 875 880

Glu Lys Lys Lys Lys Ile Asn Ile Ser Tyr Pro Asn Ala Val Leu Asn

885 890 895

Thr Met Val Lys Asp His Phe Thr Asn Asp Gln Tyr His Glu Leu Arg

900 905 910

Lys Asp Lys Glu Asn Asn Leu Pro Lys Tyr Asp Ile Arg Asp Glu Asn

915 920 925

Ser Ile Phe Phe Glu Val Asp Gly Pro Tyr Leu Ala Met Val Leu Pro

930 935 940

Ala Ala Lys Glu Glu Gly Lys Lys Leu Lys Lys Arg Tyr Ala Val Phe

945 950 955 960

Asn Phe Asp Gly Thr Leu Ala Glu Leu Lys Gly Phe Glu Val Lys Arg

965 970 975

Arg Gly Glu Leu Gln Leu Ile Lys Asn Phe Gln Ser Ser Val Phe Glu

980 985 990

Ala Phe Leu Ala Gly Ser Thr Leu Glu Glu Cys Tyr Ala Ser Val Ala

995 1000 1005

Lys Val Ala Asp Tyr Trp Leu Asp Val Leu Tyr Ser Arg Gly Ser Asn

1010 1015 1020

Leu Pro Asp Ser Glu Leu Phe Glu Leu Ile Ser Glu Asn Lys Ser Met

1025 1030 1035 1040

Ser Lys Lys Leu Glu Glu Tyr Gly Ala Gln Lys Ser Thr Ser Ile Ser

1045 1050 1055

Thr Ala Lys Arg Leu Ala Glu Phe Leu Gly Glu Gln Met Val Lys Asp

1060 1065 1070

Ala Gly Leu Ala Cys Lys Tyr Ile Ile Ser Lys Lys Pro Glu Gly Ala

1075 1080 1085

Pro Val Thr Glu Arg Ala Ile Pro Leu Ala Ile Phe Gln Ser Glu Pro

1090 1095 1100

Ser Val Arg Arg His His Leu Arg Arg Trp Leu Lys Asp Asn Thr Met

1105 1110 1115 1120

Gly Asp Ala Asp Ile Arg Asp Val Leu Asp Trp Asn Tyr Tyr Ile Glu

1125 1130 1135

Arg Leu Gly Gly Thr Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu

1140 1145 1150

Gln Gly Leu Ala Asn Pro Val Pro Arg Val Gln His Pro Asp Trp Leu

1155 1160 1165

His Lys Lys Met Leu Glu Lys Asn Asp Val Leu Lys Gln Arg Arg Ile

1170 1175 1180

Asn Glu Met Phe Thr Ser Arg Pro Lys Pro Lys Pro Leu Ala Thr Glu

1185 1190 1195 1200

Glu Asp Lys Leu Ala Asp Met Glu Asp Leu Ala Gly Lys Asp Gly Gly

1205 1210 1215

Glu Gly Ala Ala Gly Cys Pro Ile Val Thr Lys Arg Lys Arg Ile Gln

1220 1225 1230

Leu Glu Glu His Asp Glu Glu Glu Ala Gln Pro Gln Ala Thr Thr Trp

1235 1240 1245

Arg Gln Ala Leu Gly Ala Pro Pro Pro Ile Gly Glu Thr Arg Lys Thr

1250 1255 1260

Ile Val Glu Trp Val Arg Phe Gln Lys Lys Lys Trp Lys Trp Gln Gln

1265 1270 1275 1280

Asp Gln Arg Gln Arg Asn Arg Gln Ala Ser Lys Arg Thr Arg Gly Glu

1285 1290 1295

Asp Pro Arg Tyr Thr Gly Arg Phe Leu Arg Arg Ala Gln Arg Thr Leu

1300 1305 1310

Leu Asp Gln Pro Trp Gln Ile Val Gln Leu Val Pro Val Asp Asp Leu

1315 1320 1325

Gly His Phe Thr Val Trp Ala Leu Ile Gly Glu Glu Leu His Lys Ile

1330 1335 1340

Lys Leu Thr Val Pro Arg Ile Phe Tyr Val Asn Gln Arg Ser Ala Ala

1345 1350 1355 1360

Pro Pro Glu Glu Gly Gln Leu Trp Arg Lys Val Asn Arg Val Leu Pro

1365 1370 1375

Arg Ser Arg Pro Val Phe Asn Leu Tyr Arg Tyr Ser Val Pro Glu Gln

1380 1385 1390

Leu Phe Arg Asp Asn Ser Leu Gly Met Leu Ala Asp Leu Ala Thr Pro

1395 1400 1405

Asp Ile Glu Gly Ile Tyr Glu Thr Gln Met Thr Leu Glu Phe Arg Ala

1410 1415 1420

Leu Met Asp Met Gly Cys Ile Cys Gly Val Gln Arg Glu Glu Ala Arg

1425 1430 1435 1440

Arg Leu Ala Gln Leu Ala Thr Lys Asp Leu Glu Thr Phe Ser Ile Glu

1445 1450 1455

Gln Leu Glu Gln Gly Pro Arg Leu Arg Ser Asn Ile Trp Leu Ala Pro

1460 1465 1470

Thr Ile Asp Cys Ala Lys Ser Thr Cys Ile Ser Ile Thr His Arg Arg

1475 1480 1485

Pro Arg Arg Arg Ser Val Ser Leu Ile Pro Met Pro Ser Lys Lys Ala

1490 1495 1500

Phe Val Phe Ala Leu Asp Thr Val Arg Ala Asn Gln Met Pro Asn Met

1505 1510 1515 1520

Arg Gln Leu Tyr Thr Ala Glu Arg Leu Ala Leu Leu Lys Asn Leu Thr

1525 1530 1535

Ala Glu Glu Gln Asp Lys Ile Pro Val Glu Asp Tyr Thr Phe Glu Val

1540 1545 1550

Leu Ile Glu Val Asp Val Lys Gln Ile Tyr Arg His Ile Gln Arg Ala

1555 1560 1565

Leu Thr Thr Tyr Lys Gln Glu His Gln Gly Pro Pro Thr Ile Leu Cys

1570 1575 1580

Leu Gln Thr Ala Leu Ser Ala Arg Lys Leu Ser Leu Ala Met Pro Ile

1585 1590 1595 1600

Leu Leu Glu Phe Pro Gln Ala Gln Ile His Ile Ser Asp Asp Ala Ser

1605 1610 1615

Leu Leu Ser Gly Leu Asp Trp Gln Arg Gln Gly Ser Arg Ala Val Ile

1620 1625 1630

Arg His Phe Leu Asn Leu Asn Asn Val Leu Asp Leu Met Leu Asp Gln

1635 1640 1645

Cys Arg Tyr Phe His Val Pro Ile Gly Asn Met Pro Pro Asp Thr Val

1650 1655 1660

Leu Phe Gly Ala Asp Leu Phe Phe Ala Arg Leu Leu Gln Arg His Asn

1665 1670 1675 1680

Phe Val Leu Trp Trp Ser Ala Ser Thr Arg Pro Asp Leu Gly Gly Arg

1685 1690 1695

Glu Ala Asp Asp Ser Arg Leu Leu Ala Glu Phe Glu Glu Ser Ile Ser

1700 1705 1710

Val Val Gln Asn Lys Ala Gly Phe Tyr Pro Asp Val Cys Val Glu Leu

1715 1720 1725

Ala Leu Asp Ser Leu Ala Val Ser Ala Leu Leu Gln Ser Thr Arg Ile

1730 1735 1740

Gln Glu Met Glu Gly Ala Ser Ser Ala Ile Thr Phe Asp Val Met Pro

1745 1750 1755 1760

Gln Val Ser Leu Glu Glu Met Ile Gly Thr Val Pro Ala Ala Thr Leu

1765 1770 1775

Pro Ser Tyr Asp Glu Thr Ala Leu Cys Ser Ala Ala Phe Arg Val Met

1780 1785 1790

Arg Ser Met Val Asn Gly Trp Leu Arg Glu Val Ser Ile Asn Arg Asn

1795 1800 1805

Ile Phe Ser Asp Phe Gln Ile Val His Phe Tyr Arg Trp Val Arg Ser

1810 1815 1820

Ser Asn Ala Leu Leu Tyr Asp Pro Ala Leu Arg Arg Ser Leu Asn Asn

1825 1830 1835 1840

Leu Met Arg Lys Met Phe Leu Arg Ile Ile Ala Glu Phe Lys Arg Leu

1845 1850 1855

Gly Ala Thr Ile Ile Tyr Ala Asp Phe Asn Arg Ile Ile Leu Ser Ser

1860 1865 1870

Gly Lys Lys Thr Val Ser Asp Ala Leu Gly Tyr Val Asp Tyr Ile Val

1875 1880 1885

Gln Ser Leu Arg Asn Lys Glu Met Phe His Ser Ile Gln Leu Ser Phe

1890 1895 1900

Glu Gln Cys Trp Asn Phe Met Leu Trp Met Asp Gln Ala Asn Phe Ser

1905 1910 1915 1920

Gly Ile Arg Gly Lys Leu Pro Lys Gly Ile Asp Glu Thr Val Ser Ser

1925 1930 1935

Ile Val Ser Thr Thr Met Ile Arg Asp Ser Glu Arg Asn Gln Asp Asp

1940 1945 1950

Asp Glu Asp Glu Glu Glu Asp Ser Glu Asn Arg Asp Pro Val Glu Ser

1955 1960 1965

Asn Glu Ala Glu Gln Asp Gln Glu Asp Glu Leu Ser Leu Glu Leu Asn

1970 1975 1980

Trp Thr Ile Gly Glu His Leu Pro Asp Glu Asn Glu Cys Arg Glu Lys

1985 1990 1995 2000

Phe Glu Ser Leu Leu Thr Leu Phe Met Gln Ser Leu Ala Glu Lys Lys

2005 2010 2015

Thr Thr Glu Gln Ala Ile Lys Asp Ile Ser His Cys Ala Phe Asp Phe

2020 2025 2030

Ile Leu Lys Leu His Lys Asn Tyr Gly Lys Gly Lys Pro Ser Pro Gly

2035 2040 2045

Leu Glu Leu Ile Arg Thr Leu Ile Lys Ala Leu Ser Val Asp Lys Thr

2050 2055 2060

Leu Ala Glu Gln Ile Asn Glu Leu Arg Arg Asn Met Leu Arg Leu Val

2065 2070 2075 2080

Gly Ile Gly Glu Phe Ser Asp Leu Ala Glu Trp Glu Asp Pro Cys Asp

2085 2090 2095

Ser His Ile Ile Asn Glu Val Ile Cys Lys Ala Cys Asn His Cys Arg

2100 2105 2110

Asp Leu Asp Leu Cys Lys Asp Lys His Arg Ala Met Lys Asp Gly Cys

2115 2120 2125

Tyr Val Ala Tyr Asp Asn Glu Glu Ile Glu Met Arg Met Leu Asp Ala

2130 2135 2140

Leu Gln Arg Lys Met Met Ser Tyr Val Leu Gln Asp Leu Arg Cys Ser

2145 2150 2155 2160

Arg Cys Ser Glu Ile Lys Arg Glu Asn Leu Ala Glu Phe Cys Thr Cys

2165 2170 2175

Ala Gly Asn Phe Val Pro Leu Ile Ser Gly Lys Asp Ile Gln Thr Leu

2180 2185 2190

Leu Gly Thr Phe Asn Lys Val Ala Ala Asn His Lys Met Gln Leu Leu

2195 2200 2205

Gln Gln Thr Val His Gln Ala Leu Thr Thr Pro Arg

2210 2215 2220

<210>67

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物

<400>67

gactagtggc tatcttgtgg cgggaa 26

<210>68

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物

<400>68

ggaat tcctt gtcccgtgtc aggtca 26

<210>69

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物

<400>69

cagaactttg ccctcccata cctc 24

<210>70

<211>3318

<212>DNA

<213>小鼠(Mus musculus)

<400>70

atggattgta agcggcgaca aggaccaggc cctggggtgc ccccaaagcg ggctcgaggg 60

cacctctggg atgaggacga gccttcgccg tcgcagtttg aggcgaacct ggcactgctg 120

gaggaaatag aggctgagaa ccggctgcag gaggcagagg aggagctgca gctgccccca 180

gagggcaccg tgggtgggca gttttccact gcagacattg accctcggtg gcggcggccc 240

accctacgtg ccctggaccc cagcacggag cccctcatct tccagcagct ggagattgac 300

cactatgtgg gctcagcacc acccctgcca gaagggcccc tgccatcccg gaactcagtg 360

cccatactga gggcctttgg ggtcaccgat gaaggcttct ccgtctgctg ccacatacag 420

ggctttgccc cctacttcta cacccccgcg cctcctggtt ttggggccga gcacctgagt 480

gagctgcagc aggagctgaa cgcagccatc agccgggacc agcgcggtgg gaaggagctc 540

tcagggccgg cagtgctggc aatagagcta tgctcccgtg agagcatgtt tgggtaccac 600

ggtcatggcc cttctccatt tctccgcatc accctggcac taccccgcct tatggcacca 660

gcccgccgcc ttctggaaca gggtgtccga gtgccaggcc tgggcacccc gagcttcgca 720

ccctacgaag ccaacgtgga ctttgagatc cggttcatgg tggatgctga cattgtggga 780

tgcaactggt tggagctgcc agctggaaag tacgttcgga gggcggagaa gaaggccacc 840

ctgtgtcagc tggaggtgga cgtgctgtgg tcagatgtga tcagtcaccc accggagggg 900

cagtggcagc gcattgcacc cctgcgtgtg cttagcttcg acatcgagtg tgctggccga 960

aaaggcatct tccctgagcc tgagcgtgac cccgtgatcc agatctgttc tctggggctg 1020

cgctgggggg agccggagcc attcttgcgt ctggcactca cgctgcggcc ctgtgccccc 1080

atcctgggtg ccaaagtgca gagctatgag cgggaagaag acctgctcca ggcctgggcc 1140

gacttcatcc ttgccatgga ccctgacgtg atcaccggct acaacattca gaactttgcc 1200

ctcccatacc tcatctctcg ggcacaggcc ctaaaggtgg accgcttccc tttcctgggc 1260

cgcgtgactg gtctccgctc caacatccgt gactcctcct tccaatcaag gcaggtcggc 1320

cggcgggaca gtaaggtgat cagcatggtg ggtcgcgttc agatggatat gctgcaggtg 1380

ctgcttcggg aacacaagct ccgctcctac acgctcaacg ctgtgagttt ccacttcctg 1440

ggcgagcaga aggaggacgt tcagcacagc atcatcaccg acctgcagaa tgggaacgaa 1500

cagacgcgcc gccgcctggc cgtgtactgc ctgaaggacg cctttctgcc actccgacta 1560

ctagagcgcc ttatggtgct ggtgaataat gtggagatgg cgcgtgtcac gggtgtaccc 1620

cttgggtacc tgctcacccg gggccagcag gtcaaggtcg tgtctcagct gctgcgccag 1680

gccatgcgcc aggggctgct gatgcctgtg gtgaagaccg agggcagtga ggactacacg 1740

ggagccacag tcattgagcc cctcaaaggg tactatgacg tccccattgc caccctggac 1800

ttctcctcct tgtacccatc catcatgatg gcccataatc tgtgctacac cacgctgctc 1860

cgacctgggg ctgcccagaa gctgggcctt aaaccagatg agttcatcaa gacacccact 1920

ggggatgagt ttgtgaagtc atctgtacgg aagggcctcc tgccccagat cctggagaat 1980

ctgctgagtg cccgcaagag ggccaaggct gagctggctc aggagacgga ccccctgcgg 2040

cgacaggtct tggacggccg gcaactggca ctaaaagtga gtgccaactc cgtatatggc 2100

ttcactggtg cccaggtggg caagctgcca tgtttggaga tctcccagag tgtcactggg 2160

ttcgggcggc agatgattga gaaaaccaag cagcttgtgg agtccaagta caccgtggaa 2220

aatggctacg atgccaacgc caaggtagtc tacggtgaca cggactctgt gatgtgccgg 2280

tttggcgtct cctctgtggc tgaagcaatg tctctggggc gggaggctgc aaactgggta 2340

tccagtcact tcccatcacc catccggctg gagttcgaga aggtttactt cccatacctg 2400

ctcatcagca agaagcgcta tgctggcctg ctcttctcct cccgctctga tgcccatgac 2460

aaaatggact gcaagggcct ggaggctgtg cgcagggaca actgtcccct ggtggccaac 2520

ctcgttacat cctctctgcg ccggatcctc gtggaccggg accctgatgg ggcagtagcc 2580

catgccaagg acgtcatctc ggacctgctg tgcaaccgca tagacatctc ccagctggtc 2640

atcaccaaag agttgacccg cgcagcagca gactatgctg gcaagcaggc tcacgtggag 2700

ctggctgaga ggatgaggaa gcgcgacccc ggcagtgcgc ccagcctggg tgaccgagtc 2760

ccctatgtga tcattggtgc tgctaagggt gtggccgcct acatgaagtc ggaggacccc 2820

ctgtttgtgc tggagcacag cctgcccatc gacactcagt actacctgga gcagcagctg 2880

gccaagccgc tcttgcgcat ctttgagccc atcctgggtg agggccgtgc agagtctgtg 2940

ctgctgcgcg gtgaccacac acgatgcaag actgtgctca ccagcaaggt gggcggcctc 3000

ttggccttca ccaagcgccg caactgttgc attggctgcc gctccgtaat cgaccatcaa 3060

ggagccgtgt gtaagttctg tcagccacgg gagtcggagc tctatcagaa ggaggtgtca 3120

cacctgaatg ccttggaaga acggttctct cgcctctgga cacagtgtca acgctgccag 3180

ggcagcttgc atgaggacgt catctgtacc agccgtgact gtcccatctt ctacatgcgc 3240

aagaaggtgc gcaaggacct ggaagaccag gaacggctgc tgcagcgctt tggaccgccc 3300

ggccctgagg cctggtga 3318

<210>71

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物

<400>71

tccccgcggc tgcagaggat tttccacag 29

<210>72

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>72

ggactagtat ggtatgcaca acagcctc 28

<210>73

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物

<400>73

tccccgcgga gtggttgtgg gagacttac 29

<210>74

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>74

ggac tagtca gtcccacagt cccaaagt 28

<210>75

<211>18

<212>DNA

<213>人工序列

<220>

<223>引物

<400>75

ctgagagtga tgaggttc 18

<210>76

<211>21

<212>DNA

<213>人工序列

<220>

<223>引物

<400>76

ctaatcgcca tcttccagca g 21

<210>77

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>77

gctcgacgtt gtcactgaag 20

<210>78

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>78

ccaacgctat gtcctgatag 20

<210>79

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>79

gctcgacgtt gtcactgaag 20

<210>80

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>80

ccaacgctat gtcctgatag 20

<210>81

<211>5725

<212>DNA

<213>小鼠(Mus musculus)

<400>81

agtggttgtg ggagacttac cgtcctcttg tctctggaga gtgccttcta ccatgtcatc 60

agaagggctg tcatcttggt ccccgatttc ttccacatca ttgtcctgag catcagcagc 120

gtctccaatg gggcagttta atttgaggca atacttactc ttcaactggc cgttactttc 180

acctggacta gacacatcgc gcttctgaga acacacttta tccaaaaacc ggataccgaa 240

atcctgcccg gactacatca tcaagttgat gtcctccttt ttcacgaaaa tctttgtggt 300

gtacctgtag ttcagcacct cttcaaatat gtgggagcag atgaaatcta tctctatgat 360

ggacaagctg tccagttcta gcttcttgaa aagtttcttt tttttttctt tcaatttttt 420

attaggtatt tagctcattt acatttccaa tgctatacca aaagtccccc atacccaccc 480

acccccactc ccctacccgc tcactccacc tttttggccc tggcgttccc ctgttctggg 540

gcatataaag tttgtgtgtc caatgggcct ctctttccag tgatggccga ctaggccatc 600

ttttgataca tatgcagcta gagtcaagag ctccggggta ctggttagtt cataatgttg 660

atccacctat agggttgcag atccctttag ctccttgggt actttctcta gctcctccat 720

tgggagccct gtgatccatc cattagctga ctgtgggcat ccacttctgt gtttgctagg 780

ccccggcata gtctcacaag agacagctac atctgggtcc tttcgataaa atcttgctag 840

tgtatgcaat ggtgtcagcg tttggatgct gattatgggg tggatccctg gataaggcag 900

tctctacatg gtccatcctt tcatctcagc tccaaacttt gtctctgtaa ctccttccaa 960

gggtgttttg ttcccacttc taaggagggg catagtgtcc acacttcagt cttctttttt 1020

catgagtttc atgtgtttag gaaattgtat cttatatctt gggtatccta ggttttgggc 1080

taatatccac ttatcagcga gtacatattg tgtgagttcc tttgtgaatg tgttacctca 1140

ctcaggaaga tgccctccag gtccatccat ttggctagga atttcataaa ttcattcttt 1200

ttaatagctg agtagtactc cattgtgtag atgtaccaca ttttctgtat ccattcctct 1260

gttgaggggc atctgggttc tttccagctt ctggctatta taaataaggc tgctatgaac 1320

atagtggagc atgtgtcctt cttaccagtt ggggcatctc ctggatatat gcccaggaga 1380

ggtattcctg gatcctccgg tagtactatg tccaattttc taaggaaccg ccagatggat 1440

ttccagagtg gttgtacaag cctgcaatcc caccaacaat ggaggagtgt tcctctttct 1500

ccacatcctc gccagcatct gctgtcacct gaatttttga tcttagccat tctgactggt 1560

gtgaggtgga atctcagggt tgttttgatt tgcatttccc tgatgattaa ggatgttgaa 1620

cattttttca ggtgcttctc tgccattcgg tattcctcag gtgagaattc tttgttcagt 1680

tctgagcccc atttttttaa tggggttatt tgattttctg aagtccacct tcttgagttc 1740

tttatatatg ttggatatta gtcccctatc tgatttagga taggtaaaga tcctttccca 1800

atctgttggt ggtctctttg tcttattgac agtgtctttt gccttgcaga aactttggag 1860

tttcattagg tcccatttgt caattctcga tcttacagca caagccattg ctgttctgtt 1920

caggaatttt tcccctgtgc ccatatcttc aaggcttttc cccactttct cctctataag 1980

tttcagtgtc tctggtttta tgtgaagttc tttgatccat ttagatttga ccttagtaca 2040

aggagataag tatggatcga ttcgcattct tctacatgat aacaaccagt tgtgccagca 2100

ccatttgttg aaaatgctgt ctttcttcca ctggatggtt ttagctccct tgtcgaagat 2160

caagtgacca taggtgtgtg ggttcatttc tgggtcttca attctattcc attggtctac 2220

ttgtctgtct ctataccagt accatgcagt ttttaccaca attgctctgt agtaaagctt 2280

taggtcaggc atggtgattc caccagaggt tcttttatcc ttgagaagag tttttgctat 2340

cctaggtttt ttgttattcc agatgaattt gcaaattgct ccttctaatt cgttgaagaa 2400

ttgagttgga attttgatgg ggattgcatt gaatctgtag attgcttttg gcaagatagc 2460

catttttaca atattgatcc tgccaatcca tgagcatggg agatctttcc atcttctgag 2520

atcttcttta atttctttct tcagagactt gaagttttta tcatacatat ctttcacttc 2580

ctcagttaga gtcacgccga gatattttat attatttgtg actattgaga agggtgttgt 2640

ttccctaatt tctttctcag actgtttatt ctttgtgtag agaaaggcca ttgacttgtt 2700

tgagttaatt ttatatccag ctacttcacc aaagctgttt atcaggttta ggagttctct 2760

ggtggaattt ttagggtcac ttatatatac tatcatatca tctgcgaaaa gtgatatttt 2820

gacttcctct tttccaattt gtatcccctt gatctccttt tgttgtcgaa ttgctcagca 2880

ctgcagtatt cttaacaaag ttgattctca ttagaaaata aagctgccat atgaccatct 2940

aacacttagt aactgggaaa atttgatttg atctggtgat ttgtcacagc aataacaaag 3000

taactatcac aatggctgaa acaagtctgc tcacttggaa tcaacacttt ttgtcccagg 3060

agcaacagag tcttcagtat caggggccta aatttagaga tgaaggtttg gacctgtagc 3120

ctgaacctct tgcagaagtg atgtattaaa aggctgatca acaatggtcg ctacaagagt 3180

actccaggcc agccaatcca acaagcccaa taccttgaag gatgaaaccc atgcccaaga 3240

tcacttcctg tgcctggtgg ctgggcctct actgagtgcc acaaagtaga agaaaaaact 3300

ctagatgcta gtgttcctct aagcatgaat aactgatata tattcatgct gctctacctc 3360

agatattcag acttttcccc ctggttttca gtaaatcaag ttggatcact ccactcttct 3420

ctctcctcct cttctcattt cctctgttca gcctcccctc ccagattctc cagtctgacc 3480

acgtttctaa acagtttgct aatttatctt ggcagctgag gcagctatgg gagccacagc 3540

aggcagagag cacaggagac tcagggttct cagcagggct ctcagcaggg ctctcagcag 3600

ggctgttgtg ggtgatcctt ggattctcta tcctccagga acagtttcac tgttccagaa 3660

gatggtgatg attctgacga ctgagatgca cgtgtggtgg tgtctctgga ggctaaagtg 3720

caggtgccaa gtggttccaa atagctgggt gcagtttgtc tcaggggcac ctctagaggg 3780

tcagcctgtt tctttcagcc tctagagggc agagatgagt cccagacctt gctctctaca 3840

ttatcctagc ctttctgtgc cctttgtgag gcgcctgcag ttaagaacgt gtccagcagg 3900

gggcgcagtg tacatgggtg ttctccagta acagtcttgg ctgggaagga gagctagatt 3960

ccaggttctt aaaatactgt tttcctgtac atacctaagt aatctttaca ttggaaaaca 4020

aacaaatagt aaagctctgt tgttgttgtt gataagtagc aaattaattt agggggagca 4080

gtttgggggg ctgatgggtc ttgttctgcc attcaggctg ggctgaagct cctagggtct 4140

gaagatgctc ctgtctcaga ctccaaagca tgggactgca tacagaagcg tgcaacagtg 4200

ctaggcttcc aatcaggttt cacattttgc ttctagacag aaatataatt tcctgaaacc 4260

tttcgttttg aaatgatgtc attattgggc ccccgcactc attgctgctg acgcccccct 4320

cccactatcc ctcgggctga aatgtcctga ttgggtgtca acgctcattt gcactgatgc 4380

tcccccctta atccctggag ctgaaatgtc ctgattgggt gccaaaattt tttccactga 4440

tgcctctccc atcccattag cactaggact gaaatgtcat gattgggcgc aaaaactaat 4500

ttccaattat gcccggcccc tccgattatc cctggtgctg agatgtcatg attggggcca 4560

acactcattt ctgctgatgg ccctcctctc ccattagacc tggacctgaa tccgtgtcat 4620

gattggacgc caacactcat ttccactgat gccccggccc tcccattagt cctgaggctg 4680

aacccctgtc atgattgggc tccaatcctc atttcaggtg atgctcagct cctcccatca 4740

gccctgtggc tgaatctctg tcacgattgg gccccaaccc tcatttctgc tgaggcccag 4800

cccctcccat tagccctggg gctgcatccc tgtcaccact agacaccaac actcatttct 4860

gctgatgccc cgcccatgcc attacccttg ggcctaaatc cctgtcatga ttgaactcca 4920

acccacattt ctcctgatac cctgactccc attatcctta ggcttaatcc gtgtcataat 4980

tgggcgccaa cactgatttc ctctgatgcc ctgcccctcc cattagcccg ggactgaatc 5040

cctgtcataa ttggacttga accctcattt ttgctgaggc ccagcgcctc ccatttgtcc 5100

tcgggctgat ccctgtcatg attgggcccc aaccctcatt tcggctgagg ccccactcct 5160

ccaattagcc ctgaggctga atccatgtca tgagtaggca ccaactctca ttaacactga 5220

tgcgctgccc cttacattag ccctggggct gaatccctgt catgattggg ccccaacact 5280

catttctgct gatggccctc ctctcccatt agacctgagg ctgaatccgt gtcatgattg 5340

ggcaccaaac cgcaattcca ctaaagcccc acccctccca ttaccatcct gccgaaacca 5400

tgtcttgtca tgattgggcc ccaaccctcc tttccactga tgcccccccc tcccttaagc 5460

cctcctgctg agaccacatc ttgattgggc actaacactc atttccgctg atgcccacca 5520

ctcccatttg ccctgggact taaaccctgt cgtgattggg tgtcaaccct catttccggt 5580

gatgccccgc ctcttcctat aaatcctggc gctcaaatac tgtggtcggt gggcaggaac 5640

agccatttgg atcactgcct gcagcctagc ggttgagctg ctctggcgat catctgttct 5700

gaggtacttt gggactgtgg gactg 5725

<210>82

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>82

ctgagtctag atttcccgcc atggaaatcg 30

<210>83

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>83

agcaacgagc tcttatgatt ggtttatctg 30

<210>84

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>84

atttgctgtc gataatatca gatttcttgg 30

<210>85

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>85

gagtgaggat ttgtacatga tctgaagg 28

<210>86

<211>3357

<212>DNA

<213>小鼠(Mus musculus)

<220>

<221>CDS

<222>(24)..(3341)

<400>86

ggcgggaaaa gctgtttgag gcg atg gat tgt aag cgg cga caa gga cca ggc 53

Met Asp Cys Lys Arg Arg Gln Gly Pro Gly

1 5 10

cct ggg gtg ccc cca aag cgg gct cga ggg cac ctc tgg gat gag gac 101

Pro Gly Val Pro Pro Lys Arg Ala Arg Gly His Leu Trp Asp Glu Asp

15 20 25

gag cct tcg ccg tcg cag ttt gag gcg aac ctg gca ctg ctg gag gaa 149

Glu Pro Ser Pro Ser Gln Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu

30 35 40

ata gag gct gag aac cgg ctg cag gag gca gag gag gag ctg cag ctg 197

Ile Glu Ala Glu Asn Arg Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu

45 50 55

ccc cca gag ggc acc gtg ggt ggg cag ttt tcc act gca gac att gac 245

Pro Pro Glu Gly Thr Val Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp

60 65 70

cct cgg tgg cgg cgg ccc acc cta cgt gcc ctg gac ccc agc acg gag 293

Pro Arg Trp Arg Arg Pro Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu

75 80 85 90

ccc ctc atc ttc cag cag ctg gag att gac cac tat gtg ggc tca gca 341

Pro Leu Ile Phe Gln Gln Leu Glu Ile Asp His Tyr Val Gly Ser Ala

95 100 105

cca ccc ctg cca gaa ggg ccc ctg cca tcc cgg aac tca gtg ccc ata 389

Pro Pro Leu Pro Glu Gly Pro Leu Pro Ser Arg Asn Ser Val Pro Ile

110 115 120

ctg agg gcc ttt ggg gtc acc gat gaa ggc ttc tcc gtc tgc tgc cac 437

Leu Arg Ala Phe Gly Val Thr Asp Glu Gly Phe Ser Val Cys Cys His

125 130 135

ata cag ggc ttt gcc ccc tac ttc tac acc ccc gcg cct cct ggt ttt 485

Ile Gln Gly Phe Ala Pro Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe

140 145 150

ggg gcc gag cac ctg agt gag ctg cag cag gag ctg aac gca gcc atc 533

Gly Ala Glu His Leu Ser Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile

155 160 165 170

agc cgg gac cag cgc ggt ggg aag gag ctc tca ggg ccg gca gtg ctg 581

Ser Arg Asp Gln Arg Gly Gly Lys Glu Leu Ser Gly Pro Ala Val Leu

175 180 185

gca ata gag cta tgc tcc cgt gag agc atg ttt ggg tac cac ggt cat 629

Ala Ile Glu Leu Cys Ser Arg Glu Ser Met Phe Gly Tyr His Gly His

190 195 200

ggc cct tct cca ttt ctc cgc atc acc ctg gca cta ccc cgc ctt atg 677

Gly Pro Ser Pro Phe Leu Arg Ile Thr Leu Ala Leu Pro Arg Leu Met

205 210 215

gca cca gcc cgc cgc ctt ctg gaa cag ggt gtc cga gtg cca ggc ctg 725

Ala Pro Ala Arg Arg Leu Leu Glu Gln Gly Val Arg Val Pro Gly Leu

220 225 230

ggc acc ccg agc ttc gca ccc tac gaa gcc aac gtg gac ttt gag atc 773

Gly Thr Pro Ser Phe Ala Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile

235 240 245 250

cgg ttc atg gtg gat gct gac att gtg gga tgc aac tgg ttg gag ctg 821

Arg Phe Met Val Asp Ala Asp Ile Val Gly Cys Asn Trp Leu Glu Leu

255 260 265

cca gct gga aag tac gtt cgg agg gcg gag aag aag gcc acc ctg tgt 869

Pro Ala Gly Lys Tyr Val Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys

270 275 280

cag ctg gag gtg gac gtg ctg tgg tca gat gtg atc agt cac cca ccg 917

Gln Leu Glu Val Asp Val Leu Trp Ser Asp Val Ile Ser His Pro Pro

285 290 295

gag ggg cag tgg cag cgc att gca ccc ctg cgt gtg ctt agc ttc gac 965

Glu Gly Gln Trp Gln Arg Ile Ala Pro Leu Arg Val Leu Ser Phe Asp

300 305 310

atc gag tgt gct ggc cga aaa ggc atc ttc cct gag cct gag cgt gac 1013

Ile Glu Cys Ala Gly Arg Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp

315 320 325 330

ccc gtg atc cag atc tgt tct ctg ggg ctg cgc tgg ggg gag ccg gag 1061

Pro Val Ile Gln Ile Cys Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu

335 340 345

cca ttc ttg cgt ctg gca ctc acg ctg cgg ccc tgt gcc ccc atc ctg 1109

Pro Phe Leu Arg Leu Ala Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu

350 355 360

ggt gcc aaa gtg cag agc tat gag cgg gaa gaa gac ctg ctc cag gcc 1157

Gly Ala Lys Val Gln Ser Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala

365 370 375

tgg gcc gac ttc atc ctt gcc atg gac cct gac gtg atc acc ggc tac 1205

Trp Ala Asp Phe Ile Leu Ala Met Asp Pro Asp Val Ile Thr Gly Tyr

380 385 390

aac att cag aac ttt gac ctc cca tac ctc atc tct cgg gca cag gcc 1253

Asn Ile Gln Asn Phe Asp Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala

395 400 405 410

cta aag gtg gac cgc ttc cct ttc ctg ggc cgc gtg act ggt ctc cgc 1301

Leu Lys Val Asp Arg Phe Pro Phe Leu Gly Arg Val Thr Gly Leu Arg

415 420 425

tcc aac atc cgt gac tcc tcc ttc caa tca agg cag gtc ggc cgg cgg 1349

Ser Asn Ile Arg Asp Ser Ser Phe Gln Ser Arg Gln Val Gly Arg Arg

430 435 440

gac agt aag gtg atc agc atg gtg ggt cgc gtt cag atg gat atg ctg 1397

Asp Ser Lys Val Ile Ser Met Val Gly Arg Val Gln Met Asp Met Leu

445 450 455

cag gtg ctg ctt cgg gaa cac aag ctc cgc tcc tac acg ctc aac gct 1445

Gln Val Leu Leu Arg Glu His Lys Leu Arg Ser Tyr Thr Leu Asn Ala

460 465 470

gtg agt ttc cac ttc ctg ggc gag cag aag gag gac gtt cag cac agc 1493

Val Ser Phe His Phe Leu Gly Glu Gln Lys Glu Asp Val Gln His Ser

475 480 485 490

atc atc acc gac ctg cag aat ggg aac gaa cag acg cgc cgc cgc ctg 1541

Ile Ile Thr Asp Leu Gln Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu

495 500 505

gcc gtg tac tgc ctg aag gac gcc ttt ctg cca ctc cga cta cta gag 1589

Ala Val Tyr Cys Leu Lys Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu

510 515 520

cgc ctt atg gtg ctg gtg aat aat gtg gag atg gcg cgt gtc acg ggt 1637

Arg Leu Met Val Leu Val Asn Asn Val Glu Met Ala Arg Val Thr Gly

525 530 535

gta ccc ctt ggg tac ctg ctc acc cgg ggc cag cag gtc aag gtc gtg 1685

Val Pro Leu Gly Tyr Leu Leu Thr Arg Gly Gln Gln Val Lys Val Val

540 545 550

tct cag ctg ctg cgc cag gcc atg cgc cag ggg ctg ctg atg cct gtg 1733

Ser Gln Leu Leu Arg Gln Ala Met Arg Gln Gly Leu Leu Met Pro Val

555 560 565 570

gtg aag acc gag ggc agt gag gac tac acg gga gcc aca gtc att gag 1781

Val Lys Thr Glu Gly Ser Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu

575 580 585

ccc ctc aaa ggg tac tat gac gtc ccc att gcc acc ctg gac ttc tcc 1829

Pro Leu Lys Gly Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp Phe Ser

590 595 600

tcc ttg tac cca tcc atc atg atg gcc cat aat ctg tgc tac acc acg 1877

Ser Leu Tyr Pro Ser Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr

605 610 615

ctg ctc cga cct ggg gct gcc cag aag ctg ggc ctt aaa cca gat gag 1925

Leu Leu Arg Pro Gly Ala Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu

620 625 630

ttc atc aag aca ccc act ggg gat gag ttt gtg aag tca tct gta cgg 1973

Phe Ile Lys Thr Pro Thr Gly Asp Glu Phe Val Lys Ser Ser Val Arg

635 640 645 650

aag ggc ctc ctg ccc cag atc ctg gag aat ctg ctg agt gcc cgc aag 2021

Lys Gly Leu Leu Pro Gln Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys

655 660 665

agg gcc aag gct gag ctg gct cag gag acg gac ccc ctg cgg cga cag 2069

Arg Ala Lys Ala Glu Leu Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln

670 675 680

gtc ttg gac ggc cgg caa ctg gca cta aaa gtg agt gcc aac tcc gta 2117

Val Leu Asp Gly Arg Gln Leu Ala Leu Lys Val Ser Ala Asn Ser Val

685 690 695

tat ggc ttc act ggt gcc cag gtg ggc aag ctg cca tgt ttg gag atc 2165

Tyr Gly Phe Thr Gly Ala Gln Val Gly Lys Leu Pro Cys Leu Glu Ile

700 705 710

tcc cag agt gtc act ggg ttc ggg cgg cag atg att gag aaa acc aag 2213

Ser Gln Ser Val Thr Gly Phe Gly Arg Gln Met Ile Glu Lys Thr Lys

715 720 725 730

cag ctt gtg gag tcc aag tac acc gtg gaa aat ggc tac gat gcc aac 2261

Gln Leu Val Glu Ser Lys Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn

735 740 745

gcc aag gta gtc tac ggt gac acg gac tct gtg atg tgc cgg ttt ggc 2309

Ala Lys Val Val Tyr Gly Asp Thr Asp Ser Val Met Cys Arg Phe Gly

750 755 760

gtc tcc tct gtg gct gaa gca atg tct ctg ggg cgg gag gct gca aac 2357

Val Ser Ser Val Ala Glu Ala Met Ser Leu Gly Arg Glu Ala Ala Asn

765 770 775

tgg gta tcc agt cac ttc cca tca ccc atc cgg ctg gag ttc gag aag 2405

Trp Val Ser Ser His Phe Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys

780 785 790

gtt tac ttc cca tac ctg ctc atc agc aag aag cgc tat gct ggc ctg 2453

Val Tyr Phe Pro Tyr Leu Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu

795 800 805 810

ctc ttc tcc tcc cgc tct gat gcc cat gac aaa atg gac tgc aag ggc 2501

Leu Phe Ser Ser Arg Ser Asp Ala His Asp Lys Met Asp Cys Lys Gly

815 820 825

ctg gag gct gtg cgc agg gac aac tgt ccc ctg gtg gcc aac ctc gtt 2549

Leu Glu Ala Val Arg Arg Asp Asn Cys Pro Leu Val Ala Asn Leu Val

830 835 840

aca tcc tct ctg cgc cgg atc ctc gtg gac cgg gac cct gat ggg gca 2597

Thr Ser Ser Leu Arg Arg Ile Leu Val Asp Arg Asp Pro Asp Gly Ala

845 850 855

gta gcc cat gcc aag gac gtc atc tcg gac ctg ctg tgc aac cgc ata 2645

Val Ala His Ala Lys Asp Val Ile Ser Asp Leu Leu Cys Asn Arg Ile

860 865 870

gac atc tcc cag ctg gtc atc acc aaa gag ttg acc cgc gca gca gca 2693

Asp Ile Ser Gln Leu Val Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala

875 880 885 890

gac tat gct ggc aag cag gct cac gtg gag ctg gct gag agg atg agg 2741

Asp Tyr Ala Gly Lys Gln Ala His Val Glu Leu Ala Glu Arg Met Arg

895 900 905

aag cgc gac ccc ggc agt gcg ccc agc ctg ggt gac cga gtc ccc tat 2789

Lys Arg Asp Pro Gly Ser Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr

910 915 920

gtg atc att ggt gct gct aag ggt gtg gcc gcc tac atg aag tcg gag 2837

Val Ile Ile Gly Ala Ala Lys Gly Val Ala Ala Tyr Met Lys Ser Glu

925 930 935

gac ccc ctg ttt gtg ctg gag cac agc ctg ccc atc gac act cag tac 2885

Asp Pro Leu Phe Val Leu Glu His Ser Leu Pro Ile Asp Thr Gln Tyr

940 945 950

tac ctg gag cag cag ctg gcc aag ccg ctc ttg cgc atc ttt gag ccc 2933

Tyr Leu Glu Gln Gln Leu Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro

955 960 965 970

atc ctg ggt gag ggc cgt gca gag tct gtg ctg ctg cgc ggt gac cac 2981

Ile Leu Gly Glu Gly Arg Ala Glu Ser Val Leu Leu Arg Gly Asp His

975 980 985

aca cga tgc aag act gtg ctc acc agc aag gtg ggc ggc ctc ttg gcc 3029

Thr Arg Cys Lys Thr Val Leu Thr Ser Lys Val Gly Gly Leu Leu Ala

990 995 1000

ttc acc aag cgc cgc aac tgt tgc att ggc tgc cgc tcc gta atc 3074

Phe Thr Lys Arg Arg Asn Cys Cys Ile Gly Cys Arg Ser Val Ile

1005 1010 1015

gac cat caa gga gcc gtg tgt aag ttc tgt cag cca cgg gag tcg 3119

Asp His Gln Gly Ala Val Cys Lys Phe Cys Gln Pro Arg Glu Ser

1020 1025 1030

gag ctc tat cag aag gag gtg tca cac ctg aat gcc ttg gaa gaa 3164

Glu Leu Tyr Gln Lys Glu Val Ser His Leu Asn Ala Leu Glu Glu

1035 1040 1045

cgg ttc tct cgc ctc tgg aca cag tgt caa cgc tgc cag ggc agc 3209

Arg Phe Ser Arg Leu Trp Thr Gln Cys Gln Arg Cys Gln Gly Ser

1050 1055 1060

ttg cat gag gac gtc atc tgt acc agc cgt gac tgt ccc atc ttc 3254

Leu His Glu Asp Val Ile Cys Thr Ser Arg Asp Cys Pro Ile Phe

1065 1070 1075

tac atg cgc aag aag gtg cgc aag gac ctg gaa gac cag gaa cgg 3299

Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu Asp Gln Glu Arg

1080 1085 1090

ctg ctg cag cgc ttt gga ccg ccc ggc cct gag gcc tgg tga 3341

Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala Trp

1095 1100 1105

cctgacacgg gacaag 3357

<210>87

<211>1105

<212>PRT

<213>小鼠(Mus musculus)

<400>87

Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys

1 5 10 15

Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln

20 25 30

Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg

35 40 45

Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val

50 55 60

Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro

65 70 75 80

Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln

85 90 95

Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Gly

100 105 110

Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val

115 120 125

Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro

130 135 140

Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser

145 150 155 160

Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly

165 170 175

Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser

180 185 190

Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu

195 200 205

Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu

210 215 220

Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala

225 230 235 240

Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala

245 250 255

Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val

260 265 270

Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val

275 280 285

Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg

290 295 300

Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg

305 310 315 320

Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys

325 330 335

Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala

340 345 350

Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser

355 360 365

Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu

370 375 380

Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Asp

385 390 395 400

Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe

405 410 415

Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser

420 425 430

Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser

435 440 445

Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu

450 455 460

His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu

465 470 475 480

Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln

485 490 495

Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys

500 505 510

Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val

515 520 525

Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu

530 535 540

Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln

545 550 555 560

Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Ser

565 570 575

Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr

580 585 590

Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile

595 600 605

Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala

610 615 620

Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr

625 630 635 640

Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln

645 650 655

Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu

660 665 670

Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln

675 680 685

Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala

690 695 700

Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly

705 710 715 720

Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys

725 730 735

Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly

740 745 750

Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu

755 760 765

Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe

770 775 780

Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu

785 790 795 800

Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser

805 810 815

Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg

820 825 830

Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg

835 840 845

Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp

850 855 860

Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val

865 870 875 880

Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln

885 890 895

Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser

900 905 910

Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala

915 920 925

Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu

930 935 940

Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu

945 950 955 960

Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg

965 970 975

Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val

980 985 990

Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn

995 1000 1005

Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val

1010 1015 1020

Cys Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu

1025 1030 1035

Val Ser His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp

1040 1045 1050

Thr Gln Cys Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile

1055 1060 1065

Cys Thr Ser Arg Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val

1070 1075 1080

Arg Lys Asp Leu Glu Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly

1085 1090 1095

Pro Pro Gly Pro Glu Ala Trp

1100 1105

<210>88

<211>3318

<212>DNA

<213>小鼠(Mus musculus)

<220>

<221>CDS

<222>(1)..(3318)

<400>88

atg gat tgt aag cgg cga caa gga cca ggc cct ggg gtg ccc cca aag 48

Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys

1 5 10 15

cgg gct cga ggg cac ctc tgg gat gag gac gag cct tcg ccg tcg cag 96

Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln

20 25 30

ttt gag gcg aac ctg gca ctg ctg gag gaa ata gag gct gag aac cgg 144

Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg

35 40 45

ctg cag gag gca gag gag gag ctg cag ctg ccc cca gag ggc acc gtg 192

Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val

50 55 60

ggt ggg cag ttt tcc act gca gac att gac cct cgg tgg cgg cgg ccc 240

Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro

65 70 75 80

acc cta cgt gcc ctg gac ccc agc acg gag ccc ctc atc ttc cag cag 288

Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln

85 90 95

ctg gag att gac cac tat gtg ggc tca gca cca ccc ctg cca gaa ggg 336

Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Gly

100 105 110

ccc ctg cca tcc cgg aac tca gtg ccc ata ctg agg gcc ttt ggg gtc 384

Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val

115 120 125

acc gat gaa ggc ttc tcc gtc tgc tgc cac ata cag ggc ttt gcc ccc 432

Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro

130 135 140

tac ttc tac acc ccc gcg cct cct ggt ttt ggg gcc gag cac ctg agt 480

Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser

145 150 155 160

gag ctg cag cag gag ctg aac gca gcc atc agc cgg gac cag cgc ggt 528

Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly

165 170 175

ggg aag gag ctc tca ggg ccg gca gtg ctg gca ata gag cta tgc tcc 576

Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser

180 185 190

cgt gag agc atg ttt ggg tac cac ggt cat ggc cct tct cca ttt ctc 624

Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu

195 200 205

cgc atc acc ctg gca cta ccc cgc ctt atg gca cca gcc cgc cgc ctt 672

Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu

210 215 220

ctg gaa cag ggt gtc cga gtg cca ggc ctg ggc acc ccg agc ttc gca 720

Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala

225 230 235 240

ccc tac gaa gcc aac gtg gac ttt gag atc cgg ttc atg gtg gat gct 768

Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala

245 250 255

gac att gtg gga tgc aac tgg ttg gag ctg cca gct gga aag tac gtt 816

Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val

260 265 270

cgg agg gcg gag aag aag gcc acc ctg tgt cag ctg gag gtg gac gtg 864

Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val

275 280 285

ctg tgg tca gat gtg atc agt cac cca ccg gag ggg cag tgg cag cgc 912

Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg

290 295 300

att gca ccc ctg cgt gtg ctt agc ttc gac atc gag tgt gct ggc cga 960

Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg

305 310 315 320

aaa ggc atc ttc cct gag cct gag cgt gac ccc gtg atc cag atc tgt 1008

Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys

325 330 335

tct ctg ggg ctg cgc tgg ggg gag ccg gag cca ttc ttg cgt ctg gca 1056

Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala

340 345 350

ctc acg ctg cgg ccc tgt gcc ccc atc ctg ggt gcc aaa gtg cag agc 1104

Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser

355 360 365

tat gag cgg gaa gaa gac ctg ctc cag gcc tgg gcc gac ttc atc ctt 1152

Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu

370 375 380

gcc atg gac cct gac gtg atc acc ggc tac aac att cag aac ttt gcc 1200

Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Ala

385 390 395 400

ctc cca tac ctc atc tct cgg gca cag gcc cta aag gtg gac cgc ttc 1248

Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe

405 410 415

cct ttc ctg ggc cgc gtg act ggt ctc cgc tcc aac atc cgt gac tcc 1296

Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser

420 425 430

tcc ttc caa tca agg cag gtc ggc cgg cgg gac agt aag gtg atc agc 1344

Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser

435 440 445

atg gtg ggt cgc gtt cag atg gat atg ctg cag gtg ctg ctt cgg gaa 1392

Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu

450 455 460

cac aag ctc cgc tcc tac acg ctc aac gct gtg agt ttc cac ttc ctg 1440

His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu

465 470 475 480

ggc gag cag aag gag gac gtt cag cac agc atc atc acc gac ctg cag 1488

Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln

485 490 495

aat ggg aac gaa cag acg cgc cgc cgc ctg gcc gtg tac tgc ctg aag 1536

Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys

500 505 510

gac gcc ttt ctg cca ctc cga cta cta gag cgc ctt atg gtg ctg gtg 1584

Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val

515 520 525

aat aat gtg gag atg gcg cgt gtc acg ggt gta ccc ctt ggg tac ctg 1632

Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu

530 535 540

ctc acc cgg ggc cag cag gtc aag gtc gtg tct cag ctg ctg cgc cag 1680

Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln

545 550 555 560

gcc atg cgc cag ggg ctg ctg atg cct gtg gtg aag acc gag ggc agt 1728

Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Ser

565 570 575

gag gac tac acg gga gcc aca gtc att gag ccc ctc aaa ggg tac tat 1776

Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr

580 585 590

gac gtc ccc att gcc acc ctg gac ttc tcc tcc ttg tac cca tcc atc 1824

Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile

595 600 605

atg atg gcc cat aat ctg tgc tac acc acg ctg ctc cga cct ggg gct 1872

Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala

610 615 620

gcc cag aag ctg ggc ctt aaa cca gat gag ttc atc aag aca ccc act 1920

Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr

625 630 635 640

ggg gat gag ttt gtg aag tca tct gta cgg aag ggc ctc ctg ccc cag 1968

Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln

645 650 655

atc ctg gag aat ctg ctg agt gcc cgc aag agg gcc aag gct gag ctg 2016

Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu

660 665 670

gct cag gag acg gac ccc ctg cgg cga cag gtc ttg gac ggc cgg caa 2064

Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln

675 680 685

ctg gca cta aaa gtg agt gcc aac tcc gta tat ggc ttc act ggt gcc 2112

Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala

690 695 700

cag gtg ggc aag ctg cca tgt ttg gag atc tcc cag agt gtc act ggg 2160

Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly

705 710 715 720

ttc ggg cgg cag atg att gag aaa acc aag cag ctt gtg gag tcc aag 2208

Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys

725 730 735

tac acc gtg gaa aat ggc tac gat gcc aac gcc aag gta gtc tac ggt 2256

Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly

740 745 750

gac acg gac tct gtg atg tgc cgg ttt ggc gtc tcc tct gtg gct gaa 2304

Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu

755 760 765

gca atg tct ctg ggg cgg gag gct gca aac tgg gta tcc agt cac ttc 2352

Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe

770 775 780

cca tca ccc atc cgg ctg gag ttc gag aag gtt tac ttc cca tac ctg 2400

Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu

785 790 795 800

ctc atc agc aag aag cgc tat gct ggc ctg ctc ttc tcc tcc cgc tct 2448

Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser

805 810 815

gat gcc cat gac aaa atg gac tgc aag ggc ctg gag gct gtg cgc agg 2496

Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg

820 825 830

gac aac tgt ccc ctg gtg gcc aac ctc gtt aca tcc tct ctg cgc cgg 2544

Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg

835 840 845

atc ctc gtg gac cgg gac cct gat ggg gca gta gcc cat gcc aag gac 2592

Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp

850 855 860

gtc atc tcg gac ctg ctg tgc aac cgc ata gac atc tcc cag ctg gtc 2640

Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val

865 870 875 880

atc acc aaa gag ttg acc cgc gca gca gca gac tat gct ggc aag cag 2688

Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln

885 890 895

gct cac gtg gag ctg gct gag agg atg agg aag cgc gac ccc ggc agt 2736

Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser

900 905 910

gcg ccc agc ctg ggt gac cga gtc ccc tat gtg atc att ggt gct gct 2784

Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala

915 920 925

aag ggt gtg gcc gcc tac atg aag tcg gag gac ccc ctg ttt gtg ctg 2832

Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu

930 935 940

gag cac agc ctg ccc atc gac act cag tac tac ctg gag cag cag ctg 2880

Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu

945 950 955 960

gcc aag ccg ctc ttg cgc atc ttt gag ccc atc ctg ggt gag ggc cgt 2928

Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg

965 970 975

gca gag tct gtg ctg ctg cgc ggt gac cac aca cga tgc aag act gtg 2976

Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val

980 985 990

ctc acc agc aag gtg ggc ggc ctc ttg gcc ttc acc aag cgc cgc aac 3024

Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn

995 1000 1005

tgt tgc att ggc tgc cgc tcc gta atc gac cat caa gga gcc gtg 3069

Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val

1010 1015 1020

tgt aag ttc tgt cag cca cgg gag tcg gag ctc tat cag aag gag 3114

Cys Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu

1025 1030 1035

gtg tca cac ctg aat gcc ttg gaa gaa cgg ttc tct cgc ctc tgg 3159

Val Ser His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp

1040 1045 1050

aca cag tgt caa cgc tgc cag ggc agc ttg cat gag gac gtc atc 3204

Thr Gln Cys Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile

1055 1060 1065

tgt acc agc cgt gac tgt ccc atc ttc tac atg cgc aag aag gtg 3249

Cys Thr Ser Arg Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val

1070 1075 1080

cgc aag gac ctg gaa gac cag gaa cgg ctg ctg cag cgc ttt gga 3294

Arg Lys Asp Leu Glu Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly

1085 1090 1095

ccg ccc ggc cct gag gcc tgg tga 3318

Pro Pro Gly Pro Glu Ala Trp

1100 1105

<210>89

<211>1105

<212>PRT

<213>小鼠(Mus musculus)

<400>89

Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys

1 5 10 15

Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln

20 25 30

Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg

35 40 45

Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val

50 55 60

Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro

65 70 75 80

Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln

85 90 95

Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Gly

100 105 110

Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val

115 120 125

Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro

130 135 140

Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser

145 150 155 160

Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly

165 170 175

Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser

180 185 190

Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu

195 200 205

Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu

210 215 220

Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala

225 230 235 240

Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala

245 250 255

Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val

260 265 270

Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val

275 280 285

Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg

290 295 300

Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg

305 310 315 320

Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys

325 330 335

Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala

340 345 350

Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser

355 360 365

Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu

370 375 380

Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Ala

385 390 395 400

Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe

405 410 415

Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser

420 425 430

Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser

435 440 445

Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu

450 455 460

His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu

465 470 475 480

Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln

485 490 495

Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys

500 505 510

Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val

515 520 525

Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu

530 535 540

Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln

545 550 555 560

Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Ser

565 570 575

Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr

580 585 590

Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile

595 600 605

Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala

610 615 620

Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr

625 630 635 640

Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln

645 650 655

Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu

660 665 670

Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln

675 680 685

Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala

690 695 700

Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly

705 710 715 720

Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys

725 730 735

Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly

740 745 750

Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu

755 760 765

Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe

770 775 780

Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu

785 790 795 800

Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser

805 810 815

Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg

820 825 830

Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg

835 840 845

Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp

850 855 860

Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val

865 870 875 880

Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln

885 890 895

Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser

900 905 910

Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala

915 920 925

Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu

930 935 940

Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu

945 950 955 960

Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg

965 970 975

Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val

980 985 990

Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn

995 1000 1005

Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val

1010 1015 1020

Cys Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu

1025 1030 1035

Val Ser His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp

1040 1045 1050

Thr Gln Cys Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile

1055 1060 1065

Cys Thr Ser Arg Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val

1070 1075 1080

Arg Lys Asp Leu Glu Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly

1085 1090 1095

Pro Pro Gly Pro Glu Ala Trp

1100 1105

<210>90

<211>3684

<212>DNA

<213>拟南芥(Arabidopsis thaliana)

<220>

<221>CDS

<222>(501)..(557)

<220>

<221>CDS

<222>(689)..(818)

<220>

<221>CDS

<222>(1008)..(1114)

<220>

<221>CDS

<222>(1194)..(1320)

<220>

<221>CDS

<222>(1469)..(1576)

<220>

<221>CDS

<222>(1671)..(1786)

<220>

<221>CDS

<222>(1858)..(1941)

<220>

<221>CDS

<222>(2040)..(2 108)

<220>

<221>CDS

<222>(2198)..(2269)

<220>

<221>CDS

<222>(2352)..(2443)

<220>

<221>CDS

<222>(2545)..(2672)

<220>

<221>CDS

<222>(2772)..(2873)

<220>

<221>CDS

<222>(2965)..(3032)

<220>

<221>CDS

<222>(3122)..(3181)

<400>90

agcgattcct tagcagaaag gcgctccatt tctctggcgt aaaccaaagg agatccttga 60

actgtttcct gcaccattgc tcttaaaacc cttctccggc acgaattctt ccaaccctgc 120

ttcaccaccg gaacattgag acaaaatctc gacggtgacg ctgaggttga aaaaaccaat 180

cgaaccgcag acgtaccagg aaccgaacca tgtatcaacg ccattgaaga agaagaagaa 240

gaagaaggtg aaaaacgaaa gattgagaat ttgtttgctt tgagcaacca aacctcagga 300

aaaaagagtt aaggtgggag tgtctggttc aaccggttta tatccggttc aaattaaacc 360

tcttacagtt aaccgggttt tgtgtttggt tcgattgttc ataaaagaaa gaagactctt 420

gtcgtcgatt agtgccaaag ttgaaagttg aaaccttttc tcagaatttt ctgctcagtt 480

ctgagttttt ttttcccgcc atg gaa atc gac tcc gag aaa att cac gaa agg 533

Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg

1 5 10

aag caa tcc gat tac aat tcg ctg gtacgaactc tattacttta tcgacttgta 587

Lys Gln Ser Asp Tyr Asn Ser Leu

15

gtgaaagaca aatgtaatca ttcgtggtgg tgactgtttc tacttataag tgtacgggct 647

agggtttgtt atctgattct gagtttttgc aattgaagca g gat gag aga ttc gag 703

Asp Glu Arg Phe Glu

20

ata cag aag gag atg tac aga ggt cag caa tac agt cag att tac ttt 751

Ile Gln Lys Glu Met Tyr Arg Gly Gln Gln Tyr Ser Gln Ile Tyr Phe

25 30 35 40

gct cgt ctt cat ctc atg aga aca ctt ctc tac tct ctt gct cct act 799

Ala Arg Leu His Leu Met Arg Thr Leu Leu Tyr Ser Leu Ala Pro Thr

45 50 55

tgg aaa tct cat ttg cct g gtcagtgctt ttgtttctct catatttagc 848

Trp Lys Ser His Leu Pro

60

acaacaacga agagcagttt ttgagaattt tcttgggtta gatataatta ggtgaaatca 908

gtgattttta gggatttttg ctatcttatg gattacagtt gagaaagatt gctagtattg 968

tttaaattat agatctgaat gtgaatttca tttttgcag tg tgt aag gtt ttg 1021

Val Cys Lys Val Leu

65

gga ctt gaa aaa gga aaa gaa tgc ata att gtg gga acc ttg ttc aaa 1069

Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr Leu Phe Lys

70 75 80

cac atg aag ctt aaa cct tgt gtt ctc gat gaa tat tct aaa gag 1114

His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser Lys Glu

85 90 95

gttggttttt attaacctct actgtttttt tgagctatgt ctatgctgaa tcaatctgag 1174

tatatttaac ataatgcag agg tca gtt act ccg ctt gtt aaa cca cat aac 1226

Arg Ser Val Thr Pro Leu Val Lys Pro His Asn

100 105

ttt atg cat cct gat gat aat ctg atc ctc gaa gac gag agt ggg aga 1274

Phe Met His Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu Ser Gly Arg

110 115 120 125

gtt aag ctt gct ggt tcc gca ctt tca cct gcg att tat gtg aca g 1320

Val Lys Leu Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr Val Thr

130 135 140

gtattgcaaa tgggttctta ctgtttttac tgtatgattt tttccttctt tacaatgtgg 1380

caaatcttag agattttgat caagctttcc tctcttaaaa gatgggttct ttaagaaaat 1440

taacgttgaa gcctcccgtg cattgtag gt gtt gtt gtt gca ctg cat ggg 1491

Gly Val Val Val Ala Leu His Gly

145

aag gaa act aat gct ggt gaa ttc ttt gtt gag gat gta cta gaa gct 1539

Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp Val Leu Glu Ala

150 155 160

ggt tta cca cct cag att gag cgg cct atc gat cta c gtaagtctag 1586

Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu

165 170 175

ctatgttctc ttccttttgc taacctcatg gctcaatcat ttctataagc aatctctcat 1646

gatacatcca tattgcatct gcag ag gaa gat aaa tat gtc gtg tta ttg 1696

Gln Glu Asp Lys Tyr Val Val Leu Leu

180 185

tcg ggc ctt tgt att gga agc aaa tcg gct aat ccc ctg cag ttt cag 1744

Ser Gly Leu Cys Ile Gly Ser Lys Ser Ala Asn Pro Leu Gln Phe Gln

190 195 200

ctt ctt gtt gac cat ata act ggg cat ctc gga gat gag gag 1786

Leu Leu Val Asp His Ile Thr Gly His Leu Gly Asp Glu Glu

205 210 215

gttcaaatct cttaacttgc aggttgttca acatatttct ttccttaatt tatactttat 1846

ggtttgaaca g gaa caa ggc ctt gca gca cag ata gtt cat gta gta att 1896

Glu Gln Gly Leu Ala Ala Gln Ile Val His Val Val Ile

220 225

gct gga aac tct ttt gaa ttt ccc cgc aaa ctc att aat ggc cag 1941

Ala Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile Asn Gly Gln

230 235 240

gtacttataa cttttgttgc tgatatattc tcagatacag ttccagtaat tatctgcccc 2001

agttatgtct tatgatcttt attggttgat ctttgtag aac ttg gcc tcg aaa gat 2057

Asn Leu Ala Ser Lys Asp

245

caa tcg aca ctg tat gag ccc atc aaa gag ctt gat atc atg tta agc 2105

Gln Ser Thr Leu Tyr Glu Pro Ile Lys Glu Leu Asp Ile Met Leu Ser

250 255 260 265

cag gtcagttaac tggatctacg tgtgtgttat cgatatctat tgagatgaaa 2158

Gln

gttcaaactc ctgttttttt ttttgtggat tgtttttag ata gct gca gga gtt 2212

Ile Ala Ala Gly Val

270

tca gta gat atc atg cca ggc acg aat gat cca gct aac ttc gca ttg 2260

Ser Val Asp Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu

275 280 285

cct cag cag gtctgcaaat acataagaaa cattcaaaat cccgcatttt 2309

Pro Gln Gln

290

gtatcgataa ctctgattca taggcccttc tcttttgttc ag cct ctg aat aga 2363

Pro Leu Asn Arg

tgt ctt ttc cct gga tct tca cct tat aac acc ttc aga tca tgt aca 2411

Cys Leu Phe Pro Gly Ser Ser Pro Tyr Asn Thr Phe Arg Ser Cys Thr

295 300 305 310

aat cct cac tca ttt gat gtc gat aat atc ag gtatgattat tattaatagt 2463

Asn Pro His Ser Phe Asp Val Asp Asn Ile Arg

315 320

tgaatacaat ctctctgatt ttacaacgat aaaattcttg ggtttatctg actgaaaacc 2523

tcatatgggg gcattttgca g a ttt ctt gga act tct ggt cag aac atc gat 2575

Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp

325 330

gac ctt ggc aag tac tca gag gct aag agc aag ctt gat ttt gtg gaa 2623

Asp Leu Gly Lys Tyr Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu

335 340 345

aga acg ctg agg tgg aga cat ctt gcc cca act gca cct aat aca ctc g 2672

Arg Thr Leu Arg Trp Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu

350 355 360

gtaagaattc tccttgccct gcaagattac ttttttgaac taagcccata aaaaaatgat 2732

cctttgagtt ctatttggtt ttgattcact tgcgtacag gt tgt tat cct ttc 2785

Gly Cys Tyr Pro Phe

365

acc gat aga gac cct ttc ttg att gaa acc tgc ccg cat gtc tac ttc 2833

Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe

370 375 380

gtc ggg aat caa gat aaa tat gac aac cgt ttg ata aag g gtaaaagcac 2883

Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys

385 390 395

cttacacaga gattagaaat aacattctct tttgtcaaac atcaggcttt aacttttctt 2943

gggtaaatat gaatgctgca g gg tca gaa ggg cag ctt gtc cgg ttg atc 2993

Gly Ser Glu Gly Gln Leu Val Arg Leu Ile

400 405

tgc att cct aag ttc tgt gag acc ggt att gct gtt gcg gtgagtttaa 3042

Cys Ile Pro Lys Phe Cys Glu Thr Gly Ile Ala Val Ala

410 415 420

aatttgagca gaatttgaga ccatttaccc tcatagattg cagattctaa atctcaaaat 3102

caccatgtct atttcgcag gtg aac cta aga aat ctg gaa tgt cac act tta 3154

Val Asn Leu Arg Asn Leu Glu Cys His Thr Leu

425 430

agc ttt agc act cag ata aac caa tca taacattgag ttgctacttt 3201

Ser Phe Ser Thr Gln Ile Asn Gln Ser

435 440

ggtagattat ttcctgtctt gaagatgtaa tgttgagctt tttcagtaac acactcctat 3261

gttctaacca aatgtttgtt aaaaatcctt tttcttgagt ggaacttcca aatctttgga 3321

tatattggta atgctcattg ttttgtccta attttctaaa aatctcgaca cgagttctta 3381

ggtagtcaca taaaggacaa aaagggccga ccagatagtg tcgtggtcgt tggtcagaag 3441

aacgtgaaaa gactgcaaaa ataatcttaa aaaaagcaac aagtgcacag aatctcatgc 3501

aaatgtctct ctctctcttc tcaacggcta tatccatcca cacttattac attataaaat 3561

taattaaatg caataatgta acgcattata ttctccaacg gtccattttc ccgcatttcc 3621

ctaacctttc ctttataacg caaaacagtt tcatcttcta cacttaacac tttaatcctc 3681

tct 3684

<210>91

<211>440

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>91

Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg Lys Gln Ser Asp Tyr

1 5 10 15

Asn Ser Leu Asp Glu Arg Phe Glu Ile Gln Lys Glu Met Tyr Arg Gly

20 25 30

Gln Gln Tyr Ser Gln Ile Tyr Phe Ala Arg Leu His Leu Met Arg Thr

35 40 45

Leu Leu Tyr Ser Leu Ala Pro Thr Trp Lys Ser His Leu Pro Val Cys

50 55 60

Lys Val Leu Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr

65 70 75 80

Leu Phe Lys His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser

85 90 95

Lys Glu Arg Ser Val Thr Pro Leu Val Lys Pro His Asn Phe Met His

100 105 110

Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu Ser Gly Arg Val Lys Leu

115 120 125

Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr Val Thr Gly Val Val Val

130 135 140

Ala Leu His Gly Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp

145 150 155 160

Val Leu Glu Ala Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu

165 170 175

Gln Glu Asp Lys Tyr Val Val Leu Leu Ser Gly Leu Cys Ile Gly Ser

180 185 190

Lys Ser Ala Asn Pro Leu Gln Phe Gln Leu Leu Val Asp His Ile Thr

195 200 205

Gly His Leu Gly Asp Glu Glu Glu Gln Gly Leu Ala Ala Gln Ile Val

210 215 220

His Val Val Ile Ala Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile

225 230 235 240

Asn Gly Gln Asn Leu Ala Ser Lys Asp Gln Ser Thr Leu Tyr Glu Pro

245 250 255

Ile Lys Glu Leu Asp Ile Met Leu Ser Gln Ile Ala Ala Gly Val Ser

260 265 270

Val Asp Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu Pro

275 280 285

Gln Gln Pro Leu Asn Arg Cys Leu Phe Pro Gly Ser Ser Pro Tyr Asn

290 295 300

Thr Phe Arg Ser Cys Thr Asn Pro His Ser Phe Asp Val Asp Asn Ile

305 310 315 320

Arg Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp Asp Leu Gly Lys Tyr

325 330 335

Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu Arg Thr Leu Arg Trp

340 345 350

Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu Gly Cys Tyr Pro Phe

355 360 365

Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe

370 375 380

Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys Gly Ser Glu

385 390 395 400

Gly Gln Leu Val Arg Leu Ile Cys Ile Pro Lys Phe Cys Glu Thr Gly

405 410 415

Ile Ala Val Ala Val Asn Leu Arg Asn Leu Glu Cys His Thr Leu Ser

420 425 430

Phe Ser Thr Gln Ile Asn Gln Ser

435 440

<210>92

<211>3684

<212>DNA

<213>拟南芥(Arabidopsis thaliana)

<220>

<221>CDS

<222>(501)..(557)

<220>

<221>CDS

<222>(689)..(818)

<220>

<221>CDS

<222>(1008)..(1114)

<220>

<221>CDS

<222>(1194)..(1320)

<220>

<221>CDS

<222>(1469)..(1576)

<220>

<221>CDS

<222>(1671)..(1786)

<220>

<221>CDS

<222>(1858)..(1941)

<220>

<221>CDS

<222>(2040)..(2 108)

<220>

<221>CDS

<222>(2198)..(2269)

<220>

<221>CDS

<222>(2352)..(2443)

<220>

<221>CDS

<222>(2545)..(2672)

<220>

<221>CDS

<222>(2772)..(2873)

<220>

<221>CDS

<222>(2965)..(3032)

<220>

<221>CDS

<222>(3122)..(3181)

<400>92

agcgattcct tagcagaaag gcgctccatt tctctggcgt aaaccaaagg agatccttga 60

actgtttcct gcaccattgc tcttaaaacc cttctccggc acgaattctt ccaaccctgc 120

ttcaccaccg gaacattgag acaaaatctc gacggtgacg ctgaggttga aaaaaccaat 180

cgaaccgcag acgtaccagg aaccgaacca tgtatcaacg ccattgaaga agaagaagaa 240

gaagaaggtg aaaaacgaaa gattgagaat ttgtttgctt tgagcaacca aacctcagga 300

aaaaagagtt aaggtgggag tgtctggttc aaccggttta tatccggttc aaattaaacc 360

tcttacagtt aaccgggttt tgtgtttggt tcgattgttc ataaaagaaa gaagactctt 420

gtcgtcgatt agtgccaaag ttgaaagttg aaaccttttc tcagaatttt ctgctcagtt 480

ctgagttttt ttttcccgcc atg gaa atc gac tcc gag aaa att cac gaa agg 533

Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg

1 5 10

aag caa tcc gat tac aat tcg ctg gtacgaactc tattacttta tcgacttgta 587

Lys Gln Ser Asp Tyr Asn Ser Leu

15

gtgaaagaca aatgtaatca ttcgtggtgg tgactgtttc tacttataag tgtacgggct 647

agggtttgtt atctgattct gagtttttgc aattgaagca g gat gag aga ttc gag 703

Asp Glu Arg Phe Glu

20

ata cag aag gag atg tac aga ggt cag caa tac agt cag att tac ttt 751

Ile Gln Lys Glu Met Tyr Arg Gly Gln Gln Tyr Ser Gln Ile Tyr Phe

25 30 35 40

gct cgt ctt cat ctc atg aga aca ctt ctc tac tct ctt gct cct act 799

Ala Arg Leu His Leu Met Arg Thr Leu Leu Tyr Ser Leu Ala Pro Thr

45 50 55

tgg aaa tct cat ttg cct g gtcagtgctt ttgtttctct catatttagc 848

Trp Lys Ser His Leu Pro

60

acaacaacga agagcagttt ttgagaattt tcttgggtta gatataatta ggtgaaatca 908

gtgattttta gggatttttg ctatcttatg gattacagtt gagaaagatt gctagtattg 968

tttaaattat agatctgaat gtgaatttca tttttgcag tg tgt aag gtt ttg 1021

Val Cys Lys Val Leu

65

gga ctt gaa aaa gga aaa gaa tgc ata att gtg gga acc ttg ttc aaa 1069

Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr Leu Phe Lys

70 75 80

cac atg aag ctt aaa cct tgt gtt ctc gat gaa tat tct aaa gag 1114

His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser Lys Glu

85 90 95

gttggttttt attaacctct actgtttttt tgagctatgt ctatgctgaa tcaatctgag 1174

tatatttaac ataatgcag agg tca gtt act ccg ctt gtt aaa cca cat aac 1226

Arg Ser Val Thr Pro Leu Val Lys Pro His Asn

100 105

ttt atg cat cct gat gat aat ctg atc ctc gaa gac gag agt ggg aga 1274

Phe Met His Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu Ser Gly Arg

110 115 120 125

gtt aag ctt gct ggt tcc gca ctt tca cct gcg att tat gtg aca g 1320

Val Lys Leu Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr Val Thr

130 135 140

gtattgcaaa tgggttctta ctgtttttac tgtatgattt tttccttctt tacaatgtgg 1380

caaatcttag agattttgat caagctttcc tctcttaaaa gatgggttct ttaagaaaat 1440

taacgttgaa gcctcccgtg cattgtag gt gtt gtt gtt gca ctg cat ggg 1491

Gly Val Val Val Ala Leu His Gly

145

aag gaa act aat gct ggt gaa ttc ttt gtt gag gat gta cta gaa gct 1539

Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp Val Leu Glu Ala

150 155 160

ggt tta cca cct cag att gag cgg cct atc gat cta c gtaagtctag 1586

Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu

165 170 175

ctatgttctc ttccttttgc taacctcatg gctcaatcat ttctataagc aatctctcat 1646

gatacatcca tattgcatct gcag ag gaa gat aaa tat gtc gtg tta ttg 1696

Gln Glu Asp Lys Tyr Val Val Leu Leu

180 185

tcg ggc ctt tgt att gga agc aaa tcg gct aat ccc ctg cag ttt cag 1744

Ser Gly Leu Cys Ile Gly Ser Lys Ser Ala Asn Pro Leu Gln Phe Gln

190 195 200

ctt ctt gtt gac cat ata act ggg cat ctc gga gat gag gag 1786

Leu Leu Val Asp His Ile Thr Gly His Leu Gly Asp Glu Glu

205 210 215

gttcaaatct cttaacttgc aggttgttca acatatttct ttccttaatt tatactttat 1846

ggtttgaaca g gaa caa ggc ctt gca gca cag ata gtt cat gta gta att 1896

Glu Gln Gly Leu Ala Ala Gln Ile Val His Val Val Ile

220 225

gct gga aac tct ttt gaa ttt ccc cgc aaa ctc att aat ggc cag 1941

Ala Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile Asn Gly Gln

230 235 240

gtacttataa cttttgttgc tgatatattc tcagatacag ttccagtaat tatctgcccc 2001

agttatgtct tatgatcttt attggttgat ctttgtag aac ttg gcc tcg aaa gat 2057

Asn Leu Ala Ser Lys Asp

245

caa tcg aca ctg tat gag ccc atc aaa gag ctt gat atc atg tta agc 2105

Gln Ser Thr Leu Tyr Glu Pro Ile Lys Glu Leu Asp Ile Met Leu Ser

250 255 260 265

cag gtcagttaac tggatctacg tgtgtgttat cgatatctat tgagatgaaa 2158

Gln

gttcaaactc ctgttttttt ttttgtggat tgtttttag ata gct gca gga gtt 2212

Ile Ala Ala Gly Val

270

tca gta gat atc atg cca ggc acg aat gat cca gct aac ttc gca ttg 2260

Ser Val Asp Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu

275 280 285

cct cag cag gtctgcaaat acataagaaa cattcaaaat cccgcatttt 2309

Pro Gln Gln

290

gtatcgataa ctctgattca taggcccttc tcttttgttc ag cct ctg aat aga 2363

Pro Leu Asn Arg

tgt ctt ttc cct gga tct tca cct tat aac acc ttc aga tca tgt aca 2411

Cys Leu Phe Pro Gly Ser Ser Pro Tyr Asn Thr Phe Arg Ser Cys Thr

295 300 305 310

aat cct cac tca ttt gct gtc gat aat atc ag gtatgattat tattaatagt 2463

Asn Pro His Ser Phe Ala Val Asp Asn Ile Arg

315 320

tgaatacaat ctctctgatt ttacaacgat aaaattcttg ggtttatctg actgaaaacc 2523

tcatatgggg gcattttgca g a ttt ctt gga act tct ggt cag aac atc gat 2575

Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp

325 330

gac ctt ggc aag tac tca gag gct aag agc aag ctt gat ttt gtg gaa 2623

Asp Leu Gly Lys Tyr Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu

335 340 345

aga acg ctg agg tgg aga cat ctt gcc cca act gca cct aat aca ctc g 2672

Arg Thr Leu Arg Trp Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu

350 355 360

gtaagaattc tccttgccct gcaagattac ttttttgaac taagcccata aaaaaatgat 2732

cctttgagtt ctatttggtt ttgattcact tgcgtacag gt tgt tat cct ttc 2785

Gly Cys Tyr Pro Phe

365

acc gat aga gac cct ttc ttg att gaa acc tgc ccg cat gtc tac ttc 2833

Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe

370 375 380

gtc ggg aat caa gat aaa tat gac aac cgt ttg ata aag g gtaaaagcac 2883

Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys

385 390 395

cttacacaga gattagaaat aacattctct tttgtcaaac atcaggcttt aacttttctt 2943

gggtaaatat gaatgctgca g gg tca gaa ggg cag ctt gtc cgg ttg atc 2993

Gly Ser Glu Gly Gln Leu Val Arg Leu Ile

400 405

tgc att cct aag ttc tgt gag acc ggt att gct gtt gcg gtgagtttaa 3042

Cys Ile Pro Lys Phe Cys Glu Thr Gly Ile Ala Val Ala

410 415 420

aatttgagca gaatttgaga ccatttaccc tcatagattg cagattctaa atctcaaaat 3102

caccatgtct atttcgcag gtg aac cta aga aat ctg gaa tgt cac act tta 3154

Val Asn Leu Arg Asn Leu Glu Cys His Thr Leu

425 430

agc ttt agc act cag ata aac caa tca taacattgag ttgctacttt 3201

Ser Phe Ser Thr Gln Ile Asn Gln Ser

435 440

ggtagattat ttcctgtctt gaagatgtaa tgttgagctt tttcagtaac acactcctat 3261

gttctaacca aatgtttgtt aaaaatcctt tttcttgagt ggaacttcca aatctttgga 3321

tatattggta atgctcattg ttttgtccta attttctaaa aatctcgaca cgagttctta 3381

ggtagtcaca taaaggacaa aaagggccga ccagatagtg tcgtggtcgt tggtcagaag 3441

aacgtgaaaa gactgcaaaa ataatcttaa aaaaagcaac aagtgcacag aatctcatgc 3501

aaatgtctct ctctctcttc tcaacggcta tatccatcca cacttattac attataaaat 3561

taattaaatg caataatgta acgcattata ttctccaacg gtccattttc ccgcatttcc 3621

ctaacctttc ctttataacg caaaacagtt tcatcttcta cacttaacac tttaatcctc 3681

tct 3684

<210>93

<211>440

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>93

Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg Lys Gln Ser Asp Tyr

1 5 10 15

Asn Ser Leu Asp Glu Arg Phe Glu Ile Gln Lys Glu Met Tyr Arg Gly

20 25 30

Gln Gln Tyr Ser Gln Ile Tyr Phe Ala Arg Leu His Leu Met Arg Thr

35 40 45

Leu Leu Tyr Ser Leu Ala Pro Thr Trp Lys Ser His Leu Pro Val Cys

50 55 60

Lys Val Leu Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr

65 70 75 80

Leu Phe Lys His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser

85 90 95

Lys Glu Arg Ser Val Thr Pro Leu Val Lys Pro His Asn Phe Met His

100 105 110

Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu Ser Gly Arg Val Lys Leu

115 120 125

Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr Val Thr Gly Val Val Val

130 135 140

Ala Leu His Gly Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp

145 150 155 160

Val Leu Glu Ala Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu

165 170 175

Gln Glu Asp Lys Tyr Val Val Leu Leu Ser Gly Leu Cys Ile Gly Ser

180 185 190

Lys Ser Ala Asn Pro Leu Gln Phe Gln Leu Leu Val Asp His Ile Thr

195 200 205

Gly His Leu Gly Asp Glu Glu Glu Gln Gly Leu Ala Ala Gln Ile Val

210 215 220

His Val Val Ile Ala Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile

225 230 235 240

Asn Gly Gln Asn Leu Ala Ser Lys Asp Gln Ser Thr Leu Tyr Glu Pro

245 250 255

Ile Lys Glu Leu Asp Ile Met Leu Ser Gln Ile Ala Ala Gly Val Ser

260 265 270

Val Asp Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu Pro

275 280 285

Gln Gln Pro Leu Asn Arg Cys Leu Phe Pro Gly Ser Ser Pro Tyr Asn

290 295 300

Thr Phe Arg Ser Cys Thr Asn Pro His Ser Phe Ala Val Asp Asn Ile

305 310 315 320

Arg Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp Asp Leu Gly Lys Tyr

325 330 335

Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu Arg Thr Leu Arg Trp

340 345 350

Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu Gly Cys Tyr Pro Phe

355 360 365

Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe

370 375 380

Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys Gly Ser Glu

385 390 395 400

Gly Gln Leu Val Arg Leu Ile Cys Ile Pro Lys Phe Cys Glu Thr Gly

405 410 415

Ile Ala Val Ala Val Asn Leu Arg Asn Leu Glu Cys His Thr Leu Ser

420 425 430

Phe Ser Thr Gln Ile Asn Gln Ser

435 440

<210>94

<211>454

<212>DNA

<213>小鼠(Mus musculus)

<400>94

ctgcagagga ttttccacag tataattaga gattggatgt ggggaagaat tatgtttttt 60

tttttctttt tggtaatctt atggttgggt atgctttatt ttctaattga tttgaaagag 120

gatatagaaa caaaagacag gagaaaaata atctggcctt ctgatactta tttgaaggct 180

ttctaatttc ccaactctaa ccccaagctc tccgttttac tgtttagtat tctaggctgg 240

cagtttgagt ctgtaccagg caaaaaacgt tccaaatcaa gatagacagg atggagaacc 300

aatcacagag ctggatttcc tttcaaattc taccaatggc tattgtgcag gagactttga 360

actcacaaag aaaggcgggg ccaagactta agcgttaaaa atcaccacca agccagcctc 420

ccagcagcag taaagaggct gttgtgcata ccat 454

<210>95

<211>5725

<212>DNA

<213>小鼠(Mus musculus)

<400>95

agtggttgtg ggagacttac cgtcctcttg tctctggaga gtgccttcta ccatgtcatc 60

agaagggctg tcatcttggt ccccgatttc ttccacatca ttgtcctgag catcagcagc 120

gtctccaatg gggcagttta atttgaggca atacttactc ttcaactggc cgttactttc 180

acctggacta gacacatcgc gcttctgaga acacacttta tccaaaaacc ggataccgaa 240

atcctgcccg gactacatca tcaagttgat gtcctccttt ttcacgaaaa tctttgtggt 300

gtacctgtag ttcagcacct cttcaaatat gtgggagcag atgaaatcta tctctatgat 360

ggacaagctg tccagttcta gcttcttgaa aagtttcttt tttttttctt tcaatttttt 420

attaggtatt tagctcattt acatttccaa tgctatacca aaagtccccc atacccaccc 480

acccccactc ccctacccgc tcactccacc tttttggccc tggcgttccc ctgttctggg 540

gcatataaag tttgtgtgtc caatgggcct ctctttccag tgatggccga ctaggccatc 600

ttttgataca tatgcagcta gagtcaagag ctccggggta ctggttagtt cataatgttg 660

atccacctat agggttgcag atccctttag ctccttgggt actttctcta gctcctccat 720

tgggagccct gtgatccatc cattagctga ctgtgggcat ccacttctgt gtttgctagg 780

ccccggcata gtctcacaag agacagctac atctgggtcc tttcgataaa atcttgctag 840

tgtatgcaat ggtgtcagcg tttggatgct gattatgggg tggatccctg gataaggcag 900

tctctacatg gtccatcctt tcatctcagc tccaaacttt gtctctgtaa ctccttccaa 960

gggtgttttg ttcccacttc taaggagggg catagtgtcc acacttcagt cttctttttt 1020

catgagtttc atgtgtttag gaaattgtat cttatatctt gggtatccta ggttttgggc 1080

taatatccac ttatcagcga gtacatattg tgtgagttcc tttgtgaatg tgttacctca 1140

ctcaggaaga tgccctccag gtccatccat ttggctagga atttcataaa ttcattcttt 1200

ttaatagctg agtagtactc cattgtgtag atgtaccaca ttttctgtat ccattcctct 1260

gttgaggggc atctgggttc tttccagctt ctggctatta taaataaggc tgctatgaac 1320

atagtggagc atgtgtcctt cttaccagtt ggggcatctc ctggatatat gcccaggaga 1380

ggtattcctg gatcctccgg tagtactatg tccaattttc taaggaaccg ccagatggat 1440

ttccagagtg gttgtacaag cctgcaatcc caccaacaat ggaggagtgt tcctctttct 1500

ccacatcctc gccagcatct gctgtcacct gaatttttga tcttagccat tctgactggt 1560

gtgaggtgga atctcagggt tgttttgatt tgcatttccc tgatgattaa ggatgttgaa 1620

cattttttca ggtgcttctc tgccattcgg tattcctcag gtgagaattc tttgttcagt 1680

tctgagcccc atttttttaa tggggttatt tgattttctg aagtccacct tcttgagttc 1740

tttatatatg ttggatatta gtcccctatc tgatttagga taggtaaaga tcctttccca 1800

atctgttggt ggtctctttg tcttattgac agtgtctttt gccttgcaga aactttggag 1860

tttcattagg tcccatttgt caattctcga tcttacagca caagccattg ctgttctgtt 1920

caggaatttt tcccctgtgc ccatatcttc aaggcttttc cccactttct cctctataag 1980

tttcagtgtc tctggtttta tgtgaagttc tttgatccat ttagatttga ccttagtaca 2040

aggagataag tatggatcga ttcgcattct tctacatgat aacaaccagt tgtgccagca 2100

ccatttgttg aaaatgctgt ctttcttcca ctggatggtt ttagctccct tgtcgaagat 2160

caagtgacca taggtgtgtg ggttcatttc tgggtcttca attctattcc attggtctac 2220

ttgtctgtct ctataccagt accatgcagt ttttaccaca attgctctgt agtaaagctt 2280

taggtcaggc atggtgattc caccagaggt tcttttatcc ttgagaagag tttttgctat 2340

cctaggtttt ttgttattcc agatgaattt gcaaattgct ccttctaatt cgttgaagaa 2400

ttgagttgga attttgatgg ggattgcatt gaatctgtag attgcttttg gcaagatagc 2460

catttttaca atattgatcc tgccaatcca tgagcatggg agatctttcc atcttctgag 2520

atcttcttta atttctttct tcagagactt gaagttttta tcatacatat ctttcacttc 2580

ctcagttaga gtcacgccga gatattttat attatttgtg actattgaga agggtgttgt 2640

ttccctaatt tctttctcag actgtttatt ctttgtgtag agaaaggcca ttgacttgtt 2700

tgagttaatt ttatatccag ctacttcacc aaagctgttt atcaggttta ggagttctct 2760

ggtggaattt ttagggtcac ttatatatac tatcatatca tctgcgaaaa gtgatatttt 2820

gacttcctct tttccaattt gtatcccctt gatctccttt tgttgtcgaa ttgctcagca 2880

ctgcagtatt cttaacaaag ttgattctca ttagaaaata aagctgccat atgaccatct 2940

aacacttagt aactgggaaa atttgatttg atctggtgat ttgtcacagc aataacaaag 3000

taactatcac aatggctgaa acaagtctgc tcacttggaa tcaacacttt ttgtcccagg 3060

agcaacagag tcttcagtat caggggccta aatttagaga tgaaggtttg gacctgtagc 3120

ctgaacctct tgcagaagtg atgtattaaa aggctgatca acaatggtcg ctacaagagt 3180

actccaggcc agccaatcca acaagcccaa taccttgaag gatgaaaccc atgcccaaga 3240

tcacttcctg tgcctggtgg ctgggcctct actgagtgcc acaaagtaga agaaaaaact 3300

ctagatgcta gtgttcctct aagcatgaat aactgatata tattcatgct gctctacctc 3360

agatattcag acttttcccc ctggttttca gtaaatcaag ttggatcact ccactcttct 3420

ctctcctcct cttctcattt cctctgttca gcctcccctc ccagattctc cagtctgacc 3480

acgtttctaa acagtttgct aatttatctt ggcagctgag gcagctatgg gagccacagc 3540

aggcagagag cacaggagac tcagggttct cagcagggct ctcagcaggg ctctcagcag 3600

ggctgttgtg ggtgatcctt ggattctcta tcctccagga acagtttcac tgttccagaa 3660

gatggtgatg attctgacga ctgagatgca cgtgtggtgg tgtctctgga ggctaaagtg 3720

caggtgccaa gtggttccaa atagctgggt gcagtttgtc tcaggggcac ctctagaggg 3780

tcagcctgtt tctttcagcc tctagagggc agagatgagt cccagacctt gctctctaca 3840

ttatcctagc ctttctgtgc cctttgtgag gcgcctgcag ttaagaacgt gtccagcagg 3900

gggcgcagtg tacatgggtg ttctccagta acagtcttgg ctgggaagga gagctagatt 3960

ccaggttctt aaaatactgt tttcctgtac atacctaagt aatctttaca ttggaaaaca 4020

aacaaatagt aaagctctgt tgttgttgtt gataagtagc aaattaattt agggggagca 4080

gtttgggggg ctgatgggtc ttgttctgcc attcaggctg ggctgaagct cctagggtct 4140

gaagatgctc ctgtctcaga ctccaaagca tgggactgca tacagaagcg tgcaacagtg 4200

ctaggcttcc aatcaggttt cacattttgc ttctagacag aaatataatt tcctgaaacc 4260

tttcgttttg aaatgatgtc attattgggc ccccgcactc attgctgctg acgcccccct 4320

cccactatcc ctcgggctga aatgtcctga ttgggtgtca acgctcattt gcactgatgc 4380

tcccccctta atccctggag ctgaaatgtc ctgattgggt gccaaaattt tttccactga 4440

tgcctctccc atcccattag cactaggact gaaatgtcat gattgggcgc aaaaactaat 4500

ttccaattat gcccggcccc tccgattatc cctggtgctg agatgtcatg attggggcca 4560

acactcattt ctgctgatgg ccctcctctc ccattagacc tggacctgaa tccgtgtcat 4620

gattggacgc caacactcat ttccactgat gccccggccc tcccattagt cctgaggctg 4680

aacccctgtc atgattgggc tccaatcctc atttcaggtg atgctcagct cctcccatca 4740

gccctgtggc tgaatctctg tcacgattgg gccccaaccc tcatttctgc tgaggcccag 4800

cccctcccat tagccctggg gctgcatccc tgtcaccact agacaccaac actcatttct 4860

gctgatgccc cgcccatgcc attacccttg ggcctaaatc cctgtcatga ttgaactcca 4920

acccacattt ctcctgatac cctgactccc attatcctta ggcttaatcc gtgtcataat 4980

tgggcgccaa cactgatttc ctctgatgcc ctgcccctcc cattagcccg ggactgaatc 5040

cctgtcataa ttggacttga accctcattt ttgctgaggc ccagcgcctc ccatttgtcc 5100

tcgggctgat ccctgtcatg attgggcccc aaccctcatt tcggctgagg ccccactcct 5160

ccaattagcc ctgaggctga atccatgtca tgagtaggca ccaactctca ttaacactga 5220

tgcgctgccc cttacattag ccctggggct gaatccctgt catgattggg ccccaacact 5280

catttctgct gatggccctc ctctcccatt agacctgagg ctgaatccgt gtcatgattg 5340

ggcaccaaac cgcaattcca ctaaagcccc acccctccca ttaccatcct gccgaaacca 5400

tgtcttgtca tgattgggcc ccaaccctcc tttccactga tgcccccccc tcccttaagc 5460

cctcctgctg agaccacatc ttgattgggc actaacactc atttccgctg atgcccacca 5520

ctcccatttg ccctgggact taaaccctgt cgtgattggg tgtcaaccct catttccggt 5580

gatgccccgc ctcttcctat aaatcctggc gctcaaatac tgtggtcggt gggcaggaac 5640

agccatttgg atcactgcct gcagcctagc ggttgagctg ctctggcgat catctgttct 5700

gaggtacttt gggactgtgg gactg 5725

Claims

1.调节细胞的遗传性状的转化率的方法，包括下述步骤：

(a)调节细胞的基因复制的倾向于错误的频率。

2.根据权利要求1的方法，其中存在至少2种在基因复制中起作用的倾向于错误的频率的试剂。

3.根据权利要求2的方法，其中至少约30％的倾向于错误的频率的试剂具有更少的倾向于错误的频率。

4.根据权利要求1的方法，其中在基因复制中起作用的试剂具有不同的倾向于错误的频率。

5.根据权利要求1的方法，其中具有更少的倾向于错误的频率的试剂基本上是无错误的。

6.根据权利要求2的方法，其中该倾向于错误的频率彼此存在至少101的不同。

7.根据权利要求2的方法，其中该倾向于错误的频率彼此存在至少102的不同。

8.根据权利要求2的方法，其中该倾向于错误的频率彼此存在至少103的不同。

9.根据权利要求1的方法，其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的试剂的倾向于错误的频率：能去除异常碱基的修复试剂和能修复错配的碱基对的修复试剂，该试剂存在于细胞中。

10.根据权利要求1的方法，其中调节倾向于错误的频率的步骤包含提供细胞中的双链基因组DNA的一条链和另一条链之间的错误数目的差异。

11.根据权利要求1的方法，其中调节倾向于错误的频率的步骤包含调节细胞的DNA聚合酶的倾向于错误的频率。

12.根据权利要求11的方法，其中该DNA聚合酶具有校对功能。

13.根据权利要求11的方法，其中该DNA聚合酶包含至少一种选自下述的聚合酶：真核细胞的DNA聚合酶α、DNA聚合酶β、DNA聚合酶γ、DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。

14.根据权利要求1的方法，其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的聚合酶的校对活性：真核细胞的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。

15.根据权利要求1的方法，其中调节倾向于错误的频率包含调节原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的校对活性。

16.根据权利要求1的方法，其中调节倾向于错误的频率包含将DNA聚合酶变体导入细胞中。

17.根据权利要求16的方法，其中通过选自同源重组和使用基因导入或质粒的转化的方法，将DNA聚合酶变体导入细胞中。

18.根据权利要求1的方法，其中调节倾向于错误的频率包含导入原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体。

19.根据权利要求18的方法，其中该原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体包含缺失了其校对活性的突变。

20.根据权利要求1的方法，其中调节倾向于错误的频率的步骤包含将倾向于错误的频率提高到高于野生型细胞的频率。

21.根据权利要求12的方法，其中该DNA聚合酶的校对功能低于野生型DNA聚合酶。

22.根据权利要求12的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，至少1个错配的碱基的数目比野生型DNA聚合酶至少大1。

23.根据权利要求12的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基。

24.根据权利要求12的方法，其中该DNA聚合酶的校对功能能提供至少2个错配的碱基。

25.根据权利要求12的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，其比率为10^-6。

26.根据权利要求12的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，其比率为10^-3。

27.根据权利要求12的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，其比率为10^-2。

28.根据权利要求1的方法，其中该细胞是革兰氏阳性的或真核的细胞。

29.根据权利要求1的方法，其中该细胞是真核细胞。

30.根据权利要求1的方法，其中该细胞是单细胞的或多细胞的生物。

31.根据权利要求1的方法，其中该细胞是动物、植物、真菌或酵母细胞。

32.根据权利要求1的方法，其中该细胞是哺乳动物细胞。

33.根据权利要求1的方法，其中在遗传性状转化后，该细胞基本上具有与野生型细胞相同的生长。

34.根据权利要求1的方法，其中该细胞天然地具有至少2种聚合酶。

35.根据权利要求1的方法，其中该细胞天然地具有至少2种聚合酶，这至少2种聚合酶具有不同的倾向于错误的频率。

36.根据权利要求1的方法，其中该细胞具有至少2种聚合酶，这至少2种聚合酶中的一种参与后随链的倾向于错误的频率，且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。

37.根据权利要求1的方法，其中该细胞具有对环境的抗性，且转化之前的细胞不具有该抗性。

38.根据权利要求37的方法，其中作为参数的环境包含至少一种选自下述的因素：温度，湿度，pH，盐浓度，营养物，金属，气体，有机溶剂，压力，大气压力，粘度，流速，光强度，光波长，电磁波，辐射，重力，张力，声波，该细胞以外的细胞，化学试剂，抗生素，天然物质，心理应激和机体应激，或其组合。

39.根据权利要求1的方法，其中该细胞包括癌细胞。

40.根据权利要求1的方法，其中该细胞构成组织。

41.根据权利要求1的方法，其中该细胞构成生物。

42.根据权利要求1的方法，还包括：

在转化细胞的遗传性状后，使细胞分化成组织或生物。

43.根据权利要求1的方法，其中在预定条件下调节倾向于错误的频率。

44.根据权利要求43的方法，其中通过调节至少一种选自下述的因素来调节倾向于错误的频率：温度，湿度，pH，盐浓度，营养物，金属，气体，有机溶剂，压力，大气压力，粘度，流速，光强度，光波长，电磁波，辐射，重力，张力，声波，该细胞以外的细胞，化学试剂，抗生素，天然物质，心理应激和机体应激，或其组合。

(a)调节细胞的基因复制的倾向于错误的频率；和

(b)繁殖得到的细胞。

46.根据权利要求45的方法，还包括：

筛选具有需要的性状的繁殖细胞。

47.根据权利要求45的方法，其中存在至少2种在基因复制中起作用的倾向于错误的频率的试剂。

48.根据权利要求45的方法，其中至少约30％的倾向于错误的频率的试剂具有更少的倾向于错误的频率。

49.根据权利要求45的方法，其中在基因复制中起作用的试剂具有不同的倾向于错误的频率。

50.根据权利要求45的方法，其中具有更低的倾向于错误的频率的试剂基本上是无错误的。

51.根据权利要求45的方法，其中该倾向于错误的频率彼此存在至少101的不同。

52.根据权利要求45的方法，其中该倾向于错误的频率彼此存在至少102的不同。

53.根据权利要求45的方法，其中该倾向于错误的频率彼此存在至少103的不同。

54.根据权利要求45的方法，其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的试剂的倾向于错误的频率：能去除异常碱基的修复试剂和能修复错配的碱基对的修复试剂，该试剂存在于细胞中。

55.根据权利要求45的方法，其中调节倾向于错误的频率的步骤包含提供细胞中的双链基因组DNA的一条链和另一条链之间的错误数目的差异。

56.根据权利要求45的方法，其中调节倾向于错误的频率的步骤包含调节细胞的DNA聚合酶的倾向于错误的频率。

57.根据权利要求56的方法，其中该DNA聚合酶具有校对功能。

58.根据权利要求56的方法，其中该DNA聚合酶包含至少一种选自下述的聚合酶：真核细胞的DNA聚合酶α、DNA聚合酶β、DNA聚合酶γ、DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。

59.根据权利要求45的方法，其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的聚合酶的校对活性：真核细胞的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。

60.根据权利要求45的方法，其中调节倾向于错误的频率包含调节原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的校对活性。

61.根据权利要求45的方法，其中调节倾向于错误的频率包含将DNA聚合酶变体导入细胞中。

62.根据权利要求61的方法，其中通过选自同源重组和使用基因导入或质粒的转化的方法，将DNA聚合酶变体导入细胞中。

63.根据权利要求45的方法，其中调节倾向于错误的频率包含导入原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体。

64.根据权利要求63的方法，其中该原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体包含仅仅缺失了其校对活性的突变。

65.根据权利要求45的方法，其中调节倾向于错误的频率的步骤包含将倾向于错误的频率提高到高于野生型细胞的频率。

66.根据权利要求57的方法，其中该DNA聚合酶的校对功能低于野生型DNA聚合酶。

67.根据权利要求57的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，至少1个错配的碱基的数目比野生型DNA聚合酶至少大1。

68.根据权利要求57的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基。

69.根据权利要求57的方法，其中该DNA聚合酶的校对功能能提供至少2个错配的碱基。

70.根据权利要求57的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，其比率为10^-6。

71.根据权利要求57的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，其比率为10^-3。

72.根据权利要求57的方法，其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基，其比率为10^-2。

73.根据权利要求45的方法，其中该细胞是革兰氏阳性的或真核的细胞。

74.根据权利要求45的方法，其中该细胞是真核细胞。

75.根据权利要求45的方法，其中该细胞是单细胞的或多细胞的生物。

76.根据权利要求45的方法，其中该细胞是动物、植物、真菌或酵母细胞。

77.根据权利要求45的方法，其中该细胞是哺乳动物细胞。

78.根据权利要求45的方法，其中在遗传性状转化后，该细胞基本上具有与野生型细胞相同的生长。

79.根据权利要求45的方法，其中该细胞天然地具有至少2种聚合酶。

80.根据权利要求45的方法，其中该细胞天然地具有至少2种聚合酶，这至少2种聚合酶具有不同的倾向于错误的频率。

81.根据权利要求45的方法，其中该细胞具有至少2种聚合酶，这至少2种聚合酶中的一种参与后随链的倾向于错误的频率，且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。

82.根据权利要求45的方法，其中该细胞具有对环境的抗性，且转化之前的细胞不具有该抗性。

83.根据权利要求82的方法，其中作为参数的环境包含至少一种选自下述的因素：温度，湿度，pH，盐浓度，营养物，金属，气体，有机溶剂，压力，大气压力，粘度，流速，光强度，光波长，电磁波，辐射，重力，张力，声波，该细胞以外的细胞，化学试剂，抗生素，天然物质，心理应激和机体应激，或其组合。

84.根据权利要求45的方法，其中该细胞包括癌细胞。

85.根据权利要求45的方法，其中该细胞构成组织。

86.根据权利要求45的方法，其中该细胞构成生物。

87.根据权利要求45的方法，还包括：

在转化细胞的遗传性状后，使细胞分化成组织或生物。

88.根据权利要求45的方法，其中在预定条件下调节倾向于错误的频率。

89.根据权利要求88的方法，其中通过调节至少一种选自下述的因素来调节倾向于错误的频率：温度，湿度，pH，盐浓度，营养物，金属，气体，有机溶剂，压力，大气压力，粘度，流速，光强度，光波长，电磁波，辐射，重力，张力，声波，该细胞以外的细胞，化学试剂，抗生素，天然物质，心理应激和机体应激，或其组合。

(a)调节生物的基因复制的倾向于错误的频率；和

(b)繁殖得到的生物。

91.通过根据权利要求90的方法生产的具有受调节的遗传性状的细胞。

92.根据权利要求91的细胞，其中该细胞基本上具有与野生型细胞相同的生长。

93.通过根据权利要求90的方法生产的具有受调节的遗传性状的生物。

94.根据权利要求93的生物，其中该生物基本上具有与野生型生物相同的生长。

(a)改变生物的基因复制的倾向于错误的频率；

(b)繁殖得到的生物；

(c)鉴别生物中的突变；和

(d)生产能编码具有鉴别出的突变的基因的核酸分子。

96.通过根据权利要求95的方法生产出的核酸分子。

(a)改变生物的基因复制的倾向于错误的频率；

(b)繁殖得到的生物；

(c)鉴别生物中的突变；和

(d)生产由具有鉴别出的突变的基因编码的多肽。

98.通过根据权利要求97的方法生产出的多肽。

(a)改变生物的基因复制的倾向于错误的频率；

(b)繁殖得到的生物；

(c)鉴别生物中的突变；和

(d)生产具有鉴别出的突变的代谢物。

100.通过根据权利要求99的方法生产出的代谢物。

102.根据权利要求101的核酸分子，其中该DNA聚合酶是真核生物的DNA聚合酶δ或ε，或革兰氏阳性的细菌的与其对应的DNA聚合酶。

103.根据权利要求101的核酸分子，其中该DNA聚合酶是真核生物的DNA聚合酶δ或ε，或革兰氏阳性的细菌的与其对应的DNA聚合酶的变体，该变体包含仅仅缺失了其校对活性的突变。

104.根据权利要求101的核酸分子，其中该DNA聚合酶是真核生物的DNA聚合酶δ，或革兰氏阳性的细菌的与其对应的DNA聚合酶的变体，该变体包含仅仅缺失了其校对活性的突变。

105.载体，其包含根据权利要求101的核酸分子。

106.细胞，其包含根据权利要求101的核酸分子。

107.根据权利要求106的细胞，其中该细胞是真核细胞。

108.根据权利要求107的细胞，其中该真核细胞选自植物、动物和酵母。

109.根据权利要求106的细胞，其中该细胞是革兰氏阳性的细菌细胞。

110.根据权利要求106的细胞，其中该细胞用于调节遗传性状的转化率。

111.生物，其包含根据权利要求101的核酸分子。

112.通过根据权利要求106的细胞或其一部分生产的产物物质。

113.核酸分子，其包含在根据权利要求106的细胞或其一部分中。

114.根据权利要求113的核酸分子，其能编码涉及受调节的遗传性状的基因。

115.测试药物的方法，包括下述步骤：

使用根据权利要求106的细胞作为疾病模型，测试药物的效果；

使用野生型细胞作为对照，测试药物的效果；和

对比疾病模型和对照。

116.测试药物的方法，包括下述步骤：

使用根据权利要求111的生物作为疾病模型，测试药物的效果；

使用野生型生物作为对照，测试药物的效果；和

对比疾病模型和对照。

118.根据权利要求117的组，其中至少2种聚合酶中的一种参与后随链的倾向于错误的频率，且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。

119.根据权利要求117的组，其中该聚合酶的组源自相同的物种。

121.根据权利要求120的组，其中至少2种聚合酶中的一种参与后随链的倾向于错误的频率，且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。

122.根据权利要求121的组，其中该聚合酶的组源自相同的生物物种。