CN1527879A

CN1527879A - 牛表皮生长因子的核酸序列和蛋白质序列

Info

Publication number: CN1527879A
Application number: CNA028141741A
Authority: CN
Inventors: S・比洛多-格西尔斯; S·比洛多－格西尔斯; 约翰; S·J·约翰; 西林格尔; L·B·西林格尔; 本克尔; B·F·本克尔
Original assignee: Agriculture and Agri Food Canada AAFC
Current assignee: Agriculture and Agri Food Canada AAFC
Priority date: 2001-05-18
Filing date: 2002-05-17
Publication date: 2004-09-08
Also published as: US20030059802A1; KR20040089454A; CA2446398A1; WO2002095029A3; NZ529806A; US6967090B2; WO2002095029A2; MXPA03010572A; JP2004536589A; BR0209911A; EP1395658A2

Abstract

本发明提供牛表皮生长因子(bEGF)的核苷酸序列以及所编码蛋白的推导氨基酸序列。本发明还提供成熟bEGF的核苷酸序列以及推导的成熟bEGF蛋白。本发明包括同源核酸、蛋白以及分别与bEGF基因的核苷酸序列和bEGF蛋白在功能上等价的片段。可以在微生物如大肠杆菌或巴斯德毕赤酵母和植物宿主如番茄中表达牛EGF。可以使用细胞增殖/DNA合成测定来证实重组bEGF的活性。牛EGF证明可应用作为家畜生产和乳生产中家畜饲料的补充剂，以促进生长；预防或治疗肠感染；刺激肠细胞的早熟成熟以分泌合适谱系的消化酶；以及增强营养吸收。

Description

牛表皮生长因子的核酸序列和蛋白质序列

发明领域

本发明涉及牛表皮生长因子的核酸和蛋白质序列。

发明背景

近年来，高度竞争的市场和对环境的关注鼓励研究者发展改善家畜和乳制品生产效率的技术。然而，对于动物福利问题以及食品生产更大的公众关注提示，效率改善应该在不损害动物健康和福利的情况下完成。最近在许多动物系统中的发现提示，表皮生长因子(EGF)可以在家畜和乳制品生产中用作饲料添加剂，刺激肠细胞早熟以分泌合适谱系的消化酶；增加营养吸收；以及预防或治疗肠感染。

EGF是由53个氨基酸组成的6kDa多肽，衍生自一种约1,200个氨基酸的前体蛋白质(Carpenter和Cohen，1979)。它天然存在于唾液、肠分泌物和其它体液中，并在初乳和乳中大量产生(Donovan和Odle，1994)。EGF刺激人胎儿胃的生长和成熟。由于大多数物种的初乳中EGF含量高，并且在肠内存在EGF受体，因此有人已经提出EGF(和其它生长因子)也对早期出生后胃肠发育有贡献(Donovan和Odle，1994)。

EGF可能涉及调节营养摄入。在啮齿动物体内，EGF增加电解质、葡萄糖和脯氨酸穿过空肠刷状缘膜的转运。在小猪体内，EGF通过增加蔗糖酶和麦芽糖酶的活性，同时不显著影响乳糖酶和碱性磷酸酶的活性，促进肠细胞功能的成熟(归于Wilson等的国际申请第WO 88/04180号)。因此，应用EGF作为饲料添加剂以促进生长是有利的。

肠型大肠杆菌病或家畜腹泻病是由病原体大肠杆菌(Escherichiacoli)引起的细菌感染。家畜腹泻病在新生的和年幼的家畜中普遍存在，对于农业经济有相当影响。在有限区域内年幼动物过于拥挤通常伴随着家畜腹泻病爆发，其特征在于腹泻、脱水和最后死亡。接受乳替代物的乳牛犊对于家畜腹泻病比用母牛乳饲养的乳牛犊更敏感，由于感染引起的患病率高达75％。

由于目前缺乏针对家畜腹泻病的疫苗，因此需要有效治疗例如EGF。补充EGF改善感染轮状病毒的小猪的肠功能(Zijlstra等，1994)。此外，口服给予EGF降低兔的肠感染率，并防止感染引起的体重增重损失(Buret等，1997)。归于Buret等的美国专利第5,753,622号公开通过口服给予EGF或在动物饲料中间接给予EGF，治疗家畜腹泻病和其它病原性感染，以及增加体重增重的方法。在大多数这些以前的研究中，使用来自与受体不同物种的EGF；然而，原则上优选同一物种的EGF，以避免不希望的副效应。为在乳牛生产和肉牛生产中应用，优选使用牛EGF(bEGF)。

一种饲料添加剂或补充剂必须具有经济性，才能得到生产者的广泛应用。由于分子生物学和重组DNA技术的发展，有效生产大量用于研究、治疗和工业应用的外源蛋白。可以将编码所需蛋白的基因从不符合生产实际的生物转移到微生物、植物或动物表达系统，其中最通常使用微生物表达外源蛋白，因为它们易于生长和容易进行遗传操作。已经在酵母中表达人EGF，产率为40ng/mg蛋白(归于Barr等的美国专利第5,096,825号)，已经通过酵母巴斯德毕赤酵母(Pichia pastoris)生产小鼠EGF，产率为450μg/ml培养基(Clare等，1991)。

以前已经从小鼠、大鼠、猪、马和人中克隆出编码成熟EGF蛋白的互补DNA序列(Gray等，1983；Simpson等，1985；Kim等，2001；Stewart等，1994；Bell等，1986)。推导的氨基酸序列相互之间显示55％到85％的同一性，关键结构残基惊人地保守，尤其是三个甘氨酸(残基18、36和39)、六个半胱氨酸残基(残基6、14、20、31、33和42)以及酪氨酸37。推测其它残基上的变化造成用抗血清和核酸探针观察到的物种间非常低的交叉反应性。已经从人、猪和小鼠中克隆出编码所述前体蛋白的cDNA序列。

虽然以前已经如所述从不同来源克隆出编码成熟EGF蛋白的cDNA序列，但以前还没有从牛的来源获得编码成熟EGF蛋白的DNA序列。然而，bEGF可能在以下几个方面有益于乳牛生产和肉牛生产：促进生长；预防或治疗肠感染；增加营养吸收；以及加速未成熟肠细胞的发育。对于所述潜在的商业应用，希望应用来自牛来源的EGF，以避免可能损害动物健康和福利的不希望的副效应。因此，需要获得编码成熟bEGF蛋白的DNA序列并在重组系统中成功产生bEGF。

一般地说，人序列和牛序列之间的同源性允许应用人探针或引物获得对应的bEGF DNA序列。然而，发现编码bEGF DNA和蛋白序列的序列与其它物种的所述序列有很大不同，这造成试图克隆bEGF DNA序列时的最初困难，并解释了为什么该序列仍然没有得到成功克隆，尽管这样的发明有诱人的商业应用。

发明简述

本发明提供编码牛表皮生长因子(bEGF)的DNA序列以及所编码的蛋白的序列。SEQ ID NO：8和9分别描述所述bEGF基因的部分DNA序列以及所编码的bEGF蛋白的推导氨基酸序列。SEQ ID NO：10和11分别提供编码所述成熟bEGF蛋白的DNA序列以及所述成熟bEGF蛋白的推导氨基酸序列。

因此，本发明广泛地提供编码bEGF多肽的分离的核酸，其中所编码的多肽包含选自以下的氨基酸序列

a)在SEQ ID NO：9中描述的氨基酸序列；

b)在SEQ ID NO：11中描述的氨基酸序列；和

c)与SEQ ID NO：9中所述氨基酸序列或SEQ ID NO：11所述氨基酸序列有至少55％、更优选至少60％、更优选至少65％、更优选至少70％、更优选至少75％、更优选至少80％、更优选至少85％、更优选至少90％、更优选至少95％、最优选至少99％同源性的在功能上等价的氨基酸序列。本发明还包括牛表皮生长因子分离的多肽的片段，其中所述片段包含与SEQ ID NO：11所述氨基酸序列在功能上等价的多肽。

在本发明的再一方面，提供编码bEGF多肽的分离的核酸，其中所述核酸包含选自以下的核苷酸序列

a)在SEQ ID NO：8中描述的核苷酸序列；

b)在SEQ ID NO：10中描述的核苷酸序列；和

c)与SEQ ID NO：9中所述氨基酸序列或SEQ ID NO：10所述核苷酸序列有至少75％、更优选至少80％、更优选至少85％、更优选至少90％、更优选至少95％、最优选至少99％同源性的在功能上等价的核苷酸序列。本发明还包括编码牛表皮生长因子多肽的分离的核酸的片段，其中所述片段包含与SEQ ID NO：10所述核苷酸序列在功能上等价的核苷酸序列。

在又一方面，本发明提供包含编码bEGF多肽的核酸分子的载体和细胞，以及生产所编码的多肽的方法。

本发明还包括表达构建物，所述表达构建物构成与能够在合适宿主中指导bEGF表达的控制序列有效连接的编码bEGF的核酸。

本发明还包括已经用编码所述bEGF多肽的DNA转化以及表达所述DNA的宿主细胞，还包括生产所述转化宿主细胞的方法。

本发明还包括针对所述bEGF多肽或其片段产生的单克隆抗体和多克隆抗体。

在家畜生产和乳品生产中，可以使用所述bEGF多肽或其功能等价片段作为家畜饲料中的补充剂，以促进生长；预防或治疗肠感染，尤其是肠病原性大肠杆菌感染，如肠型大肠杆菌病、贾第鞭毛虫病和家畜腹泻病；增加营养吸收；以及刺激肠细胞早熟以分泌合适谱系的消化酶。

在另一个更广的方面，本发明提供通过给予bEGF多肽改善动物生长的方法以及预防和治疗动物肠感染的方法。因此，本发明提供包含选自以下的制备物的饲料添加剂

a)由核酸编码的bEGF多肽；

b)由核酸编码的bEGF多肽，其中所述bEGF多肽与惰性或活性成分组合；

c)微生物或植物组织，其中所述微生物或所述植物组织表达由核酸编码的bEGF多肽；和

d)从所述微生物或所述植物组织获得的培养基或提取物，其中所述培养基或所述提取物包含核酸编码的bEGF多肽。

在又一个更广的方面，本发明提供饲料组合物，所述饲料组合物包含与编码bEGF的核酸所编码的bEGF多肽组合或用所述bEGF多肽处理的饲料。

在本文和权利要求中，下面陈述的术语和词组有下面定义。

“抗体”包括单克隆抗体和多克隆抗体。

“牛”指牛亚科(Bovinae)的物种，其中包括Bison bison(美洲野牛，水牛)、Bison bonasus(欧洲野牛)、Bos frontalis(大额牛)、Bos indicus(瘤牛)、Bos taurus(普通牛)、Boselaphus tragocamelus(蓝牛羚)、Bubalusbubalis(水牛)、Syncerus caffer(非洲水牛，南非水牛)、Taurotragusderbianus(德氏大羚羊)、Taurotragus oryx(大羚羊)、Tragelaphus angasii(旋角羚)、Tragelaphus eurycerus、Tragelaphus imberbis(小弯角羚)、Tragelaphus scriptus(羚羊)、Tragelaphus spekii(泽羚)、Tragelaphusstrepsiceros(大弯角羚)。

“环化”指线性化DNA末端连接形成共价闭合环状分子或“环状DNA”。

“编码序列”指编码蛋白氨基酸序列或功能RNA(如tRNA或rRNA)的基因部分。

“互补”或“互补序列”指与另一个核苷酸序列按照沃森-克里克碱基配对规则形成氢键键合双螺旋的核苷酸序列。例如，5′-AAGGCT-3′的互补碱基序列是3′-TTCCGA-5′。

“常规聚合酶链反应”指以指数方式扩增靶DNA片段的技术，由此将引物设计成为与DNA的相对链杂交，在两个引物之间进行延伸。

“简并的”或“简并性”指遗传密码的特性，由此一个以上的密码子可以确定一个特定的氨基酸。

“下游”指DNA或RNA中任何位点的3′侧。

“肠型大肠杆菌病”指由肠产毒性(产生毒素的)大肠杆菌菌株引起的感染。所述大肠杆菌菌株附着在小肠表面并大量扩增，分泌导致严重消化改变的肠毒素，引起临床上的腹泻、脱水和高死亡率。

“肠病原性”指倾向于在肠道内产生疾病。

“外显子”指编码蛋白特定结构域的真核基因区段。

“表达”指基因转录成为结构RNA(rRNA，tRNA)，或转录成为信使RNA(mRNA)并随后翻译成为蛋白。

与bEGF“功能等价”的氨基酸序列是这样的氨基酸序列：所述氨基酸序列通过一个或多个氨基酸取代进行修饰，或通过添加和/或缺失氨基酸进行修饰，或者其中一个或多个氨基酸受到化学修饰，但仍然保留bEGF的活性。“功能等价”的核苷酸序列是那些编码在实质上具有bEGF相同生物活性的多肽的核苷酸序列。

“贾第鞭毛虫病”指鞭毛原生动物(贾第鞭毛虫属(Giardia))感染或由鞭毛原生动物引起的疾病，其特征通常是腹泻。

两个核酸序列在下面情况下相互是“异源的”：所述序列来自不同生物(不论所述生物是否同一物种)，只要所述序列并不同时天然出现在同一生物的同一排列中。

两个多核苷酸或多肽在下列情况下是“同源的”或“相同的”：当所述核苷酸序列或所述两个序列中的氨基酸残基分别如本文所述按照最大对应性排列时相同。一般如下进行两个或多个多核苷酸或多肽之间的序列比较：在一个比较窗口上比较所述两个序列的各部分，鉴定和比较具有序列相似性的局部区域。所述比较窗口通常从约20个到约200个连续的核苷酸或连续的氨基酸残基。如下确定多核苷酸和多肽的“序列同一性百分率”或“序列同源性百分率”：在一个比较窗口上比较两个最佳排列的序列，其中所述比较窗口内的多核苷酸或多肽序列部分与用于最佳排列所述两个序列的参考序列(不包含添加或缺失)相比可能包括添加或缺失(即缺口)。如下计算百分率：(a)确定两个序列中出现相同核酸碱基或氨基酸残基的位置的数目，得到匹配位置数量；(b)用所述匹配位置的数目除以所述比较窗口中位置的总数；然后(c)该结果乘以100，产生序列同一性的百分率。

可以通过已知算法的计算机化实现形式或通过检查来最佳排列序列以进行比较。从Ausubel等(1990)可以找到提供商业软件和免费软件的列表。容易得到的序列比较算法和多序列排列对比算法分别是Basic Local Alignment Search Tool(BLAST)(Altschul等，1997)和ClustalW程序。其它合适的程序包括Wisconsin Genetics软件包(Genetics Computer Group(GCG)，575 Science Dr.，Madison，WI)中的GAP、BESTFIT、FASTA和TFASTA。为更加肯定，在本文和权利要求中，氨基酸序列的“序列同一性百分率”或“序列同源性百分率”根据使用如本文所述BLASTP程序的默认值确定的最佳序列排列对比来确定。

如在下文将更详细讨论的，也可以通过DNA杂交分析测定核苷酸序列之间的同源性，其中双链DNA杂种的稳定性依赖于出现的碱基配对的程度。高温和/或低盐含量的条件降低所述杂种的稳定性，可以对所述条件加以变化，以预防具有低于选定同源性程度的序列退火。

“宿主细胞”包括动物宿主细胞、植物宿主细胞、酵母宿主细胞、真菌宿主细胞、原生动物宿主细胞和原核宿主细胞。

“肠感染”指包括但不限于肠病原性大肠杆菌感染，例如肠型大肠杆菌病、贾第鞭毛虫病和家畜腹泻病。

“内含子”指基因中的间插序列。它被转录，但在mRNA翻译前被切除。

“反向聚合酶链式反应”指用于扩增在已知序列的核心区侧翼未知DNA序列的技术，由此用合适的限制酶消化DNA，然后环化，并设计引物以便延伸向外进行并使产物包含所述已知序列上游和下游的序列。

“分离的”指“通过人的劳动”从自然状态改变。假如“分离的”组合物或物质天然存在，它已经受到改变或从其天然环境中取出，或者两种情况都发生。例如，在生活动物体内天然存在的多核苷酸或多肽不是“分离的”，但从其天然状态的共存材料中分离的同样多核苷酸或多肽是“分离的”，与本文使用的所述术语一样。

“家畜”包括，例如，乳牛和肉牛、猪、山羊和绵羊。该术语包括年幼和成年的动物。

“多核苷酸”或“核酸”指脱氧核糖核苷酸的线性序列(在DNA中)或核糖核苷酸的线性序列(在RNA中)，其中一个核苷酸的戊糖的3′碳通过磷酸基团连接邻近核苷酸的戊糖的5′碳。“多肽”或“核酸”可能包括DNA(其中包括cDNA、基因组DNA组和合成DNA)或RNA，DNA或RNA可以是双链或单链的，如果是单链的，则可以是编码链或非编码(反义)链。

“多核苷酸构建物”指从天然基因分离的核酸分子，或者已经受到修饰而包含以非天然方式组合和并列的核酸区段的核酸分子。

两个DNA序列在下面情况下“有效连接”：所述连接的性质并不干扰所述序列实现它们相互之间的正常功能。例如，假如一个启动子区能够实现一个编码序列的转录，则所述启动子与所述编码序列有效连接。

“多肽”指通过肽键连接的氨基酸线性聚合物。

“启动子”指顺式作用的DNA序列，一般长80-120个碱基对，位于基因起始位点的上游，RNA聚合酶可以结合所述序列并起始正确转录。

“重组”核酸分子，例如重组DNA分子，指在体外通过连接两个或多个非同源DNA分子而形成的新型核酸序列(例如在其克隆位点或其多接头内包含一个或多个外源DNA的插入片段的重组质粒)。

“家畜腹泻病”指动物长时间的腹泻。

“沉默改变”指包含例如不改动多核苷酸序列所编码的氨基酸序列的改变。

“转化”指通过外部应用来自不同基因型的另一细胞的纯化的重组DNA，导致其被摄入并整合进接受者细胞的基因组，从而定向修饰所述细胞的基因组。在细菌中，重组DNA并不整合进细菌染色体，而是作为质粒自主复制。

“转基因”指已经在种系中引入外源DNA的生物。

“转基因植物”包括继续携带所述外源DNA的所有后代、杂种和其杂交物，不论是有性繁殖或无性繁殖获得，并且包括转基因植物、植物组织和植物细胞。

“上游”指DNA或RNA中任何位点的5′侧。

基因的“变体”或“变异”指编码同样蛋白的核苷酸序列或编码具有bEGF活性的等价蛋白的核苷酸序列。

蛋白的“变体”或“变异”指bEGF蛋白或其片段的变体(包括衍生物或类似物)。所述变体可以与所述bEGF蛋白在氨基酸序列上由于任何组合的一个或多个取代、添加、缺失、融合和截短而有所不同。

“载体”指能够在宿主细胞中自主复制并接受外源DNA的核酸分子。载体携带其自身的复制原点、一个或多个可以用于插入外源DNA的限制性内切核酸酶独特识别位点、一般还有选择标记例如编码抗生素抗性的基因、以及常常有用于表达插入DNA的识别序列(如启动子)。常用载体包括但不限于噬菌体、粘粒、杆状病毒、反转录病毒载体和质粒载体。

附图简述

图1A和1B是牛EGF的DNA编码序列部分(SEQ ID NO：8)与来自小鼠、猪和人的对应EGF序列的序列排列对比。所述EGF序列的来源是：

1)小鼠(Gray等，1983；GenBank登记号J00380)核苷酸3108-3539，SEQ ID NO：24；和

2)猪(Kim等，2001；GenBank登记号AF336151)核苷酸3172-3606，SEQ ID NO：25；和

3)人(Bell等，1986；GenBank登记号X04571)核苷酸3170-3607，SEQ ID NO：26。

图2显示编码成熟bEGF蛋白的DNA编码序列(SEQ ID NO：10)与对应小鼠序列(核苷酸3282-3440，SEQ ID NO：27)、猪序列(核苷酸3346-3504，SEQ ID NO：28)和人序列(核苷酸3347-3505，SEQ ID NO：29)的排列对比。

图3显示推导的bEGF蛋白序列(SEQ ID NO：9)与对应小鼠EGF蛋白序列(残基919-1063，SEQ ID NO：30)、猪EGF蛋白序列(残基912-1056，SEQ ID NO：31)和人EGF蛋白序列(残基912-1057，SEQ IDNO：32)的排列对比。

图4是推导的成熟bEGF蛋白(SEQ ID NO：11)与对应小鼠成熟EGF蛋白(残基977-1029，SEQ ID NO：33)、猪成熟EGF蛋白(残基970-1022，SEQ ID NO：34)和人成熟EGF蛋白(残基970-1022，SEQ IDNO：35)的排列对比。

优选实施方案的描述

EGF是有53个氨基酸的小多肽，从更大的前体蛋白产生。所述前体蛋白由一个跨越110kb的DNA编码，所述DNA中24个短外显子被各种大小的多个内含子分开。切除所述内含子后，产生含约4,700碱基对的mRNA，所述mRNA编码含约1,200个氨基酸的前体蛋白。通过切除所述前体蛋白的氨基酸残基977到1029，产生成熟人EGF蛋白，所述切除的部分由外显子20的3′最后95个核苷酸以及外显子21的5′头64个核苷酸编码，对应于所述mRNA的核酸3347-3505(Bell等，1986)。

I. bEGF的核酸序列和多肽序列

首先从牛血中分离基因组DNA(实施例1)。为克隆编码bEGF的序列，在一个聚合酶链反应(PCR)中，在牛总基因组DNA存在下使用SEQ ID NO：1和2的引物(实施例2)。SEQ ID NO：1的引物包括人EGF cDNA序列的核苷酸3215-3237，因此位于成熟EGF蛋白编码序列的上游。设计该引物，使得通过混合核苷酸碱基以适应潜在的简并性。SEQ ID NO：2的引物也有简并性，包括人EGF cDNA序列的核苷酸3377-3400，因此在成熟区内。使用这两个引物，获得一个1456碱基对的片段(SEQ ID NO：3)，然后克隆并测序该片段。根据使用2.0版BLAST算法(Altschul等，1997)对DNA和蛋白质数据库的类似性搜索显示，该片段与小鼠和人EGF DNA序列有显著同源性，包含外显子19的56个碱基对、一个1320碱基对的内含子以及外显子20的80个碱基对，其中包括编码成熟EGF蛋白NH₂末端的前十个氨基酸的30个碱基对。

发明人克隆编码成熟EGF蛋白剩余部分的DNA序列的最初策略是使用一种从上述序列设计得到的牛特异性5′引物以及一种从其它物种在所述成熟区下游的序列设计得到的3′引物；然而，该策略并不成功，因为许多受测的引物组合可能不与bEGF序列退火和扩增bEGF序列。因此，怀疑当使用从其它物种的序列设计得到的引物时，不允许成功扩增在所述成熟区下游的bEGF序列。然后使用扩增未知侧翼序列的反向PCR。在常规PCR中，设计引物与DNA相对的两条链杂交，延伸在两个引物之间进行。在反向PCR中，使DNA环化，设计引物使得延伸向外进行，产物包含已知序列上游和下游的序列(Ochman等，1988；Benkel和Fong，1996)。

为扩增如上获得的bEGF序列上游和下游的DNA序列，在分别进行的反应中用特异性限制酶消化牛基因组DNA，然后稀释到低浓度，进行连接(实施例3)。在低浓度下，有利于分子内连接，产生DNA环。选择限制酶BamH I、EcoR I、Hind III和Sac I，因为它们都识别六碱基对序列；因此，消化时产生的平均序列大小是4kb，所述片段可以容易地用长范围聚合酶进行扩增。此外，根据以前获得的序列，在外显子19和20之间的内含子5′末端附近有一个BamH I位点；因此，假如用BamH I消化基因组DNA，环化，然后用从所述BamH I位点下游序列设计的引物进行扩增，那么得到的片段包含从所述BamH I位点到内含子内下一个BamH I位点下游的序列(图4)。在以前获得的序列中没有其它三种限制酶的识别位点；因此，扩增产物包含所述已知序列上游往上到第一个识别位点的序列以及所述已知序列下游往下到下一个限制位点的序列。

使用SEQ ID NO：4和5的引物(分别是SEQ ID NO：3的核苷酸1184-1204以及1070-1090)扩增用上述酶消化的DNA。然后以所述第一个反应的等分物作为模板，应用SEQ ID NO：6和7的引物(SEQ IDNO：3的核苷酸1413-1434和375-394)。设计这些引物扩增用SEQ IDNO：4和5的引物扩增的序列内部的片段，该嵌套反应证实第一个反应中扩增的序列包含EGF序列。扩增用Sac I消化的DNA，在琼脂糖凝胶上产生约7,500bp的单一带，而该材料的嵌套扩增产生预期的更小的非常浓的带。然后克隆并测序该产物(SEQ ID NO：8；实施例3)。使用2.0版BLAST算法(Altschul等，1997)根据相似性搜索DNA和蛋白质数据库，指出该DNA片段与其它物种的EGF序列有显著同源性。该片段包括内含子的483个核苷酸、外显子19、以前鉴定的含1,320个碱基对的内含子、外显子20、一个含4.8千碱基的内含子和外显子21的158个核苷酸。因此，该片段包含与以前鉴定的那些序列同源的序列，以及其它的序列，包括那些编码牛成熟EGF蛋白剩余部分的序列。

人是唯一可以获得EGF基因从外显子19到21的基因组序列(包括内含子)的物种，所述基因组序列包括在从人染色体4获得的127kb克隆中(Stone等，1998；GenBank登记号AC004050)。外显子19在牛和人中有124个碱基对；外显子20在牛中有145个碱基对，在人中有149个碱基对。由于本发明的牛克隆不包括外显子21的完整序列，其大小不能与人外显子21进行比较。内含子大小有更多差异，因为外显子19和20之间的内含子在人中有1362个碱基对，在牛中有5171个碱基对。外显子20和21之间的内含子在人中有4799个碱基对，在牛中有5171个碱基对。在牛内含子中看起来有SINE序列插入；然而，内含子序列的剩余部分显示与人内含子有显著同源性。

图1显示牛EGF序列与人、猪和鼠的EGF序列的排列对比。使用2.0版BLAST算法成对比较这些序列，牛核酸序列与人、猪和鼠核酸序列之间的总同源性分别是70％、73％和64％。这些序列不同区之间的同源性水平有所不同；例如，当仅比较成熟蛋白的核酸序列(图2)时，牛序列(SEQ ID NO：9)与人、猪和鼠序列之间的同源性分别是64％、66％和59％。然而，当仅比较成熟蛋白编码序列上游的核酸序列时，牛序列与人、猪和鼠序列之间的同源性分别是82％、85％和72％。

如上获得的bEGF基因外显子序列编码SEQ ID NO：10的推导蛋白。图3显示所述推导的bEGF蛋白序列与人、猪和鼠EGF序列的排列对比。当使用2版BLAST算法成对比较时，牛推导蛋白序列与人、猪和鼠推导蛋白序列之间的总同源性是49％、51％和46％。考虑有相似特征的氨基酸(来自同一组)时，与人、猪和鼠的同源性分别是66％、69％和62％。与核酸序列的情况相同，序列不同区之间的同源性水平有所不同；例如，当仅比较成熟蛋白时(SEQ ID NO：11是牛序列；图4)，牛蛋白序列与人、猪和鼠蛋白序列之间的同源性分别是39％、36％和36％(当考虑相似氨基酸时是65％、62％和60％)。然而，当仅比较成熟蛋白上游的序列时，牛序列与人、猪和鼠序列之间的同源性分别是66％、73％和61％(当考虑相似氨基酸时是78％、84％和73％)。

推导的成熟bEGF蛋白的计算分子量为6112.10Da，包含在其它物种中对于蛋白结构看起来重要的特定氨基酸，即位置17、36和39的甘氨酸(其它物种中位置18、36和39)以及酪氨酸37。在人EGF中，酪氨酸13、22和29相互接近(Cooke等，1987)。在推导的bEGF蛋白中，存在酪氨酸13和22，也是芳香族氨基酸的苯丙氨酸29，5半胱氨酸对应于其它已知EGF中的6。蛋白中的二硫键不是蛋白链独特折叠的主要原因，而是增加已经稳定的构象的稳定性的装置(Watson等，1985)。推导的bEGF蛋白也是鼠EGF的同源物，折叠识别指出一致分数为44.8证明了这一点。高于12的分数在超过80％的时间里得到正确预测(Fisher，2000)。

对序列SEQ ID NO：8的分析揭示在外显子19(成熟区的上游)有一个符合读框的TGA密码子。TGA是遗传密码中三个链终止密码子之一，还可以编码硒代半胱氨酸，即第二十一个氨基酸(Nasim等，2000；Tate等，1999)。在来自其它物种的EGF基因中，对应的密码子是编码半胱氨酸的TGC；因此，硒代半胱氨酸的存在将构成保守性取代。在本发明中，进行牛基因组DNA的DNA印迹分析，确定牛基因组中EGF基因的拷贝数(实施例4)。假如看起来仅存在一个拷贝，那么可以合理地假设获得的序列来自有功能的EGF基因，并且前体蛋白是硒代蛋白。用限制酶BamH I、EcoR I、Hind III、Sac I和XbaI在分别进行的反应中消化牛基因组DNA。在琼脂糖凝胶的不同道分离三十五μg每种消化物。将所述DNA转移到尼龙膜，与用³²P-dCTP标记的SEQ ID NO：3的片段杂交，洗涤，然后对X射线底片曝光三天。所述引物与每种消化物的单一带杂交，强烈提示在牛基因组中仅有EGF的一个拷贝。

因此，本发明的一方面是分离、纯化或富集的包含SEQ ID NO：9的序列核酸以及与其互补的序列。所述分离、纯化或富集的核酸可以包含DNA，其中包括cDNA、基因组DNA和合成DNA。所述DNA可以是双链的或单链的，如果是单链，则可以是编码链或非编码(反义)链。或者，所述分离、纯化或富集的核酸可以包括RNA。

可以使用几种方法分离包含SEQ ID NO：9的序列的基因组DNA，所述方法例如用所述SEQ ID NO：4和5的引物以及SEQ IDNO：6或7的引物，对用Sac I消化的牛基因组DNA进行反向PCR。也可以根据牛序列设计其它引物组合，通过对用Sac I或其它限制酶消化的基因组DNA进行反向PCR，分离SEQ ID NO：9的DNA。也可以通过常规PCR，例如使用SEQ ID NO：6和14的引物分别作为正向引物和反向引物，获得SEQ ID NO：9的基因组序列。

其次，可以通过常规PCR，在分别进行的反应中扩增来自外显子20和21的序列，从而分离包含SEQ ID NO：9的序列的基因组DNA；例如使用SEQ ID NO：6和12的引物分别作为正向引物和反向引物，扩增外显子20。使用SEQ ID NO：13和14分别作为正向引物和反向引物，扩增外显子21，然后连接得到的两个片段。

第三，可以用从SEQ ID NO：8序列的片段制备的探针与基因组文库在允许所述探针特异性杂交相关序列的条件下接触，分离包含SEQ ID NO：9的序列的基因组DNA。通过用放射性同位素、荧光染料或能够催化可检测产物形成的酶标记所述探针，可以检测所述探针与相关序列的核酸的杂交。用于筛选基因组文库的程序已经由Ausubel等(1990)和Sambrook等(1989)描述。

可以通过逆转录PCR分离编码bEGF的互补DNA。在本发明中，分离编码成熟bEGF蛋白的cDNA片段以及上游和下游的序列，证实获得的基因组序列被转录(实施例5)。用SEQ ID NO：14的引物逆转录牛肾mRNA。在逆反录后，cDNA应用于使用SEQ ID NO：16和14的引物分别作为正向和反向引物的PCR反应中。在琼脂糖凝胶上观察到几种产物。从凝胶上切出一条稍大于400碱基对的带，纯化，并使用所述DNA作为两个分别进行的PCR反应的模板，即一个反应分别使用SEQ ID NO：16和12的引物作为正向和反向引物；另一个反应分别使用SEQ ID NO：15和14的引物作为正向和反向引物。克隆和测序获得的片段。发现组合的序列(SEQ ID NO：17)与对应的基因组序列98％同源。差别(411个核苷酸中有6个核苷酸的差别)可能是由于使用来自不同动物的组织分离基因组DNA和RNA。当与从基因组序列推导的蛋白进行比较时，从cDNA序列推导获得的成熟蛋白序列上有两个氨基酸改变是明显的，即在位置18用谷氨酰胺取代精氨酸，在位置32用谷氨酰胺取代组氨酸。

或者，通过筛选从表达EGF基因的牛组织构建的cDNA文库，分离编码bEGF的互补DNA序列。然后使所述cDNA文库与包含EGF编码序列或EGF编码序列片段的探针在允许所述探针特异性杂交互补序列的条件下接触。然后检测和分离与所述探针杂交的互补DNA。然后通过蛋白质印迹分析或PCR分析鉴定表达EGF的牛组织。

可以通过常规DNA合成仪合成产生编码成熟bEGF蛋白的序列(SEQ ID NO：9)，由此SEQ ID NO：9的片段或部分可以用作产生对应全长序列的中间体。因此SEQ ID NO：9的分离、纯化或富集的核酸可以用于制备SEQ ID NO：11的肽。

众所周知并非全长的蛋白常常具有完整蛋白的功能。缺乏N末端部分、内部部分或C末端部分的截短蛋白可能保留全长蛋白的全部或部分生物学活性和/或酶促活性；例如，在COOH端缺乏最后五个氨基酸的人EGF保留其抑制胃酸分泌的能力，而缺乏多达三个N末端残基的大鼠EGF具有天然蛋白的相同活性(Hollenberg和Gregory1980；Simpson等，1985)。因此，编码保留完整bEGF蛋白活性的内部缺失或截短的bEGF蛋白的SEQ ID NO：9的片段在本发明的范围内。制备截短蛋白以及带有内部缺失的蛋白的方法是本领域内已知的。可以使用例如DNA合成/细胞增殖测定来检验截短或内部缺失的bEGF的活性。

本发明的另一方面是编码bEGF蛋白或片段的分离、纯化或富集的核酸，所述bEGF片段包含成熟bEGF蛋白的至少7个、更优选至少10个、更优选至少15个、更优选至少20个、更优选至少25个、更优选至少30个、更优选至少35个、更优选至少40个、更优选至少45个、更优选至少50个、更优选至少51个、最优选至少52个连续氨基酸。这些核酸的编码序列可以与bEGF蛋白的编码序列相同，或者是不同的编码序列，所述不同的编码序列由于本领域内已知的遗传密码戎余性或简并性(Lewin，1997)的结果，编码bEGF蛋白或者包含bEGF蛋白的至少7个、更优选至少10个、更优选至少15个、更优选至少20个、更优选至少25个、更优选至少30个、更优选至少35个、更优选至少40个、更优选至少45个、更优选至少50个、更优选至少51个、最优选至少52个连续氨基酸的片段。

所述编码成熟bEGF蛋白的分离、纯化或富集的核酸可以包括但不限于仅是成熟bEGF蛋白的编码序列；成熟bEGF蛋白的编码序列以及其它编码序列，例如前导序列或前体蛋白序列；或者成熟bEGF蛋白的编码序列和非编码序列，例如内含子或编码序列5′和/或3′的非编码序列。

或者，可以使用定点诱变或其它已知技术(Ausubel等，1990)诱变bEGF的核酸序列，在成熟bEGF蛋白中引入沉默改变，即不改变所述多核苷酸所编码的氨基酸序列的改变。为引入宿主生物优选的密码子，由此增加包含编码所述多肽的载体的宿主细胞生产所述多肽的水平，这样的改变是合乎需要的。

可以在蛋白序列中制造某些氨基酸取代而不影响蛋白功能。因此，本发明也涉及带有核苷酸改变的多核苷酸，所述核苷酸改变导致成熟bEGF蛋白中的氨基酸取代、添加、缺失、融合和截短。可以使用定点诱变、随机化学诱变、外切核酸酶III缺失和其它重组DNA技术(Ausubel等，1990)引入所述核苷酸改变。得到的变体可能表现bEGF的生物学性质；例如，在位置13用苯丙氨酸取代酪氨酸对于人EGF结合其受体几乎没有影响(Tadaki和Niyogi，1993)。或者，所述核苷酸改变可以是天然等位基因变体，所述天然等位基因变体通过鉴定与探针特异性杂交的牛来源核酸而分离，所述探针包含SEQ IDNO：9的至少20个、更优选至少30个、更优选至少40个、更优选至少50个、更优选至少60个、更优选至少70个、更优选至少80个、更优选至少90个、更优选至少100个、更优选至少110个、更优选至少120个、更优选至少130个、更优选至少140个、更优选至少150个、最优选至少159个连续碱基或与其互补的序列。

可以在低严谨条件、中等严谨条件或高严谨条件下进行杂交。简要地说，首先将包含固定化变性核酸的聚合物膜在含0.9M NaCl，50mM NaH₂PO₄，pH 7.0，5.0mM Na₂EDTA，0.5％SDS，10X Denhardt’s和0.5mg/ml聚核糖腺苷酸的溶液中45℃下预杂交30分钟。然后在溶液中加入约2×107cpm(比活4-9×10⁸cpm/μg)用³²p末端标记的寡核苷酸探针。温育12-16小时后，所述膜在含0.5％SDS的1X SET(150mM NaCl，20mM Tris-盐酸，pH 7.8，1mM Na₂EDTA)中室温下洗涤30分钟，然后在寡核苷酸探针的Tm-10℃下在新鲜1X SET中洗涤30分钟。然后所述膜对放射自显影底片曝光，检测杂交信号。

通过改变杂交条件的严谨性，可以鉴定和分离对于所述探针有不同水平同源性的核酸。通过在低于所述探针熔解温度(Tm)下的不同温度进行杂交，可以改变严谨性，探针的熔解温度可以使用下式计算：

对于长度大于100个核苷酸的探针，使用下式计算Tm：Tm＝81.5-16.6(log[Na⁺])+0.41(％G+C)-(600/N)，其中N是所述探针的长度。假如在含有甲酰胺的溶液中进行杂交，可以使用等式Tm＝81.5-16.6(log[Na⁺])+0.41(G+C数)-0.63(％甲酰胺)-(600/N)计算Tm，其中N是所述探针的长度。

可以在6X SSC，5X Denhardt’s试剂，0.5％SDS，100μg/ml变性的片段化鲑鱼精子DNA；或者6X SSC，5X Denhardt’s试剂，0.5％SDS，100μg/ml变性的片段化鲑鱼精子DNA，50％甲酰胺中进行预杂交。SSC和Denhardt’s溶液的配方可以在Sambrook等(1989)中找到。

通过在上述预杂交溶液中加入可检测探针，进行杂交。当所述探针包含双链DNA时，在加入所述预杂交溶液中前使其变性。所述膜与所述杂交溶液接触足够时间，允许所述探针与包含互补或同源序列的cDNA或基因组DNA杂交。对于长度超过200个核苷酸的探针，可以在Tm以下15-25℃进行杂交。对于更短的探针例如寡核苷酸探针，可以在Tm以下5-10℃进行杂交。对于在6X SSC中进行的杂交，优选在约68℃下进行杂交。对于在含50％甲酰胺的溶液中进行的杂交，优选在约42℃下进行杂交。所有前面的杂交条件都被认为是高严谨性。

杂交后，所述膜首先在2X SSC，0.1％SDS中室温下洗涤15分钟；然后用0.1X SSC，0.5％SDS在室温下洗涤30分钟到1小时；然后在0.1X SSC，0.5％SDS中杂交温度下洗涤；最后用0.1X SSC在室温下洗涤。对于寡核苷酸探针，推荐使用更短的洗涤时间。通过放射自显影或其它常规技术鉴定已经与所述探针杂交的核酸。

为获得与所述可检测探针同源性降低的核酸，可以使用更低严谨性的条件；例如，在含约1M Na⁺浓度的杂交缓冲液中，杂交温度以5℃的增量从68℃降到42℃。杂交后，用2X SSC，0.5％SDS在杂交温度下洗涤所述膜。所述条件在50℃以上被认为是“中等”严谨性，在50℃以下被认为是“低”严谨性。

或者，可以在42℃下，在含甲酰胺的缓冲液例如6X SSC中进行杂交。在这种情况下，杂交溶液中的甲酰胺含量可以按5％的增量从50％降到0％，以鉴定与所述探针有更低水平同源性的克隆。杂交后，用6X SSC，0.5％SDS在50℃洗涤所述膜。所述条件在25％甲酰胺以上被认为是“中等”严谨性，在25％甲酰胺以下被认为是“低”严谨性。

因此，可以使用所述方法分离核酸，所述核酸包含与bEGF序列或者与包含其至少20个、更优选至少30个、更优选至少40个、更优选至少50个、更优选至少60个、更优选至少70个、更优选至少80个、更优选至少90个、更优选至少100个、更优选至少110个、更优选至少120个、更优选至少130个、更优选至少140个、更优选至少150个、最优选至少159个连续碱基的片段以及与其互补的序列有至少75％、至少80％、至少90％、至少95％或至少99％同源性的序列。可以使用2版BLASTN按默认参数测量同源性(Altschul等，1990)。此外，可以使用上述程序分离核酸，根据笫2版BLASTX测定，所述核酸编码与bEGF蛋白或包含其至少7个、更优选至少10个、更优选至少15个、更优选至少20个、更优选至少25个、更优选至少30个、更优选至少35个、更优选至少40个、更优选至少45个、更优选至少50个、更优选至少51个、最优选至少52个连续氨基酸的bEGF蛋白片段有至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或至少99％同源性的多肽。

SEQ ID NO：9的分离、纯化或富集的核酸、与其互补的序列、或包含SEQ ID NO：9的至少20个、更优选至少30个、更优选至少40个、更优选至少50个、更优选至少60个、更优选至少70个、更优选至少80个、更优选至少90个、更优选至少100个、更优选至少110个、更优选至少120个、更优选至少130个、更优选至少140个、更优选至少150个、最优选至少159个连续碱基的片段或者与其互补的序列可以用作探针，鉴定和分离编码SEQ ID NO：11的多肽或其变体的cDNA。在所述程序中，从表达bEGF基因的牛组织提取的RNA构建cDNA文库，然后与包含编码序列的探针在允许所述探针与互补序列杂交的条件下接触，随后检测和分离所述互补序列。改变用于鉴定EGF cDNA的杂交条件的严谨性，就能够鉴定和分离出与所述探针具有不同同源性水平的核酸。也可以在使用以牛RNA作为模板合成的cDNA的PCR反应中，用从所述编码序列或其片段设计的引物分离变体cDNA。

本发明的另一方面是分离的或纯化的bEGF蛋白或包含其至少7个、更优选至少10个、更优选至少15个、更优选至少20个、更优选至少25个、更优选至少30个、更优选至少35个、更优选至少40个、更优选至少45个、更优选至少50个、更优选至少51个、最优选至少52个连续氨基酸的片段。可以如本文所述通过在重组宿主中表达bEGF DNA序列，获得bEGF蛋白或其片段。

或者，可以通过常规肽合成仪合成生产bEGF蛋白或包含其至少7个、更优选至少10个、更优选至少15个、更优选至少20个、更优选至少25个、更优选至少30个、更优选至少35个、更优选至少40个、更优选至少45个、更优选至少50个、更优选至少51个、最优选至少52个连续氨基酸的片段。所述片段可以作为通过肽合成生产对应全长bEGF蛋白的中间体。

或者，也可以使用从DNA构建物转录的mRNA获得bEGF蛋白或其片段，所述DNA构建物包含与编码bEGF蛋白或其片段的核酸连接的启动子。可以在进行体外转录反应前线性化所述DNA构建物。然后转录的mRNA与合适的无细胞翻译提取物如兔网织红细胞提取物温育，产生bEGF蛋白或其片段。

此外，可以通过生物化学富集或纯化程序获得bEGF多肽或其片段。可以通过蛋白水解消化和/或微测序确定潜在同源多肽或片段的序列。可以使用程序例如2版BLASTP，比较预期同源多肽或片段的序列与推导的bEGF蛋白或包含其至少7个、更优选至少10个、更优选至少15个、更优选至少20个、更优选至少25个、更优选至少30个、更优选至少35个、更优选至少40个、更优选至少45个、更优选至少50个、更优选至少51个、最优选至少52个连续氨基酸的片段。

本发明还涉及bEGF蛋白的变体(包括衍生物或类似物)或包含其至少7个、更优选至少10个、更优选至少15个、更优选至少20个、更优选至少25个、更优选至少30个、更优选至少35个、更优选至少40个、更优选至少45个、更优选至少50个、更优选至少51个、最优选至少52个连续氨基酸的片段的变体。所述变体在氨基酸序列上可能由于任何组合的一个或多个取代、添加、缺失、融合和截短而与bEGF蛋白不同。

所述变体可以是天然的或者用定点诱变、随机化学诱变、外切酶III缺失程序和标准克隆技术在体外产生。或者，可以使用化学合成或修饰程序产生所述变体、片段、类似物或衍生物。

所述bEGF蛋白的变体可以是其中bEGF蛋白的一个或多个氨基酸残基受到保守或非保守氨基酸残基(优选保守氨基酸残基)取代的变体，并且所述受到取代的氨基酸残基可以是或者不是由遗传密码编码的氨基酸残基。保守取代涉及用具有相似特征的另一氨基酸取代多肽的中的给定氨基酸，典型的取代如下：

●用另一脂肪族氨基酸取代脂肪氨基酸例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸；

●用苏氨酸取代丝氨酸，或者相反；

●用另一酸性残基取代酸性残基如天冬氨酸或谷氨酸；用另一带有酰胺基团的残基取代带有酰胺基团的残基如天冬酰胺或谷氨酰胺；

●用另一碱性残基取代碱性残基如赖氨酸或精氨酸；和

●用另一芳香族残基取代芳香族残基如苯丙氨酸或酪氨酸。

其它变体是那些牛EGF蛋白的一个或多个氨基酸残基包含取代基基团的变体。

还有其它变体是那些其中在多肽中融合添加的氨基酸，例如前导序列、分泌序列或者便利蛋白纯化、富集或稳定的序列。

在一些实施方案中，所述片段、衍生物或类似物包括前体序列，以便可以通过切割所述前体部分产生有活性的肽，激活所述片段、衍生物或类似物。

本发明的另一方面是多肽或其片段，所述多肽或其片段与bEGF蛋白或包含其至少7个、更优选至少10个、更优选至少15个、更优选至少20个、更优选至少25个、更优选至少30个、更优选至少35个、更优选至少40个、更优选至少45个、更优选至少50个、更优选至少51个、最优选至少52个连续氨基酸的片段有至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或至少99％同源性。

可以使用程序例如2版BLASTP以默认参数确定同源性，所述程序排列对比进行比较的多肽或片段，并确定它们之间同源性的程度。应当知道氨基酸“同源性”包括以前所述的保守氨基酸取代。可以通过使用本文讨论的技术分离编码它们的核酸，获得与bEGF蛋白或其片段有同源性的多肽或片段。

也可以使用bEGF蛋白或包含其至少7个、更优选至少10个、更优选至少15个、更优选至少20个、更优选至少25个、更优选至少30个、更优选至少35个、更优选至少40个、更优选至少45个、更优选至少50个、更优选至少51个、最优选至少52个连续氨基酸的片段产生特异性结合所述蛋白或片段的抗体。为检测组织或体液样品中的EGF，使所述样品接触所述抗体，然后或者通过用可检测荧光标记、酶促标记或放射性同位素标记来标记所述抗体，或者用具有所述标记的第二抗体标记所述抗体，测定所述样品的结合能力。用于检测样品中bEGF的已知测定包括ELISA、夹心法测定、放射免疫测定以及蛋白质印迹。

如下获得针对bEGF蛋白或包含其至少7个、更优选至少10个、更优选至少15个、更优选至少20个、更优选至少25个、更优选至少30个、更优选至少35个、更优选至少40个、更优选至少45个、更优选至少50个、更优选至少51个、最优选至少52个连续氨基酸的片段的多克隆抗体：直接将所述蛋白或片段注射或给予动物。然后使获得的抗体结合蛋白本身；因此，甚至可以用仅编码所述蛋白片段的序列产生结合全长天然蛋白的抗体。然后可以使用所述抗体从表达所述蛋白的细胞中分离所述蛋白。

为制备单克隆抗体，可以使用提供通过连续细胞系培养产生抗体的任何方法，例如杂交瘤技术、trioma技术、人B细胞杂交瘤技术以及EBV杂交瘤技术。

因此，一般性针对bEGF蛋白或包含其至少7个、更优选至少10个、更优选至少15个、更优选至少20个、更优选至少25个、更优选至少30个、更优选至少35个、更优选至少40个、更优选至少45个、更优选至少50个、更优选至少51个、最优选至少52个连续氨基酸的片段的抗体可以用于检测牛组织和体液中的EGF蛋白，以及从其它生物(优选反刍动物)筛选相似蛋白。从牛或其它反刍动物组织或体液提取蛋白后，使蛋白与所述抗体接触，然后通过以前描述的任何程序检测那些特异性结合的蛋白。

本发明的bEGF基因可以用于异源杂交以及允许从其它哺乳动物分离EGF编码基因的PCR实验。

II. 过量表达bEGF蛋白

可以将已经特征化的bEGF编码序列引入多种表达系统以进行工业化生产。重组DNA技术已经便利有效生产肽激素例如EGF。可以使用工业化微生物菌株(例如黑曲霉(Aspergillus niger)、无花果曲霉(Aspergillus ficuum)、盛泡曲霉(Aspergillus awamori)、米曲霉(Aspergillus oryzae)、里氏木霉(Trichoderma reesei)、Mucor miehei、乳酸克鲁维酵母(Kluyverromyces lactic)、巴斯德毕赤酵母(Pichiapastoris)、酿酒酵母(Saccharomyces cerevisiae)、大肠杆菌、枯草芽孢杆菌(Bacillus subtilis)或地衣芽孢杆菌(Bacillus licheniformis)或者植物宿主(如双低油菜(canola)、大豆、玉米、番茄)生产bEGF。所有系统使用相似方法，由此装配表达构建物以包括目的蛋白编码序列以及控制序列如启动子、增强子和终止子，以及需要包括的信号序列和选择标记。

为获得bEGF的细胞外表达，本发明的表达构建物利用分泌信号序列，如果希望进行胞质表达，则不需要该序列。启动子和信号序列在宿主细胞内有功能，并且提供所述编码序列产物的表达和分泌。包括转录终止子以保证有效转录。在所述表达构建物中也可以包括增加表达或蛋白纯化的辅助序列。

可以在大肠杆菌和巴斯德毕赤酵母中表达牛EGF(实施例6)。如下制备仅包含成熟蛋白编码序列的DNA片段：分别用SEQ ID NO：6和12的引物；SEQ ID NO：13和14的引物扩增在5kb内含子两侧编码成熟蛋白的序列，然后用接头引物(SEQ ID NO：15)连接所述两种产物。将最终产物克隆进大肠杆菌和巴斯德毕赤酵母表达载体。

合适载体应该能够在宿主细胞中自主复制并接受外源DNA。一个载体携带其本身的复制原点、可用于插入外源DNA的一个或多个限制性内切核酸酶单一识别位点，以及常常还有用于表达插入DNA的识别序列(如启动子)。也可以包括选择标记，以允许选择携带所需构建物的细菌细胞；例如，合适的原核选择标记包括那些赋予抗生素(如氨苄青霉素)抗性的选择标记。可以选择本领域技术人员已知的任何合适载体，常用载体包括但不限于噬菌体、粘粒、杆状病毒、反转录病毒载体和质粒载体。提供下面质粒载体作为例子：pEQ40，或者pET系列的质粒如pET26。然而，可以使用任何质粒载体，只要所述质粒载体在宿主中可复制并且有活力。

一旦已经组装合适载体，可以利用多种技术将外源DNA引入宿主细胞。可以通过电穿孔将所述载体或表达构建物引入大肠杆菌，以及通过原生质体转化或电穿孔引入巴斯德毕赤酵母。对于电穿孔，细胞用无菌水洗涤，然后重悬浮于低电导率溶液(如1M山梨糖醇溶液)。对所述细胞悬浮液应用高电压电击，在细胞膜上产生瞬时的孔，转化DNA通过该孔进入细胞。在巴斯德毕赤酵母中，所述表达构建物通过同源重组整合进aox 1(乙醇氧化酶)位点，稳定地维持。通过应用所述表达构建物或载体携带的选择标记鉴定携带所述载体或表达构建物的宿主细胞，然后通过杂交、PCR、抗体或其它技术证实目的基因的存在。可以在液体或半固体培养基上，通过例如分批发酵和连续发酵等技术培养转化的微生物细胞。在针对最大投入产出比(product-to-cost ratio)优化的条件下，繁殖转化细胞。通过操作培养参数例如温度、pH、通气和培养基组成，可以增加产物产量。小心操作和监测重组高表达大肠杆菌细胞的培养条件，可能导致培养物生物量和蛋白产量分别为150g(湿重)细胞/l以及5g不溶蛋白/l。可以使用低浓度蛋白酶抑制剂(如苯甲基磺酰氟或抑胃肽)减少过量表达的蛋白的蛋白水解，或者可以使用蛋白酶缺陷型宿主细胞减少或消除蛋白降解。对于微生物表达，可能也希望生产融合蛋白，以便利纯化或保护bEGF免受蛋白水解降解。

发酵后，通过下游工艺例如离心和过滤从培养基中取出微生物细胞。假如所需产物是分泌型的，则可以从营养培养基中提取所需产物。在细胞内生产的情况下，收获细胞，通过使用机械力、超声处理、酶、化学试剂和/或高压破碎细胞，释放所述产物。在高表达大肠杆菌系统中出现的不溶产物的生产可能便利产物纯化。通过离心从破碎的细胞中提取产物包涵体，用含低浓度变性剂(如0.5-6M尿素、0.1-1％SDS或0.5-4.0M胍-HCl)的缓冲液洗涤，除去污染蛋白。洗出的包涵体溶解于含6-8M尿素、1-2％SDS或4-6M胍-HCl的溶液中，然后通过在透析过程中缓慢除去变性剂，复性溶解的产物。

也可以在植物细胞如番茄或甘蓝型油菜(Brassica napus)中表达牛EGF。将所述表达构建物插入能够在根癌农杆菌(A.tumefaciens)中复制的二元载体，并带动转移进入植物细胞。将所得的构建物转化进根癌农杆菌细胞，然后将所述表达构建物通过所述二元载体∷表达构建物的接合带动转移(conjugal mobilization)转移进甘蓝型油菜叶细胞。所述表达构建物随机整合进所述植物细胞基因组。

选择和筛选后，可以使用已知方法将转化植物细胞再生成为整株植株，并培育和培养转基因植物的品种系。通过研磨、匀浆和/或化学处理可以从收获的部分或整株植株中提取牛EGF。种子特异性亲脂性油体蛋白(oleosin)融合物通过将油体蛋白融合蛋白分配到双低油菜(canola)种子榨出的油部分而与水溶性蛋白分离，从而便利纯化(van Rooijen和Moloney，1994)。

如果需要，可以使用沉淀(如硫酸铵沉淀)、色谱(如凝胶过滤、离子交换、亲和液体层析)、超滤、电泳、溶剂-溶剂萃取(如丙酮沉淀)或这些方法的组合从微生物、发酵和植物提取物中纯化所述产物。

III. bEGF蛋白的活性

可以使用例如DNA合成/细胞增殖测定测试所获得的重组bEGF蛋白的活性，因为EGF是各种类型细胞的有丝分裂原(实施例7)。简要地说，在24孔板中培养牛成纤维细胞到半汇合，然后在各个孔中加入重组bEGF(各种不同浓度)和人EGF(阳性对照)。加入bEGF后十八小时，在需要掺入所述新合成DNA的每个孔内加入氚化胸苷。八个小时后，收获细胞，通过酸沉淀分离未掺入和已经掺入的胸苷。通过闪烁计数确定每个部分中放射性的量。与对照细胞相比掺入的氚化胸苷增加，说明重组bEGF刺激成纤维细胞中的DNA合成。使用该测定，还有可能比较人EGF和bEGF刺激牛细胞中DNA合成和增殖的效力。在相似测定中，加入bEGF后十八小时收获细胞，计数并确定bEGF对于细胞增殖的效应。

IV. bEGF的配制和应用

可以在需要bEGF活性的应用中直接使用bEGF蛋白或其功能等价片段、所有或部分转化微生物培养物和植物、以及从所述培养物或植物获得的提取物。所述应用包括促进生长、预防或治疗肠感染、增加应用吸收、以及加速来成熟肠细胞的发育。

大部分家畜与人类不同，不能通过胎盘吸收免疫球蛋白，而是借助“渗漏的”不成熟的肠细胞结构摄取母体乳汁中的抗体。虽然这种摄取在出生后相当快速地获得，但用成熟肠细胞取代不成熟肠细胞的时间可能很长；例如，该时间在小猪中为四周，在小牛中可能长达三个月。这个阶段可能在畜牧业中产生各种问题，尤其是预防成熟型膳食的应用，使得新生动物依赖于哺乳获得基本营养。

归于Wilson等的国际公开第WO 88/04180号提供通过给予家畜EGF来促进消化酶早熟成熟和生长的方法。为增强乳牛或肉牛的生长，所给予的EGF理论上可能来自任何哺乳动物来源。一般相信EGF活性序列在物种之间非常保守。然而，如本发明展示的，bEGF活性序列与所有其它已知的哺乳动物EGF序列显著不同。因此，为促进乳牛或肉牛的生长，假如使用替代来源的EGF，那么优选使用可能更有效影响牛消化生理并避免不希望的副效应的bEGF。也可以使用牛EGF促进其它家畜物种的生长，所述家畜物种优选反刍动物例如山羊和绵羊。

EGF可能参与调节营养摄入；例如，在啮齿动物体内，EGF增加跨过空肠刷状缘膜的电解质、葡萄糖和脯氨酸转运。因此，本发明的bEGF也可使用比以前所述改变肠细胞结构所需时间更长的时期。应对bEGF在营养摄入上的潜在增加将会增加饲料效率并增强生长。

年幼动物的肠细胞必须保持在未成熟状态足够长的时间以允许转移获得母体免疫。因此，如果所需效应是加速所述肠细胞结构成熟，那么当小牛两日龄、三日龄或四日龄时可以开始给予bEGF，持续仅两到四天；或者如果所需效应是利用bEGF介导的营养摄取增加，则给予bEGF可以持续更长时间，例如四到六周。可能必须通过实验确定在小牛体内获得最佳效应给予bEGF的最佳时间。可以以几种方法给予牛EGF，即通过如归于Wilson等的国际公开号WO88/04180中建议的植入物或以八小时间隔经胃肠外途径给予。然而，优选在动物饲料或饮用水中口服给予。以每日100μg/kg体重的剂量给予EGF九天增强New Zaeland白兔的体重增重(归于Buret等的美国专利第5,753,622号)。对于小牛，可以口服给予bEGF，剂量范围例如在每日10-10,000μg/kg内变化。

也可以使用牛EGF预防或治疗肠感染。所述感染包括但不限于肠病原性大肠杆菌感染例如肠大肠杆菌病、贾第鞭毛虫病和家畜腹泻病。添加EGF改善感染轮状病毒的小猪的肠功能(Zijlstra等，1994)此外，口服给予EGF减少兔的肠感染率，预防感染引起的体重增重减少(Buret等，1997)。归于Buret等的美国专利第5,753,622号公开通过口服给予EGF或在动物饲料中给予EGF，治疗家畜腹泻病和其它病原体感染以及增加体重增重的方法。对于小牛，为预防或治疗家畜腹泻病或其它病原体感染，可以口服给予bEGF，剂量范围例如在每日10-10,000μg/kg内变化。

为进行上述应用，可以制备如下形式的bEGF：粗bEGF、纯化的bEGF、或作为从转化微生物、转化植物组织或其中转化微生物可分泌bEGF的培养物或营养培养基获得的提取物。因此可以制备各种bEGF制剂，以给予年幼和成年的动物(如牛、家禽、猪、绵羊、山羊、其它单胃家畜或反刍家畜)，促进它们的生长和健康。也可以将牛EGF配制成为如下固体、液体、悬浮液、饲料添加剂、混合物或饲料组合物。

i)固体-配制牛EGF为固体、矿物质舔块、盐、颗粒、药丸、圆颗粒或粉末。可以将粉末形式的bEGF喷洒进饲料槽或与口粮混合，或者通过已知工艺与其它饲料形成颗粒。

ii)液体和悬浮液-可以通过将冻干或粉末状的牛EGF加入合适液体，使牛EGF掺入液体，配制成为溶液或悬浮液。可以将牛EGF与动物饮用水混合或以其它液体形式提供用于食用。可以将牛EGF与液体饲料组合，所述液体饲料例如初乳、医院乳(hospital milk)、全脂乳和乳替代物，是本领域内已知为小牛提供营养和免疫保护的液体饲料类型。在液体饲料内加入活性成分的方法是本领域内众所周知的，见例如归于Langrehr的美国专利第5,785,990号。

iii)饲料添加剂-可以以饲料添加剂的形式给予牛EGF，所述饲料添加剂包含已经受到转化以表达bEGF的冻干微生物或植物组织的制备物。可以将所述饲料添加剂包括在动物日常饲料中。

iv)混合物-通常如下将活性成分掺入动物饲料：制备所述活性成分的预混合料，将所述预混合料与维生素和矿物质混合，然后将所述预混合料或饲料添加剂加入饲料。可以将牛EGF与本领域内已知的其它活性成分混合，所述其它活性成分例如酶、抗生素、益生菌或双歧杆菌和乳酸菌的活体制备物。所述活性成分包括单独的bEGF或bEGF与其它活性成分的组合，可以将所述活性成分与营养物组合，提供预混合的补充剂。营养物包括微量营养物如维生素(如维生素A、D、E和K、硫胺素、核黄素等)和矿物质(如铜、钴、镁、碘、硫酸铁等)以及常量营养物(如谷物、种子、草、脂肪和油)。然后可以将所述预混合物加入干燥的饲料成分，所述干燥的饲料成分包括谷类(如小麦、燕麦、大麦和玉米)、植物蛋白饲料、动物蛋白饲料和乳制品(如奶粉和乳清粉)。

v)饲料组合物-可以以饲料组合物的形式提供牛EGF，所述饲料组合物包括与bEGF组合或用bEGF处理的饲料。牛EGF可以与饲料混合成为干燥形式例如粉末，或者作为用作例如浸液或喷雾剂的液体。可以使用任何常规饲料，所述常规饲料包括粮谷例如玉米、谷物、高梁、小麦、大麦、燕麦、植物蛋白粗粉、草、干草、草青贮料和玉米青贮料。

可以通过加入其它蛋白(如明胶、脱脂奶粉等)或化学试剂(如甘油、聚乙二醇、还原剂和醛)稳定bEGF的制剂。所述制剂中可以掺入药学上可接受的载体、稀释剂和赋形剂，例如糖、奶粉或乳副产品以及纤维素衍生物。为保证动物消耗足够的量，可以在所述制剂中加入调味剂，以对于动物看起来美味或者熟悉的形式提供bEGF。可以为生长期和育肥期内的年幼动物改变bEGF制剂，所述制剂包含的bEGF量与成年动物所需的量不同。

可以通过几种方法给予牛EGF，即通过植入物或通过胃肠外途径。然而，在动物饲料或饮用水中口服给予是方便的。或者，可以将带有合适启动子-增强子序列的bEGF基因整合入动物基因组，并在分泌bEGF进入胃肠道的器官或组织内选择性表达，由此消除补充性bEGF的需要。

bEGF的剂量依赖于本领域内技术人员众所周知的许多因素，例如bEGF的具体形式；bEGF所使用的条件(即促进生长或治疗肠感染)；动物的类型、年龄和体重。对于小牛，可以口服给予bEGF，剂量范围在例如每天10-10,000μg/kg内变化。成年动物需要更大的剂量范围。

本文的实施例以举例说明的方式给出，并且无论如何不意图限制本发明的范围。已经努力保证所使用数字(如温度、pH、量)的准确性，但应当认识到有一些试验差异和偏差的可能性。

实施例1-从黄牛分离基因组DNA

使用盐提取方法(Miller等，1988)从黄牛(Bos Taurus)血中分离基因组DNA。简要地说，将从接受过抗凝血处理的血液中获取的有核细胞重悬浮于15ml离心管内3ml核裂解缓冲液(10mM Tris-HCl，400mM NaCl，和2mM Na₂EDTA，pH8.2)。所述裂解物与200μl 10％SDS和0.5ml蛋白酶K溶液(1％SDS和2mM Na₂EDTA中含1mg蛋白酶K)温育过夜。消化后，在每管内加入1ml饱和NaCl(约6M)，然后剧烈振荡15秒钟，然后在2500rpm离心15分钟。将上清液转移到另一15ml管，加入1倍体积无水乙醇(室温)，倒转所述管几次，直到DNA沉淀。用移液器取出DNA链，转移到含300μl Tris缓冲液的微量离心管。

实施例2-扩增、克隆和测序bEGF基因的1.5kb片段

i)用于PCR扩增基因组bEGF片段的引物设计

分析来自哺乳动物物种的下述EGF cDNA序列，鉴定同源区：

1)人(Bell等，1986；GenBank登记号X04571)；

2)小鼠(Gray等，1983；GenBank登记号J00380)；

3)大鼠(Saggi等，1992；GenBank登记号U04842)；

4)猪(Kim等，2001；GenBank登记号AF336151)；和

5)马(Stewart等；GenBank登记号S73527)。

鉴定出位于成熟EGF蛋白上游83个氨基酸的一个高度保守的区，该区编码氨基酸序列“CTNTEGGY”。使用该序列设计SEQ IDNO：1的引物，以便通过混合下面这些位置的核苷酸碱基：5′GACACA/C/G/T TGC/T ACA AAT ACA/C/G/T GAG GG 3′，可以适应可能的简并性。从人EGF中成熟蛋白一个非常保守的区的序列“DGYCLHDG”设计SEQ ID NO：2的引物。同样通过混合下面这些位置的核苷酸碱基：5′GAC/T GGG TAC TGC CTC CAC/T GG/AT GG3′，可以适应可能的简并性。在DNA/RNA合成仪(Applied Biosystems，850 Lincoln CentreDrive，Foster City CA，94404，USA，#392型)产生引物。

ii)PCR扩增和克隆1.5kb基因组bEGF片段

扩增在50μl体积内进行，使用300ng牛基因组DNA作为模板(如实施例1所述分离)，以及SEQ ID NO：1和2的引物各200nM、100μM dNTP(Roche Molecular Biochemicals，201 Boulevard Armand-Frappier，Laval，QC H7V 4A2，Canada，目录号1 581 295)、1.5 U TaqDNA POLYMERASE(Life Technologies，9800 Medical Center Drive，P.O.Box 6482，Rockville，MD 20850，USA，目录号1 0342-053)、1X反应缓冲液(与所述酶一起提供)以及1.5mM MgCl₂。在96℃3.0分钟的起始变性步骤后，重复下面PCR循环三十五次：(1)94℃30秒钟的变性步骤；(2)57℃15秒钟的退火步骤；(3)72℃2分钟的延伸步骤；然后是72℃5分钟的最终延伸步骤。

在1％琼脂糖凝胶上分离15μ1所述PCR反应物，然后用溴化乙锭染色，在紫外光下显影。从凝胶上切下一条约1.5kb的带，通过玻璃纤维进行纯化。简要地说，将少量玻璃纤维置于底部有小孔的0.5ml管内。将凝胶块置于玻璃纤维的顶部，然后把所述管放入1.5ml管。所述管在10,000rpm离心10分钟。在一个100μl的PCR反应(如上述相同条件)中使用2μl所述洗脱物作为模板，产生用于克隆的足够模板。所有所述扩增反应物都在1％琼脂糖凝胶上分离，然后用溴化乙锭染色，在紫外光下显影。从凝胶上切下所述1.5kb的带，用QIAquick凝胶纯化试剂盒(Qiagen Inc.，28159 Avenue Stanford，Valencia，CA 91355，USA，目录号28704)纯化。用3单位T4 DNA连接酶(Promega Corporation，目录号M1801)在10μl体积内4℃下反应16小时，将约50ng DNA连接进12.5ng pGEMT-EASY TA克隆载体(Promega Corporation，2800 Wood Hollow Road，Madison，WI 53711-5399，USA，目录号A1360)。将2μl所述连接混合物转化进大肠杆菌MAX EfficiencyDH5α^TM感受态细胞(Life Technologies，目录号18258-012)。

iii)测序所述1.5kb基因组牛EGF片段

通过下面方法确定所述1.5kb插入片段(SEQ ID NO：3)的完整序列。用QIAprep Spin Miniprep试剂盒(Qiagen Inc，目录号27104)从大肠杆菌(用携带bEGF的质粒转化)的过夜培养物提取模板DNA。使用BIGDYE TERMINATOR CYCLE SEQUENCING KIT(AppliedBiosystems，目录号403051)制备样品，用于在DNA测序仪(AppliedBiosystems，373A型)上进行分析。通过引物步移法产生重叠序列。使用SEQUENCHERTM软件(Gene Codes Corporation，640 Avis Drive，Suite 300 Ann Arbor，Michigan 48108，目录号SQA3.1)分析所述DNA序列数据。

实施例3-反向PCR扩增DNA序列

i)从所述1.5kb bEGF片段的序列设计用于反向PCR的引物

从实施例2获得的所述1.5kb bEGF基因片段的序列设计引物。SEQ ID NO：4(SEQ ID NO：3的核苷酸1184到1204)和5(SEQ ID NO：3的核苷酸1070到1090)的引物用于第一个扩增；设计SEQ ID NO：6(SEQ ID NO：3的核苷酸1413到1434)和7(SEQ ID NO：3的核苷酸375到394)的引物，扩增在用SEQ ID NO：4和5的引物产生的片段内部的一个片段。

ii)模板制备

用40 U EcoR I、BamH I、Hind III和Sac I(New England BioLabsInc.，32 Tozer Road，Beverly，MA 01915，USA，目录号R0101S、R0136S、R0104S、R0156S)分别在100μl反应物中于37℃过夜消化1μg牛基因组DNA，制备模板。消化后，在80℃温育10分钟，使酶失活。将所述DNA稀释到在水中1μg/ml的浓度，然后用30 U T4DNA连接酶(Promega Corporation，目录号M1801)和1X连接酶缓冲液在1ml体积内16℃下温育16小时。在该低浓度下，有利于分子间连接，产生DNA环。连接后，用QIAquick PCR纯化试剂盒(QiagenInc.，目录号28104)清洁所述DNA，然后在30μl体积的10mM Tris内洗脱。通过蒸发将体积减少到10μl。

iii)聚合酶链反应

使用从每次消化获得的连接DNA的5μl等分物(对应于约300ngDNA)作为PCR中的模板。所述反应混合物含1X LA PCR BUFFER II(Pan Vera Corporation，545 Science Drive，Madison，WI 53711 USA，目录号RR002M)、2.5mM MgCl₂、1.6mM dNTP(Pan Vera Corporation，目录号RR002M)、0.2μM SEQ ID NO：4的引物、0.2μM SEQ ID NO：5的引物、1.25 U TAKARALA TAQ POLYMERASE(Pan VeraCorporation，目录号RR002M)，加水到25μl。在96℃3.0分钟的起始变性步骤后，重复下面PCR循环三十五次：(1)94℃30秒钟的变性步骤；(2)61℃15秒钟的退火步骤；(3)68℃7分钟的延伸步骤；然后是72℃5分钟的最终延伸步骤。1μl扩增产物直接用于30个循环的双嵌套扩增，使用SEQ ID NO：6和7的引物以及上述相同条件，只是反应体积是50μl。

来自第一次扩增以及双嵌套扩增的15μl产物在0.7％琼脂糖凝胶上分离，然后用溴化乙锭染色，在紫外光下显影。选择扩增Sac I消化的DNA产生的产物用于分析，因为所述第一次扩增反应导致一条约7.5kb的弱带，而所述双嵌套扩增导致更大的DNA，所述DNA比预期的大小略小。如上文所述克隆和测序得自所述嵌套扩增的产物。使用2.0版BLAST算法(Altschul等，1990)根据相似性搜索DNA和蛋白质数据库，结果指出：获得的DNA片段(SEQ ID NO：8)与人EGF有显著同源性(Bell等，1986；GenBank登记号X04571)。所述片段包含内含子的483个核苷酸、外显子19、以前鉴定的1,320碱基对内含子、外显子20、一个5kb内含子以及外显子21的158个核苷酸；因此，该片段包含与以前鉴定的序列以及添加的序列同源的序列，其中包括那些编码成熟bEGF蛋白其余部分的序列。

实施例4-DNA印迹分析以确定牛基因组中EGF基因的拷贝数

i)转移DNA到尼龙膜

为确定牛基因组EGF基因的拷贝数，用SEQ ID NO：3的片段与牛基因组DNA的DNA印迹进行杂交。简要地说，用限制酶BamH I、EcoR I、Hind III、Sac I和Xba I(New England BioLabs Inc.，目录号R0136S、R0101S、R0104S、R0156S、R0145S)在分别进行的反应中消化35μg牛基因组DNA过夜。消化的DNA在0.7％琼脂糖凝胶上用30V分离16小时，然后对凝胶染色。对所述凝胶照相后，将所述凝胶浸入0.2N HCl 10分钟，脱嘌呤处理所述DNA，然后用1.5MNaCl/0.5N NaOH在温和振荡下洗15分钟共三次，变性DNA。然后用10X SSC作为转移缓冲液，通过上升毛细管作用将DNA转移到带正电荷的尼龙膜(Roche Molecular Bioehemicals，目录号1 417 240)。24小时后，将所述膜置于印迹纸之间，在80℃烘烤3小时。

ii)探针制备

使用随机标记试剂盒(Roche Molecular Biochemicals，目录号1004 760)，用50μCi α³²PdCTP(Amersham Pharmacia Biotech，500Morgan Boulevard，Baie d’Urfe，QC H9X-3V1，Canada，目录号PB10205-250μCi)标记25ng SEQ ID NO：3的片段。使用NUC-TRAP柱(Stratagene，11011 North Torrey Pines Road，La Jolla，CA 92037，USA，目录号400 701)纯化所述探针。

iii)预杂交、杂交、洗涤和放射性自显影

所述膜在2X SSC中预润湿15分钟。在旋转式杂交烤箱中，42℃下在10ml体积中进行预杂交1小时，所述10ml体积内含50％去离子化甲酰胺、1％SDS、1M NaCl、10％硫酸葡聚糖和1mg变性的鲑鱼精子DNA。然后将所述探针加入所述预杂交缓冲液，在42℃进行杂交12小时。所述膜在100ml 2X SSC/1％SDS中室温下洗涤30分钟共两次；在200ml 0.2X SSC/0.1％SDS中60℃下洗涤1小时共两次；在200ml 0.1X SSC/0.1％SDS中60℃下洗涤30分钟共两次。所述膜对KODAK BIO-MAX MS底片(Kodak Canada，3500 EglintonAvenue West，Toronto，ON M6M 1V3，Canada，目录号1435726)曝光三天。

实施例5-分离cDNA

为证实得到的基因组序列被转录，克隆对应的eDNA。在含1X反转录缓冲液、10mM DTT、1mM dNTP混合物、40 U RNAse抑制剂和15U Thermoseript反转录酶(Life Teehnologies，目录号11146-024)的反应物中，用10pmol SEQ ID NO：14的引物在55℃下反转录1μg牛肾mRNA(Clontech，1020 East Meadow Circle，Palo Alto，CA 94303-4230，USA，目录号6824-1)1小时。在85℃失活所述反转录酶5分钟，加入100U RNAse H，所述反应物在37℃温育20分钟，然后在70℃加热10分钟。用QIAquick PCR纯化试剂盒(Qiagen Inc.，目录号28104)清洁所述cDNA。

在一个含1X PCR缓冲液(含1.5mM MgCl₂)、每种dNTP 0.2mM、0.4μM SEQ ID NO：16的引物、0.4μM SEQ ID NO：14的引物、0.625 U TAKARA Taq DNA POLYMERASE(Pan Vera Corporation，目录号TAKR001B)并加水到25μl的PCR反应物中，使用5μl所述反转录反应物作为模板。在94℃4分钟的起始变性步骤后，重复下面PCR循环五十次：(1)94℃30秒钟的变性步骤；(2)59℃30秒钟的退火步骤；(3)72℃30秒钟的延伸步骤；然后是72℃10分钟的最终延伸步骤。

将15μl加样到1.8％琼脂糖凝胶上，然后用溴化乙锭染色，在紫外光下显影。在琼脂糖凝胶上观察到所述反应的几种产物。从所述凝胶上切下一条稍大于400bp的带，纯化，使用所述DNA作为两个不同PCR反应的模板：一个反应使用SEQ ID NO：16和12的引物分别作为正向引物和反向引物；另一个反应使用SEQ ID NO：15和14的引物分别作为正向引物和反向引物。条件如上所述，只是仅进行35个循环。克隆并测序获得的片段(SEQ ID NO：17和18)，使用2版BLAST算法(Altschul等，1997)，发现所述序列与对应基因组序列98％同源。

实施例6-在大肠杆菌和巴斯德毕赤酵母中过量表达牛EGF成熟蛋白。

i)扩增没有内含子的成熟牛EGF蛋白编码序列

为产生用于过量表达成熟牛EGF蛋白的序列，必须去除分隔该序列的5kb内含子。在分别进行的反应中，用SEQ ID NO：6和12的引物扩增编码蛋白N末端的序列，用SEQ ID NO：13和14的引物扩增编码蛋白羧基末端的序列。在1.5mM MgCl₂存在下，使用5单位Pfu DNA POLYMERASE(Stratagene，目录号600153)，在94℃4分钟的起始变性步骤后，重复下面PCR循环三十次：(1)94℃30秒钟的变性步骤；(2)57℃30秒钟的退火步骤；(3)72℃30秒钟的延伸步骤；然后是72℃10分钟的最终延伸步骤。

所述PCR反应物在1.8％琼脂糖凝胶上分离，用溴化乙锭染色，用QIAquick凝胶提取试剂盒(Qiagen Inc.，目录号28704)纯化产物，并使用每种产物各1μl作为合成连接所述两个片段的单链的模板。用SEQ ID NO：6和15的引物(重叠N末端片段的3′端以及羧基片段的5′端)在正向扩增，完成所述合成。用QIAquick PCR纯化试剂盒(Qiagen Inc.，目录号28104)清洁所述单链产物，在50μl内洗脱。使用1μl所述洗脱物作为用SEQ ID NO：6和14的引物扩增的模板。如实施例2所述，从1.5％琼脂糖凝胶上纯化292bp产物，然后克隆到pGEMT-EASY TA克隆载体(Promega Corporation，目录号A1360)。

ii)构建大肠杆菌表达载体

可以购买到多种大肠杆菌表达载体，并可用于产生重组bEGF。在本文中，用载体pQE40(Qiagen Inc.，目录号32915)制备所述构建物，所述载体pQE40基于T5启动子转录-翻译系统，设计用于表达保护短肽例如EGF免受蛋白水解的鼠二氢叶酸还原酶(DHFR)融合蛋白。所述1ac阻抑物阻抑T5启动子；然而，加入异丙基-β-硫代半乳糖苷(IPTG)使1ac阻抑物失活，随后诱导所述重组蛋白的表达。用SEQID NO：18和19的寡核苷酸引物扩增编码成熟EGF蛋白并克隆进pGEMT-EASY TA克隆载体(Promega Corporation，目录号A1360)的序列。设计所述引物包含合适的限制位点(针对SEQ ID NO：18的引物的Sph I以及针对SEQ ID NO：19的引物的Hind III)，以便利将所得到的产物克隆进pQE40。SEQ ID NO：18的引物也包含因子Xa识别位点的编码序列。用Sph I和Hind III消化所述扩增产物，连接进用相似方式切割的pQE40。

iii)转化大肠杆菌并表达bEGF

通过热休克法(Sambrook等，1989)，使用构建物pQE40∷bEGF转化感受态大肠杆菌M15[pRep4]细胞(Qiagen Inc.，目录号34210)。然后将细胞接种到含25μg/ml卡那霉素和100μg/ml氨苄青霉素的LB琼脂上，在37℃培养过夜。为鉴定高水平表达的克隆，将转化子的单集落挑到含上述抗生素的1.5ml LB培养基内。将这些小培养物培养过夜，用于接种10ml含抗生素的LB培养基。然后这些培养物在37℃剧烈振荡下培养30分钟，直到OD₆₀₀达到0.5-0.7。加入IPTG达到1mM的终浓度，诱导重组蛋白的表达，然后再培养所述培养物4-5小时。在1500 RPM离心10分钟，收获细胞，然后重悬浮于400μl细胞裂解缓冲液，用Ni-NTA(Qiagen Inc.，目录号30210)纯化。用Ni-NTA柱(Qiagen Inc.，目录号30210)纯化重组的His的标记蛋白，通过SDS-PAGE和蛋白质印迹分析估计所产生蛋白的量。因此，高表达克隆可用于建立表达参数、测试纯化方法以及用于大规模生产所述重组蛋白。

iv)构建巴斯德毕赤酵母表达载体

通过PCR产生编码成熟牛EGF蛋白并适于插入巴斯德毕赤酵母表达载体的序列。制备名为“ExtraStop”和“ExtraTag”的两种用于细胞外表达的构建物。用引物alphaA bEGF正向(SEQ ID NO：20)和alphaA&ZB bEGF反向(SEQ ID NO：21)产生ExtraStop构建物。用alphaA bEGF正向引物和alpha AFXa&mycHIS反向引物(SEQ IDNO：22)产生ExtraTag构建物。这些引物包含限制酶识别位点，便利将得到的PCR产物克隆进巴斯德毕赤酵母表达载体(正向引物内的Xho I位点和反向引物内的Xba I位点)。使用这些引物扩增如以前所述制备的成熟牛EGF蛋白编码序列。在PCR循环中使用AmpliTaqDNA POLYMERASE(Applied Biosystems，850 Lincoln Centre Drive，Foster City CA，94404，USA，目录号N808-0160)，所述PCR循环重复三十五次，包括：(1)94℃1分钟的变性步骤；(2)65℃1分钟的退火步骤；(3)72℃4分钟的最终延伸步骤。

从1.5％琼脂糖凝胶纯化PCR产物，克隆进pGEMT-EASY克隆载体(Promega Corporation，目录号A1360)，以将所述构建物增殖进大肠杆菌。为传递所述bEGF编码序列进入巴斯德毕赤酵母表达载体，用Xho I和Xba I(New England BioLabs Inc.，目录号R0146S、R0145S)将该构建物从pGEMT中消化出来，凝胶纯化，然后连接进用相似方式消化的pPICZαA载体(Invitrogen Corporation，3985 BSorrento Valley Blvd.San Diego，CA 92121，USA，目录号V195-20)。使用连接的DNA转化感受态大肠杆菌MAX EfficiencyDH5α^TM感受态细胞(Life Technologies，目录号18258-012)，通过PCR筛选得到的转化子中存在的所需构建物。纯化质粒DNA，用于转化巴斯德毕赤酵母。

v)转化巴斯德毕赤酵母以及bEGF表达

如下制备巴斯德毕赤酵母细胞：将菌株GS115(InvitrogenCorporation，目录号K1710-01)的1-5ml过夜培养物接种到50ml新鲜YPD培养基(50ml)，在28℃振荡培养直到所述培养物OD₆₀₀达到1.2-1.5(约6小时)。通过离心，从20ml OD₆₀₀等于1.5的培养物收集细胞，用10mM Tris，1mM EDTA，0.1M LiCl和0.1M二硫苏糖醇缓冲液(pH 7.4)洗涤，然后重悬浮于1ml TE/LiCl/DTT缓冲液。所述悬浮液在30℃温育1小时；用1ml冰冷的水洗一次，用1ml冰冷的1M山梨糖醇洗一次；然后重悬浮于160μl冰冷的山梨糖醇，获得约10¹⁰细胞/ml的细胞浓度。事先用BstXI(New England BioLabs Inc.，目录号R0113S)线性化的表达构建物pPICZα∷bEGF(5-10μg)与80μl细胞混合，置于冰上冰冷的电穿孔小池(0.2cm电极距离)内5分钟。用GENE PULSER(Bio-Rad Laboratories，Ltd.，5671 McAdam Road，Mississauga，ON L4Z 1N9，Canada，目录号165 2105)在1.5kV，20μF，200Ω脉冲所述细胞。然后在所述小池内加入1ml冰冷的1M山梨糖醇，得到的混合物在30℃温育1-2小时。在含100μg/ml zeocin和1M山梨糖醇的YPD琼脂上选择zeocin抗性转化子。在BMGY肉汤中30℃，300rpm下培养分离物24小时，从zeocin抗性克隆生产生物量。离心收集细胞，重悬浮于诱导培养基(BMMY)，继续温育6-12天，每24小时加入无水乙醇达到0.5％的终浓度。收集培养物等分物，保存于-20℃直到进行分析。

vi)用Ni-NTA亲和树脂纯化表达的蛋白

使用Ni-NTA琼脂糖(Qiagen Inc.，目录号30210)纯化受到标记的蛋白。固定化在NTA磁性琼脂糖珠上的镍离子对多组氨酸有高亲和性。用于克隆bEGF序列进入大肠杆菌和巴斯德毕赤酵母的载体在重组蛋白的羧基末端(大肠杆菌则是在N末端)编码6个连续的组氨酸残基(6X尾)。用5倍体积的细胞裂解缓冲液(50mM NaH₂PO₄，pH 8.0中含300mM NaCl和10mM咪唑)洗涤Ni-NTA树脂(乙醇中的50％浆)的3ml等分物4次。将所述树脂重悬浮于3ml细胞裂解缓冲液中，用0.2M NaOH将pH调整到8.0。混合1ml悬浮的大肠杆菌或巴斯德毕赤酵母细胞以及100μl经过洗涤的树脂，获得纯化的蛋白。样品在温和搅拌下于4℃温育30分钟，然后用500μl洗涤缓冲液(50mMNaH₂PO₄，pH 8.0中含300mMNaCl和20mM咪唑)洗两次。用100ml洗脱缓冲液(50mM NaH₂PO₄，pH 8.0中含300mM NaCl和250mM咪唑)从所述浆中洗脱纯化的蛋白。通过用Xa因子(New England BioLabsInc.，目录号P8010S)切割，从大肠杆菌或巴斯德毕赤酵母产生的bEGF上除去所述His尾，并再次用Ni-NTA亲和树脂清洁bEGF蛋白(仅所述His尾结合所述树脂)。随后在细胞增殖/DNA合成测定中测试所述重组蛋白的生物活性。

实施例7-细胞增殖/DNA合成测定

从骨骼肌结缔组织分离牛纤维原细胞，在24孔板内含10％马血清(HyClone Laboratories，Inc.，1725 S.HyClone Road，Logan，UT 84321，USA，目录号SH30074.03)和碳酸氢钠的1ml MEM(Life Technologies，目录号23700)中培养到所需汇合水平。在所述培养基内加入重组bEGF或含bEGF的蛋白部分，在39℃下培养细胞18小时。重组人EGF(Sigma，3050 Spruce Street，St-Louis，MO，USA，目录号E9644)用作阳性对照，未添加的用作阴性对照。每个孔内加入1μCi/ml氚化胸苷(Amersham Pharmacia Biotech，目录号TRA310-250μCi)，在39℃继续温育所述培养物18小时。除去培养基后，用200μl PBS洗涤细胞两次，然后用0.1％胰蛋白酶在200μl体积内39℃下解吸附处理约30分钟。通过移液器尖吸进吸出破碎细胞后，取出125μl 用血球计数器计数细胞，在剩余部分中加入375μl冷的20％TCA，沉淀20分钟。然后将细胞转移到1.5ml离心管，每孔用200μl PBS洗涤，然后将洗涤的PBS加入合适的管中。所述管在14000rpm离心15分钟，将上清转移到闪烁小管。沉淀用200μl10％TCA洗涤，并再次离心。将上清液转移到同一闪烁管中，因此含有由所述细胞吸收但没有掺入DNA的标记胸苷。将所述沉淀用40μl 1N NaOH溶解10分钟，转移到含75μl 1N HCl的闪烁小管内，因此含有掺入DNA的标记胸苷。在所有小管内加入闪烁剂，在闪烁计数器(Beckman Coulter Inc.，4300 N.Harbor Boulevard，P.O.Box 3100，Fullerton，CA 92834-3100，USA，LS 6100C型)针对1分钟/样品计数。

参考文献

Altschul，S.F.，Madden，T.L.，Schaffer，A.A.，Zhang，J.，Zhang，Z.，Miller，W.和Lipman，D.J.(1997)缺口BLAST和PSI_BLAST：新一代的蛋白质数据库搜索程序.Nucleic Acids Res.25：3389-3402.

Ausubel，F.A.，Brent，R，Kingston，R.E.，Moore，D.D.，Sneidman，J.G.，Smith，J.A.和Struhl，K.(编辑)(1990)分子生物学的当前方法.GreenPublishing and Wiley-Interscienee，New York.

Bell，G.I.，Fong，N.M.，Stempien，M.M.，Wormsted，M.A.，Caput，D.，Ku，L.，Urdea，M.S.，Rall，L.B.和Sanchez-Pescador，R.(1986)人表皮生长因子前体：cDNA序列、体外表达和基因组织.Nucleic Acids Res.14：8427-8446.

Benkel，B.F.和Fong，Y.(1996)长程反向PCR(LR-IPCR)：延伸反向PCR的有用范围.Genetic Analysis：Biomol.Eng.13：123-127.

Buret，A.，Gall，D.G.，Olson，M.E.和Hardin，J.A.(1997)粘膜细胞因子的抗感染性质：表皮生长因子(EGF).Proc.Agric.Biotechnol.Workshop，AARI，P.19.

Carpenter，G.和Cohen，S.(1979)表皮生长因子.Ann.Rev.Biochem.48：193-216.

Clare，J.J.，Romanos，M.A.，Rayment，F.B.，Rowedder，J.E.Smith，M.A.，Payne，M.M.，Sreekrishna，K.和Henwood，C.A.(1991)在酵母中生产小鼠表皮生长因子：使用含多基因拷贝的巴斯德毕赤酵母(Pichiapastoris)进行高水平分泌.Gene 105：205-212.

Cooke，R.M.，Wilkinson，A.J.，Baron，M.，Pastore，A.，Tappin，M.J.，

Campbell，I.D.，Gregory，H.和Sheard，B.(1987)人表皮生长因子的溶液结构.Nature 327：339-341.

Donovan，S.M.和Odle，J.(1994)乳中的生长因子作为婴儿发育的媒介物.Ann.Rev.Nutr.14：147.

Fisher，D.(2000)杂种识别：组合推导的性质以及进化信息.PacificSymp.Biocomputing，Hawaii，119-130，January 2000，World Scientific.Gray，A.，Dull，T.J.和Ullrich，A.(1983)表皮生长因子cDNA的核苷酸序列预测一个128,000分子量的蛋白前体.Nature 303：722-725.

Hollenberg，M.D.和Gregory，H.(1980)表皮生长因子-抗溃疡素：衍生物的生物活性和受体结合.Mol.Pharmacol.17：314-320.

Kim，J.G.，Vallet，J.L.和Christenson，R.K.(2001)表征猪怀孕期间的子宫表皮生长因子.Domestic Animal Endocrinology 20(4)：253-265.Lewin，B.(1997)Genes VI，Oxford University Press，Menlo Park，CA，USA.

Miller，S.A.，Dykes，D.D.和Polesky，H.F.(1988)从人有核细胞提取DNA的一种简单盐析程序.Nucleic Acids Res.16：1215.

Nasim，M.T.，Jaenicke，S.，Belduz，A.，Kollmus，H.，Flohe，L.和McCarthy，J.E.(2000)真核细胞硒代半胱氨酸掺入遵循与翻译终止竞争的非进行性机制.J.Biol.Chem.275：14846-14852.

Ochman，H.，Gerber，A.S.和Hartl，D.L.(1988)反向聚合酶链反应的遗传应用.Genetics120：621-623.

Saggi，S.J.，Safirstein，R.和Price，P.M.(1 992)大鼠前原表皮生长因子cDNA的克隆和测序：与小鼠和人序列的比较.DNA Cell Biol.11：481-487.

Sambrook，J.，Fritsch，E.F.和Maniatis，T.(1989)Molecular Cloning.ALaboratory Manual.第二版.Cold Spring Harbor Laboratory Press.ColdSpring Harbor，New York.

Shin，S.Y.，Watanabe，M.，Kako，K.，Ohtaki，T.和Munekata，E.(1994)人表皮生长因子(h-EGF)的结构-活性关系.Life Science 55：131-139.Simpson，R.J.，Smith，J.A.，Mortiz，R.L.，O′Hare，M.J.，Rudland，P.S.，Morrison，J.R.，Lloyd，C.J.，Grogo，B.，Burgess，A.W.和Nice，E.E.(1985)大鼠表皮生长因子：完整氨基酸序列。与对应小鼠和人蛋白的同源性；分离有完整体外生物活性的两端截短的形式.Eur.J.Biochem.153：629-637.

Stewart，F.，Powel，C.A.，Lennard，S.N.，Allen，W.R.，Amet，L.和Edwards，R.M.(1994)鉴定马表皮生长因子(EGF)编码序列及其在监测怀孕母马子宫内膜中EGF基因表达中的应用.J.Mol.Endo.12：341-350.

Stone，N.E.，Schmutz，J.J.，Shang，J.，Cox，D.R.和Myers，R.M.智人(Homo sapiens)染色体4克隆B207D4 map4q25，完整序列.GenBank登记号AC004050，1998年1月28日提交。

Tadaki，D.K.和Niyogi，S.K.(1993)人表皮生长因子位置13的酪氨酸的疏水性在受体结合中的功能重要性.J.Biol.Chem.268：10114-10119。

Tate，W.P.，Mansell，J.B.，Mannering，S.A.，Irvine，J.H.，Major，L.L.和Wilson，D.N.(1999)UGA：蛋白质合成中“停止”和重编码的双重信号.[综述].Biochemistry 64：1342-1353.

van Rooijen，G.J.H.和Moloney，M.M.(1994)植物种子油体用作外源蛋白的载体.Bio/Technology 13：72-77.

Watson，J.D.，Hopkins，N.H.，Roberts，J.W.，Steitz，J.A.和Weiner，A.M.(1985)Molecular Biology of the Gene.第1卷.第4版.TheBenjamin/Cummings Publishing Company，Inc.Menlo Park，CA，USA.

Zijlstra，R.T.，Odle，J.，Hall，W.F.，Petschow，B.W.，Gelberg，H. B.和Litoy，R.E.(1994)口服给予表皮生长因子对于感染轮状病毒的新生猪的肠恢复的效应.J.Ped.Gastroent.Nutr.19：382-390.

专利文件

Barr，P.J.，Merryweather，J.P.，Mullenbach，G.T.，Urdea，M.S.和Valenzuela，P.人表皮生长因子基因及其合成和表达。美国专利第5,096,825号，1992年3月17日发布。

Buret，A.G.，Gall，D.，Hardin，J.A.和Olson，M.E.应用表皮生长因子作为胃肠治疗剂。美国专利第5,753,622号，1998年5月19日发布。

Langrehr，J.S.preruminant小牛的饲料强化剂(fortifier)和增强剂及其应用方法.美国专利第5,785,990号，1998年7月28日发布。

Wilson，T.J.G.，Tivey，D.R.，Smith，M.W.，James，P.S.和Peters，T.J.国际专利公开第WO 88/04180号，1988年6月16日公开.

本说明书内提到的所有公开物都象征本发明所涉及的本领域内技术人员的技术水平。所有公开物都通过引用结合到本文中，其程度等同于特定并单独地指示各个公开物通过引用结合到本文中。

本说明书中使用的术语和表达方式除在本文中专门定义外，作为描述但非限制性的术语使用。当使用所述术语和表达方式时，无意排除举例说明和描述的特征的等价物，本发明的范围仅受下面权利要求的定义和限制。

序列表

<110>Her Majesty the Queen in Right of Canada as Represented by the

Minister of Agriculture and Agri-Food

<120>牛表皮生长因子的核酸序列和蛋白质序列

<130>24012WOO

<140>未定

<141>未定

<150>美国临时申请号60/292,136

<151>05/18/2001

<160>23

<170>PatentIn version 3.1

<210>1

<211>23

<212>DNA

<213>简并序列

<220>

<221>misc_feature

<222>(6)..(6)

<223>n为a，c，t或g

<220>

<221>misc_feature

<222>(18)..(18)

<223>n为a，c，t或g

<400>1

gacacntgya caaatacnga ggg 23

<210>2

<211>23

<212>DNA

<213>简并序列

<400>2

gaygggtact gcctccaygr tgg 23

<210>3

<211>1456

<212>DNA

<213>普通牛(Bos taurus)

<220>

<221>外显子

<222>(2)..(56)

<223>

<220>

<221>内含子

<222>(57)..(1376)

<223>

<220>

<221>外显子

<222>(1377)..(1456)

<223>

<400>3

a aac cac act tgc acg tgt gct ggc gac ttg tct gag cct gga cag att 49

Asn His Thr Cys Thr Cys Ala Gly Asp Leu Ser Glu Pro Gly Gln Ile

1 5 10 15

tgc cct g gtaggttggt gggtggtttg gatccaaggg gagggacttg attcccaaaa 106

Cys Pro

aatctctact taagtgtgtt ttcattagag cttcaagaaa tcatttggtt caatcaggct 166

ggtgagtttc ctctcctgat tagattgatg ataaggtcga gaatgaaatg gtccaagttt 226

tcttaattta atagcatctg gaataaatcc ttttttatta ttcacaatgc aatataggtg 286

agaacacagg tggttctctt taactattca gttaatgtcc tgatttgtaa tgttgatttk 346

gggggccgct gggagaactt ggcagggcta gacaggttgg ggaggatgtc tggtctgctg 406

gcattttgaa tcactttcaa ggattttaaa gtattacttt aaaaagtcag tatttcttga 466

gctgaatgag aactttttaa attgttaatt atacccattt ctgcttcctg aaacctcccc 526

ctgcaaaagc agtatcttct caccatcagc actccagaat ggggaggggt ggtcagaggg 586

tggcgggggg ttggcttcaa agacaccaga agccagaatc agcttagtca ctgacagcca 646

tttacccatc tcagccctgc aagcagaaaa catcctgaaa aaggaaaatt cggcacttgt 706

ttggggctct ggtttttcag tatattattt tctcaaataa tttgctcttc ttagaggtat 766

tgaaaaactc ctaatactta tgtagtcagc tacacaccct aatgtttttc ttttaaagag 826

cagcgaacca ttaataaaaa gggacttttc cacttgggca tcccctctgt tatggtaaca 886

tttcctctct gtcaaagttg ctagtcctgt ctttgagggc tcccctgaaa gttaaatgcg 946

tttagaagca agtatcctgt gggataaaat tttgagactc cagggaactg ggggtaattg 1006

actggatagt ggtgggtggt tacaagccat gaagagagac ggttgttcag tgagaccctc 1066

ttaagctaac tgttgtttta catggtgtgt ttttatagat gacagatggc ttttataaga 1126

gatctgtact cagggttcat atggtcttag gattgaccat tctcttactt gcctccaata 1186

tactttatgt caaatagtgc tgaacctcaa gcaaaatggg tgactccata gcaaattcat 1246

aaggtctggt taagaaagtg aaattattgt tccatatgac aaattgttca cagaaactag 1306

ttcctgatgt tgatatctga aagactccag tcacttcaga aagtaaaaga aatgcctttg 1366

attcttctag ac tct act ctg ctg tct cac ctt ggg aag aat gga cac 1414

Asp Ser Thr Leu Leu Ser His Leu Gly Lys Asn Gly His

20 25 30

aat ttt ttg aaa aaa tgt ttc cct gaa tat acc ccg aat ttt 1456

Asn Phe Leu Lys Lys Cys Phe Pro Glu Tyr Thr Pro Asn Phe

35 40 45

<210>4

<211>21

<212>DNA

<213>普通牛(Bos taurus)

<400>4

gaccattctc ttacttgcct c 21

<210>5

<211>21

<212>DNA

<213>普通牛(Bos taurus)

<400>5

agagggtctc actgaacaac c 21

<210>6

<211>22

<212>DNA

<213>普通牛(Bos taurus)

<400>6

tgtctcacct tgggaagaat gg 22

<210>7

<211>20

<212>DNA

<213>普通牛(Bos taurus)

<400>7

ccgctgggag aacttggcag 20

<210>8

<211>7387

<212>DNA

<213>普通牛(Bos taurus)

<220>

<221>内含子

<222>(1)..(485)

<223>

<220>

<221>CDS

<222>(486)..(609)

<223>

<220>

<221>内含子

<222>(610)..(1930)

<223>

<220>

<221>CDS

<222>(1931)..(2075)

<223>

<220>

<221>内含子

<222>(2076)..(7227)

<223>

<220>

<221>CDS

<222>(7228)..(7387)

<223>

<220>

<221>mat_peptide

<222>(1981)..()

<223>

<220>

<221>misc_feature

<222>(537)..()

<223>TGN为Xaa，Xaa可能为硒代半胱氨酸

<220>

<221>misc_feature

<222>(537)..()

<223>N为a，Xaa可能为硒代半胱氨酸

<220>

<221>misc_feature

<222>(7228)..()

<223>成熟蛋白于残基7228终止

<400>8

cagcgatgga aaattaaaga aggaaggacc taaaggttat ggtggtgata ctaagaaaag 60

aaaaagatgg gtagttggga aagaaagaga tgatttcatt tatatctgtg ttaaaagggc 120

aaaatgtttt atttaatagg atctgaactt ctaaatgttt acctagagat agttwaccat 180

ctccaacttt cccacggagc tatttgtgct gggaagtttc ctttccttcc aagcagtagg 240

gaagcttcca gcctgacatc aggagtttac ctgcatgggt atgcacccca gggacccagt 300

tcatctctct ttccaacatg gataatagaa tttttgaatc taaaaatgta cagagctctg 360

agaacatgta tcatgacaca aattgaagat gcttcttttc cagaatattg ggtttttcaa 420

ttactatatg agcctctgat ctcctctgca cctcactttt ctctttccta ctcctttttc 480

ctgga gat att gat gag tgc cga cgg ggc gtg cac agc tgt ggg gaa aat 530

Asp Ile Asp Glu Cys Arg Arg Gly Val His Ser Cys Gly Glu Asn

-55 -50 -45

gcc acc tgn aca aat atg gag gga aac Gac act tgc acg tgt gct ggc 578

Ala Thr Xaa Thr Asn Met Glu Gly Asn His Thr Cys Thr Cys Ala Gly

-40 -35 -30

gac ttg tct gag cct gga cag att tgc cct g gtaggttggt gggtggtttg 629

Asp Leu Ser Glu Pro Gly Gln Ile Cys Pro

-25 -20

gatccaaggg gagggacttg attcccaaaa aatctctact taagtgtgtt ttcattagag 689

cttcaagaaa tcatttggtt caatcaggct ggtgagtttc ctctcctgat tagattgatg 749

ataaggtcga gaatgaaatg gtccaagttt tcttaattta atagcatctg gaataaatcc 809

ttttttatta ttcacaatgc aatataggtg agaacacagg tggttctctt taactattca 869

gttaatgtcc tgatttgtaa tgttgatttk gggggccgct gggagaactt ggcagggcta 929

gacaggttgg ggaggatgtc tggtctgctg gcattttgaa tcactttcaa ggattttaaa 989

gtattacttt aaaaagtcag tatttcttga gctgaatgag aactttttaa attgttaatt 1049

atacccattt ctgcttcctg aaacctcccc ctgcaaaagc agtatcttct caccatcagc 1109

actccagaat ggggaggggt ggtcagaggg tggcgggggg ttggcttcaa agacaccaga 1169

agccagaatc agcttagtca ctgacagcca tttacccatc tcagccctgc aagcagaaaa 1229

catcctgaaa aaggaaaatt cggcacttgt ttggggctct ggtttttcag tatattattt 1289

tctcaaataa tttgctcttc ttagaggtat tgaaaaactc ctaatactta tgtagtcagc 1349

tacacaccct aatgtttttc ttttaaagag cagcgaacca ttaataaaaa gggacttttc 1409

cacttgggca tcccctctgt tatggtaaca tttcctctct gtcaaagttg ctagtcctgt 1469

ctttgagggc tcccctgaaa gttaaatgcg tttagaagca agtatcctgt gggataaaat 1529

tttgagactc cagggaactg ggggtaattg actggatagt ggtgggtggt tacaagccat 1589

gaagagagac ggttgttcag tgagaccctc ttaagctaac tgttgtttta catggtgtgt 1649

ttttatagat gacagatggc ttttataaga gatctgtact cagggttcat atggtcttag 1709

gattgaccat tctcttactt gcctccaata tactttatgt caaatagtgc tgaacctcaa 1769

gcaaaatggg tgactccata gcaaattcca taaggtctgg ttaagaaagt gaaattattg 1829

ttccatatga caaattgttc acagaaacta gttcctgatg ttgatatctg aaagactcca 1889

gtcacttcag aaagtaaaag aaatgccttt gattcttcta g ac tct act ctg ctg 1944

Asp Ser Thr Leu Leu

-15

tct cac ctt ggg aag aat gga cac aat ttt ttg aaa aaa tgt ttc cct 1992

Ser His Leu Gly Lys Asn Gly His Asn Phe Leu Lys Lys Cys Phe Pro

-10 -5 -11

gaa tat acc ccg aat ttt gaa ggg tac tgc ctc aat ggt cgt gtc tgt 2040

Glu Tyr Thr Pro Asn Phe Glu Gly Tyr Cys Leu Asn Gly Arg Val Cys

5 10 15 20

ata tat ttt ggc att gcc aac ctg ttc tcc tgc ca gtaagtcaaa 2085

Ile Tyr Phe Gly Ile Ala Asn Leu Phe Ser Cys His

25 30

ctatttttct gtagagatat gatattgcag cccataagtt ttagtgaatt caaaaaattt 2145

atattgagat ttttctataa ttaaactttt ccatagtgaa aaatatatgt aatttatata 2205

tgtaaatctg ggcttcccac atggtgcagc aataaagaat ctgcctgccc gtgcaggaga 2265

ggcaggaaac tcggattccg tgcctgggtc agggaagagc ctctggagga ggaagtasca 2325

acccattcca gtattctttc ctggaggtgg agagaggagc ctagtgggct tacagtccat 2385

ggggtcgcag agtctgacat gactgagcac acacacacac gtaaatctgt tatttacata 2445

tatatatata tatatatata tataaaatgt gtgtattaca ctctttctga atatttcaca 2505

cacaccccag gtgtcagtgg caaatatgaa atttaaggaa ttgggtgatt tcccctctga 2565

cttaaataac ttgctgttac tactggtaca gtctgggaag taaactgaga gaatttctta 2625

aaacttctat tttatgccaa atagatgggg agcatcagtg ctgcgtttct aaattttaaa 2685

aagtgttaca tacagtcaca ctgggcctcc atttttctcc ctgtacatcc taatagttgg 2745

cgtttgcatt tttgttgtta acaactgata aatgcagcca cggctgcctt tgytctgcct 2805

tggtcaccgt gatggctttg gtgggttatg tgtcagcctg ctcccaccat actccctcaa 2865

aaccgtgccc ctcagtcttt agtaaaacca cacccagaag atctagttct gtatcaaatc 2925

ttacttttag taactttcat aatctgaagg caatctgagg gaatggatag atactgaaaa 2985

ataaataggt ctcttctggc yggcctcctg actcagtgat aattttctct gtgcctaatg 3045

atggagtgag agagtacgtt gatcctcata agtaggtgct ataagcttaa aagctttgat 3105

tattaatcat aattagtaga aacatagtct aaattactag aataaattat attctgtgat 3165

gaagactatg gccttgcatt agaaatcaca tcatcctgac aaaaatagtg ggaaatgttt 3225

gtaaatatta gaaaaaataa ctcagtccta atagaaatct gttttcatat tcatatttca 3285

tgccatggtt ttctaaccta agataaattt agtacttgat gataatcatt gttgattttg 3345

ataataagga tcaaattgtt ttcatctgtt catggctttt tattattccc agtaatgaaa 3405

ttatgaaaac aagtatccta gcaatggttt atgtttctct ctgacacttt aacttcggat 3465

tattaaaggc attataagaa gaagaagggt actgcagagt tatgtattgt agttagcaca 3525

tcaatttcac ttggaactga tagcaccaat cattaaatgt cttgtgaaca ctctttagca 3585

cactgctttc gtttctgtca ttaaaaccca atgaaaatat catattcctc taataatatt 3645

ttaaatatga gttgctacaa aatgacaatt aaactggatc taacacttaa atttaagcac 3705

ctttaatggc accccactcc agtactctta cccggaaaat cccatgcaca gaggagcctg 3765

gtagactgaa atccatgggg tcacaaagag tcagacatga ctgagcgact tcactttcac 3825

ttttcacttt catgcattgg aggaggaaat ggcaacccac tccagtgttc ctgcctggag 3885

aatcccaggg acgggggagc ctggtgggct gccgtctatg gggttgcaca gagtcggacr 3945

cgactgaagc gacttagcag cagcagcagc agcaatcaaa agcaatattt aaaatatcac 4005

ctgagttctc attaatctgg atcataattt gtttttgaat tctatatcta ataaaaacat 4065

ggatttgtca gatatccaac ccttccatgc cccagtgacc tcaccttgta tttttttaat 4125

tccataaaaa gaaaacatct ctagggagtg cttctcagtc caacggttat tagaaacatc 4185

tcacaggcat cattctgcac atgtatacat gagtgctaag ttacttcagt catgttcaac 4245

tctgtgcgac cctgtggacc aygcccacca agctcctctg tccatgggat tcttcaagca 4305

agaatactag agtggttgca tgccttcctc caggggatct tcccaaycca gggactgaac 4365

ccaggtcgtc tgcatctcct gcattggcag gtgggttctc taccactagc gccacctggg 4425

aagcccagag actgttcacg atgttgtgag caggttagta aaggaacttt cttccttcct 4485

tgcttggagg caatggaagc tcccctccca gatgtaggaa atcccagctg ccctggggat 4545

gcagaggata tgagaaccgg aagtctctac accacaggcc tcctcagagg gcccctgctc 4605

gggggttctc agaggattcc aaacctcttg agcacagaag aggtcctcat ttattctggt 4665

ttggctctga accaacccac agcctctagg gcaggtcttc ttcagcccaa gttgcccaaa 4725

ctatggtgct gtgaaatgtt tcatgagaaa aggatcatgt ggcacagttt aagaaatgct 4785

gcttacgcta gccttcaatt cttgattcat ggtcaccaca acgtgtgaaa aagtcttgtt 4845

gacctttgtt tagtccagaa cttgaaattg tttgaccatg gaaccaagct tattcggcta 4905

ggaaactttc tgtttaatgt aggagaagaa ttaatcaaaa cccaaaaaat tagtgatgtg 4965

tggcctgccc ttgtgaaatg ctggctgatt gctctgggcc ttataaggct gaaaggcttt 5025

gatatcgcag cctgcttaac tctccagact cttatcatgt gcttgactta ttacttgaga 5085

ctttatgatc tctgagagga tcggaggtgt ggcctgttaa tatccaccag tttaaaaatg 5145

gctgctaggt gttaataatg gatgtgtata accaatgggt tgttgttaaa acatgtgttg 5205

ttgttaaatg gatgtgttaa aacagcatca gcaaagccag gaataactgg atggtcctcc 5265

atggtgctat actcagatcg tgcatgctct tgcagagtca gaacagtttt tcagaggtgc 5325

atggaactga aaactctttt tggatgtggc ccaacgtagt agaaagaata cagactttga 5385

aatcagagaa ccatttgaat caaaactacc attcactagg cgtgtgacct ggtacaaatt 5445

atgtaactcc tttgcatctc actttcctca tctataaaat ggaaatctac cattgagaac 5505

aaaacaaaag tgcccagcgt tcagctgctg agtcatgtct gactctttgc aaccccgtgg 5565

attgtagcat gccaggcccc cctgtcctac actatctcct ggagtttgct cagattcatg 5625

tcccttgagt cggtgatgct atctaactat cccagtatca gaaacataat gtgtatagca 5685

aacgctggtt tctttccctt ctgtctctga aagtgacttg ccaaaagctc ctatgactaa 5745

ctcaaggtac aactaggact agacttgaga tctcttctgg ggcttgatcc atgcaggaga 5805

tgcatgattc atctaaagct tgtcccttgc tgcctcttcc catcatgggg actgatgtcc 5865

attctctgtg tattcatacc ttcatctcct tctggaataa agtgggggca tgggtatata 5925

gttagtggat ccagggccaa ggggaagaaa ttcctaacaa gtgagcatca caaaatgctt 5985

agtagactat ttctaaagtt tatgctcttt caaagaataa ttaattctac tcaagatcct 6045

gagaggctct ggaagcatgc attcccagta gatggcagca tggtttcatt tactttcaca 6105

caaaagttca cagcctgtgt tggttgctaa tagtgttagt cactccgtcc catcttgtgt 6165

cttggacttc ttgagacccc atggactgta gcccaccagg cttctctgtc catgggattc 6225

cccaggcaag aatactggag taggtagcca ttcccttctt caacgtgtat cttcccaacc 6285

cagggatcga acccaggtct ccattacagg cagatacttt atctacatat ctaagccacc 6345

agggaggccc catatgaaca acaataattc cagtaacagt ttcaccaatg aacagcggga 6405

tgttggtgaa tgccgctttt ccctccactt agtttttctc tcttgaagaa agtaagtgtg 6465

tgcttattgt taccactgag accttttgga tctatgacct ttaagaaaaa agtaagaaaa 6525

atggtttcct ctgcttcctg ttcagaggct actcacattc ttttataacc tggtctcaag 6585

taaaagactc tgctttcaaa ttcttccttc ctttgactta tattgattgc aatctggcca 6645

aacatttgtt tgtaaactcc ctttgctcct agggcagggt tgctttgtgt tggtcttaga 6705

gagaggcagt tcttctttta acagaaattg attcttaatc agtgttctgc agtgccttat 6765

agaggtggta tgcaaataac cctgaatcaa tccctgggct cagtcatgtc agactaagtt 6825

tatgctgcag taacttgtag atcagagtgc tttcaacttg acccgtttgg cttcctgggg 6885

tgtcagcggt aaagagactt gcctgccagt acaggagaca cggttcgatc cttgggtcgg 6945

gcagatccct tgaagaaaga aatggccaac ccattccagt attttcttgc ctggaaaatc 7005

ccatggacag aggagcctgg tgggctacag tccatggggt tgcaagagtg ggacacagct 7065

gagtgactga acaacagcag caactgagcc ctgatggatt ttccatattc ttcacaaagt 7125

atgaggctga agtgtagagg ctgagagatg actggctagt acaagaatgt aagtgtttct 7185

ggccatggct cactgctgac ttctgtctgt gtgttgccgc ag c tgt ccc att ggc 7240

Cys Pro Ile Gly

35

tac cct ggg aag cga ggt gag tac ata gac ttc gat ggg tgg gat ccg 7288

Tyr Pro Gly Lys Arg Gly Glu Tyr Ile Asp Phe Asp Gly Trp Asp Pro

40 45 50

cac agt gca ggc cgt ggg cat cag tgg aac acc agc ccg gtg gct gtc 7336

His Ser Ala Gly Arg Gly His Gln Trp Asn Thr Ser Pro Val Ala Val

55 60 65

cgt gcg ctg gtg ctg gct ttc ctg ctg ctc ctc ggg ctg tgc aga gct 7384

Arg Ala Leu Val Leu Ala Phe Leu Leu Leu Leu Gly Leu Cys Arg Ala

70 75 80

cac 7387

His

85

<210>9

<211>143

<212>PRT

<213>普通牛(Bos taurus)

<220>

<221>misc_feature

<222>(-41)..(-41)

<223>位置-41的’Xaa’代表终止密码子，Trp或Cys。

<220>

<221>misc_feature

<222>(537)..()

<223>TGN为Xaa，Xaa可能为硒代半胱氨酸

<220>

<221>misc_feature

<222>(537)..()

<223>N为a，Xaa可能为硒代半胱氨酸

<220>

<221>misc_feature

<222>(7228)..()

<223>成熟蛋白于残基7228终止

<400>9

Asp Ile Asp Glu Cys Arg Arg Gly Val His Ser Cys Gly Glu Asn Ala

-55 -50 -45

Thr Xaa Thr Asn Met Glu Gly Asn His Thr Cys Thr Cys Ala Gly Asp

-40 -35 -30

Leu Ser Glu Pro Gly Gln Ile Cys Pro Asp Ser Thr Leu Leu Ser His

-25 -20 -15

Leu Gly Lys Asn Gly His Asn Phe Leu Lys Lys Cys Phe Pro Glu Tyr

-l0 -5 -11 5

Thr Pro Ash Phe Glu Gly Tyr Cys Leu Asn Gly Arg Val Cys Ile Tyr

10 15 20

Phe Gly Ile Ala Asn Leu Phe Ser Cys His Cys Pro Ile Gly Tyr Pro

25 30 35

Gly Lys Arg Gly Glu Tyr Ile Asp Phe Asp Gly Trp Asp Pro His Ser

40 45 50

Ala Gly Arg Gly His Gln Trp Asn Thr Ser Pro Val Ala Val Arg Ala

55 60 65 70

Leu Val Leu Ala Phe Leu Leu Leu Leu Gly Leu Cys Arg Ala His

75 80 85

<210>10

<211>159

<212>DNA

<213>普通牛(Bos taurus)

<220>

<221>mat_peptide

<222>(1)..()

<223>

<220>

<221>CDS

<222>(1)..(159)

<223>

<400>10

aaa tgt ttc cct gaa tat acc ccg aat ttt gaa ggg tac tgc ctc aat 48

Lys Cys Phe Pro Glu Tyr Thr Pro Asn Phe Glu Gly Tyr Cys Leu Asn

1 5 10 15

ggt cgt gtc tgt ata tat ttt ggc att gcc aac ctg ttc tcc tgc cac 96

Gly Arg Val Cys Ile Tyr Phe Gly Ile Ala Asn Leu Phe Ser Cys His

20 25 30

tgt ccc att ggc tac cct ggg aag cga ggt gag tac ata gac ttc gat 144

Cys Pro Ile Gly Tyr Pro Gly Lys Arg Gly Glu Tyr Ile Asp Phe Asp

35 40 45

ggg tgg gat ccg cac 159

Gly Trp Asp Pro His

50

<210>11

<211>53

<212>PRT

<213>普通牛(Bos taurus)

<400>11

Lys Cys Phe Pro Glu Tyr Thr Pro Asn Phe Glu Gly Tyr Cys Leu Asn

1 5 10 15

Gly Arg Val Cys Ile Tyr Phe Gly Ile Ala Asn Leu Phe Ser Cys His

20 25 30

Cys Pro Ile Gly Tyr Pro Gly Lys Arg Gly Glu Tyr Ile Asp Phe Asp

35 40 45

Gly Trp Asp Pro His

50

<210>12

<211>19

<212>DNA

<213>普通牛(Bos taurus)

<400>12

tggcaggaga acaggttgg 19

<210>13

<211>18

<212>DNA

<213>普通牛(Bos taurus)

<400>13

ctgtcccatt ggctaccc 18

<210>14

<211>18

<212>DNA

<213>普通牛(Bos taurus)

<400>14

gagctctgca cagcccga 18

<210>15

<211>35

<212>DNA

<213>普通牛(Bos taurus)

<400>15

gccaacctgt tctcctgcca ctgtcccatt ggcta 35

<210>16

<211>17

<212>DNA

<213>普通牛(Bos taurus)

<400>16

gacggggcgt gcacagc 17

<210>17

<211>408

<212>DNA

<213>普通牛(Bos taurus)

<220>

<221>misc_feature

<222>(36)..(36)

<223>n为A，tga可能编码硒代半胱氨酸

<220>

<221>CDS

<222>(1)..(408)

<223>

<220>

<221>mat_peptide

<222>(157)..()

<223>

<220>

<221>misc_feature

<222>(331)..()

<223>成熟肽于位置331终止

<400>17

cgg ggc gtg cac agc tgt ggg gaa aat gcc acc tgn aca aat atg gag 48

Arg Gly Val His Ser Cys Gly Glu Asn Ala Thr Xaa Thr Asn Met Glu

-50 -45 -40

gga aac cac act tgc acg tgt gct ggc gac ttg tct gag cct gga cag 96

Gly Asn His Thr Cys Thr Cys Ala Gly Asp Leu Ser Glu Pro Gly Gln

-35 -30 -25

att tgc cct gac tct act ctg ctg tct cac ctt ggg aag aat gga cac 144

Ile Cys Pro Asp Ser Thr Leu Leu Ser His Leu Gly Lys Asn Gly His

-20 -15 -10 -5

aat ttt ttg aaa aaa tgt ttc cct gaa tat acc ccg aat ttt gaa ggg 192

Asn Phe Leu Lys Lys Cys Phe Pro Glu Tyr Thr Pro Asn Phe Glu Gly

-11 5 10

tac tgc ctc aat ggt cag gtc tgt ata tat ttt ggc att gcc aac ctg 240

Tyr Cys Leu Asn Gly Gln Val Cys Ile Tyr Phe Gly Ile Ala Asn Leu

15 20 25

ttc tcc tgc caa tgt ccc att ggc tac cct ggg aag cga ggt gag tac 288

Phe Ser Cys Gln Cys Pro Ile Gly Tyr Pro Gly Lys Arg Gly Glu Tyr

30 35 40

ata gac ttc gat ggg tgg gat ccg cac agt gca ggc cgt ggg cat cag 336

Ile Asp Phe Asp Gly Trp Asp Pro His Ser Ala Gly Arg Gly His Gln

45 50 55 60

tgg aac acc agc ccg gtg gct gtc cgt gcg ctg gtg ctg gct ttc ctg 384

Trp Asn Thr Ser Pro Val Ala Val Arg Ala Leu Val Leu Ala Phe Leu

65 70 75

ctg ctc ctc ggg ctg tgc aga gct 408

Leu Leu Leu Gly Leu Cys Arg Ala

80

<210>18

<211>136

<212>PRT

<213>普通牛(Bos taurus)

<220>

<221>misc_feature

<222>(-41)..(-41)

<223>位置-41的’Xaa’代表终止密码子，Trp或Cys。

<220>

<221>misc_feature

<222>(36)..(36)

<223>n为A，tga可能编码硒代半胱氨酸

<220>

<221>misc_feature

<222>(331)..()

<223>成熟肽于位置331终止

<400>18

Arg Gly Val His Ser Cys Gly Glu Asn Ala Thr Xaa Thr Asn Met Glu

-50 -45 -40

Gly Asn His Thr Cys Thr Cys Ala Gly Asp Leu Ser Glu Pro Gly Gln

-35 -30 -25

Ile Cys Pro Asp Ser Thr Leu Leu Ser His Leu Gly Lys Asn Gly His

-20 -15 -10 -5

Asn Phe Leu Lys Lys Cys Phe Pro Glu Tyr Thr Pro Asn Phe Glu Gly

-11 5 10

Tyr Cys Leu Asn Gly Gln Val Cys Ile Tyr Phe Gly Ile Ala Asn Leu

15 20 25

Phe Ser Cys Gln Cys Pro Ile Gly Tyr Pro Gly Lys Arg 6ly Glu Tyr

30 35 40

Ile Asp Phe Asp Gly Trp Asp Pro His Ser Ala Gly Arg Gly His Gln

45 50 55 60

Trp Asn Thr Ser Pro Val Ala Val Arg Ala Leu Val Leu Ala Phe Leu

65 70 75

Leu Leu Leu Gly Leu Cys Arg Ala

80

<210>19

<211>43

<212>DNA

<213>普通牛(Bos taurus)

<400>19

ggcatgcata gaaggaagaa aatgtttccc tgaatatacc ccg 43

<210>20

<211>27

<212>DNA

<213>普通牛(Bos taurus)

<400>20

caagcttagt gcggatccca cccatcg 27

<210>21

<211>37

<212>DNA

<213>普通牛(Bos taurus)

<400>21

gctcgagaaa agaaaatgtt tccctgaata taccccg 37

<210>22

<211>43

<212>DNA

<213>普通牛(Bos taurus)

<400>22

gctcgaggcc gccatggcca aatgtttccc tgaatatacc ccg 43

<210>23

<211>46

<212>DNA

<213>普通牛(Bos taurus)

<400>23

cctctagatt tcgcccttct atgtgcggat cccacccatc gaagtc 46

<210>24

<211>435

<212>DNA

<213>小家鼠(Mus musculus)

<300>

<301>Gray，A.，Dull，T.J.和Ullrich，A.

<302>表皮生长因子cDNA的核苷酸序列预示着一个128,000分子量的蛋白前体

<303>Nature

<304>303

<306>722-725

<307>1983

<308>GenBank登记号J00380

<313>相关残基3108-3539

<400>24

gatattgacg agtgccagcg gggggcgcac aactgcgctg agaatgccgc ctgcaccaac 60

acggagggag gctacaactg cacctgcgca ggccgcccat cctcgcccgg acggagttgc 120

cctgactcta ccgcaccctc tctccttggg gaagatggcc accatttgga ccgaaatagt 180

tatccaggat gcccatcctc atatgatgga tactgcctca atggtggcgt gtgcatgcat 240

attgaatcac tggacagcta cacatgcaac tgtgttattg gctattctgg ggatcgatgt 300

cagactcgag acctacgatg gtgggagctg cgtcatgctg gctacgggca gaagcatgac 360

atcatggtgg tggctgtctg catggtgtca ctggtcctgc tgctcctctt ggggatgtgg 420

gggacttact actac 435

<210>25

<211>435

<212>DNA

<213>野猪(Sus scrofa)

<300>

<301>Kim，J.G.，Vallet，J.L.和Christenson，R.K.

<302>猪怀孕期间子宫表皮生长因子的特征

<303>未公开

<307>2001

<308>GenBank登记号AF336151

<313>相关残基3172-3606

<400>25

gatattgatg agtgccaact aggtgtgcac acctgtgggg aaaatgccac ctgtacaaat 60

acggagggaa actacacctg cacatgtgct ggccgcccct ctgaacccgg acggatttgc 120

cctgacccta ctccaccctc tcacctcggg gaggatggcc gctattctgt gagaaatagt 180

tactctgaat gcccgccgtc ccacgacggg tactgcctcc acggtggtgt gtgtatgtat 240

attgaagccg tcgacagcta tgcctgcaac tgtgtttttg gctacgttgg cgagcgatgt 300

cagcacagag acttgaaatg gtgggagctg cgccacgctg gcctcgggcg acagtggaac 360

gtcacggtgg tggccgtctg cgtggtggtg ctggtcctgc tgctgctcct ggggctgtgg 420

ggggctcact actac 435

<210>26

<211>438

<212>DNA

<213>智人(Homo sapiens)

<300>

<301>Bell，G.I.，Fong，N.M.，Stempien，M.M.，Womsted，M.A.，

Caput，D.，Ku，L.L.，Urdea，M.S.，Rall，L.B.和Sanchez-

Pescador，R.

<302>人表皮生长因子前体：cDNA序列、体外表达和基因结构。

<303>Nucleic Acids Research

<304>14

<305>21

<306>8427-8446

<307>1986

<308>GenBank登记号X04571

<313>相关残基3170-3607

<400>26

gatattgatg agtgccaact gggggtgcac agctgtggag agaatgccag ctgcacaaat 60

acagagggag gctatacctg catgtgtgct ggacgcctgt ctgaaccagg actgatttgc 120

cctgactcta ctccaccccc tcacctcagg gaagatgacc accactattc cgtaagaaat 180

agtgactctg aatgtcccct gtcccacgat gggtactgcc tccatgatgg tgtgtgcatg 240

tatattgaag cattggacaa gtatgcatgc aactgtgttg ttggctacat cggggagcga 300

tgtcagtacc gagacctgaa gtggtgggaa ctgcgccacg ctggccacgg gcagcagcag 360

aaggtcatcg tggtggctgt ctgcgtggtg gtgcttgtca tgctgctcct cctgagcctg 420

tggggggccc actactac 438

<210>27

<211>159

<212>DNA

<213>小家鼠(Mus musculus)

<300>

<301>Gray，A.，Dull，T.J.和Ullrich，A.

<303>Nature

<304>303

<306>722-725

<307>1983

<308>GenBank登记号J00380

<313>相关残基3282-3440

<400>27

aatagttatc caggatgccc atcctcatat gatggatact gcctcaatgg tggcgtgtgc 60

atgcatattg aatcactgga cagctacaca tgcaactgtg ttattggcta ttctggggat 120

cgatgtcaga ctcgagacct acgatggtgg gagctgcgt 159

<210>28

<211>159

<212>DNA

<213>野猪(Sus scrofa)

<300>

<301>Kim，J.G.，Vallet，J.L.和Christenson，R.K.

<302>猪怀孕期间子宫表皮生长因子的特征

<303>未公开

<307>2001

<308>GenBank登记号AF336151

<313>相关残基3346-3504

<400>28

aatagttact ctgaatgccc gccgtcccac gacgggtact gcctccacgg tggtgtgtgt 60

atgtatattg aagccgtcga cagctatgcc tgcaactgtg tttttggcta cgttggcgag 120

cgatgtcagc acagagactt gaaatggtgg gagctgcgc 159

<210>29

<211>159

<212>DNA

<213>智人(Homo sapiens)

<300>

<301>Bell，G.I.，Fong，N.M.，Stempien，M.M.，Wormsted，M.A.，

Caput，D.，Ku，L.L.，Urdea，M.S.，Rall，L.B.和Sanchez-

Pescador.R.

<302>人表皮生长因子前体：cDNA序列、体外表达和基因结构。

<303>Nucleic Acids Research

<304>14

<305>21

<306>8427-8446

<307>1986

<308>GenBank登记号X04571

<313>相关残基3347-3505

<400>29

aatagtgact ctgaatgtcc cctgtcccac gatgggtact gcctccatga tggtgtgtgc 60

atgtatattg aagcattgga caagtatgca tgcaactgtg ttgttggcta catcggggag 120

cgatgtcagt accgagacct gaagtggtgg gaactgcgc 159

<210>30

<211>145

<212>PRT

<213>小家鼠(Mus musculus)

<300>

<301>Gray，A.，Dull，T.J.和Ullrich，A.

<303>Nature

<304>303

<306>722-725

<307>1983

<308>GenBank登记号J00380

<313>相关残基919-1063

<400>30

Asp Ile Asp Glu Cys Gln Arg Gly Ala His Asn Cys Ala Glu Asn Ala

1 5 10 15

Ala Cys Thr Asn Thr Glu Gly Gly Tyr Asn Cys Thr Cys Ala Gly Arg

20 25 30

Pro Ser Ser Pro Gly Arg Ser Cys Pro Asp Ser Thr Ala Pro Ser Leu

35 40 45

Leu Gly Glu Asp Gly His His Leu Asp Arg Asn Ser Tyr Pro Gly Cys

50 55 60

Pro Ser Ser Tyr Asp Gly Tyr Cys Leu Asn Gly Gly Val Cys Met His

65 70 75 80

Ile Glu Ser Leu Asp Ser Tyr Thr Cys Asn Cys Val Ile Gly Tyr Ser

85 90 95

Gly Asp Arg Cys Gln Thr Arg Asp Leu Arg Trp Trp Glu Leu Arg His

100 105 110

Ala Gly Tyr Gly Gln Lys His Asp Ile Met Val Val Ala Val Cys Met

115 120 125

Val Ser Leu Val Leu Leu Leu Leu Leu Gly Met Trp Gly Thr Tyr Tyr

130 135 140

Tyr

145

<210>31

<211>145

<212>PRT

<213>野猪(Sus scrofa)

<300>

<301>Kim，J.G.，Vallet，J.L.和Christenson，R.K.

<302>猪怀孕期间子宫表皮生长因子的特征

<303>未公开

<307>2001

<308>GenBank登记号AF336151

<313>相关残基912-1056

<400>31

Asp Ile Asp Glu Cys Gln Leu Gly Val His Thr Cys Gly Glu Asn Ala

1 5 10 15

Thr Cys Thr Asn Thr Glu Gly Asn Tyr Thr Cys Thr Cys Ala Gly Arg

20 25 30

Pro Ser Glu Pro Gly Arg Ile Cys Pro Asp Pro Thr Pro Pro Ser His

35 40 45

Leu Gly Glu Asp Gly Arg Tyr Ser Val Arg Asn Ser Tyr Ser Glu Cys

50 55 60

Pro Pro Ser His Asp Gly Tyr Cys Leu His Gly Gly Val Cys Met Tyr

65 70 75 80

Ile Glu Ala Val Asp Ser Tyr Ala Cys Asn Cys Val Phe Gly Tyr Val

85 90 95

Gly Glu Arg Cys Gln His Arg Asp Leu Lys Trp Trp Glu Leu Arg His

100 105 110

Ala Gly Leu Gly Arg Gln Trp Asn Val Thr Val Val Ala Val Cys Val

115 120 125

Val Val Leu Val Leu Leu Leu Leu Leu Gly Leu Trp Gly Ala His Tyr

130 135 140

Tyr

145

<210>32

<211>146

<212>PRT

<213>智人(Homo sapiens)

<300>

<301>Bell，G.I.，Fong，N.M.，Stempien，M.M.，Wormsted，M.A.，

Caput，D.，Ku，L.L.，Urdea，M.S.，Rall，L.B.和Sanchez-

Pescador.R.

<302>人表皮生长因子前体：eDNA序列、体外表达和基因结构。

<303>Nucleic Acids Research

<304>14

<305>21

<306>8427-8446

<307>1986

<308>GenBank登记号X04571

<313>相关残基912-1057

<400>32

Asp Ile Asp Glu Cys Gln Leu Gly Val His Ser Cys Gly Glu Asn Ala

1 5 10 15

Ser Cys Thr Asn Thr Glu Gly Gly Tyr Thr Cys Met Cys Ala Gly Arg

20 25 30

Leu Ser Glu Pro Gly Leu Ile Cys Pro Asp Ser Thr Pro Pro Pro His

35 40 45

Leu Arg Glu Asp Asp His His Tyr Ser Val Arg Asn Ser Asp Ser Glu

50 55 60

Cys Pro Leu Ser His Asp Gly Tyr Cys Leu His Asp Gly Val Cys Met

65 70 75 80

Tyr Ile Glu Ala Leu Asp Lys Tyr Ala Cys Asn Cys Val Val Gly Tyr

85 90 95

Ile Gly Glu Arg Cys Gln Tyr Arg Asp Leu Lys Trp Trp Glu Leu Arg

100 105 110

His Ala Gly His Gly Gln Gln Gln Lys Val Ile Val Val Ala Val Cys

115 120 125

Val Val Val Leu Val Met Leu Leu Leu Leu Ser Leu Trp Gly Ala His

130 135 140

Tyr Tyr

145

<210>33

<211>53

<212>PRT

<213>小家鼠(Mus musculus)

<300>

<301>Gray，A.，Dull，T.J.和Ullrich，A.

<303>Nature

<304>303

<306>722-725

<307>1983

<308>GenBank登记号J00380

<313>相关残基977-1029

<400>33

Asn Ser Tyr Pro Gly Cys Pro Ser Ser Tyr Asp Gly Tyr Cys Leu Asn

1 5 10 15

Gly Gly Val Cys Met His Ile Glu Ser Leu Asp Ser Tyr Thr Cys Asn

20 25 30

Cys Val Ile Gly Tyr Ser Gly Asp Arg Cys Gln Thr Arg Asp Leu Arg

35 40 45

Trp Trp Glu Leu Arg

50

<210>34

<211>53

<212>PRT

<213>野猪(Sus scrofa)

<300>

<301>Kim，J.G.，Vallet，J.L.和Christenson，R.K.

<302>猪怀孕期间子宫表皮生长因子的特征

<303>未公开

<307>2001

<308>GenBank登记号AF336151

<313>相关残基970-1022

<400>34

Asn Ser Tyr Ser Glu Cys Pro Pro Ser His Asp Gly Tyr Cys Leu His

1 5 10 15

Gly Gly Val Cys Met Tyr Ile Glu Ala Val Asp Ser Tyr Ala Cys Asn

20 25 30

Cys Val Phe Gly Tyr Val Gly Glu Arg Cys Gln His Arg Asp Leu Lys

35 40 45

Trp Trp Glu Leu Arg

50

<210>35

<211>53

<212>PRT

<213>智人(Homo sapiens)

<300>

<301>Bell，G.I.，Fong，N.M.，Stempien，M.M.，Wormsted，M.A.，

Caput，D.，Ku，L.L.，Urdea，M.S.，Rall，L.B.和Sanchez-

Pescador.R.

<302>人表皮生长因子前体：cDNA序列、体外表达和基因结构

<303>Nucleic Acids Research

<304>14

<305>21

<306>8427-8446

<307>1986

<308>GenBank登记号X04571

<313>相关残基970-1022

<400>35

Asn Ser Asp Ser Glu Cys Pro Leu Ser His Asp Gly Tyr Cys Leu His

1 5 10 15

Asp Gly Val Cys Met Tyr Ile Glu Ala Leu Asp Lys Tyr Ala Cys Asn

20 25 30

Cys Val Val Gly Tyr Ile Gly Glu Arg Cys Gln Tyr Arg Asp Leu Lys

35 40 45

Trp Trp Glu Leu Arg

50

Claims

1.一种分离的核酸，所述核酸编码牛表皮生长因子的多肽。

2.依照权利要求1的分离核酸，其中所编码的多肽包含从以下选出的氨基酸序列：

a)SEQ ID NO：9中描述的氨基酸序列；

b)SEQ ID NO：11中描述的氨基酸序列；

c)与SEQ ID NO：9中描述的氨基酸序列或SEQ ID NO：11中描述的氨基酸序列有至少55％同源性的在功能上等价的氨基酸序列。

3.如权利要求2所述的分离核酸，其中所编码的多肽包含与SEQID NO：9中描述的氨基酸序列或SEQ ID NO：11中描述的氨基酸序列有至少60％同源性的在功能上等价的氨基酸序列。

4.如权利要求3所述的分离核酸，其中所编码的多肽包含与SEQID NO：9中描述的氨基酸序列或SEQ ID NO：11中描述的氨基酸序列有至少65％同源性的在功能上等价的氨基酸序列。

5.如权利要求4所述的分离核酸，其中所编码的多肽包含与SEQID NO：9中描述的氨基酸序列或SEQ ID NO：11中描述的氨基酸序列有至少70％同源性的在功能上等价的氨基酸序列。

6.如权利要求5所述的分离核酸，其中所编码的多肽包含与SEQID NO：9中描述的氨基酸序列或SEQ ID NO：11中描述的氨基酸序列有至少75％同源性的在功能上等价的氨基酸序列。

7.如权利要求6所述的分离核酸，其中所编码的多肽包含与SEQID NO：9中描述的氨基酸序列或SEQ ID NO：11中描述的氨基酸序列有至少80％同源性的在功能上等价的氨基酸序列。

8.如权利要求7所述的分离核酸，其中所编码的多肽包含与SEQID NO：9中描述的氨基酸序列或SEQ ID NO：11中描述的氨基酸序列有至少85％同源性的在功能上等价的氨基酸序列。

9.如权利要求8所述的分离核酸，其中所编码的多肽包含与SEQID NO：9中描述的氨基酸序列或SEQ ID NO：11中描述的氨基酸序列有至少90％同源性的在功能上等价的氨基酸序列。

10.如权利要求9所述的分离核酸，其中所编码的多肽包含与SEQID NO：9中描述的氨基酸序列或SEQ ID NO：11中描述的氨基酸序列有至少95％同源性的在功能上等价的氨基酸序列。

11.如权利要求10所述的分离核酸，其中所编码的多肽包含与SEQ ID NO：9中描述的氨基酸序列或SEQ ID NO：11中描述的氨基酸序列有至少99％同源性的在功能上等价的氨基酸序列。

12.如权利要求1所述的分离核酸，其中所述核酸包含选自以下的核苷酸序列：

a)SEQ ID NO：8中描述的核苷酸序列；

b)SEQ ID NO：10中描述的核苷酸序列；

c)与SEQ ID NO：8中描述的核苷酸序列或SEQ ID NO：10中描述的核苷酸序列有至少75％同源性的在功能上等价的核苷酸序列。

13.如权利要求12所述的分离核酸，其中所述核酸包含与SEQ IDNO：8或SEQ ID NO：10中所述核苷酸序列有至少80％同源性的核苷酸序列。

14.如权利要求13所述的分离核酸，其中所述核酸包含与SEQ IDNO：8或SEQ ID NO：10中所述核苷酸序列有至少85％同源性的核苷酸序列。

15.如权利要求14所述的分离核酸，其中所述核酸包含与SEQ IDNO：8或SEQ ID NO：10中所述核苷酸序列有至少90％同源性的核苷酸序列。

16.如权利要求15所述的分离核酸，其中所述核酸包含与SEQ IDNO：8或SEQ ID NO：10中所述核苷酸序列有至少95％同源性的核苷酸序列。

17.如权利要求16所述的分离核酸，其中所述核酸包含与SEQ IDNO：8或SEQ ID NO：10中所述核苷酸序列有至少99％同源性的核苷酸序列。

18.一种编码牛表皮生长因子多肽的分离核酸的片段，其中所述片段包含与SEQ ID NO：10中所述核苷酸序列在功能上等价的核苷酸序列。

19.一种牛表皮生长因子分离多肽的片段，其中所述片段包含与SEQ ID NO：11中所述氨基酸序列在功能上等价的多肽。

20.一种能够使牛表皮生长因子在合适宿主细胞中表达的表达构建物，其中所述表达构建物包含如权利要求1到17中任一项所述的核酸，所述核酸与所述宿主细胞的匹配性控制序列有效连接。

21.一种载体，所述载体包含如权利要求1到17中任一项陈述的核酸。

22.一种宿主细胞，所述宿主细胞包含如权利要求1到17中任一项所述的核酸，这样所述细胞能够表达由所述核酸编码的牛表皮生长因子多肽。

23.如权利要求22所述的宿主细胞，其中所述细胞选自黑曲霉(Asperggillus niger)、无花果曲霉(Aspergillus ficuum)、盛泡曲霉(Aspergillus awamori)、米曲霉(Aspergillus oryzae)、里氏木霉(Trichoderma reesei)、Mucor miehei、乳酸克鲁维酵母(Kluyverromyceslactic)、巴斯德毕赤酵母(Pichia pastoris)、酿酒酵母(Saccharomycescerevisiae)、大肠杆菌、枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacillus licheniformis)或者植物细胞。

24.如权利要求23所述的宿主细胞，其中所述细胞是大肠杆菌。

25.如权利要求23所述的宿主细胞，其中所述细胞是巴斯德毕赤酵母。

26.一种饲料添加剂，所述饲料添加剂包含选自以下的制备物：

a)由权利要求1到17中任一项所述的核酸编码的牛表皮生长因子多肽；

b)由权利要求1到17中任一项所述的核酸编码的牛表皮生长因子多肽，其中所述牛表皮生长因子多肽与惰性或活性成分组合；

c)一种微生物或一种植物组织，其中所述微生物或所述植物组织表达由权利要求1到17中任一项所述的核酸编码的牛表皮生长因子多肽；和

d)从所述微生物或所述植物组织获得的培养基或提取物，其中所述培养基或所述提取物包含由权利要求1到17中任一项所述的核酸编码的牛表皮生长因子多肽。

27.如权利要求26中所述的饲料添加剂，其中所述微生物选自黑曲霉、无花果曲霉、盛泡曲霉、米曲霉、里氏木霉、Mucor miehei、乳酸克鲁维酵母、巴斯德毕赤酵母、酿酒酵母、大肠杆菌、枯草芽孢杆菌或地衣芽孢杆菌。

28.如权利要求27中所述的饲料添加剂，其中所述微生物是大肠杆菌。

29.如权利要求27中所述的饲料添加剂，其中所述微生物是巴斯德毕赤酵母。

30.一种饲料组合物，所述组合物包含与牛表皮生长因子多肽组合的饲料，或者用如权利要求1到11中任一项所述的牛表皮生长因子多肽处理的饲料。

31.如权利要求30所述的饲料组合物，其中所述牛表皮生长因子多肽采用粉末或液体的形式。

32.如权利要求31中所述的饲料组合物，其中所述饲料选自以下：玉米、谷物、高梁、小麦、大麦、燕麦、植物蛋白粗粉、草、干草、草青贮料和玉米青贮料。

33.一种生产具有牛表皮生长因子活性的多肽的方法，所述方法包括以下步骤：

a)培养包含如权利要求1到17中任一项所述的核酸的宿主细胞，培养条件有利于表达所述核酸编码的多肽；然后

b)从所述宿主细胞、包含所述宿主细胞的培养基或从所述宿主细胞获取的提取物回收所编码的多肽。

34.如权利要求33中所述的方法，其中所述宿主细胞选自黑曲霉、无花果曲霉、盛泡曲霉、米曲霉、里氏木霉、Mucor miehei、乳酸克鲁维酵母、巴斯德毕赤酵母、酿酒酵母、大肠杆菌、枯草芽孢杆菌和地衣芽孢杆菌，或者选自植物细胞。

35.如权利要求34中所述的方法，其中所述宿主细胞是大肠杆菌。

36.如权利要求34中所述的方法，其中所述宿主细胞是巴斯德毕赤酵母。

37.一种生产植物的方法，所述植物表达如权利要求1到17中任一项所述的核酸，所述方法通过将所述核酸引入一种植物细胞，以便所述核酸掺入所述植物细胞的基因组。

38.如权利要求37中所述的方法，其中所述植物选自双低油菜(canola)、大豆、玉米和番茄。

39.牛表皮生长因子多肽的应用，所述牛表皮生长因子多肽用于给予动物，改善所述动物的生长。

40.如权利要求39中所述的应用，其中所述多肽选自如权利要求1到11中任一项所述的任何多肽。

41.如权利要求40中所述的应用，其中所述动物选自猪、小猪、母牛、小牛、山羊、小山羊、绵羊和羔羊。

42.如权利要求41中所述的应用，其中所述动物是母牛或小牛。

43.牛表皮生长因子多肽的应用，所述牛表皮生长因子多肽用于给予动物，预防和治疗所述动物的肠感染。

44.如权利要求43中所述的应用，其中所述多肽选自如权利要求1到11中任一项所述的任何多肽。

45.如权利要求44中所述的应用，其中所述动物选自猪、小猪、母牛、小牛、山羊、小山羊、绵羊和羔羊。

46.如权利要求45中所述的应用，其中所述动物是母牛或小牛。

47.如权利要求45中所述的应用，其中所述感染选自家畜腹泻病、肠病原性大肠杆菌感染和贾第鞭毛虫病。

48.如权利要求47中所述的应用，其中所述肠病原性大肠杆菌感染是肠型大肠杆菌病。

49.如权利要求48中所述的应用，其中所述动物是小牛。