CN1420892A

CN1420892A - 动物胶原和明胶

Info

Publication number: CN1420892A
Application number: CN00818241.8A
Authority: CN
Inventors: M·P·贝尔; T·B·内夫; J·W·波拉克; T·W·西利
Original assignee: Fibrogen Inc
Current assignee: Fibrogen Inc
Priority date: 1999-11-12
Filing date: 2000-11-10
Publication date: 2003-05-28
Anticipated expiration: 2020-11-10
Also published as: CN1285612C; BR0015507A; US20040018592A1; US20040005663A1; CA2399371A1

Abstract

本发明提供了动物胶原和明胶及其组合物，以及它的生产方法。

Description

动物胶原和明胶

本申请是1999年11月12日提交的美国临时申请号09/439,058的后续申请，其说明书在此完整引入以供参考。

发明领域

本发明涉及衍生自动物序列的胶原和明胶的重组合成。本发明还涉及编码牛和猪胶原的新颖多核苷酸序列，编码的多肽序列，以及这些序列在重组生产动物胶原和明胶中的用途。

发明背景

胞外基质最丰富的成分是胶原。胶原是一大类纤维蛋白，特征是存在三链螺旋结构域。胶原分子通常是含有(-Gln-X-Y-)_n重复的多肽链三聚装配的结果，该重复形成三股螺旋结构域(van der Rest等(1991)FASEB J.5：2814-2823)。

胶原

目前，在脊椎动物中已鉴定出约二十种不同的胶原类型，包括牛、绵羊、猪、鸡和人胶原。通常胶原类型用罗马数字编号，在每一胶原类型中发现的链用阿拉伯数字编号。天然存在的胶原各种不同类型的结构和生物功能的详细描述是本领域可得的(见例如，Ayad等(1998)The Extracellular Matrix Facts Book，AcademicPress，San Diego，CA；Burgeson，R.E.和Nimmi(1992)“胶原类型：分子结构和组织分布”于Clin.Orthop.282：250-272；Kielty，C.M.等(1993)“胶原家族：胞外基质中的结构，装配和组织”Connective Tissue And Its Heritable Disorders，Molecular Genetics，And Medical Aspects，Royce，P.M.和B.Steinmann编，Wiley-Liss，NY，pp.103-147；和Prockop，D.J.和K.I.Kivirikko(1995)“胶原：分子生物学，疾病和治疗性能”，Annu.Rev.Biochem.64：403-434)。

I型胶原是骨骼和皮肤的主要纤维胶原，占生物体全部胶原的约80-90％。I型胶原是多细胞生物胞外基质的主要的结构大分子，占总蛋白质量的约20％。I型胶原是异三聚分子，含有两条α1(I)链和一条α2(I)链，分别由COL1A1和COL1A2基因编码。其它胶原类型比I型胶原少，呈现不同的分布情况。例如，II型胶原是软骨和玻璃液中的主要胶原，而III型胶原以高水平存在于血管中，而在皮肤中较少一些。

II型胶原是同三聚(homotrimeric)胶原，含有三条相同的α1(II)链，由COL2A1基因编码。纯化的II型胶原可从组织中通过本领域已知的方法，例如Miller和Rhodes(1982)Methods in Enzymology 82：33-64所述的方法制备。

III型胶原是皮肤和血管组织中的主要纤维胶原。III型胶原是同三聚胶原，含有三条相同的α1(III)链，由COL3A1基因编码。从组织中纯化的III型胶原的方法，可在例如Byers等(1974)Biochemistry 13：5243-5248和Miller和Rhodes，见上所述的制备方法中找到。

IV型胶原以片层而不是纤维的形式存在于基底膜中。IV型胶原最常见含有两条α1(IV)链和一条α2(IV)链。组成IV型胶原的具体链是组织特异性的。IV型胶原可以用例如Furuto和Miller(1987)Methods in Enzymology，144：41-61，AcademicPress所述的方法纯化。

V型胶原主要是存在于骨骼、腱、角膜、皮肤和血管中的纤维胶原。V型胶原同时存在同三聚和异三聚形式。V型胶原的一种形式是两条α1(V)链和一条α2(V)链的异三聚体。V型胶原的另一种形式是α1(V)、α2(V)和α3(V)链的异三聚体。V型胶原的还有一种形式是α1(V)的同三聚体。从天然来源分离V型胶原的方法可在例如Elstow和Weiss(1983)Collagen Rel.Res.3：181-193和Abedin等(1982)Biosci.Rep.2：493-502中找到。

VI型胶原具有一个小的三股螺旋区和两个大的非胶原剩余部分。VI型胶原是一个异三聚体，含有α1(VI)、α2(VI)和α3(VI)链。VI型胶原在许多结缔组织中发现。可在例如Wu等(1987)Biochem.J.248：373-381和Kielty等(1991)J.Cell.Sci.99：797-807中找到如何从天然来源纯化VI型胶原的描述。

VII型胶原是在特定表皮组织中发现的纤维胶原。VII型胶原是三条α1(VII)链的同三聚分子。可在例如Lunstrum等(1986)J.Biol.Chem.261：9042-9048和Bentz等(1983)Proc.Natl.Acad.Sci.USA 80：3168-3172中找到如何从组织纯化VII型胶原的描述。

VIII型胶原存在于在角膜的后界层中。VIII型胶原是异三聚体，含有两条α1(VIII)链和一条α2(VIII)链，虽然也报道过其它的链成分。可在例如Benya和Padilla(1986)J.Biol.Chem.261：4160-4169和Kapoor等(1986)Biochemistry25：3930-3937中找到如何从天然来源纯化VIII型胶原的方法。

IX型胶原是在软骨和玻璃液中发现的纤维结合的胶原。IX型胶原是异三聚分子，含有α1(IX)、α2(IX)和α3(IX)链。IX型胶原被分类为FACIT(纤维结合的胶原，具有中断的三股螺旋)胶原，具有几个由非三股螺旋结构域分隔的三股螺旋结构域。可在例如Duance等(1984)Biochem.J.221：885-889；Ayad等(1989)BiochemJ.262：753-761；和Grant等(1988)The Control of tissue Damage，Glauert，A.M.编，Elsevier Science Publishers，Amsterdam，pp.3-28中找到纯化IX型胶原的方法。

X型胶原是α1(X)链的同三聚分子。可从生长板的肥大的软骨中分离出X型胶原。(见例如Apte等(1992)Eur J Biochem 206(1)：217-24.)。

可在软骨组织中和身体的其它位置发现与II型胶原和IX型结合的XI型胶原。XI型胶原是异三聚分子，含有α1(XI)、α2(XI)和α3(XI)链。可在例如Grant等，见上述说明中找到纯化XI型胶原的方法。

XII型胶原是主要与I型胶原结合的FACIT胶原。XII型胶原是同三聚分子，含有三条α1(XII)链。可在例如Dublet等(1989)J.Biol.Chem.264：13150-13156；Lunstrum等(1992)J.Biol.Chem.267：20087-20092；和Watt等(1992)J.Biol.Chem.267：20093-20099中找到纯化XII型胶原及其变体的方法。

XIII型胶原是在皮肤、肠、骨骼、软骨和横纹肌等中发现的非纤维胶原。可在例如Juvonen等(1992)J.Biol.Chem.267：24700-24707中发现XIII型胶原的详细描述。

XIV型胶原是一种特征为含有α1(XIV)链的同三聚分子的FACIT胶原。分离XIV型胶原的方法可在例如Aubert-Foucher等(1992)J.Biol.Chem.267：15759-15764和Watt等，见上述说明中发现。

XV型胶原与XVIII型胶原在结构上同源。可在例如Myers等(1992)Proc.Natl.Acad.Sci.USA 89：10144-10148；Huebner等(1992)Genomics 14：220-224；Kivirikko等(1994)J.Biol.Chem.269：4773-4779；和Muragaki，J.(1994)J.Biol.Chem.264：4042-4046中发现有关天然XV型胶原的结构和分离的信息。

XVI型胶原是一种纤维结合的胶原，存在于皮肤、肺成纤维细胞和角质形成细胞中。可在Pan等(1992)Proc.Natl.Acad.Sci.USA 89：6565-6569；和Yamaguchi等(1992)J.Biochem.112：856-863中发现XVI型胶原的结构和编码XVI型基因的信息。

XVII型胶原是半桥粒跨膜胶原，也称为大疱性类天疱疮抗原。可在例如Li等(1993)J.Biol.Chem.268(12)：8825-8834；和McGrath等(1995)Nat.Genet.11(1)：83-86中发现XVII型胶原的结构和编码XVII型胶原的基因的信息。

XVIII型胶原在结构上与XV型胶原类似，可从肝脏中分离得到。可在例如Rehn和Pihlajaniemi(1994)Proc.Natl.Acad.Sci.USA 91：4234-4238；Oh等(1994)Proc.Natl.Acad.Sci.USA 91：4229-4233；Rehn等(1994)J.Biol.Chem.269：13924-13935；和Oh等(1994)Genomics 19：494-499中发现从天然来源分离XVIII型胶原及其结构的描述。

据信XIX型胶原是FACIT胶原家族的另一个成员，在横纹肌肉瘤细胞分离的mRNA中发现。可在例如Inoguchi等(1995)J.Biochem.117：137-146；Yoshioka等(1992)Genomics 13：884-886；和Myers等，J.Biol.Chem.289：18549-18557(1994)中发现XIX性胶原的结构和分离的描述。

XX型胶原是FACIT胶原家族新发现的成员；已在鸡角膜中鉴定得到(见例如Gordon等(1999)FASEB杂志13：A1119；和Gordon等(1998)IOVS 39：S1128)。

明胶

明胶是胶原的衍生物，动物的主要结构和结缔蛋白。明胶衍生自胶原变性，含有具有Gly-X-Y重复的多肽序列，其中X和Y最常见是脯氨酸和羟脯氨酸残基。这些序列形成三股螺旋结构，影响明胶多肽的凝胶化能力。目前可得的明胶是通过通常是牛和猪来源的动物皮革和骨骼加工提取的。明胶的生物物理性质使它成为多用途的材料，广泛用于各种应用和工业。明胶用于例如许多药物和医学、照像、工业、化妆品和食品饮料产业，以及制造过程。因此明胶是商业上有价值和多用途的产品。

明胶通常是用牛和猪来源，特别是从皮革和骨骼中天然存在的胶原制造的。在某些情况下，可从例如鱼、鸡或马来源抽提取明胶。典型明胶生产的原料，例如牛皮和骨骼来自经过政府认证的调查，并合格适用于人类消费的动物。对于该原料的感染性有关注，因为存在污染因子例如可传播的海绵状脑病(TSE)，特别是牛海绵状脑病(BSE)和羊瘙痒病等(见例如Rohwer，R.G.(1996)Dev Biol Stand88：247-256)。这种问题对于用于药物和医学用途的明胶尤其关键。

近来，对于这些材料(其中大部分来自牛来源)的安全性的关注增加了，导致各种含明胶的产品成为几项管理标准的焦点，来减少与新变种克-雅氏病(nvCJD)，一种致命的人神经疾病有关的牛海绵状脑病(BSE)传播的潜在危险。有担心目前用于从动物组织和骨骼提取明胶的方法的纯化步骤不足以除去感染性，因为污染携带SE的组织(如脑组织等)。美国和欧洲制造商规定在动物或人的食品或药物、医学或化妆品应用的明胶原料不能是来自数量正在增加的BSE国家的。另外，管理部门规定在明胶生产中不能使用某些材料，例如牛脑组织。

目前的生产过程涉及几个纯化和清洁步骤，可能需要严厉和冗长的提取模式。用熬炼法处理动物皮毛和骨骼，提取的材料经过各种化学处理，包括长时间接触高酸性或碱性溶液。许多纯化步骤涉及洗涤和过滤以及各种热处理。用酸除盐和石灰处理除去杂质，例如非胶原的蛋白质。骨骼必须脱脂。可在过程中加入其它洗涤和过滤步骤，离子交换和其它化学和消毒处理，来进一步纯化材料。另外，在加工后仍可能存在污染物和杂质，得到的明胶产物因此必须澄清，纯化，常常在准备使用前需要进一步浓缩。

商品明胶常常分为A型和B型。这些分类反映了作为提取过程一部分所接收的预处理提取来源。A型通常衍生自酸加工的材料，通常是猪皮，B型通常衍生自碱或石灰加工的材料，通常是牛骨(骨胶原)和皮革。在A和B两型提取过程中，得到的明胶产物通常是明胶分子的混合物，大小从几千到几十万道尔顿不等。

分为凝胶化或非凝胶化型，和通常作为A型明胶加工的鱼明胶也用于一些商业应用。凝胶化型通常衍生自一些温水鱼的皮肤，而非凝胶化型通常衍生自冷水鱼。鱼明胶具有广泛变化的氨基酸组分，与动物明胶不同，脯氨酸和羟脯氨酸残基比例通常较低。与其它动物明胶相反，鱼明胶通常在低得多的温度下，甚至在平均分子量相当时仍保持液态。与动物明胶一样，鱼明胶是从鱼皮中经过处理然后水解提取的。另外，与动物提取过程相同，提取鱼明胶的过程得到不均匀的产物。

目前的提取方法得到的是蛋白质异源混合物，含有分子量范围不同的多肽的明胶。有时必须混合各种产物批料，来获得含有适用于所需用途的具有物理性能的明胶混合物。因此需要可靠和可重现的明胶生产方法，提供特征受控制的均一产物。

另外，在药物、化妆品、食品和饮料工业中，尤其需要从例如牛、猪骨骼和组织的动物来源提取获得的明胶以外的明胶来源。另外，由于目前可得的明胶是从动物来源如骨骼和组织生产的，有担心含明胶产品的不良免疫原性和感染性(见例如Sakaguchi，M.等(1999)J.Aller.clin.Immunol.104：695-699；Miyazawa等(1999)Vaccine 17：2176-2180；Sakaguchi等(1999)Immunology 96：286-290；Kelso(1999)J Aller.Clin.Immunol.103：200-202；Asher(1999)Dev Biol Stand99：41-44；和Verdrager(1999)Lancet 354：1304-1305)。另外，可得到不经过动物来源，如组织和骨骼提取的基础物质将克服各种伦理、宗教和社会要求。不需要从动物来源，例如组织和骨骼提取的重组物质可用于例如制造食品和其它食用产品，包括胶囊化的药物，适用于具有饮食限制的人，例如信奉犹太教和伊斯兰教的人。

翻译后酶

翻译后酶对胶原和胶原蛋白生物合成是重要的。例如，脯氨酰4-羟化酶是将重复的-Gly-X-Y-序列中Y位置的脯氨酰残基羟化成4-羟脯氨酸必需的(见例如Prockop等(1984)N.Engl.J.Med.311：376-386)。羟脯氨酸起到了稳定胶原三股螺旋的关键作用。

脊椎动物脯氨酰4-羟化酶是α₂β₂四聚体(见例如Berg和Prockop(1973)J.Biol.Chem.248：1175-1192；和Tuderman等(1975)Eur.J.Biochem.52：9-16)。α亚基(63kDa)含有羟化脯氨酰残基的催化位点，在缺乏β亚基的情况下是不溶的。与蛋白质二硫键异构酶相同的β亚基(55kDa)催化蛋白质底物的硫醇-二硫键互换，导致形成对建立稳定蛋白必需的二硫键。当作为脯氨酰4-羟化酶四聚体的一部分时，β亚基保留50％蛋白质二硫异构酶活性(见例如Pihlajaniemi等(1987)EmboJ.6：643-649；Parkkonen等(1988)Biochem.J.256：1005-1011；和Koivu等(1987)J.Biol.Chem.262：6447-6449)。在昆虫细胞中通过刺激性表达α和β亚基产生了活性重组人脯氨酰4-羟化酶(见例如Vuori等(1992)Proc.Natl.Acad.Sci.USA89：7467-7470)。

除了脯氨酰4-羟化酶，在文献中已鉴定和报道了其它胶原翻译后酶，包括例如C-蛋白酶，N-蛋白酶，赖氨酰氧化酶和赖氨酰羟化酶(见例如Olsen等(1991)CellBiology of Extracellular Matrix，第二版，Hay编，Plenum Press，New York)。

在各种重组宿主-载体系统中不难获得许多外源基因的表达。然而如果蛋白质的最终形成需要广泛的翻译后加工，表达就变得困难。例如，脯氨酰4-羟化酶活性是胶原结构域羟化所必需的要求。在脯氨酰4-羟化酶内源活性缺陷的表达系统中必需补充脯氨酰4-羟化酶，来提供天然存在的羟化系统。

难以获得可靠和稳定的胶原基因的重组表达阻碍了有许多有用用途的胶原和明胶的生产。另外，许多类型的胶原在组织中仅以痕量存在，不能从这些来源大量获得。另外，可在提取和纯化过程后留下或在其中引入非胶原性杂质。

总结

总的说，虽然商品可得的动物胶原和明胶特性适用于许多产品，但这些现在可得的材料的可变性，和与优化这些材料以用于各种用途的相关的困难，提供了极小的变通性。结果，本领域需要一种有效的系统，能够在基因和分子水平修饰起始材料，提供产生为了不同用途和市场特别定制和标准化的重组胶原和明胶的可能性。另外，对于使用目前可得的提取材料有关的免疫原性和感染性的危险的关注也需要纯净和安全的取代材料。

发明简述

本发明提供了动物胶原和明胶，以及制备这些动物胶原和明胶的方法。因此，在一个方面，本发明包含一种分离和纯化的多肽，该多肽是选自α1(I)胶原、α2(I)胶原和α1(III)胶原和这些胶原的片段和变体的牛或猪多肽。

在一个实施例中，本发明提供了一种分离和纯化的多肽，它是牛α1(I)胶原或其片段或变体。在一些实施例中，多肽是单链或同三聚或异三聚的。在一个方面，多肽含有SEQ ID NO：2的氨基酸序列或其片段或变体。还提供了含有该多肽的组合物。

在另一个实施例中，本发明包含一种分离和纯化的多核苷酸，编码牛α1(I)胶原或其片段或变体，和分离和纯化的多核苷酸，它与编码牛α1(I)胶原或其片段或变体的多核苷酸互补。本发明在一个实施例中提供了一条编码SEQ ID NO：2的分离和纯化的多核苷酸或其片段或变体。还提供了含有该多核苷酸的组合物、表达载体和宿主细胞。在各种实施例中，宿主细胞是原核细胞或真核细胞，特别是动物、酵母、植物、昆虫或真菌细胞。在某些实施例中，本发明提供了含有该多核苷酸的转基因动物和转基因植物。在一个方面，本发明包括产生牛α1(I)胶原的方法，该方法包括在适合表达牛α1(I)胶原的条件下培养含有多核苷酸的宿主细胞，从宿主细胞培养物回收牛α1(I)胶原。

在一些实施例中，本发明提供含有牛α1(I)胶原或其片段或变体的重组胶原和重组明胶。本发明特别提供了重组胶原和明胶，含有SEQ ID NO：2或其片段或变体。在一个实施例中本发明提供了一种分离和纯化的多肽，含有牛α1(III)胶原或其片段或变体。在一些实施例中，多肽是单链或同三聚或异三聚的。在一个方面，多肽含有SEQ ID NO：4或SEQ ID NO：6的氨基酸序列或其片段或变体。还提供了含有该多肽的组合物。

在另一个实施例中，本发明包含了一种分离和纯化的编码牛α1(III)胶原或其片段或变体的多核苷酸和分离和纯化的，与编码牛α1(III)胶原或其片段和变体的多核苷酸互补的多核苷酸。本发明在一个实施例中提供了一种分离和纯化的编码SEQ ID NO：4或SEQ ID NO：6的多核苷酸或其片段或变体。还提供了含有该多核苷酸的组合物、表达载体和宿主细胞。在许多实施例中，宿主细胞是原核细胞或真核细胞，特别是动物、酵母、植物、昆虫或真菌细胞。在某些实施例中，本发明提供了含有该多核苷酸的转基因动物和转基因植物。在一个方面，本发明包括产生牛α1(III)胶原的方法，该方法包括在适合表达牛α1(III)胶原的条件下培养含有多核苷酸的宿主细胞，从宿主细胞培养物回收牛α1(III)胶原。

在一些实施例中，本发明提供含有牛α1(III)胶原或其片段或变体的重组胶原和重组明胶。本发明特别提供了含有SEQ ID NO：4或SEQ ID NO：6的重组胶原和明胶，或其片段或变体。

在一个实施例中，本发明提供了一种分离和纯化的多肽，它是猪α1(I)胶原或其片段或变体。在一些实施例中，多肽是单链或同三聚或异三聚的。在一个方面，多肽含有SEQ ID NO：8的氨基酸序列或其片段或变体。还提供了含有该多肽的组合物。

在另一个实施例中，本发明包含一种分离和纯化的多核苷酸，编码猪α1(I)胶原或其片段或变体，和分离和纯化的多核苷酸，它与编码猪α1(I)胶原或其片段或变体的多核苷酸互补。本发明在一个实施例中提供了一条编码SEQ ID NO：8的分离和纯化的多核苷酸或其片段或变体。还提供了含有该多核苷酸的组合物、表达载体和宿主细胞。在各种实施例中，宿主细胞是原核细胞或真核细胞，特别是动物、酵母、植物、昆虫或真菌细胞。在某些实施例中，本发明提供了含有该多核苷酸的转基因动物和转基因植物。在一个方面，本发明包括产生猪α1(I)胶原的方法，该方法包括在适合表达猪α1(I)胶原的条件下培养含有多核苷酸的宿主细胞，从宿主细胞培养物回收猪α1(I)胶原。

在一些实施例中，本发明提供含有猪α1(I)胶原或其片段或变体的重组胶原和重组明胶。本发明特别提供了含有SEQ ID NO：8的重组胶原和明胶，或其片段或变体。

在一个实施例中，本发明提供了一种分离和纯化的多肽，它是猪α2(I)胶原或其片段或变体。在一些实施例中，多肽是单链或同三聚或异三聚的。在一个方面，多肽含有SEQ ID NO：10的氨基酸序列或其片段或变体。还提供了含有该多肽的组合物。

在另一个实施例中，本发明包含一种分离和纯化的多核苷酸，编码猪α2(I)胶原或其片段或变体，和分离和纯化的多核苷酸，它与编码猪α2(I)胶原或其片段或变体的多核苷酸互补。本发明在一个实施例中提供了一条编码SEQ ID NO：10的分离和纯化的多核苷酸或其片段或变体。还提供了含有该多核苷酸的组合物、表达载体和宿主细胞。在各种实施例中，宿主细胞是原核细胞或真核细胞，特别是动物、酵母、植物、昆虫或真菌细胞。在某些实施例中，本发明提供了含有该多核苷酸的转基因动物和转基因植物。在一个方面，本发明包括产生猪α2(I)胶原的方法，该方法包括在适合表达猪α2(I)胶原的条件下培养含有多核苷酸的宿主细胞，从宿主细胞培养物回收猪α2(I)胶原。

在一些实施例中，本发明提供含有猪α2(I)胶原或其片段或变体的重组胶原和重组明胶。本发明特别提供了重组胶原和明胶，含有SEQ ID NO：10或其片段或变体。

在一个实施例中，本发明提供了一种分离和纯化的多肽，它是猪α1(III)胶原或其片段或变体。在一些实施例中，多肽是单链或同三聚或异三聚的。在一个方面，多肽含有SEQ ID NO：12的氨基酸序列或其片段或变体。还提供了含有该多肽的组合物。

在另一个实施例中，本发明包含一种分离和纯化的多核苷酸，编码猪α1(III)胶原或其片段或变体，和分离和纯化的多核苷酸，它与编码猪α1(III)胶原或其片段或变体的多核苷酸互补。本发明在一个实施例中提供了一条编码SEQ ID NO：12的分离和纯化的多核苷酸或其片段或变体。

还提供了含有该多核苷酸的组合物、表达载体和宿主细胞。在各种实施例中，宿主细胞是原核细胞或真核细胞，特别是动物、酵母、植物、昆虫或真菌细胞。在某些实施例中，本发明提供了含有该多核苷酸的转基因动物和转基因植物。在一个方面，本发明包括产生猪α1(III)胶原的方法，该方法包括在适合表达猪α1(III)胶原的条件下培养含有多核苷酸的宿主细胞，从宿主细胞培养物回收猪α1(III)胶原。

在一些实施例中，本发明提供含有猪α1(III)胶原或其片段或变体的重组胶原和重组明胶。本发明特别提供了重组胶原和明胶，含有SEQ ID NO：12或其片段或变体。

还提供了产生重组动物胶原和明胶的方法。在一个实施例中本发明提供了一种产生重组动物胶原的方法，该方法包括在一个宿主细胞中引入至少一个含有编码动物胶原或前胶原的多核苷酸序列的表达载体和至少一个在允许表达多核苷酸条件下，含有编码翻译后酶的多核苷酸的表达载体；和分离动物胶原。在另一个方面，翻译后酶选自脯氨酰羟化酶、肽基脯氨酰异构酶、胶原半乳糖苷羟赖氨酰葡糖转移酶、羟赖氨酰半乳糖苷转移酶、C-蛋白酶、N-蛋白酶、赖氨酰羟化酶和赖氨酰氧化酶。在一个实施例中，翻译后酶选自与动物胶原相同的物种。在另一个实施例中，宿主细胞选自与动物胶原相同的物种。在还有实施例中，宿主细胞不内源性产生胶原，或不内源性产生翻译后酶。特别提供了一种含有至少一个编码动物胶原的表达载体和至少一个编码翻译后酶的表达载体的宿主细胞。

在一个方面，本发明提供了一种基本不含任何其它类型胶原的一型重组动物胶原。在这一种类型的胶原是特别选自I型、II型、III型、IV型、V型、VI型、VII型、VIII型、IX型、X型、XI型、XII型、XIII型、XIV型、XV型、XVI型、XVII型、XVIII型、XIX型、和XX型胶原的实施例是经特别考虑的。

还提供了产生重组动物明胶的方法。在一个方面，该方法包括提供重组动物胶原，和衍生重组动物明胶。在另一个方面，该方法包括直接从改变的动物胶原结构产生重组动物明胶。

附图简述

图1A、1B和1C显示编码牛α1(I)胶原的核酸序列(SEQ NO：1)。

图2A、2B、2C和2D显示牛α1(I)胶原的氨基酸序列(SEQ NO：2)。

图3A、3B和3C显示编码牛α1(III)胶原的核酸序列(SEQ NO：3)。

图4A、4B、4C和4D显示牛α1(III)胶原的氨基酸序列(SEQ NO：4)。

图5A、5B和5C显示编码牛α1(III)胶原的核酸序列(SEQ NO：5)。

图6A、6B、6C和6D显示牛α1(III)胶原的氨基酸序列(SEQ NO：6)。

图7A、7B和7C显示编码猪α1(I)胶原的核酸序列(SEQ NO：7)。

图8A、8B、8C和8D显示猪α1(I)胶原的氨基酸序列(SEQ NO：8)。

图9A、9B和9C显示编码猪α2(I)胶原的核酸序列(SEQ NO：9)。

图10A、10B、10C和10D显示猪α2(I)胶原的氨基酸序列(SEQ NO：10)。

图11A、11B和11C显示编码猪α1(III)胶原的核酸序列(SEQ NO：11)。

图12A、12B、12C和12D显示猪α1(III)胶原的氨基酸序列(SEQ NO：12)。

图13A、13B、13C、13D、13E、13F、13G、13H和13I描述了翻译的牛α1(I)胶原开放阅读框序列与已知的人(HU)、小鼠(MUS)、犬(CANIS)、牛蛙(RANA)和日本水螈(CYNPS)胶原序列的排列。

发明详述

在描述本发明的蛋白质、核苷酸序列和方法之前，应理解本发明不限于所述的具体方法、方案、细胞系、载体和试剂，因为这些可变。还应理解本文所用的术语仅为描述特定实施例，而不是为了限制本发明的范围。

必须注意本文和在权利要求中所用的单个“一”、“一个”和“该”包括复数，除非上下文明确说明。因此例如“一个宿主细胞”指一个或多个这样的宿主细胞及其本领域技术人员已知的等价物，“一种抗体”指一种或多种抗体及其本领域技术人员已知的等价物。

除非另外说明，本文所用的所有技术和科学术语具有本发明所属领域的技术人员通常理解的意义。虽然在实践和测试本发明中可使用任何与本文所属的相似或相同的方法和材料，在此描述优选的方法、装置和材料。所有本文提到的出版物在此引入以供参考，用于描述和公开细胞系、载体和方法等，它们在可与本发明结合使用的出版物中有所报道。本文中的任何陈述都不被认为是承认本发明无权根据先前的发明提前公开。本文引用的所有文献在此完整引入以供参考。

本发明的实施将使用(除非另外说明)本领域技术范围内的化学、生物化学、分子生物学、免疫学和药物学的方法。这些技术在文献中有完整解释。见例如Gennaro，A.R.编(1990)Remington’s Pharmaceutical Science，第18版，MackPublishing Co.；Colowick，S.等编，Methods in Enzymology，Academic Press，Inc.；Handbook of Experimental Immunology，Vols.I-IV(D.M.Weir和C.C.Blackwell编，1986，Blackwell Scientific Publications)；Maniatis，T.等编(1989)Molecular Cloning：A Laboratory Manual第二版，I-III卷，Cold SpringHarbor Laboratory Press；Ausubel，F.M.等编(1999)Short Protocols inMolecular Biology，第四版，John Wiley & Sons；Ream等编(1998)MolecularBiology Techniques：An Intensive Laboratory Course，Academic Press)；PCR(Introduction to Biotechniques Series)，第二版(Newton & Graham编，1997，Springer Verlag)。

定义

术语“胶原”指任一已知胶原类型，包括胶原I-XX型，和任何其它胶原，不论天然、合成、半合成或重组的。该术语也包括前胶原。术语胶原包含任何一条多核苷酸编码的单链多肽，和胶原链的同三聚和异三聚装配。术语“胶原”特别包括其变体和片段，及其功能性等价物和衍生物，它们优选保留至少一种胶原的结构或功能特征，例如(Gly-X-Y)_n结构域。

因此例如术语“牛α1(I)胶原”指一条多核苷酸序列编码的单链牛α1(I)胶原，和任何相应的前胶原，或其任何片段、变体、功能性等价物或衍生物。术语“牛I型胶原”指含有牛I型胶原链的同三聚或异三聚胶原，和任何相应的前胶原，或任何其片段、变体、功能性等价物或衍生物。

术语“前胶原”指对应胶原I-XX型任何一种的前胶原，以及对应任何其它胶原，不论是合成、半合成或重组的前胶原，它们具有额外的C-末端和/或N-末端前肽或端肽，辅助三聚体装配、溶解性、纯化或任何其它功能，然后由与胶原产生有关的N-蛋白酶、C-蛋白酶或其它酶(例如蛋白酶)切割。术语前胶原特别包含其变体和片段，及其功能性等价物和衍生物，其优选保留胶原的至少一个结构或功能特征，例如(Gly-X-Y)_n结构域。

术语“牛α1(I)”指来自任何天然、合成、半合成或重组的来源的牛α1(I)胶原或其功能性等价物，及其片段和变体，和编码该多肽的多核苷酸。

术语“牛α1(III)”指来自任何天然、合成、半合成或重组的来源的牛α1(III)胶原或其功能性等价物，及其片段和变体，和编码该多肽的多核苷酸。

术语“猪α1(I)”指来自任何天然、合成、半合成或重组的来源的猪α1(I)胶原或其功能性等价物，及其片段和变体，和编码该多肽的多核苷酸。

术语“猪α2(I)”指来自任何天然、合成、半合成或重组的来源的猪α2(I)胶原或其功能性等价物，及其片段和变体，和编码该多肽的多核苷酸。

术语“猪α1(III)”指来自任何天然、合成、半合成或重组的来源的猪α1(III)胶原或其功能性等价物，及其片段和变体，和编码该多肽的多核苷酸。

本文所用的“明胶”指任何明胶，不论是用传统方法提取或重组或原始生物合成的，或任何具有明胶的至少一种结构和/或功能特征的分子。明胶目前是通过提取衍生自动物(例如牛、猪、啮齿类、鸡、马、鱼)来源，如骨骼和组织的胶原获得的。术语明胶同时包括包含在明胶产物中的一种以上多肽的组合，和形成明胶物质的单独的多肽。因此，本发明所使用的重组明胶同时包括构成本发明明胶多肽的重组明胶物质，和本发明的单独的明胶多肽。

可衍生明胶的多肽是胶原、前胶原和其它具有胶原的至少一种结构和/或功能特征的多肽。该多肽可以含有一条胶原链或胶原同三聚体或异三聚体或其任何片段、衍生物、寡聚体、聚合物或其亚基，含有至少一种胶原结构域(Gly-X-Y区)。该术语特别指天然情况下不存在的工程改造过的序列，例如改变的胶原构建体等。改变的胶原构建体是含有通过缺失、添加、取代或其它改变从天然存在的胶原基因改变的序列的多核苷酸。

“佐剂”是任何加到药物或疫苗中提高、增强或辅助其作用的制剂。在疫苗制剂中使用的佐剂可以是免疫剂，它能通过产生免疫应答非特异性刺激因子来增强免疫应答。佐剂常用于非活疫苗。

术语“等位基因”或“等位基因序列”指基因序列的改变形式。等位基因可由核酸序列中的至少一个突变得到，等位基因可导致改变的mRNA或多肽，其结构或功能可以改变也可以不改变。任何给定的天然或重组基因可以不具有，具有一种或多种等位基因形式。产生等位基因的通常突变改变常常归因于天然缺失、添加或核苷酸的取代。这些改变类型中每一种都可以单独或与其它改变联合发生，在给定序列中发生一次或多次。

“改变的”多核苷酸序列包括具有不同的核苷酸缺失、插入或取代，得到编码相同或功能上等价的多肽的多核苷酸的多核苷酸序列。该定义中包括显示多态性的序列，它可用或不可用特定的寡核苷酸探针，或通过除去与等位基因的不正确或未预计的杂交来检测，具有除了对该测定的多核苷酸序列正常染色体座位以外的(基因)座。

“改变的”多肽可以含有氨基酸残基的缺失、插入或取代，它产生沉默改变并导致功能上等价的多肽。可在极性、电荷、溶解度、疏水性、亲水性和/或残基的两亲性性质相似基础上制造精确的氨基酸取代，只要保留编码的多肽的生物学或免疫学活性。例如，带负电的氨基酸可包括天冬氨酸和谷氨酸；带正电的氨基酸可包括赖氨酸和精氨酸；具有不带电的极性头部基团，具有相似的亲水性的氨基酸可包括亮氨酸、异亮氨酸和缬氨酸、甘氨酸和丙氨酸、天冬酰胺和谷氨酰胺、丝氨酸和苏氨酸和苯丙氨酸和酪氨酸。

本文所用的这些术语“氨基酸”或“多肽”序列或“多肽”指寡肽、肽、多肽或蛋白质序列及其片段，和天然存在或合成的分子。多肽或氨基酸片段是保留该多肽的至少一种结构和/或功能特征的多肽任何部分。在本发明的至少一个实施例中，多肽片段是保留至少一个(Gly-X-Y)_n区的片段。

本文所用的术语“动物”例如在“动物胶原”中包含任何胶原，例如天然，合成，半合成或重组的。动物来源包括例如哺乳动物来源，包括但不限于牛、猪、马、啮齿类和羊来源以及其它动物来源，包括但不限于鸡和鱼来源和非脊椎动物来源。

“抗原性”涉及当引入体内时，一种物质能够刺激免疫应答并产生抗体的能力。显示抗原性的因子称为抗原性的。抗原性因子可包括但不限于各种大分子，例如蛋白质、脂蛋白、多糖、核酸、细菌和细菌组分、以及病毒和病毒组分。

本文所用的术语“互补”或“互补性”指多核苷酸通过碱基配对的天然结合。例如序列“A-G-T”与互补序列“T-C-A”结合。两条单链分子之间的互补性可以是“部分的”，即当该核酸中的仅某些可以结合，或完整的，当单链分子之间存在完全互补。核酸链之间的互补程度对核酸链杂交的效力和强度有显著影响。这对依赖于核酸链之间的结合的扩增反应特别重要，例如在设计和使用肽核酸(PNA)分子中。

“缺失”是氨基酸或核苷酸序列中导致缺少一个或多个氨基酸残基或核苷酸的改变。

用于多核苷酸的术语“衍生的”指化学修饰编码特定多肽的多核苷酸或与编码特定多肽的多核苷酸互补的多核苷酸。这种修饰包括例如：用烷基、酰基或氨基置换氢。本文用于多肽的术语“衍生的”指通过羟化、糖基化、聚乙二醇化或任何相似方法修饰的多肽。术语“衍生物”包含含有衍生出它的分子的至少一种结构和/或功能特征的分子。

当一个分子含有在正常情况下不是该分子一部分的额外化学基团时，它被称为其它分子的“化学衍生物”。这些基团可改善分子的溶解性、吸收性、生物半衰期等。该基团还可以降低分子的毒性，消除或弱化分子的任何不良副作用等。能介导这些效果的基团是本领域一般可得的，并可在例如Remington’s PharmaceuticalSciences，见上文中找到。将这些基团与分子偶联的方法是本领域熟知的。

作为术语用于本文的“赋形剂”是任何在药物、疫苗或其它药物组合物配制中用作稀释剂或载体的惰性物质，来赋予该药物、疫苗或药物组合物合适的稠度形态。

本文所用的术语“功能性等价物”指具有特定多肽或多核苷酸的至少一种功能和/或结构特征的多肽或多核苷酸。功能性等价物可含有能进行特定功能的修饰。术语“功能性等价物”将包括分子的片段、突变体、杂交物、变体、同类物或化学衍生物。

“融合蛋白”是其中肽序列来自不同蛋白质并可操纵性连接的蛋白质。

术语“杂交”指核酸序列与互补序列通过碱基配对结合的过程。杂交条件可用例如预杂交和杂交溶液中盐或甲酰胺浓度，或杂交温度限定，是本领域熟知的。杂交可在各种严格条件下发生。

特别是，严格度可通过降低盐浓度，提高甲酰胺浓度，或提高杂交温度来提高。例如，为了本发明的目的，高严格条件下的杂交发生在约37℃-42℃下，约50％甲酰胺中，降低的严格条件下，在约35％-25％甲酰胺中，约30-35℃下。特别是，杂交在，42℃，50％甲酰胺，5X SSPE，0.3％SDS和200微克/毫升剪切和变性的鲑鱼精DNA最高的严格条件下发生。

对应具体严格水平的温度范围可用本领域已知的方法进一步缩小，例如，通过计算感兴趣的核酸的嘌呤和嘧啶比，据此调节温度。为了除去非专一信号，可依次洗涤印迹，例如在递增的严格条件下，达0.1X SSC和0.5％SDS在室温下洗涤。上述范围和条件的变化是本领域熟知的。

“免疫原性”涉及在生物体内引起免疫应答的能力。显示免疫原性性质的因子称为免疫原性的。因子可包括但不限于各种大分子，例如蛋白质、脂蛋白、多糖、核酸、细菌和细菌组分，以及病毒和病毒组分。免疫原性因子通常具有相当高的分子量(通常大于10kDa)。

“感染性”指能感染或能产生感染，指微生物，例如细菌或病毒在体内的侵袭和复制。

术语“插入”或“添加”指多肽或多核苷酸序列中的改变，分别导致与天然存在的分子相比加入一个或多个氨基酸或核苷酸。

本文所用的术语“分离的”指不仅从存在于来自蛋白质天然来源的蛋白质，还从一般其它成分中分离得到的分子，优选指在如果存在仅一种溶剂、缓冲剂、离子的任何东西或其它通常存在于该相同溶液中的组分中发现的分子。本文所用的术语“分离的”和“纯化的”不包括其天然来源中存在的分子。

术语“微阵列”指任何核酸、氨基酸、抗体等在基质上的排列。基质可以是任何合适的载体，例如珠、玻璃、纸、硝基纤维素、尼龙、或任何合适的膜等。基质可以是任何刚性或半刚性的载体，包括但不限于膜、滤膜、晶片、芯片、玻片、纤维、珠，包括磁性或非磁性的珠、凝胶、管材、皿、聚合物、微粒、毛细管等。基质可提供包被的表面和/或具有各种表面形式，例如小孔(wells)、针(pins)、沟(trenches)、渠(channels)和细孔(pore)，在其上可结合核酸和氨基酸等。

术语“微生物”可包括但不限于病毒、细菌、衣原体、立克次氏体、支原体、脲原体、真菌和寄生虫，包括感染性寄生虫例如原生动物。

术语“核酸”或“多核苷酸”序列或“多核苷酸”指寡核苷酸、核苷酸或多核苷酸或其任何片段，天然或合成来源的DNA或RNA，它们可以是单链或双链，并且可代表正义或反义链，肽核酸(PNA)或天然或合成来源的任何DNA样或RNA样物质。多核苷酸片段是任何保留多核苷酸的至少一种结构或功能特征的多核苷酸序列的部分。在本发明的一个实施例中，多核苷酸片段是编码至少一个(Gly-X-Y)_n区的多核苷酸片段。多核苷酸片段长度可变，例如长度可大于60个核苷酸，至少长100个核苷酸，至少长1000个核苷酸或至少长10,000个核苷酸。

词组“相似性百分数(percent similarity)”(％相似性)指在比较两条或多条多肽或多核苷酸序列中发现的相似序列性百分数。相似性百分数可通过本领域熟知的方法确定。例如氨基酸序列之间的相似性百分数可以用Clustal法计算(见例如Higgins，D.G.和P.M.Sharp(1988)Gene 73：237-244)。Clustal算法将序列通过检测所有配对之间的距离分成簇。配对排列簇，然后排列组。通过将序列A的长度减去序列A中缺口残基的数目，减去序列B中缺口残基的数目的差，除以序列A和序列B之间的残基匹配和，乘以100计算两条氨基酸序列，例如序列A和序列B之间的相似性百分数。两条氨基酸序列之间低或无同源性的缺口不包括在相似性百分数的计算中。可用本领域已知的其它方法计算相似性百分数，通过改变杂交条件，并可用MEGALIGN程序(DNASTAR Inc.，Madison，Wisconsin)用电脑计算。

本文所用的术语“植物”包括指一种或多种植物，即任何真核自养生物，例如被子植物和裸子植物、单子叶和双子叶植物等，包括但不限于大豆、棉花、苜蓿、亚麻、番茄、甘蔗、甜菜、向日葵、马铃薯、烟草、玉米、小麦、水稻、莴苣、香蕉、木薯、红花、含油种子、油菜、芥菜、加拿大油菜、大麻、水藻、海草等。术语“植物”还包括一种或多种植物细胞。术语“植物细胞”包括但不限于植物组织和器官，如种子、悬浮培养物、种胚、分生组织区、愈伤组织、叶、根、芽、配子体、孢子体、花粉、块茎、球茎、鳞茎、花、果、球花、小孢子等。

术语“翻译后酶”指任何催化例如任何胶原或前胶原翻译后修饰的酶。术语包括但不限于例如，脯氨酰羟化酶、肽基脯氨酰异构酶、胶原半乳糖苷羟赖氨酰葡糖转移酶、羟赖氨酰半乳糖苷转移酶、C-蛋白酶、N-蛋白酶、赖氨酰羟化酶和赖氨酰氧化酶。

本文所用的术语“启动子”通常指能引发，指导和介导多核苷酸序列转录的核酸序列的调控区。启动子可以另外含有识别序列，例如上游或下游启动子元件，它们可以影响转录速率。

术语“非组成型启动子”指通过特定组织诱导转录的启动子，或可以在环境或发育控制下诱导转录，并包括可阻抑和可诱导的启动子，例如倾向组织的，组织专一性的和细胞类型特异性的启动子。这种启动子包括但不限于可被低氧或冷压力诱导的AdH1启动子，被热压力诱导的Hsp70启动子和可被光诱导的PPDK启动子。

“倾向组织的”启动子是在某些组织中优先引发转录的启动子。“倾向组织”的启动子是仅在某些组织中引发转录的启动子。“细胞类型特异性”的启动子是主要在至少一个器官中的某些细胞类型中例如血管细胞中驱动表达的启动子。

“可诱导”或“可阻抑”启动子是那些在环境控制下，例如转染受到例如环境条件，如厌氧条件，存在光，生物压力等控制下的启动子，或对内部、化学或生物信号，如甘油醛磷酸脱氢酶、AOX1和AOX2甲醇诱导启动子或物理损伤有反应的启动子。

本文所用的术语“组成型启动子”指引发、指导、介导转录，并且在大部分环境条件下和在发育或细胞分化的状态下具有活性的启动子。组成型启动子的例子包括但不限于花椰菜花叶病毒(CaMy)35S，衍生自根瘤土壤杆菌T-DNA的1’-或2’-启动子、泛蛋白1启动子、Smas启动子、肉桂醇脱氢酶启动子、甘油醛脱氢酶启动子和氧化氮合酶(Nos)启动子等。

本文所用的术语“纯化”描述了指定的分子存在于基本不存在其它生物大分子，例如多核苷酸、蛋白质等的状态下。术语优选考虑感兴趣的分子存在于溶液或组合物中或至少占80％重量；优选至少85％重量；更优选至少95％重量；和最优选至少99.8％重量。可存在水、缓冲液和其它小分子，尤其是具有小于1kDa的分子量的分子。

本文所用的术语“基本纯化的”指从其天然环境取出的，分离或分开，并至少60％，优选75％，最优选90％无其它与之天然结合成分的核酸或氨基酸序列。

“取代”是一个或多个氨基酸或核苷酸分别被不同的氨基酸或核苷酸分别置换。

本文所用的术语“转染”指向细胞中引入表达载体的过程。各种转染技术是本领域已知的，例如显微注射、脂转染或用基因枪。

本文限定的“转化”描述了外源核酸序列，例如DNA进入和改变受体细胞的过程。转化可以在天然或人工条件下用各种本领域已知的方法发生。转化可以依赖于任何已知方法，用于在原核或真核宿主细胞中插入外源核酸序列。基于要转化的宿主细胞的类型选择方法，并且可包括但不限于病毒感染、电泳、热休克、脂转染和粒子轰击。这种“经转染的”细胞包括稳定转化的细胞，其中插入的DNA能作为自动复制质粒或作为宿主染色体的一部分来复制，还包括能在一段限定时间内瞬时表达插入的核酸的细胞。

本文所用的术语“疫苗”指制备杀死的或修饰的微生物、活的减毒生物或活的完全毒性生物或任何其它因子，包括但不限于肽、蛋白质、生物大分子或核酸的天然、合成或半合成的制备物，施用该制备物产生或人工提高对特定疾病的免疫力，以防止类似侵入的再次感染。疫苗可以是活的或灭活的微生物或制剂，包括病毒和细菌，以及亚单位、合成的、半合成或基于重组DNA的病毒和细菌。

疫苗可以是单价(一种菌株/微生物/疾病疫苗)，含有一种微生物或因子(例如脊髓灰质炎病毒)，或一种微生物或因子的多种抗原。疫苗还可以是多价的，例如二价，三价等(混合的疫苗)，含有一种以上的微生物或制剂(例如麻疹-腮腺炎-风疹(MMR)疫苗)或一种以上微生物或因子的抗原。

从活微生物制备活的疫苗。减毒的疫苗是从微生物制备的活疫苗，它经过物理改变或在实验室动物宿主中系列传代，或感染组织/细胞培养物，这种处理产生无毒的株或毒性减弱的株，但维持诱导保护性免疫的能力。活的减毒疫苗的例子包括麻疹、胆腺炎、风疹和犬热病(canine distemper)、灭活疫苗是指已用化学或物理处理(诸如甲醋、β丙醇酸内酯(beta-propiolactone)、γ线照射)破坏其感染性微生物成份，而不影响病毒外壳(coat)和细菌外膜蛋白的抗原性和免疫原性的疫苗。灭活或亚单位疫苗的例子包括流感、甲型肝炎、春髓灰质炎(IPV)疫苗。

亚单位疫苗由来自病毒、细菌或其它能引起免疫应答的制剂的关键大分子组成。这些成分可用许多方法获得，例如通过从微生物纯化，用重组DNA技术产生等。亚单位疫苗可含有任何感染因子的合成模拟物。亚单位疫苗可包括大分子，例如细菌蛋白毒素(如破伤风、白喉)、病毒蛋白(如从流感病毒得)、从有荚膜的细菌(如流感嗜血菌和肺炎链球菌)得到的多糖和重组DNA技术产生的病毒样颗粒(如乙肝表面抗原)等。

合成的疫苗是小合成肽构成的疫苗、该肽是模拟病原体表面抗原的，是免疫原性的，或可以是在重组DNA技术帮助下制造的疫苗，包括核酸经过修饰的完整病毒。

半合成疫苗或偶联疫苗(conjugate vaccines)由结合在蛋白质载体分子的微生物的多糖抗原构成。

DNA疫苗含有编码抗原的重组DNA载体，在摄取DNA的宿主细胞中表达该编码抗原后，诱导针对该编码的抗原的体液和细胞免疫应答。

对于多种感染性因子已经开发了疫苗。本发明针对不论涉及的因子，可用于疫苗制剂的重组明胶，因此不限于本文为了说明而作为例子特别描述的疫苗。疫苗包括但不限于牛痘病毒(天花)、脊髓灰质炎病毒(Salk和Sabin疫苗)。腮腺炎、麻疹、风疹、白喉、破伤风、水痘-带状疱疹(水痘/带状疱疹)、百日咳(百日咳)、卡介苗(BCG，结核病)、流感嗜血杆菌脑膜炎、狂犬病、霍乱、日本脑炎病毒、伤寒沙门氏菌、志贺氏菌、甲肝、乙肝、腺病毒、黄热病、口蹄疫、单纯疱疹病毒、呼吸道合胞病毒、轮状病毒、登革热、西尼罗河热病毒、土耳其疱疹病毒(马立克氏病)、流感和炭疽。本文所用的术语疫苗包括指各种已经开发或将要开发的感染性和自身免疫病，以及癌症的疫苗，例如针对各种感染性和自身免疫疾病的疫苗，如针对人类免疫缺陷病毒(HIV)、(HCV)、疟疾的疫苗，和对乳腺、肺、结肠、直肠、膀胱和卵巢癌的疫苗。

多肽或氨基酸“变体”是一种改变来自特定氨基酸序列的一个或多个氨基酸获得的氨基酸序列。多肽变体可以具有保守改变，其中取代的氨基酸具有与被置换的氨基酸具有类似的结构或化学性能，例如用异亮氨酸取代亮氨酸。变体还可以具有非保守取代，其中取代的氨基酸可具于与被取代的氨基酸不同的物理性质，例如用色氨酸置换甘氨酸。类似的小变化还可以包括氨基酸缺失或插入，或同时包括两者。优选氨基酸变体维持特定多肽的某些结构或功能特征。确定取代、插入或缺失哪些氨基酸残基的指导可用本领域熟知的计算机程序，例如LASERGENE软件(DNASTAR，Inc.Madison，WI)找到。

多核苷酸变体是一种特定多核苷酸序列的变体，优选具有至少约80％、更优选至少约90％，最优选至少约95％多核苷酸序列与特定的多核苷酸序列相似。本领域技术人员应理解由于基因编码的简并性，可产生编码特定蛋白质的多种不同的多核苷酸序列，其中一些与任何已知和天然存在的基因的多核苷酸序列的同源性最小。因此，本发明考虑可通过根据可能的密码子选择选择组合制备的每一种可能的多核苷酸序列变体。可根据标准密码子三个一组的基因编码产生这些组合，所有的这些变体都被视为特别公开。

发明

本发明提供了重组动物胶原和明胶的生产。这些动物胶原和明胶提供了超越目前可得的材料的优点，在于它们是作为良好特征的和纯的蛋白质来产生的。还提供了制备这些动物胶原和明胶的方法。在某些实施例中，本发明提供了衍生自牛I型胶原、牛III型胶原、猪I型胶原和猪III型胶原的动物胶原和明胶。在某些特殊实施例中，提供了牛α1(I)、牛α1(III)、猪α1(I)、猪α2(I)和猪α1(III)胶原和明胶。

本发明提供了在不产生任何其它胶原类型的在重组细胞培养系统中合成相对大量的单一类型的动物胶原的生产。例如，本发明提供了基本无任何其它胶原形式的动物I型胶原。用本发明的方法，大大促进了胶原的纯化。

本发明还针对用于本发明的方法的载体和质粒。这些载体和/或质粒由编码所需胶原或其片段或变体的多核苷酸，必需的启动子、和其它正确表达这些多肽必需的序列构成。优选从动物来源获得编码胶原的多核苷酸。动物来源包括非人类哺乳动物来源，诸如牛、绵羊和猪来源。在一个实施例中，本发明的载体和质粒进一步包含编码一种或多种翻译后酶或其功能性等价物的至少一种多核苷酸。编码一种或多种翻译后酶的多核苷酸可以衍生自任何上述物种。在一个优选例中，编码胶原的多核苷酸衍生自与编码翻译后酶的多核苷酸相同的物种。

在另一个实施例中，将至少一种编码翻译后酶，例如脯氨酰4-羟化酶，C-蛋白酶，N-蛋白酶，赖氨酰氧化酶或赖氨酰羟化酶的多核苷酸插入不天然产生翻译后酶的细胞，例如酵母细胞，或插入天然不产生足量的翻译后酶的细胞，例如一些哺乳动物和昆虫细胞。在本发明的一个优选例中，翻译后酶是脯氨酰4-羟化酶，其中编码脯氨酰4-羟化酶的α亚基的多核苷酸和编码脯氨酰4-羟化酶的β亚基的多核苷酸被插入细胞，以产生生物活性的脯氨酰4-羟化酶。

本发明特别考虑了使用任何生物学或化学化合物，如需要的话，对于本发明的重组动物胶原和明胶使用羟化，即例如脯氨酸羟化和/或赖氨酸羟化。这包括例如内源性或外源性补充的来自任何物种的脯氨酰4-羟化酶，包括脯氨酰4-羟化酶的各种同工型，和具有所需活性的脯氨酰4-羟化酶的任何变体或片段或亚基，不论是天然的，合成的或半合成的，和脯氨酰3-羟化酶等其它羟化酶(见例如美国专利号5,928,922)，在此完整引入以供参考。在一个实施例中，脯氨酰羟化酶活性是由衍生自编码重组胶原或明胶的多核苷酸，或编码可衍生重组明胶的多肽的相同物种的脯氨酰羟化酶赋予的。在另一个实施例中，脯氨酰4-羟化酶来自动物，编码的多核苷酸来自相同动物的序列。

本发明提供了产生重组动物胶原和明胶的方法。应注意为了说明，虽然该生产方法一般针对胶原的生产，该生产方法可用于直接从改变的胶原构建物生产明胶，和生产能衍生出明胶的多肽。在一个实施例中，该方法包括在适合表达的条件下，在宿主细胞中引入编码动物胶原或前胶原，或其片段或变体的表达载体，和编码翻译后酶的第二个表达载体，并分离胶原。在一个优选例中，翻译后酶是脯氨酰羟化酶(见例如，美国专利号5,593,859，在此完整引入以供参考)。

本发明还提供了包括至少一种动物胶原链或亚基，或其片段或变体的动物胶原。在一个优选例中，本发明的胶原组分含有胶原链、或其片段或变体，它具有结构氨基酸模式(Gly-X-Y)_n，其中X和Y可以是任何氨基酸。优选X和/或Y的氨基酸是脯氨酸或羟脯氨酸；甘氨酸(Gly)是在每条链的每隔二个残基位；重复的Gly-X-Y三个一组的数目是约10-3000(即n＝10-3000)。胶原链中的Gly-X-Y单元，或其亚基或片段是相同或不同的。在一个方面，本发明的胶原组合物没有完全糖基化或没有完全羟化。例如，本发明的胶原可以是去糖基化、未糖基化、部分糖基化和部分羟化的。在本发明的另一个方面中，胶原组合物由一类胶原组成，基本不含任何其它类型的胶原。在一个实施例中，本发明提供了一种基本无任何其它类型，如II-XX型等的胶原的重组I型胶原。

本发明还包含重组多肽，包括从嵌合基因产生的融合产物，例如可为了治疗和其它用途制造胶原的相关表位。另外，本发明包含任何对胶原或明胶或其组合物或其任何降解产物作出的任何修饰。这些修饰包括例如加工动物胶原或胶原性蛋白和明胶。

本发明还提供了明胶组合物。特别是本发明提供了衍生自动物胶原的明胶组合物。在许多实施例中，该明胶组合物衍生自牛、猪或鱼胶原。在本发明的其它方面，组合物含有衍生自基本无任何其它胶原类型的胶原类型的明胶。在本发明的另一个方面，明胶组合物含有变性的三链螺旋，包括至少一种胶原亚基或链，或其片段或变体。

本发明还提供了通过表达胶原或其功能性等价物生产明胶，和从其衍生明胶的方法。本发明还提供了从改变的动物胶原构建体直接表达重组动物明胶。(见例如目前拥有的同时申请的美国临时申请＿＿，题为“重组明胶”，2000年11月10日提交，在此完整引入以供参考)。更特别的是，该过程涉及在细胞中插入一种表达载体，它含有至少一种编码动物胶原的多核苷酸，或其片段或变体，和含有至少一种编码胶原翻译后酶或其亚基的多核苷酸的表达载体，回收胶原，从胶原衍生出明胶。

在本发明的某些实施例中，可直接从分离的胶原或生物质或培养液中获得明胶组合物。从胶原产生明胶组合物的方法、过程和技术包括利用去污剂、加热或变性剂使胶原的三链螺旋结构变性，另外，这些方法、过程和技术还包括，但不限于用强碱或强酸处理，在水溶液中热提取，离子交换层析，交流过滤和加热干燥，和其它用于胶原产生明胶组合物的本领域已知的方法。相同的方法、过程和技术可用于生物质或培养液，来产生本发明的明胶组合物。

本发明还涉及各种动物胶原。在一个方面，本发明提供了牛I型胶原和牛III型胶原。在特定的实施例中，提供了牛α1(I)胶原和牛α1(III)胶原及其片段和变体。

在另一个方面，本发明提供了猪I型和猪II型胶原。另外，本发明提供了猪α1(I)胶原、猪α2(I)胶原和猪α1(III)胶原，及其片段和变体。

本发明还提供了编码牛α1(I)胶原、牛α1(III)胶原、猪α1(I)胶原或猪α1(III)胶原或猪α2(I)胶原或其片段或变体的多核苷酸。本发明还提供了与编码的多核苷酸互补的多核苷酸，以及在严格条件下与这些核酸序列杂交的多核苷酸。本发明还提供了产生重组牛I型胶原、牛III型胶原、猪I型胶原或猪III型胶原或其片段或变体的方法。

在本发明的另一个方面，含有本发明的多核苷酸的表达载体可插入宿主细胞，产生动物胶原或明胶，例如牛I型、牛III型、猪I型和猪III型胶原或明胶。在一个方法中，含有本发明的多核苷酸的表达载体是在宿主细胞中，用含有编码本发明的多肽的多核苷酸的表达载体与含有编码翻译后酶的多核苷酸的表达载体共表达得到的。在一个实施例中，翻译后酶是脯氨酰4-羟化酶，含有α亚基和β亚基。

本发明的重组动物胶原和明胶限制了人与各种污染物的接触，这些污染物存在于目前用作制造胶原和胶原衍生物质如明胶的原料的动物组织中。另外，本发明的胶原和明胶比目前从原始动物来源获得的胶原或明胶更具可复制性。

根据本发明，编码多核苷酸序列以及具有可预测表现的特征明显的蛋白质可用于产生指导该多肽在合适的宿主细胞中表达的重组分子。

本领域一般描述了编码胶原的核酸序列。(见例如Fuller和Boedtker(1981)Biochemistry 20：996-1006；Sandell等(1984)J Biol Chem259：7826-34；Kohno等(1984)J Biol Chem.259：13668-13673；French等(1985)gene39：311-312；Metsaranta等(1991)J Biol Chem 266：16862-16869；Metsaranta等(1991)Biochem Biophys Acta 1089：241-243；Wood等(1987)Gene 61：225-230；Glumoff等(1994)Biochem Biophys Acta 1217：41-48；Shirai等(1998)MatrixBiology 17：85-88；Tromp等(1988)Biochem J.253：919-912；Kuivaniemi等(1988)Biochem J.252：633-640；和Ala-Kokko等(1989)Biochem J.260：509-516)。

在一个实施例中，本发明提供了一种多核苷酸序列，它含有一种分离的和纯化的多核苷酸序列，它与存在于SEQ ID NO：1中的牛α1(I)胶原多核苷酸序列或其片段或变体具有大于70％的相似性，优选大于80％的相似性，更优选大于90％的相似性。在另一个实施例中，多核苷酸序列编码SEQ ID NO：2的牛α1(I)氨基酸序列或其片段或变体。

在另一个实施例中，本发明的多核苷酸序列含有分离的和纯化的多核苷酸序列，它与存在于SEQ ID NO：3或SEQ ID NO：5中的牛α1(III)胶原的多核苷酸序列或其片段或变体具有大于70％的相似性，优选大于80％的相似性，更优选大于90％的相似性。在一个实施例中，多核苷酸序列编码SEQ ID NO：4或SEQ ID NO：6的牛α1(III)序列或其片段或变体。

在一方面，本发明提供了分离的和纯化的多核苷酸序列，它含有的一条多核苷酸，与存在于SEQ ID NO：7中的猪α1(I)胶原的多核苷酸序列或其片段或变体具有大于70％的相似性，优选大于80％的相似性，更优选大于90％的相似性。在一个实施例中，多核苷酸序列编码SEQ ID NO：8的氨基酸序列或其片段或变体。

在另一方面中，本发明考虑了分离的和纯化的多核苷酸序列，它含有一条序列，与存在于SEQ ID NO：9中的猪α2(I)胶原的多核苷酸序列或其片段或变体具有大于70％的相似性，优选大于80％的相似性，更优选大于90％的相似性。在一个实施例中，多核苷酸序列编码SEQ ID NO：10的猪α2(I)氨基酸序列或其片段或变体。

在另一个方面中，本发明涉及一种分离的和纯化的多核苷酸序列，它与存在于SEQ ID NO：11中的猪α1(III)胶原的多核苷酸序列或其片段或变体具有大于70％的相似性，优选大于80％的相似性，更优选大于90％的相似性。在另一个实施例中，多核苷酸序列编码SEQ ID NO：12的猪α1(III)序列或其片段或变体。

可用各种本领域已知的方法，从据信具有感兴趣的胶原类型，并在可检测水平表达该胶原的组织制备的cDNA文库，获得未获得核酸序列的胶原。例如，可从已知表达新胶原的细胞系获得聚腺苷酸化的mRNA构建cDNA文库，或可用先前制成该组织/细胞类型的cDNA文库。用合适的核酸探针筛选cDNA文库，和/或用专一性识别其它胶原的合适的多克隆或单克隆抗体筛选文库。合适的核酸探针包括编码来自相同或不同物种的新颖胶原的已知部分的寡核苷酸探针。其它合适的探针包括但不限于编码相同或相似基因的寡核苷酸、cDNA或其片段和/或同源性基因组DNA或其片段。用所选的探针筛选cDNA文库或基因组文库可用本领域已知的标准方法实现(见例如Maniatis等，见上)。鉴定新胶原的其它方法涉及重组DNA技术的已知技术，例如通过直接表达克隆或用聚合酶链式反应(PCR)，如，美国专利号4,683,195，或如Maniatis等，见上或Ausubel等，见上所述。

可根据本发明使用的改变的多核苷酸序列包括缺失、添加或取代不同的核苷酸残基，得到编码相同或功能上等价的基因产物的序列。基因产物本身可含有氨基酸残基的缺失、添加或取代，仍然得到功能上等价的多肽。

本发明的核酸序列可经过工程改造，来为了各种目的改变编码序列，包括但不限于：修改基因产物加工和表达的改变。例如，可用另一种分泌信号取代天然的分泌信号，和/或用本领域已知的技术，例如定点诱变引入突变，来插入新限制性位点，改变糖基化模式，磷酸化等。在一个实施例中，本发明的多核苷酸在任何三联氨基酸密码子的沉默位置改变，从而更好的符合特定宿主生物体的密码子选择。

进一步将本发明的多核苷酸定向到编码所述动物胶原和明胶的变体和片段。可用各种本领域已知的引入合适核苷酸和氨基酸改变的方法制备这些氨基酸片段和变体。氨基酸变体构建中的两个重要变量是突变的位置和突变的性质。优选通过给予在天然中不存在的氨基酸序列的多核苷酸突变构建胶原的氨基酸变体。在与来自不同物种的胶原中不同的位置(可变位置)或在高度保守的区域(恒定区域)中制备这些氨基酸改变。这些位置上的位点通常被系列修饰，例如通过用保守选择取代第一个(例如用疏水性氨基酸取代不同的疏水性氨基酸)，然后用更不同的选择(例如用疏水性氨基酸取代带电的氨基酸)然后可在靶位点制造缺失和插入。

氨基酸根据它们的侧链(极性、电荷、溶解度、疏水性、亲水性和/或两性性质)分成组：(1)疏水的(亮氨酸，甲硫氨酸，丙氨酸，异亮氨酸)，(2)中性疏水的(半胱氨酸，丝氨酸，苏氨酸)，(3)酸性(天冬氨酸，谷氨酸)，(4)弱碱性(天冬酰胺，谷氨酰胺，组氨酸)，(5)强碱性(赖氨酸，精氨酸)，(6)影响链取向的残基(甘氨酸，脯氨酸)和(7)芳族(色氨酸，酪氨酸，苯丙氨酸)。保守改变包括一个氨基酸位置与“天然”氨基酸同一组内的改变的变体。温和保守改变包括一个氨基酸位置的变体，它在与“天然”氨基酸密切相关的组中(例如中性疏水变为弱碱性)。非保守改变包括一个氨基酸位置的改变，它在与“天然”氨基酸很不相关的组中(如疏水的变为强碱性或酸性)。

氨基酸序列的缺失一般在约1-30个残基，优选约1-10个残基，通常是连续的。氨基酸插入包括氨基和/或羧基末端融合长度在1-100个或以上的残基范围，以及在序列内插入一个或多个氨基酸残基。序列内插入的范围一般在约i-10个氨基酸残基，优选1-5个残基。末端插入的例子包括分泌或在不同宿主细胞中胞内靶向必需的异源信号序列。

在本发明的另一个实施例中，本发明的多核苷酸可与异源序列连接，编码融合蛋白。例如，融合蛋白可经工程改造，含有本发明的在α1(I)牛胶原序列和异源蛋白质序列之间的切割位点，从而可将α1(I)胶原与异源分子切开。

还可根据本领域熟知的方法产生多核苷酸变体。在本发明的一个实施例中，多核苷酸通过定点诱变改变。该方法使用编码所需氨基酸变体的多核苷酸序列的寡核苷酸序列，以及在改变的氨基酸两侧足够的邻接核苷酸，在要改变的位点两侧的任一侧形成稳定的双链体。一般定点诱变技术是本领域技术人员熟知的，例如出版物Edelman等(1983)DNA 2：183说明了该技术。Zoller和Smith(1982)NucleicAcids Res.10：6487-6500描述了多核苷酸序列中产生位点专一性改变的多用途和有效的方法。

如本领域已知的，核酸突变不必要改变多核苷酸序列编码的氨基酸序列，但提供用于操纵分子的独特限制性位点。因此，经修饰的分子可由许多不连续区域，或D-区构成，侧接独特的限制性位点。该分子的这些不连续区在本文中称为盒。本发明包含一个盒的多个拷贝形成的分子。本发明还包括重组或突变的核酸分子或盒，它们提供了所需特征，例如抗内源性酶，如胶原酶(见例如Maniatis等，见上；和Ausubel等，见上)。

本领域技术人员应理解，由于基因密码的简并性，可产生多种编码本发明的多肽或其功能性等价物的多核苷酸序列，其中某些与任何已知或天然存在的基因的核苷酸序列同源性最小。因此，本发明考虑可结合基于可能的密码子选择产生的核苷酸序列的每种和每一个可能变化。根据标准三联体基因密码产生这些组合。

本发明还包括完全通过合成化学产生编码本发明的多肽或其功能性等价物的多核苷酸序列或其片段。在产生后可将合成的序列用本领域熟知的试剂插入许多可得的表达载体和细胞系统的任一。另外，可用合成化学在编码胶原或其功能性等价物的多核苷酸序列中引入突变。

还可用PCR来建立本发明的突变。当用小量模板核酸作为起始材料，序列与模板核酸中的相应区域略有不同的引物可产生所需的氨基酸变体。PCR扩增得到一群与在引物特异的位置编码胶原的多核苷酸模板不同的产物多核苷酸片段。产物片段代替了质粒中相应的区域，建立了所需核酸或氨基酸变体。

由于基因密码固有的简并性，本发明还包括基本编码相同或功能上等价的多肽序列的其它多核苷酸序列，还特别考虑了所有简并变体和密码子优化的序列。天然、合成、半合成或重组的编码多核苷酸序列可用于所要求的发明的实施。这些多核苷酸序列包括能与合适的多核苷酸序列在严格条件下杂交的那些。

如天然产生的，胶原是结构蛋白，含有一种或多种胶原亚基，它们一起形成至少一个三链螺旋结构域。利用各种酶，以将胶原亚基转化成前胶原或其它前体分子，然后转化成成熟胶原。这些酶包括例如脯氨酰4-羟化酶、C-蛋白酶、N-蛋白酶、赖氨酰氧化酶、赖氨酰羟化酶等。

脯氨酰4-羟化酶是α₂β₂四聚体，在所有胶原的生物合成中起到了中心作用，4-羟脯氨酸残基使新合成的多肽链折叠成稳定三链螺旋分子的过程稳定(见例如Prockop等(1995)Annu.Rev.Biochem.64：403-434；Kivirikko等(1992)“蛋白质的翻译后修饰”pp.1-51；和Kivirikko等(1989)FASEB J.3：1609-1617)。另外，III型胶原表达的水平在不存在重组脯氨酰4-羟化酶时比存在时低。已克隆了脯氨酰4-羟化酶的人同工型，并确定了特征(见例如Helaakoski等(1995)Proc.Natl.Acad.Sci.92：4427-4431；美国专利号5,928,922)。

赖氨酰羟化酶，一种α2同二聚物，催化胶原的翻译后修饰，在胶原内形成羟赖氨酸。一般见Kivirikko等(1992)蛋白质的翻译后修饰，Harding，J.J.和Crabbe，M.J.C.编，CRC Press，Boca Raton，FL；和Kivirikko(1995)医学生物学原理，卷3，细胞器和胞外基质，Bittar，E.E.和Bittar，N.编，JAI Press，Greenwich，Great Britain。克隆和鉴定了赖氨酰羟化酶的同工型(见例如Passoja等(1998)Proc.Natl.Acad.Sci.95(18)：10482-10486；和Valtavaara等(1997)J.Biol.Chem.272(1)：6831-6834)。

C-蛋白酶通过切下前胶原的C-末端加工装配的前胶原，该末端帮助装配但不是胶原分子三链螺旋的部分(见例如Kadler等(1987)J.Biol.Chem.262：15969-15701；和Kadler等(1990)Ann.NY Acad.Sci.580：214-224)。

N-蛋白酶通过切下前胶原的N-末端加工装配的前胶原，该末端帮助装配但不是胶原三链螺旋的部分(见例如Hojima等(1987)J.Biol.Chem.269：11381-11390)。

赖氨酰氧化酶是一种胞外铜酶，催化某些赖氨酸和羟赖氨酸残基中α-氨基的氧化性脱氨基，形成反义性醛。然后这些醛经过醇醛缩合形成醇醛，交联胶原纤维。可在例如Kivirikko(1995)，见上，Kagan(1994)Path.Res.Pract.190：910-919；Kenyon等(1993)J.Biol.Chem.268(25)：18435-18437；Wu等(1992)J.Biol.Chem.267(34)：24199-24206；Mariani等(1992)Matrix 12(3)：242-248；和Hamalainen等(1991)Genomics 11(3)：508-516中找到赖氨酰氧化酶的DNA和蛋白序列的信息。

报道了编码许多这些翻译后酶的核酸序列(见例如Vuori等(1992)Proc.Natl.Acad.Sci.USA 89：7467-7470；和Kessler等(1996)Science 271：360-362)。编码各种翻译后酶的核酸序列还可根据上面一般描述的方法确定，包括使用合适的探针和核酸文库。

本发明的重组动物明胶可用本领域已知的各种方法衍生自动物胶原(见例如Veis，A.(1965)International Review of Connective Tissue Research，3：113-200)例如目前加工的共同特征是胶原蛋白的二级结构变性，在大部分情况下是胶原的一级或三级结构改变。因此本发明的动物胶原可用不同方法加工，视所需明胶类型决定。

可从重组产生的胶原或前胶原或其它胶原性多肽，用各种本领域已知的方法衍生本发明的重组动物明胶。例如，明胶可直接从细胞团块或培养基中通过利用明胶在升温下的溶解度提高，及其在低或高pH，低或高盐浓度和高温下的稳定性衍生出来。从胶原产生明胶组合物的方法、过程和技术包括利用去污剂、热或各种本领域熟知的变性剂使胶原的三链螺旋结构变性。另外，可用与从动物和屠宰场来源提取明胶有关的各种步骤，包括用石灰或酸处理，在水溶液中热提取，离子交换层析、交叉流过滤和各种干燥方法，从重组胶原中衍生本发明的明胶。

表达

本产生动物胶原和明胶的方法可用于各种本领域可得的重组系统。本文描述了许多这样的重组系统，虽然应理解本方法的应用不限于下文举例说明的系统。

为了表达本发明的重组动物胶原和明胶，或可衍生出重组明胶的多肽，将编码多核苷酸插入合适的表达载体，即含有掺入的编码序列转录和翻译必需的元件的载体，或在RNA病毒载体情况下，复制和翻译必需的元件的载体。

可用本领域技术人员熟知的方法构建含有本发明的多核苷酸和合适的转录/翻译控制信号的表达载体。这些方法包括标准DNA克隆技术，例如体外重组技术，合成技术和体内重组/基因重组(见例如，Maniatis等，见上和Ausubel等，见上所描述的技术)。

不同系统的表达元件强度和专一性都不同。由所用的宿主/载体系统而定，许多合适的转录和翻译元件，包括组成型和诱导型启动子，任一都可用于表达载体。例如，当在细菌系统中克隆时，可使用诱导型启动子，例如噬菌体γplac的pL，ptrp，ptac(ptrp-lac杂交启动子)等；当在昆虫细胞系统中克隆时，可使用杆状病毒多角体启动子等启动子；当在植物细胞系统中克隆时，可使用衍生自植物细胞基因组的启动子(例如热休克启动子；核酮糖-1，5-二磷酸羧化酶-加氧酶(RUBISCO)小亚基的启动子；叶绿素a/b结合蛋白启动子)或来自植物病毒(如花椰菜花叶病毒(CaMV)的35S RNA启动子；烟草花叶病毒(TMV)的外被蛋白启动子)；当在哺乳动物细胞系统中克隆时，可使用衍生自哺乳动物细胞基因组的启动子(如金属硫蛋白启动子)或来自哺乳动物病毒(如腺病毒晚期启动子；痘苗病毒7.5K启动子)的启动子；当产生含有多个胶原DNA拷贝的细胞系时，可与合适的可选择标记一起使用基于猴病毒40(SV40)、牛乳头瘤病毒(BPV)和EB病毒(EBV)的载体。

专一性起始信号也可以是有效翻译插入序列所需的。这些信号包括ATG起始密码子和邻接的序列。就将整个胶原基因，包括其自身的起始密码子和邻接序列插入合适的表达载体而言，不需要额外的翻译控制信号。然而对于仅插入一部分胶原编码序列情况下，必须提供外源翻译控制信号，包括ATG起始密码子。另外，起始密码子必须与胶原编码序列的阅读框协调，来确保整个插入物的翻译。这些外源翻译控制信号和起始密码子可以是各种来源，天然和合成的两种来源。表达效力可通过掺入合适的转录增强子元件、转录终止子等增强(见例如Bittner等(1987)Methods in Enzymol，153：516-544)。

本发明的多肽可以表达成分泌蛋白。当用于表达蛋白质的经工程改造的细胞是非人宿主细胞，用另一种能被宿主细胞的分泌靶向机制更有效识别的可变的分泌信号肽替换胶原蛋白的分泌信号肽常常是有利的。合适的分泌信号序列对于获得最佳真菌表达哺乳动物基因特别重要。例如见Brake等(1984)Proc.Natl.Acad.Sci.USA 81：4642。原核、酵母、真菌、昆虫或哺乳动物细胞的其它信号序列是本领域熟知的，本领域普通技术人员能够简单的选择适于所选宿主细胞的信号序列。

本发明的载体可在宿主细胞中自动复制，或可以整合入宿主基染色体。具有对于原核细胞和真核细胞的各种细菌、酵母和各种病毒复制序列的具有自动复制序列的合适载体是熟知的。当载体和宿主细胞基因组DNA中发现的序列有同源核苷酸序列时，载体可整合到宿主细胞基因组中。

在一个实施例中，本发明的表达载体含有一个可选择标记，它编码宿主细胞在某些条件下生长和存活必需的产物。典型的选择基因包括编码赋予对抗生素或其它毒素(如四环素、氨苄青霉素、新霉素、氨甲蝶呤等)的抗性的蛋白质，补偿宿主细胞营养缺陷要求的蛋白质等。选择基因的其它例子包括单纯疱疹病毒胸腺嘧啶脱氧核苷激酶(Wigler等(1977)Cell 11：223)，次黄嘌呤-鸟嘌呤磷酸核糖转移酶(Srybalska等(1962)Prot，Natl.Acod.Sci.USA 48：2026)腺嘌呤磷酸核糖转移酶(Lowy等(1980)Cell 22：817)基因，可分别在tk^-，hgprf；或aprf细胞中使用。

可用抗代谢物抗性作为选择的基础，例如用赋予氨甲蝶呤抗性的dhfr；抗霉酚酸的gpt抗性；neo，对氨基糖苷G-418赋予抗性；和hygro，对潮霉素赋予抗性(见例如Wigler等(1980)Proc.Natl.Acad.Sci.USA 77：3567；O’Hare等(1981)Proc.Natl.Acad.Sci.USA 78：1527；Mulligan等(1981)Proc.Natl.Acad.Sci.USA 78：2072；Colberre-Garapin等(1981)J.Mol.Biol.150：1；和Santerre等(1984)Gene 30：147)。其它可选择基因包括trpB，它使细胞利用吲哚以取代色氨酸；hisD，它使细胞利用组氨醇以取肛组氨酸；和odc(鸟氨酸脱羧酶)，它赋予对鸟氨酸脱羧酶抑制剂，2-(二氟甲基)-DL-鸟氨酸，DFMO的抗性。(见例如Hartman等(1988)Proc.Natl.Acad.Sci.USA 85：8047和McConlogue L.于：CurrentCommunications in Molecular Biology，Cold Spring Harbor Laboratory编(1987))。

表达本发明的载体必需的元件包括引发转录的序列，例如启动子和增强子。启动子是位于结构基因起始密码子上游的非翻译序列，它控制核酸在其控制下转录。可诱导启动子是响应培养条件的改变，例如存在或不存在一种营养物的改变，以改变其转录起始水平的启动子。本领域技术人员知道许多可在适合本发明的宿主细胞中可被识别的启动子。这些启动子通过从其天然基因上除去启动子，并在启动子序列放置编码胶原的DNA，与编码胶原的DNA3’可操纵性连接。

本发明中有用的启动子包括但不限于乳糖启动子、碱性磷酸酶启动子、色氨酸启动子、杂交启动子例如tac启动子，3-磷酸甘油酸激酶启动子，其它糖酵解酶启动子(己糖激酶、丙酮酸脱羧酶、果糖磷酸激酶、葡萄糖-6-磷酸异构酶等)，醇脱氢酶启动子、金属硫蛋白启动子、麦芽糖启动子、半乳糖启动子、多瘤病毒、禽痘病毒、腺病毒、牛乳头瘤病毒、禽肉瘤病毒、巨细胞病毒、逆转录病毒、猴病毒40的启动子和来自包括曲霉属的葡糖淀粉酶启动子的靶真核细胞的启动子，肌动蛋白启动子或哺乳动物的免疫球蛋白启动子和天然胶原启动子(见例如Boer等(1983)Proc.Natl.Acad.Sci.USA 80：21-25；Hitzeman等(1980)J.Biol.Chem.255：2073；Fiers等(1978)Nature 273：113；Mulligan和Berg(1980)Science209：1422-1427；Pavlakis等(1981)Proc.Natl.Acad.Sci.USA 78：7398-7402；Greenway等(1982)Gene 18：355-360；Gray等(1982)Nature 295：503-508；Reyes等(1982)Nature 297：598-601；Canaani和Berg(1982)Proc.Natl.Acad.Sci.USA79：5166-5170；Gorman等(1982)Proc.Natl.Acad.Sci.USA 79：6777-6781；和Nunberg等(1984)Mol.and Cell..Biol.11(4)：2306-2315)。

启动子编码序列的转录通常是通过在载体中插入增强子序列提高的。增强子是顺式激活元件，通常约10-300bp，它起到提高启动子转录起始速率的作用。许多增强子对于真核细胞和原核细胞两者都是已知的，普通技术人员可为感兴趣的宿主细胞选择合适的增强子(见例如Yaniv(1982)Nature 297：17-18)。

另外，可选择宿主细胞株，它调节插入序列的表达，或以所需的特定方式修饰和加工基因产物。这种蛋白质产物的修饰(例如糖基化)和加工(例如切割)可以是对蛋白质功能可能是重要的。不同宿主细胞具有蛋白质翻译后加工和修饰的特征性和专一性的机制。可选择合适的细胞系或宿主细胞以确保表达的外源蛋白质的正确修饰和加工。对此，可使用具有基因产物的一级转录物，糖基化和磷酸化正确加工细胞机制的真核宿主细胞。这些哺乳动物宿主细胞包括但不限于CHO、VERO、BHK、HeLa、COS、MDCK、293、WI38等。另外，可工程改造宿主细胞来表达各种酶，确保编码的多肽的正确加工。例如，可使脯氨酰4-羟化酶的基因与编码胶原或其片段或变体的多核苷酸共表达，实现正确羟基化。

为了长期、高产率产生重组蛋白，优选稳定表达。例如，可工程改造稳定表达本发明胶原的细胞系。不使用含有病毒复制起始点的表达载体，而用受合适表达控制元件(例如启动子、增强子序列，转录终止子、聚腺苷酸位点等)和可选择标记控制的编码胶原的DNA转化宿主细胞。引入外源DNA后，在富集培养基中使工程改造的细胞生长1-2日，然后切换到选择性培养基。重组质粒中的选择性标记对选择赋予抗性，使细胞将质粒稳定整合入其染色体，并生长形成灶，从而能克隆并扩增成细胞系。因此，本方法可有利的用于工程改造表达所需动物胶原或其片段或变体的细胞。

例如，由半乳糖启动子驱动的本发明的多肽表达可通过在非抑制、非诱导糖上生长培养，从而在加入半乳糖后非常迅速的诱导；在葡萄糖培养基中培养培养物，然后通过离心和洗涤细胞除去葡萄糖，重新悬浮在半乳糖培养基中；通过使细胞在含有葡萄糖和半乳糖的培养基中生长，从而在半乳糖诱导发生前优先代谢葡萄糖。

可用本领域技术人员已知的技术将表达本发明的多肽的载体和表达编码任何所需的翻译后酶的多核苷酸的载体引入宿主细胞，来产生编码的多肽。例如，可用上述表达载体转染或感染或转化宿主细胞，并在适合选择含有编码胶原的载体的转导子或转化子的营养培养基中培养。可用各种本领域技术人员已知的方法进行细胞转染，例如磷酸钙沉淀，电穿孔和脂转染技术(见例如Maniatis等，见上，Ohta，T.(1996)Nippon Rinsho54(3)：757-764；Trotter和Wood(1996)MolBiotechnol 6(3)：329-334；Mann和King(1989)J Gen Virol 70：3501-3505；和Hartig等(1991)Biotechniques 11(3)：310)。

在一个实施例中，本发明提供了本发明提供了一种方法，其中一个以上编码本发明的多肽的表达载体被插入细胞中，从而例如可合成三聚胶原。例如，在本发明的一种产生动物胶原的方法中，可以用第一种含有编码猪α1(I)胶原的多核苷酸的载体和第二个含有编码猪α2(I)胶原的多核苷酸的载体，和第三和第四个含有编码脯氨酰4-羟化酶的α亚基和β亚基的载体在适合多肽和完全羟化的异三聚猪胶原表达的条件下共感染、共转染或共转化细胞。

在本发明的另一种方法中，考虑了同三聚体胶原的生产。例如，在产生牛胶原III型时，可用第一种含有编码牛α1(III)胶原的多核苷酸的载体，第二种含有编码脯氨酰4-羟化酶α亚基的多核苷酸的载体和第三种含有编码脯氨酰4-羟化酶β亚基的多核苷酸的载体共感染、共转染或共转化细胞。其它动物胶原，包括哺乳动物胶原例如猪、羊和马胶原，和非哺乳动物动物胶原，例如鸡和鱼胶原，可在本领域技术水平内用相同或相似共表达方法和技术来产生，以及其变体产生。

可以用本领域已知任何数量的技术鉴定含有编码序列和表达生物活性基因产物的宿主细胞。这些技术包括例如：检测核酸杂交复合物的形成，通过测量宿主细胞中mRNA转录物表达评估转录水平检测存在或不存在标记基因功能，和通过免疫测定法或生物活性检测基因产物。

在第一个方法中，可通过例如检测DNA-DNA或DNA-RNA杂交复合物，或通过用含有与动物胶原编码序列或部分或其衍生物同源的核苷酸序列的引物扩增来检测所提呈的多核苷酸的存在。基于扩增的检测涉及用基于与感兴趣的编码序列同源的序列的寡核苷酸或寡聚物来检测含有编码的多核苷酸的转化物。

在第二个方法中，基于存在或不存在某种标记基因功能(例如胸腺嘧啶激酶活性，对抗生素的抗性，对氨甲蝶呤的抗性，转化表型，杆状病毒中包含体的形成)，重组表达载体/宿主系统被鉴定和选择。例如，如果编码序列插入载体的标记基因序列内，可由不存在标记基因功能能鉴定出含有编码序列的重组细胞。另外，可将标记基因置入，并与编码序列串联，置于相同或不同的启动子控制下，用于控制该编码序列表达。对应于诱导或选择的标记的表达表明编码序列的表达。

在第三个方法中，编码区的转录活性可通过杂交测定评估。例如，可用与编码序列或其特定部分同源的探针RNA印迹分离和分析RNA。另外，可抽提宿主细胞的总核酸，测定与这些探针的杂交。

在第四个方法中，用免疫学方法测定蛋白质产物的表达，例如用蛋白质印迹，和诸如放免法-沉淀、酶联免疫分析等免疫等试验。

在一个实施例中，本发明的动物胶原分泌入培养基，并可用各种本领域已知的方法，例如通过层析纯化到均一。在一个实施例中，本发明的重组动物胶原用尺寸排阻层析纯化。然而，还可用其它本领域已知的纯化技术，包括离子交换层析，和反相层析。(见例如Maniatis等，见上，Ausubel等，见上和Scopes(1994)ProteinPurification：Principles and Practice，Springer-Verlag New York Inc.，NY)。

本方法可用于，虽然不限于用于下列的表达系统。

原核

在原核系统，例如细菌系统中，根据表达的多肽所要的用途有助于选择许多表达载体。例如，当要产生大量的本发明的动物胶原和明胶，例如产生抗体时，指导能高水平表达可容易地被纯化的融合蛋白产物的载体是理想的。这些载体包括但不限于大肠杆菌表达载体pUR278(Ruther等(1983)EMBO J.2：1791)，其中可以将编码序列连接到带有lazZ编码区的阅读框内的载体上，从而产生杂交的AS-lacZ蛋白；pIN载体(Inouye等(1985)Nucleic Acids Res.13：3101-3109和Van Heeke等(1989).J.Biol.Chem.264：5503-5509)；等。pGEX载体也可用于表达作为与谷胱甘肽S-转移酶(GST)的融合蛋白的外源多肽。一般这些融合蛋白是可溶的，并可容易地通过吸附到谷胱甘肽-琼脂糖珠上，然后在游离谷胱甘肽的存在下洗脱，从裂解细胞中纯化。该pGEX载体被设计成包含有凝血酶或因子Xa蛋白酶切割位点，从而克隆的感兴趣多肽可从GST分子上释放。

酵母

在一个实施例中，本多肽在酵母表达系统中产生。在酵母中，可使用许多含有组成型或可诱导的启动子的本领域已知的载体。(见例如Ausubel等，见上，卷2，13章；Grant等(1987)Expression and Secretion Vector for Yeast，于Methodsin Enzymology，Wu & Grossman编，Acad.Press.N.Y.153：516-544；Glover(1986)DNA Cloning，卷II，IRL Press，Wash，D.C.，Ch3；Bitter(1987)酵母中的异源基因表达，Methods in Enzymology，Berger & Kimmel编，Acad.Press，N.Y.152：673-684；和The Molecular Biology of the Yeast Sacchromyces，Strathern等编，Cold Spring Harbor Press，卷I和II(1982))。

本发明的多肽可以用宿主细胞表达，例如从酿酒酵母(Saccharomycescerevisiae)表达。该特定酵母可用于许多表达载体的任一。常用表达载体是含有在酵母中增殖的2μ复制起始点和大肠杆菌中的Col E1起始点的穿梭载体，用于有效转录外源基因。这些基于2μ质粒的载体的典型例子是pWYG4，它具有2μORI-STB元件，GAL1-10启动子和2μD基因终止子。在该载体中，用Nco1克隆位点插入要表达多肽的基因，并提供ATG起始密码子。另一个表达载体是pWYG7L，它具有完整的2αORI、STB、REP1和REP2，和GAL1-10启动子，和用FLP终止子。在该载体中，编码的多核苷酸插入多接头，其5’末端在BamHI或Ncol位点。含有插入的多核苷酸的载体转化入除去细胞壁后的酿酒酵母，以产生在用钙和聚乙二醇处理后摄取DNA的原生质球体，或转化入用锂离子处理完整的细胞。

另外，可通过电穿孔引入DNA。例如可用具有可选择标记基因例如LEU2、TRP1、URA3、HIS3或Leu2-D的亮氨酸、色氨酸、尿嘧啶或组氨酸共同营养缺陷型的宿主酵母细胞选择转化子。

在本发明的一个实施例中，本多核苷酸引入来自毕赤酵母(yeast pichia)的宿主细胞。非酿酒酵母的物种，例如巴斯德毕赤酵母(Pichia pastoris)似乎以增大比例中生产高产量的重组蛋白质上有特别的优势。另外，从InvitrogenCorporation(San Diego，CA)可购得毕赤表达盒。

在甲基营养酵母，例如巴斯德毕赤酵母中有许多甲醇反应性基因，它们各自的表达受到甲醇反应性调控区控制，也称为启动子。这些甲醇反应性启动子任一适合用于实施本发明。特定调控区的例子包括AOX1启动子、AOX2启动子、二羟基丙酮合成酶(DAS)、P40启动子和来自巴斯德毕赤酵母的过氧化氢酶基因启动子等。

在其它实施例中，本发明考虑使用甲基营养酵母多形汉逊酵母(Hansenulapolymorpha)。在甲醇生长导致诱导甲醇代谢的关键酶，例如MOX(甲醇氧化酶)、DAS(二羟丙酮合成酶)和FMHD(甲酸脱氢酶)。这些酶可占全部细胞蛋白质的30-40％。编码MOX、DAS和FMDH生产的基因受到强启动子的控制，它受到在甲醇上生长的诱导，在葡萄糖上生长的抑制。这三种启动子或其中的任一可用于获得异源基因在多形汉逊酵母中的高水平表达。因此，在本发明的一个方面，编码动物胶原或其片段或变体的多核苷酸在可诱导的多形汉逊酵母的启动子的控制下被克隆入表达载体。如果需要分泌产物，将编码酵母分泌信号序列的多核苷酸与多核苷酸在阅读框中连接。在另一个实施例中，表达载体优选含有营养缺陷的标记基因，例如URA3或LEU2，它们可用于补偿营养缺陷宿主的缺陷性。

然后用本领域技术人员已知的技术用表达载体转化多形汉逊酵母宿主细胞。多形汉逊酵母转化的一个有用特征是将多达100个表达载体拷贝自发整合到基因组中。在大多数情况下，整合的多核苷酸形成显示头-尾排列的多聚体。整合的外源多核苷酸在几种重组菌株中甚至在非选择性条件下也显示稳定的有丝分裂。该高拷贝整合的现象也帮助了该系统的高生产力性能。

真菌

还用丝状真菌生产该多肽。在丝状真菌中表达和/或分泌重组蛋白质的载体是熟知的，本领域技术人员可用这些载体表达本发明的重组动物胶原。

植物

在一个方面，本发明考虑在植物和植物细胞中产生动物胶原和明胶。在使用植物表达载体的情况下，编码本发明胶原的序列的表达可由许多启动子中的任一驱动。例如，可使用病毒启动子，如花椰菜花叶病毒(CaMV)的35S RNA和19S RNA启动子(Brisson等，(1984)Nature 310：511-514)，或烟草花叶病毒(TMV)的包被蛋白启动子(Takamatsu等(1987)EMBO J.6：307-311)；另外可使用植物启动子，例如核酮糖-1，5-二磷酸羧化酶-加氧酶RUBISCO的小亚基(Coruzzi等(1984)EMBO J.3：1671-1680；Broglie等(1984)Science 224：838-843)或热休克启动子，例如大豆hsp17.5-E或hsp17.3-B(Gurley等(1986)Mol.Cell.Biol.6：559-565)。这些构建物可用各种本领域技术人员已知的方法引入植物细胞，例如用Ti质粒、Ri质粒体、植物病毒载体、直接DNA转化、显微注射、电穿孔等。对于这些技术的回顾见例如Weissbach & Weissbach，Methods for Plant MolecularBiology，Academic Press，NY，VIII节，pp.421-463(1988)；Grierson & Corey，Plant Molecular Biology，第二版，Blackie，London，7-9章(1988)；TransgenicPlants：A Production System for Industrial and Pharmaceutical Proteins，Owen和Pen编，John Wiliey & Sons，1996；Transgenic Plants，Galun and Breiman编，Imperial College Press，1997；和Applied Plant Biotechnology，Chopra，Malik和Bhat编Science Publishers，Inc，1999。

植物细胞天然不产生足量的翻译后酶，来有效产生稳定的胶原。因此，本发明提供了如需要羟化，用必需的翻译后酶补充用于表达本发明动物胶原的植物细胞，来充分产生稳定的胶原。在本发明的一个优选例中，翻译后酶是脯氨酰4-羟化酶。

在植物系统中产生本发明的动物胶原或明胶的方法可通过提供植物或植物细胞的生物质实现，其中植物或植物细胞含有至少一条编码序列，它与影响多肽表达的启动子可操纵性连接，然后从生物质中提取多肽。另外，多肽可不提取，即在胚乳内表达等。

植物表达载体和报道基因是本领域已知的(见例如Gruber等(1993)Methodsof Plant Molecular Biology and Biotechnology，CRC Press)。通常表达载体含有例如重组或合成产生的核酸构建物，并含有在植物细胞中有功能的启动子，其中这种启动子与编码动物胶原或其片段或变体的核酸序列，或与胶原生物合成重要的翻译后酶可操纵性连接。

启动子驱动植物中的蛋白质表达水平。为了在植物中产生所需水平的蛋白质表达，表达可以在植物启动子的指导下进行。根据本发明，适用的启动子是本领域可得的。(见例如PCT出版号WO91/19806)。可根据本发明使用的启动子的例子包括非组成型启动子或组成型启动子。这些启动子包括但不限于核酮糖-1，-二磷酸羧化酶小亚基启动子，来自根瘤土壤杆菌(Agrobaterium tumefaciens)的肿瘤诱导质粒的启动子，例如RUBISCO胭脂氨酸合成酶(NOS)和章鱼碱合成酶启动子；细菌T-DNA启动子，例如mas和ocs启动子；和病毒启动子，例如花椰菜花叶病毒(CaMV)19S和35S启动子或玄参花叶病毒(ort mosaic virus)35S启动子。

本发明的多核苷酸序列还可以在组成型启动子的转录控制下，直接在植物的大多数组织中表达胶原或翻译后酶。在一个实施例中，多核苷酸序列在花椰菜花叶病毒(CaMV)35S启动子的控制下。双链花椰菜家族提供了植物中转基因表达的最独一无二的重要的启动子表达，特别是35S启动子(见例如Kay等(1987)Science236：1299)。来自该家族的其它启动子，例如玄参花叶病毒启动子等在领域中有所描述，也可根据本发明使用。(见例如Sanger等(1990)Plant Mol.Biol.14：433-443；Medberry等(1992)Plant Cell 4：195-192；和Yin和Beachy(1995)PlantJ.7：969-980)。

如需要，可修饰用于本发明多核苷酸构建物的启动子，来影响其控制特征。例如，将CaMV启动子与在无光条件下，抑制RUBISCO表达的RUBISCO基因的部分连接，来建立在叶子中活跃，在根中不活跃的启动子。得到的嵌合启动子可如本文所述使用。

具有本领域已知的一般表达性能的组成型植物启动子可用于本发明的表达载体。这些启动子在大多数植物组织中大量表达，而且包括例如肌动蛋白启动子和遍在蛋白启动子(见例如，McElroy等(1990)Plant Cell 2：163-171；和Christensen等(1992)Plant Mol.Biol.18：675-689)。

另外，本发明的多肽可在特定组织、细胞类型中，或在更精确的环境条件下或发育控制下表达。指导这些情况下表达的启动子称为诱导型启动子。就使用组织特异性启动子的情况而言，蛋白质表达在需要提取蛋白质的组织中特别高。视所需组织而定，表达可靶向胚乳、糊粉层、种胚(或其部分如胚鳞和子叶)、果皮、茎、叶、块茎、根等。已知的组织特异性启动子的例子包括指向块茎(tuber-directed)的I类patatin启动子，与马铃薯块茎ADPGPP基因相关的启动子，大豆β-conglycinin(7S蛋白)启动子，它驱动针对种子的转录，和来自玉米胚乳玉米醇溶蛋白基因的针对种子的启动子(见例如Bevan等(1986)Nucleic AcidsRes.14：4625-38；Muller等(1990)Mol.Gen.Genet.224：136-46；Bray(1987)Planta 172：364-370；和Pederson等(1982)Cell 29：1015-26)。

在一个优选例中，本发明的多肽通过基于种子的生产技术，使用例如芸苔、玉米、大豆、水稻和大麦种子在种子中生产。在该过程中，例如产物在种子发芽中被回收。(见例如PCT出版号WO 9940210；WO 9916890；WO 9907206；美国专利号5,866,121；美国专利号5,792,933；所有文献在此引入以供参考)。

可用于指导多肽表达的启动子可以是异源或非异源的。这些启动子还可用于驱动反义核酸的表达，在所需组织中减弱，提高或改变本发明的动物胶原的浓度和组合物。

可用于提高和/或使本发明的多肽在植物或植物细胞中的转录最大化的其它修改是本领域已知的和标准化的。例如，含有编码重组动物胶原或明胶的多核苷酸序列，或可衍生出重组动物明胶的多肽或其片段或变体，与一启动子可操纵连接的载体还可包含至少一种因子，它改变胶原或相关翻译后酶的转录速度，包括但不限于肽输出信号序列、密码子使用、内含子、聚腺苷酸化和转录终止位点。修饰构建物以提高在植物中表达水平的方法通常是本领域已知的(见例如Rogers等(1985)J.Biol.Chem.260：3731；和Cornejo等(1993)Plant Mol Biol 23：567-58)。在工程改造影响本发明胶原和相关翻译后酶转录速率的植物系统中，各种本领域已知的因素，包括调控序列，例如正或负激活序列、增强子和沉默子，以及可以影响植物的转录速率的染色质结构。本发明提供了这些因素的至少一种，可用于表达本文所述的重组动物胶原和明胶。

含有本发明多核苷酸的载体通常含有一标记基因，它赋予植物细胞选择性表型。通常选择性标记基因因带有合适的基因将编码抗生素抗性，这些合适的基因包括至少下列基因的一种，编码对抗生素壮观霉素抗性的基因，编码链霉素抗性的链霉素磷酸转移酶(SPT)基因、编码卡那霉素或遗传霉素抗性的新霉素磷酸转移酶(NPTH)基因，潮霉素抗性，编码对除草剂特别是磺酰脲型除草剂抗性的基因，它用于抑制乙酰乳酸合成酶(ALS)的基因，(如乙酰乳酸合成酶(ALS)基因，它含有导致特别是S4和/或Hra突变的这种抗性)，含有抑制谷氨酰胺合成酶作用的突变的基因，例如phophinothricin和basra(例如bar基因)或其它本领域已知的类似基因。bar基因编码对除草剂basta的抗性，nptII基因编码对抗生素卡那霉素和遗传霉素的抗性，ALS基因编码对除草剂绿黄酮的抗性。

用于在植物中表达外源基因的典型载体是本领域熟知的，包括但不限于衍生自根瘤土壤杆菌的肿瘤诱导性(Ti)质粒的载体。这些载体是植物整合载体，它们在转化后，将一部分DNA整合入宿主植物的基因组(见例如Roger等(1987)Meth.InEnzymol.153：253-277；Schardl等(1987)Gene 61：1-11；和Berger等；Proc.Natl.Acad.Sci.USA 86：8402-8406)。

含有编码本发明多肽的序列的载体和含有翻译后酶或其亚基的载体可共同引入所需植物。转化植物细胞的方法是本领域已知的，例如直接基因转移，体外原生质体转化，植物病毒介导的转化，脂质体介导的转化，显微注射，电穿孔，土壤杆菌介导的转化和颗粒轰击。(见例如Paszkowski等(1984)EMBO J.3：2717-2722；美国专利号4,684,611；欧洲申请号0 67 553；美国专利号4,407,956；美国专利号4,536,475；Crossway等(1986)Biotechniques 4：320-334；Riggs等(1986)Proc.Natl.Acad.Sci.USA 83：5602-5606；Hinchee等(1988)Biotechnology 6：915-921；和美国专利号4,945,050)。本领域描述了转化例如水稻、小麦、玉米、高粱和大麦的标准方法(见例如Christou等(1992)Trendsin Biotechnology 10：239和Lee等(1991)Proc.Natl.Acad.Sci.USA 88：6389)。可用与转化玉米或水稻类似的技术转化小麦。另外，Casas等(1993)Proc.Natl.Acad.Sci.USA 90：11212描述了一种转化高粱的方法，而Wan等(1994)PlantPhysiol.104：37描述了一种转化大麦的方法。Fromm等(1990)Bio/Technology8：833和Gordon-Kamm等见上提供了转化玉米的合适方法。

在本领域建立了其它可用于产生生产本发明的动物胶原的植物的方法。(见例如美国专利号5,959,091；美国专利号5,859,347；美国专利号5,763,241；美国专利号5,659,122；美国专利号5,593,874；美国专利号5,495,071；美国专利号5,424,412；美国专利号5,362,865；美国专利号5,229,112；美国专利号5,981,841；美国专利号5,959,179；美国专利号5,932,439；美国专利号5,869,720；美国专利号5,804,425；美国专利号5,763,245；美国专利号5,716,837；美国专利号5,689,052；美国专利号5,633,435；美国专利号5,631,152；美国专利号5,627,061；美国专利号5,602,321；美国专利号5,589,612；美国专利号5,510,253；美国专利号5,503,999；美国专利号5,378,619；美国专利号5,349,124；美国专利号5,304,730；美国专利号5,185,253；美国专利号4,970,168；欧洲出版号EPA00709462；欧洲出版号EPA00578627；欧洲出版号EPA00531273；欧洲出版号EPA00426641；PCT出版号WO93/31248；PCT出版号WO98/58069；PCT出版号WO98/45457；PCT出版号WO98/31812；PCT出版号WO98/08962；PCT出版号WO97/48814；PCT出版号WO97/30582；和PCT出版号WO9717459)。

昆虫

根据本发明的方法使用的另一种表达系统是昆虫系统。杆状病毒是在昆虫细胞中大量产生各种重组蛋白的非常有效的载体。在例如Luckow等(1989)Virology170：31-39和Gruenwald，S.和Heitz，J.(1993)Baculovirus Expression VectorSystem：Procedures & Methods Manual，Pharmingen，San Diego，CA所述的流程和方法可用于构建含有本发明胶原的胶原编码序列和合适的转录/翻译调控信号的表达载体。例如，可在昆虫细胞中通过用编码多肽的杆状病毒感染，实现蛋白重组产生。在本发明的一个方面，用稳定的三链螺旋产生的重组多肽可涉及用三个杆状病毒共同感染昆虫细胞，一个编码要表达的动物胶原，另两个分别表达脯氨酰4-羟化酶的α和β亚基。该昆虫细胞系统能大量产生重组蛋白。在该系统中，用苜蓿银纹夜蛾(Autographa californica)核型多角体病毒(AcNPV)作为表达异源基因的载体。病毒在草地夜蛾(Spodoptera frugiperda)细胞中生长。本发明的多肽的编码序列可克隆入该病毒的非必需区域(例如多角体基因)，置于AcNPV启动子的控制下(例如多角体启动子)。编码序列的成功插入将导致多角体基因失活，产生无包含体(non-occluded)重组病毒(即缺乏多角体基因编码的蛋白质包被的病毒)。然后用这些重组的病毒感染草地夜蛾细胞，在其中表达插入的基因。(见例如Smith等，(1983)J.Virol.46：584；和美国专利号4,215,051)。该表达系统的其它例子可在例如Ausubel等见上述内容中发现。

动物

在动物宿主细胞中，许多表达系统可利用。就使用腺病毒作为表达载体而言，本发明的多核苷酸序列可与腺病毒转录/翻译控制复合物，如晚期启动子和三联前导序列连接。然后可将该嵌合的基因通过体外或体内重组插入腺病毒基因组。在该病毒基因组的非必需区(如E1或E3区)插入将得到活的重组病毒，它能在感染的宿主中表达该编码的多肽(见例如Logan & Shenk，Proc.Natl.Acad.Sci.USA81：3655-3659(1984))。另外，亦可使用痘苗病毒7.5K启动子。(见例如Mackett等(1982)Proc.Natl.Acad.Sci.USA 79：7415-7419；Mackett等(1982)J.Virol.49：857-864；和Panicali等(1982)Proc.Natl.Acad.Sci.USA79：4927-4931)。

哺乳动物宿主细胞中优选的表达系统是西门利克森林病毒(Semliki Forestviras)。哺乳动物宿主细胞，例如幼仓鼠肾(BHK)细胞和中国仓鼠卵巢(CHO)细胞的感染可得到非常高的重组表达水平。西门利克森林病毒是优选的表达系统，因为该病毒具有广泛的宿主范围，使得哺乳动物细胞系的感染成为可能。更具体的，预计西门利克森林病毒可用于各式各样的宿主，因为该系统不基于染色体整合，因此将是在针对鉴定结构-功能关系和测试各种杂交分子的效果的研究中获得重组动物胶原修饰的快速途径。例如在Olkkonen等(1994)Methods Cell Biol 43：43-53中描述了构建用于在哺乳动物宿主细胞中表达外源蛋白质的西门利克森林病毒载体的方法。

还可用转基因动物表达本发明的多肽。可通过将本发明的多肽与启动子，以及单独与其它所需或可任选的能在哺乳动物腺体中有效表达的调控序列可操纵性连接，构建该系统。类似的，可同时在靶细胞中用合适的表达系统产生所需或可任选的翻译后酶。用转基因动物重组产生蛋白质的方法是本领域已知的(见例如美国专利号4,736,866；美国专利号5,824,838；美国专利号5,487,992；和美国专利号5,614,396)。

胶原和明胶的用途

本发明的重组胶原和明胶用于各种用途。胶原广泛用于医学、药学、食品和化妆品工业的许多用途。例如，胶原是人工密封胶、骨移植物、药物释放系统、皮肤移植、止血剂和失禁植入体的重要成分。在自身免疫疾病，例如类风湿性关节炎的治疗中，在试验中评价了胶原诱导口服耐受的性能。胶原还用于食品，例如肠衣和其它衍生自例如猪、牛和羊来源的胶原基衣。在健康和美容应用中，可在例如化妆品或面部和皮肤产品，如保湿霜中找到胶原。迄今，用于各种用途的各种胶原是用酶和化学方法衍生自动物来源的。例如，市售的牛胶原分离自牛组织和骨骼，主要由I型和III型胶原的混合物构成。该胶原形式也用作人的注射装置。

明胶出现在各种药物或医学产品和装置，包括药物稳定剂，例如药物和疫苗、血浆补充剂、海绵、硬和软明胶胶囊、栓剂等的成品中，或作为其中的成分。在特别设计用于药物口服固态剂型，包括控释胶囊和片剂的各种薄膜包装系统中，利用明胶的薄膜形成性。

在食品和饮料工业中长期使用各种可食形式的明胶。明胶在各种人造稠黄油(whipped toppings)和汤和调味汁中作为乳化剂和增稠剂。明胶可用作澄清剂，澄清各种饮料，包括葡萄酒和果汁。明胶亦可在各种低脂或减低脂肪产品生产中用作增稠剂和稳定剂，亦可作为脂肪替代品出现。明胶还广泛用于调味剂、色素和维生素的微囊化。明胶还可在各种高能和营养饮料和食品(例如那些在减肥和体育运动产业中流行的)中用作蛋白质补充物。作为薄膜形成物，明胶用于对水果，肉类、熟食包衣，和各种糖果制品，包括硬糖和口香糖等。

在化妆品工业中，明胶出现在各种护发和护肤品中。明胶在许多洗发精、摩丝、霜、乳液、面膜、唇膏、指甲油和产品，和其它美容装置和用途中用作增稠剂和基础剂。明胶还在化妆品工业中用于微囊化和包装各种产品。

明胶用于各式各样的工业用途。例如，明胶在各种制造过程中广泛用作胶水和粘合剂。明胶可用于各种粘合剂和胶水制剂，例如用于制造可重新水化的胶纸包装带、木胶贴、各级纸板箱和纸的纸面粘合，和各种提供可在重新湿润后重新活化的粘性表面的应用。

明胶在各种电子装置中作为光敏感性涂层，在各种光刻(photoliphographic)法中作为光敏电阻(photoresist)基底，例如在彩色电视机和摄像机制造中。在半导体制造中，用明胶构建引线框和各种半导体元件的包被。明胶可用于印刷过程和制造特殊质量的纸，例如用于债券和股票证明等。

明胶用于各种照像用途，例如作为照像溶液中的各种活性成分的携带者，包括用于X光和照像胶片显影的溶液。长期用于各种照像凸板制版法的明胶也作为各种类型胶片的成分，并大量用于各种胶片层和纸制品的卤化银化学。银明胶胶片是缩微胶片形式和其它信息储藏形式。用明胶作为各种胶片膜的自密封元件等。

明胶还是用于各种实验室用途的有价值物质。例如，明胶可用于各种细胞培养用途，提供细胞附着和生长的合适表面，例如培养皿和培养瓶，或提供细胞附着和生长的表面。水解或低凝胶强度的明胶可用作各种试验的生物缓冲剂，例如在诸如酶联免疫吸附试验(ELISA)和其它免疫试验的包被和封闭溶液。明胶还在各种用于生物化学和电泳分析的凝胶，包括酶显影凝胶(enzymography gels)中作为组分。

实施例

提供下列实施例仅为了说明所要求的发明。然而本发明不限于举例的实施例的范围，它们仅是为了说明本发明的一个方面，功能性相等的方法在本发明的范围内。事实上，除了本文所述的外本发明的各种修饰对于本领域技术人员从上述内容和附图将变得明白。这些修改应在所附权利要求的范围内。实施例1：牛前胶原I型α1的测序

进行了实验，通过PCR从商品牛主动脉平滑肌cDNA文库(Stratagene #936705)来产+生α1(I)胶原基因片段，它是最初PCR实验中牛胶原(I)α2基因片段的最成功来源。在该最初的筛选过程中，从牛mRNA序列设计胶原(I)α2的PCR引物(Shirai等(1998)Matrix Biology 17：85-88)，进行PCR扩增，获得DNA片段。虽然显示商品文库含有牛胶原(I)α2基因的整个编码区，用各种人α1(I)胶原序列PCR引物产生牛α1(I)胶原基因的尝试证明是不成功的。寻找一种类似含有牛α1(I)胶原转录物的cDNA库的另选来源。

ATCC牛皮肤细胞系(CRL-6054；皮肤，正常，牛)生长到约60％汇合，分离总RNA(Qiagen RNeasy)。从得到的RNA通过RT-PCR(Clontech RT-for-PCR试剂)制备cDNA库。用该cDNA库作为模板序列，用于随后重叠基因片段的PCR实验。

从已知的人α1(I)胶原mRNA序列设计引物，用于扩增该基因开放阅读框的重叠区段(Mackay等(1993)Human Molecular Genetics 2(8)：1155-1160)。PCR引物经过工程改造，用于扩增位于人α1(I)胶原基因的三链螺旋编码区中的片段，并列于表1。

表1

SEQ ID NO：	引物	序列
SEQ ID NO：	引物	序列	13	SSCP 1F	CCGGCTCCTGCTCCTCTTAG
14	SSCP 1REV	GCCAGGAGCACCAGCAATAC	13	SSCP 1F	CCGGCTCCTGCTCCTCTTAG
14	SSCP 1REV	GCCAGGAGCACCAGCAATAC	15	SSCP 2F	GCTGATGGACAGCCTGGTGC
16	SSCP 2REV	GCCCTGGAAGACCAGCTGCA	15	SSCP 2F	GCTGATGGACAGCCTGGTGC
16	SSCP 2REV	GCCCTGGAAGACCAGCTGCA	17	SSCP 3F	CCTGGCCTTAAGGGAATGCC
18	SSCP 3REV	GCGCCAGGAGAACCGTCTCG	17	SSCP 3F	CCTGGCCTTAAGGGAATGCC
18	SSCP 3REV	GCGCCAGGAGAACCGTCTCG	19	SSCP 4F	CCGAAGGTTCCCCTGGACGA
20	SSCP 4REV	CGGTCATGCTCTCGCCGAAC	19	SSCP 4F	CCGAAGGTTCCCCTGGACGA

用引物获得覆盖牛α1(I)胶原基因的三链螺旋部分的重叠牛PCR片段。用热循环仪(Hybaid，非冷冻)在下列条件下进行PCR(Clontech，Advantage GC-Rich cDNAPCR试剂盒；全部PCR引物在每次反应中使用100皮摩尔(pmol))：

步骤1：94℃4分钟

步骤2：28循环：

68℃3分钟

94℃30秒

60℃30秒

步骤3：68℃10分钟

30℃1秒

维持在室温

最初全部PCR产物用凝胶电泳筛选，可预测大小的用琼脂糖凝胶电泳和/或柱层析纯化(Qiagen Qiaquick)。为了方便测序，将所选的PCR片段克隆入载体(pCRII-TOPO试剂盒，Invitrogen)。用外部载体测序引物(M13正向和反向)用ABI373自动测序仪(ABI PRISMBigDye^TM终止循环测序试剂盒，Perkin-Elmer)对各PCR片段的多个克隆进行测序。获得的序列资料用SEQMAN软件(DNASTAR)分析，确定克隆片段的共有序列。

用获得的牛α1(I)胶原序列设计内部牛胶原测序引物，然后用于对这些牛克隆完整测序。这些引物是在引物设计软件(RightPrimer，BioDisk)的帮助下设计的，列于表2。

表2

SEQ ID NO：	引物	序列
SEQ ID NO：	引物	序列	21	B C1A1 SP 502F	CCCCAGTTGTCTTACGGCTATG
22	B C1A1 SP 502REV	CATAGCCGTAAGACAACTGGGG	21	B C1A1 SP 502F	CCCCAGTTGTCTTACGGCTATG
22	B C1A1 SP 502REV	CATAGCCGTAAGACAACTGGGG	23	B C1A1 SP 886F	GGTAGCCCCGGTGAAAATG
24	B C1A1 SP 886REV	CATTTTCACCGGGGCTACC	23	B C1A1 SP 886F	GGTAGCCCCGGTGAAAATG
24	B C1A1 SP 886REV	CATTTTCACCGGGGCTACC	25	B C1A1 SP 1302F	GCCCCAAGGGTAACAGCGGT
26	B C1A1 SP 1302REV	ACCGCTGTTACCCTTGGGGC	25	B C1A1 SP 1302F	GCCCCAAGGGTAACAGCGGT
26	B C1A1 SP 1302REV	ACCGCTGTTACCCTTGGGGC	27	B C1A1 SP 1560F	TCCTGGCCCTGCTGGCCCCAAA
28	B C1A1 SP 1560REV	TTTGGGGCCAGCAGGGCCAGGA	27	B C1A1 SP 1560F	TCCTGGCCCTGCTGGCCCCAAA
28	B C1A1 SP 1560REV	TTTGGGGCCAGCAGGGCCAGGA	29	B C1A1 SP 1770F	TGGACCTAAAGGTGCTGCTGGA
30	B C1A1 SP 1770REV	TCCAGCAGCACCTTTAGGTCCA	29	B C1A1 SP 1770F	TGGACCTAAAGGTGCTGCTGGA
30	B C1A1 SP 1770REV	TCCAGCAGCACCTTTAGGTCCA	31	B C1A1 SP 1997F	GAACAGGGTGTTCCTGGAGA
32	B C1A1 SP 1997REV	TCTCCAGGAACACCCTGTTC	31	B C1A1 SP 1997F	GAACAGGGTGTTCCTGGAGA
32	B C1A1 SP 1997REV	TCTCCAGGAACACCCTGTTC	33	B C1A1 SP 2289F	GGCAAAGATGGCGTCCGT
34	B C1A1 SP 2289REV	ACGGACGCCATCTTTGCC	33	B C1A1 SP 2289F	GGCAAAGATGGCGTCCGT
34	B C1A1 SP 2289REV	ACGGACGCCATCTTTGCC	35	B C1A1 SP 2592F	GCTAAAGGCGAACCTGGCGA
36	B C1A1 SP 2592REV	TCGCCAGGTTCGCCTTTAGC	35	B C1A1 SP 2592F	GCTAAAGGCGAACCTGGCGA
36	B C1A1 SP 2592REV	TCGCCAGGTTCGCCTTTAGC	37	B C1A1 SP 3198F	GCCGGCAAGAGCGGTGATCGT
38	B C1A1 SP 3198REV	ACGATCACCGCTCTTGCCGGC	37	B C1A1 SP 3198F	GCCGGCAAGAGCGGTGATCGT
38	B C1A1 SP 3198REV	ACGATCACCGCTCTTGCCGGC	39	B C1A1 SP 3648F	CGATGGTGGCCGCTACTAC
40	B C1A1 SP 3648REV	GTAGTAGCGGCCACCATCG	39	B C1A1 SP 3648F	CGATGGTGGCCGCTACTAC
40	B C1A1 SP 3648REV	GTAGTAGCGGCCACCATCG	41	B C1A1 SP 4007F	AGAGCATGACCGAAGGGCGAATT
42	B C1A1 SP 4007REV	AATTCGCCCTTCGGTCATGCTCT	41	B C1A1 SP 4007F	AGAGCATGACCGAAGGGCGAATT

在用表1(SEQ ID NO：13-20)的8个SSCP人引物产生牛PCR产物后，扩增三条另外的PCR片段，与最初的牛克隆重叠，衍生到ORF推定的末端(通过用人α1(I)胶原序列模似)。用于该扩增的PCR引物列于表3。

表3

SEQ ID NO：	引物	序列
SEQ ID NO：	引物	序列	43	H AVR IIF	TTAATTCCTAGGATGTTCAGCTTTGTGGACCTCCGGCTC
44	H EAR 1F	TGCCACTCTGACTGGAAGAGTGGAGAGTACTG	43	H AVR IIF	TTAATTCCTAGGATGTTCAGCTTTGTGGACCTCCGGCTC
44	H EAR 1F	TGCCACTCTGACTGGAAGAGTGGAGAGTACTG	45	H NOT1 REV	TTTTCCTTTTGCGGCCGCTTACAGGAAGCAGACAGGGCCAACGTC

克隆并对得到的DNA片段进行测序，对于基因ORF的大部分通过配对下列引物：H AVR II(SEQ ID NO：43)和SSCP 1REV(SEQ ID NO：14)；H EAR 1F(SEQ ID NO：44)和H NOT1 REV(SEQ ID NO：45)；和SSCP 4F(SEQ ID NO：19)和H NOT1 REV(SEQID NO：45)建立了共有序列。

为了获得cDNA克隆的5’和3’末端，从牛序列通过RACE(快速扩增cDNA末端)法(SMART RACE cDNA扩增试剂盒，Clontech)和引物设计软件的帮助设计嵌套PCR引物。为了提高专一性，设计具有特别的高解链温度的引物。该设计的引物列于表4。

表4

SEQ ID NO：	引物	序列
SEQ ID NO：	引物	序列	46	GS BC1A1 118REV	GTCATGGTACCTGAGGCCGTTCTGTACGCA
47	GS BC1A1 190REV	ACGTCATCGCACAGCACGTTGCCGTTGTC	46	GS BC1A1 118REV	GTCATGGTACCTGAGGCCGTTCTGTACGCA
47	GS BC1A1 190REV	ACGTCATCGCACAGCACGTTGCCGTTGTC	48	GS BC1A1 213REV	AGGACAGTCCTTAAGTTCGTCGCAGATCACGTCA
49	GS BC1A1 761REV	AGGGAGGCCAGCTGTTCCAGGCAATC	48	GS BC1A1 213REV	AGGACAGTCCTTAAGTTCGTCGCAGATCACGTCA
49	GS BC1A1 761REV	AGGGAGGCCAGCTGTTCCAGGCAATC	50	GS BC1A1 3085F	CCGAAGGTTCCCCTGGACGAGATGGTT
51	GS BC1A1 3305F	CGTGGTGACAAGGGTGAGACAGGCGAACA	50	GS BC1A1 3085F	CCGAAGGTTCCCCTGGACGAGATGGTT
51	GS BC1A1 3305F	CGTGGTGACAAGGGTGAGACAGGCGAACA	52	GS BC1A1 3675F	CGGGCTGATGATGCCAATGTGGTCCGT
53	GS BC1A1 3905F	AACATGGAAACCGGTGAGACCTGTGTATACCC	52	GS BC1A1 3675F	CGGGCTGATGATGCCAATGTGGTCCGT

上述总牛mRNA进一步用于制备具有用作PCR模板的带有该必需外部引物位点的新cDNA库。用：(1)着落(touchdown)PCR技术；(2)新设计的牛RACE PCR引物；和(3)试剂盒中提供的材料在基因的5’和3’端两处获得了PCR产物。在Peltier-冷却的热循环仪中用下列方案和条件使用两个着落PCR程序：

72℃-68℃着落程序I：

步骤1：具有下列条件的8个循环：

94℃10秒钟

72℃10秒钟，每循环下降0.5℃

72℃3分钟

步骤2：具有下列条件的28个循环：

94℃10秒钟

68℃10秒钟

72℃3分钟

72℃10分钟

4℃保持

68℃-64℃着落程序II：

步骤1：具有下列条件的8个循环：

94℃10秒钟

68℃10秒钟，每循环下降0.5℃

72℃3分钟

步骤2：具有下列条件的28个循环：

94℃10秒钟

68℃10秒钟

72℃3分钟

72℃10分钟

4℃保持

用1.2％琼脂糖凝胶电泳检测得到的片段，随后进行克隆和测序分析。用来自两个程序的PCR产物。该得到的序列与先前克隆的牛α1(I)胶原序列，以及编码的ORF5’和3’末端，以及连续非翻译cDNA区重叠。牛原胶原I型α1的核苷酸序列如图1A-1C所示(SEQ ID NO：1)。对应的氨基酸如图2A-2D所示(SEQ ID NO：2)。

如图13A-13I所示，翻译的牛胶原ORF序列与已知人(HU)、小鼠(MUS)、犬(CANIS)、牛蛙(RANA)和日本水螈(CYNPS)序列对齐。翻译的牛序列还和已公开的牛α1(I)胶原的三链螺旋重复域的氨基酸序列片段对齐。(见例如Miller(1984)Extracellular Matrix Biochemistry，Piez等编，Elsevier SciencePublishing，New York，pp.41-81；和SWISSPROT数据库登录号p02453)。注意到本发明提供的预测的牛α1(I)胶原蛋白质序列和之前已知的牛蛋白质序列之间有许多差异。这些差异中的一些包括通常难于被蛋白质测序辨别的氨基酸取代(例如谷氨酰胺/谷氨酸和天冬氨酸/天冬酰胺)。本文公开的如SEQ ID NO：1的多核苷酸序列提示这些已知的牛α1(I)胶原蛋白序列可含有错误，因此可以，例如排除，不用于通过氨基酸回翻译(backtranslation)构建编码可靠的牛α1(I)胶原的合成基因。

实施例2：牛前胶原III型α1的测序

如下分离了牛前胶原III型α1 cDNA。用1微升牛肝Poly A⁺ RNA(Clontech，目录号6810-1)，用Ambion Retroscript试剂盒(目录号1710)按如下步骤通过逆转录反应构建cDNA链：

1微升 RNA(1微克)

4微升 dNTPs混合物(各2.5mM)

2微升 Oligo dT第一链引物

9微升无菌水

该溶液在75℃保温3分钟，然后置于冰上。然后加入下列：

2微升 10X另外的RT-PCR缓冲液

1微升胎盘RNAase抑制剂

1微升 M-MLV逆转录酶

反应在42℃进行90分钟，然后在92℃保温10分钟灭活。然后将反应物储藏在-20℃。

根据人前胶原3型α1 cDNA(GenBank登录号X14420)和牛前胶原3型α1cDNA(Genbank登录号L47641)的序列设计寡核苷酸引物。用上述制备的第一链cDNA和表5列出的引物进行PCR。

表5

SEQ ID NO：	引物	序列
SEQ ID NO：	引物	序列	54	CIII-1	GACATGATGAGCTTTGTGCAAAAGG
55	CIII-6	TTTGGTTTATAAAAAGCAAACAGGGCC	54	CIII-1	GACATGATGAGCTTTGTGCAAAAGG
55	CIII-6	TTTGGTTTATAAAAAGCAAACAGGGCC	56	A3-N	TCTCATGTCTGATATTTAGACATG
57	CIII-4	GGACTAATGAGGCTTTCTATTTGTCC	56	A3-N	TCTCATGTCTGATATTTAGACATG
57	CIII-4	GGACTAATGAGGCTTTCTATTTGTCC	58	CIII-2	GGCACCATTCTTACCAGGCTCACC
59	CIII-3	TGGGTCCCGCTGGCATTCCTGG	58	CIII-2	GGCACCATTCTTACCAGGCTCACC
59	CIII-3	TGGGTCCCGCTGGCATTCCTGG	60	CIII-5	CCAGGACAACCAGGCCCTCCTGG

PCR反应条件如下：

5微升上述逆转录酶反应物

5微升 10X反应缓冲液

1.5微升 dNTPs混合物(各2.5mM)

1.5微升引物CIII-1(5μM)

1.5微升引物CIII-6(5μM)

0.5微升 Platinum pfx聚合酶(Life Tech，目录号11708-013)

35微升无菌水

50微升总体积

反应混合物在Techne Genius DNA热循环仪中如下循环：

80℃ 2分钟

94℃ 2分钟1循环

94℃ 30秒钟

55℃ 30秒钟35循环

68℃ 4.5分钟

68℃ 5分钟1循环

在反应物中用引物CIII-1(SEQ ID NO：54)和CIII-6(SEQ ID NO：55)鉴定约4500bp的DNA条带。用Qiagen Qia Quick凝胶提取试剂盒(目录号28704)纯化该DNA片段，并连接到质粒载体pCR-Blunt(Invitrogen Zero Blunt^TM PCR克隆试剂盒，目录号K2700-20)。得到的重组质粒引入完整的大肠杆菌(JM109)，用QiagenQiaprep Spin Miniprep试剂盒(目录号27106)产生重组质粒DNA的原种。在LI-COR 4200自动荧光测序仪(MWG-Biotech UK Ltd.)上测序DNA。

在可从如Genbank登录号L47641和PO4258(仅氨基酸)所述的部分牛序列获得高质量序列的区域，显示本发明牛α1(III)cDNA序列是同源的。在其它区域，鉴定出与人前胶原α1(III)cDNA(Genbank登录号X14420)和猪前胶原α1(III)cDNA(Genbank登录号C94995、C94535和C94565)高度同源的序列。

因为5’引物CIII-1(SEQ ID NO：54)是对应人序列设计的，因此整合到新分离的cDNA中，在该区域中如下鉴定该天然牛序列。从牛cDNA中用引物A3-N(SEQ IDNO：56)和CIII-4(SEQ ID NO：57)扩增约3700bp的另一条PCR片段。根据人前胶原3型α1 cDNA的序列在紧挨起始密码子的立即上游区设计引物。对得到的片段进行测序并用引物CIII-1(SEQ ID NO：54)和CIII-6(SEQ ID NO：6)确认。

总的说，用RT-PCR从牛mRNA分离牛前胶原α1(III)的全长cDNA。在用表5所述的引物和用实施例1中所述和本领域技术人员已知的方法设计的测序引物全面测序(三次独立的PCR反应)后，装配含有起始密码子ATG和终止密码子TAA的4428bp的邻接序列(图3A-3C，SEQ ID NO：3)。图4A-4D显示了推测的氨基酸序列(SEQ ID NO：4)。获得了两条牛α1(III)胶原的cDNA序列变体(SEQ ID NO：3和SEQID NO：5)，通过多克隆测序确定。SEQ ID NO：3和对应的氨基酸序列(SEQ ID NO：4)对应于Genbank登录号L47641中的合适区域。比较起来，SEQ ID NO：5(图5A-5C)显示C-T的碱基取代，导致密码子从AAC变为AAT(都编码Asp)；一个A-G的碱基取代，导致密码子从AAT变为GAT(残基1232处的Asp-Asn取代)；和T-C碱基取代，导致密码子从GTC变为GCC(残基1382的Val-Ala取代)。图6A-6D显示相应的推测氨基酸序列(SEQ ID NO：6)。上述序列与可得的部分牛序列相同(Genbank登录号L47641和PO4258)。

实施例3：猪前胶原1型α1的测序

用如下方法分离猪前胶原I型α1 cDNA。将冷冻的猪肝(从Anglo Dutch Meats，Charing，Kent获得)置于液氮中，用杵和臼研磨。将约800毫克粉碎的物质加到5毫升Ambion RNAqeous试剂盒(目录号1912)所述的裂解结合溶液中。Dounce匀浆后，用离心(12,000xg，2分钟)除去任何碎片，在匀浆液中加入另外5毫升裂解结合溶液。加入10微升64％乙醇，混合，并在RNAqeous滤器(Ambion)中加入裂解液/乙醇混合物。用2x700微升裂解液/乙醇混合物加载各滤器，离心(12,000xg，1分钟)。然后用700微升洗涤溶液1号(Ambion)洗涤滤器一次，用500微升洗涤溶液2/3号(Ambion)洗涤两次，在每次洗涤步骤后离心，在最后洗涤后最终离心一次(12,000xg，15秒)。通过加入2x60微升预热(95℃)洗脱溶液(Ambion)将RNA从滤器洗脱到滤器中央，并离心(12,000xg，室温，30秒钟)。合并4次纯化RNA的4个洗脱液(总浓度～15微克)，用0.5×体积的氯化锂(Ambion)-20℃沉淀过夜。然后在12,000xg，15分钟，4℃离心，用70％乙醇洗涤沉淀。然后空气干燥沉淀并重新悬浮在15微升无菌水中，并储藏在-70℃。

用1微升上述分离的RNA，用实施例2所述进行的逆转录反应构建cDNA链。设计了基于人前胶原α1(I)cDNA(Genbank登录号NM000088)序列和猪前胶原α1(I)cDNA(Genbank登录号C94935)的寡核苷酸引物。然后用实施例2所述的方法进行PCR，制备的第一链cDNA和对应已知的人或猪DNA引物(表6)。

表6

SEQ ID NO	引物	序列
SEQ ID NO	引物	序列	61	HU1-5	GACATGTTCAGCTTTGTGGACCTC
62	PCA1-6	AGTTTACAGGAAGCAGACAG	61	HU1-5	GACATGTTCAGCTTTGTGGACCTC
62	PCA1-6	AGTTTACAGGAAGCAGACAG	63	A1-N	CTACATGTCTAGGGTCTAGACATG
64	PCA1-4	AGGCGCCAGGCTCGCCAGGCTCAC	63	A1-N	CTACATGTCTAGGGTCTAGACATG
64	PCA1-4	AGGCGCCAGGCTCGCCAGGCTCAC	65	PCA1-3	AGTTGTCTTATGGCTATGATGAG

对猪肝纯化的RNA进行逆转录PCR，在该反应中用引物HUI-5(SEQ ID NO：61)和PCA1-6(SEQ ID NO：62)鉴定出约4500bp的DNA条带。纯化该DNA条带，克隆并如实施例2中进行测序。

由于根据人序列设计了5’引物HUI-5(SEQ ID NO：61)，从而整合入如上所述新分离的cDNA，在该区域需要被确认的该天然猪序列。随后从猪cDNA用引物A1-N(SEQ ID NO：63)和PCAI-4(SEQ ID NO：64)扩增约750bp的额外PCR片段。根据在人前胶原α1(I)cDNA起始密码子立即上游区域的序列设计引物A1-N(SEQ IDNO：63)。对该片段进行测序，确认用引物HU1-5(SEQ ID NO：61)和PCA1-6(SEQ IDNO：62)产生的全长猪α1(I)cDNA片段具有真正的5’末端，而不是引入了基于人序列的引物的杂交序列。

总的说，用猪肝的RT-PCR分离了猪前胶原α1(I)的全长cDNA。全面测序(三个独立的PCR反应)后，如图7A-7C中所示装配了含有起始密码子ATG和终止密码子TAA的4425bp的连续序列(SEQ ID NO：7)。该序列与可得的部分猪序列(Genbank登录号C94935和AU058670)相同，该序列显示与人前胶原1型α1序列(登录号G4502944)高度的同源性。猪1型α1胶原的相应基酸序列显示于图8A-8D(SEQ IDNO：8)

实施例4：猪前胶原I型α2的测序

用如下方法分离猪前胶原I型α2 cDNA。主要如实施例2中所述进行总RNA分离、逆转录和PCR。设计了基于人原胶原α2(I)前胶原(Genbank登录号NM000089)和猪前胶原α2(I)cDNA(Genbank登录号AU058497)序列的寡核苷酸引物。所用的引物列于表7。

表7

SEQ ID NO	引物	序列
SEQ ID NO	引物	序列	66	HU2-5	GACATGCTCAGCTTTGTGGATACG
67	PCA2-6	AGCTGGACCAGGCTCACCAACAA	66	HU2-5	GACATGCTCAGCTTTGTGGATACG
67	PCA2-6	AGCTGGACCAGGCTCACCAACAA	68	PCA2-5	TGGTGCTAAGGGTGCTGCTGGCCT
69	PCA2-8	AGGTTCACCCACTGATCCAGCAACA	68	PCA2-5	TGGTGCTAAGGGTGCTGCTGGCCT
69	PCA2-8	AGGTTCACCCACTGATCCAGCAACA	70	PCA2-7	TCCCTCTGGAGAGCCTGGTACTGCT
71	PCA2-2	TGGAAGTTTGGGTTTTAAACTTCCC	70	PCA2-7	TCCCTCTGGAGAGCCTGGTACTGCT
71	PCA2-2	TGGAAGTTTGGGTTTTAAACTTCCC	72	A2-N	ACACAAGGAGTCTGCATGTCT

用下列引物对来产生三条具有下列大小的重叠片段：1054bp DNA，用引物HU2-5(SEQ ID NO：66)和引物PCA2-6(SEQ ID NO：67)；1766bp DNA，用引物PCA2-5(SEQ ID NO：68)和引物PCA2-8(SEQ ID NO：69)；和1937bp DNA，用引物PCA2-7(SEQID NO：70)和引物PCA2-2(SEQ ID NO：71)。分离这些DNA片段，用上述方法亚克隆并测序。鉴定了与全长人具有α2(I)基因(Genbank登录号NM000089)或部分猪α2(I)序列(Genbank登录号AU058497)高度同源的序列。

由于用对人序列设计了用于克隆猪前胶原1型α2 cDNA的5’引物HU2-5(SEQ IDNO：66)，从而整合入如上所述新分离的cDNA，用引物A2-N(SEQ ID NO：72)和PCA2-6(SEQ ID NO：67)随后从猪cDNA中扩增约1100bp的额外PCR片段。根据在人(Genbank登录号NM000089)和牛(Genbank登录号AB008683)前胶原α2(I)cDNA起始密码子立即上游区域的序列设计引物A2-N。该DNA片段的序列确认用引物HU2-5和PCA2-2产生的全长片段具有真正的猪5’末端。图9A-9C显示了猪α2(I)胶原基因(SEQ ID NO：9)的全长核苷酸序列。图10A-10C描述了相应的氨基酸序列(SEQ IDNO：10)。

实施例5：猪前胶原III型α1的测序

用下列方法分离猪前胶原III型α1 cDNA。从冷冻猪肝中分离总RNA，如实施例2中所述进行逆转录和PCR。设计了基于人前胶原3型α1cDNA(Genbank登录号X14420)和猪前胶原3型α1 cDNA(Genbank登录号C94995、C94535和C94565)的序列的寡核苷酸引物。这些引物列于上述表5。

用从猪肝纯化的RNA进行RT-PCR，在反应中用引物CIII-1(SEQ ID NO：54)和CIII-6(SEQ ID NO：55)鉴定了约4500bp的DNA条带。纯化该DNA片段，如上亚克隆和测序。在能从Genbank登录号C94565、C94535和C95995的部分猪序列可得高质量序列的区域，新cDNA的序列显示是相同的。在其它区域鉴定了与人前胶原α1(III)cDNA(Genbank登录号X14420)和牛前胶原α1(III)cDNA(衍生自本发明和Genbank登录号L47641的序列)高度同源的序列。

由于用对人序列设计了5′引物CIII-1，并整合到新分离的cDNA中，需要确定天然猪序列。用引物A3-N(SEQ ID NO：56)和CIII-4(SEQ ID NO：57)从猪cDNA扩增了约3700bp的另一条PCR片段。根据起始密码子立即上游区的人前胶原α1(III)cDNA序列设计了引物A3-N。对该片段进行测序，确定了用引物CIII-1和CIII-6产生的全长片段具有真正的猪5′序列。

总的说，用RT-PCR从猪肝中分离了猪α1(III)的全长cDNA。在全面测序后(三次独立的PCR反应)，装配含有起始密码子ATG和终止密码子TAA的4428bp的连续序列。(图11A-11C，SEQ ID NO：11)。该序列与可得的部分猪序列(Genbank登录号C94565、C94535和C95995)相同。整条序列显示与人α1(III)前胶原cDNA(Genbank登录号X14420)和牛α1(III)前胶原cDNA(来自本发明和Genbank登录号L47641和PO4258)高度同源。猪III型α1胶原的推测氨基酸序列列于图12A-12C(SEQ ID NO：12)。

实施例6：在转基因植物中产生动物胶原和明胶

将编码本发明的动物胶原，脯氨酰4-羟化酶的α亚基和脯氨酰4-羟化酶的β亚基的cDNA克隆入合适的植物表达载体，该载体含有正确表达外源蛋白的必需元件。这些元件可以包括例如信号肽、启动子和终止子(见例如Rogers等，见上；Schardl等，见上；Berger等，见上)。例如，本领域描述了pVL载体(见例如A.Lamberg等(1996)J.Biol.Chem.271：11988-11995)。这些重组pVL载体用作用本领域已知的常规方法构建植物表达载体的基因来源。为了在植物或植物细胞中表达胶原，可操纵性连接核酸序列，例如与CaMV 35S启动子连接。编码脯氨酰4-羟化酶的α亚基或β亚基的核酸序列与CaMV 35S启动子可操纵性连接，并可以在相同或不同质粒上存在以产生生物活性的脯氨酰4-羟化酶。

用本领域熟知的转化技术将表达载体转化入植物或植物细胞。用例如RNA和蛋白质印迹选择表达克隆，并可在发酵罐中培养，产生纯化重组胶原的细胞团块。

用300毫克细胞沉淀抽提物在10mM Tris，pH7.8、100mM NaCl、100mM甘氨酸、10μM二硫苏糖醇(DTT)、0.1％Triton X100、2μM亮抑酶肽(Leupeptin)和0.25mM苯甲基磺酰氟(PMSF)通过免疫印迹法等筛选脯氨酰4-羟化酶的α亚基和β亚基和动物胶原的表达。用4-20％SDS-PAGE分离提取物中的蛋白质，转移到硝酸纤维素膜上，用针对脯氨酰4-羟化酶的α亚基和β亚基和动物胶原的抗体探测。

为了确定植物或植物细胞中的重组动物胶原特征，进行了下列方案：

1.在1M NaCl、0.05M Tris，pH7.4中悬浮并匀化细胞沉淀，4℃搅拌1小时。4℃离心收集上清液；

2.在上清液中加入7.5毫升乙酸，4℃培养2小时。4℃离心收集沉淀。

3.用2M NaCl，0.05M tris，pH7.4洗涤沉淀两次；

4.在2M脲、0.2M NaCl、0.05M Tris，pH7.4中重新溶解；

5.对2M脲、0.2M NaCl、0.05M Tris，pH7.4透析；

6.通过DEAE-纤维素柱。收集流出液；

7.加入乙酸达0.5M，加入NaCl达0.9M，4℃培养2小时；

8.离心收集沉淀；

9.将沉淀重新悬浮在0.5M乙酸中，在4℃搅拌过夜。

10.用0.1mg/ml胃蛋白酶消化沉淀2小时；

11.加入饱和Tris缓冲液，将pH调节到7.4；

12.过夜培养，灭活胃蛋白酶；

13.加入NaCl达0.9M，乙酸达0.5M，4℃培育2小时；

14. 4℃离心收集沉淀；

15.用2M NaCl、0.05M Tris，pH7.4洗涤沉淀；

16.溶于2M脲、150M NaCl、0.05M Tris，pH7.4；和

17.样品在56℃加热5分钟，然后加到用高效液相层析(HPLC)系统操作的Bio-Gel TSK 40柱上。

用氨基酸组分分析确定得到的纯化胶原的特征。

本发明所述方法和系统的各种修改和变化对于本领域技术人员是明白的，不违背本发明的范围和精神。虽然本发明结合特别的优选例进行了描述，应理解所要求的本发明不会不恰当的被这些具体实施例所限。事实上，对于分子生物学或相关领域的技术人员来说明显易见的所述实施本发明的模式的各种修改是在权利要求的范围内。本文引用的全部文献在此完整引入以供参考。

序列表<110>法布罗根股份有限公司(FIBROGEN，INC.)<120>动物胶原和明胶<130>FG0217 PCT<140><141><160>72<170>PatentIn Ver.2.0<210>1<211>4748<212>DNA<213>牛(bos taurus)<400>1cagacgggag tttctcctcg gggtcggagc aggaggcacg cggagtgtga ggccacgcat 60gagcggacgc taacccccac cccagccgca aagagtctac atgtctaggg tctagacatg 120ttcagctttg tggacctccg gctcctgctc ctcttagcgg ccaccgccct cctgacgcac 180ggccaagagg agggccagga agaaggccaa gaagaagaca tcccaccagt cacctgcgta 240cagaacggcc tcaggtacca tgaccgagac gtgtggaaac ccgtgccctg ccagatctgt 300gtctgcgaca acggcaacgt gctgtgcgat gacgtgatct gcgacgaact taaggactgt 360cctaacgcca aagtccccac ggacgaatgc tgccccgtct gccccgaagg ccaggaatca 420cccacggacc aagaaaccac cggagtcgag ggaccgaaag gagacactgg cccccgaggc 480ccaaggggac ccgccggccc ccccggccga gatggcatcc ctggacaacc tggacttccc 540ggaccccctg gaccccccgg acctcccgga ccccctggcc tcggaggaaa ctttgctccc 600cagttgtctt acggctatga tgagaaatca acaggaattt ccgtgcctgg tcccatgggt 660ccttctggtc ctcgtggtct ccctggcccc cctggcgcac ctggtcccca aggtttccaa 720ggcccccctg gtgagcctgg cgagccagga gcctcaggtc ccatgggtcc ccgtggtccc 780cctggccccc ctggcaagaa cggagatgat ggcgaagctg gaaagcctgg tcgtcctggt 840gagcgcgggc ctcccggacc tcagggtgct cggggattgc ctggaacagc tggcctccct 900ggaatgaagg gacacagagg tttcagtggt ttggatggtg ccaagggaga tgctggtcct 960gctggcccca agggcgagcc tggtagcccc ggtgaaaatg gagctcctgg tcagatgggc 1020ccccgtggtc tgcctggtga gagaggtcgc cctggagccc ctggccctgc tggtgctcga 1080ggaaatgatg gtgcgactgg tgctgctggg ccccctggtc ccactggccc cgctggtcct 1140cctggtttcc ctggtgctgt gggtgctaag ggtgaaggtg gtccccaagg accccgaggt 1200tctgaaggtc cccagggtgt acgtggtgag cctggccccc ctggccctgc tggtgctgct 1260ggccctgctg gcaaccctgg tgctgatgga cagcctggtg ctaaaggagc caatggcgct 1320cctggtattg ctggtgctcc tggcttccct ggtgcccgag gcccctctgg accccagggc 1380cccagcggcc cccctggccc caagggtaac agcggtgaac ctggtgctcc tggcagcaaa 1440ggagacactg gcgccaaggg agaacccggt cccactggta ttcaaggccc ccctggcccc 1500gctggggaag aaggaaagcg aggagcccga ggtgaacctg gacctgctgg cctgcctgga 1560ccccctggcg agcgtggtgg acctggaagc cgtggtttcc ctggcgccga cggtgttgct 1620ggtcccaagg gtcctgctgg tgaacgcggt gctcctggcc ctgctggccc caaaggttct 1680cctggtgaag ctggtcgccc cggtgaagct ggtctgcccg gtgccaaggg tctgactgga 1740agccctggca gcccgggtcc tgatggcaaa actggccccc ctggtcccgc cggtcaagat 1800ggccgccctg gacctccagg ccctcccggt gcccgtggtc aggctggcgt gatgggtttc 1860cctggaccta aaggtgctgc tggagagcct ggaaaagctg gagagcgagg tgttcctgga 1920ccccctggcg ctgttggtcc tgctggcaaa gacggagaag ctggagctca gggaccccca 1980ggacctgctg gcccgctggt gagagaggcg aacaaggccc tgctggctcc cctggattcc 2040agggtctccc cggccctgct ggtcctcctg gtgaagcagg caaacctggt gaacagggtg 2100ttcctggaga tcttggtgcc cccggcccct ctggagcaag aggcgagaga ggtttccccg 2160gcgagcgtgg tgtgcaaggg ccgcccggtc ctgcaggtcc ccgtggggcc aatggtgccc 2220ctggcaacga tggtgctaag ggtgatgctg gtgcccctgg agcccccggt agccagggtg 2280cccctggcct tcaaggaatg cctggtgaac gaggtgcagc tggtcttcca ggccctaagg 2340gtgacagagg ggatgctggt cccaaaggtg ctgatggtgc tcctggcaaa gatggcgtcc 2400gtggtctgac tggtcccatc ggtcctcctg gccccgctgg tgcccctggt gacaagggtg 2460aagctggtcc tagcggccca gccggtccca ctggagctcg tggtgccccc ggtgaccgtg 2520gtgagcctgg tccccccggc cctgctggct tcgctggccc ccctggtgct gatggccaac 2580ctggtgctaa aggcgaacct ggtgatgctg gtgctaaagg tgacgctggt ccccccggcc 2640ctgctgggcc cgctggaccc cccggcccca ttggtaacgt tggtgctccc ggacccaaag 2700gtgctcgtgg cagcgctggt ccccctggtg ctactggttt cccaggtgct gctggccgag 2760ttggtccccc cggcccctct ggaaatgctg gaccccctgg ccctcctggc cctgctggca 2820aagaaggcag caaaggcccc cgcggtgaga ctggccccgc tgggcgtccc ggtgaagtcg 2880gtccccctgg tccccctggc cccgctggtg agaaaggagc ccctggtgct gacggacctg 2940ctggagctcc tggcactcct ggacctcaag gtattgctgg acagcgtggt gtggtcggcc 3000tgcctggtca gagaggagaa agaggcttcc ctggtcttcc tggcccctct ggtgaacccg 3060gcaaacaagg tccttctgga gcaagtggtg aacgtggccc ccctggtccc atgggccccc 3120ctggattggc tggaccccct ggcgagtctg gacgtgaggg agctcctggt gctgaaggat 3180cccctggacg agatggttct cctggcgcca agggtgaccg tggtgagacc ggccctgctg 3240gacctcctgg tgctcctggc gctcccggtg cccccggccc tgtcggacct gccggcaaga 3300gcggtgatcg tggtgagacc ggtcctgctg gtcctgctgg tcccattggc cccgttggtg 3360cccgtggccc cgctggaccc caaggccccc gtggtgacaa gggtgagaca ggcgaacagg 3420gcgacagagg cattaagggt caccgtggct tctctggtct ccagggtccc cccggccctc 3480ccggctctcc tggtgagcaa ggtccttccg gagcctctgg tcctgctggt ccccgcggtc 3540cccctggctc tgctggttct cccggcaaag atggactcaa tggtctccca ggccccatcg 3600gtccccctgg gcctcgaggt cgcactggtg atgctggtcc tgctggtcct cccggccctc 3560ctggaccccc tggtccccca ggtcctccca gcggcggcta cgacttgagc ttcctgcccc 3720agccacctca agagaaggct cacgatggtg gccgctacta ccgggctgat gatgccaatg 3780tggtccgtga ccgtgacctc gaggtggaca ccaccctcaa gagcctgagc cagcagatcg 3840agaacatccg gagccctgaa ggcagccgca agaaccccgc ccgcacctgc cgtgacctca 3900agatgtgcca ctctgactgg aagagcggag aatactggat tgaccccaac caaggctgca 3960acctggatgc cattaaggtc ttctgcaaca tggaaaccgg tgagacctgt gtatacccca 4020ctcagcccag cgtggcccag aagaactggt atatcagcaa gaaccccaag gaaaagaggc 4080acgtctggta cggcgagagc atgaccggcg gattccagtt cgagtatggc ggccaggggt 4140ccgatcctgc cgatgtggcc atccagctga ctttcctgcg cctgatgtcc accgaggcct 4200cccagaacat cacctaccac tgcaagaaca gcgtggccta catggaccag cagactggca 4260acctcaagaa ggccctgctc ctccagggct ccaacgagat cgagatccgg gccgagggca 4320acagccgctt cacctacagc gtcacctacg atggctgcac gagtcacacc ggagcctggg 4380gcaagacagt gatcgaatac aaaaccacca agacctcccg cttgcccatc atcgatgtgg 4440cccccttgga cgttggcgcc ccagaccagg aattcggttt cgacgttggc cctgcctgct 4500tcctgtaaac tccttccacc ccaacctggc tccctcccac ccaacccact tgcccctgac 4560tctggaaaca gacaaacaac ccaaactgaa acccccgaaa agccaaaaaa tgggagacaa 4620tttcacatgg actttggaaa atattttttt cctttgcatt catctctcaa acttagtttt 4680tatctttgac caactgaaca tgaccaaaaa ccaaaagtgc attcaacctt accaaaaaaa 4740aaaaaaaa 4748<210>2<211>1463<212>PRT<213>牛(bos taurus)<400>2Met Phe Ser Phe Val Asp Leu Arg Leu Leu Leu Leu Leu Ala Ala Thr1 5 10 15Ala Leu Leu Thr His Gly Gln Glu Glu Gly Gln Glu Glu Gly Gln Glu

20 25 30Glu Asp Ile Pro Pro Val Thr Cys Val Gln Asn Gly Leu Arg Tyr His

35 40 45Asp Arg Asp Val Trp Lys Pro Val Pro Cys Gln Ile Cys Val Cys Asp

50 55 60Asn Gly Asn Val Leu Cys Asp Asp Val Ile Cys Asp Glu Leu Lys Asp65 70 75 80Cys Pro Asn Ala Lys Val Pro Thr Asp Glu Cys Cys Pro Val Cys Pro

85 90 95Glu Gly Gln Glu Ser Pro Thr Asp Gln Glu Thr Thr Gly Val Glu Gly

100 105 110Pro Lys Gly Asp Thr Gly Pro Arg Gly Pro Arg Gly Pro Ala Gly Pro

115 120 125Pro Gly Arg Asp Gly Ile Pro Gly Gln Pro Gly Leu Pro Gly Pro Pro

130 135 140Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Leu Gly Gly Asn Phe Ala145 150 155 160Pro Gln Leu Ser Tyr Gly Tyr Asp Glu Lys Ser Thr Gly Ile Ser Val

165 170 175Pro Gly Pro Met Gly Pro Ser Gly Pro Arg Gly Leu Pro Gly Pro Pro

180 185 190Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Pro Pro Gly Glu Pro Gly

195 200 205Glu Pro Gly Ala Ser Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro

210 215 220Pro Gly Lys Asn Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly Arg Pro225 230 235 240Gly Glu Arg Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Leu Pro Gly

245 250 255Thr Ala Gly Leu Pro Gly Met Lys Gly His Arg Gly Phe Ser Gly Leu

260 265 270Asp Gly Ala Lys Gly Asp Ala Gly Pro Ala Gly Pro Lys Gly Glu Pro

275 280 285Gly Ser Pro Gly Glu Asn Gly Ala Pro Gly Gln Met Gly Pro Arg Gly

290 295 300Leu Pro Gly Glu Arg Gly Arg Pro Gly Ala Pro Gly Pro Ala Gly Ala305 310 315 320Arg Gly Asn Asp Gly Ala Thr Gly Ala Ala Gly Pro Pro Gly Pro Thr

325 330 335Gly Pro Ala Gly Pro Pro Gly Phe Pro Gly Ala Val Gly Ala Lys Gly

340 345 350Glu Gly Gly Pro Gln Gly Pro Arg Gly Ser Glu Gly Pro Gln Gly Val

355 360 365Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Ala Ala Gly Pro Ala

370 375 380Gly Asn Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Ala Asn Gly385 390 395 400Ala Pro Gly Ile Ala Gly Ala Pro Gly Phe Pro Gly Ala Arg Gly Pro

405 410 415Ser Gly Pro Gln Gly Pro Ser Gly Pro Pro Gly Pro Lys Gly Asn Ser

420 425 430Gly Glu Pro Gly Ala Pro Gly Ser Lys Gly Asp Thr Gly Ala Lys Gly

435 440 445Glu Pro Gly Pro Thr Gly Ile Gln Gly Pro Pro Gly Pro Ala Gly Glu

450 455 460Glu Gly Lys Arg Gly Ala Arg Gly Glu Pro Gly Pro Ala Gly Leu Pro465 470 475 480Gly Pro Pro Gly Glu Arg Gly Gly Pro Gly Ser Arg Gly Phe Pro Gly

485 490 495Ala Asp Gly Val Ala Gly Pro Lys Gly Pro Ala Gly Glu Arg Gly Ala

500 505 510Pro Gly Pro Ala Gly Pro Lys Gly Ser Pro Gly Glu Ala Gly Arg Pro

515 520 525Gly Glu Ala Gly Leu Pro Gly Ala Lys Gly Leu Thr Gly Ser Pro Gly

530 535 540Ser Pro Gly Pro Asp Gly Lys Thr Gly Pro Pro Gly Pro Ala Gly Gln545 550 555 560Asp Gly Arg Pro Gly Pro Pro Gly Pro Pro Gly Ala Arg Gly Gln Ala

565 570 575Gly Val Met Gly Phe Pro Gly Pro Lys Gly Ala Ala Gly Glu Pro Gly

580 585 590Lys Ala Gly Glu Arg Gly Val Pro Gly Pro Pro Gly Ala Val Gly Pro

595 600 605Ala Gly Lys Asp Gly Glu Ala Gly Ala Gln Gly Pro Pro Gly Pro Ala

610 615 620Gly Pro Ala Gly Glu Arg Gly Glu Gln Gly Pro Ala Gly Ser Pro Gly625 630 635 640Phe Gln Gly Leu Pro Gly Pro Ala Gly Pro Pro Gly Glu Ala Gly Lys

645 650 655Pro Gly Glu Gln Gly Val Pro Gly Asp Leu Gly Ala Pro Gly Pro Ser

660 665 670Gly Ala Arg Gly Glu Arg Gly Phe Pro Gly Glu Arg Gly Val Gln Gly

675 680 685Pro Pro Gly Pro Ala Gly Pro Arg Gly Ala Asn Gly Ala Pro Gly Asn

690 695 700Asp Gly Ala Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly Ser Gln705 710 715 720Gly Ala Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Ala Ala Gly

725 730 735Leu Pro Gly Pro Lys Gly Asp Arg Gly Asp Ala Gly Pro Lys Gly Ala

740 745 750Asp Gly Ala Pro Gly Lys Asp Gly Val Arg Gly Leu Thr Gly Pro Ile

755 760 765Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Asp Lys Gly Glu Ala Gly

770 775 780Pro Ser Gly Pro Ala Gly Pro Thr Gly Ala Arg Gly Ala Pro Gly Asp785 790 795 800Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly Pro Pro

805 810 815Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Glu Pro Gly Asp Ala Gly

820 825 830Ala Lys Gly Asp Ala Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly Pro

835 840 845Pro Gly Pro Ile Gly Asn Val Gly Ala Pro Gly Pro Lys Gly Ala Arg

850 855 860Gly Ser Ala Gly Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala Ala Gly865 870 875 880Arg Val Gly Pro Pro Gly Pro Ser Gly Asn Ala Gly Pro Pro Gly Pro

885 890 895Pro Gly Pro Ala Gly Lys Glu Gly Ser Lys Gly Pro Arg Gly Glu Thr

900 905 910Gly Pro Ala Gly Arg Pro Gly Glu Val Gly Pro Pro Gly Pro Pro Gly

915 920 925Pro Ala Gly Glu Lys Gly Ala Pro Gly Ala Asp Gly Pro Ala Gly Ala

930 935 940Pro Gly Thr Pro Gly Pro Gln Gly Ile Ala Gly Gln Arg Gly Val Val945 950 955 960Gly Leu Pro Gly Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu Pro Gly

965 970 975Pro Ser Gly Glu Pro Gly Lys Gln Gly Pro Ser Gly Ala Ser Gly Glu

980 985 990Arg Gly Pro Pro Gly Pro Met Gly Pro Pro Gly Leu Ala Gly Pro Pro

995 1000 1005Gly Glu Ser Gly Arg Glu Gly Ala Pro Gly Ala Glu Gly Ser Pro Gly1010 1015 1020Arg Asp Gly Ser Pro Gly Ala Lys Gly Asp Arg Gly Glu Thr Gly Pro1025 1030 1035 1040Ala Gly Pro Pro Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly Pro Val

1045 1050 1055Gly Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly

1060 1065 1070Pro Ala Gly Pro Ile Gly Pro Val Gly Ala Arg Gly Pro Ala Gly Pro

1075 1080 1085Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Gln Gly Asp Arg1090 1095 1100Gly Ile Lys Gly His Arg Gly Phe Ser Gly Leu Gln Gly Pro Pro Gly1105 1110 1115 1120Pro Pro Gly Ser Pro Gly Glu Gln Gly Pro Ser Gly Ala Ser Gly Pro

1125 1130 1135Ala Gly Pro Arg Gly Pro Pro Gly Ser Ala Gly Ser Pro Gly Lys Asp

1140 1145 1150Gly Leu Asn Gly Leu Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly

1155 1160 1165Arg Thr Gly Asp Ala Gly Pro Ala Gly Pro Pro Gly Pro Pro Gly Pro1170 1175 1180Pro Gly Pro Pro Gly Pro Pro Ser Gly Gly Tyr Asp Leu Ser Phe Leu1185 1190 1195 1200Pro Gln Pro Pro Gln Glu Lys Ala His Asp Gly Gly Arg Tyr Tyr Arg

1205 1210 1215Ala Asp Asp Ala Asn Val Val Arg Asp Arg Asp Leu Glu Val Asp Thr

1220 1225 1230Thr Leu Lys Ser Leu Ser Gln Gln Ile Glu Asn Ile Arg Ser Pro Glu

1235 1240 1245Gly Ser Arg Lys Asn Pro Ala Arg Thr Cys Arg Asp Leu Lys Met Cys1250 1255 1260His Ser Asp Trp Lys Ser Gly Glu Tyr Trp Ile Asp Pro Asn Gln Gly1265 1270 1275 1280Cys Asn Leu Asp Ala Ile Lys Val Phe Cys Asn Met Glu Thr Gly Glu

1285 1290 1295Thr Cys Val Tyr Pro Thr Gln Pro Ser Val Ala Gln Lys Asn Trp Tyr

1300 1305 1310Ile Ser Lys Asn Pro Lys Glu Lys Arg His Val Trp Tyr Gly Glu Ser

1315 1320 1325Met Thr Gly Gly Phe Gln Phe Glu Tyr Gly Gly Gln Gly Ser Asp Pro1330 1335 1340Ala Asp Val Ala Ile Gln Leu Thr Phe Leu Arg Leu Met Ser Thr Glu1345 1350 1355 1360Ala Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Val Ala Tyr Met

1365 1370 1375Asp Gln Gln Thr Gly Asn Leu Lys Lys Ala Leu Leu Leu Gln Gly Ser

1380 1385 1390Asn Glu Ile Glu Ile Arg Ala Glu Gly Asn Ser Arg Phe Thr Tyr Ser

1395 1400 1405Val Thr Tyr Asp Gly Cys Thr Ser His Thr Gly Ala Trp Gly Lys Thr1410 1415 1420Val Ile Glu Tyr Lys Thr Thr Lys Thr Ser Arg Leu Pro Ile Ile Asp1425 1430 1435 1440Val Ala Pro Leu Asp Val Gly Ala Pro Asp Gln Glu Phe Gly Phe Asp

1445 1450 1455Val Gly Pro Ala Cys Phe Leu

1460<210>3<211>4428<212>DNA<213>牛(bos taurus)<400>3gaattcaggg acatgatgag ctttgtgcaa aaggggacct ggttactttt cgctctgctt 60catcccactg ttattttggc acaacaggaa gctgttgacg gaggatgctc ccatctcggt 120cagtcttatg cagatagaga tgtatggaaa ccagaaccgt gccaaatatg cgtctgtgac 180tcaggatccg ttctctgtga tgacataata tgtgacgacc aagaattaga ctgccccaac 240cctgaaatcc cgtttggaga atgttgtgca gtttgcccac agcctccaac agctcccact 300cgccctccta atggtcaagg acctcaaggc cccaagggag atccaggtcc tcctggtatt 360cctgggcgaa atggcgatcc tggtcctcca ggatcaccag gctccccagg ttctcccggc 420cctcctggaa tctgtgaatc atgtcctact ggtggccaga actattctcc ccagtacgaa 480gcatatgatg tcaagtctgg agtagcagga ggaggaatcg caggctatcc tgggccagct 540ggtcctcctg gcccacccgg accccctggc acatctggcc atcctggtgc ccctggcgct 600ccaggatacc aaggtccccc cggtgaacct gggcaagctg gtccggcagg tcctccagga 660cctcctggtg ctataggtcc atctggccct gctggaaaag atggggaatc aggaagaccc 720ggacgacctg gagagcgagg atttcctggc cctcctggta tgaaaggccc agctggtatg 780cctggattcc ctggtatgaa aggacacaga ggctttgatg gacgaaatgg agagaaaggc 840gaaactggtg ctcctggatt aaagggggaa aatggcgttc caggtgaaaa tggagctcct 900ggacccatgg gtccaagagg ggctcccggt gagagaggac ggccaggact tcctggagcc 960gcaggggctc gaggtaatga tggagctcga ggaagtgatg gacaaccggg cccccctggt 1020cctcctggaa ctgcaggatt ccctggttcc cctggtgcta agggtgaagt tggacctgca 1080ggatctcctg gttcaagtgg cgcccctgga caaagaggag aacctggacc tcagggacat 1140gctggtgctc caggtccccc tgggcctcct gggagtaatg gtagtcctgg tggcaaaggt 1200gaaatgggtc ctgctggcat tcctggggct cctgggctga taggagctcg tggtcctcca 1260gggccacctg gcaccaatgg tgttcccggg caacgaggtg ctgcaggtga acccggtaag 1320aatggagcca aaggagaccc aggaccacgt ggggaacgcg gagaagctgg ttctccaggt 1380atcgcaggac ctaagggtga agatggcaaa gatggttctc ctggagaacc tggtgcaaat 1440ggacttcctg gagctgcagg agaaaggggt gtgcctggat tccgaggacc tgctggagca 1500aatggccttc caggagaaaa gggtcctcct ggggaccgtg gtggcccagg ccctgcaggg 1560cccagaggtg ttgctggaga gcccggcaga gatggtctcc ctggaggtcc aggattgagg 1620ggtattcctg gtagcccggg aggaccaggc agtgatggga aaccagggcc tcctggaagc 1680caaggagaga cgggtcgacc cggtcctcca ggttcacctg gtccgcgagg ccagcctggt 1740gtcatgggct tccctggtcc caaaggaaac gatggtgctc ctggaaaaaa tggagaacga 1800ggtggccctg gaggtcctgg ccctcagggt cctgctggaa agaatggtga gaccggacct 1860cagggtcctc caggacctac tggcccttct ggtgacaaag gagacacagg accccctggt 1920ccacaaggac tacaaggctt gcctggaacg agtggtcccc caggagaaaa cggaaaacct 1980ggtgaacctg gtccaaaggg tgaggctggt gcacctggaa ttccaggagg caagggtgat 2040tctggtgctc ccggtgaacg cggacctcct ggagcaggag ggccccctgg acctagaggt 2100ggagctggcc cccctggtcc cgaaggagga aagggtgctg ctggtccccc tgggccacct 2160ggttctgctg gtacacctgg tctgcaagga atgcctggag aaagaggggg tcctggaggc 2220cctggtccaa agggtgataa gggtgagcct ggcagctcag gtgtcgatgg tgctccaggg 2280aaagatggtc cacggggtcc cactggtccc attggtcctc ctggcccagc tggtcagcct 2340ggagataagg gtgaaagtgg tgcccctgga gttccgggta tagctggtcc tcgcggtggc 2400cctggtgaga gaggcgaaca ggggccccca ggacctgctg gcttccctgg tgctcctggc 2460cagaatggtg agcctggtgc taaaggagaa agaggcgctc ctggtgagaa aggtgaagga 2520ggccctcccg gagccgcagg acccgccgga ggttctgggc ctgccggtcc cccaggcccc 2580caaggtgtca aaggcgaacg tggcagtcct ggtggtcctg gtgctgctgg cttccccggt 2640ggtcgtggtc ctcctggccc tcctggcagt aatggtaacc caggcccccc aggctccagt 2700ggtgctccag gcaaagatgg tcccccaggt ccacctggca gtaatggtgc tcctggcagc 2760cccgggatct ctggaccaaa gggtgattct ggtccaccag gtgagagggg agcacctggc 2820ccccaggggc ctccgggagc tccaggccca ctaggaattg caggacttac tggagcacga 2880ggtcttgcag gcccaccagg catgccaggt gctaggggca gccccggccc acagggcatc 2940aagggtgaaa atggtaaacc aggacctagt ggtcagaatg gagaacgtgg tcctcctggc 3000ccccagggtc ttcctggtct ggctggtaca gctggtgagc ctggaagaga tggaaaccct 3060ggatcagatg gtctgccagg ccgagatgga gcgccaggtg ccaagggtga ccgtggtgaa 3120aatggctctc ctggtgcccc tggagctcct ggtcacccag gccctcctgg tcctgtcggt 3180ccagctggaa agagcggtga cagaggagaa actggccctg ctggtccttc tggggccccc 3240ggtcctgccg gatcaagagg tcctcctggt ccccaaggcc cacgcggtga caaaggggaa 3300accggtgagc gtggtgctat gggcatcaaa ggacatcgcg gattccctgg caacccaggg 3360gcccccggat ctccgggtcc cgctggtcat caaggtgcag ttggcagtcc aggccctgca 3420ggccccagag gacctgttgg acctagcggg ccccctggaa aggacggagc aagtggacac 3480cctggtccca ttggaccacc ggggccccga ggtaacagag gtgaaagagg atctgagggc 3540tccccaggcc acccaggaca accaggccct cctggacctc ctggtgcccc tggtccatgt 3600tgtggtgctg gcggggttgc tgccattgct ggtgttggag ccgaaaaagc tggtggtttt 3660gccccatatt atggagatga accgatagat ttcaaaatca ataccgatga gattatgacc 3720tcactcaaat cagtcaatgg acaaatagaa agcctcatta gtcctgatgg ttcccgtaaa 3780aaccctgcac ggaactgcag ggacctgaaa ttctgccatc ctgaactcca gagtggagaa 3840tattgggttg atcctaacca aggttgcaaa ttggatgcta ttaaagtcta ctgtaacatg 3900gaaactgggg aaacgtgcat aagtgccagt cctttgacta tcccacagaa gaactggtgg 3960acagattctg gtgctgagaa gaaacatgtt tggtttggag aatccatgga gggtggtttt 4020cagtttagct atggcaatcc tgaacttccc gaagacgtcc tcgatgtcca gctggcattc 4080ctccgacttc tctccagccg ggcctctcag aacatcacat atcactgcaa gaatagcatt 4140gcatacatgg atcatgccag tgggaatgta aagaaagcct tgaagctgat ggggtcaaat 4200gaaggtgaat tcaaggctga aggaaatagc aaattcacat acacagttct ggaggatggt 4260tgcacaaaac acactgggga atggggcaaa acagtcttcc agtatcaaac acgcaaggcc 4320gtcagactac ctattgtaga tattgcaccc tatgatatcg gtggtcctga tcaagaattt 4380ggtgcggaca ttggccctgt ttgcttttta taaaccaaac ctgaattc 4428<210>4<211>1466<212>PRT<213>牛(bos taurus)<400> 4Met Met Ser Phe Val Gln Lys Gly Thr Trp Leu Leu Phe Ala Leu Leu1 5 10 15His Pro Thr Val Ile Leu Ala Gln Gln Glu Ala Val Asp Gly Gly Cys

20 25 30Ser His Leu Gly Gln Ser Tyr Ala Asp Arg Asp Val Trp Lys Pro Glu

35 40 45Pro Cys Gln Ile Cys Val Cys Asp Ser Gly Ser Val Leu Cys Asp Asp

50 55 60Ile Ile Cys Asp Asp Gln Glu Leu Asp Cys Pro Asn Pro Glu Ile Pro65 70 75 80Phe Gly Glu Cys Cys Ala Val Cys Pro Gln Pro Pro Thr Ala Pro Thr

85 90 95Arg Pro Pro Asn Gly Gln Gly Pro Gln Gly Pro Lys Gly Asp Pro Gly

100 105 110Pro Pro Gly Ile Pro Gly Arg Asn Gly Asp Pro Gly Pro Pro Gly Ser

115 120 125Pro Gly Ser Pro Gly Ser Pro Gly Pro Pro Gly Ile Cys Glu Ser Cys

130 135 140Pro Thr Gly Gly Gln Asn Tyr Ser Pro Gln Tyr Glu Ala Tyr Asp Val145 150 155 160Lys Ser Gly Val Ala Gly G1y Gly Ile Ala Gly Tyr Pro Gly Pro Ala

165 170 175Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Thr Ser Gly His Pro Gly

180 185 190Ala Pro Gly Ala Pro Gly Tyr Gln Gly Pro Pro Gly Glu Pro Gly Gln

195 200 205Ala Gly Pro Ala Gly Pro Pro Gly Pro Pro Gly Ala Ile Gly Pro Ser

210 215 220Gly Pro Ala Gly Lys Asp Gly Glu Ser Gly Arg Pro Gly Arg Pro Gly225 230 235 240Glu Arg Gly Phe Pro Gly Pro Pro Gly Met Lys Gly Pro Ala Gly Met

245 250 255Pro Gly Phe Pro Gly Met Lys Gly His Arg Gly Phe Asp Gly Arg Asn

260 265 270Gly Glu Lys Gly Glu Thr Gly Ala Pro Gly Leu Lys Gly Glu Asn Gly

275 280 285Val Pro Gly Glu Asn Gly Ala Pro Gly Pro Met Gly Pro Arg Gly Ala

290 295 300Pro Gly Glu Arg Gly Arg Pro Gly Leu Pro Gly Ala Ala Gly Ala Arg305 310 315 320Gly Asn Asp Gly Ala Arg Gly Ser Asp Gly Gln Pro Gly Pro Pro Gly

325 330 335Pro Pro Gly Thr Ala Gly Phe Pro Gly Ser Pro Gly Ala Lys Gly Glu

340 345 350Val Gly Pro Ala Gly Ser Pro Gly Ser Ser Gly Ala Pro Gly Gln Arg

355 360 365Gly Glu Pro Gly Pro Gln Gly His Ala Gly Ala Pro Gly Pro Pro Gly

370 375 380Pro Pro Gly Ser Asn Gly Ser Pro Gly Gly Lys Gly Glu Met Gly Pro385 390 395 400Ala Gly Ile Pro Gly Ala Pro Gly Leu Ile Gly Ala Arg Gly Pro Pro

405 410 415Gly Pro Pro Gly Thr Asn Gly Val Pro Gly Gln Arg Gly Ala Ala Gly

420 425 430Glu Pro Gly Lys Asn Gly Ala Lys Gly Asp Pro Gly Pro Arg Gly Glu

435 440 445Arg Gly Glu Ala Gly Ser Pro Gly Ile Ala Gly Pro Lys Gly Glu Asp

450 455 460Gly Lys Asp Gly Ser Pro Gly Glu Pro Gly Ala Asn Gly Leu Pro Gly465 470 475 480Ala Ala Gly Glu Arg Gly Val Pro Gly Phe Arg Gly Pro Ala Gly Ala

485 490 495Asn Gly Leu Pro Gly Glu Lys Gly Pro Pro Gly Asp Arg Gly Gly Pro

500 505 510Gly Pro Ala Gly Pro Arg Gly Val Ala Gly Glu Pro Gly Arg Asp Gly

515 520 525Leu Pro Gly Gly Pro Gly Leu Arg Gly Ile Pro Gly Ser Pro Gly Gly

530 535 540Pro Gly Ser Asp Gly Lys Pro Gly Pro Pro Gly Ser Gln Gly Glu Thr545 550 555 560Gly Arg Pro Gly Pro Pro Gly Ser Pro Gly Pro Arg Gly Gln Pro Gly

565 570 575Val Met Gly Phe Pro Gly Pro Lys Gly Asn Asp Gly Ala Pro Gly Lys

580 585 590Asn Gly Glu Arg Gly Gly Pro Gly Gly Pro Gly Pro Gln Gly Pro Ala

595 600 605Gly Lys Asn Gly Glu Thr Gly Pro Gln Gly Pro Pro Gly Pro Thr Gly

610 615 620Pro Ser Gly Asp Lys Gly Asp Thr Gly Pro Pro Gly Pro Gln Gly Leu625 630 635 640Gln Gly Leu Pro Gly Thr Ser Gly Pro Pro Gly Glu Asn Gly Lys Pro

645 650 655Gly Glu Pro Gly Pro Lys Gly Glu Ala Gly Ala Pro Gly Ile Pro Gly

660 665 670Gly Lys Gly Asp Ser Gly Ala Pro Gly Glu Arg Gly Pro Pro Gly Ala

675 680 685Gly Gly Pro Pro Gly Pro Arg Gly Gly Ala Gly Pro Pro Gly Pro Glu

690 695 700Gly Gly Lys Gly Ala Ala Gly Pro Pro Gly Pro Pro Gly Ser Ala Gly705 710 715 720Thr Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Gly Pro Gly Gly

725 730 735Pro Gly Pro Lys Gly Asp Lys Gly Glu Pro Gly Ser Ser Gly Val Asp

740 745 750Gly Ala Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro Ile Gly

755 760 765Pro Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Ser Gly Ala

770 775 780Pro Gly Val Pro Gly Ile Ala Gly Pro Arg Gly Gly Pro Gly Glu Arg785 790 795 800Gly Glu Gln Gly Pro Pro Gly Pro Ala Gly Phe Pro Gly Ala Pro Gly

805 810 815Gln Asn Gly Glu Pro Gly Ala Lys Gly Glu Arg Gly Ala Pro Gly Glu

820 825 830Lys Gly Glu Gly Gly Pro Pro Gly Ala Ala Gly Pro Ala Gly Gly Ser

835 840 845Gly Pro Ala Gly Pro Pro Gly Pro Gln Gly Val Lys Gly Glu Arg Gly

850 855 860Ser Pro Gly Gly Pro Gly Ala Ala Gly Phe Pro Gly Gly Arg Gly Pro865 870 875 880Pro Gly Pro Pro Gly Ser Asn Gly Asn Pro Gly Pro Pro Gly Ser Ser

885 890 895Gly Ala Pro Gly Lys Asp Gly Pro Pro Gly Pro Pro Gly Ser Asn Gly

900 905 910Ala Pro Gly Ser Pro Gly Ile Ser Gly Pro Lys Gly Asp Ser Gly Pro

915 920 925Pro Gly Glu Arg Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ala Pro

930 935 940Gly Pro Leu Gly lle Ala Gly Leu Thr Gly Ala Arg Gly Leu Ala Gly945 950 955 960Pro Pro Gly Met Pro Gly Ala Arg Gly Ser Pro Gly Pro Gln Gly Ile

965 970 975Lys Gly Glu Asn Gly Lys Pro Gly Pro Ser Gly Gln Asn Gly Glu Arg

980 985 990Gly Pro Pro Gly Pro Gln Gly Leu Pro Gly Leu Ala Gly Thr Ala Gly

995 1000 1005Glu Pro Gly Arg Asp Gly Asn Pro Gly Ser Asp Gly Leu Pro Gly Arg1010 1015 1020Asp Gly Ala Pro Gly Ala Lys Gly Asp Arg Gly Glu Asn Gly Ser Pro1025 1030 1035 1040Gly Ala Pro Gly Ala Pro Gly His Pro Gly Pro Pro Gly Pro Val Gly

1045 1050 1055Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly Pro

1060 1065 1070Ser Gly Ala Pro Gly Pro Ala Gly Ser Arg Gly Pro Pro Gly Pro Gln

1075 1080 1085Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Arg Gly Ala Met Gly1090 1095 1100Ile Lys Gly His Arg Gly Phe Pro Gly Asn Pro Gly Ala Pro Gly Ser1105 1110 1115 1120Pro Gly Pro Ala Gly His Gln Gly Ala Val Gly Ser Pro Gly Pro Ala

1125 1130 1135Gly Pro Arg Gly Pro Val Gly Pro Ser Gly Pro Pro Gly Lys Asp Gly

1140 1145 1150Ala Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly Asn

1155 1160 1165Arg Gly Glu Arg Gly Ser Glu Gly Ser Pro Gly His Pro Gly Gln Pro1170 1175 1180Gly Pro Pro Gly Pro Pro Gly Ala Pro Gly Pro Cys Cys Gly Ala Gly1185 1190 1195 1200Gly Val Ala Ala Ile Ala Gly Val Gly Ala Glu Lys Ala Gly Gly Phe

1205 1210 1215Ala Pro Tyr Tyr Gly Asp Glu Pro Ile Asp Phe Lys Ile Asn Thr Asp

1220 1225 1230Glu Ile Met Thr Ser Leu Lys Ser Val Asn Gly Gln Ile Glu Ser Leu

1235 1240 1245Ile Ser Pro Asp Gly Ser Arg Lys Asn Pro Ala Arg Asn Cys Arg Asp1250 1255 1260Leu Lys Phe Cys His Pro Glu Leu Gln Ser Gly Glu Tyr Trp Val Asp1265 1270 1275 1280Pro Asn Gln Gly Cys Lys Leu Asp Ala Ile Lys Val Tyr Cys Asn Met

1285 1290 1295Glu Thr Gly Glu Thr Cys Ile Ser Ala Ser Pro Leu Thr Ile Pro Gln

1300 1305 1310Lys Asn Trp Trp Thr Asp Ser Gly Ala Glu Lys Lys His Val Trp Phe

1315 1320 1325Gly Glu Ser Met Glu Gly Gly Phe Gln Phe Ser Tyr Gly Asn Pro Glu1330 1335 1340Leu Pro Glu Asp Val Leu Asp Val Gln Leu Ala Phe Leu Arg Leu Leu1345 1350 1355 1360Ser Ser Arg Ala Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Ile

1365 1370 1375Ala Tyr Met Asp His Ala Ser Gly Asn Val Lys Lys Ala Leu Lys Leu

1380 1385 1390Met Gly Ser Asn Glu Gly Glu Phe Lys Ala Glu Gly Asn Ser Lys Phe

1395 1400 1405Thr Tyr Thr Val Leu Glu Asp Gly Cys Thr Lys His Thr Gly Glu Trp1410 1415 1420Gly Lys Thr Val Phe Gln Tyr Gln Thr Arg Lys Ala Val Arg Leu Pro1425 1430 1435 1440Ile Val Asp Ile Ala Pro Tyr Asp Ile Gly Gly Pro Asp Gln Glu Phe

1445 1450 1455Gly Ala Asp Ile Gly Pro Val Cys Phe Leu

1460 1465<210>5<211>4428<212>DNA<213>牛(bos taurus)<400>5gaattcaggg acatgatgag ctttgtgcaa aaggggacct ggttactttt cgctctgctt 60catcccactg ttattttggc acaacaggaa gctgttgacg gaggatgctc ccatctcggt 120cagtcttatg cagatagaga tgtatggaaa ccagaaccgt gccaaatatg cgtctgtgac 180tcaggatccg ttctctgtga tgacataata tgtgacgacc aagaattaga ctgccccaac 240cctgaaatcc cgtttggaga atgttgtgca gtttgcccac agcctccaac agctcccact 300cgccctccta atggtcaagg acctcaaggc cccaagggag atccaggtcc tcctggtatt 360cctgggcgaa atggcgatcc tggtcctcca ggatcaccag gctccccagg ttctcccggc 420cctcctggaa tctgtgaatc atgtcctact ggtggccaga actattctcc ccagtacgaa 480gcatatgatg tcaagtctgg agtagcagga ggaggaatcg caggctatcc tgggccagct 540ggtcctcctg gcccacccgg accccctggc acatctggcc atcctggtgc ccctggcgct 600ccaggatacc aaggtccccc cggtgaacct gggcaagctg gtccggcagg tcctccagga 660cctcctggtg ctataggtcc atctggccct gctggaaaag atggggaatc aggaagaccc 720ggacgacctg gagagcgagg atttcctggc cctcctggta tgaaaggccc agctggtatg 780cctggattcc ctggtatgaa aggacacaga ggctttgatg gacgaaatgg agagaaaggc 840gaaactggtg ctcctggatt aaagggggaa aatggcgttc caggtgaaaa tggagctcct 900ggacccatgg gtccaagagg ggctcccggt gagagaggac ggccaggact tcctggagcc 960gcaggggctc gaggtaatga tggagctcga ggaagtgatg gacaaccggg cccccctggt 1020cctcctggaa ctgcaggatt ccctggttcc cctggtgcta agggtgaagt tggacctgca 1080ggatctcctg gttcaagtgg cgcccctgga caaagaggag aacctggacc tcagggacat 1140gctggtgctc caggtccccc tgggcctcct gggagtaatg gtagtcctgg tggcaaaggt 1200gaaatgggtc ctgctggcat tcctggggct cctgggctga taggagctcg tggtcctcca 1260gggccacctg gcaccaatgg tgttcccggg caacgaggtg ctgcaggtga acccggtaag 1320aatggagcca aaggagaccc aggaccacgt ggggaacgcg gagaagctgg ttctccaggt 1380atcgcaggac ctaagggtga agatggcaaa gatggttctc ctggagaacc tggtgcaaat 1440ggacttcctg gagctgcagg agaaaggggt gtgcctggat tccgaggacc tgctggagca 1500aatggccttc caggagaaaa gggtcctcct ggggaccgtg gtggcccagg ccctgcaggg 1560cccagaggtg ttgctggaga gcccggcaga gatggtctcc ctggaggtcc aggattgagg 1620ggtattcctg gtagcccggg aggaccaggc agtgatggga aaccagggcc tcctggaagc 1680caaggagaga cgggtcgacc cggtcctcca ggttcacctg gtccgcgagg ccagcctggt 1740gtcatgggct tccctggtcc caaaggaaac gatggtgctc ctggaaaaaa tggagaacga 1800ggtggccctg gaggtcctgg ccctcagggt cctgctggaa agaatggtga gaccggacct 1860cagggtcctc caggacctac tggcccttct ggtgacaaag gagacacagg accccctggt 1920ccacaaggac tacaaggctt gcctggaacg agtggtcccc caggagaaaa cggaaaacct 1980ggtgaacctg gtccaaaggg tgaggctggt gcacctggaa ttccaggagg caagggtgat 2040tctggtgctc ccggtgaacg cggacctcct ggagcaggag ggccccctgg acctagaggt 2100ggagctggcc cccctggtcc cgaaggagga aagggtgctg ctggtccccc tgggccacct 2160ggttctgctg gtacacctgg tctgcaagga atgcctggag aaagaggggg tcctggaggc 2220cctggtccaa agggtgataa gggtgagcct ggcagctcag gtgtcgatgg tgctccaggg 2280aaagatggtc cacggggtcc cactggtccc attggtcctc ctggcccagc tggtcagcct 2340ggagataagg gtgaaagtgg tgcccctgga gttccgggta tagctggtcc tcgcggtggc 2400cctggtgaga gaggcgaaca ggggccccca ggacctgctg gcttccctgg tgctcctggc 2460cagaatggtg agcctggtgc taaaggagaa agaggcgctc ctggtgagaa aggtgaagga 2520ggccctcccg gagccgcagg acccgccgga ggttctgggc ctgccggtcc cccaggcccc 2580caaggtgtca aaggcgaacg tggcagtcct ggtggtcctg gtgctgctgg cttccccggt 2640ggtcgtggtc ctcctggccc tcctggcagt aatggtaacc caggcccccc aggctccagt 2700ggtgctccag gcaaagatgg tcccccaggt ccacctggca gtaatggtgc tcctggcagc 2760cccgggatct ctggaccaaa gggtgattct ggtccaccag gtgagagggg agcacctggc 2820ccccaggggc ctccgggagc tccaggccca ctaggaattg caggacttac tggagcacga 2880ggtcttgcag gcccaccagg catgccaggt gctaggggca gccccggccc acagggcatc 2940aagggtgaaa atggtaaacc aggacctagt ggtcagaatg gagaacgtgg tcctcctggc 3000ccccagggtc ttcctggtct ggctggtaca gctggtgagc ctggaagaga tggaaaccct 3060ggatcagatg gtctgccagg ccgagatgga gcgccaggtg ccaagggtga ccgtggtgaa 3120aatggctctc ctggtgcccc tggagctcct ggtcacccag gccctcctgg tcctgtcggt 3180ccagctggaa agagcggtga cagaggagaa actggccctg ctggtccttc tggggccccc 3240ggtcctgccg gatcaagagg tcctcctggt ccccaaggcc cacgcggtga caaaggggaa 3300accggtgagc gtggtgctat gggcatcaaa ggacatcgcg gattccctgg caacccaggg 3360gcccccggat ctccgggtcc cgctggtcat caaggtgcag ttggcagtcc aggccctgca 3420ggccccagag gacctgttgg acctagcggg ccccctggaa aggacggagc aagtggacac 3480cctggtccca ttggaccacc ggggccccga ggtaacagag gtgaaagagg atctgagggc 3540tccccaggcc acccaggaca accaggccct cctggacctc ctggtgcccc tggtccatgt 3600tgtggtgctg gcggggttgc tgccattgct ggtgttggag ccgaaaaagc tggtggtttt 3660gccccatatt atggagatga accgatagat ttcaaaatca acaccaatga gattatgacc 3720tcactcaaat cagtcaatgg acaaatagaa agcctcatta gtcctgatgg ttcccgtaaa 3780aaccctgcac ggaactgcag ggacctgaaa ttctgccatc ctgaactcca gagtggagaa 3840tattgggttg atcctaacca aggttgcaaa ttggatgcta ttaaagtcta ctgtaacatg 3900gaaactgggg aaacgtgcat aagtgccagt cctttgacta tcccacagaa gaactggtgg 3960acagattctg gtgctgagaa gaaacatgtt tggtttggag aatccatgga gggtggtttt 4020cagtttagct atggcaatcc tgaacttccc gaagacgtcc tcgatgtcca gctggcattc 4080ctccgacttc tctccagccg ggcctctcag aacatcacat atcactgcaa gaatagcatt 4140gcatacatgg atcatgtcag tgggaatgta aagaaagcct tgaagctgat ggggtcaaat 4200gaaggtgaat tcaaggctga aggaaatagc aaattcacat acacagttct ggaggatggt 4260tgcacaaaac acactgggga atggggcaaa acagtcttcc agtatcaaac acgcaaggcc 4320gtcagactac ctattgtaga tattgcaccc tatgatatcg gtggtcctga tcaagaattt 4380ggtgcggaca ttggccctgt ttgcttttta taaaccaaac ctgaattc 4428<210>6<211>1466<212>PRT<213>牛(bos taurus)<400>6Met Met Ser Phe Val Gln Lys Gly Thr Trp Leu Leu Phe Ala Leu Leu1 5 10 15His Pro Thr Val Ile Leu Ala Gln Gln Glu Ala Val Asp Gly Gly Cys

20 25 30Ser His Leu Gly Gln Ser Tyr Ala Asp Arg Asp Val Trp Lys Pro Glu

35 40 45Pro Cys Gln Ile Cys Val Cys Asp Ser Gly Ser Val Leu Cys Asp Asp

50 55 60Ile Ile Cys Asp Asp Gln Glu Leu Asp Cys Pro Asn Pro Glu lle Pro65 70 75 80Phe Gly Glu Cys Cys Ala Val Cys Pro Gln Pro Pro Thr Ala Pro Thr

85 90 95Arg Pro Pro Asn Gly Gln Gly Pro Gln Gly Pro Lys Gly Asp Pro Gly

100 105 110Pro Pro Gly Ile Pro Gly Arg Asn Gly Asp Pro Gly Pro Pro Gly Ser

115 120 125Pro Gly Ser Pro Gly Ser Pro Gly Pro Pro Gly Ile Cys Glu Ser Cys

130 135 140Pro Thr Gly Gly Gln Asn Tyr Ser Pro Gln Tyr Glu Ala Tyr Asp Val145 150 155 160Lys Ser Gly Val Ala Gly Gly Gly Ile Ala Gly Tyr Pro Gly Pro Ala

165 170 175Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Thr Ser Gly His Pro Gly

180 185 190Ala Pro Gly Ala Pro Gly Tyr Gln Gly Pro Pro Gly Glu Pro Gly Gln

195 200 205Ala Gly Pro Ala Gly Pro Pro Gly Pro Pro Gly Ala Ile Gly Pro Ser

245 250 255Pro Gly Phe Pro Gly Met Lys Gly His Arg Gly Phe Asp Gly Arg Asn

260 265 270Gly Glu Lys Gly Glu Thr Gly Ala Pro Gly Leu Lys Gly Glu Asn Gly

275 280 285Val Pro Gly Glu Asn Gly Ala Pro Gly Pro Met Gly Pro Arg Gly Ala

325 330 335Pro Pro Gly Thr Ala Gly Phe Pro Gly Ser Pro Gly Ala Lys Gly Glu

340 345 350Val Gly Pro Ala Gly Ser Pro Gly Ser Ser Gly Ala Pro Gly Gln Arg

355 360 365Gly Glu Pro Gly Pro Gln Gly His Ala Gly Ala Pro Gly Pro Pro Gly

405 410 415Gly Pro Pro Gly Thr Asn Gly Val Pro Gly Gln Arg Gly Ala Ala Gly

420 425 430Glu Pro Gly Lys Asn Gly Ala Lys Gly Asp Pro Gly Pro Arg Gly Glu

435 440 445Arg Gly Glu Ala Gly Ser Pro Gly Ile Ala Gly Pro Lys Gly Glu Asp

485 490 495Asn Gly Leu Pro Gly Glu Lys Gly Pro Pro Gly Asp Arg Gly Gly Pro

500 505 510Gly Pro Ala Gly Pro Arg Gly Val Ala Gly Glu Pro Gly Arg Asp Gly

515 520 525Leu Pro Gly Gly Pro Gly Leu Arg Gly Ile Pro Gly Ser Pro Gly Gly

565 570 575Val Met Gly Phe Pro Gly Pro Lys Gly Asn Asp Gly Ala Pro Gly Lys

580 585 590Asn Gly Glu Arg Gly Gly Pro Gly Gly Pro Gly Pro Gln Gly Pro Ala

595 600 605Gly Lys Asn Gly Glu Thr Gly Pro Gln Gly Pro Pro Gly Pro Thr Gly

645 650 655Gly Glu Pro Gly Pro Lys Gly Glu Ala Gly Ala Pro Gly Ile Pro Gly

660 665 670Gly Lys Gly Asp Ser Gly Ala Pro Gly Glu Arg Gly Pro Pro Gly Ala

675 680 685Gly Gly Pro Pro Gly Pro Arg Gly Gly Ala Gly Pro Pro Gly Pro Glu

725 730 735Pro Gly Pro Lys Gly Asp Lys Gly Glu Pro Gly Ser Ser Gly Val Asp

740 745 750Gly Ala Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro Ile Gly

755 760 765Pro Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Ser Gly Ala

805 810 815Gln Asn Gly Glu Pro Gly Ala Lys Gly Glu Arg Gly Ala Pro Gly Glu

820 825 830Lys Gly Glu Gly Gly Pro Pro Gly Ala Ala Gly Pro Ala Gly Gly Ser

835 840 845Gly Pro Ala Gly Pro Pro Gly Pro Gln Gly Val Lys Gly Glu Arg Gly

885 890 895Gly Ala Pro Gly Lys Asp Gly Pro Pro Gly Pro Pro Gly Ser Asn Gly

900 905 910Ala Pro Gly Ser Pro Gly Ile Ser Gly Pro Lys Gly Asp Ser Gly Pro

915 920 925Pro Gly Glu Arg Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ala Pro

930 935 940Gly Pro Leu Gly Ile Ala Gly Leu Thr Gly Ala Arg Gly Leu Ala Gly945 950 955 960Pro Pro Gly Met Pro Gly Ala Arg Gly Ser Pro Gly Pro Gln Gly Ile

965 970 975Lys Gly Glu Asn Gly Lys Pro Gly Pro Ser Gly Gln Asn Gly Glu Arg

980 985 990Gly Pro Pro Gly Pro Gln Gly Leu Pro Gly Leu Ala Gly Thr Ala Gly

1045 1050 1055Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly Pro

1060 1065 1070Ser Gly Ala Pro Gly Pro Ala Gly Ser Arg Gly Pro Pro Gly Pro Gln

1125 1130 1135Gly Pro Arg Gly Pro Val Gly Pro Ser Gly Pro Pro Gly Lys Asp Gly

1140 1145 1150Ala Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly Asn

1205 1210 1215Ala Pro Tyr Tyr Gly Asp Glu Pro Ile Asp Phe Lys Ile Asn Thr Asn

1220 1225 1230Glu Ile Met Thr Ser Leu Lys Ser ValAsn Gly Gln Ile Glu Ser Leu

1285 1290 1295Glu Thr Gly Glu Thr Cys Ile Ser Ala Ser Pro Leu Thr Ile Pro Gln

1300 1305 1310Lys Asn Trp Trp Thr Asp Ser Gly Ala Glu Lys Lys His Val Trp Phe

1365 1370 1375Ala Tyr Met Asp His Val Ser Gly Asn Val Lys Lys Ala Leu Lys Leu

1380 1385 1390Met Gly Ser Asn Glu Gly Glu Phe Lys Ala Glu Gly Asn Ser Lys Phe

1445 1450 1455Gly Ala Asp Ile Gly Pro Val Cys Phe Leu

1460 1465<210>7<211>4425<212>DNA<213>野猪(sus scrofa)<400>7gaattcaggg acatgttcag ctttgtggac ctccggctcc tgctcctctt agcggccacc 60gccctcctga cgcacggcca agaggagggc caagaagaag gccaacaagg ccaagaagaa 120gacatcccac cagtcacctg cgtacagaac ggcctcaggt accatgaccg agacgtgtgg 180aaacccgtgc cctgccagat ctgtgtctgc gacaacggca atgtgttgtg cgatgacgtg 240atctgcgacg aaatcaagaa ctgtcccagc gccagagtcc ctgcgggcga gtgctgcccc 300gtctgccccg aaggcgaggt gtcacccacc gaccaggaaa ccacgggagt cgagggaccc 360aagggagaca ctggcccccg aggccccagg ggaccctctg gcccccctgg ccgagacggc 420atccctggac aacctggact tcctggaccc cccggacctc ctggaccccc cggaccccct 480ggcctcggag gaaactttgc tccccagttg tcttatggct atgatgagaa gtcagcagga 540atttccgtgc ccggccccat gggtccttct ggtcctcgtg gtctctctgg cccccctggc 600gcacctggtc cccaaggttt ccaaggcccc cctggtgagc ctggcgagcc tggcgcctcc 660ggtcccatgg gtccccgtgg tcctcctggc ccccctggca agaacggaga tgatggtgaa 720gctggaaagc ctggtcgccc tggtgagcgt gggcctcctg gacctcaggg tgctcgggga 780ttgcccggaa cagctggcct ccctggaatg aagggacaca gaggtttcag tggtttggat 840ggtgccaagg gagatgctgg tcctgctggt cccaagggtg agcctggtag ccctggtgaa 900aatggagctc ctggtcagat gggcccccgt ggtctgcctg gtgagcgagg tcgccctgga 960ccccctggcc ctgctggtgc tcgtggaaat gatggtgcta ctggtgctgc tggaccccct 1020ggtcccactg gccccgctgg tcctcctggc ttccctggtg ctgttggtgc taagggtgaa 1080gctggtcccc aaggagcccg aggctctgaa ggtccccagg gtgtgcgtgg tgagcctggc 1140ccccctggcc ctgctggtgc tgctggccct gctggaaacc ctggtgctga tggacagcct 1200ggtggcaaag gtgccaacgg cgctcctggt attgctggtg ctcctggctt ccctggtgcc 1260cgaggcccct ctggacccca gggtcccagc ggcccccctg gtcccaaggg taacagcggt 1320gaacctggtg ctcccggcag caaaggagac actggcgcca agggagagcc cggtcccact 1380ggtgttcaag gaccccctgg ccctgctgga gaagaaggaa agcgaggagc ccgaggtgaa 1440cctggacctg ctggcctgcc tggaccccct ggcgagcgtg gtggacctgg tagccgtggt 1500ttccctggcg ccgatggtgt tgctggtccc aagggtcccg ctggtgaacg tggttctcct 1560ggccctgctg gtcccaaagg ttctcctggt gaagctggtc gccccggtga agctggtctg 1620cctggtgcca agggtctgac tggaagccct ggcagccctg gtcctgatgg caaaactggc 1680ccccctggtc ccgccggtca agatggtcgc cctggacccc caggccctcc tggtgcccgt 1740ggtcaggctg gtgtgatggg tttccctgga cctaaaggtg ctgctggaga gcctggcaaa 1800gctggagagc gaggtgttcc cggaccccct ggcgcagttg gtcctgctgg caaagatgga 1860gaagctggag ctcagggacc ccccggacct gctggccccg ctggtgagag aggagaacaa 1920ggccccgctg gctcccctgg attccagggt ctccctggcc ctgctggtcc tcctggtgaa 1980gcaggcaaac ccggtgaaca gggtgttcct ggagatctcg gtgcccccgg cccctctgga 2040gcaagaggcg agagaggttt ccccggcgag cgtggtgtgc aaggtccccc cggtcctgca 2100ggtccccgtg gagccaacgg tgcccctggc aatgatggtg ctaagggtga tgctggtgcc 2150cctggagccc ctggtagcca gggcgcccct ggccttcagg gaatgcctgg cgaacgaggt 2220gcagctggtc tcccaggtcc taagggtgac agaggagatg ctggtcccaa aggtgctgat 2280ggtgctcctg gcaaagatgg cgtccgtggt ctgactggcc ccattggtcc tcccggcccc 2340gctggtgccc ctggtgacaa gggtgaaact ggtcctagcg gtcctgctgg tcccactgga 2400gctcgtggtg cccccggtga ccgtggtgag cctggtcccc ccggccctgc tggcttcgct 2460ggcccccctg gtgctgatgg ccaacctggt gctaaaggcg aacctggtga tgctggtgct 2520aaaggcgatg ctggtccccc cggccctgct ggacccactg gcccccctgg ccccattggt 2580agcgttggtg ctcccggacc caaaggtgct cgtggcagcg ctggtcctcc tggtgctact 2640ggtttccctg gtgctgctgg ccgagtcggt ccccccggcc cctctggaaa tgctggaccc 2700cctggccctc ctggtcctgc tggcaaagaa ggcagcaaag gtccccgtgg tgagactggc 2760cccgctgggc gtcccggtga agccggtccc cctggccccc ctggccccgc tggtgagaaa 2820ggatcccctg gtgctgacgg acctgctggt gctcccggta ctcctggacc tcagggtatt 2880gctggacagc gtggtgtggt cggcctgccc ggtcaacgag gagaaagagg cttccctggt 2940cttcccggcc catctggtga acccggcaaa caaggtcctt ctggaccaag cggcgaacgt 3000ggcccccctg gtcccatggg cccccctgga ttggctggac cccctggcga gtctggacgt 3060gagggagccc ctggcgctga aggatcccct ggacgagatg gtgctcctgg ccccaagggt 3120gaccgtggtg agagcggccc tgctggaccc cctggtgctc ctggtgctcc tggtgccccc 3180ggccccgttg gccctgctgg caagagcggc gatcgtggtg agactggtcc tgctggtcct 3240gctggtcccg ttggccccgt tggtgcccgt ggccctgctg gaccccaagg cccccgtggt 3300gacaagggtg agacaggcga acagggcgac agaggcatta agggtcaccg tggcttctct 3360ggtctccagg gtccccctgg ccctcccggc tctcctggtg agcaaggtcc ctccggagct 3420tctggtcccg ctggtccccg aggtccccct ggctctgctg gtgctcctgg caaagatgga 3480ctcaacggtc tccccggccc catcggtccc cctgggcctc gtggtcgcac tggtgatgct 3540ggccctgttg gtcctcccgg ccctcctgga ccccccggtc cccctggtcc tcccagcggc 3600ggtttcgact tcagcttctt gccccagcca cctcaagaga aggctcacga tggtggccgc 3660tactaccggg ccgatgatgc caatgtggtc cgcgaccgtg acctcgaggt ggacaccacc 3720ctcaagagcc tgagccagca gatcgagaac atccggagcc ccgaaggcag ccgcaagaac 3780cccgcccgca cctgccgcga cctcaagatg tgccactccg actggaagag cggagaatac 3840tggattgacc ccaaccaagg ctgcaacctg gacgccatca aagtcttctg caacatggag 3900acaggcgaga cctgcgtgta ccccactcag cccagcgtgc cccagaagaa ctggtacatc 3960agcaagaacc ccaaggacaa gaggcacgtc tggtacggcg agagcatgac cgacggattc 4020cagttcgagt acggcggcga gggctccgat cctgctgacg tggccatcca gctgaccttc 4080ctgcgcctga tgtccactga ggcttcccag aacatcacct accactgcaa gaacagcgtg 4140gcctacatgg accagcagac tggcaacctc aagaaggccc tgctcctcca gggctccaac 4200gagatcgaga tccgggccga gggcaacagc cgcttcacct acagcgtgat ctacgacggc 4260tgcacgagtc acaccggagc ctggggcaag acagtgatcg aatacaaaac caccaagacc 4320tcccgcctgc ccatcatcga tgtggccccc ttggacgttg gcgcccccga ccaagaattc 4380ggcatcgacc ttagccctgt ctgcttcctg taaactcctg aattc 4425<210>8<211>1449<212>PRT<213>野猪(sus scrofa)<400>8Met Phe Ser Phe Val Asp Leu Arg Leu Leu Leu Leu Leu Ala Ala Thr1 5 10 15Ala Leu Leu Thr His Gly Gln Glu Glu Gly Gln Glu Glu Gly Gln Gln

20 25 30Gly Gln Glu Glu Asp Ile Pro Pro Val Thr Cys Val Gln Asn Gly Leu

35 40 45Arg Tyr His Asp Arg Asp Val Trp Lys Pro Val Pro Cys Gln Ile Cys

50 55 60Val Cys Asp Asn Gly Asn Val Leu Cys Asp Asp Val Ile Cys Asp Glu65 70 75 80Ile Lys Asn Cys Pro Ser Ala Arg Val Pro Ala Gly Glu Cys Cys Pro

85 90 95Val Cys Pro Glu Gly Glu Val Ser Pro Thr Asp Gln Glu Thr Thr Gly

100 105 110Val Glu Gly Pro Lys Gly Asp Thr Gly Pro Arg Gly Pro Arg Gly Pro

115 120 125Ser Gly Pro Pro Gly Arg Asp Gly Ile Pro Gly Gln Pro Gly Leu Pro

130 135 140Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Leu Gly Gly145 150 155 160Asn Phe Ala Pro Gln Leu Ser Tyr Gly Tyr Asp Glu Lys Ser Ala Gly

165 170 175lle Ser Val Pro Gly Pro Met Gly Pro Ser Gly Pro Arg Gly Leu Ser

180 185 190Gly Pro Pro Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Pro Pro Gly

195 200 205Glu Pro Gly Glu Pro Gly Ala Ser Gly Pro Met Gly Pro Arg Gly Pro

210 215 220Pro Gly Pro Pro Gly Lys Asn Gly Asp Asp Gly Glu Ala Gly Lys Pro225 230 235 240Gly Arg Pro Gly Glu Arg Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly

245 250 255Leu Pro Gly Thr Ala Gly Leu Pro Gly Met Lys Gly His Arg Gly Phe

260 265 270Ser Gly Leu Asp Gly Ala Lys Gly Asp Ala Gly Pro Ala Gly Pro Lys

275 280 285Gly Glu Pro Gly Ser Pro Gly Glu Asn Gly Ala Pro Gly Gln Met Gly

290 295 300Pro Arg Gly Leu Pro Gly Glu Arg Gly Arg Pro Gly Pro Pro Gly Pro305 310 315 320Ala Gly Ala Arg Gly Asn Asp Gly Ala Thr Gly Ala Ala Gly Pro Pro

325 330 335Gly Pro Thr Gly Pro Ala Gly Pro Pro Gly Phe Pro Gly Ala Val Gly

340 345 350Ala Lys Gly Glu Ala Gly Pro Gln Gly Ala Arg Gly Ser Glu Gly Pro

355 360 365Gln Gly Val Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Ala Ala

370 375 380Gly Pro Ala Gly Asn Pro Gly Ala Asp Gly Gln Pro Gly Gly Lys Gly385 390 395 400Ala Asn Gly Ala Pro Gly Ile Ala Gly Ala Pro Gly Phe Pro Gly Ala

405 410 415Arg Gly Pro Ser Gly Pro Gln Gly Pro Ser Gly Pro Pro Gly Pro Lys

420 425 430Gly Asn Ser Gly Glu Pro Gly Ala Pro Gly Ser Lys Gly Asp Thr Gly

435 440 445Ala Lys Gly Glu Pro Gly Pro Thr Gly Val Gln Gly Pro Pro Gly Pro

450 455 460Ala Gly Glu Glu Gly Lys Arg Gly Ala Arg Gly Glu Pro Gly Pro Ala465 470 475 480Gly Leu Pro Gly Pro Pro Gly Glu Arg Gly Gly Pro Gly Ser Arg Gly

485 490 495Phe Pro Gly Ala Asp Gly Val Ala Gly Pro Lys Gly Pro Ala Gly Glu

500 505 510Arg Gly Ser Pro Gly Pro Ala Gly Pro Lys Gly Ser Pro Gly Glu Ala

515 520 525Gly Arg Pro Gly Glu Ala Gly Leu Pro Gly Ala Lys Gly Leu Thr Gly

530 535 540Ser Pro Gly Ser Pro Gly Pro Asp Gly Lys Thr Gly Pro Pro Gly Pro545 550 555 560Ala Gly Gln Asp Gly Arg Pro Gly Pro Pro Gly Pro Pro Gly Ala Arg

565 570 575Gly Gln Ala Gly Val Met Gly Phe Pro Gly Pro Lys Gly Ala Ala Gly

580 585 590Glu Pro Gly Lys Ala Gly Glu Arg Gly Val Pro Gly Pro Pro Gly Ala

595 600 605Val Gly Pro Ala Gly Lys Asp Gly Glu Ala Gly Ala Gln Gly Pro Pro

610 615 620Gly Pro Ala Gly Pro Ala Gly Glu Arg Gly Glu Gln Gly Pro Ala Gly625 630 635 640Ser Pro Gly Phe Gln Gly Leu Pro Gly Pro Ala Gly Pro Pro Gly Glu

645 650 655Ala Gly Lys Pro Gly Glu Gln Gly Val Pro Gly Asp Leu Gly Ala Pro

660 665 670Gly Pro Ser Gly Ala Arg Gly Glu Arg Gly Phe Pro Gly Glu Arg Gly

675 680 685Val Gln Gly Pro Pro Gly Pro Ala Gly Pro Arg Gly Ala Asn Gly Ala

690 695 700Pro Gly Asn Asp Gly Ala Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro705 710 715 720Gly Ser Gln Gly Ala Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly

725 730 735Ala Ala Gly Leu Pro Gly Pro Lys Gly Asp Arg Gly Asp Ala Gly Pro

740 745 750Lys Gly Ala Asp Gly Ala Pro Gly Lys Asp Gly Val Arg Gly Leu Thr

755 760 765Gly Pro Ile Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Asp Lys Gly

770 775 780Glu Thr Gly Pro Ser Gly Pro Ala Gly Pro Thr Gly Ala Arg Gly Ala785 790 795 800Pro Gly Asp Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Phe Ala

805 810 815Gly Pro Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Gly Pro Thr

820 825 830Gly Pro Pro Gly Pro Ile Gly Ser Val Gly Ala Pro Gly Pro Lys Gly

835 840 845Ala Arg Gly Ser Ala Gly Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala

850 855 860Ala Gly Arg Val Gly Pro Pro Gly Pro Ser Gly Asn Ala Gly Pro Pro865 870 875 880Gly Pro Pro Gly Pro Ala Gly Lys Glu Gly Ser Lys Gly Pro Arg Gly

885 890 895Glu Thr Gly Pro Ala Gly Arg Pro Gly Glu Ala Gly Pro Pro Gly Pro

900 905 910Pro Gly Pro Ala Gly Glu Lys Gly Ser Pro Gly Ala Asp Gly Pro Ala

915 920 925Gly Ala Pro Gly Thr Pro Gly Pro Gln Gly Ile Ala Gly Gln Arg Gly

930 935 940Val Val Gly Leu Pro Gly Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu945 950 955 960Pro Gly Pro Ser Gly Glu Pro Gly Lys Gln Gly Pro Ser Gly Pro Ser

965 970 975Gly Glu Arg Gly Pro Pro Gly Pro Met Gly Pro Pro Gly Leu Ala Gly

980 985 990Pro Pro Gly Glu Ser Gly Arg Glu Gly Ala Pro Gly Ala Glu Gly Ser

995 1000 1005Pro Gly Arg Asp Gly Ala Pro Gly Pro Lys Gly Asp Arg Gly Glu Ser1010 1015 1020Gly Pro Ala Gly Pro Pro Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly1025 1030 1035 1040Pro Val Gly Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro

1045 1050 1055Ala Gly Pro Ala Gly Pro Val Gly Pro Val Gly Ala Arg Gly Pro Ala

1060 1065 1070Gly Pro Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Gln Gly

1075 1080 1085Asp Arg Gly Ile Lys Gly His Arg Gly Phe Ser Gly Leu Gln Gly Pro1090 1095 1100Pro Gly Pro Pro Gly Ser Pro Gly Glu Gln Gly Pro Ser Gly Ala Ser1105 1110 1115 1120Gly Pro Ala Gly Pro Arg Gly Pro Pro Gly Ser Ala Gly Ala Pro Gly

1125 1130 1135Lys Asp Gly Leu Asn Gly Leu Pro Gly Pro Ile Gly Pro Pro Gly Pro

1140 1145 1150Arg Gly Arg Thr Gly Asp Ala Gly Pro Val Gly Pro Pro Gly Pro Pro

1155 1160 1165Gly Pro Pro Gly Pro Pro Gly Pro Pro Ser Gly Gly Phe Asp Phe Ser1170 1175 1180Phe Leu Pro Gln Pro Pro Gln Glu Lys Ala His Asp Gly Gly Arg Tyr1185 1190 1195 1200Tyr Arg Ala Asp Asp Ala Asn Val Val Arg Asp Arg Asp Leu Glu Val

1205 1210 1215Asp Thr Thr Leu Lys Ser Leu Ser Gln Gln Ile Glu Asn Ile Arg Ser

1220 1225 1230Pro Glu Gly Ser Arg Lys Asn Pro Ala Arg Thr Cys Arg Asp Leu Lys

1235 1240 1245Met Cys His Ser Asp Trp Lys Ser Gly Glu Tyr Trp Ile Asp Pro Asn1250 1255 1260Gln Gly Cys Asn Leu Asp Ala Ile Lys Val Phe Cys Asn Met Glu Thr1265 1270 1275 1280Gly Glu Thr Cys Val Tyr Pro Thr Gln Pro Ser Val Pro Gln Lys Asn

1285 1290 1295Trp Tyr Ile Ser Lys Asn Pro Lys Asp Lys Arg His Val Trp Tyr Gly

1300 1305 1310Glu Ser Met Thr Asp Gly Phe Gln Phe Glu Tyr Gly Gly Glu Gly Ser

1315 1320 1325Asp Pro Ala Asp Val Ala Ile Gln Leu Thr Phe Leu Arg Leu Met Ser1330 1335 1340Thr Glu Ala Set Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Val Ala1345 1350 1355 1360Tyr Met Asp Gln Gln Thr Gly Asn Leu Lys Lys Ala Leu Leu Leu Gln

1365 1370 1375Gly Ser Asn Glu Ile Glu Ile Arg Ala Glu Gly Asn Ser Arg Phe Thr

1380 1385 1390Tyr Ser Val Ile Tyr Asp Gly Cys Thr Ser His Thr Gly Ala Trp Gly

1395 1400 1405Lys Thr Val Ile Glu Tyr Lys Thr Thr Lys Thr Ser Arg Leu Pro Ile1410 1415 1420Ile Asp Val Ala Pro Leu Asp Val Gly Ala Pro Asp Gln Glu Phe Gly1425 1430 1435 1440Ile Asp Leu Ser Pro Val Cys Phe Leu

1445<210>9<211>4498<212>DNA<213>野猪(sus scrofa)<400>9gaattcaggg acatgctcag ctttgtggat acgcggactt tgttgctgct tgcagtaact 60tcgtgcctag caacatgcca atctttacaa gaggcaactg caagaaaggg cccaactgga 120gatagaggac cacgcggaga aaggggtcca ccaggcccac caggcagaga tggtgatgat 180ggtatcccag gccctcctgg tccacctggt cctcctggcc cccctggtct tggcgggaac 240tttgctgctc agtatgatgg aaaaggagtt ggagctggcc ctggaccaat gggtttgatg 300ggacctaggg gccctcctgg ggcagttgga gcccctggcc ctcaaggttt ccaaggacct 360gctggtgagc ctggcgaacc tggtcagact ggtcctgctg gtgctcgtgg tccacctggc 420cctcctggca aggctggtga ggatggtcac cctggaaaac ccggacgacc tggtgagaga 480ggagttgttg gaccacaggg tgctcgtggt ttccctggaa ctcctggact tcctggcttc 540aagggcatta ggggtcacaa cggtctggat ggattgaagg gacagcccgg tgctccaggt 600gtgaagggcg aacctggtgc ccccggcgaa aatggaactc caggtcaaac aggagctcgc 660gggcttcctg gtgagagagg acgtgtcggt gctcctggcc cagctggtgc ccgtggaaat 720gatggaagtg tgggtcctgt gggtcctgct ggtcccattg ggtctgctgg ccctccaggc 780ttcccaggtg ctcctggccc caagggtgaa cttggacctg ttggtaaccc tggtcctgca 840ggtcctgcgg gtccccgtgg tgaagtgggt cttccaggtg tttctggccc tgttggacct 900cctggcaacc ctggagccaa cggccttcct ggtgctaaag gtgctgctgg cctgcttggt 960gttgctgggg ctcctggcct ccctgggcct cgaggtattc ctggccctgc tggtgctgct 1020ggtgctactg gtgccagagg tcttgttggt gagcctggtc cagctggttc caaaggagag 1080agcggcaaca agggcgagcc tggtgctgct gggccccaag gtcctcctgg tcccagtggt 1140gaagaaggaa agagaggccc caatggagaa gttggatctg ctggcccccc aggacctcct 1200gggctgaggg gaaatcctgg ttctcgtggt ctccctggag ctgatggcag agctggtgtc 1260atgggccctc ctggtagtcg tggtccaact ggccctgctg gtgttcgagg tcccaatgga 1320gattctggtc gccctggaga gcctggcctt atgggacccc gaggtttccc tggatcccct 1380ggaaatgttg gtccagctgg taaagaaggt cctgcgggcc tccctggtat tgatggcagg 1440cctggaccaa ttggcccagc tggagcaaga ggagagcctg gcaacattgg attccctgga 1500cccaaaggcc ccactggtga tcctggcaaa aatggtgaaa aaggtcatgc tggtctggct 1560ggtgctcggg gtgccccagg tcctgatgga aacaatggtg ctcagggacc tcctggacca 1620cagggtgttc aaggtggaaa aggtgaacaa ggtcccgctg gtcctccagg cttccagggt 1680ctccctggcc ccgcaggtac agctggtgaa gttggcaaac caggagaaag gggtatccct 1740ggtgaatttg gtctccctgg tcctgctggt ccaagagggg agcgtggtcc cccaggtgaa 1800agtggtgctg ctggtcctgc tggtcctatt ggaagccgag gtccttctgg acccccgggg 1860cctgatggca acaagggcga acctggtgtg cttggtgctc caggcactgc tggtccatct 1920ggtcctagtg gactcccagg agagaggggt gctgctggca tacctggagg caagggagaa 1980aagggtgaaa ctggtctcag aggtgacgtt ggtagccctg gcagagatgg tgctcgtggt 2040gctcctggtg ctgtaggtgc ccctggtcct gctggagcca atggggaccg gggtgaagct 2100ggccctgctg gccctgctgg ccctgctggt cctcgtggta gtcctggtga acgtggtgag 2160gttggtcctg ctggccccaa tggatttgct ggtcctgctg gtgctgccgg tcaacctggt 2220gctaaaggag agagaggaac caaagggccc aaaggtgaaa atggtcctgt tggtcccaca 2280ggccctgttg gagctgctgg cccagctggt ccaaatggtc ctcctggtcc tgctggcagt 2340cgtggtgatg gcggcccccc tggtgctact ggtttccctg gtgctgctgg acggattggt 2400cctcctggac cttctggtat ctctgggccc cctggacccc ctggtcctgc tgggaaagaa 2460ggacttcgtg ggcctcgtgg tgaccaaggt ccagttggtc gaactggaga aacaggtgca 2520tctggccccc ctggctttgc tggtgagaaa ggtccctctg gagagcctgg tactgctgga 2580cctcctggta ccccaggtcc tcaaggtatt cttggtgctc ctggttttct gggtctccct 2640ggctctagag gtgaacgtgg tctaccaggt gttgctggat cagtgggtga acctggcccc 2700ctcggcattg caggcccacc tggggcccgt ggtccccctg gtgctgtggg taatcctggt 2760gtcaatggtg ctcctggtga agctggtcgt gatggcaacc ctggaagcga tggtccccca 2820ggccgagatg gtcaagctgg acacaagggc gagcgtggtt accctggtaa tcctggtcct 2880gctggtgctg caggagcacc tggtcctcaa ggtgctgtgg gtcccgctgg caaacatgga 2940aaccgtggtg aacctggtcc tgctggttct gttggtcctg ctggtgctgt tggtccaaga 3000ggtcctagtg gcccacaagg tattcgaggt gagaagggag agcctggtga taaggggccc 3060agaggtcttc ctggcttgaa gggacacaac ggattgcaag gtcttcctgg tcttgctggt 3120catcatggtg atcaaggtgc tcctggccct gtgggtcctg ctggtcctag gggtccagct 3180ggtccttctg gccctgctgg caaagatggt cgcactggac aacctggtgc agttggacct 3240gctggcattc gtggctctca aggaagccaa ggtcctgctg gtcctcctgg tcctcctggc 3300cctcctggac cacctggccc aagtggtggt ggttatgatt ttggatatga aggagacttc 3360tacagggctg accagcctcg ctcaccacct tctctcagac ccaaggatta tgaagttgat 3420gctactctga aatctctcaa caaccagatt gagactctac ttactccaga aggctctagg 3480aagaacccag ctcgcacatg ccgtgacttg agactcagcc acccagaatg gagtagtggt 3540tactactgga ttgaccctaa ccaaggatgt actatggatg ctatcaaagt atactgtgat 3600ttctctactg gtgaaacctg cattcgggct caacctgaaa acatcccagc caaaaactgg 3660tacagaaact ccaaggtcaa gaagcacgtc tggttaggag aaactatcaa tggtggtacc 3720cagtttgaat ataatatgga aggagttacc accaaggaaa tggctacaca acttgccttc 3780atgcgcctgc tggccaacca tgcctcccaa aacatcacct accattgcaa gaacagcatt 3840gcatacatgg atgaagagac tggcaacctg aaaaaggctg tcattctgca aggatccaat 3900gatgttgaac ttgttgccga gggcaacagc agattcacct acactgttct tgtagatggc 3960tgttctaaaa aaacaaatga atggagaaaa acaatcattg aatataaaac aaataagcca 4020tctcgcctgc ctatccttga tattgcacct ttggacatcg gtgatgctga ccaagaagtc 4080agtgtggacg ttggcccagt ctgtttcaaa taaatgaact caacctaaat taaagaaaaa 4140ggaaatctga aaaatttctc tctttgccat ttctttttct tctttttaac tgaaagctga 4200atcattccat ttcttctgca catctacttg cttaaattgt gggcaaaaga gaaggagaag 4260gattgatcag agcatcgtgc aatacaatta attcgttccc tgtccctctt cccctcccca 4320aaagatttgg aatttttttc aacattctaa cacctgttgt ggaaaatgtc aacctttgta 4380agaaaaccaa aaataaaaat tgaaaaataa aataaaaacc atgaacattt gcaccacttg 4440tggcttttga atatcttcca cagagggaag tttaaaaccc aaacttccac ctgaattc 4498<210>10<211>1366<212>PRT<213>野猪(sus scrofa)<400>10Met Leu Ser Phe Val Asp Thr Arg Thr Leu Leu Leu Leu Ala Val Thr1 5 10 15Ser Cys Leu Ala Thr Cys Gln Ser Leu Gln Glu Ala Thr Ala Arg Lys

20 25 30Gly Pro Thr Gly Asp Arg Gly Pro Arg Gly Glu Arg Gly Pro Pro Gly

35 40 45Pro Pro Gly Arg Asp Gly Asp Asp Gly Ile Pro Gly Pro Pro Gly Pro

50 55 60Pro Gly Pro Pro Gly Pro Pro Gly Leu Gly Gly Asn Phe Ala Ala Gln65 70 75 80Tyr Asp Gly Lys Gly Val Gly Ala Gly Pro Gly Pro Met Gly Leu Met

85 90 95Gly Pro Arg Gly Pro Pro Gly Ala Val Gly Ala Pro Gly Pro Gln Gly

100 105 110Phe Gln Gly Pro Ala Gly Glu Pro Gly Glu Pro Gly Gln Thr Gly Pro

115 120 125Ala Gly Ala Arg Gly Pro Pro Gly Pro Pro Gly Lys Ala Gly Glu Asp

130 135 140Gly His Pro Gly Lys Pro Gly Arg Pro Gly Glu Arg Gly Val Val Gly145 150 155 160Pro Gln Gly Ala Arg Gly Phe Pro Gly Thr Pro Gly Leu Pro Gly Phe

165 170 175Lys Gly Ile Arg Gly His Asn Gly Leu Asp Gly Leu Lys Gly Gln Pro

180 185 190Gly Ala Pro Gly Val Lys Gly Glu Pro Gly Ala Pro Gly Glu Asn Gly

195 200 205Thr Pro Gly Gln Thr Gly Ala Arg Gly Leu Pro Gly Glu Arg Gly Arg

210 215 220Val Gly Ala Pro Gly Pro Ala Gly Ala Arg Gly Asn Asp Gly Ser Val225 230 235 240Gly Pro Val Gly Pro Ala Gly Pro Ile Gly Ser Ala Gly Pro Pro Gly

245 250 255Phe Pro Gly Ala Pro Gly Pro Lys Gly Glu Leu Gly Pro Val Gly Asn

260 265 270Pro Gly Pro Ala Gly Pro Ala Gly Pro Arg Gly Glu Val Gly Leu Pro

275 280 285Gly Val Ser Gly Pro Val Gly Pro Pro Gly Asn Pro Gly Ala Asn Gly

290 295 300Leu Pro Gly Ala Lys Gly Ala Ala Gly Leu Leu Gly Val Ala Gly Ala305 310 315 320Pro Gly Leu Pro Gly Pro Arg Gly Ile Pro Gly Pro Ala Gly Ala Ala

325 330 335Gly Ala Thr Gly Ala Arg Gly Leu Val Gly Glu Pro Gly Pro Ala Gly

340 345 350Ser Lys Gly Glu Ser Gly Asn Lys Gly Glu Pro Gly Ala Ala Gly Pro

355 360 365Gln Gly Pro Pro Gly Pro Ser Gly Glu Glu Gly Lys Arg Gly Pro Asn

370 375 380Gly Glu Val Gly Ser Ala Gly Pro Pro Gly Pro Pro Gly Leu Arg Gly385 390 395 400Asn Pro Gly Ser Arg Gly Leu Pro Gly Ala Asp Gly Arg Ala Gly Val

405 410 415Met Gly Pro Pro Gly Ser Arg Gly Pro Thr Gly Pro Ala Gly Val Arg

420 425 430Gly Pro Asn Gly Asp Ser Gly Arg Pro Gly Glu Pro Gly Leu Met Gly

435 440 445Pro Arg Gly Phe Pro Gly Ser Pro Gly Asn Val Gly Pro Ala Gly Lys

450 455 460Glu Gly Pro Ala Gly Leu Pro Gly Ile Asp Gly Arg Pro Gly Pro Ile465 470 475 480Gly Pro Ala Gly Ala Arg Gly Glu Pro Gly Asn Ile Gly Phe Pro Gly

485 490 495Pro Lys Gly Pro Thr Gly Asp Pro Gly Lys Asn Gly Glu Lys Gly His

500 505 510Ala Gly Leu Ala Gly Ala Arg Gly Ala Pro Gly Pro Asp Gly Asn Asn

515 520 525Gly Ala Gln Gly Pro Pro Gly Pro Gln Gly Val Gln Gly Gly Lys Gly

530 535 540Glu Gln Gly Pro Ala Gly Pro Pro Gly Phe Gln Gly Leu Pro Gly Pro545 550 555 560Ala Gly Thr Ala Gly Glu Val Gly Lys Pro Gly Glu Arg Gly Ile Pro

565 570 575Gly Glu Phe Gly Leu Pro Gly Pro Ala Gly Pro Arg Gly Glu Arg Gly

580 585 590Pro Pro Gly Glu Ser Gly Ala Ala Gly Pro Ala Gly Pro Ile Gly Ser

595 600 605Arg Gly Pro Ser Gly Pro Pro Gly Pro Asp Gly Asn Lys Gly Glu Pro

610 615 620Gly Val Leu Gly Ala Pro Gly Thr Ala Gly Pro Ser Gly Pro Ser Gly625 630 635 640Leu Pro Gly Glu Arg Gly Ala Ala Gly Ile Pro Gly Gly Lys Gly Glu

645 650 655Lys Gly Glu Thr Gly Leu Arg Gly Asp Val Gly Ser Pro Gly Arg Asp

660 665 670Gly Ala Arg Gly Ala Pro Gly Ala Val Gly Ala Pro Gly Pro Ala Gly

675 680 685Ala Asn Gly Asp Arg Gly Glu Ala Gly Pro Ala Gly Pro Ala Gly Pro

690 695 700Ala Gly Pro Arg Gly Ser Pro Gly Glu Arg Gly Glu Val Gly Pro Ala705 710 715 720Gly Pro Asn Gly Phe Ala Gly Pro Ala Gly Ala Ala Gly Gln Pro Gly

725 730 735Ala Lys Gly Glu Arg Gly Thr Lys Gly Pro Lys Gly Glu Asn Gly Pro

740 745 750Val Gly Pro Thr Gly Pro Val Gly Ala Ala Gly Pro Ala Gly Pro Asn

755 760 765Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Asp Gly Gly Pro Pro Gly

770 775 780Ala Thr Gly Phe Pro Gly Ala Ala Gly Arg Ile Gly Pro Pro Gly Pro785 790 795 800Ser Gly Ile Ser Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Lys Glu

805 810 815Gly Leu Arg Gly Pro Arg Gly Asp Gln Gly Pro Val Gly Arg Thr Gly

820 825 830Glu Thr Gly Ala Ser Gly Pro Pro Gly Phe Ala Gly Glu Lys Gly Pro

835 840 845Ser Gly Glu Pro Gly Thr Ala Gly Pro Pro Gly Thr Pro Gly Pro Gln

850 855 860Gly Ile Leu Gly Ala Pro Gly Phe Leu Gly Leu Pro Gly Ser Arg Gly865 870 875 880Glu Arg Gly Leu Pro Gly Val Ala Gly Ser Val Gly Glu Pro Gly Pro

885 890 895Leu Gly Ile Ala Gly Pro Pro Gly Ala Arg Gly Pro Pro Gly Ala Val

900 905 910Gly Asn Pro Gly Val Asn Gly Ala Pro Gly Glu Ala Gly Arg Asp Gly

915 920 925Asn Pro Gly Ser Asp Gly Pro Pro Gly Arg Asp Gly Gln Ala Gly His

930 935 940Lys Gly Glu Arg Gly Tyr Pro Gly Asn Pro Gly Pro Ala Gly Ala Ala945 950 955 960Gly Ala Pro Gly Pro Gln Gly Ala Val Gly Pro Ala Gly Lys His Gly

965 970 975Asn Arg Gly Glu Pro Gly Pro Ala Gly Ser Val Gly Pro Ala Gly Ala

980 985 990Val Gly Pro Arg Gly Pro Ser Gly Pro Gln Gly Ile Arg Gly Glu Lys

995 1000 1005Gly Glu Pro Gly Asp Lys Gly Pro Arg Gly Leu Pro Gly Leu Lys Gly1010 1015 1020His Asn Gly Leu Gln Gly Leu Pro Gly Leu Ala Gly His His Gly Asp1025 1030 1035 1040Gln Gly Ala Pro Gly Pro Val Gly Pro Ala Gly Pro Arg Gly Pro Ala

1045 1050 1055Gly Pro Ser Gly Pro Ala Gly Lys Asp Gly Arg Thr Gly Gln Pro Gly

1060 1065 1070Ala Val Gly Pro Ala Gly Ile Arg Gly Ser Gln Gly Ser Gln Gly Pro

1075 1080 1085Ala Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Ser1090 1095 1100Gly Gly Gly Tyr Asp Phe Gly Tyr Glu Gly Asp Phe Tyr Arg Ala Asp1105 1110 1115 1120Gln Pro Arg Ser Pro Pro Ser Leu Arg Pro Lys Asp Tyr Glu Val Asp

1125 1130 1135Ala Thr Leu Lys Ser Leu Asn Asn Gln Ile Glu Thr Leu Leu Thr Pro

1140 1145 1150Glu Gly Ser Arg Lys Asn Pro Ala Arg Thr Cys Arg Asp Leu Arg Leu

1155 1160 1165Ser His Pro Glu Trp Ser Ser Gly Tyr Tyr Trp Ile Asp Pro Asn Gln1170 1175 1180Gly Cys Thr Met Asp Ala Ile Lys Val Tyr Cys Asp Phe Ser Thr Gly1185 1190 1195 1200Glu Thr Cys Ile Arg Ala Gln Pro Glu Asn Ile Pro Ala Lys Asn Trp

1205 1210 1215Tyr Arg Asn Ser Lys Val Lys Lys His Val Trp Leu Gly Glu Thr Ile

1220 1225 1230Asn Gly Gly Thr Gln Phe Glu Tyr Asn Met Glu Gly Val Thr Thr Lys

1235 1240 1245Glu Met Ala Thr Gln Leu Ala Phe Met Arg Leu Leu Ala Asn His Ala1250 1255 1260Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Ile Ala Tyr Met Asp1265 1270 1275 1280Glu Glu Thr Gly Asn Leu Lys Lys Ala Val Ile Leu Gln Gly Ser Asn

1285 1290 1295Asp Val Glu Leu Val Ala Glu Gly Asn Ser Arg Phe Thr Tyr Thr Val

1300 1305 1310Leu Val Asp Gly Cys Ser Lys Lys Thr Asn Glu Trp Arg Lys Thr Ile

1315 1320 1325Ile Glu Tyr Lys Thr Asn Lys Pro Ser Arg Leu Pro Ile Leu Asp Ile1330 1335 1340Ala Pro Leu Asp Ile Gly Asp Ala Asp Gln Glu Val Ser Val Asp Val1345 1350 1355 1360Gly Pro Val Cys Phe Lys

1365<210>11<211>4428<212>DNA<213>野猪(sus scrofa)<400>11gaattcaggg acatgatgag ctttgtgcaa aaggggacct ggttactttt tgctctactt 60catcccactg ttattttggc acaacaacag gaagctattg aaggaggatg ctcccatctt 120ggtcagtcct atgcggatag agatgtctgg aagccagaac catgtcaaat atgcgtctgt 180gactcaggat ctgttctctg cgatgatata atatgtgatg atcaagaatt agactgtccc 240aaccctgaga tcccatttgg agaatgttgt gcagtttgtc cacaacctcc aacagctccc 300acccgccctc ccaatggtca tggacctcaa ggccccaagg gagatccagg ccctcctggt 360attcctggga gaaatggaga ccctggtctt ccaggacaac caggttcccc tggttctcct 420gggcctcctg gaatctgtga atcatgccct actggtggcc agaactattc tccccagtat 480gagtcatatg atgtcaaggc tggagtagca ggaggaggaa tcggaggcta tcctgggcca 540gcaggtcccc ctggcccacc tggtccccct ggtgtatctg gtcatcctgg tgcccctggt 600tctccaggat accaagggcc ccctggtgaa cctgggcaag ctggtcctgc aggtcctcca 660gggcctcctg gtgctatagg tccatctggt cctgccggaa aagatgggga gtcaggaaga 720cccggacgac ctggagaacg aggattgcct ggccctccag gtctcaaagg tccagctggc 780atgcctggat tccctggtat gaaagggcat agaggctttg atggacgaaa tggagaaaaa 840ggtgatacag gtgctcctgg gctgaagggt gaaaatggcc ttccaggtga aaatggagct 900cctggaccca tgggtccaag aggggctcct ggtgagcgag gacggccagg acttcctgga 960gctgcagggg ctcgaggtaa tgatggtgcc cgaggaagtg atggacaacc aggtccccct 1020ggtccccctg gaactgcagg attccctggt tcccctggtg ctaagggtga agttggaccc 1080gcgggatctc ctggtccaag tggatcccct ggacaaagag gagaacctgg acctcaggga 1140catgccggtg ctgcaggtcc tcctggccct cctgggagta atggtagtcc tggtggcaaa 1200ggtgaaatgg gtcctgctgg catccctgga gctcctggat tgatgggagc ccgtggtcct 1260ccaggaccac ctggtaccaa tggtgctcct gggcaacgag gtgcagcagg tgaacctggt 1320aaaaatgggg ccaaaggaga gccaggacca cgtggtgaac gtggggaagc tggttctccg 1380ggtattccag gacccaaggg tgaagatggc aaagatggtt ctcctggaga acctggtgca 1440aatggacttc caggagctgc aggagaaagg ggtatgcctg gattccgagg agctcctgga 1500gcaaatggcc ttccaggaga aaagggtccc gctggcgagc gcggtggtcc aggccccgca 1560ggccccagag gagttgccgg agaacctggc cgagatggtg ttcctggagg tccaggattg 1620aggggcatgc ccggtagccc cggaggacca ggcagtgatg ggaaaccagg acctcctgga 1680agtcagggag aaagtggtcg accaggtcct ccaggctcac ctggtccccg aggtcagcct 1740ggagtcatgg gcttccctgg tcctaaagga aatgacggtg ctcctggaaa gaatggagaa 1800agaggtggcc ctggaggtcc cggccttccg ggtcctcctg gaaagaatgg tgagacagga 1860cctcagggtc ccccaggacc tactgggcca ggtggtgaca aaggagacac aggaccccct 1920ggtcaacaag gattacaagg cttgcctgga accagtggtc ctccaggaga aaatggaaaa 1980cctggtgaac ccggcccaaa aggtgaagct ggtgcacctg gaattccagg aggcaagggt 2040gattctggtg cccccggtga acgtggacct cctggtgcag taggtccctc aggacctaga 2100ggtggagctg gcccccctgg tcccgaagga ggaaagggcc ctgctggtcc ccctgggccg 2160cctggtgccg ctggtacacc tggtctgcaa gggatgcctg gagaaagagg aggttctgga 2220ggccccggcc caaagggtga caagggtgac cctggcggtt caggtgctga tggtgctcca 2280ggaaaagatg gtccaagggg tcctactggt cccattggtc cccctggtcc agctggtcag 2340cctggagata agggtgaaag tggtgcccct ggacttcctg gtatagctgg tcctcgtggt 2400ggccctggtg agagaggtga acatgggcca ccaggacctg ccggcttccc tggtgctcct 2460ggccagaacg gtgagcctgg tgccaaagga gaaagaggcg ctcctggtga gaaaggtgaa 2520ggaggacctc ctgggattgc aggacagccc ggaggcactg ggcctcctgg tccccctggt 2580ccccaaggtg tcaaaggtga acgtggcagt cctggtggtc ctggtgctgc tgggttcccc 2640ggtggtcgtg gtcttcctgg tcctcctggc agtaacggta acccaggccc ccctggctcc 2700agtggtcctc caggcaaaga tggtccccca ggtccacctg gtagcagtgg tgctcctggc 2760agccctggag tatctggacc gaaaggtgat gccggtcaac caggtgaaaa aggatcacct 2820ggcccccagg gccctccggg agctccaggc ccaggtggaa tttcagggat tactggagca 2880cgaggtctcg caggcccacc aggcatgcca ggtgctaggg gaagccctgg cccacagggc 2940gtcaagggtg aaaatggaaa accaggacct agtggtctca atggagaacg tggtcctcct 3000ggaccccagg gtcttcctgg tctggctggt gcagctggtg aacctggacg agatggaaac 3060cctggatcag atggtctgcc aggccgagac ggagctcccg gtagcaaggg cgatcgtggt 3120gaaaatggct ctcctggtgc ccctggtgct cctggtcacc caggcccacc tggccctgtt 3180ggtcctgctg gaaagaatgg tgacagagga gaaactggcc ctgctggtcc tgctggtgct 3240ccaggtcctg ctggttcaag aggtgctcct ggtccccaag gcccacgcgg tgacaaaggt 3300gaaaccggtg aacgtggtgc taatggcatc aaaggacatc gaggattccc tggtaatcca 3360ggtgccccag gttctccagg tcccgctggt caccaaggtg cagtaggtag cccaggacct 3420gcaggcccca gaggacctgt tggaccgagt gggccccctg gcaaagatgg agcaagtgga 3480caccctggtc ccattggacc accagggcct cgaggtaaca gaggtgaaag aggatctgag 3540ggctccccag gccatccagg acaaccaggc cctcctggac cccctggtgc ccctggtcca 3600tgttgtggtg gtggggctgc tgccatcgct ggtgttggag gtgaaaaagc tggtggtttt 3660gccccatatt atggagatga accaatggat ttcaaaatca acaccgacga gattatgact 3720tcacttaaat ccgtcaacgg acaaatagaa agcctcatta gtcccgatgg ttctcgtaaa 3780aaccctgctc gtaactgcag agacctaaaa ttctgccatc ctgagctcaa gagcggagaa 3840tattgggttg atcctaacca aggctgcaaa atggatgcta ttaaagtatt ttgtaacatg 3900gaaactgggg aaacatgcat aagtgccagt ccttctactg ttccacgtaa gaactggtgg 3960acagattctg gtgctgagaa gaaatatgtt tggtttggag aatccatgaa tggtggtttt 4020cagtttagct atggcaatcc tgaacttcct gaagatgtcc ttgatgtcca gttggcattc 4080cttcgacttc tctctagccg agcttcccag aacatcacat atcactgcaa gaatagcatt 4140gcgtacatgg aacatgccag tgggaatgta aagaaagcct tgaggctgat gggatcaaat 4200gaaggtgaat tcaaggctga aggaaatagc aaattcacat acaccgttct ggaggatggt 4260tgcactaaac acactgggga atggggcaag acagtcttcg aatatcgaac acgcaaggct 4320gtgagactac ctattgtaga tattgcaccc tatgatattg gtggtcctga tcaagaattt 4380ggtgcggaca ttggccctgt ttgcttttta taaaccaaac ctgaattc 4428<210>12<211>1466<212>PRT<213>野猪(sus scrofa)<400>12Met Met Ser Phe Val Gln Lys Gly Thr Trp Leu Leu Phe Ala Leu Leu1 5 10 15His Pro Thr Val Ile Leu Ala Gln Gln Gln Glu Ala Ile Glu Gly Gly

20 25 30Cys Ser His Leu Gly Gln Ser Tyr Ala Asp Arg Asp Val Trp Lys Pro

35 40 45Glu Pro Cys Gln Ile Cys Val Cys Asp Ser Gly Ser Val Leu Cys Asp

50 55 60Asp Ile Ile Cys Asp Asp Gln Glu Leu Asp Cys Pro Asn Pro Glu Ile65 70 75 80Pro Phe Gly Glu Cys Cys Ala Val Cys Pro Gln Pro Pro Thr Ala Pro

85 90 95Thr Arg Pro Pro Asn Gly His Gly Pro Gln Gly Pro Lys Gly Asp Pro

100 105 110Gly Pro Pro Gly Ile Pro Gly Arg Asn Gly Asp Pro Gly Leu Pro Gly

115 120 125Gln Pro Gly Ser Pro Gly Ser Pro Gly Pro Pro Gly Ile Cys Glu Ser

130 135 140Cys Pro Thr Gly Gly Gln Asn Tyr Ser Pro Gln Tyr Glu Ser Tyr Asp145 150 155 160Val Lys Ala Gly Val Ala Gly Gly Gly Ile Gly Gly Tyr Pro Gly Pro

165 170 175Ala Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Val Ser Gly His Pro

180 185 190Gly Ala Pro Gly Ser Pro Gly Tyr Gln Gly Pro Pro Gly Glu Pro Gly

195 200 205Gln Ala Gly Pro Ala Gly Pro Pro Gly Pro Pro Gly Ala Ile Gly Pro

210 215 220Ser Gly Pro Ala Gly Lys Asp Gly Glu Ser Gly Arg Pro Gly Arg Pro225 230 235 240Gly Glu Arg Gly Leu Pro Gly Pro Pro Gly Leu Lys Gly Pro Ala Gly

245 250 255Met Pro Gly Phe Pro Gly Met Lys Gly His Arg Gly Phe Asp Gly Arg

260 265 270Asn Gly Glu Lys Gly Asp Thr Gly Ala Pro Gly Leu Lys Gly Glu Asn

275 280 285Gly Leu Pro Gly Glu Asn Gly Ala Pro Gly Pro Met Gly Pro Arg Gly

290 295 300Ala Pro Gly Glu Arg Gly Arg Pro Gly Leu Pro Gly Ala Ala Gly Ala305 310 315 320Arg Gly Asn Asp Gly Ala Arg Gly Ser Asp Gly Gln Pro Gly Pro Pro

325 330 335Gly Pro Pro Gly Thr Ala Gly Phe Pro Gly Ser Pro Gly Ala Lys Gly

340 345 350Glu Val Gly Pro Ala Gly Ser Pro Gly Pro Ser Gly Ser Pro Gly Gln

355 360 365Arg Gly Glu Pro Gly Pro Gln Gly His Ala Gly Ala Ala Gly Pro Pro

370 375 380Gly Pro Pro Gly Ser Asn Gly Ser Pro Gly Gly Lys Gly Glu Met Gly385 390 395 400Pro Ala Gly Ile Pro Gly Ala Pro Gly Leu Met Gly Ala Arg Gly Pro

405 410 415Pro Gly Pro Pro Gly Thr Asn Gly Ala Pro Gly Gln Arg Gly Ala Ala

420 425 430Gly Glu Pro Gly Lys Asn Gly Ala Lys Gly Glu Pro Gly Pro Arg Gly

435 440 445Glu Arg Gly Glu Ala Gly Ser Pro Gly Ile Pro Gly Pro Lys Gly Glu

450 455 460Asp Gly Lys Asp Gly Ser Pro Gly Glu Pro Gly Ala Asn Gly Leu Pro465 470 475 480Gly Ala Ala Gly Glu Arg Gly Met Pro Gly Phe Arg Gly Ala Pro Gly

485 490 495Ala Asn Gly Leu Pro Gly Glu Lys Gly Pro Ala Gly Glu Arg Gly Gly

500 505 510Pro Gly Pro Ala Gly Pro Arg Gly Val Ala Gly Glu Pro Gly Arg Asp

515 520 525Gly Val Pro Gly Gly Pro Gly Leu Arg Gly Met Pro Gly Ser Pro Gly

530 535 540Gly Pro Gly Ser Asp Gly Lys Pro Gly Pro Pro Gly Ser Gln Gly Glu545 550 555 560Ser Gly Arg Pro Gly Pro Pro Gly Ser Pro Gly Pro Arg Gly Gln Pro

565 570 575Gly Val Met Gly Phe Pro Gly Pro Lys Gly Asn Asp Gly Ala Pro Gly

580 585 590Lys Asn Gly Glu Arg Gly Gly Pro Gly Gly Pro Gly Leu Pro Gly Pro

595 600 605Pro Gly Lys Asn Gly Glu Thr Gly Pro Gln Gly Pro Pro Gly Pro Thr

610 615 620Gly Pro Gly Gly Asp Lys Gly Asp Thr Gly Pro Pro Gly Gln Gln Gly625 630 635 640Leu Gln Gly Leu Pro Gly Thr Ser Gly Pro Pro Gly Glu Asn Gly Lys

645 650 655Pro Gly Glu Pro Gly Pro Lys Gly Glu Ala Gly Ala Pro Gly Ile Pro

660 665 670Gly Gly Lys Gly Asp Ser Gly Ala Pro Gly Glu Arg Gly Pro Pro Gly

675 680 685Ala Val Gly Pro Ser Gly Pro Arg Gly Gly Ala Gly Pro Pro Gly Pro

690 695 700Glu Gly Gly Lys Gly Pro Ala Gly Pro Pro Gly Pro Pro Gly Ala Ala705 710 715 720Gly Thr Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Gly Ser Gly

725 730 735Gly Pro Gly Pro Lys Gly Asp Lys Gly Asp Pro Gly Gly Ser Gly Ala

740 745 750Asp Gly Ala Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro Ile

755 760 765Gly Pro Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Ser Gly

770 775 780Ala Pro Gly Leu Pro Gly Ile Ala Gly Pro Arg Gly Gly Pro Gly Glu785 790 795 800Arg Gly Glu His Gly Pro Pro Gly Pro Ala Gly Phe Pro Gly Ala Pro

805 810 815Gly Gln Asn Gly Glu Pro Gly Ala Lys Gly Glu Arg Gly Ala Pro Gly

820 825 830Glu Lys Gly Glu Gly Gly Pro Pro Gly Ile Ala Gly Gln Pro Gly Gly

835 840 845Thr Gly Pro Pro Gly Pro Pro Gly Pro Gln Gly Val Lys Gly Glu Arg

850 855 860Gly Ser Pro Gly Gly Pro Gly Ala Ala Gly Phe Pro Gly Gly Arg Gly865 870 875 880Leu Pro Gly Pro Pro Gly Ser Asn Gly Asn Pro Gly Pro Pro Gly Ser

885 890 895Ser Gly Pro Pro Gly Lys Asp Gly Pro Pro Gly Pro Pro Gly Ser Ser

900 905 910Gly Ala Pro Gly Ser Pro Gly Val Ser Gly Pro Lys Gly Asp Ala Gly

915 920 925Gln Pro Gly Glu Lys Gly Ser Pro Gly Pro Gln Gly Pro Pro Gly Ala

930 935 940Pro Gly Pro Gly Gly Ile Ser Gly Ile Thr Gly Ala Arg Gly Leu Ala945 950 955 960Gly Pro Pro Gly Met Pro Gly Ala Arg Gly Ser Pro Gly Pro Gln Gly

965 970 975Val Lys Gly Glu Asn Gly Lys Pro Gly Pro Ser Gly Leu Asn Gly Glu

980 985 990Arg Gly Pro Pro Gly Pro Gln Gly Leu Pro Gly Leu Ala Gly Ala Ala

995 1000 1005Gly Glu Pro Gly Arg Asp Gly Asn Pro Gly Ser Asp Gly Leu Pro Gly1010 1015 1020Arg Asp Gly Ala Pro Gly Ser Lys Gly Asp Arg Gly Glu Asn Gly Ser1025 1030 1035 1040Pro Gly Ala Pro Gly Ala Pro Gly His Pro Gly Pro Pro Gly Pro Val

1045 1050 1055Gly Pro Ala Gly Lys Asn Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly

1060 1065 1070Pro Ala Gly Ala Pro Gly Pro Ala Gly Ser Arg Gly Ala Pro Gly Pro

1075 1080 1085Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Arg Gly Ala Asn1090 1095 1100Gly Ile Lys Gly His Arg Gly Phe Pro Gly Asn Pro Gly Ala Pro Gly1105 1110 1115 1120Ser Pro Gly Pro Ala Gly His Gln Gly Ala Val Gly Ser Pro Gly Pro

1125 1130 1135Ala Gly Pro Arg Gly Pro Val Gly Pro Ser Gly Pro Pro Gly Lys Asp

1140 1145 1150Gly Ala Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly

1155 1160 1165Asn Arg Gly Glu Arg Gly Ser Glu Gly Ser Pro Gly His Pro Gly Gln1170 1175 1180Pro Gly Pro Pro Gly Pro Pro Gly Ala Pro Gly Pro Cys Cys Gly Gly1185 1190 1195 1200Gly Ala Ala Ala Ile Ala Gly Val Gly Gly Glu Lys Ala Gly Gly Phe

1205 1210 1215Ala Pro Tyr Tyr Gly Asp Glu Pro Met Asp Phe Lys Ile Asn Thr Asp

1220 1225 1230Glu Ile Met Thr Ser Leu Lys Ser Val Asn Gly Gln Ile Glu Ser Leu

1235 1240 1245Ile Ser Pro Asp Gly Ser Arg Lys Asn Pro Ala Arg Asn Cys Arg Asp1250 1255 1260Leu Lys Phe Cys His Pro Glu Leu Lys Ser Gly Glu Tyr Trp Val Asp1265 1270 1275 1280Pro Asn Gln Gly Cys Lys Met Asp Ala Ile Lys Val Phe Cys Asn Met

1285 1290 1295Glu Thr Gly Glu Thr Cys Ile Ser Ala Ser Pro Ser Thr Val Pro Arg

1300 1305 1310Lys Asn Trp Trp Thr Asp Ser Gly Ala Glu Lys Lys Tyr Val Trp Phe

1315 1320 1325Gly Glu Ser Met Asn Gly Gly Phe Gln Phe Ser Tyr Gly Asn Pro Glu1330 1335 1340Leu Pro Glu Asp Val Leu Asp Val Gln Leu Ala Phe Leu Arg Leu Leu1345 1350 1355 1360Ser Ser Arg Ala Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Ile

1365 1370 1375Ala Tyr Met Glu His Ala Ser Gly Asn Val Lys Lys Ala Leu Arg Leu

1380 1385 1390Met Gly Ser Asn Glu Gly Glu Phe Lys Ala Glu Gly Asn Ser Lys Phe

1395 1400 1405Thr Tyr Thr Val Leu Glu Asp Gly Cys Thr Lys His Thr Gly Glu Trp1410 1415 1420Gly Lys Thr Val Phe Glu Tyr Arg Thr Arg Lys Ala Val Arg Leu Pro1425 1430 1435 1440Ile Val Asp Ile Ala Pro Tyr Asp Ile Gly Gly Pro Asp Gln Glu Phe

1445 1450 1455Gly Ala Asp Ile Gly Pro Val Cys Phe Leu

1460 1465<210>13<211>20<212>DNA<213>人(homo sapiens)<400>13ccggctcctg ctcctcttag 20<210>14<211>20<212>DNA<213>人(homo sapiens)<400>14gccaggagca ccagcaatac 20<210>15<211>20<212>DNA<213>人(homo sapiens)<400>15gctgatggac agcctggtgc 20<210>16<211>20<212>DNA<213>人(homo sapiens)<400>16gccctggaag accagctgca 20<210>17<211>20<212>DNA<213>人(homo sapiens)<400>17cctggcctta agggaatgcc 20<210>18<211>20<212>DNA<213>人(homo sapiens)<400>18gcgccaggag aaccgtctcg 20<210>19<211>20<212>DNA<213>人(homo sapiens)<400>19ccgaaggttc ccctggacga 20<210>20<211>20<212>DNA<213>人(homo sapiens)<400>20cggtcatgct ctcgccgaac 20<210>21<211>22<212>DNA<213>牛(bos taurus)<400>21ccccagttgt cttacggcta tg 22<210>22<211>22<212>DNA<213>牛(bos taurus)<400>22catagccgta agacaactgg gg 22<210>23<211>19<212>DNA<213>牛(bos taurus)<400>23ggtagccccg gtgaaaatg 19<210>24<211>19<212>DNA<213>牛(bos taurus)<400>24cattttcacc ggggctacc 19<210>25<211>20<212>DNA<213>牛(bos taurus)<400>25gccccaaggg taacagcggt 20<210>26<211>20<212>DNA<213>牛(bos taurus)<400>26accgctgtta cccttggggc 20<210>27<211>22<212>DNA<213>牛(bos taurus)<400>27tcctggccct gctggcccca aa 22<210>28<211>22<212>DNA<213>牛(bos taurus)<400>28tttggggcca gcagggccag ga 22<210>29<211>22<212>DNA<213>牛(bos taurus)<400>29tggacctaaa ggtgctgctg ga 22<210>30<211>22<212>DNA<213>牛(bos taurus)<400>30tccagcagca cctttaggtc ca 22<210>31<211>20<212>DNA<213>牛(bos taurus)<400>31gaacagggtg ttcctggaga 20<210>32<211>20<212>DNA<213>牛(bos taurus)<400>32tctccaggaa caccctgttc 20<210>33<211>18<212>DNA<213>牛(bos taurus)<400>33ggcaaagatg gcgtccgt 18<210>34<211>18<212>DNA<213>牛(bos taurus)<400>34acggacgcca tctttgcc 18<210>35<211>20<212>DNA<213>牛(bos taurus)<400>35gctaaaggcg aacctggcga 20<210>36<211>20<212>DNA<213>牛(bos taurus)<400>36tcgccaggtt cgcctttagc 20<210>37<211>21<212>DNA<213>牛(bos taurus)<400>37gccggcaaga gcggtgatcg t 21<210>38<211>21<212>DNA<213>牛(bos taurus)<400>38acgatcaccg ctcttgccgg c 21<210>39<211>19<212>DNA<213>牛(bos taurus)<400>39cgatggtggc cgctactac 19<210>40<211>19<212>DNA<213>牛(bos taurus)<400>40gtagtagcgg ccaccatcg 19<210>41<211>23<212>DNA<213>牛(bos taurus)<400>41agagcatgac cgaagggcga att 23<210>42<211>23<212>DNA<213>牛(bos taurus)<400>42aattcgccct tcggtcatgc tct 23<210>43<211>39<212>DNA<213>人(homo sapiens)<400>43ttaattccta ggatgttcag ctttgtggac ctccggctc 39<210>44<211>32<212>DNA<213>人(homo sapiens)<400>44tgccactctg actggaagag tggagagtac tg 32<210>45<211>45<212>DNA<213>人(homo sapiens)<400>45ttttcctttt gcggccgctt acaggaagca gacagggcca acgtc 45<210>46<211>30<212>DNA<213>牛(bos taurus)<400>46gtcatggtac ctgaggccgt tctgtacgca 30<210>47<211>29<212>DNA<213>牛(bos taurus)<400>47acgtcatcgc acagcacgtt gccgttgtc 29<210>48<211>34<212>DNA<213>牛(bos taurus)<400>48aggacagtcc ttaagttcgt cgcagatcac gtca 34<210>49<211>26<212>DNA<213>牛(bos taurus)<400>49agggaggcca gctgttccag gcaatc 26<210>50<211>27<212>DNA<213>牛(bos taurus)<400>50ccgaaggttc ccctggacga gatggtt 27<210>51<211>29<212>DNA<213>牛(bos taurus)<400>51cgtggtgaca agggtgagac aggcgaaca 29<210>52<211>27<212>DNA<213>牛(bos taurus)<400>52cgggctgatg atgccaatgt ggtccgt 27<210>53<211>32<212>DNA<213>牛(bos taurus)<400>53aacatggaaa ccggtgagac ctgtgtatac cc 32<210>54<211>25<212>DNA<213>人(homo sapiens)<400>54gacatgatga gctttgtgca aaagg 25<210>55<211>27<212>DNA<213>牛(bos taurus)<400>55tttggtttat aaaaagcaaa cagggcc 27<210>56<211>24<212>DNA<213>人(homo sapiens)<400>56tctcatgtct gatatttaga catg 24<210>57<211>26<212>DNA<213>牛(bos taurus)<400>57ggactaatga ggctttctat ttgtcc 26<210>58<211>24<212>DNA<213>牛(bos taurus)<400>58ggcaccattc ttaccaggct cacc 24<210>59<211>22<212>DNA<213>牛(bos taurus)<400>59tgggtcccgc tggcattcct gg 22<210>60<211>23<212>DNA<213>牛(bos taurus)<400>60ccaggacaac caggccctcc tgg 23<210>61<211>24<212>DNA<213>人(homo sapiens)<400>61gacatgttca gctttgtgga cctc 24<210>62<211>20<212>DNA<213>野猪(sus scrofa)<400>62agtttacagg aagcagacag 20<210>63<211>24<212>DNA<213>人(homo sapiens)<400>63ctacatgtct agggtctaga catg 24<210>64<211>24<212>DNA<213>野猪(sus scrofa)<400>64aggcgccagg ctcgccaggc tcac 24<210>65<211>23<212>DNA<213>野猪(sus scrofa)<400>65agttgtctta tggctatgat gag 23<210>66<211>24<212>DNA<213>人(homo sapiens)<400>66gacatgctca gctttgtgga tacg 24<210>67<211>23<212>DNA<213>野猪(sus scrofa)<400>67agctggacca ggctcaccaa caa 23<210>68<211>24<212>DNA<213>野猪(sus scrofa)<400>68tggtgctaag ggtgctgctg gcct 24<210>69<211>25<212>DNA<213>野猪(sus scrofa)<400>69aggttcaccc actgatccag caaca 25<210>70<211>25<212>DNA<213>野猪(sus scrofa)<400>70tccctctgga gagcctggta ctgct 25<210>71<211>25<212>DNA<213>野猪(sus scrofa)<400>71tggaagtttg ggttttaaac ttccc 25<210>72<211>21<212>DNA<213>人(homo sapiens)<400>72acacaaggag tctgcatgtc t 21

Claims

1.一种分离和纯化的多肽，其特征在于，该多肽含有牛或猪多肽，选自：

(i)α1(I)胶原、α2(I)胶原和α1(III)胶原；和

(ii)(i)的片段和变体。

2.一种分离和纯化的多肽，其特征在于，该多肽是牛α1(I)胶原或其片段或变体。

3.如权利要求2所述的多肽，其特征在于，所述多肽是单链。

4.如权利要求2所述的多肽，其特征在于，所述多肽是同三聚的。

5.如权利要求2所述的多肽，其特征在于，所述多肽是异三聚的。

6.如权利要求2所述的多肽，其特征在于，所述多肽具有SEQ ID NO：2的氨基酸序列或其片段或变体。

7.一种含有权利要求2所述的多肽的组合物。

8.一种分离和纯化的多核苷酸，其特征在于，该多核苷酸编码牛α1(I)胶原或其片段或变体。

9.一种与权利要求8所述的多核苷酸互补的分离和纯化的多核苷酸。

10.一种分离和纯化的多核苷酸，其特征在于，该多核苷酸编码SEQ ID NO：2或其片段或变体。

11.一种含有权利要求8所述的多核苷酸的组合物。

12.一种含有权利要求8所述的多核苷酸的表达载体。

13.一种含有权利要求8所述的多核苷酸的宿主细胞。

14.如权利要求13所述的宿主细胞，其特征在于，所述宿主细胞是原核宿主细胞。

15.如权利要求13所述的宿主细胞，其特征在于，所述宿主细胞是真核宿主细胞。

16.如权利要求13所述的宿主细胞，其特征在于，宿主细胞选自动物细胞、酵母细胞、植物细胞、昆虫细胞和真菌细胞。

17.一种含有权利要求8所述的多核苷酸的转基因动物。

18.一种含有权利要求8所述的多核苷酸的转基因植物。

19.一种产生牛α1(I)胶原的方法，其特征在于，该方法包括：

(a)在适合表达多肽的条件下培养权利要求13所述的宿主细胞；和

(b)从宿主细胞培养物回收多肽。

20.一种重组胶原，其特征在于，该胶原具有SEQ ID NO：2的氨基酸序列或其片段或变体。

21.一种重组明胶，其特征在于，该明胶具有SEQ ID NO：2的氨基酸序列或其片段或变体。

22.一种分离和纯化的多肽，其特征在于，该多肽是牛α1(III)胶原或其片段或变体。

23.一种分离和纯化的多肽，其特征在于，该多肽是猪α1(I)胶原或其片段或变体。

24.一种分离和纯化的多肽，其特征在于，该多肽是猪α2(I)胶原或其片段或变体。

25.一种分离和纯化的多肽，其特征在于，该多肽是猪α1(III)胶原或其片段或变体。

26.一种合成动物胶原的方法，其特征在于，该方法包括：

(a)在允许多核苷酸表达的条件下，在宿主细胞中引入至少一个含有编码动物胶原或前胶原

的多核苷酸序列的表达载体，和至少一个含有编码翻译后酶的多核苷酸序列的表达载体；和

(b)分离动物胶原。

27.如权利要求26所述的方法，其特征在于，所述翻译后酶选自脯氨酰羟化酶、肽基脯氨酰基异构酶、胶原半乳糖苷基羟赖氨酰葡糖苷基转移酶、羟赖氨酰半乳糖苷基转移酶、C-蛋白酶、N-蛋白酶、赖氨酰羟化酶和赖氨酰氧化酶。

28.如权利要求26所述的方法，其特征在于，所述翻译后酶选自与动物胶原的同一物种。

29.如权利要求26所述的方法，其特征在于，所述宿主细胞选自与动物胶原的同一物种。

30.如权利要求26所述的方法，其特征在于，所述细胞不内源性产生胶原。

31.如权利要求26所述的方法，其特征在于，所述细胞不内源性产生翻译后酶。

32.一种宿主细胞，其特征在于，该宿主细胞含有至少一个编码动物胶原的表达载体和至少一个编码翻译后酶的表达载体。

33.一种基本无任何其它类型的单一类型的重组动物胶原。

34.如权利要求33所述的重组动物胶原，其特征在于，单一类型的胶原选自I型、II型、III型、IV型、V型、VI型、VII型、VIII型、IX型、X型、XI型、XII型、XIII型、XV型、XVI型、XVII型、IVIII型、XIX型和XX型胶原。

35.一种产生重组动物明胶的方法，其特征在于，该方法包括：

(a)提供重组的动物胶原；和

(b)从其衍生重组动物明胶。

36.一种产生重组动物明胶的方法，该方法包括直接从改变的动物胶原构建物产生重组动物明胶。