CN1079433C

CN1079433C - 在转基因动物中生产纤维蛋白原

Info

Publication number: CN1079433C
Application number: CN95191945A
Authority: CN
Inventors: 伊恩·加纳; 迈克尔·A·达尔林普尔; 唐娜·E·普伦克德; 唐纳德·C·福斯特
Original assignee: Pharmaceutical Proteins Ltd; Zymogenetics Inc
Current assignee: LFB SA
Priority date: 1994-03-03
Filing date: 1995-03-01
Publication date: 2002-02-20
Anticipated expiration: 2015-03-01
Also published as: DE69534295T2; EP0748386B2; EP0748386B1; HU224550B1; USRE42704E1; NO963651D0; DK0748386T3; DE69534295D1; CZ296382B6; CN1144539A; PL316115A1; ES2245453T5; AU1977095A; CZ257596A3; ATE298801T1; DK0748386T4; WO1995023868A1; FI963419A0; NZ282601A; FI963419A

Abstract

本发明公开了在转基因非人类哺乳动物中生产纤维蛋白原的材料与方法。编码纤维蛋白原Aα，Bβ和γ链的DNA片段导入非人类哺乳动物的种系，该哺乳动物及其雌性后裔生产含有导入的DNA所表达的纤维蛋白原的乳汁。还公开了带有编码异源纤维蛋白原多肽链的DNA片段的非人类哺乳动物胚胎和转基因非人类哺乳动物。

Description

在转基因动物中生产纤维蛋白原

发明背景

血液凝集系列反应的最后一步是由凝血酶催化将可溶性的血浆蛋白纤维蛋白原转化为不溶性的纤维蛋白。凝血酶从纤维蛋白原的三条组成链之一(Aα)上切下一条小肽(纤维蛋白肽A)。随后纤维蛋白发生聚合，并在凝血因子XIII的激活下交联形成稳定的血栓。

纤维蛋白原是生物组织胶的一个关键成分(见U.S.Patent Nos.4,377,572和4,442,655)，生物组织胶能模拟自然血栓的形成，启动止血过程及修复受损组织。组织胶提供缝合线，卡钉以及其它缝合伤口的机械方法的附件或替代品。然而，这些产品的基本组分(纤维蛋白原，因子XIII和凝血酶)是从人的血浆库中通过低温沉淀(例如U.S.Patent Nos.4,377,572；4,362,567；4,909,251)或乙醇沉淀(例如U.S.PatentNos.4,442,655)或者是从单一提供者血浆中(如U.S.Patent No.4,627,879，Spotnitzet al.，Am.Surg.55：166-168，1989)制备的。得到的纤维蛋白原/因子XIII制剂在使用前迅速与牛凝血酶混合，将纤维蛋白原转变成纤维蛋白，并激活因子XIII，由此开始粘合剂的凝聚过程。

市场上可得到的粘合剂来源于血库中的血浆，由于血源产品已伴随有人免疫缺陷病毒(HIV)，肝炎病毒和其它致病原的传播，因此限制了这类粘合剂的可接受性和可得性，现在它们在美国已禁止使用。

使用自体血浆可降低疾病传播的危险，但自体粘合剂仅能使用于有选择的外科手术中，而且患者要预先提供所需的血液。

如上所述，纤维蛋白原由三种多肽链组成，每一种在装配好的分子中以双体存在。这些被命名为Aα，Bβ和γ链的多肽链，在肝脏中协调表达，装配和分泌。尽管可预期重组DNA技术已能提供一种替代方法来代替从血浆中分离纤维蛋白原，这一点已证明是有困难的。三种纤维蛋白原多肽链已分别单独在E.coli中表达(Lord，DNA 4：33-38，1985；Bolyard and Lord，Gene 66：183-192，1988；Bolyard and Lord，Blood 73：1202-1206)，但有功能的纤维蛋白原还没能在真核系统中生产出来。生物感受态纤维蛋白原在酵母中的表达还未见报道。培养的转染的哺乳动物细胞已被用来表达生物感受态纤维蛋白原(Farrell et al.，Blood 74：55a，1989；Hartwig and Danishefsky，J.Biol。Chem.266：6578-6585，1991；Farrell et al.，Biochemistry 30：9414-9420，1991)，但表达水平之低使得生产商业数量的重组纤维蛋白原不具可行性。实验证据说明，与肝脏相比，培养细胞中的较低的转录效率可能是表达水平低的一个原因，但在转染的BHK细胞中增加纤维蛋白原链的mRNA的总量并没有引起纤维蛋白原蛋白分泌的相应增加(Prunkard and Forster，XIV Congress of the International Society on Thrombosisand Haemostasis，1993)。后面的这些结果暗示，纤维蛋白原的正确装配与加工有一些组织特异性的机制，而这些机制在普通的实验条件下的细胞株中并不存在。

现有技术中还需要生产大量的高质量的用于组织粘合剂和其它用途的纤维蛋白原的方法，更需要的是不含血液病原体的纤维蛋白原。本发明满足了这些需要并提供了其它有关的优势。

发明概述

本发明的一个目的是提供商用数量的重组纤维蛋白原，尤其是重组人纤维蛋白原。本发明的另一个目的是提供在转基因动物，特别是家畜，如牛，绵羊，猪和山羊的乳腺组织中表达纤维蛋白原的材料和方法。

一方面，本发明提供了一种生产纤维蛋白原的方法，包括：(a)提供编码与纤维蛋白原Aα链相连接的分泌信号的第一条DNA片段，编码与纤维蛋白原Bβ链相连接的分泌信号的第二条DNA片段，和编码与纤维蛋白原γ链相连接的分泌信号的第三条DNA片段，其中第一、第二、第三条片段中的每一条都与在雌性哺乳动物宿主的乳腺中表达其所需要的附加的DNA片段相连接；(b)将DNA片段导入一个非人类哺乳动物物种的受精卵；(c)将该受精卵植入该物种的雌性动物的输卵管或子宫内，以获得带有该DNA结构的后代；(d)繁殖该后代以产生雌性后裔，来表达第一、第二、第三条DNA片段并生产出含有由这些片段编码的生物感受态纤维蛋白原的乳汁；(e)从这些雌性后裔中收集乳汁；以及(f)从这些乳汁中回收纤维蛋白原。在一个实施方案中，带有导入片段的受精卵在植入之前要培养一段时间。

另一方面，本发明提供了一种生产纤维蛋白原的方法，包括以下步骤：(a)将编码与纤维蛋白原Aα链相连的分泌信号的第一条PNA片段掺入β-乳球蛋白基因，生产出第一个融合基因；(b)将编码与纤维蛋白原Bβ链相连的分泌信号的第二条DNA片段掺入β-乳球蛋白基因，生产出第二个融合基因；(c)将编码与纤维蛋白原γ链相连的分泌信号的第三条DNA片段掺入β-乳球蛋白基因，生产出第三个融合基因；(d)将第一、第二、第三个融合基因导入-非人类哺乳动物的种系，使得该DNA片段在该动物或其雌性后裔的乳腺中表达，并且生物感受态纤维蛋白原分泌到该哺乳动物或其雌性后裔的乳汁中；(e)从该哺乳动物或其雌性后裔中获取乳汁；以及(f)从乳汁中回收纤维蛋白原。在优选的实施方案中，哺乳动物是绵羊、猪、山羊或牛。

另一方面，本发明提供了一种生产纤维蛋白原的方法包括以下步骤：(a)提供一种非人类的转基因雌性哺乳动物，在其种系中带有编码纤维蛋白原Aα，Bβ及γ链的异源DNA片段，其中的DNA片段在该哺乳动物的乳腺中表达而该DNA片段所编码的纤维蛋白原被分泌到该哺乳动物的乳汁中；(b)从该哺乳动物中收集乳汁；(c)从乳汁中回收纤维蛋白原。

另一方面，本发明提供了一种非人类的哺乳动物的胚胎，在其细胞核中含有编码纤维蛋白原Aα，Bβ及γ链的外源DNA片段。在一个相关的方面，本发明提供了一种转基因的非人类雌性哺乳动物，它在乳汁中生产可回收量的人纤维蛋白原。

另一方面，本发明提供了一种生产哺乳动物的转基因后代的方法，它包括以下步骤：(a)提供编码纤维蛋白原Aα链的第一条DNA片段，编码纤维蛋白原Bβ链的第二条DNA片段，以及编码纤维蛋白原γ链的第三条DNA片段，其中所说的第一，第二和第三条DNA片段中的每一条都连接有附加的DNA片段，以满足使其在宿主雌性哺乳动物的乳腺中表达及分泌到宿主雌性哺乳动物乳汁中的要求；(b)将该DNA片段导入非人类哺乳动物的一个受精卵中；(c)将受精卵植入雌性非人类种属动物的输卵管或子宫内，以获得带有第一、第二和第三个DNA片段的后代。在一个相关的方面，本发明提供根据该程序生产的非人类哺乳动物。

另一方面，本发明提供了带有编码异源纤维蛋白原Aα，Bβ及γ链的种系DNA片段的非人类哺乳动物，其中该哺乳动物的雌性后裔在其乳腺中表达这些DNA片段来生产生物感受态纤维蛋白原。

参考以下的详细说明及附图后，本领域熟练技术人员将会明白本发明的这些方面及其它方面。

附图简述

图1阐述人纤维蛋白原Aα链DNA序列的亚克隆。

图2是载体Zem228的部分限制性图谱。所用的符号MT-1p代表鼠金属硫蛋白启动子；SV40t代表SV40终止子；以及SV40p代表SV40启动子。

图3阐述人纤维蛋白原Bβ链DNA序列的亚克隆。

图4阐述人纤维蛋白原γ链DNA序列的亚克隆。

图5是载体Zem219b的部分限制性图谱。使用的符号MT-1P代表鼠金属硫蛋白启动子；hGHt代表人生长激素终止子；SV40p代表SV40启动子；DHFR代表二氢叶酸还原酶基因；以及SV40t代表SV40终止子。

本发明的详细描述

在开始本发明的详述之前，定义一些用于本文的术语将会有所帮助：

用于本文时，术语“生物感受态纤维蛋白原”用来指当用凝血酶处理时能发生聚合形成不溶性纤维蛋白的纤维蛋白原。

术语“卵”用来指未受精的卵细胞、在原核融合以前已受精的卵细胞或早期胚胎(具有融合原核的受精卵细胞)。

“生产含有生物感受态纤维蛋白原的乳汁的雌性哺乳动物”是一个在怀孕与分娩后，在哺乳期间，生产含有可回收量的生物感受态纤维蛋白原的乳汁的动物。本领域熟练技术人员能认识到这些动物断断续续地产奶，因而断断续续地生产纤维蛋白原。

术语“后裔”用的即是其一般含义，包括子女及后代。

术语“异源的”用来指其来源与其所导人的动物物种不同的遗传物质，或者是从这些遗传物质中生产出来的蛋白质。

在本发明中，转基因动物技术被运用来在宿主雌性哺乳动物的乳腺中生产纤维蛋白原。所感兴趣的蛋白在乳腺中的表达及随后向乳汁中的分泌克服了在用其它途径分离蛋白质时所遇到的许多困难。乳汁很容易被收集，并可大量得到，而且能很好地进行生物化学鉴定，另外，存在于乳汁中的主要蛋白质的浓度很高(从约1g/L到15g/L)。

从商业观点来看，很清楚优选的是使用那些产奶量大的物种作为宿主。虽然较小的动物如小鼠和大鼠也可以使用(而且优选的是使用于验证概念阶段)，在本发明中优选的是使用家畜，包括但并非限于使用猪、山羊、绵羊和牛。绵羊是特别优选的，这是基于如下因素如在该物种中有转基因的历史，产乳量，费用及收集绵羊奶的设备的易得性。影响宿主物种的选择的因素的比较见WO88/00239。通常的愿望是选择已作为日常用途喂养的动物来繁殖，例如East.Friesland绵羊，或者是通过将转基因系喂养一段时间导人日常的家系。无论怎样，应该使用熟悉的，具有良好健康状况的动物。

根据本发明生产的纤维蛋白原可以是人纤维蛋白原或非人类动物的纤维蛋白原。作为药用的话，优选的是应用对患者来说是天然的蛋白质，因此本发明提供了在人类和畜类药物中都可使用的纤维蛋白原。编码人纤维蛋白原的成分链的克隆的DNA分子是由这些人描述的：Rixon et al.(Diochem.22：3237，1983)，Chung et al.(Biochem.22：3244，1983)，Chung et al.(Biochem.22：3250，1983)，Chung et al.(Adv.Exp.Med.Biol.281：39-48，1990)以及Chung et al.(Ann.NY Acad.Sci.408：449-456，1983)。牛纤维蛋白原的克隆由Brown et al.(Nuc.Acad.Res.17：6397，1989)和Chung etal.(Proc.Natl.Acad.Sci.USA 78：1466-1470，1981)描述，其它的哺乳动物纤维蛋白原由Murakawa et al.(Thromb.Haemost.69：351-360，1993)描述。人类Aα，Bβ和γ链基因的代表性序列分别显示于SEQ ID NOS：1，3和5。那些熟练技术人员将明白这些序列的等位变异体将是存在的；另外的突变体可以通过氨基酸的置换、缺失或插入产生；而且这样的变异体在本发明中是有用的。一般地，优选的是那些包括仅仅有限数目的氨基酸置换、缺失或插入的工程变异体，并且任何置换都是保守性的，因此优选的方案是生产在序列上与相应的天然链至少有90％，较好的是至少95％，更好的是有至少99％或更多同一性的纤维蛋白原链多肽。术语“γ链”指的是包括纤维蛋白原的替代性拼接的γ’链(Chung et al.，Biochem.23：4232-4236，1984)。人类γ’链的氨基酸序列显示于SEQ ID NO：6。较短的γ链是由SEQ ID NO：5的9511位和10054位核苷酸之间的替代性拼接而产生的，因而翻译终止于SEQ ID NO：5中的10065位核苷酸之后。

为获得在乳腺中的表达，使用了一种来源于乳蛋白基因的转录启动子。乳蛋白基因包括那些编码酪蛋白，β-乳球蛋白(BLG)，乳清蛋白，以及乳清酸性蛋白的基因。β-乳球蛋白启动子是优选的。若是羊β-乳球蛋白基因，羊BLG基因5’侧序列的至少约406bp(包括在SEQ ID NO：7的核苷酸3844-4257中)的区域将通常被用到。优选的是更大部分的5’侧序列，直到大约5Kbp。一条更大的DNA片段，包括5’侧启动子区域及β-乳球蛋白基因的5’非编码区域(包括在SEQ ID NO：7的核苷酸1-4257)是特别优选的。见Whitelaw et al.，Biochem.J.286：31-39，1992。来自于其它种属的类似的启动子DNA片段也是适用的。

β-乳球蛋白基因的其它区域也能掺入到结构中，正如待表达的基因的基因组区域。现有技术中通常接受的是失去了内含子的结构，例如，与那些含有这样的DNA序列的相比，其表达性很差(见Brinster et al.，Proc.Natl.Acad.Sci.USA.85：836-840，1988；Palmiter et al.，Proc.Natl.Acad.Sci.USA.88：478-482，1991；Whitelawet al..Transgenic Res.1：3-13，1991；WO 89/01343；WO 91/02318)。在这一点上，通常优选的方案是，在可能时，使用含有所有或一些编码所感兴趣的蛋白质或多肽的基因中的天然内含子的基因组序列。在本发明的某些实施例中，优选方案是还包括至少一些来自于β-乳球蛋白基因的内含子。一个这样的区域是一条提供内含子拼接及RNA多腺苷酸化的、来自于羊β-乳球蛋白基因的3’非编码区的DNA片段。当用一个基因的天然3’非编码区取代时，这一羊β-乳球蛋白片段同时能增强与稳定感兴趣的蛋白质或多肽的表达水平。在其它的实施方案中，一个或多个纤维蛋白原序列的起始ATG附近的区域被替换成来自于乳汁特异性蛋白基因的相应的序列。这样的替换提供了所推想的组织特异性起始环境以增强表达。很容易将全部的纤维蛋白原链的前原和5’非编码区序列置换为那些例如BLG基因的相应序列，尽管较小的区域也能被置换。

为了表达纤维蛋白原，编码纤维蛋白原的三种组分多肽链的每个DNA片段都连接有其表达所需的附加的DNA片段。这些附加的片段包括以上所提到过的乳类蛋白基因启动子，还有提供转录终止和mRNA多腺苷酸化的序列。表达单位还包括与编码纤维蛋白原多肽链的片段相连接的编码分泌信号的DNA片段。分泌信号可能是天然的纤维蛋白原分泌信号也可能是另一种蛋白，例如一种乳蛋白的信号肽。术语“分泌信号”用于此处指的是一个蛋白质中指导其穿过细胞的分泌途径到外面的部分。分泌信号最常见的是在蛋白质的N-端。例如，可见von Heinje.Nuc.Acids Res.14：4683-4690，1986；和meadeet al.，U.S.Patent No.4,873,316中所述。

表达单位的构建很容易通过将纤维蛋白原链序列插入到一个质粒或噬菌体载体中来实现，这些载体中含有附加的DNA片段；当然表达单位也能通过基本的任一序列的连接反应来构建。尤其便利的是提供一个含有编码乳蛋白的DNA片段的载体，并将编码乳蛋白的序列置换成编码一条纤维蛋白原链(包括分泌信号)的序列，因此产生一个包括有乳蛋白基因的表达调控序列的基因融合体。无论如何，表达单位在质粒或其它载体中的克隆方便了纤维蛋白原序列的扩增。扩增很容易在细菌(如E.coli)宿主细胞中进行，这样典型的载体将包括一个在细菌宿主细胞中的复制原点和一个选择性标记。

考虑到纤维蛋白原链基因的大小最为实际的是制备三种分离的表达单位，将其混合，并将混合物导入宿主中。然而，本领域熟练技术人员会明白其它的程序也是可行的。例如，三条链的表达单位可以单个分别导入不同的胚胎，随后通过繁殖使之结合。在第三种方法中，三个表达单位可以连接在一个合适的载体中，如酵母人工染色体或噬菌体P1克隆。两条或三条链的编码序列可以结合在多顺反子表达单位中(见Levinson etal.，U.S.Patent No.4,713,339)。

然后，表达单位被导入所选择的宿主的受精卵(包括早期胚胎)中。异源基因的导入可以通过几条途径之一而完成，包括显微注射(如U.S.Patent No.4,873,191)，反转录病毒感染(Jaenisch，Science 240：1468-1474，1988)或使用胚胎干细胞(ES)的定点整合(Bradly et al.，Bio/Technology 10：534-539，1992)。该受精卵然后被植入假孕雌性动物的输卵管或子宫内并让其继续发育。在其种系中带有导入的DNA的后代可以通过正常的孟德尔遗传方式将该DNA传给其后裔，并发展成转基因种群。制造转基因动物的一般方法是现有技术中已知的。如可见以下所引的参考文献：Hogan et al.，Manipulating the Mouse Embryo：ALaboratory Manual，Cold Spring Harbor Laboratory，1986；Simons et al.，Bio/Technology 6：179-183，1988；Wall et al.，Biol.Repord.32：645-651，1985；Buhler et al.，Bio/Technology 8：140-143，1990；Ebert et al.，Bio/Technology 9：835-838，1991；Krimpenfort et al.，Bio/Technology 9：844-847，1991；Wall et al.，J.Cell.Biochem.49：113-120，1992；以及WIPO出版物WO 88/00239，WO 90/05188，WO 92/11757；以及GB 87/00458。将外源DNA导入哺乳动物及其生殖细胞的技术最初是在小鼠中发展起来的。见Gordon et al.，Proc.Natl.Acad.Sci.USA77：7380-7384，1980；Gordon and Ruddle，Science 214：1244-1246，1981；Palmiter andBrinster，Cell 41：343-345，1985；Brinster et al.，Proc.Natl.Acad.Sci.USA82：4438-4442，1985；and Hogan et al.，(ibid.)。这些技术后来也适用于较大的动物，包括家畜(见WIPO出版物WO 88/00239，WO 90/05188，WO 92/11757；以及Simons et al.，Bio/Technology 6：179-183，1988)。概括地说，到目前为止，已在转基因小鼠和家畜的生产中，用最有效的方法，将数以百计的感兴趣的线性DNA分子注射进受精卵的原核中。将该DNA注入受精卵的细胞质中也是可行的。

优选方案是获得每条纤维蛋白原链的平衡表达，使得成熟蛋白质的形成较有效。理想的是，三个表达单位应该在导入受精卵的同一个DNA分子中。然而，这种方法会产生一些技术上的难题，例如在注射和操作阶段。比如，纤维蛋白原表达单位的大小使得必须在注射前使用酵母人工染色体(YACs)或噬菌体P1来扩增和操作DNA。若按此方法进行，待注射的含有所有三个表达单位的DNA片段将会非常巨大，因此要求将注射方法作一些修改，如使用更大号的针头。在一个较为简单的方法中，使用的是各种单个表达单位的混合物。优选方案是结合等摩尔量的三种表达单位，虽然本领域熟练技术人员会明白这种比例可以根据所给的表达单位的性质而作一些改变。当使用较少摩尔数的一种或两种链时，也能得到某种程度的表达，但一般说来其水平会降低。通常可以预期的是若以偏离优选的等摩尔比例的比例进行，其表达效率将会下降。不管怎样，优选的方案是使用一种混合物，其中Aα∶Bβ∶γ表达单位的比例在0.5-1∶0.5-1∶0.5-1范围之内。若将其比例从等摩尔状态改变，优选的是使用相对多一些的Bβ表达单位。另外，一个表达单位或是两种表达单位的混合物也可导入单独的卵中，当然，由此而来的动物将只表达一条或两条纤维蛋白原链。要用这种方法产生完整的纤维蛋白原分子就要求随后进行一个繁殖过程，以结合存在于一群动物的个体中的所有三种表达单位。

一般地，雌性动物要用促滤泡激素处理使之超数排卵，然后交配。收集受精卵，然后用已知方法将异源DNA注射进入卵中。可见以下所引用的文献：U.S.Patent No.4,873,191；Gordon et al.，Proc.Natl.Acad.Sci.USA 77：7380-7384，1980；Gordonand Ruddle，Science 214：1244-1246，1981；Palmiter and Brinster，Cell 41：343-345，1985；Brinster et al.，Proc.Natl.Acad.Sci.USA 82：4438-4442，1985；Hogan etal.，Manipulating the Mouse Embryo：A Laboratory Manual，Cold Spring HarborLaboratory，1986；Simons et al.，Bio/Technology 6：179-183，1988；Wall et al.，Biol.Repord.32：645-651，1985；Buhler et al.，Bio/Technology 8：140-143，1990；Ebert et al.，Bio/Technology 9：835-838，1991；Krimpenfort et al.，Bio/Technology9：844-847，1991；Wall et al.，J.Cell.Biochem.49：113-120，1992；以及WIPO出版物WO 88/00239，WO 90/05188，WO 92/11757；以及GB 87/00458。

为了注射进入受精卵中，要用合适的限制性酶消化将表达单位从其各自的载体中切下。为了方便起见，优选的方案是设计的载体使得切下表达单位的酶不会在表达单位内部或载体上别的地方有切割位点。表达单位通过传统方法回收，例如电泳洗脱，随后用酚抽提，用乙醇沉淀，以及蔗糖密度梯度离心，或结合使用这些方法。

DNA注射到卵中，基本上是按照上述Hogan et al.的方法。在一次典型的注射中，使用体视可调焦显微镜(优选×50或×63)，将在一个装有胚胎培养基的盘子中的卵子固定。合适的培养基包括Hepes(N-2-羟乙基哌嗪-N’-2-乙磺酸)或碳酸氢盐缓冲培养基如M2或N16(可购自Sigma Chemical Co.，St.Louis，USA)或合成的输卵管培养基(见下述)。使用一个用毛细管做的drummond吸管将卵固定并转移到注射装置上的玻璃载片的中央。在此步骤时，使用低倍镜(×4)观察。使用注射装置上的吸管将卵子定位于载玻片的中心。单个的卵随后被固定到吸管上以备注射。每一次注射，吸管/卵都要定位于视野的中心。然后将注射针头定位于卵的正下方。最好使用×40倍的Nomarski目镜，两个操作台的高度调节到使卵和针头同时聚焦。通过旋转卵和调节吸管，将原核定位。一旦原核被定位后，调节操作台的高度使其聚焦于原核膜。注射器针头位于卵的下方并使针尖正好处于原核中心下面的位置。然后使用注射操作装置调整针头的位置，使针头和原核进入同一个聚焦平面。通过注射操作装置上的操纵杆(joy stick)移动针头到卵的右方。用一个短的连续穿刺动作，将原核膜刺穿并使针尖留在原核内。通过玻璃针筒给注射针头加压，直到原核膨胀到接近原来体积的两倍。此时，缓慢地移走针头，转回到低倍镜(如×4)，将注射过的卵移到玻璃片上的不同的区域，并对另一只卵重复该程序。

DNA注射完毕之后，培养该卵细胞使原核融合，生产一单细胞胚胎或较晚期胚胎。一般地，卵的培养在该种的体温下并在含有平衡的盐和血清的缓冲培养基中进行。然后将活的胚胎转移进假孕的受体雌性动物中，典型的做法是将其植入输卵管或子宫，使之发育。在胚胎发生过程中，注射的DNA将以随机方式整合到少数发育胚胎的染色体中。

潜在的转基因后代通过血样和/或组织活体解剖进行筛选。从这些样品中制备出DNA并检查注入的结构的存在，可利用诸如聚合酶链式反应(PCR，见Mullis，U.S.Patent No.4,683,202)和Southern印迹(Southern，J.Mol.Biol.98：503，1975；Maniatis etal.，Molecular Cloning：A Laboratory Manual，Cold Spring Harbor Laboratory，1982)等技术。“建立者(founder)”转基因动物，或称G0s，可以是完全转基因的，即在其所有细胞中都有转基因；也可以是部分的，只在某一类细胞中有转入的基因(见Wilkieet al.，Develop.Biol.118：9-18，1986)。在后一种情况下，生殖细胞集团中可能是全部的或部分的转基因的。而且，在后一种情况下，实际所得到的“建立者”的后代中的转基因后代的比例还不足根据孟德尔定律预测值的50％。“建立者” G0动物生长到性成熟期后，进行交配，得到后代，或称Gls。Gls同样检查转基因的存在，确定其是否从“建立者”G0动物中传了下来。若是雄性G0s，可使其与数个未转基因的雌性交配，以产生大量后代，此举增加了发现转基因传递的机会。雌性“建立者”G0可以通过自然交配、人工授精或超数排卵得到许多卵子并转移给代理母亲。后一种方法给出了在那些产仔量少的动物中观察到转基因传递的最好的机会。上述的繁殖程序被用来获得能将DNA以正常的孟德尔方式遗传给后代的动物，并使其发展成转基因动物的种群(小鼠、绵羊、猪、山羊、牛)。

从哺乳期的G0和G1雌性动物中得到的乳汁要进行异源蛋白的检查，依靠使用免疫技术如ECLISA(见Harlow and Lane，A Laboratory Manual，Cold Spring HarborLaboratory，1988)以及Western印迹 (见Towbin et aL.，Procc.Natl.Acad.Sci.USA 76：4354，1979)。由于在现有技术中公知的各种原因，异源蛋白的表达水平在不同的个体之间将是不同的。

一个令人满意的动物家族应该满足三个标准：它们应来源于同一个建立者G0动物；它们应该表现出稳定的转基因的传递；而且它们在代与代之间及个体动物的每次产乳期之间应该表现出稳定的表达水平。这些原则已经确定并讨论过(Carver et al.，Bio/Technology 11：1263-1270，1993)。来自于这样的一个合适的家族的动物可被称之为一个“系”。最初，雄性动物G0或G1，被用来通过自然地或人工受精繁殖出一群生产者动物。以这种方式，可以迅速产生许多带有相同的整合的转基因的雌性动物，从中可以得到乳汁供应。

纤维蛋白原从乳汁中的回收使用标准的做法，诸如：脱脂、沉淀、过滤以及蛋白质层析技术。

根据本发明生产的纤维蛋白原适用于人类及畜类医药，例如用于配制外科中的粘合剂。这种粘合剂是现有技术中公知的。如可见引用的文献U.S.Patent No.4,377,572；4,442,655；4,462,567；以及4,627,879。一般地，将纤维蛋白原与因子XIII结合形成第一种成分，在使用之前与含有凝血酶的第二种成分混合。凝血酶使纤维蛋白原转变成纤维蛋白，使混合物成为胶状，并激活因子XIII。激活的因子XIII使纤维蛋白交联，强化并稳定粘合剂基质。这样的典型的粘合剂中，含有大约30mg/ml-100mg/ml的纤维蛋白原与大约50μg/ml-500μg/ml的因子XIII。它们还可能含有其它成分，例如aprotinin，乳清蛋白，纤联蛋白，膨化剂以及溶剂。生产因子XIII的方法是现有技术中公知的。如可见U.S.Patent No.5,204,447。纤维蛋白原还可以用来包被聚合物如合成血管移植物的表面，如U.S.Patent No.5,272,074.(列于此处参考)所述。

通过下列的非限制性实施例对本发明做进一步的阐述。

实施例1

去掉载体pUC18(Yanisch-Perron et al.，Gene 33：103-119，1985)上的多克隆位点，置换成一条合成的双链寡核苷酸(链显示于SEQ ID NO：8和SEQ ID NO：27中)，该链含有限制性切点PvuI/MluI/Eco RV/XbaI/PvuI/MluI，并在5’端加有与Eco RI和HindIII配对的接头。pUC18用EcoRI和HindIII双酶切，其5’磷酸基团用牛胰磷酸酶除去，将寡核苷酸链连接到载体骨架中。做序列测定确定跨过连接区域的序列正确无误，新的质粒叫做pUCPM。

从pSSltgXS(WIPO出版物WO 88/00239中公开)上切下β-乳球蛋白(BLG)基因SalI-XbaI片段，克隆到用SalI和XbaI酶切过的载体pUCPM中构建载体pUCXS。因此pUCXS是pUC18的一个衍生质粒，含有完整的BLG基因，该基因来自于噬菌体SS1(Ali and Clark，J.Mol.Biol.199：415-426，1988)上的从SalI位点到XbaI位点的片段。

质粒pSStgSE(WIPO出版物WO 88/00239中公开)含有一个1290bp的BLG片段，其两侧有SphI和EcoRI限制位点、一段跨过单一位点NotI的区域及一个位于BLG mRNA的5’非翻译引导区的PvuII位点。在此PvuII位点上连接有一个双链的8bp的DNA连接序列(5’-GGATATCC-3’)，构成Eco RV的识别位点。这个质粒称做pSS1SE/RV。pSS1SE/RV中SphI和EcoRV间的DNA序列被酶切下来，并被用来置换pUCXS中的等价片段。得到的质粒称做pUCXSRV。插入到pUCXSRV中的BLG的序列显示于SEQ ID NO：7，在BLG基因的5’非翻译引导区的4245位核苷酸上有一个EcoRV的单一酶切位点。该位点允许插入一些在BLG启动子控制下的转录起始位点3’端的任何附加的DNA序列。

使用引物BLGAMP3(5’-TGG ATC CCC TGC CGG TGC CTC TGG-3’；SEQ ID NO：9)和BLGAMP4(5’-AAC GCG TCA TCC TCT GTG AGC CAG-3’；SEQ ID NO：10)，从pUCXSRV中的BLG基因的终止密码子的3’端的序列中生产出接近650bp的一个PCR片段。该PCR片段利用工程技术在5’端加有一个BamHI位点，在3’端加有一个MluI位点，并被克隆进BamHI和MluI切过的pGEM7zf(+)(Promega)构成pDAM 200(+)。

pUCXSRV用KpnI消化，最大的含有载体的条带用凝胶纯化。该条带含有全部的pUC质粒序列以及一些BLG基因上的3’非编码区序列。在此骨架中连接上一个来自pDAM200(+)的小的KpnI片段；后者在2.6Kbp的BLG3’侧区域的5’末端利用工程技术以正确的方向产生了一个BamHI位点。该质粒称做pBLAC200。从pBLAC200得到的2.6Kbp的ClaI-XbaI片段连接到ClaI-XbaI酶切的pSP72载体(Promega)中，由此在BLG序列的上游置入一EcoRV位点，此质粒称为pBLAC210。

从pBLAC210上得到的2.6Kbp的Eco RV-XbaI片段连接到Eco RV-XbaI酶切的pUCXSRV上，形成pMAD6。此时，从pUCXSRV上切下了所有编码序列和内含子序列，形成了由4.3Kbp的5’启动子和侧翼有单一EcoRV位点的2.6Kbp的3’下游序列组成的一条BLG的“迷你”基因。在pMAD6的EcoRV位点插入一个寡核苷酸接头(ZC 6839：ACT ACG TAGT；SEQ ID NO：11)。这一修改破坏了Eco RV位点，但产生了一个用于克隆目的的Sna BI位点。该载体命名为pMAD6-Sna。信使mRNA起始于Sna BI位点的上游并终止于Sna BI位点的下游。前体转录将编码一个单个BLG来源的内含子，即内含子6，它完整地位于基因的3’非翻译区内。

实施例2

编码单个纤维蛋白原链的克隆得自于University of Washington，Seattle的Dr.Earl W.Davie实验室。一个基因组纤维蛋白原Aα链克隆(Chung et al.，1990，ibid.)得自于质粒BS4。该质粒含有插入载体pUC18的SalI和Bam HI位点的Aα链克隆，但缺失了Aα链头四个氨基酸的编码序列。基因组Bβ链DNA(Chung et al.，ibid.)分离自λCharon 4A噬菌体克隆(命名为βλ4)的两个EcoRI片段，每条片段长5.6Kbp。两个片段分别克隆到已用EcoRI消化并经牛胰磷酸酶处理过的pUCl9中。得到的克隆用限制性酶PvuII消化筛选，鉴定出有5’和3’Bβ插入的质粒(分别命名为β 5’RI/puc和β 3’RI/puc)。基因组γ链克隆按Rixonetal.(Biochemistry 24：2077-2086，1985)所述分离。克隆pγ12A9包括5’非编码序列及约4535bp的γ链编码序列。克隆pγ12F3包括其余的编码序列和3’非编码核苷酸。这两个质粒都是基于pBR322的在EcoRI位点插入纤维蛋白原序列的质粒。这些质粒被用来作为个自PCR反应的模板。

为了将纤维蛋白原链编码序列插进表达载体中，使用Mullis(U.S.Patent No.4,683,202)所述的PCR技术给其加尾。该步骤是移去天然的5’和3’非翻译序列，在其每条编码序列的第一个ATG的上游加上一条9个碱基的序列(CCT GCA GCC)，提供Aα链的头四个密码子，除去了Aα链序列中的一个内部的MluI位点，并增加了限制性位点以方便随后的克隆操作。

参看图1，Aα链编码序列的5’末端通过PCR反应加尾。PCR反应体系中，含有分别为20pmol的引物ZC6632(SEQ ID NO：12)和ZC6627(SEQ ID NO：13)，约10ng的质粒BS4模板DNA，10μl的含有分别为2.5mM的各种dNTP的混合液，7.5μl的10×Pyrococcus furiosus(Pfu)DNA聚合酶缓冲液#1(200mM Tris-HCl，pH8.2，100mM KCl，60mM(NH₄)₂SO₄，20mMMgCl₂，1％Triton X-100，100μg/ml的去核酸酶牛血清白蛋白)(Stratagene，La Jolla，CA)，加水至75μl。混合物在一个DNA热循环仪(Perkin-Elmer)上以如下方式进行5个循环：94℃45秒，40℃90秒，72℃120秒；再进行20个循环：94℃45秒，45℃90秒，72℃120秒；然后在72℃保温7分钟。5’PCR片段用BamHI和HindIII消化，然后将该BamHI-HindIII片段与一个内部的2.91Kbp的HindIII-XbaI片段及经BamHI，XbaI消化的pUC18一起连接。对PCR产生的外显子序列进行序列测定。

再参看图1，通过一系列步骤给Aα编码序列的3’末端加尾。其中使用重叠延伸PCR反应(Ho et al.，Gene 77：51-59，1989)使Aα序列的终止密码子上游563位碱基上的MluI位点发生了突变。在第一个反应中，在如上所述的反应体系中加有分别为40pmol的引物ZC6521(SEQ ID NO：14)和ZC6520(SEQ ID NO：15)，约10ng的质粒BS4模板DNA。反应进行5个循环：94℃45秒，40℃90秒，72℃120秒；再进行15个循环：94℃45秒，45℃90秒，72℃120秒；然后在72℃保温7分钟。第二个反应以同样的方式进行，但使用每种分别为40pmol的引物ZC6519(SEQ ID NO：16)和ZC6518(SEQ ID NO：17)并以BS4为模板。从第一个和第二个反应中得到的PCR片段通过凝胶电泳分离并从凝胶上洗脱下来。每种回收的反应产物的约1/10与每种分别为40pmol的引物ZC6521(SEQ IDNO：14)和ZC6518(SEQ ID NO：17)在一个PCR反应中结合，在此反应中，每个片段(含有个别的碱基变化)的互补的3’末端作为其互补链3’延伸反应的引物与其退火。使用与第一个和第二个3’PCR反应中相同的反应条件进行PCR反应。然后将反应产物用XbaI和BamHI消化，并将XbaI-BamHI片段克隆到XbaI和BamHI消化的pUC18中。对PCR产生的外显子序列进行序列测定。

如图1中所示，5’BamHI-XbaI片段(3.9Kbp)和3’XbaI-BamHI片段(1.3Kbp)插入到载体Zem 228的BamHI位点，Zem 228是一个pUC18的衍生质粒，在小鼠MT-1启动子和SV40终止子之间有一个BamHI克隆位点，并在SV40启动子和终止子旁侧有一个新霉素抗性标记。见欧洲专利局出版物EP 319，944和图2。从载体Zem228上分离出完整的Aα编码序列SnaBI片段，插入到质粒pMAD6-Sna的Sna BI位点。

参看图3，使用寡核苷酸ZC6629(SEQ ID NO：18)，ZC6630(SEQ ID NO：19)和ZC6625(SEQ ID NO：20)通过PCR给Bβ链的5’末端加尾。这些引物以成对结合的方式(ZC6629+ZC6625或ZC6630+ZC6625)使用，产生起始于第一个ATG密码子(SEQ IDNO：3中的470位)的Bβ编码序列(命名为N1-β)或起始于第三个ATG密码子(SEQ IDNO：3中的512位)的Bβ编码序列(命名为N3-β)。在如上所述的反应混合物中加入5ng的β5’RI/puc模板DNA，并结合每种分别为20pmol的引物(N1-β：ZC6629，SEQID NO：18+ZC6625，SEQ ID NO：20或N3-β：ZC6630，SEQ ID NO：19+ZC6625，SEQ ID NO：20)。混合体系进行如下的5个循环：94℃45秒，40℃120秒(N1-β)或90秒(N3-β)，72℃120秒；再进行20个循环：94℃45秒，45℃120秒(N1-β)或90秒(N3-β)，72℃120秒；然后在72℃保温7分钟。两种反应产物都用EcoRI和BglII消化，并将酶切的片段与内部的BglII-XbaI片段和EGo RI+XbaI消化的pUC19一起连接。使用寡核苷酸引物ZC6626(SEQ ID NO：21)和ZC6624(SEQ ID NO：22)以及约5ng的β3’RI/puc模板在一个如上所述的反应混合物中给Bβ链序列的3’末端加尾。混合物温育5个循环：94℃45秒，40℃90秒，72℃120秒；再进行15个循环：94℃45秒，45℃90秒，72℃120秒；然后在72℃保温7分钟。分离出一个990bp的BglII-EcoRI片段。该3’片段与邻近的编码片段(340bp，SphI-BglII)和SphI+EcoRI消化的pUC19连接。对PCR产生的3’和5’外显子进行序列测定。在XbaI+SphI消化的pUC19中连接两个内部片段(4285bp XbaI-Eco RI和383bp Eco RI-SphI)构建第三个中间载体。然后装配完整的Bβ编码序列(两种形式)，连接5’EcoRI-XbaI片段中的一个，内部XbaI-SphI片段，3’SphI-EcoRI片段和EcoRI消化的载体pUC19。然后Bβ序列以7.6Kbp的SnaBI片段的形式分离出来，插入到pMAD6-Sna的SnaBI位点中。

参看图4，使用寡核苷酸引物ZC6514(SEQ、ID NO：23)和ZC6517(SEQ ID NO：24)以及约5ng的pγ12A9为模板通过PCR给γ链序列的5’末端加尾。使用40pmol的每种引物按如上所述进行PCR反应。反应进行5个循环：94℃45秒，40℃60秒，72℃120秒；接着进行15个循环：94℃45秒，45℃60秒，72℃120秒。得到的213bp的片段用BamHI和SpeI消化，将得到的酶切片段与邻近的下游4.4Kbp的SpeI-EcoRI片段和BamHI+EcoRI消化的pUC19连接。使用每种40pmol的寡核苷酸引物ZC6516(SEQ ID NO：25)和ZC6515(SEQ ID NO：26)，约50ng的pγ12 F3模板以及与用于5’片段的相同的热循环程序给γ链序列的3’末端加尾。得到的500bp的片段用BamHI和SpeI消化，将得到的酶切片段与上游2.77Kbp的EcoRI片段和EcoRI+BamHI消化的pUC19连接。所有PCR产生的外显子都进行序列测定。然后装配完整的γ’链编码序列，在BamHI+XbaI消化的Zem219b中，连接一个4.5Kbp的BamHI-EcoRI 5’片段，一个1.1Kbp的EcoRI-PstI内部片段和一个2.14Kbp的PstI-XbaI 3’片段。Zem219b是一个pUC18衍生载体，含有一个小鼠金属硫蛋白启动子和一个与SV40启动子连接的DHFR选择标记(图5)。质粒Zem219b已以E.coli XL1-blue转化子的形式保藏于American Type CultuteCollection，编号为68979。完整的γ’链编码序列以一个7.8Kbp的SnaBI片段的形式分离出来并插入到pMAD6-Sna的Sna BI位点。

实施例3

用于初始繁殖系(C57BL6J，CBACA)的小鼠得自于Harlan Olac Ltd.(Bicester，UK)。让其成对交配产生F1杂交系(B6CBAF1)，以得到受体雌性，超数排卵的雌性，用于繁殖的雄性，以及被结扎的雄性。所有的动物都保持在一种14小时光亮/10小时黑暗的循环中，并喂以任意量的水和食物(Special Diet Services RM3，Edinburgh，Scotland)。

转基因小鼠的产生基本上如Hogan et al.，在Manipulating the Mouse Embryo：ALaboratory Manual，Cold Spring Harbor Laboratory，1986中所述。雌性B6CBAF1动物在4-5周龄时通过注射怀孕雌鼠的血清促性腺激素(FOLLIGON，Vet-Drug，Falkirk，Scotland)(5iu)，随后在45小时后注射入绒毛膜促性腺激素(CHORULON，Vet-Drug，Falkirk，Scotland)(5iu)，使之超数排卵。然后让其与一只种鼠交配过夜。随后检查这些雌性动物交配是否阳性。那些已经交配的雌性动物被选出，收集它们的卵子以备用于显微注射。

如Hogan et al.(ibid.)所述将DNA注射到受精卵中。简而言之，每种含有Aα，Bβ和γ表达单位的载体用MluI消化，各表达单位用蔗糖密度梯度离心分离出来。所有使用的化学药品均为试剂级(Sigma Chemical Co.，St.Louis，MO，USA)，所有的溶液均为无菌及无核酸酶的。溶于1M NaCl，20mM Tris pH8.0，5mMEDTA的20％及40％的蔗糖溶液使用UHP水制备并经过滤除菌。混合等体积的20％和40％的蔗糖溶液，制备30％的蔗糖溶液。分步将0.5ml的40％、30％和20％的蔗糖溶液铺设到2ml的晶形塑料管中，并静置1小时，做成一种梯度。100μl的DNA溶液(接近8μgDNA)加到梯度液的顶部，然后于Beckman TL100超速离心机中使用TLS-55转头(BeckmanInstruments，Fullerton，CA，USA)在15℃下以26,000rpm转速离心17-20小时。使用一只20号的针头穿刺离心管的底部，分部收集各梯度的液滴于96孔板中。取出3μl的液体在1％的琼脂糖小胶上分析。将含有所需要的DNA片段的部分汇集起来，然后在0.3MNaAc中于-20℃用乙醇沉淀过夜。DNA沉淀物重溶于50-100μl UHP水中并用荧光计测量定量。表达单位稀释于Dulbecco’s磷酸缓冲盐(无钙和镁)(每升中含0.2gKCL，0.2gKH₂PO₄.8.0gNaCl，1.15gNa₂HPO₄)，以1∶1∶1的摩尔比混合(使用N1-β或是N3-β表达单位)，其浓度调节到大约6μg/ml，并注射到卵子中(每只卵大约总共2pl的DNA溶液)。

通过处于自然发情期的B6CBAF1雌鼠与结扎过的雄鼠交配，制备6-8周龄的受体雌鼠。那些交配检测为阳性的雌鼠保留下来准备转移显微注射后的卵。

潜在的转基因动物出生之后，于4周龄时在无菌条件下对尾部进行活体解剖。组织样品放入2ml含有200μg/ml蛋白酶K(Boehringer Mannheim，Germany)的，尾缓冲液(0.3MNaAc，50mMHCl，1.5mMMgCl₂，10mM Tris-HCl，PH8.5，0.5％NP40，0.5％7ween20)中，颠倒数次混匀。样品于55℃-60℃振荡(250rpm)3小时至过夜。通过PCR和Southern印迹检查制备于活体解剖样品的DNA中注射的结构的存在。剧烈振荡消化后的组织，取5μl液体放入0.5ml的微量离心管中。对照包括阳性和阴性尾部样品。每管中加入40μl的硅酮油(BDH，Poole，UK)并短暂地离心。管在一个热循环仪(如Omni-gene，Hybaid，Teddington，UK)的加热块上保温到95℃，10分钟。此后，每管中加入45μl的PCR混合液，这样，每个反应混合液的最终组成为：50mMKCl；2mMMgCl₂；10mM Tis-HCl(pH8.3)；0.01％的明胶；0.1％NP40；10％的DMSO；500nM的各种引物；200μM的dNTPs；0.02U/μl的Taq聚合酶(Boehinger Mannheim，Mannheim，Germany)。按照所用的特定引物所要求的温度变化，每管重复进行30个循环。引物可能会有不同，但所有的引物都必须以BLG启动子区为目标。这对于注射的DNA片段是特异性的，因为小鼠中没有BLG基因。然后在每管中加入12μl的5X上样缓冲液，其中含有OrangeG标记染料(0.25％OrangeG(Sigma)15％Ficoll-400[PharmaciaBiosystems Ltd.，Milton Keynes，UK])，反应混合物在含有EB(Sigma)的1.6％琼脂糖凝胶中电泳，直到标记染料迁移到胶的2/3长度处。在254nm波长的紫外灯下观察凝胶。用这种方法可以鉴定出具有一个或多个注射的DNA片段的转基因小鼠。

挑选阳性的尾部样品以获得纯的DNA。DNA样品通过使用一个BLG启动子探针(SEQID NO：7中的2523-4253位核苷酸)做Southern印迹进行筛选。使用合适的限制性酶(例如EcoRI)进行特异性裂解可以分辨出含有Aα，Bβ和γ序列的三种结构。

基本上按如上所述的方法制备的转基因小鼠的Southern印迹的分析结果表明。有多于50％的后代含有所有三种纤维蛋白原序列。阳性动物的乳汁的还原性SDS聚丙烯酰胺凝胶电泳检查表明，所有三种蛋白链都存在且其浓度接近1mg/ml。完全装配好的纤维蛋白原的量则与乳汁存在的各亚单位之间的比例有关。在小鼠乳汁中没有明显的与高浓度的人类纤维蛋白原相关的表型。实施例4

供体母羊在0日用阴道内的含孕酮的棉球(CHRONOGEST Goat Sponge，Intervet，Cambridfe，UK)处理。棉球留在原处保持10或12天。

超数排卵的诱导是通过用总共1单位的羊促卵泡激素(OFSH)(OVAGEN，HorizonAnimal Reproduction Technology Pty.Ltd.，New Zealand)处理，分8次肌肉注射给药，每次注射0.125单位，注射开始于-4日的5：00pm结束于0日的8：00am。在-4日给供者母羊肌肉注射0.5ml的黄体裂解试剂(ESTRUMATE，Vet-Drug)引起黄体退化，使之回复到发情和排卵期。为了使排卵同步，供体动物在0日5：00pm肌肉注射2ml合成的释放激素类似物(RECEPTAL，Vet-Drug)。

在人工授精(A.I.)之前，供体动物要断绝食物和水至少12小时。动物在+1日在镇静和局部麻醉状态下通过子宫内窥人工授精。在人工授精前大约15分钟通过肌肉注射0.05-0.1ml/10kg体重的甲苯噻嗪(ROMPUN，Vet-Drug)或0.1ml/10kg体重剂量的ACP注射液(10mg/ml)(Vet-Drug)使其镇静。人工授精使用从Poll Dorset公羊中刚收集的精液进行。精液用等量的过滤后的磷酸缓冲液稀释，每个子宫喇叭口里注射0.2ml的稀释精液。在人工授精前后，马上给供体动物肌肉注射AMOXYPEN(Vet-Drug)。

从1日5：00pm起给供体动物断绝食物和水，于2日回收受精卵。回收在全麻状态下进行，麻醉是通过静脉注射5％的硫喷妥钠(INTRAVAL SODIUM，Vet-Drug)，剂量为每10kg体重3ml。插管后通过吸入1-2％Halthane/O₂/N₂保持麻醉状态。为了回收受精卵，要进行一次腹腔切开手术，并从腹腔中取出子宫。卵子的回收是通过给输卵管倒灌注加有New Zealand来源的牛血清白蛋白的Ovum Culture Medium(AdvancedProtein Products，Brierly Hill，West Midlands，UK).灌注之后，将子宫放回腹腔，缝合伤口。供体动物允许在操作后恢复或是让其“安乐死”。允许恢复的供体动物在操作之前或之后立即肌肉注射操作者推荐剂量的Amoxypen L.A.。

含有三种纤维蛋白原链表达单位的质粒用MluI消化，表达单位片段通过蔗糖密度梯度离心回收与纯化。用荧光计测定片段的浓度，并用上述的不含钙和镁的Dulbecco’s磷酸缓冲液稀释。浓度调节到6μg/ml，约2pl的混合液显微注射进入每个具有可见原核的受精卵的一个原核中。

所有经过原核显微注射的受精卵在体外培养于38.5℃，5％CO₂：5％O₂：90％N₂气氛以及大约100％的湿度，培养基为加有20％v/v的结扎公羊血清的二氧化碳缓冲的合成输卵管培养基(见表)。血清可在56℃加热灭活30分钟，使用前冷冻储存于-20℃。受精卵培养一段合适的时间，使早期胚胎死亡(由操作技术引起的)发生。弃掉那些已死的或停止发育的胚胎。已经发育到5或6次细胞分裂的胚胎转移到同步化的受体母羊中。

表

合成输卵管培养基

储液A(可保存使用3个月)

NaCl 6.29g

KCl 0.534g

KH₂PO₄ 0.162g

MgSO₄.7H₂O 0.182g

青霉素 0.06g

60％乳酸钠糖浆 0.6ml

Super H₂O 99.4ml

储液B(可保存使用2周)

NaHCO₃ 0.21g

酚红 0.001g

Super H₂O 10ml

储液C(可保存使用2周)

丙酮酸钠 0.051g

Super H₂O 10ml

储液D(可保存使用3个月)

CaCl₂·2H₂O 0.262g

Super H₂O 10ml

储液E(可保存使用3个月)

Hepes 0.651g

酚红 0.001g

Super H₂O 10ml

配制10ml碳酸氢盐缓冲培养基

储液A 1ml

储液B 1ml

储液C 0.07ml

储液D 0.1ml

Super H₂O 7.83ml

Osmolarity应该是265-285mOsm。加入2.5ml热灭活的绵羊血过滤除菌。

配制10mls Hepes缓冲培养基

储液A 1m

储液B 0.2ml

储液C 0.07ml

储液D 0.1ml

储液E 0.8ml

Super H₂O 7.83ml

受体母羊用阴道内的含孕酮的棉球(CHRONOGEST Ewe Sponge or CHRONOGEST Ewe-Lamb Sponge，Intervet)处理，棉球留在原处保持10或12天。在-1日取走棉球，给母羊肌肉注射1.5ml(300iu)的促卵泡激素替代物(P.M.S.G.，Intervet)以及0.5ml的黄体裂解试剂(Estrumate，Coopers Pitman-Moore)。在0日和1日8：00am-5：00pm之间用结扎的公羊试验母羊的发情期。

在6日或7日将体外培养存活下来的胚胎放回受体母羊(从5日或6日5：00pm开始禁食)中。胚胎转移在如上所述的全麻状态下进行。子宫通过剖腹取出，可使用腹窥镜，也可不用。胚胎返回到那些至少具有一个合适的黄体的母羊的子宫的一个或两个喇叭口内。放回子宫之后，缝合腹部伤口。给动物在操作之前或之后立即肌肉注射操作者所推荐剂量的Amoxypen L.A.，让受体动物恢复。

羊羔在耳部挂上标签，放回饲养棚中。母羊和羊羔可以圈养喂以完全饲料和其它辅助饲料，或者随意喂以干草，也可到草地上放养。

在其第一周龄内(或在不损害健康的前提下尽可能早地)，使用两种取样方式试验羊羔中异源DNA的存在。从颈静脉中抽取10ml血样到一个EDTA针管中，如果合适，在头一周内还可以从羊羔中第二次取出血样。组织样品的获取是通过尾部活体解剖，使用一个橡皮筋缠上三圈使尾部失去反应，然后尽可能快地取样(通常在其长出尾巴后200min之内)。组织立刻放入尾部缓冲液中。尾部样品保存于室温并于收集当日分析。所有的羊羔在解剖之后立即肌肉注射操作者所推荐剂量的Amoxypen L.A.，被切过的尾部末端喷以抗生素喷雾剂。

首先分离白细胞从绵羊血液中提取DNA。10ml的血样稀释于20ml的Hank’s缓冲盐(HBS；Sigma Chemical Co.)中。在两个15ml的螺口管中每个内的5ml Histopaque(Sigma)上覆盖10ml的稀释血液。这些管于3,000rpm(最大2,000×g)离心，于室温下缓慢降速15分钟。将白血细胞分界面移到一个干净的15ml管中，用HBS稀释到15ml。稀释的细胞液于室温3,000rpm离心10分钟，回收细胞沉淀，溶于2-5ml尾部缓冲液中。

为了从白细胞中提取DNA，在细胞中加入10％的SDS使其终浓度达到1％，并颠倒管使之混匀。加入1mg新配的蛋白酶K溶液，混合液于45℃保温过夜，DNA用等体积的酚/氯仿抽提3次，并用氯仿/异戊醇抽提一次。加入0.1体积的3M NaAc和2倍体积的乙醇，颠倒混匀。沉淀的DNA用一只干净的末端有标记的玻璃棒缠绕成团。用70％乙醇洗涤后，使DNA凉至半干，然后重新溶解于TE(10mM Tris-HCl，1mM EDTA，PH7.4)中。

来自于血液和尾部的DNA样品使用对BLG启动子区及纤维蛋白原链编码区特异的探针进行Southern印迹分析。

虽然出于阐述本发明的目的，在此做了一些特殊实施方案的描述，但应理解的是，在不背离本发明的精神实质和范围的情况下，除了前面所述的，尚可对其进行各种修改。相应地，本发明将仅受后面所附的权利要求书的限制。

序列表(1)一般信息：

(i)申请人：ZymoGenetics，Inc.

1201 Eastlake Avenue East

Seattle.Washington 98102

United States of America

Pharmaceutical Proteins Ltd.

Roslin

Edinburgh

Midlothian.Scotland EH25 9PP

(ii)发明名称：在转基因动物中生产纤维蛋白原

(iii)序列数：27

(iv)联系地址：

(A)联系人：ZymoGenetics，Inc.

(B)街道：1201 Eastlake Avenue East

(C)城市：Seattle

(D)州：华盛顿州

(E)国家：美国

(F)邮编：98102

(v)计算机可读形式：

(A)媒介类型：软盘

(B)计算机：IBM PC兼容机

(C)操作系统：PC-DOS/MS-DOS

(D)软件：PatentIn Release#1.0，Version#1.25

(vi)本申请资料

(A)申请号：

(B)申请日：

(C)分类：

(vi)律师/代理人信息：

(A)姓名：Parker，Gary E

(B)注册号：31-648

(C)案号/文档号：93-15PC

(viii)通讯信息：

(A)电话：206-442-6673

(B)传真：206-442-6678(2)SEQ ID NO：1的信息：(i)序列特征

(A)长度：5943bp

(B)类型：核酸

(C)链性：双链

(D)拓扑结构：线性(ii)分子类型：DNA(基因组)(vii)来源：

(B)克隆：人纤维蛋白原A-α链(ix)特征：

(A)名称/关键词：CDS

(B)位置：连接(31..84，1154..1279，1739..1922，3055..3200，

3786..5210)(xi)序列描述：SEQ ID NO：1GTCTAGGAGC CAGCCCCACC CTTAGAAAAG ATG TTT TCC ATG AGG ATC GTC TGC 54

Met Phe Ser Met Arg Ile Val Cys

1 5CTA GTT CTA AGT GTG GTG GGC ACA GCA TGG GTATGGCCCT TTTCATTTTT 104Leu Val Leu Ser Val Val Gly Thr Ala Trp

10 15TCTTCTTGCT TTCTCTCTGG TGTTTATTCC ACAAAGAGCC TGGAGGTCAG AGTCTACCTG 164CTCTATGTCC TGACACACTC TTAGCTTTAT GACCCCAGGC CTGGGAGGAA ATTTCCTGGG 224TGGGCTTGAC ACCTCAAGAA TACAGGGTAA TATGACACCA AGAGGAAGAT CTTAGATGGA 284TGAGAGTGTA CAACTACAAG GGAAACTTTA GCATCTGTCA TTCAGTCTTA CCACATTTTG 344TTTTGTTTTG TTTTAAAAAG GGCAAGAATT ATTTGCCATC CTTGTACCTA TAAAGCCTTG 404GTGCATTATA ATGCTAGTTA ATGGAATAAA ACATTTTATG GTAAGATTTG TTTTCTTTAG 464TTATTAATTT CTTGCTACTT GTCCATAATA AGCAGAACTT TTAGTGTTAG TACAGTTTTG 524CTGAAAGGTT ATTGTTGTGT TTGTCAAGAC AGAAGAAAAA GCAAACGAAT TATCTTTGGA 584AATATCTTTG CAGTATCAGA AGAGATTAGT TAGTAAGGCA ATACGCTTTT CCGCAGTAAT 644GGTATTCTTT TAAATTATGA ATCCATCTCT AAAGGTTACA TAGAAACTTG AAGGAGAGAG 704GAACATTCAG TTAAGATAGT CTAGGTTTTT CTACTGAAGC AGCAATTACA GGAGAAAGAG 764CTCTACAGTA GTTTTCAACT TTCTGTCTGC AGTCATTAGT AAAAATGAAA AGGTAAAATT 824TAACTGATTT TATAGATTCA AATAATTTTC CTTTTAGGAT GGATTCTTTA AAACTCCTAA 884TATTTATCAA ATGCTTATTT AAGTGTCACA CACAGTTAAG AAATTTGTAC ACCTTGTCTC 944CTTTAATTCT CATAACAACT CCATAAAATG GGTCCTAGGA TTTCCATTTG AAGATAAGAA 1004ACCTGAAGCT TGCCGAAGCC CTGTGTCTGC TCTCCTTAAT CTCTGTGAGA GTGCCATCTC 1064TTCCTGGGGA CTTGTAGGCA TGCCACTGTC TCCTCTTCTG GCTAACATTG CTGTTGCTCT 1124CTTTTGTGTA TGTGAATGAA TCTTTAAAG ACT GCA GAT AGT GGT GAA GGT GAC 1177

Thr Ala Asp Ser Gly Glu Gly Asp

20 25TTT CTA GCT GAA GGA GGA GGC GTG CGT GGC CCA AGG GTT GTG GAA AGA 1225Phe Leu Ala Glu Gly Gly Gly Val Arg Gly Pro Arg Val Val Glu Arg

30 35 40CAT CAA TCT GCC TGC AAA GAT TCA GAC TGG CCC TTC TGC TCT GAT GAA 1273His Gln Ser Ala Cys Lys Asp Ser Asp Trp Pro Phe Cys Ser Asp Glu

45 50 55GAC TGG GTAAGCAGTC AGCGGGGGAA GCAGGAGATT CCTTCCCTCT GATGCTAGAG 1329Asp Trp

60GGGCTCACAG GCTGACCTGA TTGGTCCCAG AAACTTTTTT AAATAGAAAA TAATTGAATA 1389GTTACCTACA TAGCAAATAA AGAAAAGGAA CCTACTCCCA AGAGCACTGT TTATTTACCT 1449CCCCAACTCT GGATCATTAG TGGGTGAACA GACAGGATTT CAGTTGCATG CTCAGGCAAA 1509ACCAGGCTCC TGAGTATTGT GGCCTCAATT TCCTGGCACC TATTTATGGC TAAGTGGACC 1569CTCATTCCAG AGTTTCTCTG CGACCTCTAA CTAGTCCTCT TACCTACTTT TAAGCCAACT 1629TATCTGGAAG AGAAAGGGTA GGAAGAAATG GGGGCTGCAT GGAAACATGC AAAATTATTC 1689TGAATCTGAG AGATAGATCC TTACTGTAAT TTTCTCCCTT CACTTTCAG AAC TAC 1744

Asn TyrAAA TGC CCT TCT GGC TGC AGG ATG AAA GGG TTG ATT GAT GAA GTC AAT 1792Lys Cys Pro Ser Gly Cys Arg Met Lys Gly Leu Ile Asp Glu Val Asn

65 70 75CAA GAT TTT ACA AAC AGA ATA AAT AAG CTC AAA AAT TCA CTA TTT GAA 1840Gln Asp Phe Thr Asn Arg Ile Asn Lys Leu Lys Asn Ser Leu Phe Glu

80 85 90TAT CAG AAG AAC AAT AAG GAT TCT CAT TCG TTG ACC ACT AAT ATA ATG 1888Tyr Gln Lys Asn Asn Lys Asp Ser His Ser Leu Thr Thr Asn Ile Met95 100 105 110GAA ATT TTG AGA GGC GAT TTT TCC TCA GCC AAT A GTAAGTATTA 1932Glu Ile Leu Arg Gly Asp Phe Ser Ser Ala Asn

115 120CATATTTACT TCTTTGACTT TATAACAGAA ACAACAAAAA TCCTAAATAA ATATGATATC 1992CGCTTATATC TATGACAATT TCATCCCAAA GTACTTAGTG TAGAAACACA TACCTTCATA 2052ATATCCCTGA AAATTTTAAG AGGGAGCTTT TGTTTTCGTT ATTTTTTCAA AGTAAAAGAT 2112GTTAACTGAG ATTGTTTAAG GTCACAAAAT AAGTCAGAAT TTTGGATTAA AACAAGAATT 2172TAAATGTGTT CTTTTCAACA GTATATACTG AAAGTAGGAT GGGTCAGACT CTTTGAGTTG 2232ATATTTTTGT TTCTGCTTTG TAAAGGTGAA AACTGAGAGG TCAAGGAACT TGTTCAAAGA 2292CACAGAGCTG GGAATTCAAC TCCCAGACTC CACTGAGCTG ATTAGGTAGA TTTTTAAATT 2352TAAAATATAG GGTCAAGCTA CGTCATTCTC ACAGTCTACT CATTAGGGTT AGGAAACATT 2412GCATTCACTC TGGGCATGGA CAGCGAGTCT AGGGAGTCCT CAGTTTCTCA AGTTTTGCTT 2472TGCCTTTTTA CACCTTCACA AACACTTGAC ATTTAAAATC AGTGATGCCA ACACTAGCTG 2532GCAAGTGAGT GATCCTGTTG ACCCAAAACA GCTTAGGAAC CATTTCAAAT CTATAGAGTT 2592AAAAAGAAAA GCTCATCAGT AAGAAAATCC AATATGTTCA AGTCCCTTGA TTAAGGATGT 2652TATAAAATAA TTGAAATGCA ATCAAACCAA CTATTTTAAC TCCAAATTAC ACCTTTAAAA 2712TTCCAAAGAA AGTTCTTCTT CTATATTTCT TTGGGATTAC TAATTGCTAT TAGGACATCT 2772TAACTGGCAT TCATGGAAGG CTGCAGGGCA TAACATTATC CAAAAGTCAA ATGCCCCATA 2832GGTTTTGAAC TCACAGATTA AACTGTAACC AAAATAAAAT TAGGCATATT TACAAGCTAG 2892TTTCTTTCTT TCTTTTTTCT CTTTCTTTCT TTCTTTCTTT CTTTCTTTCT TTCTTTCTTT 2952CTTTCTTTCT TTCTCCTTCC TTCCTTTCTT CCTTTCTTTT TTGCTGGCAA TTACAGACAA 3012ATCACTCAGC AGCTACTTCA ATAACCATAT TTTCGATTTC AG AC CGT GAT AAT 3065

Asn Arg Asp Asn

125ACC TAC AAC CGA GTG TCA GAG GAT CTG AGA AGC AGA ATT GAA GTC CTG 3113Thr Tyr Asn Arg Val Ser Glu Asp Leu Arg Ser Arg Ile Glu Val Leu

130 135 140AAG CGC AAA GTC ATA GAA AAA GTA CAG CAT ATC CAG CTT CTG CAG AAA 3161Lys Arg Lys Val Ile Glu Lys Val Gln His Ile Gln Leu Leu Gln Lys

145 150 155AAT GTT AGA GCT CAG TTG GTT GAT ATG AAA CGA CTG GAG GTAAGTATGT 3210Asn Val Arg Ala Gln Leu Val Asp Met Lys Arg Leu Glu

160 165 170GGCTGTGGTC CCGAGTGTCC TTGTTTTTGA GTAGAGGGAA AAGGAAGGCG ATAGTTATGC 3270ACTGAGTGTC TACTATATGC AGAGAAAAGT GTTATATCCA TCATCTACCT AAAAGTAGGT 3330ATTATTTTCC TCACTCCACA GTTGAAGAAA AAAAAATTCA GAGATATTAA GTAAATTTTC 3390CAACGTACAT AGATAGTAAT TCAAAGCAAT GTTCAGTCCC TGTCTATTCC AAGCCATTAC 3450ATCACCACAC CTCTGAGCCC TCAGCCTGAG TTCACCAAGG ATCATTTAAT TAGCGTTTCC 3510TTTGAGAGGG AATAGCACCT TACTCTTGAT CCATTCTGAG GCTAAGATGA ATTAAACAGC 3570ATCCATTGCT TATCCTGGCT AGCCCTGCAA TACCCAACAT CTCTTCCACT GAGGGTGCTC 3630GATAGGCAGA AAACAGAGAA TATTAAGTGG TAGGTCTCCG AGTCAAAAAA AATGAAACCA 3690GTTTCCAGAA GGAAAATTAA CTACCAGGAA CTCAATAGAC GTAGTTTATG TATTTGTATC 3750TACATTTTCT CTTTATTTTT CTCCCCTCTC TCTAG GTG GAC ATT GAT ATT AAG 3803

Val Asp Ile Asp Ile Lys

175ATC CGA TCT TGT CGA GGG TCA TGC AGT AGG GCT TTA GCT CGT GAA GTA 3851Ile Arg Ser Cys Arg Gly Ser Cys Ser Arg Ala Leu Ala Arg Glu Val

180 185 190GAT CTG AAG GAC TAT GAA GAT CAG CAG AAG CAA CTT GAA CAG GTC ATT 3899Asp Leu Lys Asp Tyr Glu Asp Gln Gln Lys Gln Leu Glu Gln Val Ile

195 200 205GCC AAA GAC TTA CTT CCC TCT AGA GAT AGG CAA CAC TTA CCA CTG ATA 3947Ala Lys Asp Leu Leu Pro Ser Arg Asp Arg Gln His Leu Pro Leu Ile

210 215 220AAA ATG AAA CCA GTT CCA GAC TTG GTT CCC GGA AAT TTT AAG AGC CAG 3995Lys Met Lys Pro Val Pro Asp Leu Val Pro Gly Asn Phe Lys Ser Gln225 230 235 240CTT CAG AAG GTA CCC CCA GAG TGG AAG GCA TTA ACA GAC ATG CCG CAG 4043Leu Gln Lys Val Pro Pro Glu Trp Lys Ala Leu Thr Asp Met Pro Gln

245 250 255ATG AGA ATG GAG TTA GAG AGA CCT GGT GGA AAT GAG ATT ACT CGA GGA 4091Met Arg Met Glu Leu Glu Arg Pro Gly Gly Asn Glu Ile Thr Arg Gly

260 265 270GGC TCC ACC TCT TAT GGA ACC GGA TCA GAG ACG GAA AGC CCC AGG AAC 4139Gly Ser Thr Ser Tyr Gly Thr Gly Ser Glu Thr Glu Ser Pro Arg Asn

275 280 285CCT AGC AGT GCT GGA AGC TGG AAC TCT GGG AGC TCT GGA CCT GGA AGT 4187Pro Ser Ser Ala Gly Ser Trp Asn Ser Gly Ser Ser Gly Pro Gly Ser

290 295 300ACT GGA AAC CGA AAC CCT GGG AGC TCT GGG ACT GGA GGG ACT GCA ACC 4235Thr Gly Asn Arg Asn Pro Gly Ser Ser Gly Thr Gly Gly Thr Ala Thr305 310 315 320TGG AAA CCT GGG AGC TCT GGA CCT GGA AGT GCT GGA AGC TGG AAC TCT 4283Trp Lys Pro Gly Ser Ser Gly Pro Gly Ser Ala Gly Ser Trp Asn Ser

325 330 335GGG AGC TCT GGA ACT GGA AGT ACT GGA AAC CAA AAC CCT GGG AGC CCT 4331Gly Ser Ser Gly Thr Gly Ser Thr Gly Asn Gln Ash Pro Gly Ser Pro

340 345 350AGA CCT GGT AGT ACC GGA ACC TGG AAT CCT GGC AGC TCT GAA CGC GGA 4379Arg Pro Gly Ser Thr Gly Thr Trp Asn Pro Gly Ser Ser Glu Arg Gly

355 360 365AGT GCT GGG CAC TGG ACC TCT GAG AGC TCT GTA TCT GGT AGT ACT GGA 4427Ser Ala Gly His Trp Thr Ser Glu Ser Ser Val Ser Gly Ser Thr Gly

370 375 380CAA TGG CAC TCT GAA TCT GGA AGT TTT AGG CCA GAT AGC CCA GGC TCT 4475Gln Trp His Ser Glu Ser Gly Ser Phe Arg Pro Asp Ser Pro Gly Ser385 390 395 400GGG AAC GCG AGG CCT AAC AAC CCA GAC TGG GGC ACA TTT GAA GAG GTG 4523Gly Asn Ala Arg Pro Asn Asn Pro Asp Trp Gly Thr Phe Glu Glu Val

405 410 415TCA GGA AAT GTA AGT CCA GGG ACA AGG AGA GAG TAC CAC ACA GAA AAA 4571Ser Gly Asn Val Ser Pro Gly Thr Arg Arg Glu Tyr His Thr Glu Lys

420 425 430CTG GTC ACT TCT AAA GGA GAT AAA GAG CTC AGG ACT GGT AAA GAG AAG 4619Leu Val Thr Ser Lys Gly Asp Lys Glu Leu Arg Thr Gly Lys Glu Lys

435 440 445GTC ACC TCT GGT AGC ACA ACC ACC ACG CGT CGT TCA TGC TCT AAA ACC 4667Val Thr Ser Gly Ser Thr Thr Thr Thr Arg Arg Ser Cys Ser Lys Thr

450 455 460GTT ACT AAG ACT GTT ATT GGT CCT GAT GGT CAC AAA GAA GTT ACC AAA 4715Val Thr Lys Thr Val Ile Gly Pro Asp Gly His Lys Glu Val Thr Lys465 470 475 480GAA GTG GTG ACC TCC GAA GAT GGT TCT GAC TGT CCC GAG GCA ATG GAT 4763Glu Val Val Thr Ser Glu Asp Gly Ser Asp Cys Pro Glu Ala Met Asp

485 490 495TTA GGC ACA TTG TCT GGC ATA GGT ACT CTG GAT GGG TTC CGC CAT AGG 4811Leu Gly Thr Leu Ser Gly Ile Gly Thr Leu Asp Gly Phe Arg His Arg

500 505 510CAC CCT GAT GAA GCT GCC TTC TTC GAC ACT GCC TCA ACT GGA AAA ACA 4859His Pro Asp Glu Ala Ala Phe Phe Asp Thr Ala Ser Thr Gly Lys Thr

515 520 525TTC CCA GGT TTC TTC TCA CCT ATG TTA GGA GAG TTT GTC AGT GAG ACT 4907Phe Pro Gly Phe Phe Ser Pro Met Leu Gly Glu Phe Val Ser Glu Thr

530 535 540GAG TCT AGG GGC TCA GAA TCT GGC ATC TTC ACA AAT ACA AAG GAA TCC 4955Glu Ser Arg Gly Ser Glu Ser Gly Ile Phe Thr Asn Thr Lys Glu Ser545 550 555 560AGT TCT CAT CAC CCT GGG ATA GCT GAA TTC CCT TCC CGT GGT AAA TCT 5003Ser Ser His His Pro Gly Ile Ala Glu Phe Pro Ser Arg Gly Lys Ser

565 570 575TCA AGT TAC AGC AAA CAA TTT ACT AGT AGC ACG AGT TAC AAC AGA GGA 5051Ser Ser Tyr Ser Lys Gln Phe Thr Ser Ser Thr Ser Tyr Asn Arg Gly

580 585 590GAC TCC ACA TTT GAA AGC AAG AGC TAT AAA ATG GCA GAT GAG GCC GGA 5099Asp Ser Thr Phe Glu Ser Lys Ser Tyr Lys Met Ala Asp Glu Ala Gly

595 600 605AGT GAA GCC GAT CAT GAA GGA ACA CAT AGC ACC AAG AGA GGC CAT GCT 5147Ser Glu Ala Asp His Glu Gly Thr His Ser Thr Lys Arg Gly His Ala

610 615 620AAA TCT CGC CCT GTC AGA GGT ATC CAC ACT TCT CCT TTG GGG AAG CCT 5195Lys Ser Arg Pro Val Arg Gly Ile His Thr Ser Pro Leu Gly Lys Pro625 630 635 640TCC CTG TCC CCC TAGACTAAGT TAAATATTTC TGCACAGTGT TCCCATGGCC 5247Ser Leu Ser Pro

645CCTTGCATTT CCTTCTTAAC TCTCTGTTAC ACGTCATTGA AACTACACTT TTTTGGTCTG 5307TTTTTGTGCT AGACTGTAAG TTCCTTGGGG GCAGGGCCTT TGTCTGTCTC ATCTCTGTAT 5367TCCCAAATGC CTAACAGTAC AGAGCCATGA CTCAATAAAT ACATGTTAAA TGGATGAATG 5427AATTCCTCTG AAACTCTATT TGAGCTTATT TAGTCAAATT CTTTCACTAT TCAAAGTGTG 5487TGCTATTAGA ATTGTCACCC AACTGATTAA TCACATTTTT AGTATGTGTC TCAGTTGACA 5547TTTAGGTCAG GCTAAATACA AGTTGTGTTA GTATTAAGTG AGCTTAGCTA CCTGTACTGG 5607TTACTTGCTA TTAGTTTGTG CAAGTAAAAT TCCAAATACA TTTGAGGAAA ATCCCCTTTG 5667CAATTTGTAG GTATAAATAA CCGCTTATTT GCATAAGTTC TATCCCACTG TAAGTGCATC 5727CTTTCCCTAT GGAGGGAAGG AAAGGAGGAA GAAAGAAAGG AAGGGAAAGA AACAGTATTT 5787GCCTTATTTA ATCTGAGCCG TGCCTATCTT TGTAAAGTTA AATGAGAATA ACTTCTTCCA 5847ACCAGCTTAA TTTTTTTTTT AGACTGTGAT GATGTCCTCC AAACACATCC TTCAGGTACC 5907CAAAGTGGCA TTTTCAATAT CAAGCTATCC GGATCC 5943(2)SEQ ID NO：2的信息：(i)序列特征(A)长度：644个氨基酸(B)类型：氨基酸(D)拓扑结构：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：2Met Phe Ser Met Arg Ile Val Cys Leu Val Leu Ser Val Val Gly Thr1 5 10 15Ala Trp Thr Ala Asp Ser Gly Glu Gly Asp Phe Leu Ala Glu Gly Gly

20 25 30Gly Val Arg Gly Pro Arg Val Val Glu Arg His Gln Ser Ala Cys Lys

35 40 45Asp Ser Asp Trp Pro Phe Cys Ser Asp Glu Asp Trp Asn Tyr Lys Cys

50 55 60Pro Ser Gly Cys Arg Met Lys Gly Leu Ile Asp Glu Val Asn Gln Asp65 70 75 80Phe Thr Asn Arg Ile Asn Lys Leu Lys Asn Ser Leu Phe Glu Tyr Gln

85 90 95Lys Asn Asn Lys Asp Ser His Ser Leu Thr Thr Asn Ile Met Glu Ile

100 105 110Leu Arg Gly Asp Phe Ser Ser Ala Asn Asn Arg Asp Asn Thr Tyr Asn

115 120 125Arg Val Ser Glu Asp Leu Arg Ser Arg Ile Glu Val Leu Lys Arg Lys

130 135 140Val Ile Glu Lys Val Gln His Ile Gln Leu Leu Gln Lys Asn Val Arg145 150 155 160Ala Gln Leu Val Asp Met Lys Arg Leu Glu Val Asp Ile Asp Ile Lys

165 170 175Ile Arg Ser Cys Arg Gly Ser Cys Ser Arg Ala Leu Ala Arg Glu Val

180 185 190Asp Leu Lys Asp Tyr Glu Asp Gln Gln Lys Gln Leu Glu Gln Val Ile

195 200 205Ala Lys Asp Leu Leu Pro Ser Arg Asp Arg Gln His Leu Pro Leu Ile

210 215 220Lys Met Lys Pro Val Pro Asp Leu Val Pro Gly Asn Phe Lys Ser Gln225 230 235 240Leu Gln Lys Val Pro Pro Glu Trp Lys Ala Leu Thr Asp Met Pro Gln

245 250 255Met Arg Met Glu Leu Glu Arg Pro Gly Gly Asn Glu Ile Thr Arg Gly

260 265 270Gly Ser Thr Ser Tyr Gly Thr Gly Ser Glu Thr Glu Ser Pro Arg Asn

275 280 285Pro Ser Ser Ala Gly Ser Trp Asn Ser Gly Ser Ser Gly Pro Gly Ser

290 295 300Thr Gly Asn Arg Asn Pro Gly Ser Ser Gly Thr Gly Gly Thr Ala Thr305 310 315 320Trp Lys Pro Gly Ser Ser Gly Pro Gly Ser Ala Gly Ser Trp Asn Ser

325 330 335Gly Ser Ser Gly Thr Gly Ser Thr Gly Asn Gln Asn Pro Gly Ser Pro

340 345 350Arg Pro Gly Ser Thr Gly Thr Trp Asn Pro Gly Ser Ser Glu Arg Gly

355 360 365Ser Ala Gly His Trp Thr Ser Glu Ser Ser Val Ser Gly Ser Thr Gly

370 375 380Gln Trp His Ser Glu Ser Gly Ser Phe Arg Pro Asp Ser Pro Gly Ser385 390 395 400Gly Asn Ala Arg Pro Asn Asn Pro Asp Trp Gly Thr Phe Glu Glu Val

405 410 415Ser Gly Asn Val Ser Pro Gly Thr Arg Arg Glu Tyr His Thr Glu Lys

420 425 430Leu Val Thr Ser Lys Gly Asp Lys Glu Leu Arg Thr Gly Lys Glu Lys

435 440 445Val Thr Ser Gly Ser Thr Thr Thr Thr Arg Arg Ser Cys Ser Lys Thr

450 455 460Val Thr Lys Thr Val Ile Gly Pro Asp Gly His Lys Glu Val Thr Lys465 470 475 480Glu Val Val Thr Ser Glu Asp Gly Ser Asp Cys Pro Glu Ala Met Asp

485 490 495Leu Gly Thr Leu Ser Gly Ile Gly Thr Leu Asp Gly Phe Arg His Arg

500 505 510His Pro Asp Glu Ala Ala Phe Phe Asp Thr Ala Ser Thr Gly Lys Thr

515 520 525Phe Pro Gly Phe Phe Ser Pro Met Leu Gly Glu Phe Val Ser Glu Thr

530 535 540Glu Ser Arg Gly Ser Glu Ser Gly Ile Phe Thr Asn Thr Lys Glu Ser545 550 555 560Ser Ser His His Pro Gly Ile Ala Glu Phe Pro Ser Arg Gly Lys Ser

565 570 575Ser Ser Tyr Ser Lys Gln Phe Thr Ser Ser Thr Ser Tyr Asn Arg Gly

580 585 590Asp Ser Thr Phe Glu Ser Lys Ser Tyr Lys Met Ala Asp Glu Ala Gly

595 600 605Ser Glu Ala Asp His Glu Gly Thr His Ser Thr Lys Arg Gly His Ala

610 615 620Lys Ser Arg Pro Val Arg Gly Ile His Thr Ser Pro Leu Gly Lys Pro625 630 635 640Ser Leu Ser Pro(2)SEQ ID NO：3的信息：(i)序列特征(A)长度：8878bp(B)类型：核酸(C)链性：双链(D)拓扑结构：线性(ii)分子类型：DNA(基因组)(vii)来源：

(B)克隆：人纤维蛋白原B-β链(ix)特征：

(A)名称/关键词：misc_RNA

(B)位置：1..469(ix)特征：

(A)名称/关键词：外显子

(B)位置：470..583(ix)特征：

(A)名称/关键词：内含子

(B)位置：584..3257(ix)特征：

(A)名称/关键词：外显子

(B)位置：3258..3449(ix)特征：

(A)名称/关键词：内含子

(B)位置：3450..3938(ix)特征：

(A)名称/关键词：外显子

(B)位置：3939..4122(ix)特征：

(A)名称/关键词：内含子

(B)位置：4123..5042(ix)特征：

(A)名称/关键词：外显子

(B)位置：5043..5270(ix)特征：

(A)名称/关键词：内含子

(B)位置：5271..5830(ix)特征：

(A)名称/关键词：外显子

(B)位置：5831..5944(ix)特征：

(A)名称/关键词：内含子

(B)位置：5945..6632(ix)特征：

(A)名称/关键词：外显子

(B)位置：6633..6758(ix)特征：

(A)名称/关键词：内含子

(B)位置：6759..6966(ix)特征：

(A)名称/关键词：外显子

(B)位置：6967..7252(ix)特征：

(A)名称/关键词：内含子

(B)位置：7253..7870(ix)特征：

(A)名称/关键词：外显子

(B)位置：7871..8102(ix)特征：

(A)名称/关键词：3’UTR

(B)位置：8103..8537(ix)特征：

(A)名称/关键词：misc_RNA

(B)位置：8538..8878(ix)特征：

(A)名称/关键词：CDS

(B)位置：连接(470..583，3258..3449，3939..4122，5043..5270，

5831..5944，6633..6758，6967..7252，7871..8102)(xi)序列描述：SEQ ID NO：3GAATTCATGC CCCTTTTGAA ATAGACTTAT GTCATTGTCA GAAAACATAA GCATTTATGG 60TATATCATTA ATGAGTCACG ATTTTAGTGG TTGCCTTGTG AGTAGGTCAA ATTTACTAAG 120CTTAGATTTG TTTTCTCACA TATTCTTTCG GAGCTTGTGT AGTTTCCACA TTAATTTACC 180AGAAACAAGA TACACACTCT CTTTGAGGAG TGCCCTAACT TCCCATCATT TTGTCCAATT 240AAATGAATTG AAGAAATTTA ATGTTTCTAA ACTAGACCAA CAAAGAATAA TAGTTGTATG 300ACAAGTAAAT AAGCTTTGCT GGGAAGATGT TGCTTAAATG ATAAAATGGT TCAGCCAACA 360AGTGAACCAA AAATTAAATA TTAACTAAGG AAAGGTAACC ATTTCTGAAG TCATTCCTAG 420CAGAGGACTC AGATATATAT AGGATTGAAG ATCTCTCAGT TAAGTCTAC ATG AAA 475

Met Lys

1AGG ATG GTT TCT TGG AGC TTC CAC AAA CTT AAA ACC ATG AAA CAT CTA 523Arg Met Val Ser Trp Ser Phe His Lys Leu Lys Thr Met Lys His Leu

5 10 15TTA TTG CTA CTA TTG TGT GTT TTT CTA GTT AAG TCC CAA GGT GTC AAC 571Leu Leu Leu Leu Leu Cys Val Phe Leu Val Lys Ser Gln Gly Val Asn

20 25 30GAC AAT GAG GAG GTGAATTTTT TAAAGCATTA TTATATTATT AGTAGTATTA 623Asp Asn Glu Glu35TTAATATAAG ATGTAACATA ATCATATTAT GTGCTTATTT TAATGAAATT AGCATTGCTT 683ATAGTTATGA AATGGAATTG TTAACCTCTG ACTTATTGTA TTTAAAGAAT GTTTCATAGT 743ATTTCTTATA TAAAAACAAA GTAATTTCTT GTTTTCTAGT TTATCACCTT TGTTTTCTTA 803AGATGAGGAT GGCTTAGCTA ATGTAAGATG TGTTTTTCTC ACTTGCTATT CTGAGTACTG 863TGATTTTCAT TTACTTCTAG CAATACAGGA TTACAATTAA GAGGACAAGA TCTGAAAATC 923TCACAAACTA TAAAATAATA AAAGAGCAGA ATTTTAAGAT AAAAGAAACT GGTGGTAGGT 983AGATTGTTCT TTGGTGAAGG AAGGTAATAT ATATTGTTAC TGAGATTACT ATTTATAAAA 1043ATTATAACTA AGCCTAAAAG CAAAATACAT CAAGTGTAAT GATAGAAAAT GAAATATTGC 1103TTTTTTCAGA TGAAAAGTTC AAATTAGAGT TAGTGTGTAT TGTTATTATT AATAGTTATG 1163AAACACGGTT CAGTCTAATT TATTTATTTG TAGAACAGTT TGTCCTCAAC TATTATTTTT 1223GCTGACTTAT TGCTGTTAAT TTGCAGTTAC TAAAAATACA GAAATGCATT TAGGACAATG 1283GATATTTAAG AAATTTAAAT TTTATCATCA AACGTATCAT GGCCAAATTT CTTACATATA 1343GCATAGTATC ATTAAACTAG AAATAAGAAT ACACAATAAT ATTTAAATGA AGTGATTCAT 1403TTCGGATCAT TATTGAGTTT CAAGGGAACT TGAGTGTTGT ACTTATCAGA CTCTACATGT 1463AAGAACATAT AGTTAATCTG GTTGTGTGTG TAAAAACATA TGGTTAATCT GGTTAAGTCT 1523GGTTAATCAT ATTAGGTAAG AAAAATGTAA AGAATGTGTA AGACGAAATT TTTGTAAAGT 1583ACTCTGCAAA GCACTTTCAC ATTTCTGCTT ATCAACTAAA CCTCACAGAG ATAGTTTAAT 1643AGTTTAGGCT TTAAAATGGA TTTTGATTAT TCAACAAGTG GCCTTCATAA TTTCTTTAAG 1703TGTTTTTCTT TAAGTATATA CTTTCTTTAA ATATTTTTTA AAATTTCCTT TTCTCTAGTA 1763AAGCCAGACC ATCCATGCTA CCTCTCTAGT GGCACTCTGA AATAAAAAGA AAATAGTTTT 1823CTCTGTTATA ATTGTATTTG TAATAAGCAG ATGAATCACA TTTCTTAAAA TTTGTTTTAG 1883AGAGGGTAAG CTCTGACTAG GACCATGACT TCAATGTGAA ATATGTATAT ATCCTCCGAA 1943TCTTTACATA TTAAGAATGT ATATAGTCAA CTGGTTAAAC AGGAAAATCT GGAACAGCCT 2003GGCTGGGTTT TAATCTTAGC ACCATCCTAC TAAATGTTAA ATAATATTAT AATCTAATGA 2063ATAAATGACA ATGCAATTCC AAATAGAGTT CATCTGATGA CTTCTAGACT CACAAAATTG 2123CAAGAGAGCT CAGTTGTTGC TCAGTTGTTC CAAATCATGT CGTTTGTTAA TTTGTAATTA 2183AGCTCCAAAG GATGTATAGC TACTGACAAA AAAAAAAATG AGAATGTAGT TAATCCAAAT 2243CAAAACTTTC CTATTGCAAT GCGTATTTTC TGCTTCATTA TCCTTTAATA TAATATTTTA 2303AGTTAGCAAG TAATTTTAAT TACAATGCAC AAGCCTTGAG AATTATTTTA AATATAAGAA 2363AATCATAATG TTTGATAAAG AAATCATGTA AGAAATTTCA AGATAATGGT TTAACAAATA 2423ATTTTGTTGA TAGAAGATAA GACTAAAAGT GAAATTCGAA GTGGAGAGGA CACTTAAACT 2483GTAGTACTTG TTATGTGTGA TTCCAGTAAA AATAGTAATG AGCACTTATT ATTGCCAAGT 2543ACTGTTCTGA GGGTACCATA TGCAATAAGT TATTTAATCC TTACAATAAT CTTGTAAGGC 2603AGATTCAAAC TATCATTACA CTTATTTTAC AGATGAGAAA ACTGGGGCAC AGATAAAGCA 2663ACTTGCCCAA GGTCTCATAG CTGTAAGTCA ACCCTACGGT CAAGACCTAC AAGTAGCCGA 2723GCTCCAGAGT ACATTATGAG GGTCAAAGAT TGTCTTATTA CAAATAAATT CCAAGTAGAA 2783TCAACCTTTA ATAAGTCTTT AATGTCTCTT AAATATGTTT ATATAGGAGT CTAATCACCA 2843ATTCACAAAA ATGAAAGTAG GGAAATGATT AACAATAATC ATAGGAATCT AACAATCCAA 2903GTGGCTTGAG AATATTCATT CTTCTTGACA GTATAGATTC TTTACAATTT CGTAAGTTCC 2963AATGTATGTT TTAGGAATAT GAGGTCATTA CTATTCATAA TCTGATACAG CTTTATCCTA 3023AGGCCTCTCT TTAAAAACTA CACTGCATCA TAGCTTTTTT GTGCAGTTGG TCTTTCTACT 3083GTTACTGAAC AGTAAGCAAC CTACAGATTC ACTATCACCA ACCAGCCAGT TGATGGATCT 3143TAAGCAAATT ATCAAGCTTG TGATAACCTA AATTATAAAA TGAGGGTGTT GGAATAGTTA 3203CATTCCAAAT CTTCTATAAC ACTCTGTATT ATATTTCTGC CTCATTCCTT GTAG GGT 3260

GlyTTC TTC AGT GCC CGT GGT CAT CGA CCC CTT GAC AAG AAG AGA GAA GAG 3308Phe Phe Ser Ala Arg Gly His Arg Pro Leu Asp Lys Lys Arg Glu Glu40 45 50 55GCT CCC AGC CTG AGG CCT GCC CCA CCG CCC ATC AGT GGA GGT GGC TAT 3356Ala Pro Ser Leu Arg Pro Ala Pro Pro Pro Ile Ser Gly Gly Gly Tyr

60 65 70CGG GCT CGT CCA GCC AAA GCA GCT GCC ACT CAA AAG AAA GTA GAA AGA 3404Arg Ala Arg Pro Ala Lys Ala Ala Ala Thr Gln Lys Lys Val Glu Arg

75 80 85AAA GCC CCT GAT GCT GGA GGC TGT CTT CAC GCT GAC CCA GAC CTG 3449Lys Ala Pro Asp Ala Gly Gly Cys Leu His Ala Asp Pro Asp Leu

90 95 100GTGGGTGCAC TGATGTTTCT TGCAGTGGTG GCTCTCTCAT GCAGAGAAAG CCTGTAGTCA 3509TGGCAGTCTG CTAATGTTTC ACTGACCCAC ATTACCATCA CTGTTATTTT GTTTGTTTAT 3569TTTGGAAATA AAATTCAAAA CATAAACATA TTGGGCCTTT GGTTTAGGCT TTCTTTCTTG 3629TTTTCTTTGG TCTGGGCCCA AAATTTCAAA TTAGGATATG TGGGTGCCAC CTTTCCATTT 3689GTATTTTGCC ACTGCCTTTG TTTAGTTGGT AAAATTTTCA TAGCCCAATT ATATTTTTTC 3749TGGGGTAAGT AATATTTTAA ATCTCTATGA GAGTATGATG ATGACTTTCG AATTTCTGGT 3809CTTACAGAAA ACCAAATAAT AAATTTTTAT GTTGGCTAAT CGTATCGCTG AATTTTCCTA 3869TGTGCTATTT TAACAAATGT CCATGACCCA AATCCTTCAT CTAATGCCTG CTATTTTCTT 3929TGTTTTTAG GGG GTG TTG TGT CCT ACA GGA TGT CAG TTG CAA GAG GCT 3977

Gly Val Leu Cys Pro Thr Gly Cys Gln Leu Gln Glu Ala

105 110 115TTG CTA CAA CAG GAA AGG CCA ATC AGA AAT AGT GTT GAT GAG TTA AAT 4025Leu Leu Gln Gln Glu Arg Pro Ile Arg Asn Ser Val Asp Glu Leu Asn

120 125 130AAC AAT GTG GAA GCT GTT TCC CAG ACC TCC TCT TCT TCC TTT CAG TAC 4073Asn Asn Val Glu Ala Val Ser Gln Thr Ser Ser Ser Ser Phe Gln Tyr

135 140 145ATG TAT TTG CTG AAA GAC CTG TGG CAA AAG AGG CAG AAG CAA GTA AAA G 4122Met Tyr Leu Leu Lys Asp Leu Trp Gln Lys Arg Gln Lys Gln Val Lys

150 155 160GTAGATATCC TTGTGCTTTC CATTCGATTT TCAGCTATAA AATTGGAACC GTTAGACTGC 4182CACGAGAATG CATGGTTGTG AGAAGATTAA CATTTCTGGG TTAGTGAATA GCATTCATAC 4242GCTTTTGGGC ACCTTCCCCT GCAACTTGCC AGATAAGCAC TATTCAGCTC TTATTCCCAG 4302TCTGACATCA GCAAGTGTGA TTTTCTATGA AAAATTCTAC TATGACTCCT TATTTTAAGT 4362ATACAAGAAA CTTGTGACTC AGAAGATAAT ATTTACAGAG TGGAAAAAAA CCCCTAGCAT 4422TTATAGTTTT AACATTTGAG GTTTTGAATG AGAGAGTTAT CCATAATATA TTCAATTGTG 4482TTGTGGATAA TGACACCTAA CCTGTGAATC TTGAGGTCAG AATGTTGAGT GCTGTTGACT 4542TGGTGGTCAG GAAACAGCTA GTGCGTGAGC CTGGCACAGG CATCTCAGTG AGTAGCATAC 4602CCACAGTTGG AAATTTTTCA AAGAAATCAA AGGAATCATG ACATCTTATA AATTTCAAGG 4662TTCTGCTATA CTTATGTGAA ATGGATAAAT AAATCAAGCA TATCCACTCT GTAAGATTGA 4722ACTTCTCAGA TGGAAGACCC CAATACTGCT TTCTCCTCTT TTCCCTCACC AAAGAAATAA 4782ACAACCTATT TCATTTATTA CTGGACACAA TCTTTAGCGT ATACCTATGG TAAATTACTA 4842GTATGGTGGT TAGGATTTTT GTTAATTTGT ATATGTCATG CGCCAAATCA TTTCCACTAA 4902ATATGACTAT ATATCATAAC TGCTTGGTGA TAGCTCAGTG TTTAATAGTT TATTCTCAGA 4962AAATCAAAAT TGTATAGTTA AATACATTAG TTTTATGAGG CAAAAATGCT AACTATTTCT 5022ACATAATTTC ATTTTTCCAG AT AAT GAA AAT GTA GTC AAT GAG TAC TCC 5071

Asp Asn Glu Asn Val Val Asn Glu Tyr Ser

165 170TCA GAA CTG GAA AAG CAC CAA TTA TAT ATA GAT GAG ACT GTG AAT AGC 5119Ser Glu Leu Glu Lys His Gln Leu Tyr Ile Asp Glu Thr Val Asn Ser

175 180 185AAT ATC CCA ACT AAC CTT CGT GTG CTT CGT TCA ATC CTG GAA AAC CTG 5167Asn Ile Pro Thr Asn Leu Arg Val Leu Arg Ser Ile Leu Glu Asn Leu190 195 200 205AGA AGC AAA ATA CAA AAG TTA GAA TCT GAT GTC TCA GCT CAA ATG GAA 5215Arg Ser Lys Ile Gln Lys Leu Glu Ser Asp Val Ser Ala Gln Met Glu

210 215 220TAT TGT CGC ACC CCA TGC ACT GTC AGT TGC AAT ATT CCT GTG GTG TCT 5263Tyr Cys Arg Thr Pro Cys Thr Val Ser Cys Asn Ile Pro Val Val Ser

225 230 235GGC AAA G GTAACTGATT CATAAACATA TTTTTAGAGA GTTCCAGAAG AACTCACACA 5320Gly LysCCAAAAATAA GAGAACAACA ACAACAACAA AAATGCTAAG TGGATTTTCC CAACAGATCA 5380TAATGACATT ACAGTACATC ATAAAAATAT CCTTAGCCAG TTGTGTTTTG GACTGGCCTG 5440GTGCATTTGC TGGTTTTGAT GAGCAGGATG GGGCACAGGT AGTCCCAGGG GTGGCTGATG 5500TGTGCATCTG CGTACTGGCT TGAACAGATG GCAGAACCAC AGATAGATGT AGAAGTTTCT 5560CCATTTTGTG TGTTCTGGGA GCTCATGGAT ATTCCAGGAC ACAAAAGGTG GAGAAGAGCT 5620TTGTTCATCC TCTTAGCAGA TAAACGTCCT CAAAACTGGG TTGGACTTAC TAAAGTAAAA 5680TGAAAATCTA ATATTTGTTA TATTATTTTC AAAGGTCTAT AATAACACAC TCCTTAGTAA 5740CTTATGTAAT GTTATTTTAA AGAATTGGTG ACTAAATACA AAGTAATTAT GTCATAAACC 5800CCTGAACATA ATGTTGTCTT ACATTTGCAG AA TGT GAG GAA ATT ATC AGG AAA 5853

Glu Cys Glu Glu Ile Ile Arg Lys

240 245GGA GGT GAA ACA TCT GAA ATG TAT CTC ATT CAA CCT GAC AGT TCT GTC 5901Gly Gly Glu Thr Ser Glu Met Tyr Leu Ile Gln Pro Asp Ser Ser Val

250 255 260AAA CCG TAT AGA GTA TAC TGT GAC ATG AAT ACA GAA AAT GGA G 5944Lys Pro Tyr Arg Val Tyr Cys Asp Met Asn Thr Glu Asn Gly

265 270 275GTAAGCTTTC GACAGTTGTT GACCTGTTGA TCTGTAATTA TTTGGATACC GTAAAATGCC 6004AGGAAACAAG GCCAGGTGTG GTGGCTCATA CCTGTAATTC CAGCACCTTG GGAGGCCAAA 6064GTGGGCTGAT AGCTTGAGCC TAGGAGTTTG AAACTAGCCT GGGCAACATA ATGAGACCCT 6124AACTCTACAA AAAAAAAAAA AATACCAAAA AAAAAAAAAA AATCAGCTGT GTTGGTAGTA 6184TGTGCCTGTA GTCCCAGCTA TCCAGGAGGC TGAGATGGGA GATCACCTGA GCCCACAACC 6244TGGAGTCTTG ATCATGCTAC TGAACTGTAG CCTGGGCAAC AGAGGATAGT GAGATCCTGT 6304CTCAAAAAAA AAAATTAATT AAAAAGCCAG GAAACAAGAC TTAGCTCTAA CATCTAACAT 6364AGCTGACAAA GGAGTAATTT GATGTGGAAT TCAACCTGAT ATTTAAAAGT TATAAAATAT 6424CTATAATTCA CAATTTGGGG TAAGATAAAG CACTTGCAGT TTCCAAAGAT TTTACAAGTT 6484TACCTCTCAT ATTTATTTCC TTATTGTGTC TATTTTAGAG CACCAAATAT ATACTAAATG 6544GAATGGACAG GGGATTCAGA TATTATTTTC AAAGTGACAT TATTTGCTGT TGGTTAATAT 6604ATGCTCTTTT TGTTTCTGTC AACCAAAG GA TGG ACA GTG ATT CAG AAC CGT 6655

Gly Trp Thr Val Ile Gln Asn Arg

280 285CAA GAC GGT AGT GTT GAC TTT GGC AGG AAA TGG GAT CCA TAT AAA CAG 6703Gln Asp Gly Ser Val Asp Phe Gly Arg Lys Trp Asp Pro Tyr Lys Gln

290 295 300GGA TTT GGA AAT GTT GCA ACC AAC ACA GAT GGG AAG AAT TAC TGT GGC 6751Gly Phe Gly Asn Val Ala Thr Asn Thr Asp Gly Lys Asn Tyr Cys Gly

305 310 315CTA CCA G GTAACGAACA GGCATGCAAA ATAAAATCAT TCTATTTGAA ATGGGATTTT 6808Leu ProTTTTAATTAA AAAACATTCA TTGTTGGAAG CCTGTTTTAG GCAGTTAAGA GGAGTTTCCT 6868GACAAAAATG TGGAAGCTAA AGATAAGGGA AGAAAGGCAG TTTTTAGTTT CCCAAAATTT 6928TATTTTTGGT GAGAGATTTT ATTTTGTTTT TCTTTTAG GT GAA TAT TGG CTT 6980

Gly Glu Tyr Trp Leu

320GGA AAT GAT AAA ATT AGC CAG CTT ACC AGG ATG GGA CCC ACA GAA CTT 7028Gly Asn Asp Lys Ile Ser Gln Leu Thr Arg Met Gly Pro Thr Glu Leu325 330 335 340TTG ATA GAA ATG GAG GAC TGG AAA GGA GAC AAA GTA AAG GCT CAC TAT 7076Leu Ile Glu Met Glu Asp Trp Lys Gly Asp Lys Val Lys Ala His Tyr

345 350 355GGA GGA TTC ACT GTA CAG AAT GAA GCC AAC AAA TAC CAG ATC TCA GTG 7124Gly Gly Phe Thr Val Gln Asn Glu Ala Asn Lys Tyr Gln Ile Ser Val

360 365 370AAC AAA TAC AGA GGA ACA GCC GGT AAT GCC CTC ATG GAT GGA GCA TCT 7172Asn Lys Tyr Arg Gly Thr Ala Gly Asn Ala Leu Met Asp Gly Ala Ser

375 380 385CAG CTG ATG GGA GAA AAC AGG ACC ATG ACC ATT CAC AAC GGC ATG TTC 7220Gln Leu Met Gly Glu Asn Arg Thr Met Thr Ile His Asn Gly Met Phe

390 395 400TTC AGC ACG TAT GAC AGA GAC AAT GAC GGC TG GTATGTGTGG 7262Phe Ser Thr Tyr Asp Arg Asp Asn Asp Gly Trp405 410 415CACTCTTTGC TCCTGCTTTA AAAATCACAC TAATATCATT ACTCAGAATC ATTAACAATA 7322TTTTTAATAG CTACCACTTC CTGGGCACTT ACTGTCAGCC ACTGTCCTAA GCTCTTTATG 7382CATCACTCGA AAGCATTTCA ACTATAAGGT AGACATTCTT ATTCTCATTT TACAGATGAG 7442ATTTAGAGAG ATTACGTGAT TTGTCCAATG TCACACAACT ACCCAGAGAT AAAACTAGAA 7502TTTGAGCACA GTTACTTTCT GAATAATGAG CATTTAGATA AATACCTATA TCTCTATATT 7562CTAAAGTGTG TGTGAAAACT TTCATTTTCA TTTCCAGGGT TCTCTGATAC TAAGGGTTGT 7622AAAAGCTATT ATTCCAGTAT AAAGTAACAA ACACAGTCCC TAGATGGATT GCCACAAAGG 7682CCCAGTTATC TCTCTTTCTT GCTATAGGGC ACAGGAGGTC TTTGGTGTAT TAGTGTGACT 7742CTATGTATAG CACCCAAAGG AAAGACTACT GTGCACACGA GTGTAGCAGT CTTTTATGGG 7802TAATCTGCAA AACGTAACTT GACCACCGTA GTTCTGTTTC TAATAACGCC AAACACATTT 7862TCTTTCAG G TTA ACA TCA GAT CCC AGA AAA CAG TGT TCT AAA GAA GAC 7910

Leu Thr Ser Asp Pro Arg Lys Gln Cys Ser Lys Glu Asp

420 425GGT GGT GGA TGG TGG TAT AAT AGA TGT CAT GCA GCC AAT CCA AAC GGC 7958Gly Gly Gly Trp Trp Tyr Asn Arg Cys His Ala Ala Asn Pro Asn Gly

430 435 440AGA TAC TAC TGG GGT GGA CAG TAC ACC TGG GAC ATG GCA AAG CAT GGC 8006Arg Tyr Tyr Trp Gly Gly Gln Tyr Thr Trp Asp Met Ala Lys His Gly445 450 455 460ACA GAT GAT GGT GTA GTA TGG ATG AAT TGG AAG GGG TCA TGG TAC TCA 8054Thr Asp Asp Gly Val Val Trp Met Asn Trp Lys Gly Ser Trp Tyr Ser

465 470 475ATG AGG AAG ATG AGT ATG AAG ATC AGG CCC TTC TTC CCA CAG CAA TAGTCCCCAA8109Met Arg Lys Met Ser Met Lys Ile Arg Pro Phe Phe Pro Gln Gln

480 485 490TACGTAGATT TTTGCTCTTC TGTATGTGAC AACATTTTTG TACATTATGT TATTGGAATT 8169TTCTTTCATA CATTATATTC CTCTAAAACT CTCAAGCAGA CGTGAGTGTG ACTTTTTGAA 8229AAAAGTATAG GATAAATTAC ATTAAAATAG CACATGATTT TCTTTTGTTT TCTTCATTTC 8289TCTTGCTCAC CCAAGAAGTA ACAAAAGTAT AGTTTTGACA GAGTTGGTGT TCATAATTTC 8349AGTTCTAGTT GATTGCGAGA ATTTTCAAAT AAGGAAGAGG GGTCTTTTAT CCTTGTCGTA 8409GGAAAACCAT GACGGAAAGG AAAAACTGAT GTTTAAAAGT CCACTTTTAA AACTATATTT 8469ATTTATGTAG GATCTGTCAA AGAAAACTTC CAAAAAGATT TATTAATTAA ACCAGACTCT 8529GTTGCAATAA GTTAATGTTT TCTTGTTTTG TAATCCACAC ATTCAATGAG TTAGGCTTTG 8589CACTTGTAAG GAAGGAGAAG CGTTCACAAC CTCAAATAGC TAATAAACCG GTCTTGAATA 8649TTTGAAGATT TAAAATCTGA CTCTAGGACG GGCACGGTGG CTCACGACTA TAATCCCAAC 8709ACTTTGGGAG GCTGAGGCGG GCGGTCACAA GGTCAGGAGT TCAAGACCAG CCTGACCAAT 8769ATGGTGAAAC CCCATCTCTA CTAAAAATAC AAAAATTAGC CAGGCGTGGT GGCAGGTGCC 8829TGTAGGTCCC AGCTAGCCTG TGAGGTGGAG ATTGCATTGA GCCAAGATC 8878(2)SEQ ID NO：4的信息：(i)序列特征(A)长度：491个氨基酸(B)类型：氨基酸(D)拓扑结构：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：4Met Lys Arg Met Val Ser Trp Ser Phe His Lys Leu Lys Thr Met Lys1 5 10 15His Leu Leu Leu Leu Leu Leu Cys Val Phe Leu Val Lys Ser Gln Gly

20 25 30Val Asn Asp Asn Glu Glu Gly Phe Phe Ser Ala Arg Gly His Arg Pro

35 40 45Leu Asp Lys Lys Arg Glu Glu Ala Pro Ser Leu Arg Pro Ala Pro Pro

50 55 60Pro Ile Ser Gly Gly Gly Tyr Arg Ala Arg Pro Ala Lys Ala Ala Ala65 70 75 80Thr Gln Lys Lys Val Glu Arg Lys Ala Pro Asp Ala Gly Gly Cys Leu

85 90 95His Ala Asp Pro Asp Leu Gly Val Leu Cys Pro Thr Gly Cys Gln Leu

100 105 110Gln Glu Ala Leu Leu Gln Gln Glu Arg Pro Ile Arg Asn Ser Val Asp

115 120 125Glu Leu Asn Asn Asn Val Glu Ala Val Ser Gln Thr Ser Ser Ser Ser

130 135 140Phe Gln Tyr Met Tyr Leu Leu Lys Asp Leu Trp Gln Lys Arg Gln Lys145 150 155 160Gln Val Lys Asp Asn Glu Asn Val Val Asn Glu Tyr Ser Ser Glu Leu

165 170 175Glu Lys His Gln Leu Tyr Ile Asp Glu Thr Val Asn Ser Asn Ile Pro

180 185 190Thr Asn Leu Arg Val Leu Arg Ser Ile Leu Glu Asn Leu Arg Ser Lys

195 200 205Ile Gln Lys Leu Glu Ser Asp Val Ser Ala Gln Met Glu Tyr Cys Arg

210 215 220Thr Pro Cys Thr Val Ser Cys Asn Ile Pro Val Val Ser Gly Lys Glu225 230 235 240Cys Glu Glu Ile Ile Arg Lys Gly Gly Glu Thr Ser Glu Met Tyr Leu

245 250 255Ile Gln Pro Asp Ser Ser Val Lys Pro Tyr Arg Val Tyr Cys Asp Met

260 265 270Asn Thr Glu Asn Gly Gly Trp Thr Val Ile Gln Asn Arg Gln Asp Gly

275 280 285Ser Val Asp Phe Gly Arg Lys Trp Asp Pro Tyr Lys Gln Gly Phe Gly

290 295 300Asn Val Ala Thr Asn Thr Asp Gly Lys Asn Tyr Cys Gly Leu Pro Gly305 310 315 320Glu Tyr Trp Leu Gly Asn Asp Lys Ile Ser Gln Leu Thr Arg Met Gly

325 330 335Pro Thr Glu Leu Leu Ile Glu Met Glu Asp Trp Lys Gly Asp Lys Val

340 345 350Lys Ala His Tyr Gly Gly Phe Thr Val Gln Asn Glu Ala Asn Lys Tyr

355 360 365Gln Ile Ser Val Asn Lys Tyr Arg Gly Thr Ala Gly Asn Ala Leu Met

370 375 380Asp Gly Ala Ser Gln Leu Met Gly Glu Asn Arg Thr Met Thr Ile His385 390 395 400Asn Gly Met Phe Phe Ser Thr Tyr Asp Arg Asp Asn Asp Gly Trp Leu

405 410 415Thr Ser Asp Pro Arg Lys Gln Cys Ser Lys Glu Asp Gly Gly Gly Trp

420 425 430Trp Tyr Asn Arg Cys His Ala Ala Asn Pro Asn Gly Arg Tyr Tyr Trp

435 440 445Gly Gly Gln Tyr Thr Trp Asp Met Ala Lys His Gly Thr Asp Asp Gly

450 455 460Val Val Trp Met Asn Trp Lys Gly Ser Trp Tyr Ser Met Arg Lys Met465 470 475 480Ser Met Lys Ile Arg Pro Phe Phe Pro Gln Gln

485 490(2)SEQ ID NO：5的信息：(i)序列特征

(A)长度：10564bp

(B)类型：核酸

(C)链性：双链

(D)拓扑结构：线性(ii)分子类型：DNA(基因组)(vii)来源：

(B)克隆：人纤维蛋白原γ链(ix)特征：

(A)名称/关键词：CDS

(B)位置：连接(1799..1876，1973..2017，2207..2390，2510..2603，

4211..4341，4645..4778，5758..5942，7426..7703

9342..9571)

(xi)序列描述：SEQ ID NO：5CTACACACTT CTTGAAGGCA AAGGCAATGC TGAAGTCACC TTTCATGTTC AAATCATATT 60AAAAAGTTAG CAAGATGTAA TTATCAGTGT ACTATGTAAA TCTTTGTGAA TGATCAATAA 120TTACATATTT TCATTATATA TATTTTAGTA GATAATATTT ATATACATTC AACATTCTAA 180ATATAGAAAG TTTACAGAGA AAAATAAAGC CTTTTTTTCC AATCCTGTCC TCCACCTCTG 240CATCCCATTC TTCTTCACAG AGGCAACTGA TTCAAGTCAT TACATAGTTA TTGAGTGTTA 300ACTACAACTA TGTTAAGTAC AGCTATATAT GTTAGATGCC GTAGCCACAG AAATCAGTTT 360ACAATCTAAT GCAGTGGATA CAGCATGTAT ACATATAATA TAAGGTTGCT ACAAATGCTA 420TCTGAGGTAG AGCTGTTTGA AAGAATACTA ATACTTAAAT GTTTAATTCA ACTGACTTGA 480TTGACAACTG ATTAGCTGAG TGGAAAAGAT GGATGAGAAA GATTGTGAGA CTTAATTGGC 540TGGTGGTATG GTGATATGAT TGACAATAAC TGCTAAGTCA GAGAGGGATA TATTAAGGAG 600GAGAAGAAAA GCAACAAATC TGGTTTTGAT GTGTTCACTT TGTTATAATT ATTGATTATT 660TACTGAATAT GAATATTTAT CTTTGTTTTT GAGTCAATAA ATATACCTTT GTAAAGACAG 720AATTAAAGTA TTAGTATTTC TTTCAAACTG GAGGCATTTC TCCCACTAAC ATATTTCATC 780AAAACTTATA ATAAGCTTGG TTCCAGAGGA AGAAATGAGG GATAACCAAA AATAGAGACA 840TTAATAATAG TGTAACGCCC AGTGATAAAT CTCAATAGGC AGTGATGACA GACATGTTTT 900CCCAAACACA AGGATGCTGT AAGGGCCAAA CAGAAATGAT GGCCCCTCCC CAGCACCTCA 960TTTTGCCCCT TCCTTCAGCT ATGCCTCTAC TCTCCTTTAG ATACAAGGGA GGTGGATTTT 1020TCTCTTCTCT GAGATAGCTT GATGGAACCA CAGGAACAAT GAAGTGGGCT CCTGGCTCTT 1080TTCTCTGTGG CAGATGGGGT GCCATGCCCA CCTTCAGACA AAGGGAAGAT TGAGCTCAAA 1140AGCTCCCTGA GAAGTGAGAG CCTATGAACA TGGTTGACAC AGAGGGACAG GAATGTATTT 1200CCAGGGTCAT TCATTCCTGG GAATAGTGAA CTGGGACATG GGGGAAGTCA GTCTCCTCCT 1260GCCACAGCCA CAGATTAAAA ATAATAATGT TAACTGATCC CTAGGCTAAA ATAATAGTGT 1320TAACTGATCC CTAAGCTAAG AAAGTTCTTT TGGTAATTCA GGTGATGGCA GCAGGACCCA 1380TCTTAAGGAT AGACTAGGTT TGCTTAGTTC GAGGTCATAT CTGTTTGCTC TCAGCCATGT 1440ACTGGAAGAA GTTGCATCAC ACAGCCTCCA GGACTGCCCT CCTCCTCACA GCAATGGATA 1500ATGCTTCACT AGCCTTTGCA GATAATTTTG GATCAGAGAA AAAACCTTGA GCTGGGCCAA 1560AAAGGAGGAG CTTCAACCTG TGTGCAAAAT CTGGGAACCT GACAGTATAG GTTGGGGGCC 1620AGGATGAGGA AAAAGGAACG GGAAAGACCT GCCCACCCTT CTGGTAAGGA GGCCCCGTGA 1680TCAGCTCCAG CCATTTGCAG TCCTGGCTAT CCCAGGAGCT TACATAAAGG GACAATTGGA 1740GCCTGAGAGG TGACAGTGCT GACACTACAA GGCTCGGAGC TCCGGGCACT CAGACATC 1798ATG AGT TGG TCC TTG CAC CCC CGG AAT TTA ATT CTC TAC TTC TAT GCT 1846Met Ser Trp Ser Leu His Pro Arg Asn Leu Ile Leu Tyr Phe Tyr Ala1 5 10 15CTT TTA TTT CTC TCT TCA ACA TGT GTA GCA GTAAGTGTGC TCTTCACAAA 1896Leu Leu Phe Leu Ser Ser Thr Cys Val Ala

20 25ACGTTGTTTA AAATGGAAAG CTGGAAAATA AAACAGATAA TAAACTAGTG AAATTTTCGT 1956ATTTTTTCTC TTTTAG TAT GTT GCT ACC AGA GAC AAC TGC TGC ATC TTA 2005

Tyr Val Ala Thr Arg Asp Asn Cys Cys Ile Leu

30 35GAT GAA AGA TTC GTAAGTAGTT TTTATGTTTC TCCCTTTGTG TGTGAACTGG 2057Asp Glu Arg Phe

40AGAGGGGCAG AGGAATAGAA ATAATTCCCT CATAAATATC ATCTGGCACT TGTAACTTTT 2117TAAAAACATA GTCTAGGTTT TACCTATTTT TCTTAATAGA TTTTAAGAGT AGCATCTGTC 2177TACATTTTTA ATCACTGTTA TATTTTCAG GGT AGT TAT TGT CCA ACT ACC TGT 2230

Gly Ser Tyr Cys Pro Thr Thr Cys

45GGC ATT GCA GAT TTC CTG TCT ACT TAT CAA ACC AAA GTA GAC AAG GAT 2278Gly Ile Ala Asp Phe Leu Ser Thr Tyr Gln Thr Lys Val Asp Lys Asp50 55 60 65CTA CAG TCT TTG GAA GAC ATC TTA CAT CAA GTT GAA AAC AAA ACA TCA 2326Leu Gln Ser Leu Glu Asp Ile Leu His Gln Val Glu Asn Lys Thr Ser

70 75 80GAA GTC AAA CAG CTG ATA AAA GCA ATC CAA CTC ACT TAT AAT CCT GAT 2374Glu Val Lys Gln Leu Ile Lys Ala Ile Gln Leu Thr Tyr Asn Pro Asp

85 90 95GAA TCA TCA AAA CCA A GTGAGAAAAT AAAGACTACT GACCAAAAAA 2420Glu Ser Ser Lys Pro

100TAATAATAAT AATCTGTGAA GTTCTTTTGC TGTTGTTTTA GTTGTTCTAT TTGCTTAAGG 2480ATTTTTATGT CTCTGATCCT ATATTACAG AT ATG ATA GAC GCT GCT ACT TTG 2532

Asn Met Ile Asp Ala Ala Thr Leu

105 110AAG TCC AGG ATA ATG TTA GAA GAA ATT ATG AAA TAT GAA GCA TCG ATT 2580Lys Ser Arg Ile Met Leu Glu Glu Ile Met Lys Tyr Glu Ala Ser Ile

115 120 125TTA ACA CAT GAC TCA AGT ATT CG GTAAGGATTT TTGTTTTAAT TTGCTCTGCA 2633Leu Thr His Asp Ser Ser Ile Arg

130AGACTGATTT AGTTTTTATT TAATATTCTA TACTTGAGTG AAAGTAATTT TTAATGTGTT 2693TTCCCCATTT ATAATATCCC AGTGACATTA TGCCTGATTA TGTTGAGCAT AGTAGAGATA 2753GAAGTTTTTA GTGCAATATA AATTATACTG GGTTATAATT GCTTATTAAT AATCACATTG 2813AAGAAAGATG TTCTAGATGT CTTCAAATGC TAGTTTGACC ATATTTATCA AAAATTTTTT 2873CCCCATCCCC CATTTATCTT ACAACATAAA ATCAATCTCA TAGGAATTTG GGTGTTGAAA 2933ATAAAATCCT CTTTATAAAA ATGCTGACAA ATTGGTGGTT AAAAAAATTA GCAAGCAGAG 2993GCATAGTAAG GATTTTGGCT CCTAAAGTAA ATTATATTGA ATGTGGAGCA GGAAGAAACA 3053TGTCTTGAGA GACTAAGTGT GGCAAATATT GCAAAGCTCA TATTGATCAT TGCAGAATGA 3113ACCTGCATAG TCTCTTCCCT TCATTTGGAA GTGAATGTCT CTGTTAAAGC TTCTCAGGGA 3173CTCATAAACT TTCTGAACAT AAGGTCTCAG ATACAGTTTT AATATTTTTC CCCAATTTTT 3233TTTTCTGAAT TTTTCTCAAA GCAGCTTGAG AAATTGAGAT AAATAGTAGC TAGGGAGAAG 3293TGGCCCAGGA AAGATTTCTC CTCTTTTTGC TATCAGAGGG CCCTTGTTAT TATTGTTATT 3353ATTATTACTT GCATTATTAT TGTCCATCAT TGAAGTTGAA GGAGGTTATT GTACAGAAAT 3413TGCCTAAGAC AAGGTAGAGG GAAAACGTGG ACAAATAGTT TGTCTACCCT TTTTTACTTC 3473AAAGAAAGAA CGGTTTATGC ATTGTAGACA GTTTTCTATC ATTTTTGGAT ATTTGCAAGC 3533CACCCTGTAA GTAACTACAA AAGGAGGGTT TTTACTTCCC CCAGTCCATT CCCAAAGCTA 3593TGTAACCAGA AGCATTAAAG AAGAAAGGGG AAGTATCTGT TGTTTTATTT TACATACAAT 3653AACGTTCCAG ATCATGTCCC TGTGTAAGTT ATATTTTAGA TTGAAGCTTA TATGTATAGC 3713CTCAGTAGAT CCACAAGTGA AAGGTATACT CCTTCAGCAC ATGTGAATTA CTGAACTGAG 3773CTTTTCCTGC TTCTAAAGCA TCAGGGGGTG TTCCTATTAA CCAGTCTCGC CACTCTTGCA 3833GGTTGCTATC TGCTGTCCCT TATGCATAAA GTAAAAAGCA AAATGTCAAT GACATTTGCT 3893TATTGACAAG GACTTTGTTA TTTGTGTTGG GAGTTGAGAC AATATGCCCC ATTCTAAGTA 3953AAAAGATTCA GGTCCACATT GTATTCCTGT TTTAATTGAT TTTTTGATTT GTTTTTCTTT 4013TTCAAAAAGT TTATAATTTT AATTCATGTT AATTTAGTAA TATAATTTTA CATTTTCCTC 4073AAGAATGGAA TAATTTATCA GAAAGCACTT CTTAAGAAAA TACTTAGCAG TTTCCAAAGA 4133AAATATAAAA TTACTCTTCT GAAAGGAATA CTTATTTTTG TCTTCTTATT TTTGTTATCT 4193TATGTTTCTG TTTGTAG A TAT TTG CAG GAA ATA TAT AAT TCA AAT AAT CAA 4244

Tyr Leu Gln Glu Ile Tyr Asn Ser Asn Asn Gln

135 140 145AAG ATT GTT AAC CTG AAA GAG AAG GTA GCC CAG CTT GAA GCA CAG TGC 4292Lys Ile Val Asn Leu Lys Glu Lys Val Ala Gln Leu Glu Ala Gln Cys

150 155 160CAG GAA CCT TGC AAA GAC ACG GTG CAA ATC CAT GAT ATC ACT GGG AAA G 4341Gln Glu Pro Cys Lys Asp Thr Val Gln Ile His Asp Ile Thr Gly Lys

165 170 175GTAACTGATG AAGGTTATAT TGGGATTAGG TTCATCAAAG TAAGTAATGT AAAGGAGAAA 4401GTATGTACTG GAAAGTATAG GAATAGTTTA GAAAGTGGCT ACCCATTAAG TCTAAGAATT 4461TCAGTTGTCT AGACCTTTCT TGAATAGCTA AAAAAAACAG TTTAAAAGGA ATGCTGATGT 4521GAAAAGTAAG AAAATTATTC TTGGAAAATG AATAGTTTAC TACATGTTAA AAGCTATTTT 4581TCAAGGCTGG CACAGTCTTA CCTGCATTTC AAACCACAGT AAAAGTCGAT TCTCCTTCTC 4641TAG AT TGT CAA GAC ATT GCC AAT AAG GGA GCT AAA CAG AGC GGG CTT 4688

Asp Cys Gln Asp Ile Ala Asn Lys Gly Ala Lys Gln Ser Gly Leu

180 185 190TAC TTT ATT AAA CCT CTG AAA GCT AAC CAG CAA TTC TTA GTC TAC TGT 4736Tyr Phe Ile Lys Pro Leu Lys Ala Asn Gln Gln Phe Leu Val Tyr Cys

195 200 205GAA ATC GAT GGG TCT GGA AAT GGA TGG ACT GTG TTT CAG AAG 4778Glu Ile Asp Gly Ser Gly Asn Gly Trp Thr Val Phe Gln Lys

210 215 220GTAATTTTTT CCCCACCATG TGTATTTAAT AAATTCCTAC ATTGTTTCTG CCATATGGCA 4838GATACTTTTC TAAGCACCTT GTGAACCGTA GCTCATTTAA TCCTTGCAAT AGCCCTAAGA 4898GGAAGGTACT TCTGTTACTC CTATTTACAG AAAAGGAAAC TGAGGCACAC AAGGTTAAAT 4958AACTTGCCCA AGACCACATA ACTAATAAGC AACAGAGTCA GCATTTGAAC CTAGGCAGTA 5018TAGTTTCAGA GTTTGTGACT TGACTCTATA TTGTACTGGC ACTGACTTTG TAGATTCATG 5078GTGGCACATA ATCATAGTAC CACAGTGACA AATAAAAAGA AGGAAACTCT TTTGTCAGGT 5138AGGTCAAGAC CTGAGGTTTC CCATCACAAG ATGAGGAAGC CCAACACCAC CCCCCACCAC 5198CCCACCACCA TCACCACCCT TTCACACACC AGAGGATACA CTTGGGCTGC TCCAAGACAA 5258GGAACCTGTG TTGCATCTGC CACTTGCTGA TACCCACTAG GAATCTTGGC TCCTTTACTT 5318TCTGTTTACC TCCCACCACT GTTATAACTG TTTCTACAGG GGGCGCTCAG AGGGAATGAA 5378TGGTGGAAGC ATTAGTTGCC AGACACCGAT TGAGCAATGG GTTCCATCAT AAGTGTAAGA 5438ATCAGTAATA TCCAGCTAGA GTTCTGAAGT CGTCTAGGTG TCTTTTTAAT ATTACCACTC 5498ATTTAGAATT TATGATGTGC CAGAAACCCT CTTAAGTATT TCTCTTATAT TCTCTCTCAT 5558GATCCTTGCA GCAACCCTAA GAAGTAACCA TCATTTTTCC TATTTGATAC ATGAGGAAAC 5618TGAGGTAGCT TGGCCAAGAT CACTTAGTTG GGAGTTGATA GAACCAGTGC TCTGTATTTT 5678TGACAAAATG TTGACAGCAT TCTCTTTACA TGCATTGATA GTCTATTTTC TCCTTTTGCT 5738CTTGCAAATG TGTAATTAG AGA CTT GAT GGC AGT GTA GAT TTC AAG AAA AAC 5790

Arg Leu Asp Gly Ser Val Asp Phe Lys Lys Asn

225 230TGG ATT CAA TAT AAA GAA GGA TTT GGA CAT CTG TCT CCT ACT GGC ACA 5838Trp Ile Gln Tyr Lys Glu Gly Phe Gly His Leu Ser Pro Thr Gly Thr

235 240 245ACA GAA TTT TGG CTG GGA AAT GAG AAG ATT CAT TTG ATA AGC ACA CAG 5886Thr Glu Phe Trp Leu Gly Asn Glu Lys Ile His Leu Ile Ser Thr Gln250 255 260 265TCT GCC ATC CCA TAT GCA TTA AGA GTG GAA CTG GAA GAC TGG AAT GGC 5934Ser Ala Ile Pro Tyr Ala Leu Arg Val Glu Leu Glu Asp Trp Asn Gly

270 275 280AGA ACC AG GTACTGTTTT GAAATGACTT CCAACTTTTT ATTGTAAAGA 5982Arg Thr SerTTGCCTGGAA TGTGCACTTT CCAACTATCA ATAGACAATG GCAAATGCAG CCTGACAAAT 6042GCAAACAGCA CATCCAGCCA CCATTTTCTC CAGGAGTCTG TTTGGTTCTT GGGCAATCCA 6102AAAAGGTAAA TTCTATTCAG GATGAATCTA AGTGTATTGG TACAATCTAA TTACCCTGGA 6162ACCATTCAGA GTAATAGCTA ATTACTGAAC TTTTAATCAG TCCCAGGAAT TGAGCATAAA 6222ATTATAATTT TATCTAGTCT AAATTACTAT TTCATGAAGC AGGTATTATT ATTAATCCCA 6282TTTTATAGAT TAACTTGCTC AAAGTCACAT TGCTGATAAG TGGTAGAGGT AGAATTCAGA 6342CTCAAGTAGT TTAACTTTAG AGCCTGTCCT CTTAACAACT ATCCTGGTTG AAAAGCAAAT 6402ACAGCCTCTT CAGACTTCTC AGTGCCTTGA TGGCCATTTA TTCTGTCAAA TCATGAGCTA 6462CCCTAAAAGT AAACCAGCTA GCTCTTTTGA TGATCTAGAG GCTTCTTTTT GCTTGAGATA 6522TTTGAAGGTT TTAAGCATTG TTACCTAATT AAAATGCAGA AAAATATCCA ACCCTCTTGT 6582TATGTTTAAG GAATAGTGAA ATATATTGTC TTCAAACACA TGGACTTTTT TTTATTGCTT 6642GGTTGGTTTT TAATCCAGAA AGTGCTATAG TCAGTAGACC TTCTTCTAGG AAAGGACCTT 6702CCATTTCCCA GCCACTGGAG ATTAGAAAAT AAGCTAAATA TTTTCTGGAA ATTTCTGTTC 6762ATTCATTAAG GCCCATCCTT TCCCCCACTC TATAGAAGTG TTGTCCACTT GCACAATTTT 6822TTCCAGGAAA GAATCTCTCT AACTCCTTCA GCTCACATGC TTTGGACCAC ACAGGGAAGA 6882CTTTGATTGT GTAATGCCCT CAGAAGCTCT CCTTCTTGCC ACTACCACAC TGATTTGAGG 6942AAGAAAATCC CTTTAGCACC TAACCCTTCA GGTGCTATGA GTGGCTAATG GAACTGTACC 7002TCCTTCAAGT TTTGTGCAAT AATTAAGGGT CACTCACTGT CAGATACTTT CTGTGATCTA 7062TGATAATGTG TGTGCAACAC ATAACATTTC AATAAAAGTA GAAAATATGA AATTAGAGTC 7122ATCTACACAT CTGGATTTGA TCTTAGAATG AAACAAGCAA AAAAGCATCC AAGTGAGTGC 7182AATTATTAGT TTTCAGAGAT GCTTCAAAGG CTTCTAGGCC CATCCCGGGA AGTGTTAATG 7242AGCTGTGGAC TGGTTCACAT ATCTATTGCC TCTTGCCAGA TTTGCAAAAA ACTTCACTCA 7302ATGAGCAAAT TTCAGCCTTA AGAAACAAAG TCAAAAATTC CAAGGAAGCA TCCTACGAAA 7362GAGGGAACTT CTGAGATCCC TGAGGAGGGT CAGCATGTGA TGGTTGTATT TCCTTCTTCT 7422CAG T ACT GCA GAC TAT GCC ATG TTC AAG GTG GGA CCT GAA GCT GAC 7468

Thr Ala Asp Tyr Ala Met Phe Lys Val Gly Pro Glu Ala Asp

285 290 295AAG TAC CGC CTA ACA TAT GCC TAC TTC GCT GGT GGG GAT GCT GGA GAT 7516Lys Tyr Arg Leu Thr Tyr Ala Tyr Phe Ala Gly Gly Asp Ala Gly Asp

300 305 310GCC TTT GAT GGC TTT GAT TTT GGC GAT GAT CCT AGT GAC AAG TTT TTC 7564Ala Phe Asp Gly Phe Asp Phe Gly Asp Asp Pro Ser Asp Lys Phe Phe315 320 325 330ACA TCC CAT AAT GGC ATG CAG TTC AGT ACC TGG GAC AAT GAC AAT GAT 7612Thr Ser His Asn Gly Met Gln Phe Ser Thr Trp Asp Asn Asp Asn Asp

335 340 345AAG TTT GAA GGC AAC TGT GCT GAA CAG GAT GGA TCT GGT TGG TGG ATG 7660Lys Phe Glu Gly Asn Cys Ala Glu Gln Asp Gly Ser Gly Trp Trp Met

350 355 360AAC AAG TGT CAC GCT GGC CAT CTC AAT GGA GTT TAT TAC CAA G 7703Asn Lys Cys His Ala Gly His Leu Asn Gly Val Tyr Tyr Gln

365 370 375GTATGTTTTC CTTTCTTAGA TTCCAAGTTA ATGTATAGTG TATACTATTT TCATAAAAAA 7763TAATAAATAG ATATGAAGAA ATGAAGAATA ATTTATAAAG ATAGTAGGGA TTTTATCATG 7823T1CTTTATTT CAACTAAGTT CTTTGAAACT GGAAGTGGAT AATACCAAGT TCATGCCTAA 7883AATTAGCCCT TCTAAAGAAA TCCACCTGCT GCAAAATATC CAGTAGTTTG GCATTATATG 7943TGAAACTATC ACCATCATAG CTGGCACTGT GGGTTGTGGG ATCTCCTTTA GACATACAAC 8003ATAAATGATC TGGATGGATT AACATTACTA CATGGATGCT TGTTGACACA TTAACCTGGC 8063TTCCCATGAG CTTTGTGTCA GATACACGCA GTGAACAGGT GTTTGGAGGA ACAGAATAAA 8123GAGAAGGCAA GCACTGGTAA GGGCAGGGGT TTGTGAAAGC TTGAGAGAAG AGACCAGTCT 8183GAGGACAGTA GACACTTATT TTAGGATGGG GGTTGGATGA GGAGGCTATA GTTTGCTATA 8243AGCTTGGAAT GGTTTGGAAC ACTGGTTTCA CTCACCTACC CAGCAGTTAT GTGTGGGGAA 8303GCCTTACCGA TGCTAAAGGA TCCATGTTAC AATAATGGCA TTATTTGGAA ATCCCAGTGG 8363TATTCCATGA ATAAAACCAC TATGAAGATA ATCCCACTCA ACAGACTCTC CGTTGGAGAA 8423GGACAGCAAC ACCACCCTGG GAAAGCCAAA CAGTCAGACC AGACCTGTTT AGCATCAGTA 8483GGACTTCCCT ACCATATCTG CTGGGTAGAT GAGTGAAACC AGTGTTCCAA ACCACTCCGG 8543GCTTGTAGCA AACCATAGTC TCCTCATCTA CCAAGATGAG CAACCTTACC TCCTGATGTC 8603CTAGCCAATC ACCAACTAGG AAACTTTGCA CAGTTTATTT AAAGTAACAG TTTGATTTTC 8663ACAATATTTT TAAATTGGAG AAACATAACT TATCTTTGCA CTCACAAACC ACATAATGAG 8723AAGAAACTCT AAGGGAAAAT GCTTGATCTG TGTGACCCGG GGCGCCATGC CAGAGCTGTA 8783GTTCATGCCA GTGTTGTGCT CTGACAAGCC TTTTACAGAA TTACATGAGA TCTGCTTCCC 8843TAGGACAAGG AGAAGGCAAA TCAACAGAGG CTGCACTTTA AAATGGAGAC ATAAAATAAC 8903ATGCCAGAAC CATTTCCTAA AGCTCCTCAA TCAACCAACA AAATTGTGCT TTCAAATAAC 8963CTGAGTTGAC CTCATCAGGA ATTTTGTGGC TCCTTCTCTT CTAACCTGCC TGAAGAAAGA 9023TGGTCCACAG CAGCTGAGTC CGGGATGGAT AAGCTTAGGG ACAGAGGCCA ATTAGGGAAC 9083TTTGGGTTTC TAGCCCTACT AGTAGTGAAT AAATTTAAAG TGTGGATGTG ACTATGAGTC 9143ACAGCACAGA TGTTGTTTAA TAATATGTTT ATTTTATAAA TTGATATTTT AGGAATCTTT 9203GGAGATATTT TCAGTTAGCA GATAATACTA TAAATTTTAT GTAACTGGCA ATGCACTTCG 9263TAATAGACAG CTCTTCATAG ACTTGCAGAG GTAAAAAGAT TCCAGAATAA TGATATGTAC 9323ATCTACGACT TGTTTTAG GT GGC ACT TAC TCA AAA GCA TCT ACT CCT AAT 9373

Gly Gly Thr Tyr Ser Lys Ala Ser Thr Pro Asn

380 385GGT TAT GAT AAT GGC ATT ATT TGG GCC ACT TGG AAA ACC CGG TGG TAT 9421Gly Tyr Asp Asn Gly Ile Ile Trp Ala Thr Trp Lys Thr Arg Trp Tyr

390 395 400TCC ATG AAG AAA ACC ACT ATG AAG ATA ATC CCA TTC AAC AGA CTC ACA 9469Ser Met Lys Lys Thr Thr Met Lys Ile Ile Pro Phe Asn Arg Leu Thr

405 410 415ATT GGA GAA GGA CAG CAA CAC CAC CTG GGG GGA GCC AAA CAG GTC AGA 9517Ile Gly Glu Gly Gln Gln His His Leu Gly Gly Ala Lys Gln Val Arg420 425 430 435CCA GAG CAC CCT GCG GAA ACA GAA TAT GAC TCA CTT TAC CCT GAG GAT 9565Pro Glu His Pro Ala Glu Thr Glu Tyr Asp Ser Leu Tyr Pro Glu Asp

440 445 450GAT TTG TAGAAAATTA ACTGCTAACT TCTATTGACC CACAAAGTTT CAGAAATTCT 9621Asp LeuCTGAAAGTTT CTTCCTTTTT TCTCTTACTA TATTTATTGA TTTCAAGTCT TCTATTAAGG 9681ACATTTAGCC TTCAATGGAA ATTAAAACTC ATTTAGGACT GTATTTCCAA ATTACTGATA 9741TCAGAGTTAT TTAAAAATTG TTTATTTGAG GAGATAACAT TTCAACTTTG TTCCTAAATA 9801TATAATAATA AAATGATTGA CTTTATTTGC ATTTTTATGA CCACTTGTCA TTTATTTTGT 9861CTTCGTAAAT TATTTTCATT ATATCAAATA TTTTAGTATG TACTTAATAA AATAGGAGAA 9921CATTTTAGAG TTTCAAATTC CCAGGTATTT TCCTTGTTTA TTACCCCTAA ATCATTCCTA 9981TTTAATTCTT CTTTTTAAAT GGAGAAAATT ATGTCTTTTT AATATGGTTT TTGTTTTGTT 10041ATATATTCAC AGGCTGGAGA CGTTTAAAAG ACCGTTTCAA AAGAGATTTA CTTTTTTAAA 10101GGACTTTATC TGAACAGAGA GATATAATAT TTTTCCTATT GGACAATGGA CTTGCAAAGC 10161TTCACTTCAT TTTAAGAGCA AAAGACCCCA TGTTGAAAAC TCCATAACAG TTTTATGCTG 10221ATGATAATTT ATCTACATGC ATTTCAATAA ACCTTTTGTT TCCTAAGACT AGATACATGG 10281TACCTTTATT GACCATTAAA AAACCACCAC TTTTTGCCAA TTTACCAATT ACAATTGGGC 10341AACCATCAGT AGTAATTGAG TCCTCATTTT ATGCTAAATG TTATGCCTAA CTCTTTGGGA 10401GTTACAAAGG AAATAGCAAT TATGGCTTTT GCCCTCTAGG AGATACAGGA CAAATACAGG 10461AAAATACAGC AACCCAAACT GACAATACTC TATACAAGAA CATAATCACT AAGCAGGAGT 10521CACAGCCACA CAACCAAGAT GCATAGTATC CAAAGTGCAG CTG 10564(2)SEQ ID NO：6的信息：(i)序列特征

(A)长度：453个氨基酸

(B)类型：氨基酸

(D)拓扑结构：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID N0：6Met Ser Trp Ser Leu His Pro Arg Asn Leu Ile Leu Tyr Phe Tyr Ala1 5 10 15Leu Leu Phe Leu Ser Ser Thr Cys Val Ala Tyr Val Ala Thr Arg Asp

20 25 30Asn Cys Cys Ile Leu Asp Glu Arg Phe Gly Ser Tyr Cys Pro Thr Thr

35 40 45Cys Gly Ile Ala Asp Phe Leu Ser Thr Tyr Gln Thr Lys Val Asp Lys

50 55 60Asp Leu Gln Ser Leu Glu Asp Ile Leu His Gln Val Glu Asn Lys Thr65 70 75 80Ser Glu Val Lys Gln Leu Ile Lys Ala Ile Gln Leu Thr Tyr Asn Pro

85 90 95Asp Glu Ser Ser Lys Pro Asn Met Ile Asp Ala Ala Thr Leu Lys Ser

100 105 110Arg Ile Met Leu Glu Glu Ile Met Lys Tyr Glu Ala Ser Ile Leu Thr

115 120 125His Asp Ser Ser Ile Arg Tyr Leu Gln Glu Ile Tyr Asn Ser Asn Asn

130 135 140Gln Lys Ile Val Asn Leu Lys Glu Lys Val Ala Gln Leu Glu Ala Gln145 150 155 160Cys Gln Glu Pro Cys Lys Asp Thr Val Gln Ile His Asp Ile Thr Gly

165 170 175Lys Asp Cys Gln Asp Ile Ala Asn Lys Gly Ala Lys Gln Ser Gly Leu

180 185 190Tyr Phe Ile Lys Pro Leu Lys Ala Asn Gln Gln Phe Leu Val Tyr Cys

195 200 205Glu Ile Asp Gly Ser Gly Asn Gly Trp Thr Val Phe Gln Lys Arg Leu

210 215 220Asp Gly Ser Val Asp Phe Lys Lys Asn Trp Ile Gln Tyr Lys Glu Gly225 230 235 240Phe Gly His Leu Ser Pro Thr Gly Thr Thr Glu Phe Trp Leu Gly Asn

245 250 255Glu Lys Ile His Leu Ile Ser Thr Gln Ser Ala Ile Pro Tyr Ala Leu

260 265 270Arg Val Glu Leu Glu Asp Trp Asn Gly Arg Thr Ser Thr Ala Asp Tyr

275 280 285Ala Met Phe Lys Val Gly Pro Glu Ala Asp Lys Tyr Arg Leu Thr Tyr

290 295 300Ala Tyr Phe Ala Gly Gly Asp Ala Gly Asp Ala Phe Asp Gly Phe Asp305 310 315 320Phe Gly Asp Asp Pro Ser Asp Lys Phe Phe Thr Ser His Asn Gly Met

325 330 335Gln Phe Ser Thr Trp Asp Asn Asp Asn Asp Lys Phe Glu Gly Asn Cys

340 345 350Ala Glu Gln Asp Gly Ser Gly Trp Trp Met Asn Lys Cys His Ala Gly

355 360 365His Leu Asn Gly Val Tyr Tyr Gln Gly Gly Thr Tyr Ser Lys Ala Ser

370 375 380Thr Pro Asn Gly Tyr Asp Asn Gly Ile Ile Trp Ala Thr Trp Lys Thr385 390 395 400Arg Trp Tyr Ser Met Lys Lys Thr Thr Met Lys Ile Ile Pro Phe Asn

405 410 415Arg Leu Thr Ile Gly Glu Gly Gln Gln His His Leu Gly Gly Ala Lys

420 425 430Gln Val Arg Pro Glu His Pro Ala Glu Thr Glu Tyr Asp Ser Leu Tyr

435 440 445Pro Glu Asp Asp Leu

450(2)SEQ ID NO：7的信息：(i)序列特征

(A)长度：10807bp

(B)类型：核酸

(C)链性：双链

(D)拓扑结构：线性(vii)来源：

(B)克隆：卵β-乳球蛋白(xi)序列描述：SEQ ID NO：7ACGCGTGTCG ACCTGCAGGT CAACGGATCT CTGTGTCTGT TTTCATGTTA GTACCACACT 60GTTTTGGTGG CTGTAGCTTT CAGCTACAGT CTGAAGTCAT AAAGCCTGGT ACCTCCAGCT 120CTGTTCTCTC TCAAGATTGT GTTCTGCTGT TTGGGTCTTT AGTGTCTCCA CACAATTTTT 180AGAATTGTTT GTTCTAGTTC TGTGAAAAAT GATGCTGGTA TTTTGATAAG GATTGCATTG 240AATCTGTAAA GCTACAGATA TAGTCATTGG GTAGTACAGT CACTTTAACA ATATTAACTC 300TTCACATCTG TGAGCATGAT ATATTTTCCC CCTCTATATC ATCTTCAATT CCTCCTATCA 360GTTTCTTTCA TTGCAGTTTT CTGAGTACAG GTCTTACACC TCCTTGGTTA GAGTCATTCC 420TCAGTATTTT ATTCCTTTGA TACAATTGTG AATGAGGTAA TTTTCTTAGT TTCTCTTTCT 480GATAGCTCAT TGTTAGTGTA TATATAGAAA AGCAACAGAT TTCTATGTAT TAATTTTGTA 540TCCTGCAACA GATTTCTATG TATTAATTTT GTATCCTGCT ACTTTACGGA ATTCACTTAT 600TAGCTTTTTG GTGACATCTT GAGGATTTTC TGAAGAAAAT GGCATGGTAT GGTAGGACAA 660GGTGTCATGT CATCTGCAAA CAGTGGCAGT TTTCCTTCTT CCCTTCCAAC CTGGATTTCT 720TTGATTTCTT TCTGTCTGAG TACGACTAGG ATTCCCAATA CTATACCGAA TAAAAGTGGC 780AAGAGTGGAC ATCCTTGTCT TATTTTTCTG ACCTTAGAGG AAATGCTTTC AGTTTTTCAC 840CATTAATTAT AATGTTTACT GTGGGCTTGT CATATGTGGC CTTCATTATA TGGAGGTCTA 900TTCCCTCTAT ACCCACCTTG TTGAGAGTTT TTATCATAAA AGTATGTTGA ATTTTGTCAA 960AAGTTTTTCC TGCATCTATT GAGATGATTT TTACTCTTCA ATTCATTAAT GATTTTTATT 1020CTTCATTTTG TTAATGATTT CCATTCTTCA ATTTGTTAAC GTGGTATATC ACATTGATTG 1080ATTTGTGGAT ACCTTTGTAT CCCTGGGATA AACCTCACTT GATCATGAGC TTTCAATGTA 1140TTTTTGAATT CACTTTGCTA ATATTCTGTT GGGTATTTTT GCATCTCTAT TCATCAATGA 1200TATTGGCCTA AGAAAGGTTT TGTCTGGTTT TAGTATCAGG GTGATGCTGG CCTCATAGAG 1260AGAGTTTAGA AGCATTTCCT CCTCTTTGAT TTTTCGGAAT AGTTTGAGTA GGATAGGTAT 1320TAACTCTTCT TTAAATGTTT GGGGACTTCC CTGGTGAGCC GGTGGTTGAG AATCCGCCTC 1380AGGGATGTGG GTTTGATCCC TGGTCAGGGA ACCATTAATA AGATCCCACA TGCTGCAGGC 1440AACAAGCCCC CAAGCTGCAA CCACTGAGCT GCAACCGCTG CAGTGCCCAC AGGCCACGAC 1500CAGAGAAAGC CCACATACAG CAGGGAAGAC CCAGCACAAC CGGAAAAAGG AGTTTGGTGG 1560AATACAGCTG TGAAGCCGTC TGGTCCTGGA CTCCTGCTTG AGGGAATTTT TTAAAAATTA 1620TTGATTCAAT TTCATTACTG GTAACTGGTC TGTTCATATT TTCTATTTCT TCCGGGTTCA 1680GTCTTGGGAG ATTGTACATG CCTAGGAATG TGTCCGTTTC TTCTAGGTTG TCCATTTTAT 1740TGGACATGCA TGGGAGCACA CAGCACCGAC CAGCGAGACT CATGCTGGCT TCCTGGGGCC 1800AGGCTGGGGC CCCAAGCAGC ATGGCATCCT AGAGTGTGTG AAAGCCCACT GACCCTGCCC 1860AGCCCCACAA TTTCATTCTG AGAAGTGATT CCTTGCTTCT GCACTTACAG GCCCAGGATC 1920TGACCTGCTT CTGAGGAGCA GGGGTTTTGG CAGGACGGGG AGATGCTGAG AGCCGACGGG 1980GGTCCAGGTC CCCTCCCAGG CCCCCCTGTC TGGGGCAGCC CTTGGGAAAG ATTGCCCCAG 2040TCTCCCTCCT ACAGTGGTCA GTCCCAGCTG CCCCAGGCCA GAGCTGCTTT ATTTCCGTCT 2100CTCTCTCTGG ATGGTATTCT CTGGAAGCTG AAGGTTCCTG AAGTTATGAA TAGCTTTGCC 2160CTGAAGGGCA TGGTTTGTGG TCACGGTTCA CAGGAACTTG GGAGACCCTG CAGCTCAGAC 2220GTCCCGAGAT TGGTGGCACC CAGATTTCCT AAGCTCGCTG GGGAACAGGG CGCTTGTTTC 2280TCCCTGGCTG ACCTCCCTCC TCCCTGCATC ACCCAGTTCT GAAAGCAGAG CGGTGCTGGG 2340GTCACAGCCT CTCGCATCTA ACGCCGGTGT CCAAACCACC CGTGCTGGTG TTCGGGGGGC 2400TACCTATGGG GAAGGGCTTC TCACTGCAGT GGTGCCCCCC GTCCCCTCTG AGATCAGAAG 2460TCCCAGTCCG GACGTCAAAC AGGCCGAGCT CCCTCCAGAG GCTCCAGGGA GGGATCCTTG 2520CCCCCCCGCT GCTGCCTCCA GCTCCTGGTG CCGCACCCTT GAGCCTGATC TTGTAGACGC 2580CTCAGTCTAG TCTCTGCCTC CGTGTTCACA CGCCTTCTCC CCATGTCCCC TCCGTGTCCC 2640CGTTTTCTCT CACAAGGACA CCGGACATTA GATTAGCCCC TGTTCCAGCC TCACCTGAAC 2700AGCTCACATC TGTAAAGACC TAGATTCCAA ACAAGATTCC AACCTGAAGT TCCCGGTGGA 2760TGTGAGTTCT GGGGCGACAT CCTTCAACCC CATCACAGCT TGCAGTTCAT CGCAAAACAT 2820GGAACCTGGG GTTTATCGTA AAACCCAGGT TCTTCATGAA ACACTGAGCT TCGAGGCTTG 2880TTGCAAGAAT TAAAGGTGCT AATACAGATC AGGGCAAGGA CTGAAGCTGG CTAAGCCTCC 2940TCTTTCCATC ACAGGAAAGG GGGGCCTGGG GGCGGCTGGA GGTCTGCTCC CGTGAGTGAG 3000CTCTTTCCTG CTACAGTCAC CAACAGTCTC TCTGGGAAGG AAACCAGAGG CCAGAGAGCA 3060AGCCGGAGCT AGTTTAGGAG ACCCCTGAAC CTCCACCCAA GATGCTGACC AGCCAGCGGG 3120CCCCCTGGAA AGACCCTACA GTTCAGGGGG GAAGAGGGGC TGACCCGCCA GGTCCCTGCT 3180ATCAGGAGAC ATCCCCGCTA TCAGGAGATT CCCCCACCTT GCTCCCGTTC CCCTATCCCA 3240ATACGCCCAC CCCACCCCTG TGATGAGCAG TTTAGTCACT TAGAATGTCA ACTGAAGGCT 3300TTTGCATCCC CTTTGCCAGA GGCACAAGGC ACCCACAGCC TGCTGGGTAC CGACGCCCAT 3360GTGGATTCAG CCAGGAGGCC TGTCCTGCAC CCTCCCTGCT CGGGCCCCCT CTGTGCTCAG 3420CAACACACCC AGCACCAGCA TTCCCGCTGC TCCTGAGGTC TGCAGGCAGC TCGCTGTAGC 3480CTGAGCGGTG TGGAGGGAAG TGTCCTGGGA GATTTAAAAT GTGAGAGGCG GGAGGTGGGA 3540GGTTGGGCCC TGTGGGCCTG CCCATCCCAC GTGCCTGCAT TAGCCCCAGT GCTGCTCAGC 3600CGTGCCCCCG CCGCAGGGGT CAGGTCACTT TCCCGTCCTG GGGTTATTAT GACTCTTGTC 3660ATTGCCATTG CCATTTTTGC TACCCTAACT GGGCAGCAGG TGCTTGCAGA GCCCTCGATA 3720CCGACCAGGT CCTCCCTCGG AGCTCGACCT GAACCCCATG TCACCCTTGC CCCAGCCTGC 3780AGAGGGTGGG TGACTGCAGA GATCCCTTCA CCCAAGGCCA CGGTCACATG GTTTGGAGGA 3840GCTGGTGCCC AAGGCAGAGG CCACCCTCCA GGACACACCT GTCCCCAGTG CTGGCTCTGA 3900CCTGTCCTTG TCTAAGAGGC TGACCCCGGA AGTGTTCCTG GCACTGGCAG CCAGCCTGGA 3960CCCAGAGTCC AGACACCCAC CTGTGCCCCC GCTTCTGGGG TCTACCAGGA ACCGTCTAGG 4020CCCAGAGGGG ACTTCCTGCT TGGCCTTGGA TGGAAGAAGG CCTCCTATTG TCCTCGTAGA 4080GGAAGCCACC CCGGGGCCTG AGGATGAGCC AAGTGGGATT CCGGGAACCG CGTGGCTGGG 4140GGCCCAGCCC GGGCTGGCTG GCCTGCATGC CTCCTGTATA AGGCCCCAAG CCTGCTGTCT 4200CAGCCCTCCA CTCCCTGCAG AGCTCAGAAG CACGACCCCA GGGATATCCC TGCAGCCATG 4260AAGTGCCTCC TGCTTGCCCT GGGCCTGGCC CTCGCCTGTG GCGTCCAGGC CATCATCGTC 4320ACCCAGACCA TGAAAGGCCT GGACATCCAG AAGGTTCGAG GGTTGGCCGG GTGGGTGAGT 4380TGCAGGGCGG GCAGGGGAGC TGGGCCTCAG AGAGCCAAGA GAGGCTGTGA CGTTGGGTTC 4440CCATCAGTCA GCTAGGGCCA CCTGACAAAT CCCCGCTGGG GCAGCTTCAA CCAGGCGTTC 4500ACTGTCTTGC ATTCTGGAGG CTGGAAGCCC AAGATCCAGG TGTTGGCAGG GCTGGCTTCT 4560CCTGCGGCCG CTCTCTGGGG AGCAGACGGC CGTCTTCTCC AGTCCTCTGC GCGCCCTGAT 4620TTCCTCTTCC TGTGAGGCCA CCAGGCCTGC TGGAAACACG CCTGCCTGCG CAGCTTCACA 4680CGACCTTTGT CATCTCTTTA AAGGCCATGT CTCCAGAGTC ATGTGTTGAA GTTCTGGGGG 4740TTAGTGGGAC ACAGTTCAGC CCCTAAAAGA GTCTCTCTGC CCCTCAAATT TTCCCCACCT 4800CCAGCCATGT CTCCCCAAGA TCCAAATGTT GCTACATGTG GGGGGGCTCA TCTGGGTCCC 4860TCTTTGGGTT CAGTGTGAGT CTGGGGAGAG CATTCCCCAG GGTGCAGAGT TGGGGGGAGT 4920ATCTCAGGGC TGCCCAGGCC GGGGTGGGAC AGAGAGCCCA CTGTGGGGCT GGGGGCCCCT 4980TCCCACCCCC AGAGTGCAAC TCAAGGTCCC TCTCCAGGTG GCGGGGACTT GGCACTCCTT 5040GGCTATGGCG GCCAGCGACA TCTCCCTGCT GGATGCCCAG AGTGCCCCCC TGAGAGTGTA 5100CGTGGAGGAG CTGAAGCCCA CCCCCGAGGG CAACCTGGAG ATCCTGCTGC AGAAATGGTG 5160GGCGTCTCTC CCCAACATGG AACCCCCACT CCCCAGGGCT GTGGACCCCC CGGGGGGTGG 5220GGTGCAGGAG GGACCAGGGC CCCAGGGCTG GGGAAGAGGG CTCAGAGTTT ACTGGTACCC 5280GGCGCTCCAC CCAAGGCTGC CCACCCAGGG CTTTTTTTTT TTTTAAACTT TTATTAATTT 5340GATGCTTCAG AACATCATCA AACAAATGAA CATAAAACAT TCATTTTTGT TTACTTGGAA 5400GGGGAGATAA AATCCTCTGA AGTGGAAATG CATAGCAAAG ATACATACAA TGAGGCAGGT 5460ATTCTGAATT CCCTGTTAGT CTGAGGATTA CAAGTGTATT TGAGCAACAG AGAGACATTT 5520TCATCATTTC TAGTCTGAAC ACCTCAGTAT CTAAAATGAA CAAGAAGTCC TGGAAACGAA 5580GCAGTGTGGG GATAGGCCCG TGTGAAGGCT GCTGGGAGGC AGCAGACCTG GGTCTTCGGG 5640CTCAAGCAGT TCCCGCTACC AGCCCTGTCC ACCTCAGACG GGGGTCAGGG TGCAGGAGAG 5700AGCTGGATGG GTGTGGGGGC AGAGATGGGG ACCTGAACCC CAGGGCTGCC TTTTGGGGGT 5760GCCTGTGGTC AAGGCTCTCC CTGACCTTTT CTCTCTGGCT TCATCTGACT TCTCCTGGCC 5820CATCCACCCG GTCCCCTGTG GCCTGAGGTG ACAGTGAGTG CGCCGAGGCT AGTTGGCCAG 5880CTGGCTCCTA TGCCCATGCC ACCCCCCTCC AGCCCTCCTG GGCCAGCTTC TGCCCCTGGC 5940CCTCAGTTCA TCCTGATGAA AATGGTCCAT GCCAATGGCT CAGAAAGCAG CTGTCTTTCA 6000GGGAGAACGG CGAGTGTGCT CAGAAGAAGA TTATTGCAGA AAAAACCAAG ATCCCTGCGG 6060TGTTCAAGAT CGATGGTGAG TCCGGGTCCC TGGGGGACAC CCACCACCCC CGCCCCCGGG 6120GACTGTGGAC AGGTTCAGGG GGCTGGCGTC GGGCCCTGGG ATGCTAAGGG ACTGGTGGTG 6180ATGAAGACAC TGCCTTGACA CCTGCTTCAC TTGCCTCCCC TGCCACCTGC CCGGGGCCTT 6240GGGGCGGTGG CCATGGGCAG GTCCCGGCTG GCGGGCTAAC CCACCAGGGT GACACCCGAG 6300CTCTCTTTGC TGGGGGGCGG GCGGTGCTCT GGGCCCTCAG GCTGAGCTCA GGAGGTACCT 6360GTGCCCTCCC AGGGGTAACC GAGAGCCGTT GCCCACTCCA GGGGCCCAGG TGCCCCACGA 6420CCCCAGCCCG CTCCACAGCT CCTTCATCTC CTGGAGACAA ACTCTGTCCG CCCTCGCTCA 6480TTCACTTGTT CGTCCTAAAT CCGAGATGAT AAAGCTTCGA GGGGGGGTTG GGGTTCCATC 6540AGGGCTGCCC TTCCGCCGGG CAGCCTGGGC CACATCTGCC CTTGGCCCCC TCAGGACTCA 6600CTCTGACTGG AGGCCCTGCA CTGACTGACG CCAGGGTGCC CAGCCCAGGG TCTCTGGCGC 6660CATCCAGCTG CACTGGGTTT GGGTGCTGGT CCTGCCCCCA AGCTGCCCGG ACACCACAGG 6720CAGCCGGGGC TGCCCACTGG CCTCGGTCAG GGTGAGCCCC AGCTGCCCCC GCTCAGGGCT 6780TGCCCCGACA ATGACCCCAT CCTCAGGACG CACCCCCCTT CCCTTGCTGG GCAGTGTCCA 6840GCCCCACCCG AGATCGGGGG AAGCCCTATT TCTTGACAAC TCCAGTCCCT GGGGGAGGGG 6900GCCTCAGACT GAGTGGTGAG TGTTCCCAAG TCCAGGAGGT GGTGGAGGGT CCTGGCGGAT 6960CCAGAGTTGA CAGTGAGGGC TTCCTGGGCC CCATGCGCCT GGCAGTGGCA GCAGGGAAGA 7020GGAAGCACCA TTTCAGGGGT GGGGGATGCC AGAGGCGCTC CCCACCCCGT CTTCGCCGGG 7080TGGTGACCCC GGGGGAGCCC CGCTGGTCGT GGAGGGTGCT GGGGGCTGAC TAGCAACCCC 7140TCCCCCCCCG TTGGAACTCA CTTTTCTCCC GTCTTGACCG CGTCCAGCCT TGAATGAGAA 7200CAAAGTCCTT GTGCTGGACA CCGACTACAA AAAGTACCTG CTCTTCTGCA TGGAAAACAG 7260TGCTGAGCCC GAGCAAAGCC TGGCCTGCCA GTGCCTGGGT GGGTGCCAAC CCTGGCTGCC 7320CAGGGAGACC AGCTGCGTGG TCCTTGCTGC AACAGGGGGT GGGGGGTGGG AGCTTGATCC 7380CCAGGAGGAG GAGGGGTGGG GGGTCCCTGA GTCCCGCCAG GAGAGAGTGG TCGCATACCG 7440GGAGCCAGTC TGCTGTGGGC CTGTGGGTGG CTGGGGACGG GGGCCAGACA CACAGGCCGG 7500GAGACGGGTG GGCTGCAGAA CTGTGACTGG TGTGACCGTC GCGATGGGGC CGGTGGTCAC 7560TGAATCTAAC AGCCTTTGTT ACCGGGGAGT TTCAATTATT TCCCAAAATA AGAACTCAGG 7620TACAAAGCCA TCTTTCAACT ATCACATCCT GAAAACAAAT GGCAGGTGAC ATTTTCTGTG 7680CCGTAGCAGT CCCACTGGGC ATTTTCAGGG CCCCTGTGCC AGGGGGGCGC GGGCATCGGC 7740GAGTGGAGGC TCCTGGCTGT GTCAGCCGGC CCAGGGGGAG GAAGGGACCC GGACAGCCAG 7800AGGTGGGGGG CAGGCTTTCC CCCTGTGACC TGCAGACCCA CTGCACTGCC CTGGGAGGAA 7860GGGAGGGGAA CTAGGCCAAG GGGGAAGGGC AGGTGCTCTG GAGGGCAAGG GCAGACCTGC 7920AGACCACCCT GGGGAGCAGG GACTGACCCC CGTCCCTGCC CCATAGTCAG GACCCCGGAG 7980GTGGACAACG AGGCCCTGGA GAAATTCGAC AAAGCCCTCA AGGCCCTGCC CATGCACATC 8040CGGCTTGCCT TCAACCCGAC CCAGCTGGAG GGTGAGCACC CAGGCCCCGC CCTTCCCCAG 8100GGCAGGAGCC ACCCGGCCCC GGGACGACCT CCTCCCATGG TGACCCCCAG CTCCCCAGGC 8160CTCCCAGGAG GAAGGGGTGG GGTGCAGCAC CCCGTGGGGG CCCCCTCCCC ACCCCCTGCC 8220AGGCCTCTCT TCCCGAGGTG TCCAGTCCCA TCCTGACCCC CCCATGACTC TCCCTCCCCC 8280ACAGGGCAGT GCCACGTCTA GGTGAGCCCC TGCCGGTGCC TCTGGGGTAA GCTGCCTGCC 8340CTGCCCCACG TCCTGGGCAC ACACATGGGG TAGGGGGTCT TGGTGGGGCC TGGGACCCCA 8400CATCAGGCCC TGGGGTCCCC CCTGTGAGAA TGGCTGGAAG CTGGGGTCCC TCCTGGCGAC 8460TGCAGAGCTG GCTGGCCGCG TGCCACTCTT GTGGGTGACC TGTGTCCTGG CCTCACACAC 8520TGACCTCCTC CAGCTCCTTC CAGCAGAGCT AAGGCTAAGT GAGCCAGAAT GGTACCTAAG 8580GGGAGGCTAG CGGTCCTTCT CCCGAGGAGG GGCTGTCCTG GAACCACCAG CCATGGAGAG 8640GCTGGCAAGG GTCTGGCAGG TGCCCCAGGA ATCACAGGGG GGCCCCATGT CCATTTCAGG 8700GCCCGGGAGC CTTGGACTCC TCTGGGGACA GACGACGTCA CCACCGCCCC CCCCCCATCA 8760GGGGGACTAG AAGGGACCAG GACTGCAGTC ACCCTTCCTG GGACCCAGGC CCCTCCAGGC 8820CCCTCCTGGG GCTCCTGCTC TGGGCAGCTT CTCCTTCACC AATAAAGGCA TAAACCTGTG 8880CTCTCCCTTC TGAGTCTTTG CTGGACGACG GGCAGGGGGT GGAGAAGTGG TGGGGAGGGA 8940GTCTGGCTCA GAGGATGACA GCGGGGCTGG GATCCAGGGC GTCTGCATCA CAGTCTTGTG 9000ACAACTGGGG GCCCACACAC ATCACTGCGG CTCTTTGAAA CTTTCAGGAA CCAGGGAGGG 9060ACTCGGCAGA GACATCTGCC AGTTCACTTG GAGTGTTCAG TCAACACCCA AACTCGACAA 9120AGGACAGAAA GTGGAAAATG GCTGTCTCTT AGTCTAATAA ATATTGATAT GAAACTCAAG 9180TTGCTCATGG ATCAATATGC CTTTATGATC CAGCCAGCCA CTACTGTCGT ATCAACTCAT 9240GTACCCAAAC GCACTGATCT GTCTGGCTAA TGATGAGAGA TTCCCAGTAG AGAGCTGGCA 9300AGAGGTCACA GTGAGAACTG TCTGCACACA CAGCAGAGTC CACCAGTCAT CCTAAGGAGA 9360TCAGTCCTGG TGTTCATTGG AGGACTGATG TTGAAGCTGA AACTCCAATG CTTTGGCCAC 9420CTGATGTGAA GAGCTGACTC ATTTGAAAAG ACCCTGATGC TGGGAAAGAT TGAGGGCAGG 9480AGGAGAAGGG GACGACAGAG GATGAGATGG TTGGATGGCA TCACCAACAC AATGGACATG 9540GGTTTGGGTG GACTCCAGGA GTTGGTGATG GACAGGGAGG CCTGGCGTGC TACGGAAGCG 9600GTTTATGGGG TCACAAAGAC TGAGTGACTG AACTGAGCTG AACTGAATGG AAATGAGGTA 9660TACAGCAAAG TGGGGATTTT TTAGATAATA AGAATATACA CATAACATAG TGTATACTCA 9720TATTTTTATG CATACCTGAA TGCTCAGTCA CTCAGTCGTA TCTGACTCTG TGACCTATGG 9780ACCGTAGCCT TCCAGGTTTC TTCTGTCCAC AGAATTCTCC AAGGCAAGAA TACTGGAGTG 9840GGTAGCCATT TCCTCCTCCA GGGGATCCTC CCGACCCAGG GATTGAACCG GCATCTCCTG 9900TATTGGCAGG TGGATTCTTT ACCACTGTGC CACCAGGGAA GCCCGTGTTA CTCTCTATGT 9960CCCACTTAAT TACCAAAGCT GCTCCAAGAA AAAGCCCCTG TGCCCTCTGA GCTTCCCGGC 10020CTGCAGAGGG TGGTGGGGGT AGACTGTGAC CTGGGAACAC CCTCCCGCTT CAGGACTCCC 10080GGGCCACGTG ACCCACAGTC CTGCAGACAG CCGGGTAGCT CTGCTCTTCA AGGCTCATTA 10140TCTTTAAAAA AAACTGAGGT CTATTTTGTG ACTTCGCTGC CGTAACTTCT GAACATCCAG 10200TGCGATGGAC AGGACCTCCT CCCCAGGCCT CAGGGGCTTC AGGGAGCCAG CCTTCACCTA 10260TGAGTCACCA GACACTCGGG GGTGGCCCCG CCTTCAGGGT GCTCACAGTC TTCCCATCGT 10320CCTGATCAAA GAGCAAGACC AATGACTTCT TAGGAGCAAG CAGACACCCA CAGGACACTG 10380AGGTTCACCA GAGCTGAGCT GTCCTTTTGA ACCTAAAGAC ACACAGCTCT CGAAGGTTTT 10440CTCTTTAATC TGGATTTAAG GCCTACTTGC CCCTCAAGAG GGAAGACAGT CCTGCATGTC 10500CCCAGGACAG CCACTCGGTG GCATCCGAGG CCACTTAGTA TTATCTGACC GCACCCTGGA 10560ATTAATCGGT CCAAACTGGA CAAAAACCTT GGTGGGAAGT TTCATCCCAG AGGCCTCAAC 10620CATCCTGCTT TGACCACCCT GCATCTTTTT TTCTTTTATG TGTATGCATG TATATATATA 10680TATATATTTT TTTTTTTTTC ATTTTTTGGC TGTGCTGGCT GTTCGTTGCA GTTCGGTGCG 10740CAGGCTTCTC TCTAGTTTCT CTCTAGTCTT CTCTTATCAC AGAGCAGTCT CTAGACGATC 10800GACGCGT 10807(2)SEQ ID NO：8的信息：(i)序列特征

(A)长度：47bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(xi)序列描述：SEQ ID NO：8AATTCCGATC GACGCGTCGA CGATATACTC TAGACGATCG ACGCGTA 47(2)SEQ ID NO：9的信息：(i)序列特征

(A)长度：24bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：BLGAMP3(xi)序列描述：SEQ ID NO：9TGGATCCCCT GCCGGTGCCT CTGG 24(2)SEQ ID NO：10的信息：(i)序列特征

(A)长度：24bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：BLGAMP4(xi)序列描述：SEQ ID NO：10AACGCGTCAT CCTCTGTGAG CCAG 24(2)SEQ ID NO：11的信息：(i)序列特征

(A)长度：10bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6839(xi)序列描述：SEQ ID NO：11ACTACGTAGT 10(2)SEQ ID NO：12的信息：(i)序列特征

(A)长度：42bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6632(xi)序列描述：SEQ ID NO：12CGACGCGGAT CCTACGTACC TGCAGCCATG TTTTCCATGA GG 42(2)SEQ ID NO：13的信息：(i)序列特征

(A)长度：21bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6627(xi)序列描述：SEQ ID NO：13AGGGCTTCGG CAAGCTTCAG G 21(2)SEQ ID NO：14的信息：(i)序列特征

(A)长度：24bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6521(xi)序列描述：SEQ ID NO：14GCCAAAGACT TACTTCCCTC TAGA 24(2)SEQ ID NO：15的信息：(i)序列特征

(A)长度：30bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性((vii)来源：

(B)克隆：ZC6520(xi)序列描述：SEQ ID NO：15GCATGAACGT CGCGTGGTGG TTGTGCTACC 30(2)SEQ ID NO：16的信息：(i)序列特征

(A)长度：30bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6519(xi)序列描述：SEQ ID NO：16ACCACGCGAC GTTCATGCTC TAAAACCGTT 30(2)SEQ ID NO：17的信息：(i)序列特征

(A)长度：36bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6518(xi)序列描述：SEQ ID NO：17GCTGCGGGAT CCTACGTACT AGGGGGACAG GGAAGG 36(2)SEQ ID NO：18的信息：(i)序列特征

(A)长度：45bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6629(xi)序列描述：SEQ ID NO：18CGACGCGAAT TCTACGTACC TGCAGCCATG AAAAGGATGG TTTCT 45(2)SEQ ID NO：19的信息：(i)序列特征

(A)长度：45bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6630(xi)序列描述：SEQ ID NO：19CGACGCGAAT TCTACGTACC TGCAGCCATG AAACATCTAT TATTG 45(2)SEQ ID NO：20的信息：(i)序列特征

(A)长度：21bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6625(xi)序列描述：SEQ ID NO：20GTGAGATTTT CAGATCTTGT C 21(2)SEQ ID NO：21的信息：(i)序列特征

(A)长度：21bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6626(xi)序列描述：SEQ ID NO：21AAGAATTACT GTGGCCTACC A 21(2)SEQ ID NO：22的信息：(i)序列特征

(A)长度：33bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6624(xi)序列描述：SEQ ID NO：22GCTGCGGAAT TCTACGTACT ATTGCTGTGG GAA 33(2)SEQ ID NO：23的信息：(i)序列特征

(A)长度：45bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6514(xi)序列描述：SEQ ID NO：23CGACGCGGAT CCTACGTACC TGCAGCCATG AGTTGGTCCT TGCAC 45(2)SEQ ID NO：24的信息：(i)序列特征

(A)长度：21bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6517(xi)序列描述：SEQ ID NO：24GTCTCTGGTA GCAACATACT A 21(2)SEQ ID NO：25的信息：(i)序列特征

(A)长度：22bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6516(xi)序列描述：SEQ ID NO：25GGGTTTCTAG CCCTACTAGT AG 22(2)SEQ ID NO：26的信息：(i)序列特征

(A)长度：22bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(vii)来源：

(B)克隆：ZC6515(xi)序列描述：SEQ ID NO：26GGGTTTCTAG CCCTACTAGT AG 22(2)SEQ ID NO：27的信息：(i)序列特征

(A)长度：47bp

(B)类型：核酸

(C)链性：单链

(D)拓扑结构：线性(xi)序列描述：SEQ ID NO：27AAGCTACGCG TCGATCGTCT AGAGTATATC GTCGACGCGT CGATCGG 47

Claims

1.一种生产纤维蛋白原的方法，包括：

提供编码与纤维蛋白原Aα链相连接的分泌信号的第一条DNA片段，编码与纤维蛋白原Bβ链相连接的分泌信号的第二条DNA片段，和编码与纤维蛋白原γ链相连接的分泌信号的第三条DNA片段，其中第一、第二、第三条片段中的每一条都与在雌性哺乳动物宿主的乳腺中表达其所需要的附加的DNA片段相连接，且第一条DNA片段包含编码具有SEQ ID NO：2所示氨基酸序列的人纤维蛋白原Aα链的核苷酸序列，第二条DNA片段包含编码具有SEQ IDNO：4所示氨基酸序列的人纤维蛋白原Bβ链的核苷酸序列，第三条DNA片段包含具有SEQ ID NO：6所示氨基酸序列的人纤维蛋白原γ链的核苷酸序列；

将所说的DNA片段导入一个非人类哺乳动物物种的受精卵；

将所说的受精卵植入所说的物种的雌性动物的输卵管或子宫内，以获得带有所说的DNA结构的后代；

繁殖所说的后代以产生雌性后裔，来表达所说的第一、第二、第三条DNA片段并生产出含有由这些片段编码的生物感受态的纤维蛋白原的乳汁；

从所说的雌性后裔中收集乳汁；

从这些乳汁中回收纤维蛋白原。

2.根据权利要求1的方法，其中所说的物种选自由绵羊，猪，山羊和牛组成的一组。

3.根据权利要求1的方法，其中所说的第一，第二和第三条DNA片段中的每一条包括一个内含子。

4.根据权利要求1的方法，其中所说的第一，第二和第三条DNA片段的摩尔比在范围0.5-1∶0.5-1∶0.5-1范围之内。

5.根据权利要求1的方法，其中所说的第一，第二和第三条DNA片段中的每一条都连接有选自酪蛋白，β-乳球蛋白，α-乳清蛋白以及乳清酸性蛋白基因启动子组成的一组中的一个转录启动子。

6.根据权利要求1的方法，其中所说的第一，第二和第三条DNA片段在β-乳球蛋白启动子的控制之下表达。

7.根据权利要求1的方法，其中所说的导入步骤包括向所说的受精卵的一个原核中注射所说的第一，第二和第三条DNA片段。

8.根据权利要求1的方法，其中所说的纤维蛋白原是人类纤维蛋白原。

9.根据权利要求1的方法，其中所说的第二条DNA片段包括如SEQ ID NO：3所示的从470位-8100位核苷酸的核苷酸序列。

10.根据权利要求1的方法，其中所说的第二条DNA片段包括如SEQ ID NO：3所示的从512位-8100位核苷酸的核苷酸序列。

11.一种生产纤维蛋白原的方法，包括：

将编码与纤维蛋白原Aα链相连的分泌信号的第一条DNA片段掺入β-乳球蛋白基因，生产出第一个融合基因，其中第一条DNA片段包含编码具有SEQ ID NO：2所示氨基酸序列的人纤维蛋白原Aα链的核苷酸序列；

将编码与纤维蛋白原Bβ链相连的分泌信号的第二条DNA片段掺入β-乳球蛋白基因，生产出第二个融合基因，其中第二条DNA片段包含编码具有SEQ ID NO：4所示氨基酸序列的人纤维蛋白原Bβ链的核苷酸序列；

将编码与纤维蛋白原γ链相连的分泌信号的第三条DNA片段掺入β-乳球蛋白基因，生产出第三个融合基因，其中第三条DNA片段包含编码具有SEQ ID NO：6所示氨基酸序列的人纤维蛋白原γ链的核苷酸序列；

将所说的第一、第二、第三个融合基因导入一非人类哺乳动物的种系，使得所说的DNA片段在该哺乳动物或其雌性后裔的乳腺中表达，并且生物感受态的纤维蛋白原分泌到该哺乳动物或其雌性后裔中的乳汁中；

从所说的哺乳动物或其雌性后裔中获得乳汁；

从所说的乳汁中回收所说的纤维蛋白原。

12.根据权利要求11的方法，其中所说的哺乳动物是绵羊，猪，山羊或牛。

13.根据权利要求11的方法，其中所说的第一，第二和第三个融合基因中的每一个包括一个内含子。

14.根据权利要求11的方法，其中所说的第一，第二和第三个融合基因的摩尔比在0.5-1∶0.5-1∶0.5-1范围之内。

15.根据权利要求11的方法，其中所说的导入步骤包括向所说的受精卵的一个原核中注射所说的第一，第二和第三个融合基因，并将所说的卵植入假孕的雌性动物的输卵管，以产生在其种系中带有所说的融合基因的雌性后代。

16.一种生产纤维蛋白原的方法，包括：

提供一种非人类的转基因雌性哺乳动物，在其种系中带有分别编码具有SEQ ID NO：2所示氨基酸序列的人纤维蛋白原Aα链、具有SEQ ID NO：4所示氨基酸序列的人纤维蛋白原Bβ链和具有SEQID NO：6所示氨基酸序列的人纤维蛋白原γ链的异源DNA片段，其中所说的DNA片段在所说的哺乳动物的乳腺中表达而所说的DNA片段所编码的纤维蛋白原分泌到所说的哺乳动物的乳汁中；

从所说的哺乳动物中收集乳汁；

从所说的乳汁中回收所说的纤维蛋白原。

17.根据权利要求16的方法，其中所说的哺乳动物是绵羊，猪，山羊或牛。

18.一种生产哺乳动物的转基因后代的方法，包括：

提供编码纤维蛋白原Aα链的第一条DNA片段，编码纤维蛋白原Bβ链的第二条DNA片段，和编码纤维蛋白原γ链的第三条DNA片段，其中第一、第二、第三条片段中的每一条都与在雌性哺乳动物宿主的乳腺中表达与分泌到所说的宿主雌性哺乳动物的乳汁中所需要的附加的DNA链相连接，且第一条DNA片段包含编码具有SEQID NO：2所示氨基酸序列的人纤维蛋白原Aα链的核苷酸序列，第二条DNA片段包含编码具有SEQ ID NO：4所示氨基酸序列的人纤维蛋白原Bβ链的核苷酸序列，第三条DNA片段包含具有SEQ IDNO：6所示氨基酸序列的人纤维蛋白原γ链的核苷酸序列；

将所说的DNA片段导入一个非人类哺乳动物的受精卵；

将所说的受精卵植入所说的非人类物种的雌性动物的输卵管或子宫内，以获得带有所说的第一、第二和第三条DNA片段的后代。

19.根据权利要求18的方法，其中所说的后代是雌性的。

20.根据权利要求18的方法，其中所说的后代是雄性的。