CN1079433C - 在转基因动物中生产纤维蛋白原 - Google Patents

在转基因动物中生产纤维蛋白原 Download PDF

Info

Publication number
CN1079433C
CN1079433C CN95191945A CN95191945A CN1079433C CN 1079433 C CN1079433 C CN 1079433C CN 95191945 A CN95191945 A CN 95191945A CN 95191945 A CN95191945 A CN 95191945A CN 1079433 C CN1079433 C CN 1079433C
Authority
CN
China
Prior art keywords
fibrinogen
dna fragmentation
ser
chain
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN95191945A
Other languages
English (en)
Other versions
CN1144539A (zh
Inventor
伊恩·加纳
迈克尔·A·达尔林普尔
唐娜·E·普伦克德
唐纳德·C·福斯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LFB SA
Original Assignee
Pharmaceutical Proteins Ltd
Zymogenetics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=22765288&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1079433(C) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Pharmaceutical Proteins Ltd, Zymogenetics Inc filed Critical Pharmaceutical Proteins Ltd
Publication of CN1144539A publication Critical patent/CN1144539A/zh
Application granted granted Critical
Publication of CN1079433C publication Critical patent/CN1079433C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Knock-in vertebrates, e.g. humanised vertebrates
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4717Plasma globulins, lactoglobulin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4732Casein
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/75Fibrinogen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/89Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microinjection
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/103Ovine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/01Animal expressing industrially exogenous proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Toxicology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Veterinary Medicine (AREA)
  • Environmental Sciences (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Hematology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本发明公开了在转基因非人类哺乳动物中生产纤维蛋白原的材料与方法。编码纤维蛋白原Aα,Bβ和γ链的DNA片段导入非人类哺乳动物的种系,该哺乳动物及其雌性后裔生产含有导入的DNA所表达的纤维蛋白原的乳汁。还公开了带有编码异源纤维蛋白原多肽链的DNA片段的非人类哺乳动物胚胎和转基因非人类哺乳动物。

Description

在转基因动物中生产纤维蛋白原
发明背景
血液凝集系列反应的最后一步是由凝血酶催化将可溶性的血浆蛋白纤维蛋白原转化为不溶性的纤维蛋白。凝血酶从纤维蛋白原的三条组成链之一(Aα)上切下一条小肽(纤维蛋白肽A)。随后纤维蛋白发生聚合,并在凝血因子XIII的激活下交联形成稳定的血栓。
纤维蛋白原是生物组织胶的一个关键成分(见U.S.Patent Nos.4,377,572和4,442,655),生物组织胶能模拟自然血栓的形成,启动止血过程及修复受损组织。组织胶提供缝合线,卡钉以及其它缝合伤口的机械方法的附件或替代品。然而,这些产品的基本组分(纤维蛋白原,因子XIII和凝血酶)是从人的血浆库中通过低温沉淀(例如U.S.Patent Nos.4,377,572;4,362,567;4,909,251)或乙醇沉淀(例如U.S.PatentNos.4,442,655)或者是从单一提供者血浆中(如U.S.Patent No.4,627,879,Spotnitzet al.,Am.Surg.55:166-168,1989)制备的。得到的纤维蛋白原/因子XIII制剂在使用前迅速与牛凝血酶混合,将纤维蛋白原转变成纤维蛋白,并激活因子XIII,由此开始粘合剂的凝聚过程。
市场上可得到的粘合剂来源于血库中的血浆,由于血源产品已伴随有人免疫缺陷病毒(HIV),肝炎病毒和其它致病原的传播,因此限制了这类粘合剂的可接受性和可得性,现在它们在美国已禁止使用。
使用自体血浆可降低疾病传播的危险,但自体粘合剂仅能使用于有选择的外科手术中,而且患者要预先提供所需的血液。
如上所述,纤维蛋白原由三种多肽链组成,每一种在装配好的分子中以双体存在。这些被命名为Aα,Bβ和γ链的多肽链,在肝脏中协调表达,装配和分泌。尽管可预期重组DNA技术已能提供一种替代方法来代替从血浆中分离纤维蛋白原,这一点已证明是有困难的。三种纤维蛋白原多肽链已分别单独在E.coli中表达(Lord,DNA 4:33-38,1985;Bolyard and Lord,Gene 66:183-192,1988;Bolyard and Lord,Blood 73:1202-1206),但有功能的纤维蛋白原还没能在真核系统中生产出来。生物感受态纤维蛋白原在酵母中的表达还未见报道。培养的转染的哺乳动物细胞已被用来表达生物感受态纤维蛋白原(Farrell et al.,Blood 74:55a,1989;Hartwig and Danishefsky,J.Biol。Chem.266:6578-6585,1991;Farrell et al.,Biochemistry 30:9414-9420,1991),但表达水平之低使得生产商业数量的重组纤维蛋白原不具可行性。实验证据说明,与肝脏相比,培养细胞中的较低的转录效率可能是表达水平低的一个原因,但在转染的BHK细胞中增加纤维蛋白原链的mRNA的总量并没有引起纤维蛋白原蛋白分泌的相应增加(Prunkard and Forster,XIV Congress of the International Society on Thrombosisand Haemostasis,1993)。后面的这些结果暗示,纤维蛋白原的正确装配与加工有一些组织特异性的机制,而这些机制在普通的实验条件下的细胞株中并不存在。
现有技术中还需要生产大量的高质量的用于组织粘合剂和其它用途的纤维蛋白原的方法,更需要的是不含血液病原体的纤维蛋白原。本发明满足了这些需要并提供了其它有关的优势。
发明概述
本发明的一个目的是提供商用数量的重组纤维蛋白原,尤其是重组人纤维蛋白原。本发明的另一个目的是提供在转基因动物,特别是家畜,如牛,绵羊,猪和山羊的乳腺组织中表达纤维蛋白原的材料和方法。
一方面,本发明提供了一种生产纤维蛋白原的方法,包括:(a)提供编码与纤维蛋白原Aα链相连接的分泌信号的第一条DNA片段,编码与纤维蛋白原Bβ链相连接的分泌信号的第二条DNA片段,和编码与纤维蛋白原γ链相连接的分泌信号的第三条DNA片段,其中第一、第二、第三条片段中的每一条都与在雌性哺乳动物宿主的乳腺中表达其所需要的附加的DNA片段相连接;(b)将DNA片段导入一个非人类哺乳动物物种的受精卵;(c)将该受精卵植入该物种的雌性动物的输卵管或子宫内,以获得带有该DNA结构的后代;(d)繁殖该后代以产生雌性后裔,来表达第一、第二、第三条DNA片段并生产出含有由这些片段编码的生物感受态纤维蛋白原的乳汁;(e)从这些雌性后裔中收集乳汁;以及(f)从这些乳汁中回收纤维蛋白原。在一个实施方案中,带有导入片段的受精卵在植入之前要培养一段时间。
另一方面,本发明提供了一种生产纤维蛋白原的方法,包括以下步骤:(a)将编码与纤维蛋白原Aα链相连的分泌信号的第一条PNA片段掺入β-乳球蛋白基因,生产出第一个融合基因;(b)将编码与纤维蛋白原Bβ链相连的分泌信号的第二条DNA片段掺入β-乳球蛋白基因,生产出第二个融合基因;(c)将编码与纤维蛋白原γ链相连的分泌信号的第三条DNA片段掺入β-乳球蛋白基因,生产出第三个融合基因;(d)将第一、第二、第三个融合基因导入-非人类哺乳动物的种系,使得该DNA片段在该动物或其雌性后裔的乳腺中表达,并且生物感受态纤维蛋白原分泌到该哺乳动物或其雌性后裔的乳汁中;(e)从该哺乳动物或其雌性后裔中获取乳汁;以及(f)从乳汁中回收纤维蛋白原。在优选的实施方案中,哺乳动物是绵羊、猪、山羊或牛。
另一方面,本发明提供了一种生产纤维蛋白原的方法包括以下步骤:(a)提供一种非人类的转基因雌性哺乳动物,在其种系中带有编码纤维蛋白原Aα,Bβ及γ链的异源DNA片段,其中的DNA片段在该哺乳动物的乳腺中表达而该DNA片段所编码的纤维蛋白原被分泌到该哺乳动物的乳汁中;(b)从该哺乳动物中收集乳汁;(c)从乳汁中回收纤维蛋白原。
另一方面,本发明提供了一种非人类的哺乳动物的胚胎,在其细胞核中含有编码纤维蛋白原Aα,Bβ及γ链的外源DNA片段。在一个相关的方面,本发明提供了一种转基因的非人类雌性哺乳动物,它在乳汁中生产可回收量的人纤维蛋白原。
另一方面,本发明提供了一种生产哺乳动物的转基因后代的方法,它包括以下步骤:(a)提供编码纤维蛋白原Aα链的第一条DNA片段,编码纤维蛋白原Bβ链的第二条DNA片段,以及编码纤维蛋白原γ链的第三条DNA片段,其中所说的第一,第二和第三条DNA片段中的每一条都连接有附加的DNA片段,以满足使其在宿主雌性哺乳动物的乳腺中表达及分泌到宿主雌性哺乳动物乳汁中的要求;(b)将该DNA片段导入非人类哺乳动物的一个受精卵中;(c)将受精卵植入雌性非人类种属动物的输卵管或子宫内,以获得带有第一、第二和第三个DNA片段的后代。在一个相关的方面,本发明提供根据该程序生产的非人类哺乳动物。
另一方面,本发明提供了带有编码异源纤维蛋白原Aα,Bβ及γ链的种系DNA片段的非人类哺乳动物,其中该哺乳动物的雌性后裔在其乳腺中表达这些DNA片段来生产生物感受态纤维蛋白原。
参考以下的详细说明及附图后,本领域熟练技术人员将会明白本发明的这些方面及其它方面。
附图简述
图1阐述人纤维蛋白原Aα链DNA序列的亚克隆。
图2是载体Zem228的部分限制性图谱。所用的符号MT-1p代表鼠金属硫蛋白启动子;SV40t代表SV40终止子;以及SV40p代表SV40启动子。
图3阐述人纤维蛋白原Bβ链DNA序列的亚克隆。
图4阐述人纤维蛋白原γ链DNA序列的亚克隆。
图5是载体Zem219b的部分限制性图谱。使用的符号MT-1P代表鼠金属硫蛋白启动子;hGHt代表人生长激素终止子;SV40p代表SV40启动子;DHFR代表二氢叶酸还原酶基因;以及SV40t代表SV40终止子。
本发明的详细描述
在开始本发明的详述之前,定义一些用于本文的术语将会有所帮助:
用于本文时,术语“生物感受态纤维蛋白原”用来指当用凝血酶处理时能发生聚合形成不溶性纤维蛋白的纤维蛋白原。
术语“卵”用来指未受精的卵细胞、在原核融合以前已受精的卵细胞或早期胚胎(具有融合原核的受精卵细胞)。
“生产含有生物感受态纤维蛋白原的乳汁的雌性哺乳动物”是一个在怀孕与分娩后,在哺乳期间,生产含有可回收量的生物感受态纤维蛋白原的乳汁的动物。本领域熟练技术人员能认识到这些动物断断续续地产奶,因而断断续续地生产纤维蛋白原。
术语“后裔”用的即是其一般含义,包括子女及后代。
术语“异源的”用来指其来源与其所导人的动物物种不同的遗传物质,或者是从这些遗传物质中生产出来的蛋白质。
在本发明中,转基因动物技术被运用来在宿主雌性哺乳动物的乳腺中生产纤维蛋白原。所感兴趣的蛋白在乳腺中的表达及随后向乳汁中的分泌克服了在用其它途径分离蛋白质时所遇到的许多困难。乳汁很容易被收集,并可大量得到,而且能很好地进行生物化学鉴定,另外,存在于乳汁中的主要蛋白质的浓度很高(从约1g/L到15g/L)。
从商业观点来看,很清楚优选的是使用那些产奶量大的物种作为宿主。虽然较小的动物如小鼠和大鼠也可以使用(而且优选的是使用于验证概念阶段),在本发明中优选的是使用家畜,包括但并非限于使用猪、山羊、绵羊和牛。绵羊是特别优选的,这是基于如下因素如在该物种中有转基因的历史,产乳量,费用及收集绵羊奶的设备的易得性。影响宿主物种的选择的因素的比较见WO88/00239。通常的愿望是选择已作为日常用途喂养的动物来繁殖,例如East.Friesland绵羊,或者是通过将转基因系喂养一段时间导人日常的家系。无论怎样,应该使用熟悉的,具有良好健康状况的动物。
根据本发明生产的纤维蛋白原可以是人纤维蛋白原或非人类动物的纤维蛋白原。作为药用的话,优选的是应用对患者来说是天然的蛋白质,因此本发明提供了在人类和畜类药物中都可使用的纤维蛋白原。编码人纤维蛋白原的成分链的克隆的DNA分子是由这些人描述的:Rixon et al.(Diochem.22:3237,1983),Chung et al.(Biochem.22:3244,1983),Chung et al.(Biochem.22:3250,1983),Chung et al.(Adv.Exp.Med.Biol.281:39-48,1990)以及Chung et al.(Ann.NY Acad.Sci.408:449-456,1983)。牛纤维蛋白原的克隆由Brown et al.(Nuc.Acad.Res.17:6397,1989)和Chung etal.(Proc.Natl.Acad.Sci.USA 78:1466-1470,1981)描述,其它的哺乳动物纤维蛋白原由Murakawa et al.(Thromb.Haemost.69:351-360,1993)描述。人类Aα,Bβ和γ链基因的代表性序列分别显示于SEQ ID NOS:1,3和5。那些熟练技术人员将明白这些序列的等位变异体将是存在的;另外的突变体可以通过氨基酸的置换、缺失或插入产生;而且这样的变异体在本发明中是有用的。一般地,优选的是那些包括仅仅有限数目的氨基酸置换、缺失或插入的工程变异体,并且任何置换都是保守性的,因此优选的方案是生产在序列上与相应的天然链至少有90%,较好的是至少95%,更好的是有至少99%或更多同一性的纤维蛋白原链多肽。术语“γ链”指的是包括纤维蛋白原的替代性拼接的γ’链(Chung et al.,Biochem.23:4232-4236,1984)。人类γ’链的氨基酸序列显示于SEQ ID NO:6。较短的γ链是由SEQ ID NO:5的9511位和10054位核苷酸之间的替代性拼接而产生的,因而翻译终止于SEQ ID NO:5中的10065位核苷酸之后。
为获得在乳腺中的表达,使用了一种来源于乳蛋白基因的转录启动子。乳蛋白基因包括那些编码酪蛋白,β-乳球蛋白(BLG),乳清蛋白,以及乳清酸性蛋白的基因。β-乳球蛋白启动子是优选的。若是羊β-乳球蛋白基因,羊BLG基因5’侧序列的至少约406bp(包括在SEQ ID NO:7的核苷酸3844-4257中)的区域将通常被用到。优选的是更大部分的5’侧序列,直到大约5Kbp。一条更大的DNA片段,包括5’侧启动子区域及β-乳球蛋白基因的5’非编码区域(包括在SEQ ID NO:7的核苷酸1-4257)是特别优选的。见Whitelaw et al.,Biochem.J.286:31-39,1992。来自于其它种属的类似的启动子DNA片段也是适用的。
β-乳球蛋白基因的其它区域也能掺入到结构中,正如待表达的基因的基因组区域。现有技术中通常接受的是失去了内含子的结构,例如,与那些含有这样的DNA序列的相比,其表达性很差(见Brinster et al.,Proc.Natl.Acad.Sci.USA.85:836-840,1988;Palmiter et al.,Proc.Natl.Acad.Sci.USA.88:478-482,1991;Whitelawet al..Transgenic Res.1:3-13,1991;WO 89/01343;WO 91/02318)。在这一点上,通常优选的方案是,在可能时,使用含有所有或一些编码所感兴趣的蛋白质或多肽的基因中的天然内含子的基因组序列。在本发明的某些实施例中,优选方案是还包括至少一些来自于β-乳球蛋白基因的内含子。一个这样的区域是一条提供内含子拼接及RNA多腺苷酸化的、来自于羊β-乳球蛋白基因的3’非编码区的DNA片段。当用一个基因的天然3’非编码区取代时,这一羊β-乳球蛋白片段同时能增强与稳定感兴趣的蛋白质或多肽的表达水平。在其它的实施方案中,一个或多个纤维蛋白原序列的起始ATG附近的区域被替换成来自于乳汁特异性蛋白基因的相应的序列。这样的替换提供了所推想的组织特异性起始环境以增强表达。很容易将全部的纤维蛋白原链的前原和5’非编码区序列置换为那些例如BLG基因的相应序列,尽管较小的区域也能被置换。
为了表达纤维蛋白原,编码纤维蛋白原的三种组分多肽链的每个DNA片段都连接有其表达所需的附加的DNA片段。这些附加的片段包括以上所提到过的乳类蛋白基因启动子,还有提供转录终止和mRNA多腺苷酸化的序列。表达单位还包括与编码纤维蛋白原多肽链的片段相连接的编码分泌信号的DNA片段。分泌信号可能是天然的纤维蛋白原分泌信号也可能是另一种蛋白,例如一种乳蛋白的信号肽。术语“分泌信号”用于此处指的是一个蛋白质中指导其穿过细胞的分泌途径到外面的部分。分泌信号最常见的是在蛋白质的N-端。例如,可见von Heinje.Nuc.Acids Res.14:4683-4690,1986;和meadeet al.,U.S.Patent No.4,873,316中所述。
表达单位的构建很容易通过将纤维蛋白原链序列插入到一个质粒或噬菌体载体中来实现,这些载体中含有附加的DNA片段;当然表达单位也能通过基本的任一序列的连接反应来构建。尤其便利的是提供一个含有编码乳蛋白的DNA片段的载体,并将编码乳蛋白的序列置换成编码一条纤维蛋白原链(包括分泌信号)的序列,因此产生一个包括有乳蛋白基因的表达调控序列的基因融合体。无论如何,表达单位在质粒或其它载体中的克隆方便了纤维蛋白原序列的扩增。扩增很容易在细菌(如E.coli)宿主细胞中进行,这样典型的载体将包括一个在细菌宿主细胞中的复制原点和一个选择性标记。
考虑到纤维蛋白原链基因的大小最为实际的是制备三种分离的表达单位,将其混合,并将混合物导入宿主中。然而,本领域熟练技术人员会明白其它的程序也是可行的。例如,三条链的表达单位可以单个分别导入不同的胚胎,随后通过繁殖使之结合。在第三种方法中,三个表达单位可以连接在一个合适的载体中,如酵母人工染色体或噬菌体P1克隆。两条或三条链的编码序列可以结合在多顺反子表达单位中(见Levinson etal.,U.S.Patent No.4,713,339)。
然后,表达单位被导入所选择的宿主的受精卵(包括早期胚胎)中。异源基因的导入可以通过几条途径之一而完成,包括显微注射(如U.S.Patent No.4,873,191),反转录病毒感染(Jaenisch,Science 240:1468-1474,1988)或使用胚胎干细胞(ES)的定点整合(Bradly et al.,Bio/Technology 10:534-539,1992)。该受精卵然后被植入假孕雌性动物的输卵管或子宫内并让其继续发育。在其种系中带有导入的DNA的后代可以通过正常的孟德尔遗传方式将该DNA传给其后裔,并发展成转基因种群。制造转基因动物的一般方法是现有技术中已知的。如可见以下所引的参考文献:Hogan et al.,Manipulating the Mouse Embryo:ALaboratory Manual,Cold Spring Harbor Laboratory,1986;Simons et al.,Bio/Technology 6:179-183,1988;Wall et al.,Biol.Repord.32:645-651,1985;Buhler et al.,Bio/Technology 8:140-143,1990;Ebert et al.,Bio/Technology 9:835-838,1991;Krimpenfort et al.,Bio/Technology 9:844-847,1991;Wall et al.,J.Cell.Biochem.49:113-120,1992;以及WIPO出版物WO 88/00239,WO 90/05188,WO 92/11757;以及GB 87/00458。将外源DNA导入哺乳动物及其生殖细胞的技术最初是在小鼠中发展起来的。见Gordon et al.,Proc.Natl.Acad.Sci.USA77:7380-7384,1980;Gordon and Ruddle,Science 214:1244-1246,1981;Palmiter andBrinster,Cell 41:343-345,1985;Brinster et al.,Proc.Natl.Acad.Sci.USA82:4438-4442,1985;and Hogan et al.,(ibid.)。这些技术后来也适用于较大的动物,包括家畜(见WIPO出版物WO 88/00239,WO 90/05188,WO 92/11757;以及Simons et al.,Bio/Technology 6:179-183,1988)。概括地说,到目前为止,已在转基因小鼠和家畜的生产中,用最有效的方法,将数以百计的感兴趣的线性DNA分子注射进受精卵的原核中。将该DNA注入受精卵的细胞质中也是可行的。
优选方案是获得每条纤维蛋白原链的平衡表达,使得成熟蛋白质的形成较有效。理想的是,三个表达单位应该在导入受精卵的同一个DNA分子中。然而,这种方法会产生一些技术上的难题,例如在注射和操作阶段。比如,纤维蛋白原表达单位的大小使得必须在注射前使用酵母人工染色体(YACs)或噬菌体P1来扩增和操作DNA。若按此方法进行,待注射的含有所有三个表达单位的DNA片段将会非常巨大,因此要求将注射方法作一些修改,如使用更大号的针头。在一个较为简单的方法中,使用的是各种单个表达单位的混合物。优选方案是结合等摩尔量的三种表达单位,虽然本领域熟练技术人员会明白这种比例可以根据所给的表达单位的性质而作一些改变。当使用较少摩尔数的一种或两种链时,也能得到某种程度的表达,但一般说来其水平会降低。通常可以预期的是若以偏离优选的等摩尔比例的比例进行,其表达效率将会下降。不管怎样,优选的方案是使用一种混合物,其中Aα∶Bβ∶γ表达单位的比例在0.5-1∶0.5-1∶0.5-1范围之内。若将其比例从等摩尔状态改变,优选的是使用相对多一些的Bβ表达单位。另外,一个表达单位或是两种表达单位的混合物也可导入单独的卵中,当然,由此而来的动物将只表达一条或两条纤维蛋白原链。要用这种方法产生完整的纤维蛋白原分子就要求随后进行一个繁殖过程,以结合存在于一群动物的个体中的所有三种表达单位。
一般地,雌性动物要用促滤泡激素处理使之超数排卵,然后交配。收集受精卵,然后用已知方法将异源DNA注射进入卵中。可见以下所引用的文献:U.S.Patent No.4,873,191;Gordon et al.,Proc.Natl.Acad.Sci.USA 77:7380-7384,1980;Gordonand Ruddle,Science 214:1244-1246,1981;Palmiter and Brinster,Cell 41:343-345,1985;Brinster et al.,Proc.Natl.Acad.Sci.USA 82:4438-4442,1985;Hogan etal.,Manipulating the Mouse Embryo:A Laboratory Manual,Cold Spring HarborLaboratory,1986;Simons et al.,Bio/Technology 6:179-183,1988;Wall et al.,Biol.Repord.32:645-651,1985;Buhler et al.,Bio/Technology 8:140-143,1990;Ebert et al.,Bio/Technology 9:835-838,1991;Krimpenfort et al.,Bio/Technology9:844-847,1991;Wall et al.,J.Cell.Biochem.49:113-120,1992;以及WIPO出版物WO 88/00239,WO 90/05188,WO 92/11757;以及GB 87/00458。
为了注射进入受精卵中,要用合适的限制性酶消化将表达单位从其各自的载体中切下。为了方便起见,优选的方案是设计的载体使得切下表达单位的酶不会在表达单位内部或载体上别的地方有切割位点。表达单位通过传统方法回收,例如电泳洗脱,随后用酚抽提,用乙醇沉淀,以及蔗糖密度梯度离心,或结合使用这些方法。
DNA注射到卵中,基本上是按照上述Hogan et al.的方法。在一次典型的注射中,使用体视可调焦显微镜(优选×50或×63),将在一个装有胚胎培养基的盘子中的卵子固定。合适的培养基包括Hepes(N-2-羟乙基哌嗪-N’-2-乙磺酸)或碳酸氢盐缓冲培养基如M2或N16(可购自Sigma Chemical Co.,St.Louis,USA)或合成的输卵管培养基(见下述)。使用一个用毛细管做的drummond吸管将卵固定并转移到注射装置上的玻璃载片的中央。在此步骤时,使用低倍镜(×4)观察。使用注射装置上的吸管将卵子定位于载玻片的中心。单个的卵随后被固定到吸管上以备注射。每一次注射,吸管/卵都要定位于视野的中心。然后将注射针头定位于卵的正下方。最好使用×40倍的Nomarski目镜,两个操作台的高度调节到使卵和针头同时聚焦。通过旋转卵和调节吸管,将原核定位。一旦原核被定位后,调节操作台的高度使其聚焦于原核膜。注射器针头位于卵的下方并使针尖正好处于原核中心下面的位置。然后使用注射操作装置调整针头的位置,使针头和原核进入同一个聚焦平面。通过注射操作装置上的操纵杆(joy stick)移动针头到卵的右方。用一个短的连续穿刺动作,将原核膜刺穿并使针尖留在原核内。通过玻璃针筒给注射针头加压,直到原核膨胀到接近原来体积的两倍。此时,缓慢地移走针头,转回到低倍镜(如×4),将注射过的卵移到玻璃片上的不同的区域,并对另一只卵重复该程序。
DNA注射完毕之后,培养该卵细胞使原核融合,生产一单细胞胚胎或较晚期胚胎。一般地,卵的培养在该种的体温下并在含有平衡的盐和血清的缓冲培养基中进行。然后将活的胚胎转移进假孕的受体雌性动物中,典型的做法是将其植入输卵管或子宫,使之发育。在胚胎发生过程中,注射的DNA将以随机方式整合到少数发育胚胎的染色体中。
潜在的转基因后代通过血样和/或组织活体解剖进行筛选。从这些样品中制备出DNA并检查注入的结构的存在,可利用诸如聚合酶链式反应(PCR,见Mullis,U.S.Patent No.4,683,202)和Southern印迹(Southern,J.Mol.Biol.98:503,1975;Maniatis etal.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,1982)等技术。“建立者(founder)”转基因动物,或称G0s,可以是完全转基因的,即在其所有细胞中都有转基因;也可以是部分的,只在某一类细胞中有转入的基因(见Wilkieet al.,Develop.Biol.118:9-18,1986)。在后一种情况下,生殖细胞集团中可能是全部的或部分的转基因的。而且,在后一种情况下,实际所得到的“建立者”的后代中的转基因后代的比例还不足根据孟德尔定律预测值的50%。“建立者”  G0动物生长到性成熟期后,进行交配,得到后代,或称Gls。Gls同样检查转基因的存在,确定其是否从“建立者”G0动物中传了下来。若是雄性G0s,可使其与数个未转基因的雌性交配,以产生大量后代,此举增加了发现转基因传递的机会。雌性“建立者”G0可以通过自然交配、人工授精或超数排卵得到许多卵子并转移给代理母亲。后一种方法给出了在那些产仔量少的动物中观察到转基因传递的最好的机会。上述的繁殖程序被用来获得能将DNA以正常的孟德尔方式遗传给后代的动物,并使其发展成转基因动物的种群(小鼠、绵羊、猪、山羊、牛)。
从哺乳期的G0和G1雌性动物中得到的乳汁要进行异源蛋白的检查,依靠使用免疫技术如ECLISA(见Harlow and Lane,A Laboratory Manual,Cold  Spring HarborLaboratory,1988)以及Western印迹  (见Towbin et aL.,Procc.Natl.Acad.Sci.USA 76:4354,1979)。由于在现有技术中公知的各种原因,异源蛋白的表达水平在不同的个体之间将是不同的。
一个令人满意的动物家族应该满足三个标准:它们应来源于同一个建立者G0动物;它们应该表现出稳定的转基因的传递;而且它们在代与代之间及个体动物的每次产乳期之间应该表现出稳定的表达水平。这些原则已经确定并讨论过(Carver et al.,Bio/Technology 11:1263-1270,1993)。来自于这样的一个合适的家族的动物可被称之为一个“系”。最初,雄性动物G0或G1,被用来通过自然地或人工受精繁殖出一群生产者动物。以这种方式,可以迅速产生许多带有相同的整合的转基因的雌性动物,从中可以得到乳汁供应。
纤维蛋白原从乳汁中的回收使用标准的做法,诸如:脱脂、沉淀、过滤以及蛋白质层析技术。
根据本发明生产的纤维蛋白原适用于人类及畜类医药,例如用于配制外科中的粘合剂。这种粘合剂是现有技术中公知的。如可见引用的文献U.S.Patent No.4,377,572;4,442,655;4,462,567;以及4,627,879。一般地,将纤维蛋白原与因子XIII结合形成第一种成分,在使用之前与含有凝血酶的第二种成分混合。凝血酶使纤维蛋白原转变成纤维蛋白,使混合物成为胶状,并激活因子XIII。激活的因子XIII使纤维蛋白交联,强化并稳定粘合剂基质。这样的典型的粘合剂中,含有大约30mg/ml-100mg/ml的纤维蛋白原与大约50μg/ml-500μg/ml的因子XIII。它们还可能含有其它成分,例如aprotinin,乳清蛋白,纤联蛋白,膨化剂以及溶剂。生产因子XIII的方法是现有技术中公知的。如可见U.S.Patent No.5,204,447。纤维蛋白原还可以用来包被聚合物如合成血管移植物的表面,如U.S.Patent No.5,272,074.(列于此处参考)所述。
通过下列的非限制性实施例对本发明做进一步的阐述。
实施例1
去掉载体pUC18(Yanisch-Perron et al.,Gene 33:103-119,1985)上的多克隆位点,置换成一条合成的双链寡核苷酸(链显示于SEQ ID NO:8和SEQ ID NO:27中),该链含有限制性切点PvuI/MluI/Eco RV/XbaI/PvuI/MluI,并在5’端加有与Eco RI和HindIII配对的接头。pUC18用EcoRI和HindIII双酶切,其5’磷酸基团用牛胰磷酸酶除去,将寡核苷酸链连接到载体骨架中。做序列测定确定跨过连接区域的序列正确无误,新的质粒叫做pUCPM。
从pSSltgXS(WIPO出版物WO 88/00239中公开)上切下β-乳球蛋白(BLG)基因SalI-XbaI片段,克隆到用SalI和XbaI酶切过的载体pUCPM中构建载体pUCXS。因此pUCXS是pUC18的一个衍生质粒,含有完整的BLG基因,该基因来自于噬菌体SS1(Ali and Clark,J.Mol.Biol.199:415-426,1988)上的从SalI位点到XbaI位点的片段。
质粒pSStgSE(WIPO出版物WO 88/00239中公开)含有一个1290bp的BLG片段,其两侧有SphI和EcoRI限制位点、一段跨过单一位点NotI的区域及一个位于BLG mRNA的5’非翻译引导区的PvuII位点。在此PvuII位点上连接有一个双链的8bp的DNA连接序列(5’-GGATATCC-3’),构成Eco RV的识别位点。这个质粒称做pSS1SE/RV。pSS1SE/RV中SphI和EcoRV间的DNA序列被酶切下来,并被用来置换pUCXS中的等价片段。得到的质粒称做pUCXSRV。插入到pUCXSRV中的BLG的序列显示于SEQ ID NO:7,在BLG基因的5’非翻译引导区的4245位核苷酸上有一个EcoRV的单一酶切位点。该位点允许插入一些在BLG启动子控制下的转录起始位点3’端的任何附加的DNA序列。
使用引物BLGAMP3(5’-TGG ATC CCC TGC CGG TGC CTC TGG-3’;SEQ ID NO:9)和BLGAMP4(5’-AAC GCG TCA TCC TCT GTG AGC CAG-3’;SEQ ID NO:10),从pUCXSRV中的BLG基因的终止密码子的3’端的序列中生产出接近650bp的一个PCR片段。该PCR片段利用工程技术在5’端加有一个BamHI位点,在3’端加有一个MluI位点,并被克隆进BamHI和MluI切过的pGEM7zf(+)(Promega)构成pDAM 200(+)。
pUCXSRV用KpnI消化,最大的含有载体的条带用凝胶纯化。该条带含有全部的pUC质粒序列以及一些BLG基因上的3’非编码区序列。在此骨架中连接上一个来自pDAM200(+)的小的KpnI片段;后者在2.6Kbp的BLG3’侧区域的5’末端利用工程技术以正确的方向产生了一个BamHI位点。该质粒称做pBLAC200。从pBLAC200得到的2.6Kbp的ClaI-XbaI片段连接到ClaI-XbaI酶切的pSP72载体(Promega)中,由此在BLG序列的上游置入一EcoRV位点,此质粒称为pBLAC210。
从pBLAC210上得到的2.6Kbp的Eco RV-XbaI片段连接到Eco RV-XbaI酶切的pUCXSRV上,形成pMAD6。此时,从pUCXSRV上切下了所有编码序列和内含子序列,形成了由4.3Kbp的5’启动子和侧翼有单一EcoRV位点的2.6Kbp的3’下游序列组成的一条BLG的“迷你”基因。在pMAD6的EcoRV位点插入一个寡核苷酸接头(ZC 6839:ACT ACG TAGT;SEQ ID NO:11)。这一修改破坏了Eco RV位点,但产生了一个用于克隆目的的Sna BI位点。该载体命名为pMAD6-Sna。信使mRNA起始于Sna BI位点的上游并终止于Sna BI位点的下游。前体转录将编码一个单个BLG来源的内含子,即内含子6,它完整地位于基因的3’非翻译区内。
实施例2
编码单个纤维蛋白原链的克隆得自于University of Washington,Seattle的Dr.Earl W.Davie实验室。一个基因组纤维蛋白原Aα链克隆(Chung et al.,1990,ibid.)得自于质粒BS4。该质粒含有插入载体pUC18的SalI和Bam HI位点的Aα链克隆,但缺失了Aα链头四个氨基酸的编码序列。基因组Bβ链DNA(Chung et al.,ibid.)分离自λCharon 4A噬菌体克隆(命名为βλ4)的两个EcoRI片段,每条片段长5.6Kbp。两个片段分别克隆到已用EcoRI消化并经牛胰磷酸酶处理过的pUCl9中。得到的克隆用限制性酶PvuII消化筛选,鉴定出有5’和3’Bβ插入的质粒(分别命名为β 5’RI/puc和β 3’RI/puc)。基因组γ链克隆按Rixonetal.(Biochemistry 24:2077-2086,1985)所述分离。克隆pγ12A9包括5’非编码序列及约4535bp的γ链编码序列。克隆pγ12F3包括其余的编码序列和3’非编码核苷酸。这两个质粒都是基于pBR322的在EcoRI位点插入纤维蛋白原序列的质粒。这些质粒被用来作为个自PCR反应的模板。
为了将纤维蛋白原链编码序列插进表达载体中,使用Mullis(U.S.Patent No.4,683,202)所述的PCR技术给其加尾。该步骤是移去天然的5’和3’非翻译序列,在其每条编码序列的第一个ATG的上游加上一条9个碱基的序列(CCT GCA GCC),提供Aα链的头四个密码子,除去了Aα链序列中的一个内部的MluI位点,并增加了限制性位点以方便随后的克隆操作。
参看图1,Aα链编码序列的5’末端通过PCR反应加尾。PCR反应体系中,含有分别为20pmol的引物ZC6632(SEQ ID NO:12)和ZC6627(SEQ ID NO:13),约10ng的质粒BS4模板DNA,10μl的含有分别为2.5mM的各种dNTP的混合液,7.5μl的10×Pyrococcus furiosus(Pfu)DNA聚合酶缓冲液#1(200mM Tris-HCl,pH8.2,100mM KCl,60mM(NH4)2SO4,20mMMgCl2,1%Triton X-100,100μg/ml的去核酸酶牛血清白蛋白)(Stratagene,La Jolla,CA),加水至75μl。混合物在一个DNA热循环仪(Perkin-Elmer)上以如下方式进行5个循环:94℃45秒,40℃90秒,72℃120秒;再进行20个循环:94℃45秒,45℃90秒,72℃120秒;然后在72℃保温7分钟。5’PCR片段用BamHI和HindIII消化,然后将该BamHI-HindIII片段与一个内部的2.91Kbp的HindIII-XbaI片段及经BamHI,XbaI消化的pUC18一起连接。对PCR产生的外显子序列进行序列测定。
再参看图1,通过一系列步骤给Aα编码序列的3’末端加尾。其中使用重叠延伸PCR反应(Ho et al.,Gene 77:51-59,1989)使Aα序列的终止密码子上游563位碱基上的MluI位点发生了突变。在第一个反应中,在如上所述的反应体系中加有分别为40pmol的引物ZC6521(SEQ ID NO:14)和ZC6520(SEQ ID NO:15),约10ng的质粒BS4模板DNA。反应进行5个循环:94℃45秒,40℃90秒,72℃120秒;再进行15个循环:94℃45秒,45℃90秒,72℃120秒;然后在72℃保温7分钟。第二个反应以同样的方式进行,但使用每种分别为40pmol的引物ZC6519(SEQ ID NO:16)和ZC6518(SEQ ID NO:17)并以BS4为模板。从第一个和第二个反应中得到的PCR片段通过凝胶电泳分离并从凝胶上洗脱下来。每种回收的反应产物的约1/10与每种分别为40pmol的引物ZC6521(SEQ IDNO:14)和ZC6518(SEQ ID NO:17)在一个PCR反应中结合,在此反应中,每个片段(含有个别的碱基变化)的互补的3’末端作为其互补链3’延伸反应的引物与其退火。使用与第一个和第二个3’PCR反应中相同的反应条件进行PCR反应。然后将反应产物用XbaI和BamHI消化,并将XbaI-BamHI片段克隆到XbaI和BamHI消化的pUC18中。对PCR产生的外显子序列进行序列测定。
如图1中所示,5’BamHI-XbaI片段(3.9Kbp)和3’XbaI-BamHI片段(1.3Kbp)插入到载体Zem 228的BamHI位点,Zem 228是一个pUC18的衍生质粒,在小鼠MT-1启动子和SV40终止子之间有一个BamHI克隆位点,并在SV40启动子和终止子旁侧有一个新霉素抗性标记。见欧洲专利局出版物EP 319,944和图2。从载体Zem228上分离出完整的Aα编码序列SnaBI片段,插入到质粒pMAD6-Sna的Sna BI位点。
参看图3,使用寡核苷酸ZC6629(SEQ ID NO:18),ZC6630(SEQ ID NO:19)和ZC6625(SEQ ID NO:20)通过PCR给Bβ链的5’末端加尾。这些引物以成对结合的方式(ZC6629+ZC6625或ZC6630+ZC6625)使用,产生起始于第一个ATG密码子(SEQ IDNO:3中的470位)的Bβ编码序列(命名为N1-β)或起始于第三个ATG密码子(SEQ IDNO:3中的512位)的Bβ编码序列(命名为N3-β)。在如上所述的反应混合物中加入5ng的β5’RI/puc模板DNA,并结合每种分别为20pmol的引物(N1-β:ZC6629,SEQID NO:18+ZC6625,SEQ ID NO:20或N3-β:ZC6630,SEQ ID NO:19+ZC6625,SEQ ID NO:20)。混合体系进行如下的5个循环:94℃45秒,40℃120秒(N1-β)或90秒(N3-β),72℃120秒;再进行20个循环:94℃45秒,45℃120秒(N1-β)或90秒(N3-β),72℃120秒;然后在72℃保温7分钟。两种反应产物都用EcoRI和BglII消化,并将酶切的片段与内部的BglII-XbaI片段和EGo RI+XbaI消化的pUC19一起连接。使用寡核苷酸引物ZC6626(SEQ ID NO:21)和ZC6624(SEQ ID NO:22)以及约5ng的β3’RI/puc模板在一个如上所述的反应混合物中给Bβ链序列的3’末端加尾。混合物温育5个循环:94℃45秒,40℃90秒,72℃120秒;再进行15个循环:94℃45秒,45℃90秒,72℃120秒;然后在72℃保温7分钟。分离出一个990bp的BglII-EcoRI片段。该3’片段与邻近的编码片段(340bp,SphI-BglII)和SphI+EcoRI消化的pUC19连接。对PCR产生的3’和5’外显子进行序列测定。在XbaI+SphI消化的pUC19中连接两个内部片段(4285bp XbaI-Eco RI和383bp Eco RI-SphI)构建第三个中间载体。然后装配完整的Bβ编码序列(两种形式),连接5’EcoRI-XbaI片段中的一个,内部XbaI-SphI片段,3’SphI-EcoRI片段和EcoRI消化的载体pUC19。然后Bβ序列以7.6Kbp的SnaBI片段的形式分离出来,插入到pMAD6-Sna的SnaBI位点中。
参看图4,使用寡核苷酸引物ZC6514(SEQ、ID NO:23)和ZC6517(SEQ ID NO:24)以及约5ng的pγ12A9为模板通过PCR给γ链序列的5’末端加尾。使用40pmol的每种引物按如上所述进行PCR反应。反应进行5个循环:94℃45秒,40℃60秒,72℃120秒;接着进行15个循环:94℃45秒,45℃60秒,72℃120秒。得到的213bp的片段用BamHI和SpeI消化,将得到的酶切片段与邻近的下游4.4Kbp的SpeI-EcoRI片段和BamHI+EcoRI消化的pUC19连接。使用每种40pmol的寡核苷酸引物ZC6516(SEQ ID NO:25)和ZC6515(SEQ ID NO:26),约50ng的pγ12 F3模板以及与用于5’片段的相同的热循环程序给γ链序列的3’末端加尾。得到的500bp的片段用BamHI和SpeI消化,将得到的酶切片段与上游2.77Kbp的EcoRI片段和EcoRI+BamHI消化的pUC19连接。所有PCR产生的外显子都进行序列测定。然后装配完整的γ’链编码序列,在BamHI+XbaI消化的Zem219b中,连接一个4.5Kbp的BamHI-EcoRI 5’片段,一个1.1Kbp的EcoRI-PstI内部片段和一个2.14Kbp的PstI-XbaI 3’片段。Zem219b是一个pUC18衍生载体,含有一个小鼠金属硫蛋白启动子和一个与SV40启动子连接的DHFR选择标记(图5)。质粒Zem219b已以E.coli XL1-blue转化子的形式保藏于American Type CultuteCollection,编号为68979。完整的γ’链编码序列以一个7.8Kbp的SnaBI片段的形式分离出来并插入到pMAD6-Sna的Sna BI位点。
实施例3
用于初始繁殖系(C57BL6J,CBACA)的小鼠得自于Harlan Olac Ltd.(Bicester,UK)。让其成对交配产生F1杂交系(B6CBAF1),以得到受体雌性,超数排卵的雌性,用于繁殖的雄性,以及被结扎的雄性。所有的动物都保持在一种14小时光亮/10小时黑暗的循环中,并喂以任意量的水和食物(Special Diet Services RM3,Edinburgh,Scotland)。
转基因小鼠的产生基本上如Hogan et al.,在Manipulating the Mouse Embryo:ALaboratory Manual,Cold Spring Harbor Laboratory,1986中所述。雌性B6CBAF1动物在4-5周龄时通过注射怀孕雌鼠的血清促性腺激素(FOLLIGON,Vet-Drug,Falkirk,Scotland)(5iu),随后在45小时后注射入绒毛膜促性腺激素(CHORULON,Vet-Drug,Falkirk,Scotland)(5iu),使之超数排卵。然后让其与一只种鼠交配过夜。随后检查这些雌性动物交配是否阳性。那些已经交配的雌性动物被选出,收集它们的卵子以备用于显微注射。
如Hogan et al.(ibid.)所述将DNA注射到受精卵中。简而言之,每种含有Aα,Bβ和γ表达单位的载体用MluI消化,各表达单位用蔗糖密度梯度离心分离出来。所有使用的化学药品均为试剂级(Sigma Chemical Co.,St.Louis,MO,USA),所有的溶液均为无菌及无核酸酶的。溶于1M NaCl,20mM Tris pH8.0,5mMEDTA的20%及40%的蔗糖溶液使用UHP水制备并经过滤除菌。混合等体积的20%和40%的蔗糖溶液,制备30%的蔗糖溶液。分步将0.5ml的40%、30%和20%的蔗糖溶液铺设到2ml的晶形塑料管中,并静置1小时,做成一种梯度。100μl的DNA溶液(接近8μgDNA)加到梯度液的顶部,然后于Beckman TL100超速离心机中使用TLS-55转头(BeckmanInstruments,Fullerton,CA,USA)在15℃下以26,000rpm转速离心17-20小时。使用一只20号的针头穿刺离心管的底部,分部收集各梯度的液滴于96孔板中。取出3μl的液体在1%的琼脂糖小胶上分析。将含有所需要的DNA片段的部分汇集起来,然后在0.3MNaAc中于-20℃用乙醇沉淀过夜。DNA沉淀物重溶于50-100μl UHP水中并用荧光计测量定量。表达单位稀释于Dulbecco’s磷酸缓冲盐(无钙和镁)(每升中含0.2gKCL,0.2gKH2PO4.8.0gNaCl,1.15gNa2HPO4),以1∶1∶1的摩尔比混合(使用N1-β或是N3-β表达单位),其浓度调节到大约6μg/ml,并注射到卵子中(每只卵大约总共2pl的DNA溶液)。
通过处于自然发情期的B6CBAF1雌鼠与结扎过的雄鼠交配,制备6-8周龄的受体雌鼠。那些交配检测为阳性的雌鼠保留下来准备转移显微注射后的卵。
潜在的转基因动物出生之后,于4周龄时在无菌条件下对尾部进行活体解剖。组织样品放入2ml含有200μg/ml蛋白酶K(Boehringer Mannheim,Germany)的,尾缓冲液(0.3MNaAc,50mMHCl,1.5mMMgCl2,10mM Tris-HCl,PH8.5,0.5%NP40,0.5%7ween20)中,颠倒数次混匀。样品于55℃-60℃振荡(250rpm)3小时至过夜。通过PCR和Southern印迹检查制备于活体解剖样品的DNA中注射的结构的存在。剧烈振荡消化后的组织,取5μl液体放入0.5ml的微量离心管中。对照包括阳性和阴性尾部样品。每管中加入40μl的硅酮油(BDH,Poole,UK)并短暂地离心。管在一个热循环仪(如Omni-gene,Hybaid,Teddington,UK)的加热块上保温到95℃,10分钟。此后,每管中加入45μl的PCR混合液,这样,每个反应混合液的最终组成为:50mMKCl;2mMMgCl2;10mM Tis-HCl(pH8.3);0.01%的明胶;0.1%NP40;10%的DMSO;500nM的各种引物;200μM的dNTPs;0.02U/μl的Taq聚合酶(Boehinger Mannheim,Mannheim,Germany)。按照所用的特定引物所要求的温度变化,每管重复进行30个循环。引物可能会有不同,但所有的引物都必须以BLG启动子区为目标。这对于注射的DNA片段是特异性的,因为小鼠中没有BLG基因。然后在每管中加入12μl的5X上样缓冲液,其中含有OrangeG标记染料(0.25%OrangeG(Sigma)15%Ficoll-400[PharmaciaBiosystems Ltd.,Milton Keynes,UK]),反应混合物在含有EB(Sigma)的1.6%琼脂糖凝胶中电泳,直到标记染料迁移到胶的2/3长度处。在254nm波长的紫外灯下观察凝胶。用这种方法可以鉴定出具有一个或多个注射的DNA片段的转基因小鼠。
挑选阳性的尾部样品以获得纯的DNA。DNA样品通过使用一个BLG启动子探针(SEQID NO:7中的2523-4253位核苷酸)做Southern印迹进行筛选。使用合适的限制性酶(例如EcoRI)进行特异性裂解可以分辨出含有Aα,Bβ和γ序列的三种结构。
基本上按如上所述的方法制备的转基因小鼠的Southern印迹的分析结果表明。有多于50%的后代含有所有三种纤维蛋白原序列。阳性动物的乳汁的还原性SDS聚丙烯酰胺凝胶电泳检查表明,所有三种蛋白链都存在且其浓度接近1mg/ml。完全装配好的纤维蛋白原的量则与乳汁存在的各亚单位之间的比例有关。在小鼠乳汁中没有明显的与高浓度的人类纤维蛋白原相关的表型。实施例4
供体母羊在0日用阴道内的含孕酮的棉球(CHRONOGEST Goat Sponge,Intervet,Cambridfe,UK)处理。棉球留在原处保持10或12天。
超数排卵的诱导是通过用总共1单位的羊促卵泡激素(OFSH)(OVAGEN,HorizonAnimal Reproduction Technology Pty.Ltd.,New Zealand)处理,分8次肌肉注射给药,每次注射0.125单位,注射开始于-4日的5:00pm结束于0日的8:00am。在-4日给供者母羊肌肉注射0.5ml的黄体裂解试剂(ESTRUMATE,Vet-Drug)引起黄体退化,使之回复到发情和排卵期。为了使排卵同步,供体动物在0日5:00pm肌肉注射2ml合成的释放激素类似物(RECEPTAL,Vet-Drug)。
在人工授精(A.I.)之前,供体动物要断绝食物和水至少12小时。动物在+1日在镇静和局部麻醉状态下通过子宫内窥人工授精。在人工授精前大约15分钟通过肌肉注射0.05-0.1ml/10kg体重的甲苯噻嗪(ROMPUN,Vet-Drug)或0.1ml/10kg体重剂量的ACP注射液(10mg/ml)(Vet-Drug)使其镇静。人工授精使用从Poll Dorset公羊中刚收集的精液进行。精液用等量的过滤后的磷酸缓冲液稀释,每个子宫喇叭口里注射0.2ml的稀释精液。在人工授精前后,马上给供体动物肌肉注射AMOXYPEN(Vet-Drug)。
从1日5:00pm起给供体动物断绝食物和水,于2日回收受精卵。回收在全麻状态下进行,麻醉是通过静脉注射5%的硫喷妥钠(INTRAVAL SODIUM,Vet-Drug),剂量为每10kg体重3ml。插管后通过吸入1-2%Halthane/O2/N2保持麻醉状态。为了回收受精卵,要进行一次腹腔切开手术,并从腹腔中取出子宫。卵子的回收是通过给输卵管倒灌注加有New Zealand来源的牛血清白蛋白的Ovum Culture Medium(AdvancedProtein Products,Brierly Hill,West Midlands,UK).灌注之后,将子宫放回腹腔,缝合伤口。供体动物允许在操作后恢复或是让其“安乐死”。允许恢复的供体动物在操作之前或之后立即肌肉注射操作者推荐剂量的Amoxypen L.A.。
含有三种纤维蛋白原链表达单位的质粒用MluI消化,表达单位片段通过蔗糖密度梯度离心回收与纯化。用荧光计测定片段的浓度,并用上述的不含钙和镁的Dulbecco’s磷酸缓冲液稀释。浓度调节到6μg/ml,约2pl的混合液显微注射进入每个具有可见原核的受精卵的一个原核中。
所有经过原核显微注射的受精卵在体外培养于38.5℃,5%CO2:5%O2:90%N2气氛以及大约100%的湿度,培养基为加有20%v/v的结扎公羊血清的二氧化碳缓冲的合成输卵管培养基(见表)。血清可在56℃加热灭活30分钟,使用前冷冻储存于-20℃。受精卵培养一段合适的时间,使早期胚胎死亡(由操作技术引起的)发生。弃掉那些已死的或停止发育的胚胎。已经发育到5或6次细胞分裂的胚胎转移到同步化的受体母羊中。
            表
     合成输卵管培养基
储液A(可保存使用3个月)
NaCl                    6.29g
KCl                     0.534g
KH2PO4                0.162g
MgSO4.7H2O            0.182g
青霉素                   0.06g
60%乳酸钠糖浆           0.6ml
Super H2O              99.4ml
储液B(可保存使用2周)
NaHCO3                 0.21g
酚红                     0.001g
Super H2O              10ml
储液C(可保存使用2周)
丙酮酸钠                 0.051g
Super H2O              10ml
储液D(可保存使用3个月)
CaCl2·2H2O           0.262g
Super H2O              10ml
储液E(可保存使用3个月)
Hepes                   0.651g
酚红                    0.001g
Super H2O                   10ml
配制10ml碳酸氢盐缓冲培养基
储液A                        1ml
储液B                        1ml
储液C                        0.07ml
储液D                        0.1ml
Super H2O                   7.83ml
Osmolarity应该是265-285mOsm。加入2.5ml热灭活的绵羊血过滤除菌。
配制10mls Hepes缓冲培养基
储液A                    1m
储液B                    0.2ml
储液C                    0.07ml
储液D                    0.1ml
储液E                    0.8ml
Super H2O               7.83ml
Osmolarity应该是265-285mOsm。加入2.5ml热灭活的绵羊血过滤除菌。
受体母羊用阴道内的含孕酮的棉球(CHRONOGEST Ewe Sponge or CHRONOGEST Ewe-Lamb Sponge,Intervet)处理,棉球留在原处保持10或12天。在-1日取走棉球,给母羊肌肉注射1.5ml(300iu)的促卵泡激素替代物(P.M.S.G.,Intervet)以及0.5ml的黄体裂解试剂(Estrumate,Coopers Pitman-Moore)。在0日和1日8:00am-5:00pm之间用结扎的公羊试验母羊的发情期。
在6日或7日将体外培养存活下来的胚胎放回受体母羊(从5日或6日5:00pm开始禁食)中。胚胎转移在如上所述的全麻状态下进行。子宫通过剖腹取出,可使用腹窥镜,也可不用。胚胎返回到那些至少具有一个合适的黄体的母羊的子宫的一个或两个喇叭口内。放回子宫之后,缝合腹部伤口。给动物在操作之前或之后立即肌肉注射操作者所推荐剂量的Amoxypen L.A.,让受体动物恢复。
羊羔在耳部挂上标签,放回饲养棚中。母羊和羊羔可以圈养喂以完全饲料和其它辅助饲料,或者随意喂以干草,也可到草地上放养。
在其第一周龄内(或在不损害健康的前提下尽可能早地),使用两种取样方式试验羊羔中异源DNA的存在。从颈静脉中抽取10ml血样到一个EDTA针管中,如果合适,在头一周内还可以从羊羔中第二次取出血样。组织样品的获取是通过尾部活体解剖,使用一个橡皮筋缠上三圈使尾部失去反应,然后尽可能快地取样(通常在其长出尾巴后200min之内)。组织立刻放入尾部缓冲液中。尾部样品保存于室温并于收集当日分析。所有的羊羔在解剖之后立即肌肉注射操作者所推荐剂量的Amoxypen L.A.,被切过的尾部末端喷以抗生素喷雾剂。
首先分离白细胞从绵羊血液中提取DNA。10ml的血样稀释于20ml的Hank’s缓冲盐(HBS;Sigma Chemical Co.)中。在两个15ml的螺口管中每个内的5ml Histopaque(Sigma)上覆盖10ml的稀释血液。这些管于3,000rpm(最大2,000×g)离心,于室温下缓慢降速15分钟。将白血细胞分界面移到一个干净的15ml管中,用HBS稀释到15ml。稀释的细胞液于室温3,000rpm离心10分钟,回收细胞沉淀,溶于2-5ml尾部缓冲液中。
为了从白细胞中提取DNA,在细胞中加入10%的SDS使其终浓度达到1%,并颠倒管使之混匀。加入1mg新配的蛋白酶K溶液,混合液于45℃保温过夜,DNA用等体积的酚/氯仿抽提3次,并用氯仿/异戊醇抽提一次。加入0.1体积的3M NaAc和2倍体积的乙醇,颠倒混匀。沉淀的DNA用一只干净的末端有标记的玻璃棒缠绕成团。用70%乙醇洗涤后,使DNA凉至半干,然后重新溶解于TE(10mM Tris-HCl,1mM EDTA,PH7.4)中。
来自于血液和尾部的DNA样品使用对BLG启动子区及纤维蛋白原链编码区特异的探针进行Southern印迹分析。
虽然出于阐述本发明的目的,在此做了一些特殊实施方案的描述,但应理解的是,在不背离本发明的精神实质和范围的情况下,除了前面所述的,尚可对其进行各种修改。相应地,本发明将仅受后面所附的权利要求书的限制。
                              序列表(1)一般信息:
(i)申请人:ZymoGenetics,Inc.
           1201 Eastlake Avenue East
           Seattle.Washington 98102
           United States of America
           Pharmaceutical Proteins Ltd.
           Roslin
           Edinburgh
           Midlothian.Scotland EH25 9PP
(ii)发明名称:在转基因动物中生产纤维蛋白原
(iii)序列数:27
(iv)联系地址:
   (A)联系人:ZymoGenetics,Inc.
   (B)街道:1201 Eastlake Avenue East
   (C)城市:Seattle
   (D)州:华盛顿州
   (E)国家:美国
   (F)邮编:98102
(v)计算机可读形式:
   (A)媒介类型:软盘
   (B)计算机:IBM PC兼容机
   (C)操作系统:PC-DOS/MS-DOS
   (D)软件:PatentIn Release#1.0,Version#1.25
(vi)本申请资料
   (A)申请号:
   (B)申请日:
   (C)分类:
(vi)律师/代理人信息:
   (A)姓名:Parker,Gary E
   (B)注册号:31-648
   (C)案号/文档号:93-15PC
(viii)通讯信息:
   (A)电话:206-442-6673
   (B)传真:206-442-6678(2)SEQ ID NO:1的信息:(i)序列特征
(A)长度:5943bp
(B)类型:核酸
(C)链性:双链
(D)拓扑结构:线性(ii)分子类型:DNA(基因组)(vii)来源:
(B)克隆:人纤维蛋白原A-α链(ix)特征:
(A)名称/关键词:CDS
(B)位置:连接(31..84,1154..1279,1739..1922,3055..3200,
              3786..5210)(xi)序列描述:SEQ ID NO:1GTCTAGGAGC CAGCCCCACC CTTAGAAAAG ATG TTT TCC ATG AGG ATC GTC TGC      54
                             Met Phe Ser Met Arg Ile Val Cys
                               1               5CTA GTT CTA AGT GTG GTG GGC ACA GCA TGG GTATGGCCCT TTTCATTTTT        104Leu Val Leu Ser Val Val Gly Thr Ala Trp
 10                  15TCTTCTTGCT TTCTCTCTGG TGTTTATTCC ACAAAGAGCC TGGAGGTCAG AGTCTACCTG    164CTCTATGTCC TGACACACTC TTAGCTTTAT GACCCCAGGC CTGGGAGGAA ATTTCCTGGG    224TGGGCTTGAC ACCTCAAGAA TACAGGGTAA TATGACACCA AGAGGAAGAT CTTAGATGGA    284TGAGAGTGTA CAACTACAAG GGAAACTTTA GCATCTGTCA TTCAGTCTTA CCACATTTTG    344TTTTGTTTTG TTTTAAAAAG GGCAAGAATT ATTTGCCATC CTTGTACCTA TAAAGCCTTG    404GTGCATTATA ATGCTAGTTA ATGGAATAAA ACATTTTATG GTAAGATTTG TTTTCTTTAG    464TTATTAATTT CTTGCTACTT GTCCATAATA AGCAGAACTT TTAGTGTTAG TACAGTTTTG    524CTGAAAGGTT ATTGTTGTGT TTGTCAAGAC AGAAGAAAAA GCAAACGAAT TATCTTTGGA    584AATATCTTTG CAGTATCAGA AGAGATTAGT TAGTAAGGCA ATACGCTTTT CCGCAGTAAT    644GGTATTCTTT TAAATTATGA ATCCATCTCT AAAGGTTACA TAGAAACTTG AAGGAGAGAG     704GAACATTCAG TTAAGATAGT CTAGGTTTTT CTACTGAAGC AGCAATTACA GGAGAAAGAG     764CTCTACAGTA GTTTTCAACT TTCTGTCTGC AGTCATTAGT AAAAATGAAA AGGTAAAATT     824TAACTGATTT TATAGATTCA AATAATTTTC CTTTTAGGAT GGATTCTTTA AAACTCCTAA     884TATTTATCAA ATGCTTATTT AAGTGTCACA CACAGTTAAG AAATTTGTAC ACCTTGTCTC     944CTTTAATTCT CATAACAACT CCATAAAATG GGTCCTAGGA TTTCCATTTG AAGATAAGAA    1004ACCTGAAGCT TGCCGAAGCC CTGTGTCTGC TCTCCTTAAT CTCTGTGAGA GTGCCATCTC    1064TTCCTGGGGA CTTGTAGGCA TGCCACTGTC TCCTCTTCTG GCTAACATTG CTGTTGCTCT    1124CTTTTGTGTA TGTGAATGAA TCTTTAAAG ACT GCA GAT AGT GGT GAA GGT GAC      1177
                            Thr Ala Asp Ser Gly Glu Gly Asp
                                 20                  25TTT CTA GCT GAA GGA GGA GGC GTG CGT GGC CCA AGG GTT GTG GAA AGA      1225Phe Leu Ala Glu Gly Gly Gly Val Arg Gly Pro Arg Val Val Glu Arg
         30                  35                  40CAT CAA TCT GCC TGC AAA GAT TCA GAC TGG CCC TTC TGC TCT GAT GAA      1273His Gln Ser Ala Cys Lys Asp Ser Asp Trp Pro Phe Cys Ser Asp Glu
     45                  50                  55GAC TGG GTAAGCAGTC AGCGGGGGAA GCAGGAGATT CCTTCCCTCT GATGCTAGAG       1329Asp Trp
 60GGGCTCACAG GCTGACCTGA TTGGTCCCAG AAACTTTTTT AAATAGAAAA TAATTGAATA    1389GTTACCTACA TAGCAAATAA AGAAAAGGAA CCTACTCCCA AGAGCACTGT TTATTTACCT    1449CCCCAACTCT GGATCATTAG TGGGTGAACA GACAGGATTT CAGTTGCATG CTCAGGCAAA    1509ACCAGGCTCC TGAGTATTGT GGCCTCAATT TCCTGGCACC TATTTATGGC TAAGTGGACC    1569CTCATTCCAG AGTTTCTCTG CGACCTCTAA CTAGTCCTCT TACCTACTTT TAAGCCAACT    1629TATCTGGAAG AGAAAGGGTA GGAAGAAATG GGGGCTGCAT GGAAACATGC AAAATTATTC    1689TGAATCTGAG AGATAGATCC TTACTGTAAT TTTCTCCCTT CACTTTCAG AAC TAC        1744
                                                  Asn TyrAAA TGC CCT TCT GGC TGC AGG ATG AAA GGG TTG ATT GAT GAA GTC AAT      1792Lys Cys Pro Ser Gly Cys Arg Met Lys Gly Leu Ile Asp Glu Val Asn
     65                  70                  75CAA GAT TTT ACA AAC AGA ATA AAT AAG CTC AAA AAT TCA CTA TTT GAA      1840Gln Asp Phe Thr Asn Arg Ile Asn Lys Leu Lys Asn Ser Leu Phe Glu
 80                  85                  90TAT CAG AAG AAC AAT AAG GAT TCT CAT TCG TTG ACC ACT AAT ATA ATG      1888Tyr Gln Lys Asn Asn Lys Asp Ser His Ser Leu Thr Thr Asn Ile Met95                 100                 105                 110GAA ATT TTG AGA GGC GAT TTT TCC TCA GCC AAT A GTAAGTATTA             1932Glu Ile Leu Arg Gly Asp Phe Ser Ser Ala Asn
            115                 120CATATTTACT TCTTTGACTT TATAACAGAA ACAACAAAAA TCCTAAATAA ATATGATATC    1992CGCTTATATC TATGACAATT TCATCCCAAA GTACTTAGTG TAGAAACACA TACCTTCATA    2052ATATCCCTGA AAATTTTAAG AGGGAGCTTT TGTTTTCGTT ATTTTTTCAA AGTAAAAGAT    2112GTTAACTGAG ATTGTTTAAG GTCACAAAAT AAGTCAGAAT TTTGGATTAA AACAAGAATT    2172TAAATGTGTT CTTTTCAACA GTATATACTG AAAGTAGGAT GGGTCAGACT CTTTGAGTTG    2232ATATTTTTGT TTCTGCTTTG TAAAGGTGAA AACTGAGAGG TCAAGGAACT TGTTCAAAGA    2292CACAGAGCTG GGAATTCAAC TCCCAGACTC CACTGAGCTG ATTAGGTAGA TTTTTAAATT    2352TAAAATATAG GGTCAAGCTA CGTCATTCTC ACAGTCTACT CATTAGGGTT AGGAAACATT    2412GCATTCACTC TGGGCATGGA CAGCGAGTCT AGGGAGTCCT CAGTTTCTCA AGTTTTGCTT    2472TGCCTTTTTA CACCTTCACA AACACTTGAC ATTTAAAATC AGTGATGCCA ACACTAGCTG    2532GCAAGTGAGT GATCCTGTTG ACCCAAAACA GCTTAGGAAC CATTTCAAAT CTATAGAGTT    2592AAAAAGAAAA GCTCATCAGT AAGAAAATCC AATATGTTCA AGTCCCTTGA TTAAGGATGT    2652TATAAAATAA TTGAAATGCA ATCAAACCAA CTATTTTAAC TCCAAATTAC ACCTTTAAAA    2712TTCCAAAGAA AGTTCTTCTT CTATATTTCT TTGGGATTAC TAATTGCTAT TAGGACATCT    2772TAACTGGCAT TCATGGAAGG CTGCAGGGCA TAACATTATC CAAAAGTCAA ATGCCCCATA    2832GGTTTTGAAC TCACAGATTA AACTGTAACC AAAATAAAAT TAGGCATATT TACAAGCTAG    2892TTTCTTTCTT TCTTTTTTCT CTTTCTTTCT TTCTTTCTTT CTTTCTTTCT TTCTTTCTTT    2952CTTTCTTTCT TTCTCCTTCC TTCCTTTCTT CCTTTCTTTT TTGCTGGCAA TTACAGACAA    3012ATCACTCAGC AGCTACTTCA ATAACCATAT TTTCGATTTC AG AC CGT GAT AAT        3065
                                          Asn Arg Asp Asn
                                                      125ACC TAC AAC CGA GTG TCA GAG GAT CTG AGA AGC AGA ATT GAA GTC CTG      3113Thr Tyr Asn Arg Val Ser Glu Asp Leu Arg Ser Arg Ile Glu Val Leu
            130                 135                 140AAG CGC AAA GTC ATA GAA AAA GTA CAG CAT ATC CAG CTT CTG CAG AAA      3161Lys Arg Lys Val Ile Glu Lys Val Gln His Ile Gln Leu Leu Gln Lys
        145                 150             155AAT GTT AGA GCT CAG TTG GTT GAT ATG AAA CGA CTG GAG GTAAGTATGT       3210Asn Val Arg Ala Gln Leu Val Asp Met Lys Arg Leu Glu
    160                 165                 170GGCTGTGGTC CCGAGTGTCC TTGTTTTTGA GTAGAGGGAA AAGGAAGGCG ATAGTTATGC    3270ACTGAGTGTC TACTATATGC AGAGAAAAGT GTTATATCCA TCATCTACCT AAAAGTAGGT    3330ATTATTTTCC TCACTCCACA GTTGAAGAAA AAAAAATTCA GAGATATTAA GTAAATTTTC    3390CAACGTACAT AGATAGTAAT TCAAAGCAAT GTTCAGTCCC TGTCTATTCC AAGCCATTAC    3450ATCACCACAC CTCTGAGCCC TCAGCCTGAG TTCACCAAGG ATCATTTAAT TAGCGTTTCC    3510TTTGAGAGGG AATAGCACCT TACTCTTGAT CCATTCTGAG GCTAAGATGA ATTAAACAGC    3570ATCCATTGCT TATCCTGGCT AGCCCTGCAA TACCCAACAT CTCTTCCACT GAGGGTGCTC    3630GATAGGCAGA AAACAGAGAA TATTAAGTGG TAGGTCTCCG AGTCAAAAAA AATGAAACCA    3690GTTTCCAGAA GGAAAATTAA CTACCAGGAA CTCAATAGAC GTAGTTTATG TATTTGTATC    3750TACATTTTCT CTTTATTTTT CTCCCCTCTC TCTAG GTG GAC ATT GAT ATT AAG       3803
                                   Val Asp Ile Asp Ile Lys
                                                   175ATC CGA TCT TGT CGA GGG TCA TGC AGT AGG GCT TTA GCT CGT GAA GTA     3851Ile Arg Ser Cys Arg Gly Ser Cys Ser Arg Ala Leu Ala Arg Glu Val
        180                 185                 190GAT CTG AAG GAC TAT GAA GAT CAG CAG AAG CAA CTT GAA CAG GTC ATT     3899Asp Leu Lys Asp Tyr Glu Asp Gln Gln Lys Gln Leu Glu Gln Val Ile
    195                 200                 205GCC AAA GAC TTA CTT CCC TCT AGA GAT AGG CAA CAC TTA CCA CTG ATA     3947Ala Lys Asp Leu Leu Pro Ser Arg Asp Arg Gln His Leu Pro Leu Ile
210                 215                 220AAA ATG AAA CCA GTT CCA GAC TTG GTT CCC GGA AAT TTT AAG AGC CAG     3995Lys Met Lys Pro Val Pro Asp Leu Val Pro Gly Asn Phe Lys Ser Gln225                 230                 235                 240CTT CAG AAG GTA CCC CCA GAG TGG AAG GCA TTA ACA GAC ATG CCG CAG     4043Leu Gln Lys Val Pro Pro Glu Trp Lys Ala Leu Thr Asp Met Pro Gln
            245                 250                 255ATG AGA ATG GAG TTA GAG AGA CCT GGT GGA AAT GAG ATT ACT CGA GGA     4091Met Arg Met Glu Leu Glu Arg Pro Gly Gly Asn Glu Ile Thr Arg Gly
        260                 265                 270GGC TCC ACC TCT TAT GGA ACC GGA TCA GAG ACG GAA AGC CCC AGG AAC     4139Gly Ser Thr Ser Tyr Gly Thr Gly Ser Glu Thr Glu Ser Pro Arg Asn
    275                 280                 285CCT AGC AGT GCT GGA AGC TGG AAC TCT GGG AGC TCT GGA CCT GGA AGT     4187Pro Ser Ser Ala Gly Ser Trp Asn Ser Gly Ser Ser Gly Pro Gly Ser
290                 295                 300ACT GGA AAC CGA AAC CCT GGG AGC TCT GGG ACT GGA GGG ACT GCA ACC     4235Thr Gly Asn Arg Asn Pro Gly Ser Ser Gly Thr Gly Gly Thr Ala Thr305                 310                 315                 320TGG AAA CCT GGG AGC TCT GGA CCT GGA AGT GCT GGA AGC TGG AAC TCT     4283Trp Lys Pro Gly Ser Ser Gly Pro Gly Ser Ala Gly Ser Trp Asn Ser
            325                 330                 335GGG AGC TCT GGA ACT GGA AGT ACT GGA AAC CAA AAC CCT GGG AGC CCT     4331Gly Ser Ser Gly Thr Gly Ser Thr Gly Asn Gln Ash Pro Gly Ser Pro
        340                 345                 350AGA CCT GGT AGT ACC GGA ACC TGG AAT CCT GGC AGC TCT GAA CGC GGA     4379Arg Pro Gly Ser Thr Gly Thr Trp Asn Pro Gly Ser Ser Glu Arg Gly
    355                 360             365AGT GCT GGG CAC TGG ACC TCT GAG AGC TCT GTA TCT GGT AGT ACT GGA      4427Ser Ala Gly His Trp Thr Ser Glu Ser Ser Val Ser Gly Ser Thr Gly
370                 375                 380CAA TGG CAC TCT GAA TCT GGA AGT TTT AGG CCA GAT AGC CCA GGC TCT      4475Gln Trp His Ser Glu Ser Gly Ser Phe Arg Pro Asp Ser Pro Gly Ser385                 390                 395                 400GGG AAC GCG AGG CCT AAC AAC CCA GAC TGG GGC ACA TTT GAA GAG GTG      4523Gly Asn Ala Arg Pro Asn Asn Pro Asp Trp Gly Thr Phe Glu Glu Val
            405                 410                 415TCA GGA AAT GTA AGT CCA GGG ACA AGG AGA GAG TAC CAC ACA GAA AAA      4571Ser Gly Asn Val Ser Pro Gly Thr Arg Arg Glu Tyr His Thr Glu Lys
        420                 425                 430CTG GTC ACT TCT AAA GGA GAT AAA GAG CTC AGG ACT GGT AAA GAG AAG      4619Leu Val Thr Ser Lys Gly Asp Lys Glu Leu Arg Thr Gly Lys Glu Lys
    435                 440                 445GTC ACC TCT GGT AGC ACA ACC ACC ACG CGT CGT TCA TGC TCT AAA ACC      4667Val Thr Ser Gly Ser Thr Thr Thr Thr Arg Arg Ser Cys Ser Lys Thr
450                 455                 460GTT ACT AAG ACT GTT ATT GGT CCT GAT GGT CAC AAA GAA GTT ACC AAA      4715Val Thr Lys Thr Val Ile Gly Pro Asp Gly His Lys Glu Val Thr Lys465                 470                 475                 480GAA GTG GTG ACC TCC GAA GAT GGT TCT GAC TGT CCC GAG GCA ATG GAT      4763Glu Val Val Thr Ser Glu Asp Gly Ser Asp Cys Pro Glu Ala Met Asp
            485                 490                 495TTA GGC ACA TTG TCT GGC ATA GGT ACT CTG GAT GGG TTC CGC CAT AGG      4811Leu Gly Thr Leu Ser Gly Ile Gly Thr Leu Asp Gly Phe Arg His Arg
        500                 505                 510CAC CCT GAT GAA GCT GCC TTC TTC GAC ACT GCC TCA ACT GGA AAA ACA      4859His Pro Asp Glu Ala Ala Phe Phe Asp Thr Ala Ser Thr Gly Lys Thr
    515                 520                 525TTC CCA GGT TTC TTC TCA CCT ATG TTA GGA GAG TTT GTC AGT GAG ACT      4907Phe Pro Gly Phe Phe Ser Pro Met Leu Gly Glu Phe Val Ser Glu Thr
530                 535                 540GAG TCT AGG GGC TCA GAA TCT GGC ATC TTC ACA AAT ACA AAG GAA TCC      4955Glu Ser Arg Gly Ser Glu Ser Gly Ile Phe Thr Asn Thr Lys Glu Ser545                 550                 555                 560AGT TCT CAT CAC CCT GGG ATA GCT GAA TTC CCT TCC CGT GGT AAA TCT      5003Ser Ser His His Pro Gly Ile Ala Glu Phe Pro Ser Arg Gly Lys Ser
            565                 570                 575TCA AGT TAC AGC AAA CAA TTT ACT AGT AGC ACG AGT TAC AAC AGA GGA      5051Ser Ser Tyr Ser Lys Gln Phe Thr Ser Ser Thr Ser Tyr Asn Arg Gly
        580                 585                 590GAC TCC ACA TTT GAA AGC AAG AGC TAT AAA ATG GCA GAT GAG GCC GGA      5099Asp Ser Thr Phe Glu Ser Lys Ser Tyr Lys Met Ala Asp Glu Ala Gly
    595                 600                 605AGT GAA GCC GAT CAT GAA GGA ACA CAT AGC ACC AAG AGA GGC CAT GCT      5147Ser Glu Ala Asp His Glu Gly Thr His Ser Thr Lys Arg Gly His Ala
610                 615                 620AAA TCT CGC CCT GTC AGA GGT ATC CAC ACT TCT CCT TTG GGG AAG CCT      5195Lys Ser Arg Pro Val Arg Gly Ile His Thr Ser Pro Leu Gly Lys Pro625                 630                 635                 640TCC CTG TCC CCC TAGACTAAGT TAAATATTTC TGCACAGTGT TCCCATGGCC          5247Ser Leu Ser Pro
            645CCTTGCATTT CCTTCTTAAC TCTCTGTTAC ACGTCATTGA AACTACACTT TTTTGGTCTG    5307TTTTTGTGCT AGACTGTAAG TTCCTTGGGG GCAGGGCCTT TGTCTGTCTC ATCTCTGTAT    5367TCCCAAATGC CTAACAGTAC AGAGCCATGA CTCAATAAAT ACATGTTAAA TGGATGAATG    5427AATTCCTCTG AAACTCTATT TGAGCTTATT TAGTCAAATT CTTTCACTAT TCAAAGTGTG    5487TGCTATTAGA ATTGTCACCC AACTGATTAA TCACATTTTT AGTATGTGTC TCAGTTGACA    5547TTTAGGTCAG GCTAAATACA AGTTGTGTTA GTATTAAGTG AGCTTAGCTA CCTGTACTGG    5607TTACTTGCTA TTAGTTTGTG CAAGTAAAAT TCCAAATACA TTTGAGGAAA ATCCCCTTTG    5667CAATTTGTAG GTATAAATAA CCGCTTATTT GCATAAGTTC TATCCCACTG TAAGTGCATC    5727CTTTCCCTAT GGAGGGAAGG AAAGGAGGAA GAAAGAAAGG AAGGGAAAGA AACAGTATTT    5787GCCTTATTTA ATCTGAGCCG TGCCTATCTT TGTAAAGTTA AATGAGAATA ACTTCTTCCA    5847ACCAGCTTAA TTTTTTTTTT AGACTGTGAT GATGTCCTCC AAACACATCC TTCAGGTACC        5907CAAAGTGGCA TTTTCAATAT CAAGCTATCC GGATCC                                  5943(2)SEQ ID NO:2的信息:(i)序列特征(A)长度:644个氨基酸(B)类型:氨基酸(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:2Met Phe Ser Met Arg Ile Val Cys Leu Val Leu Ser Val Val Gly Thr1               5                  10                  15Ala Trp Thr Ala Asp Ser Gly Glu Gly Asp Phe Leu Ala Glu Gly Gly
         20                  25                  30Gly Val Arg Gly Pro Arg Val Val Glu Arg His Gln Ser Ala Cys Lys
     35                  40                  45Asp Ser Asp Trp Pro Phe Cys Ser Asp Glu Asp Trp Asn Tyr Lys Cys
 50                  55                  60Pro Ser Gly Cys Arg Met Lys Gly Leu Ile Asp Glu Val Asn Gln Asp65                  70                  75                  80Phe Thr Asn Arg Ile Asn Lys Leu Lys Asn Ser Leu Phe Glu Tyr Gln
             85                  90                  95Lys Asn Asn Lys Asp Ser His Ser Leu Thr Thr Asn Ile Met Glu Ile
        100                 105                 110Leu Arg Gly Asp Phe Ser Ser Ala Asn Asn Arg Asp Asn Thr Tyr Asn
    115                 120                 125Arg Val Ser Glu Asp Leu Arg Ser Arg Ile Glu Val Leu Lys Arg Lys
130                 135                 140Val Ile Glu Lys Val Gln His Ile Gln Leu Leu Gln Lys Asn Val Arg145                 150                 155                 160Ala Gln Leu Val Asp Met Lys Arg Leu Glu Val Asp Ile Asp Ile Lys
            165                 170                 175Ile Arg Ser Cys Arg Gly Ser Cys Ser Arg Ala Leu Ala Arg Glu Val
        180                 185                 190Asp Leu Lys Asp Tyr Glu Asp Gln Gln Lys Gln Leu Glu Gln Val Ile
    195                 200                 205Ala Lys Asp Leu Leu Pro Ser Arg Asp Arg Gln His Leu Pro Leu Ile
210                 215                 220Lys Met Lys Pro Val Pro Asp Leu Val Pro Gly Asn Phe Lys Ser Gln225                 230                 235                 240Leu Gln Lys Val Pro Pro Glu Trp Lys Ala Leu Thr Asp Met Pro Gln
            245                 250                 255Met Arg Met Glu Leu Glu Arg Pro Gly Gly Asn Glu Ile Thr Arg Gly
        260                 265                 270Gly Ser Thr Ser Tyr Gly Thr Gly Ser Glu Thr Glu Ser Pro Arg Asn
    275                 280                 285Pro Ser Ser Ala Gly Ser Trp Asn Ser Gly Ser Ser Gly Pro Gly Ser
290                 295                 300Thr Gly Asn Arg Asn Pro Gly Ser Ser Gly Thr Gly Gly Thr Ala Thr305                 310                  315                320Trp Lys Pro Gly Ser Ser Gly Pro Gly Ser Ala Gly Ser Trp Asn Ser
            325                 330                 335Gly Ser Ser Gly Thr Gly Ser Thr Gly Asn Gln Asn Pro Gly Ser Pro
        340                 345                 350Arg Pro Gly Ser Thr Gly Thr Trp Asn Pro Gly Ser Ser Glu Arg Gly
    355                 360                 365Ser Ala Gly His Trp Thr Ser Glu Ser Ser Val Ser Gly Ser Thr Gly
370                 375                 380Gln Trp His Ser Glu Ser Gly Ser Phe Arg Pro Asp Ser Pro Gly Ser385                 390                 395                 400Gly Asn Ala Arg Pro Asn Asn Pro Asp Trp Gly Thr Phe Glu Glu Val
            405                 410                 415Ser Gly Asn Val Ser Pro Gly Thr Arg Arg Glu Tyr His Thr Glu Lys
        420                 425                 430Leu Val Thr Ser Lys Gly Asp Lys Glu Leu Arg Thr Gly Lys Glu Lys
    435                 440                 445Val Thr Ser Gly Ser Thr Thr Thr Thr Arg Arg Ser Cys Ser Lys Thr
450                 455                 460Val Thr Lys Thr Val Ile Gly Pro Asp Gly His Lys Glu Val Thr Lys465                 470                 475                 480Glu Val Val Thr Ser Glu Asp Gly Ser Asp Cys Pro Glu Ala Met Asp
            485                 490                 495Leu Gly Thr Leu Ser Gly Ile Gly Thr Leu Asp Gly Phe Arg His Arg
        500                 505                 510His Pro Asp Glu Ala Ala Phe Phe Asp Thr Ala Ser Thr Gly Lys Thr
    515                 520                 525Phe Pro Gly Phe Phe Ser Pro Met Leu Gly Glu Phe Val Ser Glu Thr
530                 535                 540Glu Ser Arg Gly Ser Glu Ser Gly Ile Phe Thr Asn Thr Lys Glu Ser545                 550                 555                 560Ser Ser His His Pro Gly Ile Ala Glu Phe Pro Ser Arg Gly Lys Ser
            565                 570                 575Ser Ser Tyr Ser Lys Gln Phe Thr Ser Ser Thr Ser Tyr Asn Arg Gly
        580                 585                 590Asp Ser Thr Phe Glu Ser Lys Ser Tyr Lys Met Ala Asp Glu Ala Gly
    595                 600                 605Ser Glu Ala Asp His Glu Gly Thr His Ser Thr Lys Arg Gly His Ala
610                 615                 620Lys Ser Arg Pro Val Arg Gly Ile His Thr Ser Pro Leu Gly Lys Pro625                 630                 635                 640Ser Leu Ser Pro(2)SEQ ID NO:3的信息:(i)序列特征(A)长度:8878bp(B)类型:核酸(C)链性:双链(D)拓扑结构:线性(ii)分子类型:DNA(基因组)(vii)来源:
(B)克隆:人纤维蛋白原B-β链(ix)特征:
(A)名称/关键词:misc_RNA
(B)位置:1..469(ix)特征:
(A)名称/关键词:外显子
(B)位置:470..583(ix)特征:
(A)名称/关键词:内含子
(B)位置:584..3257(ix)特征:
(A)名称/关键词:外显子
(B)位置:3258..3449(ix)特征:
(A)名称/关键词:内含子
(B)位置:3450..3938(ix)特征:
(A)名称/关键词:外显子
(B)位置:3939..4122(ix)特征:
(A)名称/关键词:内含子
(B)位置:4123..5042(ix)特征:
(A)名称/关键词:外显子
(B)位置:5043..5270(ix)特征:
(A)名称/关键词:内含子
(B)位置:5271..5830(ix)特征:
(A)名称/关键词:外显子
(B)位置:5831..5944(ix)特征:
(A)名称/关键词:内含子
(B)位置:5945..6632(ix)特征:
(A)名称/关键词:外显子
(B)位置:6633..6758(ix)特征:
(A)名称/关键词:内含子
(B)位置:6759..6966(ix)特征:
(A)名称/关键词:外显子
(B)位置:6967..7252(ix)特征:
(A)名称/关键词:内含子
(B)位置:7253..7870(ix)特征:
(A)名称/关键词:外显子
(B)位置:7871..8102(ix)特征:
(A)名称/关键词:3’UTR
(B)位置:8103..8537(ix)特征:
(A)名称/关键词:misc_RNA
(B)位置:8538..8878(ix)特征:
(A)名称/关键词:CDS
(B)位置:连接(470..583,3258..3449,3939..4122,5043..5270,
               5831..5944,6633..6758,6967..7252,7871..8102)(xi)序列描述:SEQ ID NO:3GAATTCATGC CCCTTTTGAA ATAGACTTAT GTCATTGTCA GAAAACATAA GCATTTATGG    60TATATCATTA ATGAGTCACG ATTTTAGTGG TTGCCTTGTG AGTAGGTCAA ATTTACTAAG   120CTTAGATTTG TTTTCTCACA TATTCTTTCG GAGCTTGTGT AGTTTCCACA TTAATTTACC   180AGAAACAAGA TACACACTCT CTTTGAGGAG TGCCCTAACT TCCCATCATT TTGTCCAATT   240AAATGAATTG AAGAAATTTA ATGTTTCTAA ACTAGACCAA CAAAGAATAA TAGTTGTATG   300ACAAGTAAAT AAGCTTTGCT GGGAAGATGT TGCTTAAATG ATAAAATGGT TCAGCCAACA   360AGTGAACCAA AAATTAAATA TTAACTAAGG AAAGGTAACC ATTTCTGAAG TCATTCCTAG   420CAGAGGACTC AGATATATAT AGGATTGAAG ATCTCTCAGT TAAGTCTAC ATG AAA       475
                                                  Met Lys
                                                    1AGG ATG GTT TCT TGG AGC TTC CAC AAA CTT AAA ACC ATG AAA CAT CTA     523Arg Met Val Ser Trp Ser Phe His Lys Leu Lys Thr Met Lys His Leu
      5                  10                  15TTA TTG CTA CTA TTG TGT GTT TTT CTA GTT AAG TCC CAA GGT GTC AAC     571Leu Leu Leu Leu Leu Cys Val Phe Leu Val Lys Ser Gln Gly Val Asn
 20                  25                  30GAC AAT GAG GAG GTGAATTTTT TAAAGCATTA TTATATTATT AGTAGTATTA         623Asp Asn Glu Glu35TTAATATAAG ATGTAACATA ATCATATTAT GTGCTTATTT TAATGAAATT AGCATTGCTT   683ATAGTTATGA AATGGAATTG TTAACCTCTG ACTTATTGTA TTTAAAGAAT GTTTCATAGT   743ATTTCTTATA TAAAAACAAA GTAATTTCTT GTTTTCTAGT TTATCACCTT TGTTTTCTTA   803AGATGAGGAT GGCTTAGCTA ATGTAAGATG TGTTTTTCTC ACTTGCTATT CTGAGTACTG   863TGATTTTCAT TTACTTCTAG CAATACAGGA TTACAATTAA GAGGACAAGA TCTGAAAATC   923TCACAAACTA TAAAATAATA AAAGAGCAGA ATTTTAAGAT AAAAGAAACT GGTGGTAGGT   983AGATTGTTCT TTGGTGAAGG AAGGTAATAT ATATTGTTAC TGAGATTACT ATTTATAAAA  1043ATTATAACTA AGCCTAAAAG CAAAATACAT CAAGTGTAAT GATAGAAAAT GAAATATTGC  1103TTTTTTCAGA TGAAAAGTTC AAATTAGAGT TAGTGTGTAT TGTTATTATT AATAGTTATG    1163AAACACGGTT CAGTCTAATT TATTTATTTG TAGAACAGTT TGTCCTCAAC TATTATTTTT    1223GCTGACTTAT TGCTGTTAAT TTGCAGTTAC TAAAAATACA GAAATGCATT TAGGACAATG    1283GATATTTAAG AAATTTAAAT TTTATCATCA AACGTATCAT GGCCAAATTT CTTACATATA    1343GCATAGTATC ATTAAACTAG AAATAAGAAT ACACAATAAT ATTTAAATGA AGTGATTCAT    1403TTCGGATCAT TATTGAGTTT CAAGGGAACT TGAGTGTTGT ACTTATCAGA CTCTACATGT    1463AAGAACATAT AGTTAATCTG GTTGTGTGTG TAAAAACATA TGGTTAATCT GGTTAAGTCT    1523GGTTAATCAT ATTAGGTAAG AAAAATGTAA AGAATGTGTA AGACGAAATT TTTGTAAAGT    1583ACTCTGCAAA GCACTTTCAC ATTTCTGCTT ATCAACTAAA CCTCACAGAG ATAGTTTAAT    1643AGTTTAGGCT TTAAAATGGA TTTTGATTAT TCAACAAGTG GCCTTCATAA TTTCTTTAAG    1703TGTTTTTCTT TAAGTATATA CTTTCTTTAA ATATTTTTTA AAATTTCCTT TTCTCTAGTA    1763AAGCCAGACC ATCCATGCTA CCTCTCTAGT GGCACTCTGA AATAAAAAGA AAATAGTTTT    1823CTCTGTTATA ATTGTATTTG TAATAAGCAG ATGAATCACA TTTCTTAAAA TTTGTTTTAG    1883AGAGGGTAAG CTCTGACTAG GACCATGACT TCAATGTGAA ATATGTATAT ATCCTCCGAA    1943TCTTTACATA TTAAGAATGT ATATAGTCAA CTGGTTAAAC AGGAAAATCT GGAACAGCCT    2003GGCTGGGTTT TAATCTTAGC ACCATCCTAC TAAATGTTAA ATAATATTAT AATCTAATGA    2063ATAAATGACA ATGCAATTCC AAATAGAGTT CATCTGATGA CTTCTAGACT CACAAAATTG    2123CAAGAGAGCT CAGTTGTTGC TCAGTTGTTC CAAATCATGT CGTTTGTTAA TTTGTAATTA    2183AGCTCCAAAG GATGTATAGC TACTGACAAA AAAAAAAATG AGAATGTAGT TAATCCAAAT    2243CAAAACTTTC CTATTGCAAT GCGTATTTTC TGCTTCATTA TCCTTTAATA TAATATTTTA    2303AGTTAGCAAG TAATTTTAAT TACAATGCAC AAGCCTTGAG AATTATTTTA AATATAAGAA    2363AATCATAATG TTTGATAAAG AAATCATGTA AGAAATTTCA AGATAATGGT TTAACAAATA    2423ATTTTGTTGA TAGAAGATAA GACTAAAAGT GAAATTCGAA GTGGAGAGGA CACTTAAACT    2483GTAGTACTTG TTATGTGTGA TTCCAGTAAA AATAGTAATG AGCACTTATT ATTGCCAAGT    2543ACTGTTCTGA GGGTACCATA TGCAATAAGT TATTTAATCC TTACAATAAT CTTGTAAGGC    2603AGATTCAAAC TATCATTACA CTTATTTTAC AGATGAGAAA ACTGGGGCAC AGATAAAGCA    2663ACTTGCCCAA GGTCTCATAG CTGTAAGTCA ACCCTACGGT CAAGACCTAC AAGTAGCCGA    2723GCTCCAGAGT ACATTATGAG GGTCAAAGAT TGTCTTATTA CAAATAAATT CCAAGTAGAA    2783TCAACCTTTA ATAAGTCTTT AATGTCTCTT AAATATGTTT ATATAGGAGT CTAATCACCA    2843ATTCACAAAA ATGAAAGTAG GGAAATGATT AACAATAATC ATAGGAATCT AACAATCCAA    2903GTGGCTTGAG AATATTCATT CTTCTTGACA GTATAGATTC TTTACAATTT CGTAAGTTCC    2963AATGTATGTT TTAGGAATAT GAGGTCATTA CTATTCATAA TCTGATACAG CTTTATCCTA    3023AGGCCTCTCT TTAAAAACTA CACTGCATCA TAGCTTTTTT GTGCAGTTGG TCTTTCTACT    3083GTTACTGAAC AGTAAGCAAC CTACAGATTC ACTATCACCA ACCAGCCAGT TGATGGATCT    3143TAAGCAAATT ATCAAGCTTG TGATAACCTA AATTATAAAA TGAGGGTGTT GGAATAGTTA    3203CATTCCAAAT CTTCTATAAC ACTCTGTATT ATATTTCTGC CTCATTCCTT GTAG GGT      3260
                                                        GlyTTC TTC AGT GCC CGT GGT CAT CGA CCC CTT GAC AAG AAG AGA GAA GAG      3308Phe Phe Ser Ala Arg Gly His Arg Pro Leu Asp Lys Lys Arg Glu Glu40                  45                  50                  55GCT CCC AGC CTG AGG CCT GCC CCA CCG CCC ATC AGT GGA GGT GGC TAT      3356Ala Pro Ser Leu Arg Pro Ala Pro Pro Pro Ile Ser Gly Gly Gly Tyr
             60                  65                  70CGG GCT CGT CCA GCC AAA GCA GCT GCC ACT CAA AAG AAA GTA GAA AGA      3404Arg Ala Arg Pro Ala Lys Ala Ala Ala Thr Gln Lys Lys Val Glu Arg
         75                  80                  85AAA GCC CCT GAT GCT GGA GGC TGT CTT CAC GCT GAC CCA GAC CTG          3449Lys Ala Pro Asp Ala Gly Gly Cys Leu His Ala Asp Pro Asp Leu
     90                  95                 100GTGGGTGCAC TGATGTTTCT TGCAGTGGTG GCTCTCTCAT GCAGAGAAAG CCTGTAGTCA    3509TGGCAGTCTG CTAATGTTTC ACTGACCCAC ATTACCATCA CTGTTATTTT GTTTGTTTAT    3569TTTGGAAATA AAATTCAAAA CATAAACATA TTGGGCCTTT GGTTTAGGCT TTCTTTCTTG    3629TTTTCTTTGG TCTGGGCCCA AAATTTCAAA TTAGGATATG TGGGTGCCAC CTTTCCATTT    3689GTATTTTGCC ACTGCCTTTG TTTAGTTGGT AAAATTTTCA TAGCCCAATT ATATTTTTTC    3749TGGGGTAAGT AATATTTTAA ATCTCTATGA GAGTATGATG ATGACTTTCG AATTTCTGGT    3809CTTACAGAAA ACCAAATAAT AAATTTTTAT GTTGGCTAAT CGTATCGCTG AATTTTCCTA    3869TGTGCTATTT TAACAAATGT CCATGACCCA AATCCTTCAT CTAATGCCTG CTATTTTCTT    3929TGTTTTTAG GGG GTG TTG TGT CCT ACA GGA TGT CAG TTG CAA GAG GCT        3977
      Gly Val Leu Cys Pro Thr Gly Cys Gln Leu Gln Glu Ala
              105                 110                 115TTG CTA CAA CAG GAA AGG CCA ATC AGA AAT AGT GTT GAT GAG TTA AAT      4025Leu Leu Gln Gln Glu Arg Pro Ile Arg Asn Ser Val Asp Glu Leu Asn
            120                 125                 130AAC AAT GTG GAA GCT GTT TCC CAG ACC TCC TCT TCT TCC TTT CAG TAC      4073Asn Asn Val Glu Ala Val Ser Gln Thr Ser Ser Ser Ser Phe Gln Tyr
        135                 140                 145ATG TAT TTG CTG AAA GAC CTG TGG CAA AAG AGG CAG AAG CAA GTA AAA  G   4122Met Tyr Leu Leu Lys Asp Leu Trp Gln Lys Arg Gln Lys Gln Val Lys
    150                 155                 160GTAGATATCC TTGTGCTTTC CATTCGATTT TCAGCTATAA AATTGGAACC GTTAGACTGC    4182CACGAGAATG CATGGTTGTG AGAAGATTAA CATTTCTGGG TTAGTGAATA GCATTCATAC    4242GCTTTTGGGC ACCTTCCCCT GCAACTTGCC AGATAAGCAC TATTCAGCTC TTATTCCCAG    4302TCTGACATCA GCAAGTGTGA TTTTCTATGA AAAATTCTAC TATGACTCCT TATTTTAAGT    4362ATACAAGAAA CTTGTGACTC AGAAGATAAT ATTTACAGAG TGGAAAAAAA CCCCTAGCAT    4422TTATAGTTTT AACATTTGAG GTTTTGAATG AGAGAGTTAT CCATAATATA TTCAATTGTG    4482TTGTGGATAA TGACACCTAA CCTGTGAATC TTGAGGTCAG AATGTTGAGT GCTGTTGACT    4542TGGTGGTCAG GAAACAGCTA GTGCGTGAGC CTGGCACAGG CATCTCAGTG AGTAGCATAC    4602CCACAGTTGG AAATTTTTCA AAGAAATCAA AGGAATCATG ACATCTTATA AATTTCAAGG    4662TTCTGCTATA CTTATGTGAA ATGGATAAAT AAATCAAGCA TATCCACTCT GTAAGATTGA    4722ACTTCTCAGA TGGAAGACCC CAATACTGCT TTCTCCTCTT TTCCCTCACC AAAGAAATAA   4782ACAACCTATT TCATTTATTA CTGGACACAA TCTTTAGCGT ATACCTATGG TAAATTACTA   4842GTATGGTGGT TAGGATTTTT GTTAATTTGT ATATGTCATG CGCCAAATCA TTTCCACTAA   4902ATATGACTAT ATATCATAAC TGCTTGGTGA TAGCTCAGTG TTTAATAGTT TATTCTCAGA   4962AAATCAAAAT TGTATAGTTA AATACATTAG TTTTATGAGG CAAAAATGCT AACTATTTCT   5022ACATAATTTC ATTTTTCCAG  AT AAT GAA AAT GTA GTC AAT GAG TAC TCC       5071
                  Asp Asn Glu Asn Val Val Asn Glu Tyr Ser
                      165                 170TCA GAA CTG GAA AAG CAC CAA TTA TAT ATA GAT GAG ACT GTG AAT AGC     5119Ser Glu Leu Glu Lys His Gln Leu Tyr Ile Asp Glu Thr Val Asn Ser
175                 180                 185AAT ATC CCA ACT AAC CTT CGT GTG CTT CGT TCA ATC CTG GAA AAC CTG     5167Asn Ile Pro Thr Asn Leu Arg Val Leu Arg Ser Ile Leu Glu Asn Leu190                 195                 200                 205AGA AGC AAA ATA CAA AAG TTA GAA TCT GAT GTC TCA GCT CAA ATG GAA     5215Arg Ser Lys Ile Gln Lys Leu Glu Ser Asp Val Ser Ala Gln Met Glu
            210                 215                 220TAT TGT CGC ACC CCA TGC ACT GTC AGT TGC AAT ATT CCT GTG GTG TCT     5263Tyr Cys Arg Thr Pro Cys Thr Val Ser Cys Asn Ile Pro Val Val Ser
        225                 230                 235GGC AAA G GTAACTGATT CATAAACATA TTTTTAGAGA GTTCCAGAAG AACTCACACA    5320Gly LysCCAAAAATAA GAGAACAACA ACAACAACAA AAATGCTAAG TGGATTTTCC CAACAGATCA   5380TAATGACATT ACAGTACATC ATAAAAATAT CCTTAGCCAG TTGTGTTTTG GACTGGCCTG   5440GTGCATTTGC TGGTTTTGAT GAGCAGGATG GGGCACAGGT AGTCCCAGGG GTGGCTGATG   5500TGTGCATCTG CGTACTGGCT TGAACAGATG GCAGAACCAC AGATAGATGT AGAAGTTTCT   5560CCATTTTGTG TGTTCTGGGA GCTCATGGAT ATTCCAGGAC ACAAAAGGTG GAGAAGAGCT   5620TTGTTCATCC TCTTAGCAGA TAAACGTCCT CAAAACTGGG TTGGACTTAC TAAAGTAAAA   5680TGAAAATCTA ATATTTGTTA TATTATTTTC AAAGGTCTAT AATAACACAC TCCTTAGTAA   5740CTTATGTAAT GTTATTTTAA AGAATTGGTG ACTAAATACA AAGTAATTAT GTCATAAACC   5800CCTGAACATA ATGTTGTCTT ACATTTGCAG AA TGT GAG GAA ATT ATC AGG AAA     5853
                            Glu Cys Glu Glu Ile Ile Arg Lys
                            240                 245GGA GGT GAA ACA TCT GAA ATG TAT CTC ATT CAA CCT GAC AGT TCT GTC     5901Gly Gly Glu Thr Ser Glu Met Tyr Leu Ile Gln Pro Asp Ser Ser Val
    250                 255                 260AAA CCG TAT AGA GTA TAC TGT GAC ATG AAT ACA GAA AAT GGA G           5944Lys Pro Tyr Arg Val Tyr Cys Asp Met Asn Thr Glu Asn Gly
265                 270                 275GTAAGCTTTC GACAGTTGTT GACCTGTTGA TCTGTAATTA TTTGGATACC GTAAAATGCC   6004AGGAAACAAG GCCAGGTGTG GTGGCTCATA CCTGTAATTC CAGCACCTTG GGAGGCCAAA   6064GTGGGCTGAT AGCTTGAGCC TAGGAGTTTG AAACTAGCCT GGGCAACATA ATGAGACCCT   6124AACTCTACAA AAAAAAAAAA AATACCAAAA AAAAAAAAAA AATCAGCTGT GTTGGTAGTA   6184TGTGCCTGTA GTCCCAGCTA TCCAGGAGGC TGAGATGGGA GATCACCTGA GCCCACAACC   6244TGGAGTCTTG ATCATGCTAC TGAACTGTAG CCTGGGCAAC AGAGGATAGT GAGATCCTGT   6304CTCAAAAAAA AAAATTAATT AAAAAGCCAG GAAACAAGAC TTAGCTCTAA CATCTAACAT   6364AGCTGACAAA GGAGTAATTT GATGTGGAAT TCAACCTGAT ATTTAAAAGT TATAAAATAT   6424CTATAATTCA CAATTTGGGG TAAGATAAAG CACTTGCAGT TTCCAAAGAT TTTACAAGTT   6484TACCTCTCAT ATTTATTTCC TTATTGTGTC TATTTTAGAG CACCAAATAT ATACTAAATG   6544GAATGGACAG GGGATTCAGA TATTATTTTC AAAGTGACAT TATTTGCTGT TGGTTAATAT   6604ATGCTCTTTT TGTTTCTGTC AACCAAAG  GA TGG ACA GTG ATT CAG AAC CGT      6655
                           Gly Trp Thr Val Ile Gln Asn Arg
                                   280                 285CAA GAC GGT AGT GTT GAC TTT GGC AGG AAA TGG GAT CCA TAT AAA CAG     6703Gln Asp Gly Ser Val Asp Phe Gly Arg Lys Trp Asp Pro Tyr Lys Gln
            290                 295                 300GGA TTT GGA AAT GTT GCA ACC AAC ACA GAT GGG AAG AAT TAC TGT GGC      6751Gly Phe Gly Asn Val Ala Thr Asn Thr Asp Gly Lys Asn Tyr Cys Gly
        305                 310                 315CTA CCA G GTAACGAACA GGCATGCAAA ATAAAATCAT TCTATTTGAA ATGGGATTTT     6808Leu ProTTTTAATTAA AAAACATTCA TTGTTGGAAG CCTGTTTTAG GCAGTTAAGA GGAGTTTCCT    6868GACAAAAATG TGGAAGCTAA AGATAAGGGA AGAAAGGCAG TTTTTAGTTT CCCAAAATTT    6928TATTTTTGGT GAGAGATTTT ATTTTGTTTT TCTTTTAG  GT GAA TAT TGG CTT        6980
                                      Gly Glu Tyr Trp Leu
                                      320GGA AAT GAT AAA ATT AGC CAG CTT ACC AGG ATG GGA CCC ACA GAA CTT      7028Gly Asn Asp Lys Ile Ser Gln Leu Thr Arg Met Gly Pro Thr Glu Leu325                 330                 335                 340TTG ATA GAA ATG GAG GAC TGG AAA GGA GAC AAA GTA AAG GCT CAC TAT      7076Leu Ile Glu Met Glu Asp Trp Lys Gly Asp Lys Val Lys Ala His Tyr
            345                 350                 355GGA GGA TTC ACT GTA CAG AAT GAA GCC AAC AAA TAC CAG ATC TCA GTG      7124Gly Gly Phe Thr Val Gln Asn Glu Ala Asn Lys Tyr Gln Ile Ser Val
        360                 365                 370AAC AAA TAC AGA GGA ACA GCC GGT AAT GCC CTC ATG GAT GGA GCA TCT      7172Asn Lys Tyr Arg Gly Thr Ala Gly Asn Ala Leu Met Asp Gly Ala Ser
    375                 380                 385CAG CTG ATG GGA GAA AAC AGG ACC ATG ACC ATT CAC AAC GGC ATG TTC      7220Gln Leu Met Gly Glu Asn Arg Thr Met Thr Ile His Asn Gly Met Phe
390                 395                 400TTC AGC ACG TAT GAC AGA GAC AAT GAC GGC TG GTATGTGTGG                7262Phe Ser Thr Tyr Asp Arg Asp Asn Asp Gly Trp405             410                     415CACTCTTTGC TCCTGCTTTA AAAATCACAC TAATATCATT ACTCAGAATC ATTAACAATA    7322TTTTTAATAG CTACCACTTC CTGGGCACTT ACTGTCAGCC ACTGTCCTAA GCTCTTTATG    7382CATCACTCGA AAGCATTTCA ACTATAAGGT AGACATTCTT ATTCTCATTT TACAGATGAG    7442ATTTAGAGAG ATTACGTGAT TTGTCCAATG TCACACAACT ACCCAGAGAT AAAACTAGAA    7502TTTGAGCACA GTTACTTTCT GAATAATGAG CATTTAGATA AATACCTATA TCTCTATATT    7562CTAAAGTGTG TGTGAAAACT TTCATTTTCA TTTCCAGGGT TCTCTGATAC TAAGGGTTGT    7622AAAAGCTATT ATTCCAGTAT AAAGTAACAA ACACAGTCCC TAGATGGATT GCCACAAAGG    7682CCCAGTTATC TCTCTTTCTT GCTATAGGGC ACAGGAGGTC TTTGGTGTAT TAGTGTGACT    7742CTATGTATAG CACCCAAAGG AAAGACTACT GTGCACACGA GTGTAGCAGT CTTTTATGGG    7802TAATCTGCAA AACGTAACTT GACCACCGTA GTTCTGTTTC TAATAACGCC AAACACATTT    7862TCTTTCAG G TTA ACA TCA GAT CCC AGA AAA CAG TGT TCT AAA GAA GAC       7910
       Leu Thr Ser Asp Pro Arg Lys Gln Cys Ser Lys Glu Asp
                       420                 425GGT GGT GGA TGG TGG TAT AAT AGA TGT CAT GCA GCC AAT CCA AAC GGC      7958Gly Gly Gly Trp Trp Tyr Asn Arg Cys His Ala Ala Asn Pro Asn Gly
430                 435                 440AGA TAC TAC TGG GGT GGA CAG TAC ACC TGG GAC ATG GCA AAG CAT GGC      8006Arg Tyr Tyr Trp Gly Gly Gln Tyr Thr Trp Asp Met Ala Lys His Gly445                 450                 455                 460ACA GAT GAT GGT GTA GTA TGG ATG AAT TGG AAG GGG TCA TGG TAC TCA      8054Thr Asp Asp Gly Val Val Trp Met Asn Trp Lys Gly Ser Trp Tyr Ser
            465                 470                 475ATG AGG AAG ATG AGT ATG AAG ATC AGG CCC TTC TTC CCA CAG CAA TAGTCCCCAA8109Met Arg Lys Met Ser Met Lys Ile Arg Pro Phe Phe Pro Gln Gln
        480                 485                 490TACGTAGATT TTTGCTCTTC TGTATGTGAC AACATTTTTG TACATTATGT TATTGGAATT    8169TTCTTTCATA CATTATATTC CTCTAAAACT CTCAAGCAGA CGTGAGTGTG ACTTTTTGAA    8229AAAAGTATAG GATAAATTAC ATTAAAATAG CACATGATTT TCTTTTGTTT TCTTCATTTC    8289TCTTGCTCAC CCAAGAAGTA ACAAAAGTAT AGTTTTGACA GAGTTGGTGT TCATAATTTC    8349AGTTCTAGTT GATTGCGAGA ATTTTCAAAT AAGGAAGAGG GGTCTTTTAT CCTTGTCGTA    8409GGAAAACCAT GACGGAAAGG AAAAACTGAT GTTTAAAAGT CCACTTTTAA AACTATATTT    8469ATTTATGTAG GATCTGTCAA AGAAAACTTC CAAAAAGATT TATTAATTAA ACCAGACTCT    8529GTTGCAATAA GTTAATGTTT TCTTGTTTTG TAATCCACAC ATTCAATGAG TTAGGCTTTG    8589CACTTGTAAG GAAGGAGAAG CGTTCACAAC CTCAAATAGC TAATAAACCG GTCTTGAATA    8649TTTGAAGATT TAAAATCTGA CTCTAGGACG GGCACGGTGG CTCACGACTA TAATCCCAAC    8709ACTTTGGGAG GCTGAGGCGG GCGGTCACAA GGTCAGGAGT TCAAGACCAG CCTGACCAAT    8769ATGGTGAAAC CCCATCTCTA CTAAAAATAC AAAAATTAGC CAGGCGTGGT GGCAGGTGCC    8829TGTAGGTCCC AGCTAGCCTG TGAGGTGGAG ATTGCATTGA GCCAAGATC                8878(2)SEQ ID NO:4的信息:(i)序列特征(A)长度:491个氨基酸(B)类型:氨基酸(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:4Met Lys Arg Met Val Ser Trp Ser Phe His Lys Leu Lys Thr Met Lys1               5                  10                  15His Leu Leu Leu Leu Leu Leu Cys Val Phe Leu Val Lys Ser Gln Gly
         20                  25                  30Val Asn Asp Asn Glu Glu Gly Phe Phe Ser Ala Arg Gly His Arg Pro
     35                  40                  45Leu Asp Lys Lys Arg Glu Glu Ala Pro Ser Leu Arg Pro Ala Pro Pro
 50                  55                  60Pro Ile Ser Gly Gly Gly Tyr Arg Ala Arg Pro Ala Lys Ala Ala Ala65                  70                  75                  80Thr Gln Lys Lys Val Glu Arg Lys Ala Pro Asp Ala Gly Gly Cys Leu
             85                  90                  95His Ala Asp Pro Asp Leu Gly Val Leu Cys Pro Thr Gly Cys Gln Leu
        100                 105                 110Gln Glu Ala Leu Leu Gln Gln Glu Arg Pro Ile Arg Asn Ser Val Asp
    115                 120                 125Glu Leu Asn Asn Asn Val Glu Ala Val Ser Gln Thr Ser Ser Ser Ser
130                 135                 140Phe Gln Tyr Met Tyr Leu Leu Lys Asp Leu Trp Gln Lys Arg Gln Lys145                 150                 155                 160Gln Val Lys Asp Asn Glu Asn Val Val Asn Glu Tyr Ser Ser Glu Leu
            165                 170                 175Glu Lys His Gln Leu Tyr Ile Asp Glu Thr Val Asn Ser Asn Ile Pro
        180                 185                 190Thr Asn Leu Arg Val Leu Arg Ser Ile Leu Glu Asn Leu Arg Ser Lys
    195                 200                 205Ile Gln Lys Leu Glu Ser Asp Val Ser Ala Gln Met Glu Tyr Cys Arg
210                 215                 220Thr Pro Cys Thr Val Ser Cys Asn Ile Pro Val Val Ser Gly Lys Glu225                 230                 235                 240Cys Glu Glu Ile Ile Arg Lys Gly Gly Glu Thr Ser Glu Met Tyr Leu
            245                 250                 255Ile Gln Pro Asp Ser Ser Val Lys Pro Tyr Arg Val Tyr Cys Asp Met
        260                 265                 270Asn Thr Glu Asn Gly Gly Trp Thr Val Ile Gln Asn Arg Gln Asp Gly
    275                 280                 285Ser Val Asp Phe Gly Arg Lys Trp Asp Pro Tyr Lys Gln Gly Phe Gly
290                 295                 300Asn Val Ala Thr Asn Thr Asp Gly Lys Asn Tyr Cys Gly Leu Pro Gly305                  310                315                 320Glu Tyr Trp Leu Gly Asn Asp Lys Ile Ser Gln Leu Thr Arg Met Gly
            325                 330                 335Pro Thr Glu Leu Leu Ile Glu Met Glu Asp Trp Lys Gly Asp Lys Val
        340                 345                 350Lys Ala His Tyr Gly Gly Phe Thr Val Gln Asn Glu Ala Asn Lys Tyr
    355                 360                 365Gln Ile Ser Val Asn Lys Tyr Arg Gly Thr Ala Gly Asn Ala Leu Met
370                 375                 380Asp Gly Ala Ser Gln Leu Met Gly Glu Asn Arg Thr Met Thr Ile His385                 390                 395                 400Asn Gly Met Phe Phe Ser Thr Tyr Asp Arg Asp Asn Asp Gly Trp Leu
            405                 410                 415Thr Ser Asp Pro Arg Lys Gln Cys Ser Lys Glu Asp Gly Gly Gly Trp
        420                 425                 430Trp Tyr Asn Arg Cys His Ala Ala Asn Pro Asn Gly Arg Tyr Tyr Trp
    435                 440                 445Gly Gly Gln Tyr Thr Trp Asp Met Ala Lys His Gly Thr Asp Asp Gly
450                 455                 460Val Val Trp Met Asn Trp Lys Gly Ser Trp Tyr Ser Met Arg Lys Met465                 470                 475                 480Ser Met Lys Ile Arg Pro Phe Phe Pro Gln Gln
            485                 490(2)SEQ ID NO:5的信息:(i)序列特征
(A)长度:10564bp
(B)类型:核酸
(C)链性:双链
(D)拓扑结构:线性(ii)分子类型:DNA(基因组)(vii)来源:
(B)克隆:人纤维蛋白原γ链(ix)特征:
(A)名称/关键词:CDS
(B)位置:连接(1799..1876,1973..2017,2207..2390,2510..2603,
              4211..4341,4645..4778,5758..5942,7426..7703
              9342..9571)
(xi)序列描述:SEQ ID NO:5CTACACACTT CTTGAAGGCA AAGGCAATGC TGAAGTCACC TTTCATGTTC AAATCATATT     60AAAAAGTTAG CAAGATGTAA TTATCAGTGT ACTATGTAAA TCTTTGTGAA TGATCAATAA    120TTACATATTT TCATTATATA TATTTTAGTA GATAATATTT ATATACATTC AACATTCTAA    180ATATAGAAAG TTTACAGAGA AAAATAAAGC CTTTTTTTCC AATCCTGTCC TCCACCTCTG    240CATCCCATTC TTCTTCACAG AGGCAACTGA TTCAAGTCAT TACATAGTTA TTGAGTGTTA    300ACTACAACTA TGTTAAGTAC AGCTATATAT GTTAGATGCC GTAGCCACAG AAATCAGTTT    360ACAATCTAAT GCAGTGGATA CAGCATGTAT ACATATAATA TAAGGTTGCT ACAAATGCTA    420TCTGAGGTAG AGCTGTTTGA AAGAATACTA ATACTTAAAT GTTTAATTCA ACTGACTTGA    480TTGACAACTG ATTAGCTGAG TGGAAAAGAT GGATGAGAAA GATTGTGAGA CTTAATTGGC    540TGGTGGTATG GTGATATGAT TGACAATAAC TGCTAAGTCA GAGAGGGATA TATTAAGGAG    600GAGAAGAAAA GCAACAAATC TGGTTTTGAT GTGTTCACTT TGTTATAATT ATTGATTATT    660TACTGAATAT GAATATTTAT CTTTGTTTTT GAGTCAATAA ATATACCTTT GTAAAGACAG    720AATTAAAGTA TTAGTATTTC TTTCAAACTG GAGGCATTTC TCCCACTAAC ATATTTCATC    780AAAACTTATA ATAAGCTTGG TTCCAGAGGA AGAAATGAGG GATAACCAAA AATAGAGACA    840TTAATAATAG TGTAACGCCC AGTGATAAAT CTCAATAGGC AGTGATGACA GACATGTTTT    900CCCAAACACA AGGATGCTGT AAGGGCCAAA CAGAAATGAT GGCCCCTCCC CAGCACCTCA    960TTTTGCCCCT TCCTTCAGCT ATGCCTCTAC TCTCCTTTAG ATACAAGGGA GGTGGATTTT    1020TCTCTTCTCT GAGATAGCTT GATGGAACCA CAGGAACAAT GAAGTGGGCT CCTGGCTCTT    1080TTCTCTGTGG CAGATGGGGT GCCATGCCCA CCTTCAGACA AAGGGAAGAT TGAGCTCAAA    1140AGCTCCCTGA GAAGTGAGAG CCTATGAACA TGGTTGACAC AGAGGGACAG GAATGTATTT    1200CCAGGGTCAT TCATTCCTGG GAATAGTGAA CTGGGACATG GGGGAAGTCA GTCTCCTCCT    1260GCCACAGCCA CAGATTAAAA ATAATAATGT TAACTGATCC CTAGGCTAAA ATAATAGTGT    1320TAACTGATCC CTAAGCTAAG AAAGTTCTTT TGGTAATTCA GGTGATGGCA GCAGGACCCA    1380TCTTAAGGAT AGACTAGGTT TGCTTAGTTC GAGGTCATAT CTGTTTGCTC TCAGCCATGT    1440ACTGGAAGAA GTTGCATCAC ACAGCCTCCA GGACTGCCCT CCTCCTCACA GCAATGGATA    1500ATGCTTCACT AGCCTTTGCA GATAATTTTG GATCAGAGAA AAAACCTTGA GCTGGGCCAA    1560AAAGGAGGAG CTTCAACCTG TGTGCAAAAT CTGGGAACCT GACAGTATAG GTTGGGGGCC    1620AGGATGAGGA AAAAGGAACG GGAAAGACCT GCCCACCCTT CTGGTAAGGA GGCCCCGTGA    1680TCAGCTCCAG CCATTTGCAG TCCTGGCTAT CCCAGGAGCT TACATAAAGG GACAATTGGA    1740GCCTGAGAGG TGACAGTGCT GACACTACAA GGCTCGGAGC TCCGGGCACT CAGACATC      1798ATG AGT TGG TCC TTG CAC CCC CGG AAT TTA ATT CTC TAC TTC TAT GCT      1846Met Ser Trp Ser Leu His Pro Arg Asn Leu Ile Leu Tyr Phe Tyr Ala1               5                  10                  15CTT TTA TTT CTC TCT TCA ACA TGT GTA GCA GTAAGTGTGC TCTTCACAAA        1896Leu Leu Phe Leu Ser Ser Thr Cys Val Ala
         20                  25ACGTTGTTTA AAATGGAAAG CTGGAAAATA AAACAGATAA TAAACTAGTG AAATTTTCGT    1956ATTTTTTCTC TTTTAG TAT GTT GCT ACC AGA GAC AAC TGC TGC ATC TTA        2005
              Tyr Val Ala Thr Arg Asp Asn Cys Cys Ile Leu
                           30                  35GAT GAA AGA TTC GTAAGTAGTT TTTATGTTTC TCCCTTTGTG TGTGAACTGG          2057Asp Glu Arg Phe
     40AGAGGGGCAG AGGAATAGAA ATAATTCCCT CATAAATATC ATCTGGCACT TGTAACTTTT    2117TAAAAACATA GTCTAGGTTT TACCTATTTT TCTTAATAGA TTTTAAGAGT AGCATCTGTC    2177TACATTTTTA ATCACTGTTA TATTTTCAG GGT AGT TAT TGT CCA ACT ACC TGT      2230
                            Gly Ser Tyr Cys Pro Thr Thr Cys
                                         45GGC ATT GCA GAT TTC CTG TCT ACT TAT CAA ACC AAA GTA GAC AAG GAT      2278Gly Ile Ala Asp Phe Leu Ser Thr Tyr Gln Thr Lys Val Asp Lys Asp50                  55                  60                  65CTA CAG TCT TTG GAA GAC ATC TTA CAT CAA GTT GAA AAC AAA ACA TCA   2326Leu Gln Ser Leu Glu Asp Ile Leu His Gln Val Glu Asn Lys Thr Ser
             70                  75                  80GAA GTC AAA CAG CTG ATA AAA GCA ATC CAA CTC ACT TAT AAT CCT GAT   2374Glu Val Lys Gln Leu Ile Lys Ala Ile Gln Leu Thr Tyr Asn Pro Asp
         85                  90                  95GAA TCA TCA AAA CCA A GTGAGAAAAT AAAGACTACT GACCAAAAAA            2420Glu Ser Ser Lys Pro
    100TAATAATAAT AATCTGTGAA GTTCTTTTGC TGTTGTTTTA GTTGTTCTAT TTGCTTAAGG 2480ATTTTTATGT CTCTGATCCT ATATTACAG  AT ATG ATA GAC GCT GCT ACT TTG   2532
                            Asn Met Ile Asp Ala Ala Thr Leu
                                    105                 110AAG TCC AGG ATA ATG TTA GAA GAA ATT ATG AAA TAT GAA GCA TCG ATT   2580Lys Ser Arg Ile Met Leu Glu Glu Ile Met Lys Tyr Glu Ala Ser Ile
            115                 120                 125TTA ACA CAT GAC TCA AGT ATT CG GTAAGGATTT TTGTTTTAAT TTGCTCTGCA   2633Leu Thr His Asp Ser Ser Ile Arg
        130AGACTGATTT AGTTTTTATT TAATATTCTA TACTTGAGTG AAAGTAATTT TTAATGTGTT 2693TTCCCCATTT ATAATATCCC AGTGACATTA TGCCTGATTA TGTTGAGCAT AGTAGAGATA 2753GAAGTTTTTA GTGCAATATA AATTATACTG GGTTATAATT GCTTATTAAT AATCACATTG 2813AAGAAAGATG TTCTAGATGT CTTCAAATGC TAGTTTGACC ATATTTATCA AAAATTTTTT 2873CCCCATCCCC CATTTATCTT ACAACATAAA ATCAATCTCA TAGGAATTTG GGTGTTGAAA 2933ATAAAATCCT CTTTATAAAA ATGCTGACAA ATTGGTGGTT AAAAAAATTA GCAAGCAGAG 2993GCATAGTAAG GATTTTGGCT CCTAAAGTAA ATTATATTGA ATGTGGAGCA GGAAGAAACA 3053TGTCTTGAGA GACTAAGTGT GGCAAATATT GCAAAGCTCA TATTGATCAT TGCAGAATGA 3113ACCTGCATAG TCTCTTCCCT TCATTTGGAA GTGAATGTCT CTGTTAAAGC TTCTCAGGGA 3173CTCATAAACT TTCTGAACAT AAGGTCTCAG ATACAGTTTT AATATTTTTC CCCAATTTTT 3233TTTTCTGAAT TTTTCTCAAA GCAGCTTGAG AAATTGAGAT AAATAGTAGC TAGGGAGAAG 3293TGGCCCAGGA AAGATTTCTC CTCTTTTTGC TATCAGAGGG CCCTTGTTAT TATTGTTATT    3353ATTATTACTT GCATTATTAT TGTCCATCAT TGAAGTTGAA GGAGGTTATT GTACAGAAAT    3413TGCCTAAGAC AAGGTAGAGG GAAAACGTGG ACAAATAGTT TGTCTACCCT TTTTTACTTC    3473AAAGAAAGAA CGGTTTATGC ATTGTAGACA GTTTTCTATC ATTTTTGGAT ATTTGCAAGC    3533CACCCTGTAA GTAACTACAA AAGGAGGGTT TTTACTTCCC CCAGTCCATT CCCAAAGCTA    3593TGTAACCAGA AGCATTAAAG AAGAAAGGGG AAGTATCTGT TGTTTTATTT TACATACAAT    3653AACGTTCCAG ATCATGTCCC TGTGTAAGTT ATATTTTAGA TTGAAGCTTA TATGTATAGC    3713CTCAGTAGAT CCACAAGTGA AAGGTATACT CCTTCAGCAC ATGTGAATTA CTGAACTGAG    3773CTTTTCCTGC TTCTAAAGCA TCAGGGGGTG TTCCTATTAA CCAGTCTCGC CACTCTTGCA    3833GGTTGCTATC TGCTGTCCCT TATGCATAAA GTAAAAAGCA AAATGTCAAT GACATTTGCT    3893TATTGACAAG GACTTTGTTA TTTGTGTTGG GAGTTGAGAC AATATGCCCC ATTCTAAGTA    3953AAAAGATTCA GGTCCACATT GTATTCCTGT TTTAATTGAT TTTTTGATTT GTTTTTCTTT    4013TTCAAAAAGT TTATAATTTT AATTCATGTT AATTTAGTAA TATAATTTTA CATTTTCCTC    4073AAGAATGGAA TAATTTATCA GAAAGCACTT CTTAAGAAAA TACTTAGCAG TTTCCAAAGA    4133AAATATAAAA TTACTCTTCT GAAAGGAATA CTTATTTTTG TCTTCTTATT TTTGTTATCT    4193TATGTTTCTG TTTGTAG A TAT TTG CAG GAA ATA TAT AAT TCA AAT AAT CAA     4244
                 Tyr Leu Gln Glu Ile Tyr Asn Ser Asn Asn Gln
                 135                 140                 145AAG ATT GTT AAC CTG AAA GAG AAG GTA GCC CAG CTT GAA GCA CAG TGC      4292Lys Ile Val Asn Leu Lys Glu Lys Val Ala Gln Leu Glu Ala Gln Cys
            150                 155                 160CAG GAA CCT TGC AAA GAC ACG GTG CAA ATC CAT GAT ATC ACT GGG AAA  G   4341Gln Glu Pro Cys Lys Asp Thr Val Gln Ile His Asp Ile Thr Gly Lys
        165                 170                 175GTAACTGATG AAGGTTATAT TGGGATTAGG TTCATCAAAG TAAGTAATGT AAAGGAGAAA    4401GTATGTACTG GAAAGTATAG GAATAGTTTA GAAAGTGGCT ACCCATTAAG TCTAAGAATT    4461TCAGTTGTCT AGACCTTTCT TGAATAGCTA AAAAAAACAG TTTAAAAGGA ATGCTGATGT    4521GAAAAGTAAG AAAATTATTC TTGGAAAATG AATAGTTTAC TACATGTTAA AAGCTATTTT    4581TCAAGGCTGG CACAGTCTTA CCTGCATTTC AAACCACAGT AAAAGTCGAT TCTCCTTCTC    4641TAG  AT TGT CAA GAC ATT GCC AAT AAG GGA GCT AAA CAG AGC GGG CTT      4688
Asp Cys Gln Asp Ile Ala Asn Lys Gly Ala Lys Gln Ser Gly Leu
        180                 185                 190TAC TTT ATT AAA CCT CTG AAA GCT AAC CAG CAA TTC TTA GTC TAC TGT      4736Tyr Phe Ile Lys Pro Leu Lys Ala Asn Gln Gln Phe Leu Val Tyr Cys
    195                 200                 205GAA ATC GAT GGG TCT GGA AAT GGA TGG ACT GTG TTT CAG AAG              4778Glu Ile Asp Gly Ser Gly Asn Gly Trp Thr Val Phe Gln Lys
210                 215                 220GTAATTTTTT CCCCACCATG TGTATTTAAT AAATTCCTAC ATTGTTTCTG CCATATGGCA    4838GATACTTTTC TAAGCACCTT GTGAACCGTA GCTCATTTAA TCCTTGCAAT AGCCCTAAGA    4898GGAAGGTACT TCTGTTACTC CTATTTACAG AAAAGGAAAC TGAGGCACAC AAGGTTAAAT    4958AACTTGCCCA AGACCACATA ACTAATAAGC AACAGAGTCA GCATTTGAAC CTAGGCAGTA    5018TAGTTTCAGA GTTTGTGACT TGACTCTATA TTGTACTGGC ACTGACTTTG TAGATTCATG    5078GTGGCACATA ATCATAGTAC CACAGTGACA AATAAAAAGA AGGAAACTCT TTTGTCAGGT    5138AGGTCAAGAC CTGAGGTTTC CCATCACAAG ATGAGGAAGC CCAACACCAC CCCCCACCAC    5198CCCACCACCA TCACCACCCT TTCACACACC AGAGGATACA CTTGGGCTGC TCCAAGACAA    5258GGAACCTGTG TTGCATCTGC CACTTGCTGA TACCCACTAG GAATCTTGGC TCCTTTACTT    5318TCTGTTTACC TCCCACCACT GTTATAACTG TTTCTACAGG GGGCGCTCAG AGGGAATGAA    5378TGGTGGAAGC ATTAGTTGCC AGACACCGAT TGAGCAATGG GTTCCATCAT AAGTGTAAGA    5438ATCAGTAATA TCCAGCTAGA GTTCTGAAGT CGTCTAGGTG TCTTTTTAAT ATTACCACTC    5498ATTTAGAATT TATGATGTGC CAGAAACCCT CTTAAGTATT TCTCTTATAT TCTCTCTCAT    5558GATCCTTGCA GCAACCCTAA GAAGTAACCA TCATTTTTCC TATTTGATAC ATGAGGAAAC    5618TGAGGTAGCT TGGCCAAGAT CACTTAGTTG GGAGTTGATA GAACCAGTGC TCTGTATTTT    5678TGACAAAATG TTGACAGCAT TCTCTTTACA TGCATTGATA GTCTATTTTC TCCTTTTGCT    5738CTTGCAAATG TGTAATTAG AGA CTT GAT GGC AGT GTA GAT TTC AAG AAA AAC     5790
                 Arg Leu Asp Gly Ser Val Asp Phe Lys Lys Asn
                         225                 230TGG ATT CAA TAT AAA GAA GGA TTT GGA CAT CTG TCT CCT ACT GGC ACA      5838Trp Ile Gln Tyr Lys Glu Gly Phe Gly His Leu Ser Pro Thr Gly Thr
235                 240                 245ACA GAA TTT TGG CTG GGA AAT GAG AAG ATT CAT TTG ATA AGC ACA CAG      5886Thr Glu Phe Trp Leu Gly Asn Glu Lys Ile His Leu Ile Ser Thr Gln250                 255                 260                 265TCT GCC ATC CCA TAT GCA TTA AGA GTG GAA CTG GAA GAC TGG AAT GGC      5934Ser Ala Ile Pro Tyr Ala Leu Arg Val Glu Leu Glu Asp Trp Asn Gly
            270                 275                 280AGA ACC AG GTACTGTTTT GAAATGACTT CCAACTTTTT ATTGTAAAGA               5982Arg Thr SerTTGCCTGGAA TGTGCACTTT CCAACTATCA ATAGACAATG GCAAATGCAG CCTGACAAAT    6042GCAAACAGCA CATCCAGCCA CCATTTTCTC CAGGAGTCTG TTTGGTTCTT GGGCAATCCA    6102AAAAGGTAAA TTCTATTCAG GATGAATCTA AGTGTATTGG TACAATCTAA TTACCCTGGA    6162ACCATTCAGA GTAATAGCTA ATTACTGAAC TTTTAATCAG TCCCAGGAAT TGAGCATAAA    6222ATTATAATTT TATCTAGTCT AAATTACTAT TTCATGAAGC AGGTATTATT ATTAATCCCA    6282TTTTATAGAT TAACTTGCTC AAAGTCACAT TGCTGATAAG TGGTAGAGGT AGAATTCAGA    6342CTCAAGTAGT TTAACTTTAG AGCCTGTCCT CTTAACAACT ATCCTGGTTG AAAAGCAAAT    6402ACAGCCTCTT CAGACTTCTC AGTGCCTTGA TGGCCATTTA TTCTGTCAAA TCATGAGCTA    6462CCCTAAAAGT AAACCAGCTA GCTCTTTTGA TGATCTAGAG GCTTCTTTTT GCTTGAGATA    6522TTTGAAGGTT TTAAGCATTG TTACCTAATT AAAATGCAGA AAAATATCCA ACCCTCTTGT    6582TATGTTTAAG GAATAGTGAA ATATATTGTC TTCAAACACA TGGACTTTTT TTTATTGCTT    6642GGTTGGTTTT TAATCCAGAA AGTGCTATAG TCAGTAGACC TTCTTCTAGG AAAGGACCTT    6702CCATTTCCCA GCCACTGGAG ATTAGAAAAT AAGCTAAATA TTTTCTGGAA ATTTCTGTTC    6762ATTCATTAAG GCCCATCCTT TCCCCCACTC TATAGAAGTG TTGTCCACTT GCACAATTTT    6822TTCCAGGAAA GAATCTCTCT AACTCCTTCA GCTCACATGC TTTGGACCAC ACAGGGAAGA    6882CTTTGATTGT GTAATGCCCT CAGAAGCTCT CCTTCTTGCC ACTACCACAC TGATTTGAGG    6942AAGAAAATCC CTTTAGCACC TAACCCTTCA GGTGCTATGA GTGGCTAATG GAACTGTACC    7002TCCTTCAAGT TTTGTGCAAT AATTAAGGGT CACTCACTGT CAGATACTTT CTGTGATCTA    7062TGATAATGTG TGTGCAACAC ATAACATTTC AATAAAAGTA GAAAATATGA AATTAGAGTC    7122ATCTACACAT CTGGATTTGA TCTTAGAATG AAACAAGCAA AAAAGCATCC AAGTGAGTGC    7182AATTATTAGT TTTCAGAGAT GCTTCAAAGG CTTCTAGGCC CATCCCGGGA AGTGTTAATG    7242AGCTGTGGAC TGGTTCACAT ATCTATTGCC TCTTGCCAGA TTTGCAAAAA ACTTCACTCA    7302ATGAGCAAAT TTCAGCCTTA AGAAACAAAG TCAAAAATTC CAAGGAAGCA TCCTACGAAA    7362GAGGGAACTT CTGAGATCCC TGAGGAGGGT CAGCATGTGA TGGTTGTATT TCCTTCTTCT    7422CAG T ACT GCA GAC TAT GCC ATG TTC AAG GTG GGA CCT GAA GCT GAC        7468
  Thr Ala Asp Tyr Ala Met Phe Lys Val Gly Pro Glu Ala Asp
  285                 290                 295AAG TAC CGC CTA ACA TAT GCC TAC TTC GCT GGT GGG GAT GCT GGA GAT      7516Lys Tyr Arg Leu Thr Tyr Ala Tyr Phe Ala Gly Gly Asp Ala Gly Asp
300                 305                 310GCC TTT GAT GGC TTT GAT TTT GGC GAT GAT CCT AGT GAC AAG TTT TTC      7564Ala Phe Asp Gly Phe Asp Phe Gly Asp Asp Pro Ser Asp Lys Phe Phe315                 320                 325                 330ACA TCC CAT AAT GGC ATG CAG TTC AGT ACC TGG GAC AAT GAC AAT GAT      7612Thr Ser His Asn Gly Met Gln Phe Ser Thr Trp Asp Asn Asp Asn Asp
            335                 340                 345AAG TTT GAA GGC AAC TGT GCT GAA CAG GAT GGA TCT GGT TGG TGG ATG      7660Lys Phe Glu Gly Asn Cys Ala Glu Gln Asp Gly Ser Gly Trp Trp Met
        350                 355                 360AAC AAG TGT CAC GCT GGC CAT CTC AAT GGA GTT TAT TAC CAA G            7703Asn Lys Cys His Ala Gly His Leu Asn Gly Val Tyr Tyr Gln
    365                 370                 375GTATGTTTTC CTTTCTTAGA TTCCAAGTTA ATGTATAGTG TATACTATTT TCATAAAAAA    7763TAATAAATAG ATATGAAGAA ATGAAGAATA ATTTATAAAG ATAGTAGGGA TTTTATCATG    7823T1CTTTATTT CAACTAAGTT CTTTGAAACT GGAAGTGGAT AATACCAAGT TCATGCCTAA    7883AATTAGCCCT TCTAAAGAAA TCCACCTGCT GCAAAATATC CAGTAGTTTG GCATTATATG    7943TGAAACTATC ACCATCATAG CTGGCACTGT GGGTTGTGGG ATCTCCTTTA GACATACAAC    8003ATAAATGATC TGGATGGATT AACATTACTA CATGGATGCT TGTTGACACA TTAACCTGGC    8063TTCCCATGAG CTTTGTGTCA GATACACGCA GTGAACAGGT GTTTGGAGGA ACAGAATAAA    8123GAGAAGGCAA GCACTGGTAA GGGCAGGGGT TTGTGAAAGC TTGAGAGAAG AGACCAGTCT    8183GAGGACAGTA GACACTTATT TTAGGATGGG GGTTGGATGA GGAGGCTATA GTTTGCTATA    8243AGCTTGGAAT GGTTTGGAAC ACTGGTTTCA CTCACCTACC CAGCAGTTAT GTGTGGGGAA    8303GCCTTACCGA TGCTAAAGGA TCCATGTTAC AATAATGGCA TTATTTGGAA ATCCCAGTGG    8363TATTCCATGA ATAAAACCAC TATGAAGATA ATCCCACTCA ACAGACTCTC CGTTGGAGAA    8423GGACAGCAAC ACCACCCTGG GAAAGCCAAA CAGTCAGACC AGACCTGTTT AGCATCAGTA    8483GGACTTCCCT ACCATATCTG CTGGGTAGAT GAGTGAAACC AGTGTTCCAA ACCACTCCGG    8543GCTTGTAGCA AACCATAGTC TCCTCATCTA CCAAGATGAG CAACCTTACC TCCTGATGTC    8603CTAGCCAATC ACCAACTAGG AAACTTTGCA CAGTTTATTT AAAGTAACAG TTTGATTTTC    8663ACAATATTTT TAAATTGGAG AAACATAACT TATCTTTGCA CTCACAAACC ACATAATGAG    8723AAGAAACTCT AAGGGAAAAT GCTTGATCTG TGTGACCCGG GGCGCCATGC CAGAGCTGTA    8783GTTCATGCCA GTGTTGTGCT CTGACAAGCC TTTTACAGAA TTACATGAGA TCTGCTTCCC    8843TAGGACAAGG AGAAGGCAAA TCAACAGAGG CTGCACTTTA AAATGGAGAC ATAAAATAAC    8903ATGCCAGAAC CATTTCCTAA AGCTCCTCAA TCAACCAACA AAATTGTGCT TTCAAATAAC    8963CTGAGTTGAC CTCATCAGGA ATTTTGTGGC TCCTTCTCTT CTAACCTGCC TGAAGAAAGA    9023TGGTCCACAG CAGCTGAGTC CGGGATGGAT AAGCTTAGGG ACAGAGGCCA ATTAGGGAAC    9083TTTGGGTTTC TAGCCCTACT AGTAGTGAAT AAATTTAAAG TGTGGATGTG ACTATGAGTC    9143ACAGCACAGA TGTTGTTTAA TAATATGTTT ATTTTATAAA TTGATATTTT AGGAATCTTT    9203GGAGATATTT TCAGTTAGCA GATAATACTA TAAATTTTAT GTAACTGGCA ATGCACTTCG    9263TAATAGACAG CTCTTCATAG ACTTGCAGAG GTAAAAAGAT TCCAGAATAA TGATATGTAC    9323ATCTACGACT TGTTTTAG GT GGC ACT TAC TCA AAA GCA TCT ACT CCT AAT       9373
               Gly Gly Thr Tyr Ser Lys Ala Ser Thr Pro Asn
                           380                 385GGT TAT GAT AAT GGC ATT ATT TGG GCC ACT TGG AAA ACC CGG TGG TAT      9421Gly Tyr Asp Asn Gly Ile Ile Trp Ala Thr Trp Lys Thr Arg Trp Tyr
    390                 395                 400TCC ATG AAG AAA ACC ACT ATG AAG ATA ATC CCA TTC AAC AGA CTC ACA      9469Ser Met Lys Lys Thr Thr Met Lys Ile Ile Pro Phe Asn Arg Leu Thr
405                 410                 415ATT GGA GAA GGA CAG CAA CAC CAC CTG GGG GGA GCC AAA CAG GTC AGA      9517Ile Gly Glu Gly Gln Gln His His Leu Gly Gly Ala Lys Gln Val Arg420                 425                 430                 435CCA GAG CAC CCT GCG GAA ACA GAA TAT GAC TCA CTT TAC CCT GAG GAT      9565Pro Glu His Pro Ala Glu Thr Glu Tyr Asp Ser Leu Tyr Pro Glu Asp
            440                 445                 450GAT TTG TAGAAAATTA ACTGCTAACT TCTATTGACC CACAAAGTTT CAGAAATTCT       9621Asp LeuCTGAAAGTTT CTTCCTTTTT TCTCTTACTA TATTTATTGA TTTCAAGTCT TCTATTAAGG    9681ACATTTAGCC TTCAATGGAA ATTAAAACTC ATTTAGGACT GTATTTCCAA ATTACTGATA    9741TCAGAGTTAT TTAAAAATTG TTTATTTGAG GAGATAACAT TTCAACTTTG TTCCTAAATA    9801TATAATAATA AAATGATTGA CTTTATTTGC ATTTTTATGA CCACTTGTCA TTTATTTTGT    9861CTTCGTAAAT TATTTTCATT ATATCAAATA TTTTAGTATG TACTTAATAA AATAGGAGAA    9921CATTTTAGAG TTTCAAATTC CCAGGTATTT TCCTTGTTTA TTACCCCTAA ATCATTCCTA    9981TTTAATTCTT CTTTTTAAAT GGAGAAAATT ATGTCTTTTT AATATGGTTT TTGTTTTGTT   10041ATATATTCAC AGGCTGGAGA CGTTTAAAAG ACCGTTTCAA AAGAGATTTA CTTTTTTAAA   10101GGACTTTATC TGAACAGAGA GATATAATAT TTTTCCTATT GGACAATGGA CTTGCAAAGC   10161TTCACTTCAT TTTAAGAGCA AAAGACCCCA TGTTGAAAAC TCCATAACAG TTTTATGCTG   10221ATGATAATTT ATCTACATGC ATTTCAATAA ACCTTTTGTT TCCTAAGACT AGATACATGG   10281TACCTTTATT GACCATTAAA AAACCACCAC TTTTTGCCAA TTTACCAATT ACAATTGGGC   10341AACCATCAGT AGTAATTGAG TCCTCATTTT ATGCTAAATG TTATGCCTAA CTCTTTGGGA   10401GTTACAAAGG AAATAGCAAT TATGGCTTTT GCCCTCTAGG AGATACAGGA CAAATACAGG   10461AAAATACAGC AACCCAAACT GACAATACTC TATACAAGAA CATAATCACT AAGCAGGAGT   10521CACAGCCACA CAACCAAGAT GCATAGTATC CAAAGTGCAG CTG                     10564(2)SEQ ID NO:6的信息:(i)序列特征
(A)长度:453个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID N0:6Met Ser Trp Ser Leu His Pro Arg Asn Leu Ile Leu Tyr Phe Tyr Ala1               5                  10                  15Leu Leu Phe Leu Ser Ser Thr Cys Val Ala Tyr Val Ala Thr Arg Asp
         20                 25                  30Asn Cys Cys Ile Leu Asp Glu Arg Phe Gly Ser Tyr Cys Pro Thr Thr
     35                  40                  45Cys Gly Ile Ala Asp Phe Leu Ser Thr Tyr Gln Thr Lys Val Asp Lys
 50                  55                  60Asp Leu Gln Ser Leu Glu Asp Ile Leu His Gln Val Glu Asn Lys Thr65                  70                  75                  80Ser Glu Val Lys Gln Leu Ile Lys Ala Ile Gln Leu Thr Tyr Asn Pro
             85                  90                  95Asp Glu Ser Ser Lys Pro Asn Met Ile Asp Ala Ala Thr Leu Lys Ser
        100                 105                 110Arg Ile Met Leu Glu Glu Ile Met Lys Tyr Glu Ala Ser Ile Leu Thr
    115                 120                 125His Asp Ser Ser Ile Arg Tyr Leu Gln Glu Ile Tyr Asn Ser Asn Asn
130                 135                 140Gln Lys Ile Val Asn Leu Lys Glu Lys Val Ala Gln Leu Glu Ala Gln145                 150                 155                 160Cys Gln Glu Pro Cys Lys Asp Thr Val Gln Ile His Asp Ile Thr Gly
            165                 170                 175Lys Asp Cys Gln Asp Ile Ala Asn Lys Gly Ala Lys Gln Ser Gly Leu
        180                 185                 190Tyr Phe Ile Lys Pro Leu Lys Ala Asn Gln Gln Phe Leu Val Tyr Cys
    195                 200                 205Glu Ile Asp Gly Ser Gly Asn Gly Trp Thr Val Phe Gln Lys Arg Leu
210                 215                 220Asp Gly Ser Val Asp Phe Lys Lys Asn Trp Ile Gln Tyr Lys Glu Gly225                 230                 235                 240Phe Gly His Leu Ser Pro Thr Gly Thr Thr Glu Phe Trp Leu Gly Asn
            245                 250                 255Glu Lys Ile His Leu Ile Ser Thr Gln Ser Ala Ile Pro Tyr Ala Leu
        260                 265                 270Arg Val Glu Leu Glu Asp Trp Asn Gly Arg Thr Ser Thr Ala Asp Tyr
    275                 280                 285Ala Met Phe Lys Val Gly Pro Glu Ala Asp Lys Tyr Arg Leu Thr Tyr
290                 295                 300Ala Tyr Phe Ala Gly Gly Asp Ala Gly Asp Ala Phe Asp Gly Phe Asp305                 310                 315                 320Phe Gly Asp Asp Pro Ser Asp Lys Phe Phe Thr Ser His Asn Gly Met
            325                 330                 335Gln Phe Ser Thr Trp Asp Asn Asp Asn Asp Lys Phe Glu Gly Asn Cys
        340                 345                 350Ala Glu Gln Asp Gly Ser Gly Trp Trp Met Asn Lys Cys His Ala Gly
    355                 360                 365His Leu Asn Gly Val Tyr Tyr Gln Gly Gly Thr Tyr Ser Lys Ala Ser
370                 375                 380Thr Pro Asn Gly Tyr Asp Asn Gly Ile Ile Trp Ala Thr Trp Lys Thr385                 390                 395                 400Arg Trp Tyr Ser Met Lys Lys Thr Thr Met Lys Ile Ile Pro Phe Asn
            405                 410                 415Arg Leu Thr Ile Gly Glu Gly Gln Gln His His Leu Gly Gly Ala Lys
        420                 425                 430Gln Val Arg Pro Glu His Pro Ala Glu Thr Glu Tyr Asp Ser Leu Tyr
    435                 440                 445Pro Glu Asp Asp Leu
450(2)SEQ ID NO:7的信息:(i)序列特征
(A)长度:10807bp
(B)类型:核酸
(C)链性:双链
(D)拓扑结构:线性(vii)来源:
(B)克隆:卵β-乳球蛋白(xi)序列描述:SEQ ID NO:7ACGCGTGTCG ACCTGCAGGT CAACGGATCT CTGTGTCTGT TTTCATGTTA GTACCACACT      60GTTTTGGTGG CTGTAGCTTT CAGCTACAGT CTGAAGTCAT AAAGCCTGGT ACCTCCAGCT     120CTGTTCTCTC TCAAGATTGT GTTCTGCTGT TTGGGTCTTT AGTGTCTCCA CACAATTTTT     180AGAATTGTTT GTTCTAGTTC TGTGAAAAAT GATGCTGGTA TTTTGATAAG GATTGCATTG     240AATCTGTAAA GCTACAGATA TAGTCATTGG GTAGTACAGT CACTTTAACA ATATTAACTC     300TTCACATCTG TGAGCATGAT ATATTTTCCC CCTCTATATC ATCTTCAATT CCTCCTATCA    360GTTTCTTTCA TTGCAGTTTT CTGAGTACAG GTCTTACACC TCCTTGGTTA GAGTCATTCC    420TCAGTATTTT ATTCCTTTGA TACAATTGTG AATGAGGTAA TTTTCTTAGT TTCTCTTTCT    480GATAGCTCAT TGTTAGTGTA TATATAGAAA AGCAACAGAT TTCTATGTAT TAATTTTGTA    540TCCTGCAACA GATTTCTATG TATTAATTTT GTATCCTGCT ACTTTACGGA ATTCACTTAT    600TAGCTTTTTG GTGACATCTT GAGGATTTTC TGAAGAAAAT GGCATGGTAT GGTAGGACAA    660GGTGTCATGT CATCTGCAAA CAGTGGCAGT TTTCCTTCTT CCCTTCCAAC CTGGATTTCT    720TTGATTTCTT TCTGTCTGAG TACGACTAGG ATTCCCAATA CTATACCGAA TAAAAGTGGC    780AAGAGTGGAC ATCCTTGTCT TATTTTTCTG ACCTTAGAGG AAATGCTTTC AGTTTTTCAC    840CATTAATTAT AATGTTTACT GTGGGCTTGT CATATGTGGC CTTCATTATA TGGAGGTCTA    900TTCCCTCTAT ACCCACCTTG TTGAGAGTTT TTATCATAAA AGTATGTTGA ATTTTGTCAA    960AAGTTTTTCC TGCATCTATT GAGATGATTT TTACTCTTCA ATTCATTAAT GATTTTTATT   1020CTTCATTTTG TTAATGATTT CCATTCTTCA ATTTGTTAAC GTGGTATATC ACATTGATTG   1080ATTTGTGGAT ACCTTTGTAT CCCTGGGATA AACCTCACTT GATCATGAGC TTTCAATGTA   1140TTTTTGAATT CACTTTGCTA ATATTCTGTT GGGTATTTTT GCATCTCTAT TCATCAATGA   1200TATTGGCCTA AGAAAGGTTT TGTCTGGTTT TAGTATCAGG GTGATGCTGG CCTCATAGAG   1260AGAGTTTAGA AGCATTTCCT CCTCTTTGAT TTTTCGGAAT AGTTTGAGTA GGATAGGTAT   1320TAACTCTTCT TTAAATGTTT GGGGACTTCC CTGGTGAGCC GGTGGTTGAG AATCCGCCTC   1380AGGGATGTGG GTTTGATCCC TGGTCAGGGA ACCATTAATA AGATCCCACA TGCTGCAGGC   1440AACAAGCCCC CAAGCTGCAA CCACTGAGCT GCAACCGCTG CAGTGCCCAC AGGCCACGAC   1500CAGAGAAAGC CCACATACAG CAGGGAAGAC CCAGCACAAC CGGAAAAAGG AGTTTGGTGG   1560AATACAGCTG TGAAGCCGTC TGGTCCTGGA CTCCTGCTTG AGGGAATTTT TTAAAAATTA   1620TTGATTCAAT TTCATTACTG GTAACTGGTC TGTTCATATT TTCTATTTCT TCCGGGTTCA   1680GTCTTGGGAG ATTGTACATG CCTAGGAATG TGTCCGTTTC TTCTAGGTTG TCCATTTTAT   1740TGGACATGCA TGGGAGCACA CAGCACCGAC CAGCGAGACT CATGCTGGCT TCCTGGGGCC    1800AGGCTGGGGC CCCAAGCAGC ATGGCATCCT AGAGTGTGTG AAAGCCCACT GACCCTGCCC    1860AGCCCCACAA TTTCATTCTG AGAAGTGATT CCTTGCTTCT GCACTTACAG GCCCAGGATC    1920TGACCTGCTT CTGAGGAGCA GGGGTTTTGG CAGGACGGGG AGATGCTGAG AGCCGACGGG    1980GGTCCAGGTC CCCTCCCAGG CCCCCCTGTC TGGGGCAGCC CTTGGGAAAG ATTGCCCCAG    2040TCTCCCTCCT ACAGTGGTCA GTCCCAGCTG CCCCAGGCCA GAGCTGCTTT ATTTCCGTCT    2100CTCTCTCTGG ATGGTATTCT CTGGAAGCTG AAGGTTCCTG AAGTTATGAA TAGCTTTGCC    2160CTGAAGGGCA TGGTTTGTGG TCACGGTTCA CAGGAACTTG GGAGACCCTG CAGCTCAGAC    2220GTCCCGAGAT TGGTGGCACC CAGATTTCCT AAGCTCGCTG GGGAACAGGG CGCTTGTTTC    2280TCCCTGGCTG ACCTCCCTCC TCCCTGCATC ACCCAGTTCT GAAAGCAGAG CGGTGCTGGG    2340GTCACAGCCT CTCGCATCTA ACGCCGGTGT CCAAACCACC CGTGCTGGTG TTCGGGGGGC    2400TACCTATGGG GAAGGGCTTC TCACTGCAGT GGTGCCCCCC GTCCCCTCTG AGATCAGAAG    2460TCCCAGTCCG GACGTCAAAC AGGCCGAGCT CCCTCCAGAG GCTCCAGGGA GGGATCCTTG    2520CCCCCCCGCT GCTGCCTCCA GCTCCTGGTG CCGCACCCTT GAGCCTGATC TTGTAGACGC    2580CTCAGTCTAG TCTCTGCCTC CGTGTTCACA CGCCTTCTCC CCATGTCCCC TCCGTGTCCC    2640CGTTTTCTCT CACAAGGACA CCGGACATTA GATTAGCCCC TGTTCCAGCC TCACCTGAAC    2700AGCTCACATC TGTAAAGACC TAGATTCCAA ACAAGATTCC AACCTGAAGT TCCCGGTGGA    2760TGTGAGTTCT GGGGCGACAT CCTTCAACCC CATCACAGCT TGCAGTTCAT CGCAAAACAT    2820GGAACCTGGG GTTTATCGTA AAACCCAGGT TCTTCATGAA ACACTGAGCT TCGAGGCTTG    2880TTGCAAGAAT TAAAGGTGCT AATACAGATC AGGGCAAGGA CTGAAGCTGG CTAAGCCTCC    2940TCTTTCCATC ACAGGAAAGG GGGGCCTGGG GGCGGCTGGA GGTCTGCTCC CGTGAGTGAG    3000CTCTTTCCTG CTACAGTCAC CAACAGTCTC TCTGGGAAGG AAACCAGAGG CCAGAGAGCA    3060AGCCGGAGCT AGTTTAGGAG ACCCCTGAAC CTCCACCCAA GATGCTGACC AGCCAGCGGG    3120CCCCCTGGAA AGACCCTACA GTTCAGGGGG GAAGAGGGGC TGACCCGCCA GGTCCCTGCT    3180ATCAGGAGAC ATCCCCGCTA TCAGGAGATT CCCCCACCTT GCTCCCGTTC CCCTATCCCA    3240ATACGCCCAC CCCACCCCTG TGATGAGCAG TTTAGTCACT TAGAATGTCA ACTGAAGGCT    3300TTTGCATCCC CTTTGCCAGA GGCACAAGGC ACCCACAGCC TGCTGGGTAC CGACGCCCAT    3360GTGGATTCAG CCAGGAGGCC TGTCCTGCAC CCTCCCTGCT CGGGCCCCCT CTGTGCTCAG    3420CAACACACCC AGCACCAGCA TTCCCGCTGC TCCTGAGGTC TGCAGGCAGC TCGCTGTAGC    3480CTGAGCGGTG TGGAGGGAAG TGTCCTGGGA GATTTAAAAT GTGAGAGGCG GGAGGTGGGA    3540GGTTGGGCCC TGTGGGCCTG CCCATCCCAC GTGCCTGCAT TAGCCCCAGT GCTGCTCAGC    3600CGTGCCCCCG CCGCAGGGGT CAGGTCACTT TCCCGTCCTG GGGTTATTAT GACTCTTGTC    3660ATTGCCATTG CCATTTTTGC TACCCTAACT GGGCAGCAGG TGCTTGCAGA GCCCTCGATA    3720CCGACCAGGT CCTCCCTCGG AGCTCGACCT GAACCCCATG TCACCCTTGC CCCAGCCTGC    3780AGAGGGTGGG TGACTGCAGA GATCCCTTCA CCCAAGGCCA CGGTCACATG GTTTGGAGGA    3840GCTGGTGCCC AAGGCAGAGG CCACCCTCCA GGACACACCT GTCCCCAGTG CTGGCTCTGA    3900CCTGTCCTTG TCTAAGAGGC TGACCCCGGA AGTGTTCCTG GCACTGGCAG CCAGCCTGGA    3960CCCAGAGTCC AGACACCCAC CTGTGCCCCC GCTTCTGGGG TCTACCAGGA ACCGTCTAGG    4020CCCAGAGGGG ACTTCCTGCT TGGCCTTGGA TGGAAGAAGG CCTCCTATTG TCCTCGTAGA    4080GGAAGCCACC CCGGGGCCTG AGGATGAGCC AAGTGGGATT CCGGGAACCG CGTGGCTGGG    4140GGCCCAGCCC GGGCTGGCTG GCCTGCATGC CTCCTGTATA AGGCCCCAAG CCTGCTGTCT    4200CAGCCCTCCA CTCCCTGCAG AGCTCAGAAG CACGACCCCA GGGATATCCC TGCAGCCATG    4260AAGTGCCTCC TGCTTGCCCT GGGCCTGGCC CTCGCCTGTG GCGTCCAGGC CATCATCGTC    4320ACCCAGACCA TGAAAGGCCT GGACATCCAG AAGGTTCGAG GGTTGGCCGG GTGGGTGAGT    4380TGCAGGGCGG GCAGGGGAGC TGGGCCTCAG AGAGCCAAGA GAGGCTGTGA CGTTGGGTTC    4440CCATCAGTCA GCTAGGGCCA CCTGACAAAT CCCCGCTGGG GCAGCTTCAA CCAGGCGTTC    4500ACTGTCTTGC ATTCTGGAGG CTGGAAGCCC AAGATCCAGG TGTTGGCAGG GCTGGCTTCT    4560CCTGCGGCCG CTCTCTGGGG AGCAGACGGC CGTCTTCTCC AGTCCTCTGC GCGCCCTGAT    4620TTCCTCTTCC TGTGAGGCCA CCAGGCCTGC TGGAAACACG CCTGCCTGCG CAGCTTCACA    4680CGACCTTTGT CATCTCTTTA AAGGCCATGT CTCCAGAGTC ATGTGTTGAA GTTCTGGGGG    4740TTAGTGGGAC ACAGTTCAGC CCCTAAAAGA GTCTCTCTGC CCCTCAAATT TTCCCCACCT    4800CCAGCCATGT CTCCCCAAGA TCCAAATGTT GCTACATGTG GGGGGGCTCA TCTGGGTCCC    4860TCTTTGGGTT CAGTGTGAGT CTGGGGAGAG CATTCCCCAG GGTGCAGAGT TGGGGGGAGT    4920ATCTCAGGGC TGCCCAGGCC GGGGTGGGAC AGAGAGCCCA CTGTGGGGCT GGGGGCCCCT    4980TCCCACCCCC AGAGTGCAAC TCAAGGTCCC TCTCCAGGTG GCGGGGACTT GGCACTCCTT    5040GGCTATGGCG GCCAGCGACA TCTCCCTGCT GGATGCCCAG AGTGCCCCCC TGAGAGTGTA    5100CGTGGAGGAG CTGAAGCCCA CCCCCGAGGG CAACCTGGAG ATCCTGCTGC AGAAATGGTG    5160GGCGTCTCTC CCCAACATGG AACCCCCACT CCCCAGGGCT GTGGACCCCC CGGGGGGTGG    5220GGTGCAGGAG GGACCAGGGC CCCAGGGCTG GGGAAGAGGG CTCAGAGTTT ACTGGTACCC    5280GGCGCTCCAC CCAAGGCTGC CCACCCAGGG CTTTTTTTTT TTTTAAACTT TTATTAATTT    5340GATGCTTCAG AACATCATCA AACAAATGAA CATAAAACAT TCATTTTTGT TTACTTGGAA    5400GGGGAGATAA AATCCTCTGA AGTGGAAATG CATAGCAAAG ATACATACAA TGAGGCAGGT    5460ATTCTGAATT CCCTGTTAGT CTGAGGATTA CAAGTGTATT TGAGCAACAG AGAGACATTT    5520TCATCATTTC TAGTCTGAAC ACCTCAGTAT CTAAAATGAA CAAGAAGTCC TGGAAACGAA    5580GCAGTGTGGG GATAGGCCCG TGTGAAGGCT GCTGGGAGGC AGCAGACCTG GGTCTTCGGG    5640CTCAAGCAGT TCCCGCTACC AGCCCTGTCC ACCTCAGACG GGGGTCAGGG TGCAGGAGAG    5700AGCTGGATGG GTGTGGGGGC AGAGATGGGG ACCTGAACCC CAGGGCTGCC TTTTGGGGGT    5760GCCTGTGGTC AAGGCTCTCC CTGACCTTTT CTCTCTGGCT TCATCTGACT TCTCCTGGCC    5820CATCCACCCG GTCCCCTGTG GCCTGAGGTG ACAGTGAGTG CGCCGAGGCT AGTTGGCCAG    5880CTGGCTCCTA TGCCCATGCC ACCCCCCTCC AGCCCTCCTG GGCCAGCTTC TGCCCCTGGC    5940CCTCAGTTCA TCCTGATGAA AATGGTCCAT GCCAATGGCT CAGAAAGCAG CTGTCTTTCA    6000GGGAGAACGG CGAGTGTGCT CAGAAGAAGA TTATTGCAGA AAAAACCAAG ATCCCTGCGG    6060TGTTCAAGAT CGATGGTGAG TCCGGGTCCC TGGGGGACAC CCACCACCCC CGCCCCCGGG    6120GACTGTGGAC AGGTTCAGGG GGCTGGCGTC GGGCCCTGGG ATGCTAAGGG ACTGGTGGTG    6180ATGAAGACAC TGCCTTGACA CCTGCTTCAC TTGCCTCCCC TGCCACCTGC CCGGGGCCTT    6240GGGGCGGTGG CCATGGGCAG GTCCCGGCTG GCGGGCTAAC CCACCAGGGT GACACCCGAG    6300CTCTCTTTGC TGGGGGGCGG GCGGTGCTCT GGGCCCTCAG GCTGAGCTCA GGAGGTACCT    6360GTGCCCTCCC AGGGGTAACC GAGAGCCGTT GCCCACTCCA GGGGCCCAGG TGCCCCACGA    6420CCCCAGCCCG CTCCACAGCT CCTTCATCTC CTGGAGACAA ACTCTGTCCG CCCTCGCTCA    6480TTCACTTGTT CGTCCTAAAT CCGAGATGAT AAAGCTTCGA GGGGGGGTTG GGGTTCCATC    6540AGGGCTGCCC TTCCGCCGGG CAGCCTGGGC CACATCTGCC CTTGGCCCCC TCAGGACTCA    6600CTCTGACTGG AGGCCCTGCA CTGACTGACG CCAGGGTGCC CAGCCCAGGG TCTCTGGCGC    6660CATCCAGCTG CACTGGGTTT GGGTGCTGGT CCTGCCCCCA AGCTGCCCGG ACACCACAGG    6720CAGCCGGGGC TGCCCACTGG CCTCGGTCAG GGTGAGCCCC AGCTGCCCCC GCTCAGGGCT    6780TGCCCCGACA ATGACCCCAT CCTCAGGACG CACCCCCCTT CCCTTGCTGG GCAGTGTCCA    6840GCCCCACCCG AGATCGGGGG AAGCCCTATT TCTTGACAAC TCCAGTCCCT GGGGGAGGGG    6900GCCTCAGACT GAGTGGTGAG TGTTCCCAAG TCCAGGAGGT GGTGGAGGGT CCTGGCGGAT    6960CCAGAGTTGA CAGTGAGGGC TTCCTGGGCC CCATGCGCCT GGCAGTGGCA GCAGGGAAGA    7020GGAAGCACCA TTTCAGGGGT GGGGGATGCC AGAGGCGCTC CCCACCCCGT CTTCGCCGGG    7080TGGTGACCCC GGGGGAGCCC CGCTGGTCGT GGAGGGTGCT GGGGGCTGAC TAGCAACCCC    7140TCCCCCCCCG TTGGAACTCA CTTTTCTCCC GTCTTGACCG CGTCCAGCCT TGAATGAGAA    7200CAAAGTCCTT GTGCTGGACA CCGACTACAA AAAGTACCTG CTCTTCTGCA TGGAAAACAG    7260TGCTGAGCCC GAGCAAAGCC TGGCCTGCCA GTGCCTGGGT GGGTGCCAAC CCTGGCTGCC    7320CAGGGAGACC AGCTGCGTGG TCCTTGCTGC AACAGGGGGT GGGGGGTGGG AGCTTGATCC    7380CCAGGAGGAG GAGGGGTGGG GGGTCCCTGA GTCCCGCCAG GAGAGAGTGG TCGCATACCG   7440GGAGCCAGTC TGCTGTGGGC CTGTGGGTGG CTGGGGACGG GGGCCAGACA CACAGGCCGG   7500GAGACGGGTG GGCTGCAGAA CTGTGACTGG TGTGACCGTC GCGATGGGGC CGGTGGTCAC   7560TGAATCTAAC AGCCTTTGTT ACCGGGGAGT TTCAATTATT TCCCAAAATA AGAACTCAGG   7620TACAAAGCCA TCTTTCAACT ATCACATCCT GAAAACAAAT GGCAGGTGAC ATTTTCTGTG   7680CCGTAGCAGT CCCACTGGGC ATTTTCAGGG CCCCTGTGCC AGGGGGGCGC GGGCATCGGC   7740GAGTGGAGGC TCCTGGCTGT GTCAGCCGGC CCAGGGGGAG GAAGGGACCC GGACAGCCAG   7800AGGTGGGGGG CAGGCTTTCC CCCTGTGACC TGCAGACCCA CTGCACTGCC CTGGGAGGAA   7860GGGAGGGGAA CTAGGCCAAG GGGGAAGGGC AGGTGCTCTG GAGGGCAAGG GCAGACCTGC   7920AGACCACCCT GGGGAGCAGG GACTGACCCC CGTCCCTGCC CCATAGTCAG GACCCCGGAG   7980GTGGACAACG AGGCCCTGGA GAAATTCGAC AAAGCCCTCA AGGCCCTGCC CATGCACATC   8040CGGCTTGCCT TCAACCCGAC CCAGCTGGAG GGTGAGCACC CAGGCCCCGC CCTTCCCCAG   8100GGCAGGAGCC ACCCGGCCCC GGGACGACCT CCTCCCATGG TGACCCCCAG CTCCCCAGGC   8160CTCCCAGGAG GAAGGGGTGG GGTGCAGCAC CCCGTGGGGG CCCCCTCCCC ACCCCCTGCC   8220AGGCCTCTCT TCCCGAGGTG TCCAGTCCCA TCCTGACCCC CCCATGACTC TCCCTCCCCC   8280ACAGGGCAGT GCCACGTCTA GGTGAGCCCC TGCCGGTGCC TCTGGGGTAA GCTGCCTGCC   8340CTGCCCCACG TCCTGGGCAC ACACATGGGG TAGGGGGTCT TGGTGGGGCC TGGGACCCCA   8400CATCAGGCCC TGGGGTCCCC CCTGTGAGAA TGGCTGGAAG CTGGGGTCCC TCCTGGCGAC   8460TGCAGAGCTG GCTGGCCGCG TGCCACTCTT GTGGGTGACC TGTGTCCTGG CCTCACACAC   8520TGACCTCCTC CAGCTCCTTC CAGCAGAGCT AAGGCTAAGT GAGCCAGAAT GGTACCTAAG   8580GGGAGGCTAG CGGTCCTTCT CCCGAGGAGG GGCTGTCCTG GAACCACCAG CCATGGAGAG   8640GCTGGCAAGG GTCTGGCAGG TGCCCCAGGA ATCACAGGGG GGCCCCATGT CCATTTCAGG   8700GCCCGGGAGC CTTGGACTCC TCTGGGGACA GACGACGTCA CCACCGCCCC CCCCCCATCA   8760GGGGGACTAG AAGGGACCAG GACTGCAGTC ACCCTTCCTG GGACCCAGGC CCCTCCAGGC   8820CCCTCCTGGG GCTCCTGCTC TGGGCAGCTT CTCCTTCACC AATAAAGGCA TAAACCTGTG   8880CTCTCCCTTC TGAGTCTTTG CTGGACGACG GGCAGGGGGT GGAGAAGTGG TGGGGAGGGA   8940GTCTGGCTCA GAGGATGACA GCGGGGCTGG GATCCAGGGC GTCTGCATCA CAGTCTTGTG   9000ACAACTGGGG GCCCACACAC ATCACTGCGG CTCTTTGAAA CTTTCAGGAA CCAGGGAGGG   9060ACTCGGCAGA GACATCTGCC AGTTCACTTG GAGTGTTCAG TCAACACCCA AACTCGACAA   9120AGGACAGAAA GTGGAAAATG GCTGTCTCTT AGTCTAATAA ATATTGATAT GAAACTCAAG   9180TTGCTCATGG ATCAATATGC CTTTATGATC CAGCCAGCCA CTACTGTCGT ATCAACTCAT   9240GTACCCAAAC GCACTGATCT GTCTGGCTAA TGATGAGAGA TTCCCAGTAG AGAGCTGGCA   9300AGAGGTCACA GTGAGAACTG TCTGCACACA CAGCAGAGTC CACCAGTCAT CCTAAGGAGA   9360TCAGTCCTGG TGTTCATTGG AGGACTGATG TTGAAGCTGA AACTCCAATG CTTTGGCCAC   9420CTGATGTGAA GAGCTGACTC ATTTGAAAAG ACCCTGATGC TGGGAAAGAT TGAGGGCAGG   9480AGGAGAAGGG GACGACAGAG GATGAGATGG TTGGATGGCA TCACCAACAC AATGGACATG   9540GGTTTGGGTG GACTCCAGGA GTTGGTGATG GACAGGGAGG CCTGGCGTGC TACGGAAGCG   9600GTTTATGGGG TCACAAAGAC TGAGTGACTG AACTGAGCTG AACTGAATGG AAATGAGGTA   9660TACAGCAAAG TGGGGATTTT TTAGATAATA AGAATATACA CATAACATAG TGTATACTCA   9720TATTTTTATG CATACCTGAA TGCTCAGTCA CTCAGTCGTA TCTGACTCTG TGACCTATGG   9780ACCGTAGCCT TCCAGGTTTC TTCTGTCCAC AGAATTCTCC AAGGCAAGAA TACTGGAGTG   9840GGTAGCCATT TCCTCCTCCA GGGGATCCTC CCGACCCAGG GATTGAACCG GCATCTCCTG   9900TATTGGCAGG TGGATTCTTT ACCACTGTGC CACCAGGGAA GCCCGTGTTA CTCTCTATGT   9960CCCACTTAAT TACCAAAGCT GCTCCAAGAA AAAGCCCCTG TGCCCTCTGA GCTTCCCGGC  10020CTGCAGAGGG TGGTGGGGGT AGACTGTGAC CTGGGAACAC CCTCCCGCTT CAGGACTCCC  10080GGGCCACGTG ACCCACAGTC CTGCAGACAG CCGGGTAGCT CTGCTCTTCA AGGCTCATTA  10140TCTTTAAAAA AAACTGAGGT CTATTTTGTG ACTTCGCTGC CGTAACTTCT GAACATCCAG  10200TGCGATGGAC AGGACCTCCT CCCCAGGCCT CAGGGGCTTC AGGGAGCCAG CCTTCACCTA   10260TGAGTCACCA GACACTCGGG GGTGGCCCCG CCTTCAGGGT GCTCACAGTC TTCCCATCGT   10320CCTGATCAAA GAGCAAGACC AATGACTTCT TAGGAGCAAG CAGACACCCA CAGGACACTG   10380AGGTTCACCA GAGCTGAGCT GTCCTTTTGA ACCTAAAGAC ACACAGCTCT CGAAGGTTTT   10440CTCTTTAATC TGGATTTAAG GCCTACTTGC CCCTCAAGAG GGAAGACAGT CCTGCATGTC   10500CCCAGGACAG CCACTCGGTG GCATCCGAGG CCACTTAGTA TTATCTGACC GCACCCTGGA   10560ATTAATCGGT CCAAACTGGA CAAAAACCTT GGTGGGAAGT TTCATCCCAG AGGCCTCAAC   10620CATCCTGCTT TGACCACCCT GCATCTTTTT TTCTTTTATG TGTATGCATG TATATATATA   10680TATATATTTT TTTTTTTTTC ATTTTTTGGC TGTGCTGGCT GTTCGTTGCA GTTCGGTGCG   10740CAGGCTTCTC TCTAGTTTCT CTCTAGTCTT CTCTTATCAC AGAGCAGTCT CTAGACGATC   10800GACGCGT                                                             10807(2)SEQ ID NO:8的信息:(i)序列特征
(A)长度:47bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(xi)序列描述:SEQ ID NO:8AATTCCGATC GACGCGTCGA CGATATACTC TAGACGATCG ACGCGTA                   47(2)SEQ ID NO:9的信息:(i)序列特征
(A)长度:24bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:BLGAMP3(xi)序列描述:SEQ ID NO:9TGGATCCCCT GCCGGTGCCT CTGG                                24(2)SEQ ID NO:10的信息:(i)序列特征
(A)长度:24bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:BLGAMP4(xi)序列描述:SEQ ID NO:10AACGCGTCAT CCTCTGTGAG CCAG                                24(2)SEQ ID NO:11的信息:(i)序列特征
(A)长度:10bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6839(xi)序列描述:SEQ ID NO:11ACTACGTAGT                                                10(2)SEQ ID NO:12的信息:(i)序列特征
(A)长度:42bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6632(xi)序列描述:SEQ ID NO:12CGACGCGGAT CCTACGTACC TGCAGCCATG TTTTCCATGA GG            42(2)SEQ ID NO:13的信息:(i)序列特征
(A)长度:21bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6627(xi)序列描述:SEQ ID NO:13AGGGCTTCGG CAAGCTTCAG G                                   21(2)SEQ ID NO:14的信息:(i)序列特征
(A)长度:24bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6521(xi)序列描述:SEQ ID NO:14GCCAAAGACT TACTTCCCTC TAGA                                24(2)SEQ ID NO:15的信息:(i)序列特征
(A)长度:30bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性((vii)来源:
(B)克隆:ZC6520(xi)序列描述:SEQ ID NO:15GCATGAACGT CGCGTGGTGG TTGTGCTACC                          30(2)SEQ ID NO:16的信息:(i)序列特征
(A)长度:30bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6519(xi)序列描述:SEQ ID NO:16ACCACGCGAC GTTCATGCTC TAAAACCGTT                          30(2)SEQ ID NO:17的信息:(i)序列特征
(A)长度:36bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6518(xi)序列描述:SEQ ID NO:17GCTGCGGGAT CCTACGTACT AGGGGGACAG GGAAGG                   36(2)SEQ ID NO:18的信息:(i)序列特征
(A)长度:45bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6629(xi)序列描述:SEQ ID NO:18CGACGCGAAT TCTACGTACC TGCAGCCATG AAAAGGATGG TTTCT         45(2)SEQ ID NO:19的信息:(i)序列特征
(A)长度:45bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6630(xi)序列描述:SEQ ID NO:19CGACGCGAAT TCTACGTACC TGCAGCCATG AAACATCTAT TATTG         45(2)SEQ ID NO:20的信息:(i)序列特征
(A)长度:21bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6625(xi)序列描述:SEQ ID NO:20GTGAGATTTT CAGATCTTGT C                                   21(2)SEQ ID NO:21的信息:(i)序列特征
(A)长度:21bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6626(xi)序列描述:SEQ ID NO:21AAGAATTACT GTGGCCTACC A                                   21(2)SEQ ID NO:22的信息:(i)序列特征
(A)长度:33bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6624(xi)序列描述:SEQ ID NO:22GCTGCGGAAT TCTACGTACT ATTGCTGTGG GAA                      33(2)SEQ ID NO:23的信息:(i)序列特征
(A)长度:45bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6514(xi)序列描述:SEQ ID NO:23CGACGCGGAT CCTACGTACC TGCAGCCATG AGTTGGTCCT TGCAC         45(2)SEQ ID NO:24的信息:(i)序列特征
(A)长度:21bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6517(xi)序列描述:SEQ ID NO:24GTCTCTGGTA GCAACATACT A                                   21(2)SEQ ID NO:25的信息:(i)序列特征
(A)长度:22bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6516(xi)序列描述:SEQ ID NO:25GGGTTTCTAG CCCTACTAGT AG                                  22(2)SEQ ID NO:26的信息:(i)序列特征
(A)长度:22bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(vii)来源:
(B)克隆:ZC6515(xi)序列描述:SEQ ID NO:26GGGTTTCTAG CCCTACTAGT AG                                  22(2)SEQ ID NO:27的信息:(i)序列特征
(A)长度:47bp
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(xi)序列描述:SEQ ID NO:27AAGCTACGCG TCGATCGTCT AGAGTATATC GTCGACGCGT CGATCGG       47

Claims (20)

1.一种生产纤维蛋白原的方法,包括:
提供编码与纤维蛋白原Aα链相连接的分泌信号的第一条DNA片段,编码与纤维蛋白原Bβ链相连接的分泌信号的第二条DNA片段,和编码与纤维蛋白原γ链相连接的分泌信号的第三条DNA片段,其中第一、第二、第三条片段中的每一条都与在雌性哺乳动物宿主的乳腺中表达其所需要的附加的DNA片段相连接,且第一条DNA片段包含编码具有SEQ ID NO:2所示氨基酸序列的人纤维蛋白原Aα链的核苷酸序列,第二条DNA片段包含编码具有SEQ IDNO:4所示氨基酸序列的人纤维蛋白原Bβ链的核苷酸序列,第三条DNA片段包含具有SEQ ID NO:6所示氨基酸序列的人纤维蛋白原γ链的核苷酸序列;
将所说的DNA片段导入一个非人类哺乳动物物种的受精卵;
将所说的受精卵植入所说的物种的雌性动物的输卵管或子宫内,以获得带有所说的DNA结构的后代;
繁殖所说的后代以产生雌性后裔,来表达所说的第一、第二、第三条DNA片段并生产出含有由这些片段编码的生物感受态的纤维蛋白原的乳汁;
从所说的雌性后裔中收集乳汁;
从这些乳汁中回收纤维蛋白原。
2.根据权利要求1的方法,其中所说的物种选自由绵羊,猪,山羊和牛组成的一组。
3.根据权利要求1的方法,其中所说的第一,第二和第三条DNA片段中的每一条包括一个内含子。
4.根据权利要求1的方法,其中所说的第一,第二和第三条DNA片段的摩尔比在范围0.5-1∶0.5-1∶0.5-1范围之内。
5.根据权利要求1的方法,其中所说的第一,第二和第三条DNA片段中的每一条都连接有选自酪蛋白,β-乳球蛋白,α-乳清蛋白以及乳清酸性蛋白基因启动子组成的一组中的一个转录启动子。
6.根据权利要求1的方法,其中所说的第一,第二和第三条DNA片段在β-乳球蛋白启动子的控制之下表达。
7.根据权利要求1的方法,其中所说的导入步骤包括向所说的受精卵的一个原核中注射所说的第一,第二和第三条DNA片段。
8.根据权利要求1的方法,其中所说的纤维蛋白原是人类纤维蛋白原。
9.根据权利要求1的方法,其中所说的第二条DNA片段包括如SEQ ID NO:3所示的从470位-8100位核苷酸的核苷酸序列。
10.根据权利要求1的方法,其中所说的第二条DNA片段包括如SEQ ID NO:3所示的从512位-8100位核苷酸的核苷酸序列。
11.一种生产纤维蛋白原的方法,包括:
将编码与纤维蛋白原Aα链相连的分泌信号的第一条DNA片段掺入β-乳球蛋白基因,生产出第一个融合基因,其中第一条DNA片段包含编码具有SEQ ID NO:2所示氨基酸序列的人纤维蛋白原Aα链的核苷酸序列;
将编码与纤维蛋白原Bβ链相连的分泌信号的第二条DNA片段掺入β-乳球蛋白基因,生产出第二个融合基因,其中第二条DNA片段包含编码具有SEQ ID NO:4所示氨基酸序列的人纤维蛋白原Bβ链的核苷酸序列;
将编码与纤维蛋白原γ链相连的分泌信号的第三条DNA片段掺入β-乳球蛋白基因,生产出第三个融合基因,其中第三条DNA片段包含编码具有SEQ ID NO:6所示氨基酸序列的人纤维蛋白原γ链的核苷酸序列;
将所说的第一、第二、第三个融合基因导入一非人类哺乳动物的种系,使得所说的DNA片段在该哺乳动物或其雌性后裔的乳腺中表达,并且生物感受态的纤维蛋白原分泌到该哺乳动物或其雌性后裔中的乳汁中;
从所说的哺乳动物或其雌性后裔中获得乳汁;
从所说的乳汁中回收所说的纤维蛋白原。
12.根据权利要求11的方法,其中所说的哺乳动物是绵羊,猪,山羊或牛。
13.根据权利要求11的方法,其中所说的第一,第二和第三个融合基因中的每一个包括一个内含子。
14.根据权利要求11的方法,其中所说的第一,第二和第三个融合基因的摩尔比在0.5-1∶0.5-1∶0.5-1范围之内。
15.根据权利要求11的方法,其中所说的导入步骤包括向所说的受精卵的一个原核中注射所说的第一,第二和第三个融合基因,并将所说的卵植入假孕的雌性动物的输卵管,以产生在其种系中带有所说的融合基因的雌性后代。
16.一种生产纤维蛋白原的方法,包括:
提供一种非人类的转基因雌性哺乳动物,在其种系中带有分别编码具有SEQ ID NO:2所示氨基酸序列的人纤维蛋白原Aα链、具有SEQ ID NO:4所示氨基酸序列的人纤维蛋白原Bβ链和具有SEQID NO:6所示氨基酸序列的人纤维蛋白原γ链的异源DNA片段,其中所说的DNA片段在所说的哺乳动物的乳腺中表达而所说的DNA片段所编码的纤维蛋白原分泌到所说的哺乳动物的乳汁中;
从所说的哺乳动物中收集乳汁;
从所说的乳汁中回收所说的纤维蛋白原。
17.根据权利要求16的方法,其中所说的哺乳动物是绵羊,猪,山羊或牛。
18.一种生产哺乳动物的转基因后代的方法,包括:
提供编码纤维蛋白原Aα链的第一条DNA片段,编码纤维蛋白原Bβ链的第二条DNA片段,和编码纤维蛋白原γ链的第三条DNA片段,其中第一、第二、第三条片段中的每一条都与在雌性哺乳动物宿主的乳腺中表达与分泌到所说的宿主雌性哺乳动物的乳汁中所需要的附加的DNA链相连接,且第一条DNA片段包含编码具有SEQID NO:2所示氨基酸序列的人纤维蛋白原Aα链的核苷酸序列,第二条DNA片段包含编码具有SEQ ID NO:4所示氨基酸序列的人纤维蛋白原Bβ链的核苷酸序列,第三条DNA片段包含具有SEQ IDNO:6所示氨基酸序列的人纤维蛋白原γ链的核苷酸序列;
将所说的DNA片段导入一个非人类哺乳动物的受精卵;
将所说的受精卵植入所说的非人类物种的雌性动物的输卵管或子宫内,以获得带有所说的第一、第二和第三条DNA片段的后代。
19.根据权利要求18的方法,其中所说的后代是雌性的。
20.根据权利要求18的方法,其中所说的后代是雄性的。
CN95191945A 1994-03-03 1995-03-01 在转基因动物中生产纤维蛋白原 Expired - Lifetime CN1079433C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/206,176 1994-03-03
US08/206,176 US5639940A (en) 1994-03-03 1994-03-03 Production of fibrinogen in transgenic animals

Publications (2)

Publication Number Publication Date
CN1144539A CN1144539A (zh) 1997-03-05
CN1079433C true CN1079433C (zh) 2002-02-20

Family

ID=22765288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95191945A Expired - Lifetime CN1079433C (zh) 1994-03-03 1995-03-01 在转基因动物中生产纤维蛋白原

Country Status (20)

Country Link
US (2) US5639940A (zh)
EP (1) EP0748386B9 (zh)
JP (1) JPH09509839A (zh)
CN (1) CN1079433C (zh)
AT (1) ATE298801T1 (zh)
AU (1) AU685250B2 (zh)
BR (1) BR9506944A (zh)
CA (1) CA2184004C (zh)
CZ (1) CZ296382B6 (zh)
DE (1) DE69534295T4 (zh)
DK (1) DK0748386T4 (zh)
ES (1) ES2245453T5 (zh)
FI (1) FI963419A (zh)
HU (1) HU224550B1 (zh)
NO (1) NO329072B1 (zh)
NZ (1) NZ282601A (zh)
PL (1) PL186074B1 (zh)
PT (1) PT748386E (zh)
SK (1) SK111896A3 (zh)
WO (1) WO1995023868A1 (zh)

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0759762A4 (en) * 1994-05-02 1999-09-01 Squibb & Sons Inc RECOMBINANT FIBRIN CHAINS, FIBRIN AND FIBRIN APPROVED
US5968809A (en) 1997-04-11 1999-10-19 Abbot Laboratories Methods and compositions for synthesis of long chain poly-unsaturated fatty acids
GB9715064D0 (en) * 1997-07-17 1997-09-24 Ppl Therapeutics Scotland Ltd Protein expression
AU3066699A (en) 1998-03-03 1999-09-20 Johns Hopkins University, The Smallpox inhibitor of complement enzymes (spice) protein and methods of inhibiting complement activation
US7122620B1 (en) * 1998-05-27 2006-10-17 Medical Research Services And Development Ltd. Haptotactic peptides
JP2003517809A (ja) * 1998-05-27 2003-06-03 ハダシット メディカル リサーチ サービシーズ アンド ディベロップメント リミテッド 新規ペプチド
WO2000017239A1 (en) * 1998-09-24 2000-03-30 Ppl Therapeutics (Scotland) Limited Purification of fibrinogen from fluids by precipitation and hydrophobic chromatography
DE69940700D1 (de) 1998-11-19 2009-05-20 Pharming Intellectual Pty Bv Stabilisierung der milch transgener tieren
GB9825374D0 (en) * 1998-11-19 1999-01-13 Ppl Therapeutics Scotland Ltd Method
CA2354638C (en) 1999-01-06 2013-03-19 Atlantic Biopharmaceuticals, Inc. Expression of secreted human alpha-fetoprotein in transgenic animals
US7208576B2 (en) * 1999-01-06 2007-04-24 Merrimack Pharmaceuticals, Inc. Non-glycosylated human alpha-fetoprotein, methods of production, and uses thereof
US6183803B1 (en) 1999-06-11 2001-02-06 Biosante Pharmaceuticals, Inc. Method for processing milk
BR0014860A (pt) * 1999-10-14 2003-07-08 Genzyme Transgenics Corp Métodos para a produção de uma molécula alvo em um animal transgênico e purificação da molécula alvo
WO2001047942A2 (en) * 1999-12-27 2001-07-05 Curagen Corporation Nucleic acids containing single nucleotide polymorphisms and methods of use thereof
CN1436235A (zh) * 2000-05-13 2003-08-13 生物活性有限公司 抗血管生成的多肽
BR0113674A (pt) * 2000-09-01 2003-06-03 Bioacta Ltd Peptìdeos antiangiogênicos
EP2325337A1 (en) 2000-09-26 2011-05-25 Duke University RNA aptamers and methods for identifying the same
KR100882029B1 (ko) * 2000-11-17 2009-02-09 교와 핫꼬 기린 가부시키가이샤 클로닝된 트랜스제닉 유제류에서 이종 (사람)면역글로블린의 발현
US20020073441A1 (en) 2000-12-13 2002-06-13 Ross Brian D. Compositions and methods for detecting proteolytic activity
AU2003243157C1 (en) 2002-04-19 2008-09-04 Verenium Corporation Phospholipases, nucleic acids encoding them and methods for making and using them
US7226771B2 (en) 2002-04-19 2007-06-05 Diversa Corporation Phospholipases, nucleic acids encoding them and methods for making and using them
DE10261126A1 (de) * 2002-08-13 2004-03-04 Aventis Behring Gmbh Lagerungsstabile, flüssige Fibrinogen-Formulierung
IL152609A0 (en) * 2002-11-03 2003-06-24 Hapto Biotech Inc Liposomal compositions comprising haptotactic peptides and uses thereof
RU2384059C2 (ru) 2002-11-08 2010-03-20 Киова Хакко Кирин Ко., Лтд. Трансгенные копытные животные, имеющие пониженную активность прионного белка, и их применения
EP1577385B1 (en) * 2002-12-24 2010-03-24 Nitto Boseki Co., Ltd. Marker proteins for diagnosing liver disease and method of diagnosing liver disease using the same
CN102618564B (zh) 2003-03-06 2014-10-29 维莱尼姆公司 淀粉酶、编码它们的核酸及其制备和应用方法
CA2515583C (en) 2003-03-07 2015-07-14 Diversa Corporation Hydrolases, nucleic acids encoding them and methods for making and using them
MXPA05010681A (es) 2003-04-04 2005-12-15 Diversa Corp Liasas de pectato, acidos nucleicos que las codifican, y metodos para hacerlas y usarlas.
US7514593B2 (en) * 2003-05-30 2009-04-07 The University Of North Carolina At Chapel Hill Animal model for chronic obstructive pulmonary disease and cystic fibrosis
AU2004254640B2 (en) 2003-07-02 2010-08-26 Bp Corporation North America Inc. Glucanases, nucleic acids encoding them and methods for making and using them
US7741089B2 (en) 2003-08-11 2010-06-22 Verenium Corporation Laccases, nucleic acids encoding them and methods for making and using them
CN1871252A (zh) * 2003-09-05 2006-11-29 Gtc生物治疗学公司 在转基因哺乳动物奶中生产融合蛋白的方法
US20050186608A1 (en) * 2004-02-19 2005-08-25 Olsen Byron V. Method for the production of transgenic proteins useful in the treatment of obesity and diabetes
DE102004009400A1 (de) 2004-02-24 2005-09-08 Zlb Behring Gmbh Fibrinogen Reinigung
JP2007533328A (ja) 2004-04-22 2007-11-22 キリンホールディングス株式会社 トランスジェニック動物及びその用途
CN101432292B (zh) 2004-06-16 2013-03-13 维莱尼姆公司 对叶绿素进行酶促脱色的组合物和方法
US8615368B2 (en) * 2005-03-10 2013-12-24 Gen-Probe Incorporated Method for determining the amount of an analyte in a sample
EP1869174B1 (en) 2005-03-10 2015-02-18 BASF Enzymes LLC Lyase enzymes, nucleic acids encoding them and methods for making and using them
DK1861506T3 (en) 2005-03-15 2015-07-20 Bp Corp North America Inc Cellulases, nucleic acids encoding them, and methods of making and using them
EP1987142A4 (en) 2006-02-02 2009-07-15 Verenium Corp ESTERASES AND ASSOCIATED NUCLEIC ACIDS AND METHODS
DK2415864T3 (da) 2006-02-10 2014-05-05 Bp Corp North America Inc Oligomerase-2-enzymer (eller beta-xylosidaseenzymer), nucleinsyrer, som koder for dem, og fremgangsmåder til at fremstille og anvende dem
EP3406621A1 (en) 2006-02-14 2018-11-28 BP Corporation North America Inc. Xylanases, nucleic acids encoding them and methods for making and using them
EP1996186A4 (en) 2006-03-06 2009-07-22 Humagene Inc PROCESS FOR THE PREPARATION OF RECOMBINANT HUMAN THROMBIN AND FIBRINOGEN
US8546118B2 (en) 2006-03-07 2013-10-01 Verenium Corporation Aldolases, nucleic acids encoding them and methods for making and using them
EP2322643B1 (en) 2006-03-07 2014-07-09 Cargill, Incorporated Aldolases, nucleic acids encoding them and methods for making and using them
US8124831B2 (en) * 2006-07-06 2012-02-28 Duke University Transgenic mice carrying functional single nucleotide polymorphisms in brain-specific tryptophan hydroxylase
AU2007356171B8 (en) 2006-08-04 2014-01-16 Bp Corporation North America Inc. Glucanases, nucleic acids encoding them, and methods for making and using them
WO2008036863A2 (en) 2006-09-21 2008-03-27 Verenium Corporation Phospholipases, nucleic acids encoding them and methods for making and using them
MX2009003032A (es) 2006-09-21 2009-11-18 Verenium Corp Fitasas, acidos nucleicos que las codifican, y metodos de hacerlas y usarlas.
PL2479267T3 (pl) 2006-12-21 2017-06-30 Basf Enzymes Llc Amylazy i glukoamylazy, kwasy nukleinowe kodujące te związki oraz sposoby wytwarzania tych związków oraz stosowania ich
DK2191001T3 (en) 2007-04-09 2016-09-19 Univ Florida RAAV VECTOR COMPOSITIONS WITH TYROSIN MODIFIED CAPSIDE PROTEINS AND PROCEDURES FOR USE THEREOF
DK2205744T3 (en) 2007-10-03 2015-04-27 Bp Corp North America Inc Xylanases, nucleic acids encoding them, and methods of making and an-facing presence thereof
JP2011502162A (ja) * 2007-10-29 2011-01-20 ザ ユニバーシティー オブ カリフォルニア 変形性関節症遺伝子治療
CA2710922A1 (en) 2008-01-03 2009-07-16 Verenium Corporation Isomerases, nucleic acids encoding them and methods for making and using them
EP2238242B9 (en) 2008-01-03 2015-06-10 BASF Enzymes LLC Transferases and oxidoreductases, nucleic acids encoding them and methods for making and using them
EP2285400B1 (en) 2008-05-02 2015-10-28 Laboratoire Français du Fractionnement et des Biotechnologies Treatment of bleeding with low half-life fibrinogen
US20110177524A1 (en) * 2008-07-09 2011-07-21 Profibrix Bv Recombinant Fibrinogen
US8153391B2 (en) 2008-08-29 2012-04-10 Bunge Oils, Inc. Hydrolases, nucleic acids encoding them and methods for making and using them
US8357503B2 (en) 2008-08-29 2013-01-22 Bunge Oils, Inc. Hydrolases, nucleic acids encoding them and methods for making and using them
US8198062B2 (en) 2008-08-29 2012-06-12 Dsm Ip Assets B.V. Hydrolases, nucleic acids encoding them and methods for making and using them
ES2670368T3 (es) 2008-09-15 2018-05-30 F. Hoffmann-La Roche Ag Composiciones y procedimientos para regular la osmolaridad celular
MX355638B (es) 2009-05-21 2018-03-26 Verenium Corp Fitasas, ácidos nucléicos que las codifican, y métodos de hacerlas y usarlas.
US20100304873A1 (en) * 2009-05-28 2010-12-02 Lipa Markowitz Bowling Ball and Football Game Controller
UA111708C2 (uk) 2009-10-16 2016-06-10 Бандж Ойлз, Інк. Спосіб рафінування олії
UA109884C2 (uk) 2009-10-16 2015-10-26 Поліпептид, що має активність ферменту фосфатидилінозитол-специфічної фосфоліпази с, нуклеїнова кислота, що його кодує, та спосіб його виробництва і застосування
AU2011204557B2 (en) 2010-01-08 2014-08-28 Mallinckrodt Pharma Ip Trading D.A.C. Fibrinogen preparations enriched in fibrinogen with an extended alpha chain
EP2547337A1 (en) 2010-03-17 2013-01-23 Pharming Intellectual Property B.V. Use of anticoagulants in the production of recombinant proteins in the milk of transgenic animals
NZ602897A (en) 2010-04-23 2014-09-26 Univ Florida Raav-guanylate cyclase compositions and methods for treating leber’s congenital amaurosis-1 (lca1)
JP2016508515A (ja) 2013-02-13 2016-03-22 ラボラトワール フランセ デュ フラクショヌマン エ デ ビオテクノロジーLaboratoire Francais du Fractionnement et des Biotechnologies 高ガラクトシル化抗TNF−α抗体およびその使用
TW201446962A (zh) 2013-02-13 2014-12-16 Lab Francais Du Fractionnement 具有修飾的糖化作用之蛋白質及其製造方法
BR112016014804A2 (pt) * 2013-12-24 2017-08-08 Lfb Usa Inc Método para produzir heparina, mamífero não humano transgênico, células epiteliais mamárias, heparina, e, composição
CN103995077B (zh) * 2014-05-21 2016-01-27 中国计量科学研究院 一种测定奶粉中β-乳球蛋白含量的方法
FR3032621A1 (fr) 2015-02-13 2016-08-19 Lab Francais Du Fractionnement Colle biologique et son utilisation comme medicament
AU2016236297B2 (en) * 2015-03-20 2020-07-23 Assistance Publique - Hopitaux De Paris Isolated peptides and fragments thereof from fibrinogen for use as drugs, particularly in skin inflammatory diseases
KR101841587B1 (ko) 2016-01-12 2018-05-14 주식회사 녹십자홀딩스 피브리노겐의 정제방법
CA3028030A1 (en) 2016-07-06 2018-01-11 Laboratoire Francais Du Fractionnement Et Des Biotechnologies Anti-fibrinogen aptamers and uses thereof
AU2019258504B2 (en) * 2018-04-24 2020-03-12 Fibriant B.V. Therapeutic uses of fibrinogen gamma prime variants
US11266129B2 (en) 2019-11-05 2022-03-08 Versiti Blood Research Institute Foundation, Inc. Murine model of fetal/neonatal alloimmune thrombocytopenia
EP4054324A1 (en) 2019-11-05 2022-09-14 Versiti Blood Research Institute Foundation, Inc. A murine model of fetal/neonatal alloimmune thrombocytopenia

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1988000239A1 (en) * 1986-06-30 1988-01-14 Pharmaceutical Proteins Ltd Peptide production
WO1992011358A1 (en) * 1990-12-24 1992-07-09 The Agricultural And Food Research Council Increased expression by a second transferred sequence in transgenic organisms

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT359652B (de) 1979-02-15 1980-11-25 Immuno Ag Verfahren zur herstellung eines gewebekleb- stoffes
AT359653B (de) 1979-02-15 1980-11-25 Immuno Ag Verfahren zur herstellung eines gewebekleb- stoffes
US4873191A (en) 1981-06-12 1989-10-10 Ohio University Genetic transformation of zygotes
US4442655A (en) 1981-06-25 1984-04-17 Serapharm Michael Stroetmann Fibrinogen-containing dry preparation, manufacture and use thereof
US4462567A (en) 1982-10-28 1984-07-31 Helmut Habicht Discharge valve for granular materials
US4713339A (en) 1983-01-19 1987-12-15 Genentech, Inc. Polycistronic expression vector construction
US4627879A (en) 1984-09-07 1986-12-09 The Trustees Of Columbia University In The City Of New York Fibrin adhesive prepared as a concentrate from single donor fresh frozen plasma
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5322775A (en) 1986-06-30 1994-06-21 Pharmaceutical Proteins Ltd. Peptide production
EP0279582A3 (en) * 1987-02-17 1989-10-18 Pharming B.V. Dna sequences to target proteins to the mammary gland for efficient secretion
US4873316A (en) * 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
US5004697A (en) 1987-08-17 1991-04-02 Univ. Of Ca Cationized antibodies for delivery through the blood-brain barrier
CA1340740C (en) 1987-12-08 1999-09-14 Eileen R. Mulvihill Co-expression in eukaryotic cells
AT397203B (de) 1988-05-31 1994-02-25 Immuno Ag Gewebeklebstoff
US5087353A (en) 1988-11-03 1992-02-11 Ecological Engineering Associates Solar aquatic apparatus for treating waste
GB8826446D0 (en) * 1988-11-11 1988-12-14 Agricultural & Food Res Peptide production
US5204447A (en) 1988-11-14 1993-04-20 Zymogenetics, Inc. Purification of factor xiii
DE3928628C1 (zh) 1989-08-30 1990-10-11 Kurt 5060 Bergisch Gladbach De Munny
EP0737746A3 (en) * 1989-12-01 1996-10-23 Pharming B.V. Production of recombinant polypeptides by bovine species and transgenic methods
AU1228592A (en) * 1991-01-11 1992-08-17 American Red Cross Expression of active human protein c in mammary tissue of transgenic animals
US5272074A (en) 1992-04-23 1993-12-21 Mcmaster University Fibrin coated polymer surfaces

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1988000239A1 (en) * 1986-06-30 1988-01-14 Pharmaceutical Proteins Ltd Peptide production
WO1992011358A1 (en) * 1990-12-24 1992-07-09 The Agricultural And Food Research Council Increased expression by a second transferred sequence in transgenic organisms

Also Published As

Publication number Publication date
DE69534295T2 (de) 2006-04-27
EP0748386B2 (en) 2009-12-02
EP0748386B1 (en) 2005-06-29
HU224550B1 (hu) 2005-10-28
USRE42704E1 (en) 2011-09-13
NO963651D0 (no) 1996-09-02
DK0748386T3 (da) 2005-10-24
DE69534295D1 (de) 2005-08-04
CZ296382B6 (cs) 2006-03-15
CN1144539A (zh) 1997-03-05
PL316115A1 (en) 1996-12-23
ES2245453T5 (es) 2010-04-28
AU1977095A (en) 1995-09-18
CZ257596A3 (en) 1997-06-11
ATE298801T1 (de) 2005-07-15
DK0748386T4 (da) 2010-02-15
WO1995023868A1 (en) 1995-09-08
FI963419A0 (fi) 1996-09-02
NZ282601A (en) 1997-06-24
FI963419A (fi) 1996-09-02
JPH09509839A (ja) 1997-10-07
HU9602404D0 (en) 1996-10-28
DE69534295T3 (de) 2010-07-01
PT748386E (pt) 2005-11-30
SK111896A3 (en) 1997-07-09
CA2184004C (en) 2000-08-01
EP0748386A1 (en) 1996-12-18
ES2245453T3 (es) 2006-01-01
HUT75552A (en) 1997-05-28
NO963651L (no) 1996-11-01
AU685250B2 (en) 1998-01-15
NO329072B1 (no) 2010-08-16
CA2184004A1 (en) 1995-09-08
BR9506944A (pt) 1997-09-09
DE69534295T4 (de) 2011-03-03
EP0748386B9 (en) 2010-08-04
PL186074B1 (pl) 2003-10-31
US5639940A (en) 1997-06-17

Similar Documents

Publication Publication Date Title
CN1079433C (zh) 在转基因动物中生产纤维蛋白原
Bühler et al. Rabbit β-casein promoter directs secretion of human interleukin-2 into the milk of transgenic rabbits
CN1086262A (zh) 新的dna序列
CN100340292C (zh) Baff,其封闭剂以及它们在b细胞应答的调节中的应用
CN1035527A (zh) 直接表达活化人c蛋白的载体和化合物
CN1871252A (zh) 在转基因哺乳动物奶中生产融合蛋白的方法
CN1491280A (zh) 滑膜细胞蛋白质
US5739407A (en) Human β-casein, process for producing it and use thereof
CN1278299A (zh) 用于具有降低的抗体介导的排斥的异种移植的转基因动物
CA2128110A1 (en) Dna encoding kappa-casein, process for obtaining the protein and use thereof
Bleck et al. Sequence and single-base polymorphisms of the bovine α-lactalbumin 5'-flanking region
CN1486365A (zh) 异种(人类)免疫球蛋白在克隆转基因有蹄类动物中的表达
CN1906296A (zh) 在转基因植物中产生载脂蛋白的方法
CN1071790C (zh) 胆盐刺激的脂酶变异体、其制法、用途及编码它的核酸
CA2959737A1 (en) Materials and methods for producing animals with short hair
JPH04505710A (ja) ポリペプチドの改良された発現
CN1431911A (zh) 转基因产生的核心蛋白聚糖
CN1826350A (zh) 非糖基化人甲胎蛋白、制备方法及其应用
CN1914324A (zh) 利用同源重组的牛β-酪蛋白基因靶向载体
CN1944645A (zh) 利用乳腺生物反应器制备重组人的抗凝血酶ⅲ蛋白的方法
CN1157635A (zh) α-乳清蛋白基因构建物
CN1306568A (zh) 可得自转基因羊的胆汁盐活化的人脂肪酶(bssl)
CN1053446A (zh) 由牛生产重组多肽和转移基因的方法
CN1200735C (zh) 肾小球膜细胞增生性肾炎动物模型
CN1283785C (zh) 利用转基因动物乳腺生产人促红细胞生成素的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Free format text: FORMER OWNER: PPL MEDICAL CO., LTD.

Effective date: 20050722

Owner name: PPL MEDICAL CO., LTD.

Free format text: FORMER OWNER: ENZYME GENETICS CO.,LTD.

Owner name: FAMING INTELLECTUAL PROPERTY CO., LTD.

Free format text: FORMER OWNER: PPL MEDICAL CO., LTD.

Effective date: 20050722

C41 Transfer of patent application or patent right or utility model
C56 Change in the name or address of the patentee
CP03 Change of name, title or address

Address after: Washington State

Co-patentee after: PPL Medical Ltd.

Patentee after: Zymogenetics, Inc.

Address before: Washington State

Co-patentee before: Pharmaceutical Protein Co.,Ltd.

Patentee before: Zymogenetics, Inc.

TR01 Transfer of patent right

Effective date of registration: 20050722

Address after: Leiden

Patentee after: PHARMING INTELLECTUAL PROPERTY B.V.

Address before: Luo Xian in England

Patentee before: PPL Medical Ltd.

Effective date of registration: 20050722

Address after: Luo Xian in England

Patentee after: PPL Medical Ltd.

Address before: Washington State

Co-patentee before: PPL Medical Ltd.

Patentee before: Zymogenetics, Inc.

ASS Succession or assignment of patent right

Owner name: LABORATOIRE FRANCAIS DU FRACTIONNEMENT ET DES BIOT

Free format text: FORMER OWNER: PHARMING INTELLECTUAL PTY BV

Effective date: 20141124

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20141124

Address after: Evry France

Patentee after: LABORATOIRE FRANCAIS DU FRACTIONNEMENT ET DES BIOTECHNOLOGIES

Address before: Leiden

Patentee before: PHARMING INTELLECTUAL PROPERTY B.V.

C17 Cessation of patent right
CX01 Expiry of patent term

Expiration termination date: 20150301

Granted publication date: 20020220