CN109207387A - 用于产生胶原的酵母菌株和方法 - Google Patents

用于产生胶原的酵母菌株和方法 Download PDF

Info

Publication number
CN109207387A
CN109207387A CN201810695336.2A CN201810695336A CN109207387A CN 109207387 A CN109207387 A CN 109207387A CN 201810695336 A CN201810695336 A CN 201810695336A CN 109207387 A CN109207387 A CN 109207387A
Authority
CN
China
Prior art keywords
dna
collagen
promoter
group
yeast
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810695336.2A
Other languages
English (en)
Inventor
L·戴
J·博登
J·纳尔逊
K·鲁斯布林-贾斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Modern Ranch Ltd By Share Ltd
Modern Meadow Inc
Original Assignee
Modern Ranch Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Modern Ranch Ltd By Share Ltd filed Critical Modern Ranch Ltd By Share Ltd
Publication of CN109207387A publication Critical patent/CN109207387A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • DTEXTILES; PAPER
    • D01NATURAL OR MAN-MADE THREADS OR FIBRES; SPINNING
    • D01FCHEMICAL FEATURES IN THE MANUFACTURE OF ARTIFICIAL FILAMENTS, THREADS, FIBRES, BRISTLES OR RIBBONS; APPARATUS SPECIALLY ADAPTED FOR THE MANUFACTURE OF CARBON FILAMENTS
    • D01F4/00Monocomponent artificial filaments or the like of proteins; Manufacture thereof
    • DTEXTILES; PAPER
    • D06TREATMENT OF TEXTILES OR THE LIKE; LAUNDERING; FLEXIBLE MATERIALS NOT OTHERWISE PROVIDED FOR
    • D06NWALL, FLOOR, OR LIKE COVERING MATERIALS, e.g. LINOLEUM, OILCLOTH, ARTIFICIAL LEATHER, ROOFING FELT, CONSISTING OF A FIBROUS WEB COATED WITH A LAYER OF MACROMOLECULAR MATERIAL; FLEXIBLE SHEET MATERIAL NOT OTHERWISE PROVIDED FOR
    • D06N3/00Artificial leather, oilcloth or other material obtained by covering fibrous webs with macromolecular material, e.g. resins, rubber or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08JWORKING-UP; GENERAL PROCESSES OF COMPOUNDING; AFTER-TREATMENT NOT COVERED BY SUBCLASSES C08B, C08C, C08F, C08G or C08H
    • C08J3/00Processes of treating or compounding macromolecular substances
    • C08J3/24Crosslinking, e.g. vulcanising, of macromolecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • C12N1/165Yeast isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • C12N1/18Baker's yeast; Brewer's yeast
    • C12N1/185Saccharomyces isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/72Candida
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/78Hansenula
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/84Pichia
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/85Saccharomyces

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mycology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Textile Engineering (AREA)
  • Botany (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本文描述了遗传改造以产生增加量的非羟基化胶原或羟基化胶原的酵母菌株。还描述了包括产生胶原所必需的DNA、启动子和羟基化酶的全合一载体。还提供了产生非羟基化或羟基化胶原的方法。

Description

用于产生胶原的酵母菌株和方法
相关申请案
本申请涉及2017年6月29日提交的美国专利申请案号62/526,912,其全部内容通过引用并入本文。
技术领域
本发明涉及遗传改造的酵母菌株及产生胶原的方法。改造菌株以增加所产生胶原的量并提高所产生胶原的稳定性。胶原可用于产生生物制作的皮革材料等。
发明背景
皮革.皮革用于广泛的应用,包括家具室内装饰、服装、鞋子、行李、手提包和配饰以及汽车应用。皮革的全球贸易估计值每年约为1000亿美元(Future Trends in theWorld Leather Products Industry and Trade,United Nations IndustrialDevelopment Organization,Vienna,2010),并且对皮革产品的需求持续增长。鉴于生产皮革的经济、环境和社会成本,需要满足这种需求的新方法。为跟上技术和美学趋势,皮革产品的生产者和使用者寻求展现出优越的强度、均匀性、加工性以及纳入天然组分的时尚和吸引人的美学性质的新材料。
考虑到人口增长和全球环境,将需要具有皮革般美学和改进功能的替代材料。皮革是动物皮,并且几乎完全由胶原组成。需要一种可以转化为生物制作的皮革材料的胶原来源。
胶原.胶原是皮革的主要组分。皮肤或动物皮含有大量的胶原,即一种纤维蛋白。胶原是至少28种不同胶原类型的家族的通称;动物皮肤通常是I型胶原,但其他类型的胶原可用于形成包括III型胶原的皮革。
胶原由氨基酸的重复三联体-(Gly-X-Y)n-表征,并且胶原中大约三分之一的氨基酸残基为甘氨酸。X通常是脯氨酸,并且Y通常是羟基脯氨酸,但可能有多达400个可能的Gly-X-Y三联体。不同的动物可能会产生不同的胶原氨基酸组成,这可能导致不同的性质和所产生皮革的差异。
胶原的结构可以由三条不同长度的交织的肽链组成。胶原三螺旋(或单体)可能由约1,050个氨基酸长的α链产生,因此三螺旋呈约300nm长、直径大约为1.5nm的棒形式。
根据动物皮的类型,胶原纤维可能具有一系列的直径。除了I型胶原之外,皮肤(皮)可能还包括其他类型的胶原,包括III型胶原(网硬蛋白)、IV型胶原和VII型胶原。
哺乳动物体内存在各种类型的胶原。举例来说,除了皮肤和动物皮的主要组分之外,I型胶原还存在于软骨、腱、血管结扎、器官、肌肉和骨骼的有机部分中。还成功地将胶原从除了动物皮肤或皮之外的哺乳动物身体的各个区域分离出来。数十年前,研究人员发现,在中性pH条件下,酸性增溶胶原自组装成原纤维,其由在天然组织中观察到的相同横纹纹理组成;Schmitt F.O.J.Cell.Comp Physiol.1942;20:11)。这导致胶原用于组织改造和各种生物医学应用中。最近几年,已使用重组技术从细菌和酵母中收获胶原。
无论胶原的类型如何,其都是通过物理和化学相互作用的组合形成和稳定的,包括静电相互作用,包括盐桥、氢键结、范德华相互作用、偶极-偶极力、极化力、疏水相互作用和通常由酶促反应催化的共价键结。对于I型胶原原纤维、纤维和纤维束,在研发过程中实现了活体内其复杂组装,并且在为组织提供机械支撑、同时允许细胞运动和营养输送方面至关重要。已在脊椎动物中鉴别出了各种不同的胶原类型。这些胶原包括牛、绵羊、猪、鸡和人类胶原。
通常,胶原类型用罗马数字编号,并且每种胶原类型中发现的链由阿拉伯数字鉴别。本领域中可获得各种不同类型的天然胶原的结构和生物功能的详细描述;参见(例如)Ayad等(1998)The Extracellular Matrix Facts Book,Academic Press,San Diego,CA;Burgeson,R E.和Nimmi(1992)"Collagen types:Molecular Structure and TissueDistribution"in Clin.Orthop.282:250-272;Kielty,C.M.等(1993)"The CollagenFamily:Structure,Assembly And Organization In The Extracellular Matrix,"Connective Tissue And Its Heritable Disorders,Molecular Genetics,And MedicalAspects,Royce,P.M.和B.Steinmann编辑,Wiley-Liss,NY,第103-147页;以及Prockop,D.J-和K.I.Kivirikko(1995)"Collagens:Molecular Biology,Diseases,and Potentialsfor Therapy,"Annu.Rev.Biochem.,64:403-434。)
I型胶原是骨和皮肤的主要原纤维胶原,占生物体总胶原的大约80-90%。I型胶原是多细胞性生物体细胞外基质中存在的主要结构性大分子,并且占总蛋白质量的大约20%。I型胶原是包含两条α1(I)链和一条α2(I)链(其分别由COL1A1和COL1A2基因编码)的异源三聚体分子。其他胶原类型不如I型胶原丰富,并展现不同的分布型式。举例来说,II型胶原是软骨和玻璃体液中的主要胶原,而发现III型胶原在血管中含量较高,在皮肤中含量较低。
II型胶原是包含三条由COL2A1基因编码的相同al(II)链的同源三聚体胶原。纯化II型胶原可以通过本领域已知的方法、例如通过Miller和Rhodes(1982)Methods InEnzymology 82:33-64中描述的程序从组织制备。
III型胶原是在皮肤和血管组织中发现的主要原纤维胶原。III型胶原是包含由三条由COL3A1基因编码的相同α1(III)链的同源三聚体胶原。从组织中纯化III型胶原的方法可见于例如Byers等,(1974)Biochemistry 13:5243-5248;以及Miller和Rhodes,上文文献。
IV型胶原以片而非原纤维形式存在于基膜中。最通常地,IV型胶原含有两条α1(IV)链和一条α2(IV)链。包含特定链的IV型胶原具有组织特异性。IV型胶原可以使用(例如)以下中描述的程序来纯化:Furuto和Miller(1987)Methods in Enzymology,144:41-61,Academic Press。
V型胶原是主要发现于骨骼、腱、角膜、皮肤和血管中的原纤维胶原。V型胶原以同源三聚体和异源三聚体形式存在。V胶原的一种形式是两条α1(V)链和一条α2(V)链的异源三聚体。V型原型的另一形式是α1(V)、α2(V)和α3(V)链的异源三聚体。V胶原的另一形式是α1(V)的同源三聚体。从天然来源分离V型胶原的方法可见于(例如)Elstow和Weiss(1983)Collagen Rel.Res.3:181-193,以及Abedin等(1982)Biosci.Rep.2:493-502。
VI型胶原具有小的三螺旋区域和两个大的非胶原剩余部分。VI型胶原是包含α1(VI)、α2(VI)和α3(VI)链的异源三聚体。VI型胶原可在许多结缔组织中发现。关于如何从天然来源纯化VI胶原的描述可见于(例如)Wu等(1987)Biochem.J.248:373-381,以及Kielty等(1991)J.Cell Sci.99:797-807。
VII型胶原是在特定上皮组织中发现的原纤维胶原。VII型胶原是三条α1(VII)链的同源三聚体分子。关于如何从组织中纯化VII型胶原的描述可见于(例如)Lunstrum等(1986)J.Biol.Chem.261:9042-9048,以及Bentz等(1983)Proc.Natl.Acad.Sci.USA80:3168-3172。VIII型胶原可在角膜中的德斯密氏膜(Descemet’s membrane)中发现。VIII型胶原是包含两条α1(VIII)链和一条α2(VIII)链的异源三聚体,但已经报道了其他链组成。从自然界纯化VIII型胶原的方法可见于(例如)Benya和Padilla(1986)J.Biol.Chem.261:4160-4169,以及Kapoor等(1986)Biochemistry 25:3930-3937。
IX型胶原是在软骨和玻璃体液中发现的原纤维相关胶原。IX型胶原是包含α1(IX)、α2(IX)和α3(IX)链的异源三聚体分子。IX型胶原已被归类为FACIT(具有中断三螺旋的原纤维相关胶原)胶原,其拥有几个由非三螺旋结构域分开的三螺旋结构域。纯化IX型胶原的程序可见于(例如)Duance等(1984)Biochem.J.221:885-889;Ayad等(1989)Biochem.J.262:753-761;以及Grant等(1988)The Control of Tissue Damage,Glauert,A.M.编辑,Elsevier Science Publishers,Amsterdam,第3-28页。
X型胶原是α1(X)链的同源三聚体化合物。X型胶原已从(例如)在生长板中发现的肥大软骨中分离出来;参见(例如)Apte等(1992)Eur J Biochem 206(1):217-24。
XI型胶原可在与II型和IX型胶原相关的软骨组织以及身体其他位置中发现。XI型胶原是包含α1(XI)、α2(XI)和α3(XI)链的异源三聚体分子。纯化XI型胶原的方法可见于(例如)Grant等,上文文献。
XII型胶原是发现主要与I型胶原结合的FACIT胶原。XII型胶原是包含三条α1(XII)链的同源三聚体分子。纯化XII型胶原和其变体的方法可见于(例如)Dublet等(1989)J.Biol.Chem.264:13150-13156;Lunstrum等(1992)J.Biol.Chem.267:20087-20092;以及Watt等(1992)J.Biol.Chem.267:20093-20099。
XIII型是在(例如)皮肤、肠、骨、软骨和横纹肌中发现的非原纤维胶原。XIII型胶原的详细描述可见于(例如)Juvonen等(1992)J.Biol.Chem.267:24700-24707。
XIV型是特征为包含α1(XIV)链的同源三聚体分子的FACIT胶原。分离XIV型胶原的方法可见于(例如)Aubert-Foucher等(1992)J.Biol.Chem.267:15759-15764,以及Watt等,上文文献。
XV型胶原在结构上与XVIII型胶原同源。关于天然型XV胶原的结构和分离的信息可见于(例如)Myers等(1992)Proc.Natl.Acad.Sci.USA 89:10144-10148;Huebner等(1992)Genomics 14:220-224;Kivirikko等(1994)J.Biol.Chem.269:4773-4779;以及Muragaki,J.(1994)Biol.Chem.264:4042-4046。
XVI型胶原是在(例如)皮肤、肺纤维母细胞和角质细胞中发现的原纤维相关胶原。关于XVI型胶原的结构以及编码XVI型胶原的基因的信息可见于(例如)Pan等(1992)Proc.Natl.Acad.Sci.USA89:6565-6569;以及Yamaguchi等(1992)J.Biochem.112:856-863。
XVII型胶原是半桥粒跨膜胶原,也称为大疱性类天疱疮抗原。关于XVII型胶原的结构和编码XVII型胶原的基因的信息可见于(例如)Li等(1993)J.Biol.Chem.268(12):8825-8834;以及McGrath等(1995)Nat.Genet.11(1):83-86。
XVIII型胶原在结构上与XV型胶原类似,并且可以从肝中分离出来。XVIII型胶原的结构以及从天然来源分离的描述可见于(例如)Rehn和Pihlajaniemi(1994)Proc.Natl.Acad.Sci USA 91:4234-4238;Oh等(1994)Proc.Natl.Acad.Sci USA 91:4229-4233;Rehn等(1994)J.Biol.Chem.269:13924-13935;以及Oh等(1994)Genomics 19:494-499。
XIX型胶原被认为是FACIT胶原家族的另一成员,并且已在从横纹肌肉瘤细胞分离的mRNA中发现。XIX型胶原的结构和分离的描述可见于(例如)Inoguchi等(1995)J.Biochem.117:137-146;Yoshioka等(1992)Genomics 13:884-886;以及Myers等,J.Biol.Chem.289:18549-18557(1994)。
XX型胶原是FACIT胶原家族新近发现的成员,并已在小鸡角膜中鉴别出来。(例如,参见Gordon等(1999)FASEB Journal 13:A1119;以及Gordon等(1998),IOVS 39:S1128。)
可使用任何类型的胶原,截短的胶原,未改性的或转译后改性的或氨基酸序列修改的胶原,来产生生物制作的材料或生物制作的皮革,所述胶原可通过本文所述的方法原纤维化和交联。生物制作的皮革可以含有基本均匀的胶原,例如仅I型或III型胶原,或可含有2、3、4或更多种不同种胶原的混合物。
重组胶原.
胶原和胶原样蛋白的重组表达由以下已知:Bell,EP 1232182B1,Bovinecollagen and method for producing recombinant gelatin;Olsen等,美国专利号6,428,978,Methods for the production of gelatin and full-length triple helicalcollagen in recombinant cells;VanHeerde等,美国专利号8,188,230,Method forrecombinant microorganism expression and isolation of collagen-likepolypeptides,其公开案是通过引用并入本文中。这种重组胶原尚未用于生产皮革。
原核表达.在原核系统(例如细菌系统)中,可以根据表达多肽的预期用途有利地选择许多表达载体。举例来说,当待产生大量的本发明动物胶原和明胶(例如生成抗体)时,引导高含量的容易纯化的融合蛋白产品表达的载体是所需的。这种载体包括(但不限于)大肠杆菌(E.coli)表达载体pUR278(Ruther等(1983)EMBO J.2:1791),其中编码序列可以与lac Z编码区同框地连接到载体中,使得产生杂合AS-lacZ蛋白;pIN载体(Inouye等(1985)Nucleic Acids Res.13:3101-3109以及Van Heeke等(1989)J.Biol.Chem.264:5503-5509);等,其公开内容通过引用并入本文中。pGEX载体也可用于用谷胱甘肽S-转移酶(GST)将外源多肽表达为融合蛋白。一般来说,这种融合蛋白是可溶的,并且可易于通过吸附到谷胱甘肽-琼脂糖珠粒、然后在游离谷胱甘肽存在下洗脱而从裂解的细胞中纯化。pGEX载体被设计为包括凝血酶或因子Xa蛋白酶裂解位点,以便可以从GST部分释放感兴趣的克隆多肽。重组胶原可包含尚未进行转译后修饰、例如未糖基化或羟基化的胶原分子,或可包括一个或多个转译后修饰,例如促进胶原分子的未成束和随机取向的原纤维的原纤维化和形成的修饰。
重组胶原分子可包含可以形成三聚体胶原原纤维的天然胶原分子或改性的胶原分子或截短的胶原分子的氨基酸序列的片段,所述改性的胶原分子或截短的胶原分子具有与天然胶原氨基酸序列(或与其原纤维形成区或与基本上包含[Gly-X-Y]n)的区段,例如由SEQ ID NO:1、2或3以及由以下登录号描述的Col1A1、Col1A2和Col3A1的氨基酸序列描述的牛胶原的那些:NP_001029211.1(https://_www.ncbi.nlm.nih.gov/protein/77404252,最后登录2017年2月9日)、NP_776945.1(https://_www.ncbi.nlm.nih.gov/protein/27806257,最后登录2017年2月9日)和NP_001070299.1(https://_www.ncbi.nlm.nih.gov/protein/116003881,最后登录2017年2月9日),其以引用并入)至少70、80、90、95、96、97、98或99%相同的氨基酸序列。(这些链接通过在双斜杠后包括下划线而禁用。)
所述重组或改性的胶原分子通常将包含本文所述的重复-(Gly-X-Y)n-序列。
BLASTN可用于鉴别与参考聚核苷酸具有至少70%、75%、80%、85%、87.5%、90%、92.5%、95%、97.5%、98%或99%序列同一性的聚核苷酸序列,例如编码胶原多肽或编码SEQ ID NO:1、2或3的氨基酸序列的聚核苷酸。优化以发现高度相似序列的代表性BLASTN设置使用10的预期阈值和28的字号,在0的查询范围内的最大匹配,1/-2的匹配/失配评分以及线性间隙成本。低复杂度区域可能被过滤或掩蔽。标准核苷酸BLAST的默认设置通过参考以下描述并并入:https://_blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastn&PAGE_TYPE=BlastSearch&LINK_LOC=blasthome(最后登录2017年1月27日)。
BLASTP可用于使用相似性矩阵(例如BLOSUM45、BLOSUM62或BLOSUM80,其中BLOSUM45可用于密切相关的序列,BLOSUM62用于中间范围序列,并且BLOSUM80用于更远缘的相关序列)鉴别与参考氨基酸(例如胶原氨基酸序列)具有至少70%、75%、80%、85%、87.5%、90%、92.5%、95%、97.5%、98%或99%序列同一性或相似性的氨基酸序列。除非另有说明,否则相似性评分将基于BLOSUM62的使用。当使用BLASTP时,相似性百分比是基于BLASTP正性评分,并且序列同一性百分比是基于BLASTP属性评分。BLASTP“属性”显示相同的高评分序列对中总残基的数量和分数;BLASTP“正分”显示对齐分数具有正值并且彼此相似的残基的数量和分数。本公开期望并涵盖与本文公开的氨基酸序列具有这些同一性或相似性程度或任何中等程度的同一性或相似性的氨基酸序列。代表性BLASTP设置使用10的预期阈值,3的字号,BLOSUM 62作为矩阵,以及11(存在)和1(扩展)的空位罚分以及条件组合评分矩阵调整。BLASTP的其他默认设置通过参考在以下获得的公开内容描述并且并入:https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&PAGE_TYPE=BlastSearch&LINK_LOC=blasthome(最后登录2017年1月27日)。
酵母表达.胶原分子可在酵母表达系统中产生。在酵母中,可以使用本领域已知的许多含有组成型或诱导型启动子的载体;Grant等,上文文献,第2卷,第13章;(1987)Expression and Secretion Vectors for Yeast,in Methods in Enzymology,Wu和Grossman编辑,Acad.Press,N.Y.153:516-544;Glover(1986)DNA Cloning,第II卷,IRLPress,Wash.,D.C.,第3章;Bitter(1987)Heterologous Gene Expression in Yeast,inMethods in Enzymology,Berger和Kimmel编辑,Acad.Press,N.Y.152:673-684;以及TheMolecular Biology of the Yeast Saccharomyces,Strathern等编辑,Cold SpringHarbor Press,第I和II卷(1982),其公开内容通过引用并入本文中。
胶原可使用(例如)来自酵母啤酒酵母(Saccharomyces cerevisiae)的宿主细胞来表达。这种特定酵母可以与大量表达载体中的任一种一起使用。常用的表达载体是含有用于在酵母中繁殖的2P复制起点和用于大肠杆菌的Col E1起点用于高效转录外源基因的穿梭载体。这种基于2P质粒的载体的典型实例是pWYG4,其具有2P ORI-STB元件、GAL1-10启动子和2P D基因终止子。在这种载体中,使用Ncol克隆位点插入用于表达多肽的基因,并提供ATG起始密码子。另一表达载体是pWYG7L,其具有完整的2αORI、STB、REP1和REP2以及GAL1-10启动子,并使用FLP终止子。在这种载体中,编码聚核苷酸以其5'末端在BamHI或Ncol位点插入多连接体中。含有插入的聚核苷酸的载体在去除细胞壁后转化到啤酒酵母中以产生原生质体,所述原生质体在用钙和聚乙二醇处理时或通过用锂离子处理完整细胞吸收DNA。
或者,可以通过电穿孔引入DNA。可以使用(例如)亮氨酸、色胺酸、尿嘧啶或组氨酸营养缺陷型宿主酵母细胞以及可选标记物基因(例如LEU2、TRP1、URA3、HIS3或LEU2-D)来选择转化体。
在一个实施方案中,将编码胶原的聚核苷酸引入毕赤氏酵母的宿主细胞中。非糖酵母属酵母(例如巴斯德毕赤酵母(Pichia pastoris))在放大程序中似乎具有产生高产率重组蛋白的特殊优点。另外,毕赤氏酵母属表达试剂盒可从Invitrogen公司(San Diego,CA)获得。
甲基营养型酵母(例如巴斯德毕赤酵母)中有许多甲醇应答基因,每个基因的表达受甲醇应答调节区域(还称为启动子)控制。所述甲醇应答启动子中的任一种都适用于本发明的实践。特定调节区域的实例包括AOX1启动子、AOX2启动子、二羟基丙酮合酶(DAS)、P40启动子和来自巴斯德毕赤酵母的过氧化氢酶基因的启动子等。
也已使用甲基营养型酵母多形汉逊酵母(Hansenula polymorpha)。甲醇上的生长了诱导甲醇代谢的关键酶,例如MOX(甲醇氧化酶)、DAS(二羟基丙酮合酶)和FMDH(甲酸脱氢酶)。这些酶可占总细胞蛋白的30-40%。编码MOX、DAS和FMDH产生的基因受强启动子控制,所述启动子由甲醇上的生长诱导并由葡萄糖上的生长抑制。这些启动子的任何或全部三个可用于获得多形汉逊酵母中异源基因的高水平表达。因此,在一方面中,在可诱导型多形汉逊酵母启动子的控制下,将编码动物胶原的聚核苷酸或其片段或变体克隆到表达载体中。如果需要分泌产物,则将编码在酵母中分泌的信号序列的聚核苷酸与所述聚核苷酸同框地融合。在又一实施方案中,表达载体优选含有营养缺陷型标记物基因,例如URA3或LEU2,其可用于补充营养缺陷型宿主的缺陷。
然后使用本领域技术人员已知的技术使用表达载体以转化多形汉逊酵母宿主细胞。多形汉逊酵母转化的一个有用特征是将表达载体的最多100个拷贝自发整合到基因组中。在大部分情形下,整合的聚核苷酸形成展现头对尾排列的多聚体。即使在非选择性条件下,整合的外源聚核苷酸在若干重组菌株中也显示有丝分裂稳定。这种高拷贝整合现象进一步增加了系统的高生产力潜力。
真菌表达.丝状真菌也被用于产生现在的多肽。丝状真菌中表达和/或分泌重组蛋白的载体是众所周知的,并且所属领域技术人员可以使用这些载体表达本发明的重组动物胶原。
植物表达.已经在植物或植物细胞中产生动物胶原。在使用植物表达载体的情形下,编码本发明胶原的序列的表达可以由许多启动子中的任一者驱动。举例来说,可以使用病毒启动子,例如CaMV的35S RNA和19S RNA启动子(Brisson等(1984)Nature 310:511-514)或TMV的外壳蛋白启动子(Takamatsu等(1987)EMBO J.6:307-311);或者,可以使用植物启动子,例如RUBISCO的小的亚单位(Coruzzi等(1984)EMBO J.3:1671-1680;Broglie等(1984)Science 224:838-843);或热休克启动子,例如大豆hsp17.5-E或hsp17.3-B(Gurley等(1986)Mol.Cell.Biol.6:559-565)。这些构造体可以通过本领域技术人员已知的多种方法、例如通过使用Ti质粒、Ri质粒、植物病毒载体、直接DNA转化、显微注射、电穿孔等引入植物细胞中。关于这些技术的综述,参见(例如)Weissbach&Weissbach,Methods for PlantMolecular Biology,Academic Press,NY,Section VIII,第421-463页(1988);Grierson和Corey,Plant Molecular Biology,第2版,Blackie,London,第7-9章(1988);TransgenicPlants:A Production System for Industrial and Pharmaceutical Proteins,Owen和Pen编辑,John Wiliey&Sons,1996;Transgenic Plants,Galun和Breiman编辑,ImperialCollege Press,1997;以及Applied Plant Biotechnology,Chopra,Malik和Bhat编辑,Science Publishers公司,1999。
植物细胞不会自然产生足够量的转译后酶以有效产生稳定的胶原。因此,在需要羟基化的情况下,用于表达动物胶原的植物细胞补充有必需的转译后酶以充分产生稳定的胶原。在本发明的优选实施方案中,转译后酶是脯氨酰基4-羟化酶。
通过从植物或植物细胞中提供生质来实现在植物系统中产生动物胶原的方法,其中植物或植物细胞包含至少一个可操作地连接到启动子以实现多肽的表达的编码序列,并且然后从生质中提取多肽。或者,多肽可以是非提取的,例如,表达到胚乳中。
植物表达载体和报道基因在本领域中通常是已知的;参见(例如)Gruber等(1993),Methods of Plant Molecular Biology and Biotechnology,CRC Press。通常,表达载体包含例如重组或合成生成的核酸构造体,并且包含在植物细胞中起作用的启动子,其中所述启动子可操作连接到编码动物胶原的核酸序列或其片段或变体,或对胶原的生物合成重要的转译后酶。
启动子驱动植物中蛋白质表达的水平。为了在植物中产生期望水平的蛋白质表达,表达可以在植物启动子的指导下进行。适于使用的启动子通常在本领域中可获得;参见(例如)PCT公开号WO 91/19806。可使用的启动子的实例包括非组成型启动子或组成型启动子。这些启动子包括(但不限于)核酮糖-1,5-双磷酸羧化酶的小亚单位的启动子;来自肿瘤诱导的根癌土壤杆菌(Agrobacterium tumefaciens)的质粒的启动子,例如RUBISCO胆酯碱合酶(NOS)和章鱼碱合酶启动子;细菌T-DNA启动子,例如mas和ocs启动子;以及病毒启动子,例如花椰菜嵌纹病毒(CaMV)19S和35S启动子或玄参嵌纹病毒35S启动子。
聚核苷酸序列可以置于组成型启动子的转录控制下,从而引导植物的大部分组织中胶原或转译后酶的表达。聚核苷酸序列在花椰菜嵌纹病毒(CaMV)35S启动子的控制下。双链花椰菜花叶病毒科为植物中转基因表达提供了最重要的单一启动子表达,特别是35S启动子;参见(例如)Kay等(1987)Science 236:1299。来自这个家族的其他启动子(例如玄参嵌纹病毒启动子等)已经描述于本领域中,并且也可以被使用;参见(例如)Sanger等(1990)Plant Mol.Biol.14:433-443;Medberry等(1992)Plant Cell 4:195-192;以及Yin和Beachy(1995)Plant J.7:969-980。
聚核苷酸构造体中用于表达胶原的启动子,如果需要可以进行改性以影响其控制特征。举例来说,CaMV启动子可以接合到RUBISCO基因的一部分,以生成在叶中有活性而在根中无活性的启动子,所述基因在没有光照的情况下抑制RUBISCO的表达。如本文所述可以使用所得嵌合启动子。
具有本领域已知的一般表达性质的组成型植物启动子可以与本发明的表达载体一起使用。这些启动子在大部分植物组织中大量表达,并且包括(例如)肌动蛋白启动子和泛蛋白启动子;参见(例如)McElroy等(1990)Plant Cell 2:163-171;以及Christensen等(1992)Plant Mol.Biol.18:675-689。
或者,多肽可以在特定组织、细胞类型中或在更精确的环境条件或发育控制下表达。引导在这些情况下表达的启动子称为可诱导型启动子。在使用组织特异性启动子的情形下,蛋白质表达在需要提取蛋白质的组织中特别高。根据所需的组织,表达可以靶向胚乳、糊粉层、胚芽(或其作为盾片和子叶的部分)、果皮、茎、叶块茎、根等。已知组织特异性启动子的实例包括指向块茎的I类马铃薯块茎储藏蛋白(patatin)启动子、与马铃薯块茎ADPGPP基因相关的启动子、驱动指向种子的转录的β-伴大豆球蛋白(7S蛋白)的大豆启动以及来自玉蜀黍胚乳的玉米醇溶蛋白基因的指向种子的启动子;参见(例如)Bevan等(1986)Nucleic Acids Res.14:4625-38;Muller等(1990)Mol.Gen.Genet.224:136-46;Bray(1987)Planta 172:364-370;以及Pedersen等(1982)Cell 29:1015-26。
胶原多肽可以借助基于种子的产生技术在种子(例如芸苔、玉米、大豆、稻谷和大麦种子)中产生。在所述过程中,例如,在种子发芽期间回收产物;参见(例如)PCT公开号WO9940210;WO 9916890;WO 9907206;美国专利号5,866,121;美国专利号5,792,933;以及其中引用的所有参考文献。可用于引导多肽表达的启动子可以是异源的或非异源的。这些启动子也可以用于驱动反义核酸的表达以降低、增加或改变目前动物胶原在所需组织中的浓度和组成。
可增加和/或最大化植物或植物细胞中的转录多肽的其他修饰是标准的并且是本领域技术人员已知的。例如,包含编码重组动物胶原的聚核苷酸序列或其片段或变体并且可操作连接到启动子的载体可进一步包含至少一个改变胶原或相关转译后酶的转录速率的因子,包括但不限于肽输出信号序列、密码子使用、内含子、多聚腺苷酸化和转录终止位点。修饰构造体以增加植物中表达水平的方法在本领域中通常是已知的;参见(例如)Rogers等(1985)J.Biol.Chem.260:3731;以及Cornejo等(1993)Plant Mol Biol 23:567-58。在影响胶原和相关转译后酶的转录速率的对植物系统的工程改造中,本领域已知的各种因子(包括调节序列,例如正或负作用序列;增强子和沉默子,以及染色质结构)可影响植物中的转录速率。当表达重组动物胶原时,可以利用这些因子中的至少一种,包括(但不限于)上述胶原类型。
包含聚核苷酸的载体通常将包含赋予植物细胞可选表型的标记物基因。通常,可选标记物基因将编码抗生素抗性,其中合适的基因包括至少一组编码抗生素大观霉素(spectinomycin)抗性的基因、编码链霉素(streptomycin)抗性的链霉素磷酸转移酶(SPT)基因、编码康霉素(kanamycin)或建那霉素(geneticin)抗性的新霉素(neomycin)磷酸转移酶(NPTH)基因、编码用于抑制乙酰乳酸合酶(ALS)的作用的除草剂(特别是磺酰脲型除草剂)抗性的潮霉素(hygromycin)抗性基因;例如含有导致这种抗性的突变(特别是S4和/或Hra突变)的乙酰乳酸合酶(ALS)基因、编码用于抑制谷氨酰胺合酶的作用的除草剂例如草铵膦或草安宁(basta)抗性的基因;例如bar基因或本领域已知的其他类似基因。bar基因编码对除草剂草安宁的抗性,nptII基因编码对抗生素康霉素和建那霉素的抗性,并且ALS基因编码对除草剂氯磺隆的抗性。
用于在植物中表达外源基因的典型载体在本领域中是众所周知的,包括但不限于来源于肿瘤诱导(Ti)的根癌土壤杆菌的质粒的载体。这些载体是在转化时将一部分DNA整合到宿主植物的基因组中的植物整合载体;参见(例如)Rogers等(1987)Meth InEnzymol.153:253-277;Schardl等(1987)Gene 61:1-11;以及Berger等,Proc.Natl.Acad.Sci.U.S.A.86:8402-8406。
包含编码多肽的序列的载体和包含转译后酶或其亚单位的载体可共引入所需的植物中。转化植物细胞的程序可用于本领域中,例如,直接基因转移、活体外原生质体转化、植物病毒介导的转化、脂质体介导的转化、显微注射、电穿孔、土壤杆菌属介导的转化以及粒子轰击;参见(例如)Paszkowski等(1984)EMBO J.3:2717-2722;美国专利号4,684,611;欧洲申请号0 67 553;美国专利号4,407,956;美国专利号4,536,475;Crossway等(1986)Biotechniques 4:320-334;Riggs等(1986)Proc.Natl.Acad.Sci USA 83:5602-5606;Hinchee等(1988)Biotechnology 6:915-921;以及美国专利号4,945,050。)(例如)稻谷、小麦、玉米、高粱和大麦的标准转化方法描述于本领域中;参见(例如)Christou等(1992)Trends in Biotechnology 10:239和Lee等(1991)Proc.Nat’l Acad.Sci.USA 88:6389。小麦可通过与用于转化玉米或稻谷相似的技术进行转化。此外,Casas等(1993)Proc.Nat’lAcad.Sci.USA 90:11212描述转化高粱的方法,而Wan等(1994)Plant Physiol.104:37教导转化大麦的方法。适合于玉米转化的方法由Fromm等(1990)Bio/Technology 8:833以及Gordon-Kamm等(上文文献)提供。
本领域中确立可用于生成产生动物胶原的植物的其他方法;参见(例如)美国专利号5,959,091;美国专利号5,859,347;美国专利号5,763,241;美国专利号5,659,122;美国专利号5,593,874;美国专利号5,495,071;美国专利号5,424,412;美国专利号5,362,865;美国专利号5,229,112;美国专利号5,981,841;美国专利号5,959,179;美国专利号5,932,439;美国专利号5,869,720;美国专利号5,804,425;美国专利号5,763,245;美国专利号5,716,837;美国专利号5,689,052;美国专利号5,633,435;美国专利号5,631,152;美国专利号5,627,061;美国专利号5,602,321;美国专利号5,589,612;美国专利号5,510,253;美国专利号5,503,999;美国专利号5,378,619;美国专利号5,349,124;美国专利号5,304,730;美国专利号5,185,253;美国专利号4,970,168;欧洲公开号EPA 00709462;欧洲公开号EPA00578627;欧洲公开号EPA 00531273;欧洲公开号EPA 00426641;PCT公开号WO 99/31248;PCT公开号WO 98/58069;PCT公开号WO 98/45457;PCT公开号WO 98/31812;PCT公开号WO98/08962;PCT公开号WO 97/48814;PCT公开号WO 97/30582;以及PCT公开号WO 9717459。
昆虫表达.胶原的另一替代表达系统是昆虫系统。杆状病毒是昆虫细胞中大量产生各种重组蛋白的高效表达载体。可采用如Luckow等(1989)Virology 170:31-39以及Gruenwald,S.和Heitz,J.(1993)Baculovirus Expression Vector System:Procedures&Methods Manual,Pharmingen,San Diego,CA中所描述的方法来构造含有用于本发明胶原的胶原编码序列和适当的转录/转译控制信号的表达载体。举例来说,在昆虫细胞中通过感染编码多肽的杆状病毒载体实现蛋白质的重组产生。具有稳定三螺旋的重组胶原、胶原样或胶原多肽的产生可以涉及用三种杆状病毒共感染昆虫细胞,一种编码待表达的动物胶原并且一种各自编码脯氨酰基4-羟基酶的α亚单位和β亚单位。这种昆虫细胞系统允许大量产生重组蛋白。在一个所述系统中,加州苜蓿夜蛾(Autographa californica)核多角体病毒(AcNPV)用作载体以表达外源基因。这种病毒在草地贪夜蛾(Spodoptera frugiperda)细胞中生长。可将胶原或胶原样多肽的编码序列克隆到病毒的非必需区域(例如多面体基因)中并置于AcNPV启动子(例如多面体启动子)的控制下。编码序列的成功插入将导致多面体基因失活和产生非封闭型重组病毒;例如,缺乏由多面体基因编码的蛋白质外壳的病毒。然后使用这些重组病毒感染其中表达插入的基因的草地贪夜蛾细胞;参见(例如)Smith等(1983)J.Virol.46:584;以及美国专利号4,215,051。这种表达系统的实例可见于(例如)上述Ausubel等。
动物表达.在动物宿主细胞中,可以利用许多表达系统。在使用腺病毒作为表达载体的情形下,可将编码胶原或胶原样多肽的聚核苷酸序列接合到腺病毒转录/转译控制复合物,例如晚期启动子和三联前导序列。然后可通过活体外或活体内重组将这个嵌合基因插入腺病毒基因组中。插入病毒基因组的非必需区域(例如区域E1或E3)将产生活的并且能够在受感染的宿主中表达编码的多肽的重组病毒;参见(例如)Logan和Shenk,Proc.Natl.Acad.Sci.USA 81:3655-3659(1984)。或者,可以使用牛痘7.5K启动子;参见(例如)Mackett等(1982)Proc.Natl.Acad.Sci.USA 79:7415-7419;Mackett等(1982)J.Virol.49:857-864;以及Panicali等(1982)Proc.Natl.Acad.Sci.USA 79:4927-4931。
哺乳动物宿主细胞中的优选表达系统是塞姆利基森林病毒(Semliki Forestvirus)。哺乳动物宿主细胞(例如,幼小仓鼠肾(BHK)细胞和中国仓鼠卵巢(CHO)细胞)的感染可以产生非常高的重组表达水平。塞姆利基森林病毒是一种优选的表达系统,这是因为所述病毒具有广泛的宿主范围,使得哺乳动物细胞系的感染成为可能。更特定来说,塞姆利基森林病毒可用于多种宿主,这是因为所述系统不基于染色体整合,并且因此在旨在鉴别结构功能关系并测试各种杂合分子的效应的研究中提供了更容易获得重组动物胶原的修饰的方法。用于构造塞姆利基森林病毒载体用于在哺乳动物宿主细胞中表达外源蛋白质的方法描述于(例如)Olkkonen等(1994)Methods Cell Biol 43:43-53中。
非人类转基因动物也可用于表达多肽。所述系统可以通过将本发明的聚核苷酸可操作地连接到启动子以及能够在乳腺中实现表达的其他所需或任选调节序列来构造。同样,所需或任选转译后酶可在采用合适的表达系统在靶细胞中同时产生。使用非人类转基因动物以重组产生蛋白质的方法为本领域已知;参见(例如)美国专利号4,736,866;美国专利号5,824,838;美国专利号5,487,992;以及美国专利号5,614,396。
描述重组胶原产生的以上章节中引用的参考文献均通过引用并入本文。尽管有现有技术的教导,但仍然需要具有增加的胶原产生和增加的胶原稳定性的酵母菌株。
发明概要
在其他实施方案中,本发明涉及遗传改造以产生非羟基化胶原的酵母菌株。在替代实施方案中,本发明提供用以产生羟基化胶原的改造的酵母菌株。在一个实施方案中,本发明提供包括产生胶原、启动子和/或羟基化酶所必需的DNA的全合一载体。还提供产生非羟基化或羟基化胶原的方法。
附图简述
图1显示了设计用于产生非羟基化胶原的MMV 63的矢量图。
图2显示了设计用于产生非羟基化胶原的MMV 77的矢量图。
图3显示了设计用于产生非羟基化胶原的MMV 129的矢量图。
图4显示了设计用于产生非羟基化胶原的MMV 130的矢量图。
图5显示了设计用于产生羟基化胶原的MMV 78的矢量图。
图6显示了设计用于产生羟基化胶原的MMV 94的矢量图。
图7显示了设计用于产生羟基化胶原的MMV 156的矢量图。
图8显示了设计用于产生羟基化胶原的MMV 191的矢量图。
图9显示了设计用于产生非羟基化或羟基化胶原的全合一载体MMV 208。
图10显示了MMV84的矢量图。
图11显示了MMV150的矢量图。
图12显示了MMV140的矢量图。
发明详述
本发明利用酵母来产生胶原。合适的酵母包括(但不限于)阿叙拉属(Arxula)、假丝酵母属(Candida)、驹形氏酵母属(Komagataella)、毕赤氏酵母属(Pichia)、汉逊酵母属(Hansenula)、欧伽铁酵母属(Ogataea)、糖酵母属(Saccharomyces)、隐球菌属(Cryptococcus)和其组合。可使酵母改性或杂交。杂交的酵母是相同属的相同种、不同种的不同菌株或不同属的菌株的混合育种。
外源DNA插入到酵母基因组中或维持游离型以产生胶原。通过载体将胶原的DNA序列引入酵母中。本领域已知,对DNA的修饰(例如密码子优化)可以提高酵母转译DNA的能力和效率。外源DNA是任何非酵母宿主DNA,并且包括(例如但不限于)哺乳动物、隐杆线虫和细菌。用于酵母中胶原产生的合适的哺乳动物DNA包括(但不限于)牛、猪、袋鼠、钝吻鳄、鳄鱼、大象、长颈鹿、斑马、骆马、羊驼、羔羊、恐龙和其组合。
DNA插在载体上,合适的载体包括(但不限于)pHTX1-BiDi-P4HA-Pre-P4HB hygro、pHTX1-BiDi-P4HA-PHO1-P4HB hygro、pGCW14-pGAP1-BiDi-P4HA-Prepro-P4HB G418、pGCW14-pGAP1-BiDi-P4HA-PHO1-P4HB Hygro、pDF-Col3A1优化的吉欧霉素(Zeocin)、pCAT-Col3A1优化的吉欧霉素、具有AOX1着陆垫的pDF-Col3A1优化的吉欧霉素、pHTX1-BiDi-P4HA-Pre-Pro-P4HB hygro。载体通常包括至少一个用于DNA线性化的限制位点。
本领域已知启动子可以改善蛋白质的产生。启动子是载体中包括的DNA序列。适用于本发明的启动子包括(但不限于)AOX1甲醇诱导的启动子、PDF脱阻抑启动子、PCAT脱阻抑启动子、Das1-Das2甲醇诱导的双向启动子、PHTX1组成型双向启动子、CHO组织蛋白启动子、PGCW14-PGAP1组成型双向启动子和其组合。
在纳入酵母中的载体中利用的每个开放阅读框的末尾都需要终止子。终止子的DNA序列插入到载体中。
复制起点是起始复制所必需的。复制起点的DNA序列插入载体中。可另外游离型地维持载体。
含有与酵母基因组同源性的DNA序列是必需的,并且纳入载体中。
选择标记物用于选择已成功转化的酵母细胞。标记物有时与抗生素抗性有关。标记物还可能与在具有或不具有某些氨基酸的情况下生长的能力有关(营养缺陷型标记物)。合适的营养缺陷型标记物包括(但不限于)ADE、HIS、URA、LEU、LYS、TRP和其组合。选择标记物的DNA序列纳入载体中。
在转化后修饰之前,胶原是非羟基化的并在高胃蛋白酶浓度存在下降解,例如1:200胃蛋白酶可用于使胶原的N-末端和C-末端前肽裂解以能够原纤维化,这使胶原转化成生物制作的材料。因此,提供羟基化胶原是有用的。为了能够产生羟基化胶原,可能需要至少一种第二蛋白质。这种第二蛋白质是称为脯氨酰基4-羟基亚单位α-1(下文称为“P4HA1”)和脯氨酰基4-羟基亚单位β(下文称为“P4HB”)的酶。可以将P4HA1和P4HB DNA插入载体上的酵母中以使胶原羟基化。羟基化胶原与非羟基化胶原相比具有更好的热稳定性,并且对高浓度胃蛋白酶消化(例如1:25到1:1的总蛋白与胃蛋白酶比率)具有抗性。
上述改造的酵母需要多个载体,并且将载体加载到细胞中的过程中的每个步骤可能非常耗时。多个载体也携带多个选择标记物,此使得在添加新DNA时难以重复使用标记物。惊奇地发现,“全合一载体”可以利用胶原的DNA和P4HA和P4HB的DNA结合在单一载体上构造而成。启动子和信号序列可以模块化地添加到指定的克隆位点。根据启动子的存在或不存在,可以将DNA插入酵母中用于羟基化或非羟基化胶原。全合一载体包括用于线性化以将DNA插入酵母中的位点,包括随机和定点整合到基因组中。
术语“胶原”是指任何一种已知的胶原类型,包括I至XX型胶原;以及任何其他胶原,无论是天然的、合成的、半合成的还是重组的。其包括本文所述的所有胶原、改性的胶原和胶原样蛋白。本术语还涵盖包含基序(Gly-X-Y)n的前胶原和胶原样蛋白或胶原蛋白质,其中n是整数。其涵盖胶原和胶原样蛋白的分子、胶原分子的三聚物、胶原的原纤维和胶原原纤维的纤维。它也指化学、酶学或重组改性的可原纤维的胶原或胶原样分子,以及能够组装成纳米纤维的胶原、胶原样分子和胶原分子的片段。
在一些实施方案中,胶原或胶原样蛋白中的氨基酸残基(例如赖氨酸和脯胺酸)可能未羟基化或可能具有比相应的天然或未改性的胶原或胶原样蛋白更低或更高程度的羟基化。在其他实施方案中,胶原或胶原样蛋白中的氨基酸残基可能未糖基化或可能具有比相应的天然或未改性的胶原或胶原样蛋白更低或更高程度的糖基化。
胶原组合物中的胶原可以均匀地含有单一类型的胶原分子,例如100%I型牛胶原或100%III型牛胶原,或可以含有不同种类的胶原分子或胶原样分子的混合物,例如牛I型和III型分子的混合物。所述混合物可包括>0%、10、20、30、40、50、60、70、80、90、95、99或<100%的各个胶原或胶原样蛋白组分。这个范围包括所有中间值。举例来说,胶原组合物可含有30%I型胶原和70%III型胶原,或可含有33.3%I型胶原、33.3%II型胶原和33.3%III型胶原,其中胶原的百分比是基于组合物中胶原的总质量或基于胶原分子的分子百分比。
上述改造的酵母细胞可用于产生胶原。为此,将细胞置于发酵室或桶内的培养基中,并供给溶解的氧和碳源,在受控的pH条件下持续12小时至1周范围的时间段。合适的培养基包括(但不限于)缓冲的甘油复合培养基(BMGY)、缓冲的甲醇复合培养基(BMMY)和酵母提取物蛋白胨右旋糖(YPD)。由于胶原在酵母细胞中产生的事实,为了分离胶原,必须使用酵母的分泌菌株或溶解酵母细胞以释放胶原。然后可以通过诸如离心、沉淀等已知技术纯化胶原。
本文公开的胶原使得可产生生物制作的皮革。将胶原转化成生物制作的皮革的方法教导于以下中:共同未决的专利申请案美国申请号15/433566、15/433650、15/433632、15/433693、15/433777、15/433675、15/433676和15/433877,其公开内容通过引用并入本文中。
本发明的实施方案
本发明包括(但不限于)遗传改造的酵母菌株以及产生胶原的方法。
在第一实施方案中,本发明涉及产生非羟基化胶原的酵母菌株,所述酵母菌株包括酵母宿主;靶蛋白的重组DNA;以及启动子。
在第二实施方案中,本发明涉及产生羟基化胶原的酵母菌株,所述酵母菌株包括酵母宿主;靶蛋白的重组DNA;第二靶蛋白的DNA;以及启动子。
在第三实施方案中,本发明涉及全合一载体,其包括靶蛋白的DNA;第二靶蛋白的DNA;以及至少一个启动子的DNA。实例:明胶,胶原I,并引入超过一个基因。
在第四实施方案中,本发明涉及制备胶原的方法。
在第五实施方案中,本发明涉及制备羟基化胶原的方法。
实施方案的详细描述
如本文所用术语DNA意指脱氧核糖核酸。
如本文所用术语效价意指所产生靶蛋白的量。
如本文所用术语生物制作的皮革意指使用生物学、工程学和设计产生具有皮革样性质的材料。
如本文所用术语全合一载体意指包括产生所需重组蛋白所必需的所有DNA的载体。
如本文所用术语稳定的胶原意指在暴露于高浓度胃蛋白酶后至少75%的胶原初始浓度仍存在。
以下非限制性实例用于说明本发明。本发明的范围不限于在这些实施例中描述的细节。
实施例1
打算产生重组胶原的酵母.
获得来自DNA 2.0的野生型巴斯德毕赤酵母。将包括胶原序列的MMV 63(序列9)DNA序列插入野生型巴斯德毕赤酵母中,其生成菌株PP28。将MMV63用Pme I消化并转化到PP1(野生型巴斯德毕赤酵母菌株)中以生成PP28。载体MMV63显示于图1中。
对天然牛胶原进行测序(序列1)并使用以下聚合酶链式反应“PCR”方案使所述序列扩增以生成线性DNA序列:
PfuUltra II融合HS DNA聚合酶方案
对于50ul反应:
*所属领域技术人员了解,可基于待扩增的DNA使用多种引物。
对<10kb DNA进行温度循环器方案:
95C达2min,30个循环的95C达20秒、[引物熔融温度-5C]达20秒
如果<1kb,则72C达15秒,否则15sec/kB,72C达3min,以及永远4C。
按照Gibson程序克隆线性DNA,如下:
对于2-3个片段,使用0.02-0.5pmol DNA。对于4-6个片段,使用0.2-1.0pmol DNA。
Pmol=(以ng表示的重量)×1000/(碱基对×650道尔顿)
或使用NEBioCalculator
优化效率是50-100ng载体,具有2-3倍过量插入物(如果<200bp,则使用5倍过量)。PCR片段的总体积不应超过20%。
1.设置以下反应:
2.于50C下在温度循环器中孵育15min(2-3个片段)或60min(4-6个片段)。转化前存储在冰上或-20C下
3.用2ul组装反应物转化NEB 5-α细胞。
按照以下程序将克隆转化到大肠杆菌中:
-使50ul感受态细胞(通常5α)在冰上解冻
-添加2ul体积的10-100ng DNA
-在冰上静置5min
-于42C下热冲击10秒
-在冰上静置5min
-同时,准备管或板具有1ml超级最佳肉汤,所述肉汤具有分解代谢阻抑(“SOC”)液体培养基
-将感受态细胞转移到适当的管或孔板中
-在37C下振荡1小时以过度生长
-同时,标记板并放在37C孵育器中进行预热。
-以10,000g旋转30s以使细胞浓缩在底部
-去除并弃去800ul SOC。应具有约200ul剩余
-将全部200ul添加到室温琼脂板中。或者,将10%(20ul)添加到板1,并将90%(180ul)添加到板2。
-使用无菌玻璃珠铺在板上。
-在37C下孵育过夜
使转化的细胞生长到群落中,并根据以下程序进行大肠杆菌群落PCR:
GoTaq格林混合母液方案(Taq聚合酶)
对于20ul反应:
组分 体积 最终浓度
GoTaq格林混合母液2x 10ul 1倍
引物1,5uM 1ul 0.1uM
引物2,5uM 1ul 0.1uM
群落 一牙签
8ul
温度循环器方案:
95C达2min
28个循环的
----------------
95C达30秒
[引物熔融温度-5C]达30秒
72C达1分钟/kB
----------------
72C达5min
永远4C
为了筛选群落用于转化的有效性,按照如下所述进行琼脂糖DNA凝胶程序:
为了准备x%琼脂糖凝胶(通常8-12%):
1.测量Xg琼脂糖以达到所需的百分比。1g=1ml。举例来说,为了制备1%凝胶,测量1g琼脂糖加入100ml Tris碱、乙酸和乙二胺四乙酸缓冲液(“TAE”)中
2.将琼脂糖添加到250ml烧瓶中
3.达到100ml TAE缓冲液,或所需的体积
4.微波处理直至液体澄清。对于100ml的1%,这需要约1分30秒。
5.将SYBR Safe DNA染料添加到1倍(其是10,000倍,所以添加总琼脂糖的体积(以ml表示)/10以得到总的ul添加量。举例来说,如果具有100ml琼脂糖,则添加10ul)
6.倒入模具中。请记住添加孔槽。
7.等待45min到1hr使凝胶干燥。
为了运行凝胶:
1.从干燥的凝胶上移除孔模具
2.移除凝胶+塑料支架(不要从塑料支架上取下凝胶)并转移到凝胶盒中
3.将TAE倒在凝胶上以使其完全浸没
4.加载10-20ul梯。100ng应足以可视化。
5.加载DNA样品(在与凝胶加载染料混合后)。凝胶加载染料为6倍,并且应稀释到1倍以加载样品(如:混合4ul染料+20ul DNA并加样全部24ul)。利用格林混合母液进行PCR的DNA已经将染料纳入混合物中,并且不需要添加染料。100ng应足以可视化。一些样品可能需要稀释。
6.将有线顶部放在凝胶盒上。负极(黑色)应在具有孔的一侧。
7.将凝胶盒插入电源中。在100-120的电压下运行10-30min。
*染料与DNA相反(朝着(-)电荷)迁移。这就是为什么长时间/多次运行凝胶是不明智的,并且你将无法看到任何东西。不要重复使用凝胶。相反倒入新的。也可以将染料放入缓冲液本身中,这可能有助于可视化。
为了从大肠杆菌纯化载体,按照制造商的方案,如Zymo Researh微型制剂试剂盒中所述利用DNA制剂试剂盒。
根据供应商的方案,由Genewiz或Eurofins进行Sanger测序。结果证实,在获得转化的克隆后,DNA序列是正确的。
如制造商的方案中所述,使用Midi制剂试剂盒进行大规模DNA制备。从ZymoResearch获得试剂盒。结果显示产生了大量的环状DNA或质粒。
使用Restriction Digestion Guide(来自Addgene)如下所述将质粒转化为线性DNA:
选择限制酶来消化质粒。
注意:为了确定哪种限制酶会剪切您的DNA序列(以及它们将切割的位置),请使用序列分析程序,例如Addgene的序列分析仪。
通过阅读酶的说明来确定适当的反应缓冲液。
注意:如果正在执行双酶消化(同时消化两种酶),则需要确定适于酶的最佳缓冲液。大多数公司将具有相容性图表,例如来自NEB的双酶消化查找工具。如果找不到适于两种酶的缓冲液,则需要首先在酶1的缓冲液中消化一种酶,重新纯化切割的质粒,并且然后在酶2的缓冲液中执行第二次消化。
在1.5mL管中合并以下物质:
DNA
限制酶
缓冲液(1倍)
BSA(如果制造商建议)
dH2O补足到总体积
注意:切割的DNA量取决于应用。诊断消化物通常涉及约500ng的DNA,而分子克隆通常需要1-3μg的DNA。总反应体积通常在10-50μL之间变化,这取决于应用,并且主要由待切割的DNA的体积决定。
注意:请参阅下面的提示和常见问题解答部分,了解确定所使用的限制酶体积的注意事项。
注意:典型的限制消化反应可似如下:
1μg DNA
1μL每种限制酶
3μL 10倍缓冲液
3μL 10倍BSA(如果建议)
xμL dH2O(使总体积达到30μL)
通过移液轻轻混合。
在适当的温度(通常37℃)下将管孵育1小时。始终遵守制造商的说明书。
注意:根据应用和反应中DNA的量,孵育时间可在45min到过夜的范围内。
如下所述使用苯酚-氯仿DNA提取和纯化程序纯化DNA:
材料
1. 3M NaOAc(乙酸钠)
2. 100%乙醇,冷
3. 70%乙醇,冷
4.苯酚-氯仿-异戊醇,比率为25:24:1
程序
1.将10%体积的NaOAc添加到DNA(如:50ul到500ul)
2.添加等体积的苯酚-氯仿-异丙醇,小心从底部/较重相取出;涡旋
3.以12,000g离心5min
4.将顶部相转移到新的管中
5.添加2.5体积的冷的100%乙醇,涡旋。如果有很多DNA,液体应该看起来浑浊。
6.在-80C下放置10分钟,或放在干冰上
7.如果可能,在4C下以最大速度离心10分钟。移出大部分上清液(留下约50ul)
8.用1ml冷的70%乙醇洗涤,添加洗涤而不需要额外的机械作用(不要主动干扰颗粒)。
9.以最大速度离心5min
10.移出大部分70%乙醇;风干10-30min
11.重新悬浮于20-30ul水或TE缓冲液中
注意:
微量离心管的优化体积:
○400ul DNA
○40ul NaOAc
○440ul苯酚-氯仿-异戊醇
○顶部相回收约400ul
○添加1ml 100%ETOH
根据以下程序将DNA转变到酵母细胞中:
毕赤氏酵母属电穿孔方案(Bio-Rad Gene Pulser XcellTM总系统号1652660)
将毕赤氏酵母属菌株–来自的DNA2.0野生型毕赤氏酵母属用P4HA/B共表达质粒转化并在Hygro板上进行选择(200ug/ml)。4号克隆
1.将单个群落接种到100ml YPD培养基中并在30度下在振荡(215rpm)下过夜生长。
2.次日,培养物达到OD600约3.5(约3-5×107个细胞/OD600)。将培养物用新鲜的YPD稀释到OD600约1.7,并在30度下在振荡(215rpm)下再生长一小时。
3.将细胞以3,500g离心5min;用水洗涤一次并重新悬浮于10mM Tris-HCl(pH7.5)、100mM LiAc、10mM DTT(新鲜添加)、0.6M山梨醇中
4.对于每次转化,将8×108个细胞等分到8ml 10mM Tris-HCl(pH 7.5)、100mMLiAc、10mM DTT、0.6M山梨醇中,并在室温下孵育30min。
5.将细胞以5000g离心5min,并用冰冷的1.5ml 1M山梨醇洗涤3次,并重新悬浮于80ul冰冷的1M山梨醇中
6.向细胞中添加各种量(约5ug)的线性化DNA并通过移液进行混合。
7.将细胞和DNA混合物(80-100ul)添加到0.2cm比色管中并使用毕赤氏酵母属方案(1500v,25uF,200Ω)脉冲。
8.立即将细胞转移到1ml YPD和1M山梨醇的混合物(1:1)中并在30度下孵育>2小时
9.以不同密度平铺细胞。
将单个群落接种到24深孔板中的2mL BMGY培养基中,并在30摄氏度下在900rpm振荡下生长至少48小时。按照以下程序使用细胞裂解、SDS-page和胃蛋白酶测定测试所得细胞的胶原。
使用以下程序裂解细胞:
制备1倍裂解缓冲液。以下配方适用于制备50个样品的组合。
2.5ml 1M HEPES;最终浓度为50mM。
438.3mg NaCl;最终浓度为150mM。
5ml甘油;最终浓度为10%。
0.5ml Triton X-100;最终浓度为1%。
42ml Millipure水。
将缓冲液于4℃下存储1个月。
使用Qiagen TissueLyser,使巴斯德毕赤酵母细胞裂解。
速度:30hz
时间:15min(连续)
在桌面型离心机上使裂解物以2500rpm离心15min。将约600ul上清液收集于新鲜管或96孔深板中。弃去颗粒。
使用以下程序进行SDS-Page:
缓冲液和溶液的制备
将50ml PierceTM20X Tris-乙酸盐SDS缓冲液与950ml Millipure水混合以制备1倍Tris-乙酸盐SDS缓冲液。
向Mini或Midi凝胶罐的每个室中添加1500ml 1倍Tris-乙酸盐SDS缓冲液。
SDS-PAGE-每个凝胶将包含以下:分子量标记物、阴性对照、阳性对照、样品。
凝胶制备
打开凝胶周围的塑料外壳。
从凝胶移除孔电泳梳。
从凝胶移除白色胶带。
根据制造商说明书将凝胶放入Midi凝胶罐中。
用5ml 1倍Tris-乙酸盐SDS缓冲液冲洗凝胶孔,一次1ml。
吸出气泡并确保所有孔都浸没在1倍Tris-乙酸盐SDS缓冲液中。
用于加载SDS-PAGE凝胶的样品制备。
使样品和对照在冰上解冻。
将LDS缓冲液稀释到2倍,并添加10%2-巯基乙醇最终体积,用水补足体积。
将每个样品和LDS+2-ME以1:1的比率混合
简要地涡旋并离心样品。
将所有样品在70℃下孵育7分钟
使样品冷却到室温并简要地离心。
样品加载
向每个孔中添加20μL对照和样品以及10ul分子量标准品
对1到4个Midi凝胶罐进行电泳
利用300W创建一步程序。
步骤一是150V达一小时10分钟。
根据制造商的说明书将Midi凝胶罐的盖子连接到底座上。
将电源线连接到300W上的正确插座,确保红色电缆连接到红色插座,并且黑色电缆连接到黑色插座。
根据需要对最多4个Midi凝胶罐重复。
运行一步程序。
准备凝胶进行转移。
关闭300W。
拔下300W的Midi凝胶罐电缆。
从Midi凝胶罐移除盖子。
从Midi凝胶罐中移除凝胶。
使用Midi凝胶罐所包括的凝胶刀,通过将刀片插入塑料裂缝并转动刀来打开凝胶的塑料外壳。沿着裂缝重复这个动作,直到塑料外壳分成两部分。
将装有凝胶的塑料外壳保持凝胶面朝下放在含有水的NalgeneTM染色盒上,并轻轻地将凝胶刀压入阳极槽中以将凝胶释放到染色盒中。
重复以下程序3次,以在Millipore水中洗涤凝胶。
孵育30秒
倾析出水
考马斯(Coomassie)染色:
在室温下添加10-20ml的PageBlue蛋白染色溶液,并在室温下孵育60分钟,同时在振荡器上轻轻搅动。凝胶可过夜染色而不影响背景。
弃去染色溶液,并用MilliporeMillipure水冲洗凝胶两次。将染色溶液和水丢弃于指定的生物危害废物容器中,而非流入排水管。
添加20ml水使其脱色。对于完全脱色,将耗费10-12小时。对于更快脱色,向水中添加一些甲醇。频繁地更换水会增强脱色。
利用以下程序进行胃蛋白酶测定:
1.在胃蛋白酶处理前根据Thermo Scientific方案进行BCA测定以获得每个样品的总蛋白。将总蛋白正规化到所有样品的最低浓度。(注意:如果最低总蛋白浓度低于0.5mg/mL,则不要使用这个浓度进行正规化)
2.将100uL裂解物放于微量离心管中。
3.产生含有以下的混合母液:
a.37%HCl(0.6mL酸/100mL)以及
b.胃蛋白酶原液为1mg/mL,于去离子水中,并且胃蛋白酶的最后添加应为1:25比率的胃蛋白酶:总蛋白(重量:重量)。
c.基于步骤1总蛋白的正规化,胃蛋白酶的量将根据最终添加而变化,使用所创建的试算表进行调整。
4.添加胃蛋白酶后,用移液管混合3倍,并使样品在室温下孵育1小时以发生胃蛋白酶反应。
5.一小时后,向每个样品中添加1:1体积的含有巯基乙醇的LDS加载缓冲液,并允许在70℃下孵育7分钟。(在这种情况下,应添加100uL的LDS)。
6.然后以14,000rpm旋转1分钟以去除浊度。
7.从样品顶部添加18uL到3-8%TAE上(使用TAE缓冲液)并在150V下运行凝胶1小时10分钟。或者在沸腾后,可以立即将样品置于-80℃直到需要运行凝胶。
结果显示于下表1中。
实施例2-
产生重组胶原的酵母
按照相同的程序和方案重复实施例1,并进行以下改变:将DNA MMV77(序列10)序列(包括针对毕赤氏酵母属表达优化的牛胶原序列(优化的牛col3A1,序列2))插入酵母中。使用pAOX1启动子(序列3)驱动胶原序列的表达。使用含有500ug/ml的吉欧霉素的YPD板来选择成功的转化体。所得菌株是PP8。载体MMV77显示于图2中。
使用Pme I完成限制性消化。
使菌株在BMMY培养基中生长并测试胶原。结果显示于下表1中。
实施例3
产生增加量的重组胶原的酵母
按照相同的程序和方案重复实施例1,并进行以下改变:将DNA MMV-129(序列11)序列(包括针对毕赤氏酵母属表达优化的牛胶原序列)插入酵母中。使用pCAT启动子(序列7)驱动胶原序列的表达。使用含有500ug/ml的吉欧霉素的YPD板来选择成功的转化体。所得菌株是PP123。用Swa I消化MMV129并将其转化到PP1中以产生PP123。载体MMV129显示于图3中。
使菌株在BMGY培养基中生长并测试胶原。结果显示于下表1中。
实施例4
产生最佳量的重组胶原的酵母
按照相同的程序和方案重复实施例1,并进行以下改变:
将DNA MMV-130(序列12)序列(包括针对毕赤氏酵母属表达优化的牛胶原序列(序列2))插入酵母中。使用pDF启动子(序列6)驱动胶原序列的表达。AOX1着陆垫(由Pme I切割,序列8)用于帮助载体位点特异性整合到毕赤氏酵母属基因体中。使用含有500ug/ml的吉欧霉素的YPD板来选择成功的转化体。所得菌株是PP153。用Pme I消化MMV130并使其转化到PP1中以产生PP153。(牛col3A1优化的,序列2)。
未使用酚提取,并且使用PureLink PCR纯化试剂盒回收线性化DNA。
使菌株在BMGY培养基中生长并测试胶原。结果显示于下表1中。
实施例5
打算产生重组羟基化胶原的酵母
按照相同的程序和方案重复实施例2,并进行以下改变:将含有牛P4HA(序列4)和牛P4HB(序列5)序列的一个DNA载体MMV-78(序列13)插入酵母中。用Pme I消化MMV78并将其转化到PP1中以产生PP8。P4HA和P4HB都含有其内源信号肽并且由Das1-Das2双向启动子(序列25)驱动。用Kpn I消化DNA并将其转化到PP8中以产生PP3序列2。载体MMV78显示于图5中。
使菌株在BMMY培养基中生长并测试胶原和羟基化。结果显示于下表1中。
实施例6
产生重组羟基化胶原的酵母
按照相同的程序和方案重复实施例2,并进行以下改变:将含有牛P4HA和牛P4HB序列的一个DNA载体MMV-78插入酵母中。P4HA和P4HB都含有其内源信号肽并且由Das1-Das2双向启动子驱动。用Kpn I消化DNA并将其转化到PP8中以产生PP3序列2。
使用含有由pAOX1启动子驱动的P4HB的另一载体MMV-94(序列14),并且也将其插入酵母中。用PHO1信号肽替代P4HB的内源信号肽。所得菌株是PP38。用Avr II消化MMV94并将其转化到PP3中以产生PP38。载体MMV94显示于图6中。
使菌株在BMMY培养基中生长并测试胶原和羟基化。结果显示于下表1中。
实施例7
产生增加量的重组羟基化胶原的酵母
按照相同的程序和方案重复实施例4,并进行以下改变:将含有牛P4HA和牛P4HB序列的一个DNA载体MMV-156(序列15)插入酵母中。P4HA含有其内源信号肽并用α-因子Pre(序列21)序列替代P4HB信号序列。两种基因都由pHTX1双向启动子(序列25)驱动。用Bam HI消化MMV156并将其转化到PP153中以产生PP154。序列2。载体MMV156显示于图7中。使菌株在BMGY培养基中生长并测试胶原和羟基化。结果显示于下表1中。
实施例8
产生最佳量的重组羟基化胶原的酵母
按照相同的程序和方案重复实施例4,并进行以下改变:将含有牛P4HA和牛P4HB序列的一个DNA载体MMV-156插入酵母中。P4HA含有其内源信号肽并用α-因子Pre序列替代P4HB信号序列。两种基因都由pHTX1双向启动子驱动。用Swa I消化DNA并将其转化到PP153中以产生PP154。序列2。
也将含有P4HA和P4HB的另一载体MMV-191(序列16)插入酵母中。P4HA的额外拷贝含有其内源信号肽,并且用α因子Pre-Pro(序列22)序列替代P4HB的额外拷贝的信号序列。P4HA和P4HB的额外拷贝由pGCW14-GAP1双向启动子(序列23)驱动。用Bam HI消化MMV191并将其转化到PP154中以产生PP268。载体MMV191显示于图8中。使菌株在BMGY培养基中生长并测试胶原和羟基化。结果显示于下表1中。
实施例9
全合一载体
利用实施例1的方法和程序来生成全合一载体。全合一载体含有胶原和相关启动子和终止子的DNA、羟基胶原和相关启动子和终止子的酶的DNA、标记物表达和相关启动子和终止子的DNA、用于细菌和酵母复制起点的DNA以及与酵母基因组同源用于整合的DNA。全合一载体含有战略上放置的独特的限制位点5’、3’或在上述组分内。当需要对胶原表达或其他载体组分进行任何修饰时,选择组分的DNA可以很容易地用限制性酶切除,并用使用者选择的克隆方法替代。全合一载体(MMV208,序列17)的最简单型式包括除了羟基酶的启动子之外的所有上述组分。载体MMV208是使用以下组分制备:来自MMV84(序列18)的AOX同源物、来自MMV150(序列19)的核糖体同源物、来自MMV140(序列20)的细菌和酵母复制起点、来自MMV140的吉欧霉素标记物和来自MMV129的Col3A1。从消除以下限制位点的Genscript合成P4HA和B和相关终止子的改性型式:AvrII、NotI、PvuI、PmeI、BamHI、SacII、SwaI、XbaI、SpeI。将载体转化到菌株PP1中。
使菌株在BMGY培养基中生长并测试胶原和羟基化。结果显示于下表1中。
表1
实施例 胶原(g/L) 羟基化胶原(%)
1* 0.05 0
2 0.1 0
3 0.5 0
4 1-1.5 0
5* 0.1 15
6 0.1 35
7 1–1.5 15
8 1–1.5 40-50
9 0.5-1 15-20
*比较实例;为了量化胶原,使用考马斯染色的凝胶。使用胶原标准曲线来测定样品中的胶原浓度。在1:25胃蛋白酶处理后,通过比较样品带与标准带估计羟基化胶原的量。
如上所讨论,羟基化胶原在高浓度的胃蛋白酶中是稳定的,因此其有用之处在于自发酵不仅具有增加量的胶原,而且还具有羟基化胶原。
描述的解释
本文使用的术语仅用于描述具体实施方案的目的,而不打算限制本发明。举例来说,除非上下文另有明确指示,否则如本文所用的单数形式“一(a、an)”和“所述”打算也包括复数形式。应进一步理解,当在本说明书中使用时,术语“包含(comprises)”和/或“包含(comprising)”指明所述特征、步骤、操作、要素和/或组分的存在,但不排除一个或多个其他特征、步骤、操作、要素、组分和/或其群组的存在或添加。
尽管术语“第一”和“第二”在本文中可用于描述各种特征/要素(包括步骤),但是这些特征/元素不应该被这些术语限制,除非上下文另外指示。这些术语可用于区分一个特征/要素与另一特征/要素。因此,下面讨论的第一特征/要素可以称为第二特征/要素,并且类似地,下面讨论的第二特征/要素可以称为第一特征/要素,此并不背离本发明的教导。
在整个说明书和随后的权利要求中,除非上下文另有要求,否则词语“包含(comprise)”以及诸如“包含(comprises)”和“包含(comprising)”的变化形式意味着各种组分可以共同用于方法和制品(例如,包括装置和方法的组合物和设备)。举例来说,术语“包含(comprising)”应理解为暗示包括任何陈述的要素或步骤,但不排除任何其他要素或步骤。
尽管上文描述了各种说明性实施方案,但是在不背离如权利要求所描述的本发明的范围的情况下,可以对各种实施方案进行多种改变中的任一种。举例来说,在替代实施方案中,通常可以改变进行各种所描述的方法步骤的顺序,并且在其他替代实施方案中,可以总共跳过一个或多个方法步骤。各种装置和系统实施方案的任选特征可包括于一些实施方案中,而非其他实施方案中。因此,前面的描述主要是为了实例性目的而提供的,并且不应解释为限制权利要求中所阐述的本发明的范围。
本文包括的实施例和说明借助说明而非限制方式显示了其中可以实践主题的具体实施方案。如上所提及,可以利用其他实施方案并从中衍生出来,使得可进行结构和逻辑取代和变化,此并不背离本公开的范围。本发明主题的所述实施方案在本文中可以单独地或共同地由术语“发明”来提及,此仅仅是为了方便,并且如果实际上公开超过一个,则不打算自动地将本申请的范围限制到任何单个发明或发明概念。因此,尽管本文已经说明和描述了具体实施方案,但是为了实现相同目的而计算的任何布置可以取代所示的具体实施方案。本公开打算涵盖各种实施方案的任何和所有修改或变化。在阅读了上述描述之后,本领域技术人员将明了上述实施方案和本文中未具体描述的其他实施方案的组合。
通过引用并入
本说明书中提及的所有出版物和专利申请案的整个内容通过引用并入本文中,其并入程度如同每个单独的出版物或专利申请案被具体且单独地指出通过引用并入一般,特别提及出现在通过引用并入的说明书的相同句子、段落、页面或部分中的公开案。
序列表
<110> Modern Meadow公司
<120> 用于产生胶原的酵母菌株和方法
<130> 514257US
<150> US 62/526,912
<151> 2017-06-29
<160> 25
<170> 专利版本3.5
<210> 1
<211> 4401
<212> DNA
<213> 人工序列
<220>
<223> 胶原序列1:cDNA序列- 来自母牛的未优化的天然DNA序列
<400> 1
atgatgagct ttgtgcaaaa ggggacctgg ttacttttcg ctctgcttca tcccactgtt 60
attttggcac aacaggaagc tgttgacgga ggatgctccc atctcggtca gtcttatgca 120
gatagagatg tatggaaacc agaaccgtgc caaatatgcg tctgtgactc aggatccgtt 180
ctctgtgatg acataatatg tgacgaccaa gaattagact gccccaaccc tgaaatcccg 240
tttggagaat gttgtgcagt ttgcccacag cctccaacag ctcccactcg ccctcctaat 300
ggtcaaggac ctcaaggccc caagggagat ccaggtcctc ctggtattcc tgggcgaaat 360
ggcgatcctg gtcctccagg atcaccaggc tccccaggtt ctcccggccc tcctggaatc 420
tgtgaatcat gtcctactgg tggccagaac tattctcccc agtacgaagc atatgatgtc 480
aagtctggag tagcaggagg aggaatcgca ggctatcctg ggccagctgg tcctcctggc 540
ccacccggac cccctggcac atctggccat cctggtgccc ctggcgctcc aggataccaa 600
ggtccccccg gtgaacctgg gcaagctggt ccggcaggtc ctccaggacc tcctggtgct 660
ataggtccat ctggccctgc tggaaaagat ggggaatcag gaagacccgg acgacctgga 720
gagcgaggat ttcctggccc tcctggtatg aaaggcccag ctggtatgcc tggattccct 780
ggtatgaaag gacacagagg ctttgatgga cgaaatggag agaaaggcga aactggtgct 840
cctggattaa agggggaaaa tggcgttcca ggtgaaaatg gagctcctgg acccatgggt 900
ccaagagggg ctcccggtga gagaggacgg ccaggacttc ctggagccgc aggggctcga 960
ggtaatgatg gagctcgagg aagtgatgga caaccgggcc cccctggtcc tcctggaact 1020
gcaggattcc ctggttcccc tggtgctaag ggtgaagttg gacctgcagg atctcctggt 1080
tcaagtggcg cccctggaca aagaggagaa cctggacctc agggacatgc tggtgctcca 1140
ggtccccctg ggcctcctgg gagtaatggt agtcctggtg gcaaaggtga aatgggtcct 1200
gctggcattc ctggggctcc tgggctgata ggagctcgtg gtcctccagg gccacctggc 1260
accaatggtg ttcccgggca acgaggtgct gcaggtgaac ccggtaagaa tggagccaaa 1320
ggagacccag gaccacgtgg ggaacgcgga gaagctggtt ctccaggtat cgcaggacct 1380
aagggtgaag atggcaaaga tggttctcct ggagaacctg gtgcaaatgg acttcctgga 1440
gctgcaggag aaaggggtgt gcctggattc cgaggacctg ctggagcaaa tggccttcca 1500
ggagaaaagg gtcctcctgg ggaccgtggt ggcccaggcc ctgcagggcc cagaggtgtt 1560
gctggagagc ccggcagaga tggtctccct ggaggtccag gattgagggg tattcctggt 1620
agccccggag gaccaggcag tgatgggaaa ccagggcctc ctggaagcca aggagagacg 1680
ggtcgacccg gtcctccagg ttcacctggt ccgcgaggcc agcctggtgt catgggcttc 1740
cctggtccca aaggaaacga tggtgctcct ggaaaaaatg gagaacgagg tggccctgga 1800
ggtcctggcc ctcagggtcc tgctggaaag aatggtgaga ccggacctca gggtcctcca 1860
ggacctactg gcccttctgg tgacaaagga gacacaggac cccctggtcc acaaggacta 1920
caaggcttgc ctggaacgag tggtccccca ggagaaaacg gaaaacctgg tgaacctggt 1980
ccaaagggtg aggctggtgc acctggaatt ccaggaggca agggtgattc tggtgctccc 2040
ggtgaacgcg gacctcctgg agcaggaggg ccccctggac ctagaggtgg agctggcccc 2100
cctggtcccg aaggaggaaa gggtgctgct ggtccccctg ggccacctgg ttctgctggt 2160
acacctggtc tgcaaggaat gcctggagaa agagggggtc ctggaggccc tggtccaaag 2220
ggtgataagg gtgagcctgg cagctcaggt gtcgatggtg ctccagggaa agatggtcca 2280
cggggtccca ctggtcccat tggtcctcct ggcccagctg gtcagcctgg agataagggt 2340
gaaagtggtg cccctggagt tccgggtata gctggtcctc gcggtggccc tggtgagaga 2400
ggcgaacagg ggcccccagg acctgctggc ttccctggtg ctcctggcca gaatggtgag 2460
cctggtgcta aaggagaaag aggcgctcct ggtgagaaag gtgaaggagg ccctcccgga 2520
gccgcaggac ccgccggagg ttctgggcct gccggtcccc caggccccca aggtgtcaaa 2580
ggcgaacgtg gcagtcctgg tggtcctggt gctgctggct tccccggtgg tcgtggtcct 2640
cctggccctc ctggcagtaa tggtaaccca ggccccccag gctccagtgg tgctccaggc 2700
aaagatggtc ccccaggtcc acctggcagt aatggtgctc ctggcagccc cgggatctct 2760
ggaccaaagg gtgattctgg tccaccaggt gagaggggag cacctggccc ccagggccct 2820
ccgggagctc caggcccact aggaattgca ggacttactg gagcacgagg tcttgcaggc 2880
ccaccaggca tgccaggtgc taggggcagc cccggcccac agggcatcaa gggtgaaaat 2940
ggtaaaccag gacctagtgg tcagaatgga gaacgtggtc ctcctggccc ccagggtctt 3000
cctggtctgg ctggtacagc tggtgagcct ggaagagatg gaaaccctgg atcagatggt 3060
ctgccaggcc gagatggagc tccaggtgcc aagggtgacc gtggtgaaaa tggctctcct 3120
ggtgcccctg gagctcctgg tcacccaggc cctcctggtc ctgtcggtcc agctggaaag 3180
agcggtgaca gaggagaaac tggccctgct ggtccttctg gggcccccgg tcctgccgga 3240
tcaagaggtc ctcctggtcc ccaaggccca cgcggtgaca aaggggaaac cggtgagcgt 3300
ggtgctatgg gcatcaaagg acatcgcgga ttccctggca acccaggggc ccccggatct 3360
ccgggtcccg ctggtcatca aggtgcagtt ggcagtccag gccctgcagg ccccagagga 3420
cctgttggac ctagcgggcc ccctggaaag gacggagcaa gtggacaccc tggtcccatt 3480
ggaccaccgg ggccccgagg taacagaggt gaaagaggat ctgagggctc cccaggccac 3540
ccaggacaac caggccctcc tggacctcct ggtgcccctg gtccatgttg tggtgctggc 3600
ggggttgctg ccattgctgg tgttggagcc gaaaaagctg gtggttttgc cccatattat 3660
ggagatgaac cgatagattt caaaatcaac accgatgaga ttatgacctc actcaaatca 3720
gtcaatggac aaatagaaag cctcattagt cctgatggtt cccgtaaaaa ccctgcacgg 3780
aactgcaggg acctgaaatt ctgccatcct gaactccaga gtggagaata ttgggttgat 3840
cctaaccaag gttgcaaatt ggatgctatt aaagtctact gtaacatgga aactggggaa 3900
acgtgcataa gtgccagtcc tttgactatc ccacagaaga actggtggac agattctggt 3960
gctgagaaga aacatgtttg gtttggagaa tccatggagg gtggttttca gtttagctat 4020
ggcaatcctg aacttcccga agacgtcctc gatgtccagc tggcattcct ccgacttctc 4080
tccagccggg cctctcagaa catcacatat cactgcaaga atagcattgc atacatggat 4140
catgccagtg ggaatgtaaa gaaagccttg aagctgatgg ggtcaaatga aggtgaattc 4200
aaggctgaag gaaatagcaa attcacatac acagttctgg aggatggttg cacaaaacac 4260
actggggaat ggggcaaaac agtcttccag tatcaaacac gcaaggccgt cagactacct 4320
attgtagata ttgcacccta tgatatcggt ggtcctgatc aagaatttgg tgcggacatt 4380
ggccctgttt gctttttata a 4401
<210> 2
<211> 4404
<212> DNA
<213> 人工序列
<220>
<223> Col3A1 cDNA序列
<400> 2
atgatgtctt ttgtccaaaa gggtacttgg ttactttttg ctctgttgca cccaactgtt 60
attctcgcac aacaggaagc agtagatggt ggttgctcac atttaggtca atcttacgca 120
gatagagatg tatggaaacc tgaaccatgt caaatttgcg tgtgtgactc aggttcagtg 180
ctctgcgacg atatcatatg tgacgaccag gaattggact gtccaaaccc agagatacca 240
ttcggtgaat gttgtgctgt ttgtccacag ccaccaactg ctcctacaag acctccaaac 300
ggtcaaggtc cacaaggtcc taaaggtgat ccgggtccac ctggtattcc tggtagaaat 360
ggtgaccctg gacctcccgg ttccccaggt agcccaggat cacctgggcc tcctggaata 420
tgtgaatcct gcccaactgg tggtcagaac tatagcccac aatacgaggc ctacgacgtc 480
aaatctggtg ttgctggagg aggtattgca ggctaccctg gtcccgcagg gcccccaggt 540
ccgccgggtc cgcccggaac atcaggtcat cccggagccc ctggtgcacc aggttatcag 600
ggaccgcccg gagagcctgg acaagctggt cccgctggac cccctggtcc accaggtgct 660
attggaccaa gtggtcctgc cggaaaagac ggtgaatccg gtagacctgg tagacccggc 720
gaaaggggtt tcccaggtcc tcccggaatg aagggtccag ccggtatgcc cggttttcct 780
gggatgaagg gtcacagagg atttgatggt agaaacggag agaaaggcga aaccggtgct 840
cccggactga agggtgaaaa cggtgtccct ggtgagaacg gcgctcctgg acctatgggt 900
ccacgtggtg ctccaggaga aagaggcaga ccaggattgc ctggtgcagc tggtgctaga 960
ggtaacgatg gtgcccgtgg ttccgatgga caacccgggc cacccggccc tccaggtacc 1020
gctggatttc ctggaagccc tggtgctaag ggggaggttg gtccggctgg tagtcccgga 1080
agtagcggtg ccccaggtca aagaggcgaa ccaggccctc agggtcacgc aggagcacct 1140
ggaccgcctg gtcctcctgg ttcgaatggt tcgcctggag gaaaaggtga aatggggccc 1200
gcaggaatcc ccggtgcgcc tggtcttatt ggtgccaggg gtcctccagg cccgccaggt 1260
acaaatggtg tacccggaca gcgaggagca gctggtgaac ctggtaaaaa cggtgccaaa 1320
ggagatccag gtcctcgtgg agagcgtggt gaagctggct ctcccggtat cgccggtcca 1380
aaaggtgagg acggtaagga cggttcccct ggtgagccag gtgcgaacgg actgccaggt 1440
gcagccggag agcgaggagt cccaggattc aggggaccag ccggtgctaa cggcttgcct 1500
ggtgaaaaag ggccccctgg tgatagggga ggacccggtc cagcaggccc tcgtggagtt 1560
gctggtgagc ctggacgtga cggtttacca ggagggccag gtttgagggg tattcccggg 1620
tcccctggcg gtcctggatc ggatggaaaa ccagggccac caggttcgca gggtgaaaca 1680
ggacgtccag gcccacccgg ctcacctggt ccaaggggtc agcctggtgt catgggtttc 1740
cccggtccaa agggtaatga cggagcaccg ggtaaaaatg gtgaacgtgg tggcccaggt 1800
ggtccaggac cccaaggtcc agctggaaaa aacggtgaga caggtcctca aggacctcca 1860
ggacctaccg gtcctagcgg agataaggga gatacgggac cgccaggacc tcaaggattg 1920
caaggtttgc ctggtacatc tggccctccc ggagaaaatg gtaagcctgg agagccagga 1980
ccaaaaggcg aagctggagc cccaggtatc cccggaggta agggagactc aggtgctccg 2040
ggtgagcgtg gtcctccggg tgccggtggt ccacctggac ctagaggtgg tgccgggccg 2100
ccaggtcctg aaggtggtaa aggtgctgct ggtccaccgg gaccgcctgg ctctgctggt 2160
actcctggct tgcagggaat gccaggagag agaggtggac ctggaggtcc cggtccgaag 2220
ggtgataaag gggagccagg atcatccggt gttgacggcg cacctggtaa agacggacca 2280
aggggaccaa cgggtccaat cggaccacca ggacccgctg gccagccagg agataaaggc 2340
gagtccggag cacccggtgt tcctggtata gctggaccca ggggtggtcc cggtgaaaga 2400
ggtgaacagg gcccaccggg tcccgccggt ttccctggcg cccctggtca aaatggagaa 2460
ccaggtgcaa agggcgagag aggagcccca ggagaaaagg gtgagggagg accacccggt 2520
gctgccggtc cagctggggg ttcaggtcct gctggaccac caggtccaca gggcgttaaa 2580
ggtgagagag gaagtccagg tggtcctgga gctgctggat tcccaggtgg ccgtggacct 2640
cctggtcccc ctggatcgaa tggtaatcct ggtccgccag gtagttcggg tgctcctggg 2700
aaggacggtc cacctggccc cccaggtagt aacggtgcac ctggtagtcc aggtatatcc 2760
ggacctaaag gagattccgg tccaccaggc gaaagagggg ccccaggccc acagggtcca 2820
ccaggagccc ccggtcctct gggtattgct ggtcttactg gtgcacgtgg actggccggt 2880
ccacccggaa tgcctggagc aagaggttca cctggaccac aaggtattaa aggagagaac 2940
ggtaaacctg gaccttccgg tcaaaacgga gagcggggac ccccaggccc ccaaggtctg 3000
ccaggactag ctggtaccgc aggggaacca ggaagagatg gaaatccagg ttcagacgga 3060
ctacccggta gagatggtgc accgggggcc aagggcgaca ggggtgagaa tggatctcct 3120
ggtgcgccag gggcaccagg ccacccaggt cccccaggtc ctgtgggccc tgctggaaag 3180
tcaggtgaca ggggagagac aggcccggct ggtccatctg gcgcacccgg accagctggt 3240
tccagaggcc cacctggtcc gcaaggccct agaggtgaca agggagagac tggagaacga 3300
ggtgctatgg gtatcaaggg tcatagaggt tttccgggta atcccggcgc cccaggttct 3360
cctggtccag ctggccatca aggtgcagtc ggatcgcccg gcccagccgg tcccaggggc 3420
cctgttggtc catccggtcc tccaggaaag gatggtgctt ctggacaccc aggacctatc 3480
ggacctccgg gtcctagagg taatagagga gaacgtggat ccgagggtag tcctggtcac 3540
cctggtcaac ctggcccacc agggcctcca ggtgcacccg gtccatgttg tggtgcaggc 3600
ggtgtggctg caattgctgg tgtgggtgct gaaaaggccg gcggtttcgc tccatattat 3660
ggtgatgaac cgattgattt taagatcaat actgacgaaa tcatgacttc cttaaagtcc 3720
gttaatggtc aaattgagtc tctaatctcc ccagatggtt cacgtaaaaa tcctgctaga 3780
aattgtagag atttgaagtt ttgtcacccc gagttgcagt ccggtgagta ctgggtggac 3840
cccaatcaag gttgtaagtt agacgctatt aaagtttact gcaatatgga gacaggagaa 3900
acttgcatca gcgcttctcc attgactatc ccacaaaaaa attggtggac tgactctgga 3960
gctgagaaaa agcatgtatg gttcggggaa tcgatggaag gtggtttcca attcagctac 4020
ggtaaccctg aacttcctga agatgttctt gacgttcaat tggcatttct gagattgttg 4080
tccagtcgtg caagccaaaa cattacatac cattgcaaaa attccatcgc atatatggat 4140
catgctagcg gaaatgtgaa aaaggcattg aagctgatgg gatcaaatga aggtgaattt 4200
aaagcagagg gtaattctaa gtttacttac actgtattgg aggatggttg tacgaagcat 4260
acaggtgaat ggggtaaaac agtgtttcaa tatcaaaccc gcaaagcagt tagattgcca 4320
atcgtcgata tcgcaccata cgacattgga ggaccagatc aagagttcgg agctgacatc 4380
ggtccggtgt gtttcctttg ataa 4404
<210> 3
<211> 940
<212> DNA
<213> 人工序列
<220>
<223> pAOX1
<400> 3
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaaacg 940
<210> 4
<211> 1612
<212> DNA
<213> 人工序列
<220>
<223> 优化的牛P4HA cDNA
<400> 4
atgatttggt atatcctagt cgttggtatt ttgttgccac agtcactggc tcacccaggc 60
ttcttcactt ctataggaca gatgactgat ttgattcaca cagaaaaaga cctagttaca 120
agccttaaag actatatcaa agctgaagag gataagttgg agcaaatcaa aaagtgggca 180
gagaaactcg atagattgac tagtactgca acaaaagatc ctgagggttt tgtgggtcac 240
ccagtgaatg ctttcaagct gatgaagaga cttaatacag agtggtcaga attggaaaac 300
ttggtactta aagatatgag tgatggattc atttctaact taacaattca aagacaatac 360
tttccaaacg atgaggacca agtaggagca gcaaaagctt tgttgcgatt gcaggacaca 420
tacaatttgg acaccgacac gatatcgaag ggtgatttac ctggtgtgaa gcataagtcc 480
ttcctcactg tggaagattg ttttgaattg ggaaaagtcg catatacaga agccgactac 540
tatcacacag aattatggat ggagcaagct ctgcgtcagt tggacgaagg tgaagtttct 600
accgttgata aggtttcagt tttggattac ttatcatacg ctgtttacca gcaaggtgat 660
ctggacaaag ctctactttt aactaaaaag ttgttggagc tggacccgga gcatcaaaga 720
gctaacggta atctgaaata ctttgaatac atcatggcta aggaaaagga cgcaaataag 780
tcctcgtccg atgaccaatc cgatcaaaag accactctga aaaaaaaagg tgcagctgtt 840
gactacctcc cagagagaca aaagtatgaa atgctgtgta gaggagaggg tatcaagatg 900
actccaagga gacagaaaaa gctgttctgt agatatcatg atgggaaccg taacccaaaa 960
ttcattcttg ctccagcgaa acaggaagat gaatgggaca agcctagaat cattcgtttt 1020
catgacatca tctccgatgc agaaatagag gttgtgaaag acttggccaa accaagattg 1080
agtagggcta ccgtccatga ccctgagact ggaaaattga ctaccgcaca atatcgtgtc 1140
tctaaatcag catggttgtc cggttacgag aatcccgtgg tcagccgtat caatatgcgt 1200
attcaagatt tgactggtct tgacgtaagc actgctgagg aactacaagt tgccaactat 1260
ggtgtgggcg gtcagtatga accccacttt gatttcgcca gaaaggacga gcctgatgct 1320
tttaaggagc taggtactgg aaatagaatc gcaacgtggt tgttctatat gtccgatgtg 1380
cttgctggag gagccacagt tttccctgag gtaggtgctt ctgtttggcc taaaaagggc 1440
acggccgtat tttggtacaa tctgtttgca tctggagaag gtgattacag cactagacat 1500
gctgcttgtc ccgtcttagt cggtaataag tgggtttcca ataagtggct gcatgagaga 1560
ggtcaagagt ttaggaggcc atgcacattg tcagaattag aatgataatt tt 1612
<210> 5
<211> 1750
<212> DNA
<213> 人工序列
<220>
<223> 牛P4HB (PDI)序列,具有α pre-pro信号序列
<400> 5
aaaatgagat tcccatctat tttcaccgct gtcttgttcg ctgcctcctc tgcattggct 60
gcccctgtta acactaccac tgaagacgag actgctcaaa ttccagctga agcagttatc 120
ggttactctg accttgaggg tgatttcgac gtcgctgttt tgcctttctc taactccact 180
aacaacggtt tgttgttcat taacaccact atcgcttcca ttgctgctaa ggaagagggt 240
gtctctctcg agaaaagaga ggccgaagct gcacccgatg aggaagatca tgttttagta 300
ttgcataaag gaaatttcga tgaagctttg gccgctcaca aatatctgct cgtcgagttt 360
tacgctccct ggtgcggtca ttgtaaggcc cttgcaccag agtacgccaa ggcagctggt 420
aagttaaagg ccgaaggttc agagatcaga ttagcaaaag ttgatgctac agaagagtcc 480
gatcttgctc aacaatacgg ggttcgagga tacccaacaa ttaagttttt caaaaatggt 540
gatactgctt ccccaaagga atatactgct ggtagagagg cagacgacat agtcaactgg 600
ctcaaaaaga gaacgggccc agctgcgtct acattaagcg acggagcagc agccgaagct 660
cttgtggaat ctagtgaagt tgctgtaatc ggtttcttta aggacatgga atctgattca 720
gctaaacagt tccttttagc agctgaagca atcgatgaca tccctttcgg aatcacctca 780
aatagtgacg tgttcagcaa gtaccaactt gacaaagatg gagtggtctt gttcaaaaag 840
tttgacgaag gcagaaacaa tttcgagggt gaggttacaa aggagaaact gcttgatttc 900
attaaacata accaactacc cttagttatc gaattcactg aacaaactgc tcctaagatt 960
ttcggtggag aaatcaaaac acatatcttg ttgtttttgc caaagtccgt atcggattat 1020
gaaggtaaac tctccaattt caaaaaggcc gctgagagct ttaagggcaa gattttgttc 1080
atctttattg actcagacca cacagacaat cagaggattt tggagttttt cggtttgaaa 1140
aaggaggaat gtccagcagt ccgtttgatc accttggagg aggagatgac caaatacaaa 1200
ccagagtcgg atgagttgac tgccgagaag ataacagaat tttgtcacag atttctggaa 1260
ggtaagatca agcctcatct tatgtctcaa gagttgcctg atgactggga taagcaacca 1320
gttaaagtat tggtgggtaa aaactttgag gaagtggcct tcgacgagaa aaaaaatgtc 1380
tttgttgaat tctatgctcc gtggtgtggt cactgtaagc agctggcacc aatttgggat 1440
aaactgggtg aaacttacaa agatcacgaa aacattgtta ttgcaaagat ggacagtact 1500
gctaacgaag tggaggctgt gaaagttcac tccttcccta cgctgaagtt ctttcctgca 1560
tctgctgaca gaactgttat cgactataat ggagagagga cattggatgg ttttaaaaag 1620
tttcttgaat ccggaggtca agacggagct ggtgacgacg atgatttgga agatctggag 1680
gaggctgagg aacctgatct tgaggaggat gacgaccaga aggcagtcaa agatgaactg 1740
tgataagggg 1750
<210> 6
<211> 7479
<212> DNA
<213> 人工序列
<220>
<223> 胶原表达载体 - pDF-Col3A1
<400> 6
ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60
aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120
cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180
tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240
tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300
gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360
aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420
cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480
atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540
aattatccga aaaaattttc tagagtgttg ttactttata cttccggctc gtataatacg 600
acaaggtgta aggaggacta aaccatggct aaactcacct ctgctgttcc agtcctgact 660
gctcgtgatg ttgctggtgc tgttgagttc tggactgata ggctcggttt ctcccgtgac 720
ttcgtagagg acgactttgc cggtgttgta cgtgacgacg ttaccctgtt catctccgca 780
gttcaggacc aggttgtgcc agacaacact ctggcatggg tatgggttcg tggtctggac 840
gaactgtacg ctgagtggtc tgaggtcgtg tctaccaact tccgtgatgc atctggtcca 900
gctatgaccg agatcggtga acagccctgg ggtcgtgagt ttgcactgcg tgatccagct 960
ggtaactgcg tgcatttcgt cgcagaagag caggactaac aattgacacc ttacgattat 1020
ttagagagta tttattagtt ttattgtatg tatacggatg ttttattatc tatttatgcc 1080
cttatattct gtaactatcc aaaagtccta tcttatcaag ccagcaatct atgtccgcga 1140
acgtcaacta aaaataagct ttttatgctc ttctctcttt ttttcccttc ggtataatta 1200
taccttgcat ccacagattc tcctgccaaa ttttgcataa tcctttacaa catggctata 1260
tgggagcact tagcgccctc caaaacccat attgcctacg catgtatagg tgttttttcc 1320
acaatatttt ctctgtgctc tctttttatt aaagagaagc tctatatcgg agaagcttct 1380
gtggccgtta tattcggcct tatcgtggga ccacattgcc tgaattggtt tgccccggaa 1440
gattggggaa acttggatct gattacctta gctgcagaaa agggtaccac tgagcgtcag 1500
accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 1560
gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 1620
caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgttcttc 1680
tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 1740
ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 1800
tggacccaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 1860
gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 1920
tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 1980
gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 2040
gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 2100
ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 2160
ggccttttgc tcacatgtat ttaaataatg tatctaaacg caaactccga gctggaaaaa 2220
tgttaccggc gatgcgcgga caatttagag gcggcgatca agaaacacct gctgggcgag 2280
cagtctggag cacagtcttc gatgggcccg agatcccacc gcgttcctgg gtaccgggac 2340
gtgaggcagc gcgacatcca tcaaatatac caggcgccaa ccgagtctct cggaaaacag 2400
cttctggata tcttccgctg gcggcgcaac gacgaataat agtccctgga ggtgacggaa 2460
tatatatgtg tggagggtaa atctgacagg gtgtagcaaa ggtaatattt tcctaaaaca 2520
tgcaatcggc tgccccgcaa cgggaaaaag aatgactttg gcactcttca ccagagtggg 2580
gtgtcccgct cgtgtgtgca aataggctcc cactggtcac cccggatttt gcagaaaaac 2640
agcaagttcc ggggtgtctc actggtgtcc gccaataaga ggagccggca ggcacggagt 2700
ctacatcaag ctgtctccga tacactcgac taccatccgg gtctctcaga gaggggaatg 2760
gcactataaa taccgcctcc ttgcgctctc tgccttcatc aatcaaatca tgatgtcttt 2820
tgtccaaaag ggtacttggt tactttttgc tctgttgcac ccaactgtta ttctcgcaca 2880
acaggaagca gtagatggtg gttgctcaca tttaggtcaa tcttacgcag atagagatgt 2940
atggaaacct gaaccatgtc aaatttgcgt gtgtgactca ggttcagtgc tctgcgacga 3000
tatcatatgt gacgaccagg aattggactg tccaaaccca gagataccat tcggtgaatg 3060
ttgtgctgtt tgtccacagc caccaactgc tcctacaaga cctccaaacg gtcaaggtcc 3120
acaaggtcct aaaggtgatc cgggtccacc tggtattcct ggtagaaatg gtgaccctgg 3180
acctcccggt tccccaggta gcccaggatc acctgggcct cctggaatat gtgaatcctg 3240
cccaactggt ggtcagaact atagcccaca atacgaggcc tacgacgtca aatctggtgt 3300
tgctggagga ggtattgcag gctaccctgg tcccgcaggg cccccaggtc cgccgggtcc 3360
gcccggaaca tcaggtcatc ccggagcccc tggtgcacca ggttatcagg gaccgcccgg 3420
agagcctgga caagctggtc ccgctggacc ccctggtcca ccaggtgcta ttggaccaag 3480
tggtcctgcc ggaaaagacg gtgaatccgg tagacctggt agacccggcg aaaggggttt 3540
cccaggtcct cccggaatga agggtccagc cggtatgccc ggttttcctg ggatgaaggg 3600
tcacagagga tttgatggta gaaacggaga gaaaggcgaa accggtgctc ccggactgaa 3660
gggtgaaaac ggtgtccctg gtgagaacgg cgctcctgga cctatgggtc cacgtggtgc 3720
tccaggagaa agaggcagac caggattgcc tggtgcagct ggtgctagag gtaacgatgg 3780
tgcccgtggt tccgatggac aacccgggcc acccggccct ccaggtaccg ctggatttcc 3840
tggaagccct ggtgctaagg gggaggttgg tccggctggt agtcccggaa gtagcggtgc 3900
cccaggtcaa agaggcgaac caggccctca gggtcacgca ggagcacctg gaccgcctgg 3960
tcctcctggt tcgaatggtt cgcctggagg aaaaggtgaa atggggcccg caggaatccc 4020
cggtgcgcct ggtcttattg gtgccagggg tcctccaggc ccgccaggta caaatggtgt 4080
acccggacag cgaggagcag ctggtgaacc tggtaaaaac ggtgccaaag gagatccagg 4140
tcctcgtgga gagcgtggtg aagctggctc tcccggtatc gccggtccaa aaggtgagga 4200
cggtaaggac ggttcccctg gtgagccagg tgcgaacgga ctgccaggtg cagccggaga 4260
gcgaggagtc ccaggattca ggggaccagc cggtgctaac ggcttgcctg gtgaaaaagg 4320
gccccctggt gataggggag gacccggtcc agcaggccct cgtggagttg ctggtgagcc 4380
tggacgtgac ggtttaccag gagggccagg tttgaggggt attcccgggt cccctggcgg 4440
tcctggatcg gatggaaaac cagggccacc aggttcgcag ggtgaaacag gacgtccagg 4500
cccacccggc tcacctggtc caaggggtca gcctggtgtc atgggtttcc ccggtccaaa 4560
gggtaatgac ggagcaccgg gtaaaaatgg tgaacgtggt ggcccaggtg gtccaggacc 4620
ccaaggtcca gctggaaaaa acggtgagac aggtcctcaa ggacctccag gacctaccgg 4680
tcctagcgga gataagggag atacgggacc gccaggacct caaggattgc aaggtttgcc 4740
tggtacatct ggccctcccg gagaaaatgg taagcctgga gagccaggac caaaaggcga 4800
agctggagcc ccaggtatcc ccggaggtaa gggagactca ggtgctccgg gtgagcgtgg 4860
tcctccgggt gccggtggtc cacctggacc tagaggtggt gccgggccgc caggtcctga 4920
aggtggtaaa ggtgctgctg gtccaccggg accgcctggc tctgctggta ctcctggctt 4980
gcagggaatg ccaggagaga gaggtggacc tggaggtccc ggtccgaagg gtgataaagg 5040
ggagccagga tcatccggtg ttgacggcgc acctggtaaa gacggaccaa ggggaccaac 5100
gggtccaatc ggaccaccag gacccgctgg ccagccagga gataaaggcg agtccggagc 5160
acccggtgtt cctggtatag ctggacccag gggtggtccc ggtgaaagag gtgaacaggg 5220
cccaccgggt cccgccggtt tccctggcgc ccctggtcaa aatggagaac caggtgcaaa 5280
gggcgagaga ggagccccag gagaaaaggg tgagggagga ccacccggtg ctgccggtcc 5340
agctgggggt tcaggtcctg ctggaccacc aggtccacag ggcgttaaag gtgagagagg 5400
aagtccaggt ggtcctggag ctgctggatt cccaggtggc cgtggacctc ctggtccccc 5460
tggatcgaat ggtaatcctg gtccgccagg tagttcgggt gctcctggga aggacggtcc 5520
acctggcccc ccaggtagta acggtgcacc tggtagtcca ggtatatccg gacctaaagg 5580
agattccggt ccaccaggcg aaagaggggc cccaggccca cagggtccac caggagcccc 5640
cggtcctctg ggtattgctg gtcttactgg tgcacgtgga ctggccggtc cacccggaat 5700
gcctggagca agaggttcac ctggaccaca aggtattaaa ggagagaacg gtaaacctgg 5760
accttccggt caaaacggag agcggggacc cccaggcccc caaggtctgc caggactagc 5820
tggtaccgca ggggaaccag gaagagatgg aaatccaggt tcagacggac tacccggtag 5880
agatggtgca ccgggggcca agggcgacag gggtgagaat ggatctcctg gtgcgccagg 5940
ggcaccaggc cacccaggtc ccccaggtcc tgtgggccct gctggaaagt caggtgacag 6000
gggagagaca ggcccggctg gtccatctgg cgcacccgga ccagctggtt ccagaggccc 6060
acctggtccg caaggcccta gaggtgacaa gggagagact ggagaacgag gtgctatggg 6120
tatcaagggt catagaggtt ttccgggtaa tcccggcgcc ccaggttctc ctggtccagc 6180
tggccatcaa ggtgcagtcg gatcgcccgg cccagccggt cccaggggcc ctgttggtcc 6240
atccggtcct ccaggaaagg atggtgcttc tggacaccca ggacctatcg gacctccggg 6300
tcctagaggt aatagaggag aacgtggatc cgagggtagt cctggtcacc ctggtcaacc 6360
tggcccacca gggcctccag gtgcacccgg tccatgttgt ggtgcaggcg gtgtggctgc 6420
aattgctggt gtgggtgctg aaaaggccgg cggtttcgct ccatattatg gtgatgaacc 6480
gattgatttt aagatcaata ctgacgaaat catgacttcc ttaaagtccg ttaatggtca 6540
aattgagtct ctaatctccc cagatggttc acgtaaaaat cctgctagaa attgtagaga 6600
tttgaagttt tgtcaccccg agttgcagtc cggtgagtac tgggtggacc ccaatcaagg 6660
ttgtaagtta gacgctatta aagtttactg caatatggag acaggagaaa cttgcatcag 6720
cgcttctcca ttgactatcc cacaaaaaaa ttggtggact gactctggag ctgagaaaaa 6780
gcatgtatgg ttcggggaat cgatggaagg tggtttccaa ttcagctacg gtaaccctga 6840
acttcctgaa gatgttcttg acgttcaatt ggcatttctg agattgttgt ccagtcgtgc 6900
aagccaaaac attacatacc attgcaaaaa ttccatcgca tatatggatc atgctagcgg 6960
aaatgtgaaa aaggcattga agctgatggg atcaaatgaa ggtgaattta aagcagaggg 7020
taattctaag tttacttaca ctgtattgga ggatggttgt acgaagcata caggtgaatg 7080
gggtaaaaca gtgtttcaat atcaaacccg caaagcagtt agattgccaa tcgtcgatat 7140
cgcaccatac gacattggag gaccagatca agagttcgga gctgacatcg gtccggtgtg 7200
tttcctttga taatcaagag gatgtcagaa tgccatttgc ctgagagatg caggcttcat 7260
ttttgatact tttttatttg taacctatat agtataggat tttttttgtc attttgtttc 7320
ttctcgtacg agcttgctcc tgatcagcct atctcgcagc tgatgaatat cttgtggtag 7380
gggtttggga aaatcattcg agtttgatgt ttttcttggt atttcccact cctcttcaga 7440
gtacagaaga ttaagtgaga cgttcgtttg tgctccgga 7479
<210> 7
<211> 7356
<212> DNA
<213> 人工序列
<220>
<223> 胶原表达载体 - pCAT1-Col3A1
<400> 7
ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60
aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120
cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180
tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240
tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300
gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360
aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420
cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480
atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540
aattatccga aaaaattttc tagagtgttg ttactttata cttccggctc gtataatacg 600
acaaggtgta aggaggacta aaccatggct aaactcacct ctgctgttcc agtcctgact 660
gctcgtgatg ttgctggtgc tgttgagttc tggactgata ggctcggttt ctcccgtgac 720
ttcgtagagg acgactttgc cggtgttgta cgtgacgacg ttaccctgtt catctccgca 780
gttcaggacc aggttgtgcc agacaacact ctggcatggg tatgggttcg tggtctggac 840
gaactgtacg ctgagtggtc tgaggtcgtg tctaccaact tccgtgatgc atctggtcca 900
gctatgaccg agatcggtga acagccctgg ggtcgtgagt ttgcactgcg tgatccagct 960
ggtaactgcg tgcatttcgt cgcagaagag caggactaac aattgacacc ttacgattat 1020
ttagagagta tttattagtt ttattgtatg tatacggatg ttttattatc tatttatgcc 1080
cttatattct gtaactatcc aaaagtccta tcttatcaag ccagcaatct atgtccgcga 1140
acgtcaacta aaaataagct ttttatgctc ttctctcttt ttttcccttc ggtataatta 1200
taccttgcat ccacagattc tcctgccaaa ttttgcataa tcctttacaa catggctata 1260
tgggagcact tagcgccctc caaaacccat attgcctacg catgtatagg tgttttttcc 1320
acaatatttt ctctgtgctc tctttttatt aaagagaagc tctatatcgg agaagcttct 1380
gtggccgtta tattcggcct tatcgtggga ccacattgcc tgaattggtt tgccccggaa 1440
gattggggaa acttggatct gattacctta gctgcagaaa agggtaccac tgagcgtcag 1500
accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 1560
gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 1620
caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgttcttc 1680
tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 1740
ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 1800
tggacccaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 1860
gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 1920
tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 1980
gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 2040
gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 2100
ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 2160
ggccttttgc tcacatgtat ttaaattaat cgaactccga atgcggttct cctgtaacct 2220
taattgtagc atagatcact taaataaact catggcctga catctgtaca cgttcttatt 2280
ggtcttttag caatcttgaa gtctttctat tgttccggtc ggcattacct aataaattcg 2340
aatcgagatt gctagtacct gatatcatat gaagtaatca tcacatgcaa gttccatgat 2400
accctctact aatggaattg aacaaagttt aagcttctcg cacgagaccg aatccatact 2460
atgcacccct caaagttggg attagtcagg aaagctgagc aattaacttc cctcgattgg 2520
cctggacttt tcgcttagcc tgccgcaatc ggtaagtttc attatcccag cggggtgata 2580
gcctctgttg ctcatcaggc caaaatcata tataagctgt agacccagca cttcaattac 2640
ttgaaattca ccataacact tgctctagtc aagacttaca attaaaatga tgtcttttgt 2700
ccaaaagggt acttggttac tttttgctct gttgcaccca actgttattc tcgcacaaca 2760
ggaagcagta gatggtggtt gctcacattt aggtcaatct tacgcagata gagatgtatg 2820
gaaacctgaa ccatgtcaaa tttgcgtgtg tgactcaggt tcagtgctct gcgacgatat 2880
catatgtgac gaccaggaat tggactgtcc aaacccagag ataccattcg gtgaatgttg 2940
tgctgtttgt ccacagccac caactgctcc tacaagacct ccaaacggtc aaggtccaca 3000
aggtcctaaa ggtgatccgg gtccacctgg tattcctggt agaaatggtg accctggacc 3060
tcccggttcc ccaggtagcc caggatcacc tgggcctcct ggaatatgtg aatcctgccc 3120
aactggtggt cagaactata gcccacaata cgaggcctac gacgtcaaat ctggtgttgc 3180
tggaggaggt attgcaggct accctggtcc cgcagggccc ccaggtccgc cgggtccgcc 3240
cggaacatca ggtcatcccg gagcccctgg tgcaccaggt tatcagggac cgcccggaga 3300
gcctggacaa gctggtcccg ctggaccccc tggtccacca ggtgctattg gaccaagtgg 3360
tcctgccgga aaagacggtg aatccggtag acctggtaga cccggcgaaa ggggtttccc 3420
aggtcctccc ggaatgaagg gtccagccgg tatgcccggt tttcctggga tgaagggtca 3480
cagaggattt gatggtagaa acggagagaa aggcgaaacc ggtgctcccg gactgaaggg 3540
tgaaaacggt gtccctggtg agaacggcgc tcctggacct atgggtccac gtggtgctcc 3600
aggagaaaga ggcagaccag gattgcctgg tgcagctggt gctagaggta acgatggtgc 3660
ccgtggttcc gatggacaac ccgggccacc cggccctcca ggtaccgctg gatttcctgg 3720
aagccctggt gctaaggggg aggttggtcc ggctggtagt cccggaagta gcggtgcccc 3780
aggtcaaaga ggcgaaccag gccctcaggg tcacgcagga gcacctggac cgcctggtcc 3840
tcctggttcg aatggttcgc ctggaggaaa aggtgaaatg gggcccgcag gaatccccgg 3900
tgcgcctggt cttattggtg ccaggggtcc tccaggcccg ccaggtacaa atggtgtacc 3960
cggacagcga ggagcagctg gtgaacctgg taaaaacggt gccaaaggag atccaggtcc 4020
tcgtggagag cgtggtgaag ctggctctcc cggtatcgcc ggtccaaaag gtgaggacgg 4080
taaggacggt tcccctggtg agccaggtgc gaacggactg ccaggtgcag ccggagagcg 4140
aggagtccca ggattcaggg gaccagccgg tgctaacggc ttgcctggtg aaaaagggcc 4200
ccctggtgat aggggaggac ccggtccagc aggccctcgt ggagttgctg gtgagcctgg 4260
acgtgacggt ttaccaggag ggccaggttt gaggggtatt cccgggtccc ctggcggtcc 4320
tggatcggat ggaaaaccag ggccaccagg ttcgcagggt gaaacaggac gtccaggccc 4380
acccggctca cctggtccaa ggggtcagcc tggtgtcatg ggtttccccg gtccaaaggg 4440
taatgacgga gcaccgggta aaaatggtga acgtggtggc ccaggtggtc caggacccca 4500
aggtccagct ggaaaaaacg gtgagacagg tcctcaagga cctccaggac ctaccggtcc 4560
tagcggagat aagggagata cgggaccgcc aggacctcaa ggattgcaag gtttgcctgg 4620
tacatctggc cctcccggag aaaatggtaa gcctggagag ccaggaccaa aaggcgaagc 4680
tggagcccca ggtatccccg gaggtaaggg agactcaggt gctccgggtg agcgtggtcc 4740
tccgggtgcc ggtggtccac ctggacctag aggtggtgcc gggccgccag gtcctgaagg 4800
tggtaaaggt gctgctggtc caccgggacc gcctggctct gctggtactc ctggcttgca 4860
gggaatgcca ggagagagag gtggacctgg aggtcccggt ccgaagggtg ataaagggga 4920
gccaggatca tccggtgttg acggcgcacc tggtaaagac ggaccaaggg gaccaacggg 4980
tccaatcgga ccaccaggac ccgctggcca gccaggagat aaaggcgagt ccggagcacc 5040
cggtgttcct ggtatagctg gacccagggg tggtcccggt gaaagaggtg aacagggccc 5100
accgggtccc gccggtttcc ctggcgcccc tggtcaaaat ggagaaccag gtgcaaaggg 5160
cgagagagga gccccaggag aaaagggtga gggaggacca cccggtgctg ccggtccagc 5220
tgggggttca ggtcctgctg gaccaccagg tccacagggc gttaaaggtg agagaggaag 5280
tccaggtggt cctggagctg ctggattccc aggtggccgt ggacctcctg gtccccctgg 5340
atcgaatggt aatcctggtc cgccaggtag ttcgggtgct cctgggaagg acggtccacc 5400
tggcccccca ggtagtaacg gtgcacctgg tagtccaggt atatccggac ctaaaggaga 5460
ttccggtcca ccaggcgaaa gaggggcccc aggcccacag ggtccaccag gagcccccgg 5520
tcctctgggt attgctggtc ttactggtgc acgtggactg gccggtccac ccggaatgcc 5580
tggagcaaga ggttcacctg gaccacaagg tattaaagga gagaacggta aacctggacc 5640
ttccggtcaa aacggagagc ggggaccccc aggcccccaa ggtctgccag gactagctgg 5700
taccgcaggg gaaccaggaa gagatggaaa tccaggttca gacggactac ccggtagaga 5760
tggtgcaccg ggggccaagg gcgacagggg tgagaatgga tctcctggtg cgccaggggc 5820
accaggccac ccaggtcccc caggtcctgt gggccctgct ggaaagtcag gtgacagggg 5880
agagacaggc ccggctggtc catctggcgc acccggacca gctggttcca gaggcccacc 5940
tggtccgcaa ggccctagag gtgacaaggg agagactgga gaacgaggtg ctatgggtat 6000
caagggtcat agaggttttc cgggtaatcc cggcgcccca ggttctcctg gtccagctgg 6060
ccatcaaggt gcagtcggat cgcccggccc agccggtccc aggggccctg ttggtccatc 6120
cggtcctcca ggaaaggatg gtgcttctgg acacccagga cctatcggac ctccgggtcc 6180
tagaggtaat agaggagaac gtggatccga gggtagtcct ggtcaccctg gtcaacctgg 6240
cccaccaggg cctccaggtg cacccggtcc atgttgtggt gcaggcggtg tggctgcaat 6300
tgctggtgtg ggtgctgaaa aggccggcgg tttcgctcca tattatggtg atgaaccgat 6360
tgattttaag atcaatactg acgaaatcat gacttcctta aagtccgtta atggtcaaat 6420
tgagtctcta atctccccag atggttcacg taaaaatcct gctagaaatt gtagagattt 6480
gaagttttgt caccccgagt tgcagtccgg tgagtactgg gtggacccca atcaaggttg 6540
taagttagac gctattaaag tttactgcaa tatggagaca ggagaaactt gcatcagcgc 6600
ttctccattg actatcccac aaaaaaattg gtggactgac tctggagctg agaaaaagca 6660
tgtatggttc ggggaatcga tggaaggtgg tttccaattc agctacggta accctgaact 6720
tcctgaagat gttcttgacg ttcaattggc atttctgaga ttgttgtcca gtcgtgcaag 6780
ccaaaacatt acataccatt gcaaaaattc catcgcatat atggatcatg ctagcggaaa 6840
tgtgaaaaag gcattgaagc tgatgggatc aaatgaaggt gaatttaaag cagagggtaa 6900
ttctaagttt acttacactg tattggagga tggttgtacg aagcatacag gtgaatgggg 6960
taaaacagtg tttcaatatc aaacccgcaa agcagttaga ttgccaatcg tcgatatcgc 7020
accatacgac attggaggac cagatcaaga gttcggagct gacatcggtc cggtgtgttt 7080
cctttgataa tcaagaggat gtcagaatgc catttgcctg agagatgcag gcttcatttt 7140
tgatactttt ttatttgtaa cctatatagt ataggatttt ttttgtcatt ttgtttcttc 7200
tcgtacgagc ttgctcctga tcagcctatc tcgcagctga tgaatatctt gtggtagggg 7260
tttgggaaaa tcattcgagt ttgatgtttt tcttggtatt tcccactcct cttcagagta 7320
cagaagatta agtgagacgt tcgtttgtgc tccgga 7356
<210> 8
<211> 404
<212> DNA
<213> 人工序列
<220>
<223> AOX1着陆垫
<400> 8
agaagcgata gagagactgc gctaagcatt aatgagatta tttttgagca ttcgtcaatc 60
aataccaaac aagacaaacg gtatgccgac ttttggaagt ttctttttga ccaactggcc 120
gttagcattt caacgaacca aacttagttc atcttggatg agatcacgct tttgtcatat 180
taggttccaa gacagcgttt aaactgtcag ttttgggcca tttggggaac atgaaactat 240
ttgaccccac actcagaaag ccctcatctg gagtgatgtt cgggtgtaat gcggagcttg 300
ttgcattcgg aaataaacaa acatgaacct cgccaggggg gccaggatag acaggctaat 360
aaagtcatgg tgttagtagc ctaatagaag gaattggaat gagc 404
<210> 9
<211> 7942
<212> DNA
<213> 人工序列
<220>
<223> MMV63
<400> 9
ttctttcctg cggtacccag atccaattcc cgctttgact gcctgaaatc tccatcgcct 60
acaatgatga catttggatt tggttgactc atgttggtat tgtgaaatag acgcagatcg 120
ggaacactga aaaatacaca gttattattc atttaaataa catccaaaga cgaaaggttg 180
aatgaaacct ttttgccatc cgacatccac aggtccattc tcacacataa gtgccaaacg 240
caacaggagg ggatacacta gcagcagacc gttgcaaacg caggacctcc actcctcttc 300
tcctcaacac ccacttttgc catcgaaaaa ccagcccagt tattgggctt gattggagct 360
cgctcattcc aattccttct attaggctac taacaccatg actttattag cctgtctatc 420
ctggcccccc tggcgaggtt catgtttgtt tatttccgaa tgcaacaagc tccgcattac 480
acccgaacat cactccagat gagggctttc tgagtgtggg gtcaaatagt ttcatgttcc 540
ccaaatggcc caaaactgac agtttaaacg ctgtcttgga acctaatatg acaaaagcgt 600
gatctcatcc aagatgaact aagtttggtt cgttgaaatg ctaacggcca gttggtcaaa 660
aagaaacttc caaaagtcgg cataccgttt gtcttgtttg gtattgattg acgaatgctc 720
aaaaataatc tcattaatgc ttagcgcagt ctctctatcg cttctgaacc ccggtgcacc 780
tgtgccgaaa cgcaaatggg gaaacacccg ctttttggat gattatgcat tgtctccaca 840
ttgtatgctt ccaagattct ggtgggaata ctgctgatag cctaacgttc atgatcaaaa 900
tttaactgtt ctaaccccta cttgacagca atatataaac agaaggaagc tgccctgtct 960
taaacctttt tttttatcat cattattagc ttactttcat aattgcgact ggttccaatt 1020
gacaagcttt tgattttaac gacttttaac gacaacttga gaagatcaaa aaacaactaa 1080
ttattgaaag aattcaaaac gatgagcttt gtgcaaaagg ggacctggtt acttttcgct 1140
ctgcttcatc ccactgttat tttggcacaa caggaagctg ttgacggagg atgctcccat 1200
ctcggtcagt cttatgcaga tagagatgta tggaaaccag aaccgtgcca aatatgcgtc 1260
tgtgactcag gatccgttct ctgtgatgac ataatatgtg acgaccaaga attagactgc 1320
cccaaccctg aaatcccgtt tggagaatgt tgtgcagttt gcccacagcc tccaacagct 1380
cccactcgcc ctcctaatgg tcaaggacct caaggcccca agggagatcc aggtcctcct 1440
ggtattcctg ggcgaaatgg cgatcctggt cctccaggat caccaggctc cccaggttct 1500
cccggccctc ctggaatctg tgaatcatgt cctactggtg gccagaacta ttctccccag 1560
tacgaagcat atgatgtcaa gtctggagta gcaggaggag gaatcgcagg ctatcctggg 1620
ccagctggtc ctcctggccc acccggaccc cctggcacat ctggccatcc tggtgcccct 1680
ggcgctccag gataccaagg tccccccggt gaacctgggc aagctggtcc ggcaggtcct 1740
ccaggacctc ctggtgctat aggtccatct ggccctgctg gaaaagatgg ggaatcagga 1800
agacccggac gacctggaga gcgaggattt cctggccctc ctggtatgaa aggcccagct 1860
ggtatgcctg gattccctgg tatgaaagga cacagaggct ttgatggacg aaatggagag 1920
aaaggcgaaa ctggtgctcc tggattaaag ggggaaaatg gcgttccagg tgaaaatgga 1980
gctcctggac ccatgggtcc aagaggggct cccggtgaga gaggacggcc aggacttcct 2040
ggagccgcag gggctcgagg taatgatgga gctcgaggaa gtgatggaca accgggcccc 2100
cctggtcctc ctggaactgc aggattccct ggttcccctg gtgctaaggg tgaagttgga 2160
cctgcaggat ctcctggttc aagtggcgcc cctggacaaa gaggagaacc tggacctcag 2220
ggacatgctg gtgctccagg tccccctggg cctcctggga gtaatggtag tcctggtggc 2280
aaaggtgaaa tgggtcctgc tggcattcct ggggctcctg ggctgatagg agctcgtggt 2340
cctccagggc cacctggcac caatggtgtt cccgggcaac gaggtgctgc aggtgaaccc 2400
ggtaagaatg gagccaaagg agacccagga ccacgtgggg aacgcggaga agctggttct 2460
ccaggtatcg caggacctaa gggtgaagat ggcaaagatg gttctcctgg agaacctggt 2520
gcaaatggac ttcctggagc tgcaggagaa aggggtgtgc ctggattccg aggacctgct 2580
ggagcaaatg gccttccagg agaaaagggt cctcctgggg accgtggtgg cccaggccct 2640
gcagggccca gaggtgttgc tggagagccc ggcagagatg gtctccctgg aggtccagga 2700
ttgaggggta ttcctggtag ccccggagga ccaggcagtg atgggaaacc agggcctcct 2760
ggaagccaag gagagacggg tcgacccggt cctccaggtt cacctggtcc gcgaggccag 2820
cctggtgtca tgggcttccc tggtcccaaa ggaaacgatg gtgctcctgg aaaaaatgga 2880
gaacgaggtg gccctggagg tcctggccct cagggtcctg ctggaaagaa tggtgagacc 2940
ggacctcagg gtcctccagg acctactggc ccttctggtg acaaaggaga cacaggaccc 3000
cctggtccac aaggactaca aggcttgcct ggaacgagtg gtcccccagg agaaaacgga 3060
aaacctggtg aacctggtcc aaagggtgag gctggtgcac ctggaattcc aggaggcaag 3120
ggtgattctg gtgctcccgg tgaacgcgga cctcctggag caggagggcc ccctggacct 3180
agaggtggag ctggcccccc tggtcccgaa ggaggaaagg gtgctgctgg tccccctggg 3240
ccacctggtt ctgctggtac acctggtctg caaggaatgc ctggagaaag agggggtcct 3300
ggaggccctg gtccaaaggg tgataagggt gagcctggca gctcaggtgt cgatggtgct 3360
ccagggaaag atggtccacg gggtcccact ggtcccattg gtcctcctgg cccagctggt 3420
cagcctggag ataagggtga aagtggtgcc cctggagttc cgggtatagc tggtcctcgc 3480
ggtggccctg gtgagagagg cgaacagggg cccccaggac ctgctggctt ccctggtgct 3540
cctggccaga atggtgagcc tggtgctaaa ggagaaagag gcgctcctgg tgagaaaggt 3600
gaaggaggcc ctcccggagc cgcaggaccc gccggaggtt ctgggcctgc cggtccccca 3660
ggcccccaag gtgtcaaagg cgaacgtggc agtcctggtg gtcctggtgc tgctggcttc 3720
cccggtggtc gtggtcctcc tggccctcct ggcagtaatg gtaacccagg ccccccaggc 3780
tccagtggtg ctccaggcaa agatggtccc ccaggtccac ctggcagtaa tggtgctcct 3840
ggcagccccg ggatctctgg accaaagggt gattctggtc caccaggtga gaggggagca 3900
cctggccccc agggccctcc gggagctcca ggcccactag gaattgcagg acttactgga 3960
gcacgaggtc ttgcaggccc accaggcatg ccaggtgcta ggggcagccc cggcccacag 4020
ggcatcaagg gtgaaaatgg taaaccagga cctagtggtc agaatggaga acgtggtcct 4080
cctggccccc agggtcttcc tggtctggct ggtacagctg gtgagcctgg aagagatgga 4140
aaccctggat cagatggtct gccaggccga gatggagctc caggtgccaa gggtgaccgt 4200
ggtgaaaatg gctctcctgg tgcccctgga gctcctggtc acccaggccc tcctggtcct 4260
gtcggtccag ctggaaagag cggtgacaga ggagaaactg gccctgctgg tccttctggg 4320
gcccccggtc ctgccggatc aagaggtcct cctggtcccc aaggcccacg cggtgacaaa 4380
ggggaaaccg gtgagcgtgg tgctatgggc atcaaaggac atcgcggatt ccctggcaac 4440
ccaggggccc ccggatctcc gggtcccgct ggtcatcaag gtgcagttgg cagtccaggc 4500
cctgcaggcc ccagaggacc tgttggacct agcgggcccc ctggaaagga cggagcaagt 4560
ggacaccctg gtcccattgg accaccgggg ccccgaggta acagaggtga aagaggatct 4620
gagggctccc caggccaccc aggacaacca ggccctcctg gacctcctgg tgcccctggt 4680
ccatgttgtg gtgctggcgg ggttgctgcc attgctggtg ttggagccga aaaagctggt 4740
ggttttgccc catattatgg agatgaaccg atagatttca aaatcaacac cgatgagatt 4800
atgacctcac tcaaatcagt caatggacaa atagaaagcc tcattagtcc tgatggttcc 4860
cgtaaaaacc ctgcacggaa ctgcagggac ctgaaattct gccatcctga actccagagt 4920
ggagaatatt gggttgatcc taaccaaggt tgcaaattgg atgctattaa agtctactgt 4980
aacatggaaa ctggggaaac gtgcataagt gccagtcctt tgactatccc acagaagaac 5040
tggtggacag attctggtgc tgagaagaaa catgtttggt ttggagaatc catggagggt 5100
ggttttcagt ttagctatgg caatcctgaa cttcccgaag acgtcctcga tgtccagctg 5160
gcattcctcc gacttctctc cagccgggcc tctcagaaca tcacatatca ctgcaagaat 5220
agcattgcat acatggatca tgccagtggg aatgtaaaga aagccttgaa gctgatgggg 5280
tcaaatgaag gtgaattcaa ggctgaagga aatagcaaat tcacatacac agttctggag 5340
gatggttgca caaaacacac tggggaatgg ggcaaaacag tcttccagta tcaaacacgc 5400
aaggccgtca gactacctat tgtagatatt gcaccctatg atatcggtgg tcctgatcaa 5460
gaatttggtg cggacattgg ccctgtttgc tttttataaa ggggcggccg ctcaagagga 5520
tgtcagaatg ccatttgcct gagagatgca ggcttcattt ttgatacttt tttatttgta 5580
acctatatag tataggattt tttttgtcat tttgtttctt ctcgtacgag cttgctcctg 5640
atcagcctat ctcgcagcag atgaatatct tgtggtaggg gtttgggaaa atcattcgag 5700
tttgatgttt ttcttggtat ttcccactcc tcttcagagt acagaagatt aagtgaaacc 5760
ttcgtttgtg cggatccttc agtaatgtct tgtttctttt gttgcagtgg tgagccattt 5820
tgacttcgtg aaagtttctt tagaatagtt gtttccagag gccaaacatt ccacccgtag 5880
taaagtgcaa gcgtaggaag accaagactg gcataaatca ggtataagtg tcgagcactg 5940
gcaggtgatc ttctgaaagt ttctactagc agataagatc cagtagtcat gcatatggca 6000
acaatgtacc gtgtggatct aagaacgcgt cctactaacc ttcgcattcg ttggtccagt 6060
ttgttgttat cgatcaacgt gacaaggttg tcgattccgc gtaagcatgc atacccaagg 6120
acgcctgttg caattccaag tgagccagtt ccaacaatct ttgtaatatt agagcacttc 6180
attgtgttgc gcttgaaagt aaaatgcgaa caaattaaga gataatctcg aaaccgcgac 6240
ttcaaacgcc aatatgatgt gcggcacaca ataagcgttc atatccgctg ggtgactttc 6300
tcgctttaaa aaattatccg aaaaaatttt ctagagtgtt gttactttat acttccggct 6360
cgtataatac gacaaggtgt aaggaggact aaaccatggc taaactcacc tctgctgttc 6420
cagtcctgac tgctcgtgat gttgctggtg ctgttgagtt ctggactgat agactcggtt 6480
tctcccgtga cttcgtagag gacgactttg ccggtgttgt acgtgacgac gttaccctgt 6540
tcatctccgc agttcaggac caggttgtgc cagacaacac tctggcatgg gtatgggttc 6600
gtggtctgga cgaactgtac gctgagtggt ctgaggtcgt gtctaccaac ttccgtgatg 6660
catctggtcc agctatgacc gagatcggtg aacagccctg gggtcgtgag tttgcactgc 6720
gtgatccagc tggtaactgc gtgcatttcg tcgcagaaga gcaggactaa caattgacac 6780
cttacgatta tttagagagt atttattagt tttattgtat gtatacggat gttttattat 6840
ctatttatgc ccttatattc tgtaactatc caaaagtcct atcttatcaa gccagcaatc 6900
tatgtccgcg aacgtcaact aaaaataagc tttttatgct cttctctctt tttttccctt 6960
cggtataatt ataccttgca tccacagatt ctcctgccaa attttgcata atcctttaca 7020
acatggctat atgggagcac ttagcgccct ccaaaaccca tattgcctac gcatgtatag 7080
gtgttttttc cacaatattt tctctgtgct ctctttttat taaagagaag ctctatatcg 7140
gagaagcttc tgtggccgtt atattcggcc ttatcgtggg accacattgc ctgaattggt 7200
ttgccccgga agattgggga aacttggatc tgattacctt agctgcaggt accactgagc 7260
gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 7320
ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 7380
gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 7440
tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 7500
cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 7560
cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 7620
ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 7680
tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 7740
cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 7800
ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 7860
aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 7920
ttgctggcct tttgctcaca tg 7942
<210> 10
<211> 7954
<212> DNA
<213> 人工序列
<220>
<223> MMV77
<400> 10
ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct 60
tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa 120
ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gttcttctag 180
tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc 240
tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg 300
actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca 360
cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat 420
gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg 480
tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc 540
ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc 600
ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc 660
cttttgctca catgttcttt cctgcggtac ccagatccaa ttcccgcttt gactgcctga 720
aatctccatc gcctacaatg atgacatttg gatttggttg actcatgttg gtattgtgaa 780
atagacgcag atcgggaaca ctgaaaaata cacagttatt attcatttaa ataacatcca 840
aagacgaaag gttgaatgaa acctttttgc catccgacat ccacaggtcc attctcacac 900
ataagtgcca aacgcaacag gaggggatac actagcagca gaccgttgca aacgcaggac 960
ctccactcct cttctcctca acacccactt ttgccatcga aaaaccagcc cagttattgg 1020
gcttgattgg agctcgctca ttccaattcc ttctattagg ctactaacac catgacttta 1080
ttagcctgtc tatcctggcc cccctggcga ggttcatgtt tgtttatttc cgaatgcaac 1140
aagctccgca ttacacccga acatcactcc agatgagggc tttctgagtg tggggtcaaa 1200
tagtttcatg ttccccaaat ggcccaaaac tgacagttta aacgctgtct tggaacctaa 1260
tatgacaaaa gcgtgatctc atccaagatg aactaagttt ggttcgttga aatgctaacg 1320
gccagttggt caaaaagaaa cttccaaaag tcggcatacc gtttgtcttg tttggtattg 1380
attgacgaat gctcaaaaat aatctcatta atgcttagcg cagtctctct atcgcttctg 1440
aaccccggtg cacctgtgcc gaaacgcaaa tggggaaaca cccgcttttt ggatgattat 1500
gcattgtctc cacattgtat gcttccaaga ttctggtggg aatactgctg atagcctaac 1560
gttcatgatc aaaatttaac tgttctaacc cctacttgac agcaatatat aaacagaagg 1620
aagctgccct gtcttaaacc ttttttttta tcatcattat tagcttactt tcataattgc 1680
gactggttcc aattgacaag cttttgattt taacgacttt taacgacaac ttgagaagat 1740
caaaaaacaa ctaattattg aaagaattca aaacgatgat gtcttttgtc caaaagggta 1800
cttggttact ttttgctctg ttgcacccaa ctgttattct cgcacaacag gaagcagtag 1860
atggtggttg ctcacattta ggtcaatctt acgcagatag agatgtatgg aaacctgaac 1920
catgtcaaat ttgcgtgtgt gactcaggtt cagtgctctg cgacgatatc atatgtgacg 1980
accaggaatt ggactgtcca aacccagaga taccattcgg tgaatgttgt gctgtttgtc 2040
cacagccacc aactgctcct acaagacctc caaacggtca aggtccacaa ggtcctaaag 2100
gtgatccggg tccacctggt attcctggta gaaatggtga ccctggacct cccggttccc 2160
caggtagccc aggatcacct gggcctcctg gaatatgtga atcctgccca actggtggtc 2220
agaactatag cccacaatac gaggcctacg acgtcaaatc tggtgttgct ggaggaggta 2280
ttgcaggcta ccctggtccc gcagggcccc caggtccgcc gggtccgccc ggaacatcag 2340
gtcatcccgg agcccctggt gcaccaggtt atcagggacc gcccggagag cctggacaag 2400
ctggtcccgc tggaccccct ggtccaccag gtgctattgg accaagtggt cctgccggaa 2460
aagacggtga atccggtaga cctggtagac ccggcgaaag gggtttccca ggtcctcccg 2520
gaatgaaggg tccagccggt atgcccggtt ttcctgggat gaagggtcac agaggatttg 2580
atggtagaaa cggagagaaa ggcgaaaccg gtgctcccgg actgaagggt gaaaacggtg 2640
tccctggtga gaacggcgct cctggaccta tgggtccacg tggtgctcca ggagaaagag 2700
gcagaccagg attgcctggt gcagctggtg ctagaggtaa cgatggtgcc cgtggttccg 2760
atggacaacc cgggccaccc ggccctccag gtaccgctgg atttcctgga agccctggtg 2820
ctaaggggga ggttggtccg gctggtagtc ccggaagtag cggtgcccca ggtcaaagag 2880
gcgaaccagg ccctcagggt cacgcaggag cacctggacc gcctggtcct cctggttcga 2940
atggttcgcc tggaggaaaa ggtgaaatgg ggcccgcagg aatccccggt gcgcctggtc 3000
ttattggtgc caggggtcct ccaggcccgc caggtacaaa tggtgtaccc ggacagcgag 3060
gagcagctgg tgaacctggt aaaaacggtg ccaaaggaga tccaggtcct cgtggagagc 3120
gtggtgaagc tggctctccc ggtatcgccg gtccaaaagg tgaggacggt aaggacggtt 3180
cccctggtga gccaggtgcg aacggactgc caggtgcagc cggagagcga ggagtcccag 3240
gattcagggg accagccggt gctaacggct tgcctggtga aaaagggccc cctggtgata 3300
ggggaggacc cggtccagca ggccctcgtg gagttgctgg tgagcctgga cgtgacggtt 3360
taccaggagg gccaggtttg aggggtattc ccgggtcccc tggcggtcct ggatcggatg 3420
gaaaaccagg gccaccaggt tcgcagggtg aaacaggacg tccaggccca cccggctcac 3480
ctggtccaag gggtcagcct ggtgtcatgg gtttccccgg tccaaagggt aatgacggag 3540
caccgggtaa aaatggtgaa cgtggtggcc caggtggtcc aggaccccaa ggtccagctg 3600
gaaaaaacgg tgagacaggt cctcaaggac ctccaggacc taccggtcct agcggagata 3660
agggagatac gggaccgcca ggacctcaag gattgcaagg tttgcctggt acatctggcc 3720
ctcccggaga aaatggtaag cctggagagc caggaccaaa aggcgaagct ggagccccag 3780
gtatccccgg aggtaaggga gactcaggtg ctccgggtga gcgtggtcct ccgggtgccg 3840
gtggtccacc tggacctaga ggtggtgccg ggccgccagg tcctgaaggt ggtaaaggtg 3900
ctgctggtcc accgggaccg cctggctctg ctggtactcc tggcttgcag ggaatgccag 3960
gagagagagg tggacctgga ggtcccggtc cgaagggtga taaaggggag ccaggatcat 4020
ccggtgttga cggcgcacct ggtaaagacg gaccaagggg accaacgggt ccaatcggac 4080
caccaggacc cgctggccag ccaggagata aaggcgagtc cggagcaccc ggtgttcctg 4140
gtatagctgg acccaggggt ggtcccggtg aaagaggtga acagggccca ccgggtcccg 4200
ccggtttccc tggcgcccct ggtcaaaatg gagaaccagg tgcaaagggc gagagaggag 4260
ccccaggaga aaagggtgag ggaggaccac ccggtgctgc cggtccagct gggggttcag 4320
gtcctgctgg accaccaggt ccacagggcg ttaaaggtga gagaggaagt ccaggtggtc 4380
ctggagctgc tggattccca ggtggccgtg gacctcctgg tccccctgga tcgaatggta 4440
atcctggtcc gccaggtagt tcgggtgctc ctgggaagga cggtccacct ggccccccag 4500
gtagtaacgg tgcacctggt agtccaggta tatccggacc taaaggagat tccggtccac 4560
caggcgaaag aggggcccca ggcccacagg gtccaccagg agcccccggt cctctgggta 4620
ttgctggtct tactggtgca cgtggactgg ccggtccacc cggaatgcct ggagcaagag 4680
gttcacctgg accacaaggt attaaaggag agaacggtaa acctggacct tccggtcaaa 4740
acggagagcg gggaccccca ggcccccaag gtctgccagg actagctggt accgcagggg 4800
aaccaggaag agatggaaat ccaggttcag acggactacc cggtagagat ggtgcaccgg 4860
gggccaaggg cgacaggggt gagaatggat ctcctggtgc gccaggggca ccaggccacc 4920
caggtccccc aggtcctgtg ggccctgctg gaaagtcagg tgacagggga gagacaggcc 4980
cggctggtcc atctggcgca cccggaccag ctggttccag aggcccacct ggtccgcaag 5040
gccctagagg tgacaaggga gagactggag aacgaggtgc tatgggtatc aagggtcata 5100
gaggttttcc gggtaatccc ggcgccccag gttctcctgg tccagctggc catcaaggtg 5160
cagtcggatc gcccggccca gccggtccca ggggccctgt tggtccatcc ggtcctccag 5220
gaaaggatgg tgcttctgga cacccaggac ctatcggacc tccgggtcct agaggtaata 5280
gaggagaacg tggatccgag ggtagtcctg gtcaccctgg tcaacctggc ccaccagggc 5340
ctccaggtgc acccggtcca tgttgtggtg caggcggtgt ggctgcaatt gctggtgtgg 5400
gtgctgaaaa ggccggcggt ttcgctccat attatggtga tgaaccgatt gattttaaga 5460
tcaatactga cgaaatcatg acttccttaa agtccgttaa tggtcaaatt gagtctctaa 5520
tctccccaga tggttcacgt aaaaatcctg ctagaaattg tagagatttg aagttttgtc 5580
accccgagtt gcagtccggt gagtactggg tggaccccaa tcaaggttgt aagttagacg 5640
ctattaaagt ttactgcaat atggagacag gagaaacttg catcagcgct tctccattga 5700
ctatcccaca aaaaaattgg tggactgact ctggagctga gaaaaagcat gtatggttcg 5760
gggaatcgat ggaaggtggt ttccaattca gctacggtaa ccctgaactt cctgaagatg 5820
ttcttgacgt tcaattggca tttctgagat tgttgtccag tcgtgcaagc caaaacatta 5880
cataccattg caaaaattcc atcgcatata tggatcatgc tagcggaaat gtgaaaaagg 5940
cattgaagct gatgggatca aatgaaggtg aatttaaagc agagggtaat tctaagttta 6000
cttacactgt attggaggat ggttgtacga agcatacagg tgaatggggt aaaacagtgt 6060
ttcaatatca aacccgcaaa gcagttagat tgccaatcgt cgatatcgca ccatacgaca 6120
ttggaggacc agatcaagag ttcggagctg acatcggtcc ggtgtgtttc ctttgataag 6180
gttaaagggg cggccgctca agaggatgtc agaatgccat ttgcctgaga gatgcaggct 6240
tcatttttga tactttttta tttgtaacct atatagtata ggattttttt tgtcattttg 6300
tttcttctcg tacgagcttg ctcctgatca gcctatctcg cagcagatga atatcttgtg 6360
gtaggggttt gggaaaatca ttcgagtttg atgtttttct tggtatttcc cactcctctt 6420
cagagtacag aagattaagt gaaaccttcg tttgtgcgga tccttcagta atgtcttgtt 6480
tcttttgttg cagtggtgag ccattttgac ttcgtgaaag tttctttaga atagttgttt 6540
ccagaggcca aacattccac ccgtagtaaa gtgcaagcgt aggaagacca agactggcat 6600
aaatcaggta taagtgtcga gcactggcag gtgatcttct gaaagtttct actagcagat 6660
aagatccagt agtcatgcat atggcaacaa tgtaccgtgt ggatctaaga acgcgtccta 6720
ctaaccttcg cattcgttgg tccagtttgt tgttatcgat caacgtgaca aggttgtcga 6780
ttccgcgtaa gcatgcatac ccaaggacgc ctgttgcaat tccaagtgag ccagttccaa 6840
caatctttgt aatattagag cacttcattg tgttgcgctt gaaagtaaaa tgcgaacaaa 6900
ttaagagata atctcgaaac cgcgacttca aacgccaata tgatgtgcgg cacacaataa 6960
gcgttcatat ccgctgggtg actttctcgc tttaaaaaat tatccgaaaa aattttctag 7020
agtgttgtta ctttatactt ccggctcgta taatacgaca aggtgtaagg aggactaaac 7080
catggctaaa ctcacctctg ctgttccagt cctgactgct cgtgatgttg ctggtgctgt 7140
tgagttctgg actgatagac tcggtttctc ccgtgacttc gtagaggacg actttgccgg 7200
tgttgtacgt gacgacgtta ccctgttcat ctccgcagtt caggaccagg ttgtgccaga 7260
caacactctg gcatgggtat gggttcgtgg tctggacgaa ctgtacgctg agtggtctga 7320
ggtcgtgtct accaacttcc gtgatgcatc tggtccagct atgaccgaga tcggtgaaca 7380
gccctggggt cgtgagtttg cactgcgtga tccagctggt aactgcgtgc atttcgtcgc 7440
agaagaacag gactaacaat tgacacctta cgattattta gagagtattt attagtttta 7500
ttgtatgtat acggatgttt tattatctat ttatgccctt atattctgta actatccaaa 7560
agtcctatct tatcaagcca gcaatctatg tccgcgaacg tcaactaaaa ataagctttt 7620
tatgctgttc tctctttttt tcccttcggt ataattatac cttgcatcca cagattctcc 7680
tgccaaattt tgcataatcc tttacaacat ggctatatgg gagcacttag cgccctccaa 7740
aacccatatt gcctacgcat gtataggtgt tttttccaca atattttctc tgtgctctct 7800
ttttattaaa gagaagctct atatcggaga agcttctgtg gccgttatat tcggccttat 7860
cgtgggacca cattgcctga attggtttgc cccggaagat tggggaaact tggatctgat 7920
taccttagct gcaggtacca ctgagcgtca gacc 7954
<210> 11
<211> 7356
<212> DNA
<213> 人工序列
<220>
<223> MMV129
<400> 11
ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60
aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120
cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180
tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240
tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300
gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360
aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420
cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480
atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540
aattatccga aaaaattttc tagagtgttg ttactttata cttccggctc gtataatacg 600
acaaggtgta aggaggacta aaccatggct aaactcacct ctgctgttcc agtcctgact 660
gctcgtgatg ttgctggtgc tgttgagttc tggactgata ggctcggttt ctcccgtgac 720
ttcgtagagg acgactttgc cggtgttgta cgtgacgacg ttaccctgtt catctccgca 780
gttcaggacc aggttgtgcc agacaacact ctggcatggg tatgggttcg tggtctggac 840
gaactgtacg ctgagtggtc tgaggtcgtg tctaccaact tccgtgatgc atctggtcca 900
gctatgaccg agatcggtga acagccctgg ggtcgtgagt ttgcactgcg tgatccagct 960
ggtaactgcg tgcatttcgt cgcagaagag caggactaac aattgacacc ttacgattat 1020
ttagagagta tttattagtt ttattgtatg tatacggatg ttttattatc tatttatgcc 1080
cttatattct gtaactatcc aaaagtccta tcttatcaag ccagcaatct atgtccgcga 1140
acgtcaacta aaaataagct ttttatgctc ttctctcttt ttttcccttc ggtataatta 1200
taccttgcat ccacagattc tcctgccaaa ttttgcataa tcctttacaa catggctata 1260
tgggagcact tagcgccctc caaaacccat attgcctacg catgtatagg tgttttttcc 1320
acaatatttt ctctgtgctc tctttttatt aaagagaagc tctatatcgg agaagcttct 1380
gtggccgtta tattcggcct tatcgtggga ccacattgcc tgaattggtt tgccccggaa 1440
gattggggaa acttggatct gattacctta gctgcagaaa agggtaccac tgagcgtcag 1500
accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 1560
gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 1620
caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgttcttc 1680
tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 1740
ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 1800
tggacccaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 1860
gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 1920
tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 1980
gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 2040
gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 2100
ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 2160
ggccttttgc tcacatgtat ttaaattaat cgaactccga atgcggttct cctgtaacct 2220
taattgtagc atagatcact taaataaact catggcctga catctgtaca cgttcttatt 2280
ggtcttttag caatcttgaa gtctttctat tgttccggtc ggcattacct aataaattcg 2340
aatcgagatt gctagtacct gatatcatat gaagtaatca tcacatgcaa gttccatgat 2400
accctctact aatggaattg aacaaagttt aagcttctcg cacgagaccg aatccatact 2460
atgcacccct caaagttggg attagtcagg aaagctgagc aattaacttc cctcgattgg 2520
cctggacttt tcgcttagcc tgccgcaatc ggtaagtttc attatcccag cggggtgata 2580
gcctctgttg ctcatcaggc caaaatcata tataagctgt agacccagca cttcaattac 2640
ttgaaattca ccataacact tgctctagtc aagacttaca attaaaatga tgtcttttgt 2700
ccaaaagggt acttggttac tttttgctct gttgcaccca actgttattc tcgcacaaca 2760
ggaagcagta gatggtggtt gctcacattt aggtcaatct tacgcagata gagatgtatg 2820
gaaacctgaa ccatgtcaaa tttgcgtgtg tgactcaggt tcagtgctct gcgacgatat 2880
catatgtgac gaccaggaat tggactgtcc aaacccagag ataccattcg gtgaatgttg 2940
tgctgtttgt ccacagccac caactgctcc tacaagacct ccaaacggtc aaggtccaca 3000
aggtcctaaa ggtgatccgg gtccacctgg tattcctggt agaaatggtg accctggacc 3060
tcccggttcc ccaggtagcc caggatcacc tgggcctcct ggaatatgtg aatcctgccc 3120
aactggtggt cagaactata gcccacaata cgaggcctac gacgtcaaat ctggtgttgc 3180
tggaggaggt attgcaggct accctggtcc cgcagggccc ccaggtccgc cgggtccgcc 3240
cggaacatca ggtcatcccg gagcccctgg tgcaccaggt tatcagggac cgcccggaga 3300
gcctggacaa gctggtcccg ctggaccccc tggtccacca ggtgctattg gaccaagtgg 3360
tcctgccgga aaagacggtg aatccggtag acctggtaga cccggcgaaa ggggtttccc 3420
aggtcctccc ggaatgaagg gtccagccgg tatgcccggt tttcctggga tgaagggtca 3480
cagaggattt gatggtagaa acggagagaa aggcgaaacc ggtgctcccg gactgaaggg 3540
tgaaaacggt gtccctggtg agaacggcgc tcctggacct atgggtccac gtggtgctcc 3600
aggagaaaga ggcagaccag gattgcctgg tgcagctggt gctagaggta acgatggtgc 3660
ccgtggttcc gatggacaac ccgggccacc cggccctcca ggtaccgctg gatttcctgg 3720
aagccctggt gctaaggggg aggttggtcc ggctggtagt cccggaagta gcggtgcccc 3780
aggtcaaaga ggcgaaccag gccctcaggg tcacgcagga gcacctggac cgcctggtcc 3840
tcctggttcg aatggttcgc ctggaggaaa aggtgaaatg gggcccgcag gaatccccgg 3900
tgcgcctggt cttattggtg ccaggggtcc tccaggcccg ccaggtacaa atggtgtacc 3960
cggacagcga ggagcagctg gtgaacctgg taaaaacggt gccaaaggag atccaggtcc 4020
tcgtggagag cgtggtgaag ctggctctcc cggtatcgcc ggtccaaaag gtgaggacgg 4080
taaggacggt tcccctggtg agccaggtgc gaacggactg ccaggtgcag ccggagagcg 4140
aggagtccca ggattcaggg gaccagccgg tgctaacggc ttgcctggtg aaaaagggcc 4200
ccctggtgat aggggaggac ccggtccagc aggccctcgt ggagttgctg gtgagcctgg 4260
acgtgacggt ttaccaggag ggccaggttt gaggggtatt cccgggtccc ctggcggtcc 4320
tggatcggat ggaaaaccag ggccaccagg ttcgcagggt gaaacaggac gtccaggccc 4380
acccggctca cctggtccaa ggggtcagcc tggtgtcatg ggtttccccg gtccaaaggg 4440
taatgacgga gcaccgggta aaaatggtga acgtggtggc ccaggtggtc caggacccca 4500
aggtccagct ggaaaaaacg gtgagacagg tcctcaagga cctccaggac ctaccggtcc 4560
tagcggagat aagggagata cgggaccgcc aggacctcaa ggattgcaag gtttgcctgg 4620
tacatctggc cctcccggag aaaatggtaa gcctggagag ccaggaccaa aaggcgaagc 4680
tggagcccca ggtatccccg gaggtaaggg agactcaggt gctccgggtg agcgtggtcc 4740
tccgggtgcc ggtggtccac ctggacctag aggtggtgcc gggccgccag gtcctgaagg 4800
tggtaaaggt gctgctggtc caccgggacc gcctggctct gctggtactc ctggcttgca 4860
gggaatgcca ggagagagag gtggacctgg aggtcccggt ccgaagggtg ataaagggga 4920
gccaggatca tccggtgttg acggcgcacc tggtaaagac ggaccaaggg gaccaacggg 4980
tccaatcgga ccaccaggac ccgctggcca gccaggagat aaaggcgagt ccggagcacc 5040
cggtgttcct ggtatagctg gacccagggg tggtcccggt gaaagaggtg aacagggccc 5100
accgggtccc gccggtttcc ctggcgcccc tggtcaaaat ggagaaccag gtgcaaaggg 5160
cgagagagga gccccaggag aaaagggtga gggaggacca cccggtgctg ccggtccagc 5220
tgggggttca ggtcctgctg gaccaccagg tccacagggc gttaaaggtg agagaggaag 5280
tccaggtggt cctggagctg ctggattccc aggtggccgt ggacctcctg gtccccctgg 5340
atcgaatggt aatcctggtc cgccaggtag ttcgggtgct cctgggaagg acggtccacc 5400
tggcccccca ggtagtaacg gtgcacctgg tagtccaggt atatccggac ctaaaggaga 5460
ttccggtcca ccaggcgaaa gaggggcccc aggcccacag ggtccaccag gagcccccgg 5520
tcctctgggt attgctggtc ttactggtgc acgtggactg gccggtccac ccggaatgcc 5580
tggagcaaga ggttcacctg gaccacaagg tattaaagga gagaacggta aacctggacc 5640
ttccggtcaa aacggagagc ggggaccccc aggcccccaa ggtctgccag gactagctgg 5700
taccgcaggg gaaccaggaa gagatggaaa tccaggttca gacggactac ccggtagaga 5760
tggtgcaccg ggggccaagg gcgacagggg tgagaatgga tctcctggtg cgccaggggc 5820
accaggccac ccaggtcccc caggtcctgt gggccctgct ggaaagtcag gtgacagggg 5880
agagacaggc ccggctggtc catctggcgc acccggacca gctggttcca gaggcccacc 5940
tggtccgcaa ggccctagag gtgacaaggg agagactgga gaacgaggtg ctatgggtat 6000
caagggtcat agaggttttc cgggtaatcc cggcgcccca ggttctcctg gtccagctgg 6060
ccatcaaggt gcagtcggat cgcccggccc agccggtccc aggggccctg ttggtccatc 6120
cggtcctcca ggaaaggatg gtgcttctgg acacccagga cctatcggac ctccgggtcc 6180
tagaggtaat agaggagaac gtggatccga gggtagtcct ggtcaccctg gtcaacctgg 6240
cccaccaggg cctccaggtg cacccggtcc atgttgtggt gcaggcggtg tggctgcaat 6300
tgctggtgtg ggtgctgaaa aggccggcgg tttcgctcca tattatggtg atgaaccgat 6360
tgattttaag atcaatactg acgaaatcat gacttcctta aagtccgtta atggtcaaat 6420
tgagtctcta atctccccag atggttcacg taaaaatcct gctagaaatt gtagagattt 6480
gaagttttgt caccccgagt tgcagtccgg tgagtactgg gtggacccca atcaaggttg 6540
taagttagac gctattaaag tttactgcaa tatggagaca ggagaaactt gcatcagcgc 6600
ttctccattg actatcccac aaaaaaattg gtggactgac tctggagctg agaaaaagca 6660
tgtatggttc ggggaatcga tggaaggtgg tttccaattc agctacggta accctgaact 6720
tcctgaagat gttcttgacg ttcaattggc atttctgaga ttgttgtcca gtcgtgcaag 6780
ccaaaacatt acataccatt gcaaaaattc catcgcatat atggatcatg ctagcggaaa 6840
tgtgaaaaag gcattgaagc tgatgggatc aaatgaaggt gaatttaaag cagagggtaa 6900
ttctaagttt acttacactg tattggagga tggttgtacg aagcatacag gtgaatgggg 6960
taaaacagtg tttcaatatc aaacccgcaa agcagttaga ttgccaatcg tcgatatcgc 7020
accatacgac attggaggac cagatcaaga gttcggagct gacatcggtc cggtgtgttt 7080
cctttgataa tcaagaggat gtcagaatgc catttgcctg agagatgcag gcttcatttt 7140
tgatactttt ttatttgtaa cctatatagt ataggatttt ttttgtcatt ttgtttcttc 7200
tcgtacgagc ttgctcctga tcagcctatc tcgcagctga tgaatatctt gtggtagggg 7260
tttgggaaaa tcattcgagt ttgatgtttt tcttggtatt tcccactcct cttcagagta 7320
cagaagatta agtgagacgt tcgtttgtgc tccgga 7356
<210> 12
<211> 7879
<212> DNA
<213> 人工序列
<220>
<223> MMV130
<400> 12
ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60
aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120
cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180
tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240
tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300
gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360
aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420
cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480
atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540
aattatccga aaaaattttc tagagtgttg ttactttata cttccggctc gtataatacg 600
acaaggtgta aggaggacta aaccatggct aaactcacct ctgctgttcc agtcctgact 660
gctcgtgatg ttgctggtgc tgttgagttc tggactgata ggctcggttt ctcccgtgac 720
ttcgtagagg acgactttgc cggtgttgta cgtgacgacg ttaccctgtt catctccgca 780
gttcaggacc aggttgtgcc agacaacact ctggcatggg tatgggttcg tggtctggac 840
gaactgtacg ctgagtggtc tgaggtcgtg tctaccaact tccgtgatgc atctggtcca 900
gctatgaccg agatcggtga acagccctgg ggtcgtgagt ttgcactgcg tgatccagct 960
ggtaactgcg tgcatttcgt cgcagaagag caggactaac aattgacacc ttacgattat 1020
ttagagagta tttattagtt ttattgtatg tatacggatg ttttattatc tatttatgcc 1080
cttatattct gtaactatcc aaaagtccta tcttatcaag ccagcaatct atgtccgcga 1140
acgtcaacta aaaataagct ttttatgctc ttctctcttt ttttcccttc ggtataatta 1200
taccttgcat ccacagattc tcctgccaaa ttttgcataa tcctttacaa catggctata 1260
tgggagcact tagcgccctc caaaacccat attgcctacg catgtatagg tgttttttcc 1320
acaatatttt ctctgtgctc tctttttatt aaagagaagc tctatatcgg agaagcttct 1380
gtggccgtta tattcggcct tatcgtggga ccacattgcc tgaattggtt tgccccggaa 1440
gattggggaa acttggatct gattacctta gctgcagaaa agggtaccac tgagcgtcag 1500
accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 1560
gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 1620
caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgttcttc 1680
tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 1740
ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 1800
tggacccaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 1860
gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 1920
tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 1980
gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 2040
gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 2100
ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 2160
ggccttttgc tcacatgtat ttcagaagcg atagagagac tgcgctaagc attaatgaga 2220
ttatttttga gcattcgtca atcaatacca aacaagacaa acggtatgcc gacttttgga 2280
agtttctttt tgaccaactg gccgttagca tttcaacgaa ccaaacttag ttcatcttgg 2340
atgagatcac gcttttgtca tattaggttc caagacagcg tttaaactgt cagttttggg 2400
ccatttgggg aacatgaaac tatttgaccc cacactcaga aagccctcat ctgagtgatg 2460
ttcgggtgta atgcggagct tgttgcattc ggaaataaac aaacatgaac ctcgccaggg 2520
gggccaggat agacaggcta ataaagtcat ggtgttagta gcctaataga aggaattgga 2580
ataaataatg tatctaaacg caaactccga gctggaaaaa tgttaccggc gatgcgcgga 2640
caatttagag gcggcgatca agaaacacct gctgggcgag cagtctggag cacagtcttc 2700
gatgggcccg agatcccacc gcgttcctgg gtaccgggac gtgaggcagc gcgacatcca 2760
tcaaatatac caggcgccaa ccgagtctct cggaaaacag cttctggata tcttccgctg 2820
gcggcgcaac gacgaataat agtccctgga ggtgacggaa tatatatgtg tggagggtaa 2880
atctgacagg gtgtagcaaa ggtaatattt tcctaaaaca tgcaatcggc tgccccgcaa 2940
cgggaaaaag aatgactttg gcactcttca ccagagtggg gtgtcccgct cgtgtgtgca 3000
aataggctcc cactggtcac cccggatttt gcagaaaaac agcaagttcc ggggtgtctc 3060
actggtgtcc gccaataaga ggagccggca ggcacggagt ctacatcaag ctgtctccga 3120
tacactcgac taccatccgg gtctctcaga gaggggaatg gcactataaa taccgcctcc 3180
ttgcgctctc tgccttcatc aatcaaatca tgatgtcttt tgtccaaaag ggtacttggt 3240
tactttttgc tctgttgcac ccaactgtta ttctcgcaca acaggaagca gtagatggtg 3300
gttgctcaca tttaggtcaa tcttacgcag atagagatgt atggaaacct gaaccatgtc 3360
aaatttgcgt gtgtgactca ggttcagtgc tctgcgacga tatcatatgt gacgaccagg 3420
aattggactg tccaaaccca gagataccat tcggtgaatg ttgtgctgtt tgtccacagc 3480
caccaactgc tcctacaaga cctccaaacg gtcaaggtcc acaaggtcct aaaggtgatc 3540
cgggtccacc tggtattcct ggtagaaatg gtgaccctgg acctcccggt tccccaggta 3600
gcccaggatc acctgggcct cctggaatat gtgaatcctg cccaactggt ggtcagaact 3660
atagcccaca atacgaggcc tacgacgtca aatctggtgt tgctggagga ggtattgcag 3720
gctaccctgg tcccgcaggg cccccaggtc cgccgggtcc gcccggaaca tcaggtcatc 3780
ccggagcccc tggtgcacca ggttatcagg gaccgcccgg agagcctgga caagctggtc 3840
ccgctggacc ccctggtcca ccaggtgcta ttggaccaag tggtcctgcc ggaaaagacg 3900
gtgaatccgg tagacctggt agacccggcg aaaggggttt cccaggtcct cccggaatga 3960
agggtccagc cggtatgccc ggttttcctg ggatgaaggg tcacagagga tttgatggta 4020
gaaacggaga gaaaggcgaa accggtgctc ccggactgaa gggtgaaaac ggtgtccctg 4080
gtgagaacgg cgctcctgga cctatgggtc cacgtggtgc tccaggagaa agaggcagac 4140
caggattgcc tggtgcagct ggtgctagag gtaacgatgg tgcccgtggt tccgatggac 4200
aacccgggcc acccggccct ccaggtaccg ctggatttcc tggaagccct ggtgctaagg 4260
gggaggttgg tccggctggt agtcccggaa gtagcggtgc cccaggtcaa agaggcgaac 4320
caggccctca gggtcacgca ggagcacctg gaccgcctgg tcctcctggt tcgaatggtt 4380
cgcctggagg aaaaggtgaa atggggcccg caggaatccc cggtgcgcct ggtcttattg 4440
gtgccagggg tcctccaggc ccgccaggta caaatggtgt acccggacag cgaggagcag 4500
ctggtgaacc tggtaaaaac ggtgccaaag gagatccagg tcctcgtgga gagcgtggtg 4560
aagctggctc tcccggtatc gccggtccaa aaggtgagga cggtaaggac ggttcccctg 4620
gtgagccagg tgcgaacgga ctgccaggtg cagccggaga gcgaggagtc ccaggattca 4680
ggggaccagc cggtgctaac ggcttgcctg gtgaaaaagg gccccctggt gataggggag 4740
gacccggtcc agcaggccct cgtggagttg ctggtgagcc tggacgtgac ggtttaccag 4800
gagggccagg tttgaggggt attcccgggt cccctggcgg tcctggatcg gatggaaaac 4860
cagggccacc aggttcgcag ggtgaaacag gacgtccagg cccacccggc tcacctggtc 4920
caaggggtca gcctggtgtc atgggtttcc ccggtccaaa gggtaatgac ggagcaccgg 4980
gtaaaaatgg tgaacgtggt ggcccaggtg gtccaggacc ccaaggtcca gctggaaaaa 5040
acggtgagac aggtcctcaa ggacctccag gacctaccgg tcctagcgga gataagggag 5100
atacgggacc gccaggacct caaggattgc aaggtttgcc tggtacatct ggccctcccg 5160
gagaaaatgg taagcctgga gagccaggac caaaaggcga agctggagcc ccaggtatcc 5220
ccggaggtaa gggagactca ggtgctccgg gtgagcgtgg tcctccgggt gccggtggtc 5280
cacctggacc tagaggtggt gccgggccgc caggtcctga aggtggtaaa ggtgctgctg 5340
gtccaccggg accgcctggc tctgctggta ctcctggctt gcagggaatg ccaggagaga 5400
gaggtggacc tggaggtccc ggtccgaagg gtgataaagg ggagccagga tcatccggtg 5460
ttgacggcgc acctggtaaa gacggaccaa ggggaccaac gggtccaatc ggaccaccag 5520
gacccgctgg ccagccagga gataaaggcg agtccggagc acccggtgtt cctggtatag 5580
ctggacccag gggtggtccc ggtgaaagag gtgaacaggg cccaccgggt cccgccggtt 5640
tccctggcgc ccctggtcaa aatggagaac caggtgcaaa gggcgagaga ggagccccag 5700
gagaaaaggg tgagggagga ccacccggtg ctgccggtcc agctgggggt tcaggtcctg 5760
ctggaccacc aggtccacag ggcgttaaag gtgagagagg aagtccaggt ggtcctggag 5820
ctgctggatt cccaggtggc cgtggacctc ctggtccccc tggatcgaat ggtaatcctg 5880
gtccgccagg tagttcgggt gctcctggga aggacggtcc acctggcccc ccaggtagta 5940
acggtgcacc tggtagtcca ggtatatccg gacctaaagg agattccggt ccaccaggcg 6000
aaagaggggc cccaggccca cagggtccac caggagcccc cggtcctctg ggtattgctg 6060
gtcttactgg tgcacgtgga ctggccggtc cacccggaat gcctggagca agaggttcac 6120
ctggaccaca aggtattaaa ggagagaacg gtaaacctgg accttccggt caaaacggag 6180
agcggggacc cccaggcccc caaggtctgc caggactagc tggtaccgca ggggaaccag 6240
gaagagatgg aaatccaggt tcagacggac tacccggtag agatggtgca ccgggggcca 6300
agggcgacag gggtgagaat ggatctcctg gtgcgccagg ggcaccaggc cacccaggtc 6360
ccccaggtcc tgtgggccct gctggaaagt caggtgacag gggagagaca ggcccggctg 6420
gtccatctgg cgcacccgga ccagctggtt ccagaggccc acctggtccg caaggcccta 6480
gaggtgacaa gggagagact ggagaacgag gtgctatggg tatcaagggt catagaggtt 6540
ttccgggtaa tcccggcgcc ccaggttctc ctggtccagc tggccatcaa ggtgcagtcg 6600
gatcgcccgg cccagccggt cccaggggcc ctgttggtcc atccggtcct ccaggaaagg 6660
atggtgcttc tggacaccca ggacctatcg gacctccggg tcctagaggt aatagaggag 6720
aacgtggatc cgagggtagt cctggtcacc ctggtcaacc tggcccacca gggcctccag 6780
gtgcacccgg tccatgttgt ggtgcaggcg gtgtggctgc aattgctggt gtgggtgctg 6840
aaaaggccgg cggtttcgct ccatattatg gtgatgaacc gattgatttt aagatcaata 6900
ctgacgaaat catgacttcc ttaaagtccg ttaatggtca aattgagtct ctaatctccc 6960
cagatggttc acgtaaaaat cctgctagaa attgtagaga tttgaagttt tgtcaccccg 7020
agttgcagtc cggtgagtac tgggtggacc ccaatcaagg ttgtaagtta gacgctatta 7080
aagtttactg caatatggag acaggagaaa cttgcatcag cgcttctcca ttgactatcc 7140
cacaaaaaaa ttggtggact gactctggag ctgagaaaaa gcatgtatgg ttcggggaat 7200
cgatggaagg tggtttccaa ttcagctacg gtaaccctga acttcctgaa gatgttcttg 7260
acgttcaatt ggcatttctg agattgttgt ccagtcgtgc aagccaaaac attacatacc 7320
attgcaaaaa ttccatcgca tatatggatc atgctagcgg aaatgtgaaa aaggcattga 7380
agctgatggg atcaaatgaa ggtgaattta aagcagaggg taattctaag tttacttaca 7440
ctgtattgga ggatggttgt acgaagcata caggtgaatg gggtaaaaca gtgtttcaat 7500
atcaaacccg caaagcagtt agattgccaa tcgtcgatat cgcaccatac gacattggag 7560
gaccagatca agagttcgga gctgacatcg gtccggtgtg tttcctttga taatcaagag 7620
gatgtcagaa tgccatttgc ctgagagatg caggcttcat ttttgatact tttttatttg 7680
taacctatat agtataggat tttttttgtc attttgtttc ttctcgtacg agcttgctcc 7740
tgatcagcct atctcgcagc tgatgaatat cttgtggtag gggtttggga aaatcattcg 7800
agtttgatgt ttttcttggt atttcccact cctcttcaga gtacagaaga ttaagtgaga 7860
cgttcgtttg tgctccgga 7879
<210> 13
<211> 7963
<212> DNA
<213> 人工序列
<220>
<223> MMV78
<400> 13
aattgacacc ttacgattat ttagagagta tttattagtt ttattgtatg tatacggatg 60
ttttattatc tatttatgcc cttatattct gtaactatcc aaaagtccta tcttatcaag 120
ccagcaatct atgtccgcga acgtcaacta aaaataagct ttttatgctg ttctctcttt 180
ttttcccttc ggtataatta taccttgcat ccacagattc tcctgccaaa ttttgcataa 240
tcctttacaa catggctata tgggagcact tagcgccctc caaaacccat attgcctacg 300
catgtatagg tgttttttcc acaatatttt ctctgtgctc tctttttatt aaagagaagc 360
tctatatcgg agaagcttct gtggccgtta tattcggcct tatcgtggga ccacattgcc 420
tgaattggtt tgccccggaa gattggggaa acttggatct gattacctta gctgcaggta 480
ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct 540
gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc 600
ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc 660
aaatactgtt cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc 720
gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc 780
gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg 840
aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata 900
cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta 960
tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc 1020
ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg 1080
atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt 1140
cctggccttt tgctggcctt ttgctcacat gtcgcacaaa cgaaggtttc acttaatctt 1200
ctgtactctg aagaggagtg ggaaatacca agaaaaacat caaactcgaa tgattttccc 1260
aaacccctac cacaagatat tcatctgctg cgagataggc tgatcaggag caagctcgta 1320
cgagaagaaa caaaatgaca aaaaaaatcc tatactatat aggttacaaa taaaaaagta 1380
tcaaaaatga agcctgcatc tctcaggcaa atggcattct gacatcctct tgaaaattat 1440
cattctaatt ctgacaatgt gcatggcctc ctaaactctt gacctctctc atgcagccac 1500
ttattggaaa cccacttatt accgactaag acgggacaag cagcatgtct agtgctgtaa 1560
tcaccttctc cagatgcaaa cagattgtac caaaatacgg ccgtgccctt tttaggccaa 1620
acagaagcac ctacctcagg gaaaactgtg gctcctccag caagcacatc ggacatatag 1680
aacaaccacg ttgcgattct atttccagta cctagctcct taaaagcatc aggctcgtcc 1740
tttctggcga aatcaaagtg gggttcatac tgaccgccca caccatagtt ggcaacttgt 1800
agttcctcag cagtgcttac gtcaagacca gtcaaatctt gaatacgcat attgatacgg 1860
ctgaccacgg gattctcgta accggacaac catgctgatt tagagacacg atattgtgcg 1920
gtagtcaatt ttccagtctc agggtcatgg acggtagccc tactcaatct tggtttggcc 1980
aagtctttca caacctctat ttctgcatcg gagatgatgt catgaaaacg aatgattcta 2040
ggcttgtccc attcatcttc ctgtttcgct ggagcaagaa tgaattttgg gttacggttc 2100
ccatcatgat atctacagaa cagctttttc tgtctccttg gagtcatctt gataccctct 2160
cctctacaca gcatttcata cttttgtctc tctgggaggt agtcaacagc tgcacctttt 2220
tttttcagag tggtcttttg atcggattgg tcatcggacg aggacttatt tgcgtccttt 2280
tccttagcca tgatgtattc aaagtatttc agattaccgt tagctctttg atgctccggg 2340
tccagctcca acaacttttt agttaaaagt agagctttgt ccagatcacc ttgctggtaa 2400
acagcgtatg ataagtaatc caaaactgaa accttatcaa cggtagaaac ttcaccttcg 2460
tccaactgac gcagagcttg ctccatccat aattctgtgt gatagtagtc ggcttctgta 2520
tatgcgactt ttcccaattc aaaacaatct tccacagtga ggaaggactt atgcttcaca 2580
ccaggtaaat cacccttcga tatcgtgtcg gtgtccaaat tgtatgtgtc ctgcaatcgc 2640
aacaaagctt ttgctgctcc tacttggtcc tcatcgtttg gaaagtattg tctttgaatt 2700
gttaagttag aaatgaatcc atcactcata tctttaagta ccaagttttc caattctgac 2760
cactctgtat taagtctctt catcagcttg aaagcattca ctgggtgacc cacaaaaccc 2820
tcaggatctt ttgttgcagt actagtcaat ctatcgagtt tctctgccca ctttttgatt 2880
tgctccaact tatcctcttc agctttgata tagtctttaa ggcttgtaac taggtctttt 2940
tctgtgtgaa tcaaatcagt catctgtcct atagaagtga agaagcctgg gtgagccagt 3000
gactgtggca acaaaatacc aacgactagg atataccaaa tcatttttga tgtttgatag 3060
tttgataaga gtgaacttta gtgtttagag gggttataat ttgttgtaac tggttttggt 3120
cttaagttaa aacgaacttg ttatattaaa cacaacggtc actcaggata caagaatagg 3180
aaagaaaaac tttaaactgg ggacatgttg tctttatata atttggcggt taacccttaa 3240
tgcccgtttc cgtctcttca tgataacaaa gctgcccatc tatgactgaa tgtggagaag 3300
tatcggaaca acccttcact aaggatatct aggctaaact cattcgcgcc ttagatttct 3360
ccaaggtatc ggttaagttt cctctttcgt actggctaac gatggtgttg ctcaacaaag 3420
ggatggaacg gcagctaaag ggagtgcatg gaatgacttt aattggctga gaaagtgttc 3480
tatttgtccg aatttctttt ttctattatc tgttcgtttg ggcggatctc tccagtgggg 3540
ggtaaatgga agatttctgt tcatggggta aggaagctga aatccttcgt ttcttatagg 3600
ggcaagtata ctaaatctcg gaacattgaa tggggtttac tttcattggc tacagaaatt 3660
attaagtttg ttatggggtg aagttaccag taattttcat tttttcactt caacttttgg 3720
ggtatttctg tggggtagca tagagcaatg atataaacaa caattgagtg acaggtctac 3780
tttgttctca aaaggccata accatctgtt tgcatctctt atcaccacac catcctcctc 3840
atctggcctt caattgtggg gaacaactag catcccaaca ccagactaac tccacccaga 3900
tgaaaccagt tgtcgcttac cagtcaatga atgttgagct aacgttcctt gaaactcgaa 3960
tgatcccagc cttgctgcgt atcatccctc cgctattccg ccgcttgctc caaccatgtt 4020
tccgcctttt tcgaacaagt tcaaatacct atctttggca ggacttttcc tcctgccttt 4080
tttagcctca gctctcggtt agcctctagg caaattctgg tcttcatacc tatatcaact 4140
tttcatcaga tagcctttgg gttcaaaaaa gaactaaagc aggatgcctg atatataaat 4200
cccagatgat ctgcttttga aactattttc agtatcttga ttcgtttact tacaaacaac 4260
tattgttgat tttatctgga gaataatcga acaaaatgag attcccatct attttcaccg 4320
ctgtcttgtt cgctgcctcc tctgcattgg ctgcccctgt taacactacc actgaagacg 4380
agactgctca aattccagct gaagcagtta tcggttactc tgaccttgag ggtgatttcg 4440
acgtcgctgt tttgcctttc tctaactcca ctaacaacgg tttgttgttc attaacacca 4500
ctatcgcttc cattgctgct aaggaagagg gtgtctctct cgagaaaaga gaggccgaag 4560
ctgcacccga tgaggaagat catgttttag tattgcataa aggaaatttc gatgaagctt 4620
tggccgctca caaatatctg ctcgtcgagt tttacgctcc ctggtgcggt cattgtaagg 4680
cccttgcacc agagtacgcc aaggcagctg gtaagttaaa ggccgaaggt tcagagatca 4740
gattagcaaa agttgatgct acagaagagt ccgatcttgc tcaacaatac ggggttcgag 4800
gatacccaac aattaagttt ttcaaaaatg gtgatactgc ttccccaaag gaatatactg 4860
ctggtagaga ggcagacgac atagtcaact ggctcaaaaa gagaacgggc ccagctgcgt 4920
ctacattaag cgacggagca gcagccgaag ctcttgtgga atctagtgaa gttgctgtaa 4980
tcggtttctt taaggacatg gaatctgatt cagctaaaca gttcctttta gcagctgaag 5040
caatcgatga catccctttc ggaatcacct caaatagtga cgtgttcagc aagtaccaac 5100
ttgacaaaga tggagtggtc ttgttcaaaa agtttgacga aggcagaaac aatttcgagg 5160
gtgaggttac aaaggagaaa ctgcttgatt tcattaaaca taaccaacta cccttagtta 5220
tcgaattcac tgaacaaact gctcctaaga ttttcggtgg agaaatcaaa acacatatct 5280
tgttgttttt gccaaagtcc gtatcggatt atgaaggtaa actctccaat ttcaaaaagg 5340
ccgctgagag ctttaagggc aagattttgt tcatctttat tgactcagac cacacagaca 5400
atcagaggat tttggagttt ttcggtttga aaaaggagga atgtccagca gtccgtttga 5460
tcaccttgga ggaggagatg accaaataca aaccagagtc ggatgagttg actgccgaga 5520
agataacaga attttgtcac agatttctgg aaggtaagat caagcctcat cttatgtctc 5580
aagagttgcc tgatgactgg gataagcaac cagttaaagt attggtgggt aaaaactttg 5640
aggaagtggc cttcgacgag aaaaaaaatg tctttgttga attctatgct ccgtggtgtg 5700
gtcactgtaa gcagctggca ccaatttggg ataaactggg tgaaacttac aaagatcacg 5760
aaaacattgt tattgcaaag atggacagta ctgctaacga agtggaggct gtgaaagttc 5820
actccttccc tacgctgaag ttctttcctg catctgctga cagaactgtt atcgactata 5880
atggagagag gacattggat ggttttaaaa agtttcttga atccggaggt caagacggag 5940
ctggtgacga cgatgatttg gaagatctgg aggaggctga ggaacctgat cttgaggagg 6000
atgacgacca gaaggcagtc aaagatgaac tgtgataagg ggcggccgct caagaggatg 6060
tcagaatgcc atttgcctga gagatgcagg cttcattttt gatacttttt tatttgtaac 6120
ctatatagta taggattttt tttgtcattt tgtttcttct cgtacgagct tgctcctgat 6180
cagcctatct cgcagcagat gaatatcttg tggtaggggt ttgggaaaat cattcgagtt 6240
tgatgttttt cttggtattt cccactcctc ttcagagtac agaagattaa gtgaaacctt 6300
cgtttgtgcg gatccttcag taatgtcttg tttcttttgt tgcagtggtg agccattttg 6360
acttcgtgaa agtttcttta gaatagttgt ttccagaggc caaacattcc acccgtagta 6420
aagtgcaagc gtaggaagac caagactggc ataaatcagg tataagtgtc gagcactggc 6480
aggtgatctt ctgaaagttt ctactagcag ataagatcca gtagtcatgc atatggcaac 6540
aatgtaccgt gtggatctaa gaacgcgtcc tactaacctt cgcattcgtt ggtccagttt 6600
gttgttatcg atcaacgtga caaggttgtc gattccgcgt aagcatgcat acccaaggac 6660
gcctgttgca attccaagtg agccagttcc aacaatcttt gtaatattag agcacttcat 6720
tgtgttgcgc ttgaaagtaa aatgcgaaca aattaagaga taatctcgaa accgcgactt 6780
caaacgccaa tatgatgtgc ggcacacaat aagcgttcat atccgctggg tgactttctc 6840
gctttaaaaa attatccgaa aaaattttct agagtgttga cactttatac ttccggctcg 6900
tataatacga caaggtgtaa ggaggactaa accatgaaaa agccagagct tacagcaacg 6960
agcgttgaga aattcttgat tgaaaagttt gattcagttt ccgacctgat gcagttgtct 7020
gagggtgaag agtcaagagc cttttcgttc gatgtgggtg gtagaggtta cgtccttagg 7080
gtgaactctt gtgccgatgg tttttacaaa gatagatatg tttacagaca tttcgcatcc 7140
gcagcactcc ccatcccaga agtattggac attggagagt tttccgaatc cttgacctat 7200
tgcatctctc gacgtgccca aggtgtcact ttacaagact tgccggagac tgaacttcca 7260
gcagttttac aacctgtagc agaggctatg gacgctattg ctgctgctga tttgtctcaa 7320
acaagtggat tcggcccttt tggtcctcag ggtatcgggc aatacacaac ttggagagac 7380
tttatctgtg ctatcgcaga cccacatgtg tatcactggc aaaccgtcat ggatgacact 7440
gtatcggcta gtgtggccca agctcttgat gagctaatgc tgtgggctga ggactgtcca 7500
gaagtgaggc acttggttca cgcagacttt ggatccaata atgttctgac agataacgga 7560
cgtataacag ctgtcattga ctggtccgaa gctatgttcg gtgattcaca atatgaagtc 7620
gctaacatat tcttttggcg tccctggtta gcatgtatgg agcaacaaac tagatatttc 7680
gaacgtagac atcctgaact agctggatct ccaagattga gagcttacat gctgaggatc 7740
ggtttggatc agctgtacca gagcttggta gacggaaatt tcgacgacgc cgcatgggcg 7800
caaggtagat gcgatgccat tgtgagaagt ggtgctggca ctgttggtag aacccagatt 7860
gcaagacgtt cagctgctgt ttggacggat ggttgtgttg aggttttggc agattccgga 7920
aatcgtagac ctagcactag gccaagagct aaggaataat agc 7963
<210> 14
<211> 5508
<212> DNA
<213> 人工序列
<220>
<223> MMV94
<400> 14
aacatccaaa gacgaaaggt tgaatgaaac ctttttgcca tccgacatcc acaggtccat 60
tctcacacat aagtgccaaa cgcaacagga ggggatacac tagcagcaga ccgttgcaaa 120
cgcaggacct ccactcctct tctcctcaac acccactttt gccatcgaaa aaccagccca 180
gttattgggc ttgattggag ctcgctcatt ccaattcctt ctattaggct actaacacca 240
tgactttatt agcctgtcta tcctggcccc cctggcgagg ttcatgtttg tttatttccg 300
aatgcaacaa gctccgcatt acacccgaac atcactccag atgagggctt tctgagtgtg 360
gggtcaaata gtttcatgtt ccccaaatgg cccaaaactg acagtttaaa cgctgtcttg 420
gaacctaata tgacaaaagc gtgatctcat ccaagatgaa ctaagtttgg ttcgttgaaa 480
tgctaacggc cagttggtca aaaagaaact tccaaaagtc ggcataccgt ttgtcttgtt 540
tggtattgat tgacgaatgc tcaaaaataa tctcattaat gcttagcgca gtctctctat 600
cgcttctgaa ccccggtgca cctgtgccga aacgcaaatg gggaaacacc cgctttttgg 660
atgattatgc attgtctcca cattgtatgc ttccaagatt ctggtgggaa tactgctgat 720
agcctaacgt tcatgatcaa aatttaactg ttctaacccc tacttgacag caatatataa 780
acagaaggaa gctgccctgt cttaaacctt tttttttatc atcattatta gcttactttc 840
ataattgcga ctggttccaa ttgacaagct tttgatttta acgactttta acgacaactt 900
gagaagatca aaaaacaact aattattgaa agaattcatg ttctctccaa ttttgtcctt 960
ggaaattatt ttagctttgg ctactttgca atctgtcttc gctgcccccg acgaggagga 1020
ccacgtcctg gtgctccata agggcaactt cgacgaggcg ctggcggccc acaagtacct 1080
gctggtggag ttctacgccc catggtgcgg ccactgcaag gctctggccc cggagtatgc 1140
caaagcagct gggaagctga aggcagaagg ttctgagatc agactggcca aggtggatgc 1200
cactgaagag tctgacctgg cccagcagta tggtgtccga ggctacccca ccatcaagtt 1260
cttcaagaat ggagacacag cttcccccaa agagtacaca gctggccgag aagcggatga 1320
tatcgtgaac tggctgaaga agcgcacggg ccccgctgcc agcacgctgt ccgacggggc 1380
tgctgcagag gccttggtgg agtccagtga ggtggccgtc attggcttct tcaaggacat 1440
ggagtcggac tccgcaaagc agttcttgtt ggcagcagag gccattgatg acatcccctt 1500
cgggatcaca tctaacagcg atgtgttctc caaataccag ctggacaagg atggggttgt 1560
cctctttaag aagtttgacg aaggccggaa caactttgag ggggaggtca ccaaagaaaa 1620
gcttctggac ttcatcaagc acaaccagtt gcccctggtc attgagttca ccgagcagac 1680
agccccgaag atcttcggag gggaaatcaa gactcacatc ctgctgttcc tgccgaaaag 1740
cgtgtctgac tatgagggca agctgagcaa cttcaaaaaa gcggctgaga gcttcaaggg 1800
caagatcctg tttatcttca tcgacagcga ccacactgac aaccagcgca tcctggaatt 1860
cttcggccta aagaaagagg agtgcccggc cgtgcgcctc atcacgctgg aggaggagat 1920
gaccaaatat aagccagagt cagatgagct gacggcagag aagatcaccg agttctgcca 1980
ccgcttcctg gagggcaaga ttaagcccca cctgatgagc caggagctgc ctgacgactg 2040
ggacaagcag cctgtcaaag tgctggttgg gaagaacttt gaagaggttg cttttgatga 2100
gaaaaagaac gtctttgtag agttctatgc cccgtggtgc ggtcactgca agcagctggc 2160
ccccatctgg gataagctgg gagagacgta caaggaccac gagaacatag tcatcgccaa 2220
gatggactcc acggccaacg aggtggaggc ggtgaaagtg cacagcttcc ccacgctcaa 2280
gttcttcccc gccagcgccg acaggacggt catcgactac aatggggagc ggacactgga 2340
tggttttaag aagttcctgg agagtggtgg ccaggatggg gccggagatg atgacgatct 2400
agaagatctt gaagaagcag aagagcctga tctggaggaa gatgatgatc aaaaagctgt 2460
gaaagatgaa ctgtaagcgg ccgctcaaga ggatgtcaga atgccatttg cctgagagat 2520
gcaggcttca tttttgatac ttttttattt gtaacctata tagtatagga ttttttttgt 2580
cattttgttt cttctcgtac gagcttgctc ctgatcagcc tatctcgcag cagatgaata 2640
tcttgtggta ggggtttggg aaaatcattc gagtttgatg tttttcttgg tatttcccac 2700
tcctcttcag agtacagaag attaagtgaa accttcgttt gtgcggatcc ttcagtaatg 2760
tcttgtttct tttgttgcag tggtgagcca ttttgacttc gtgaaagttt ctttagaata 2820
gttgtttcca gaggccaaac attccacccg tagtaaagtg caagcgtagg aagaccaaga 2880
ctggcataaa tcaggtataa gtgtcgagca ctggcaggtg atcttctgaa agtttctact 2940
agcagataag atccagtagt catgcatatg gcaacaatgt accgtgtgga tctaagaacg 3000
cgtcctacta accttcgcat tcgttggtcc agtttgttgt tatcgatcaa cgtgacaagg 3060
ttgtcgattc cgcgtaagca tgcataccca aggacgcctg ttgcaattcc aagtgagcca 3120
gttccaacaa tctttgtaat attagagcac ttcattgtgt tgcgcttgaa agtaaaatgc 3180
gaacaaatta agagataatc tcgaaaccgc gacttcaaac gccaatatga tgtgcggcac 3240
acaataagcg ttcatatccg ctgggtgact ttctcgcttt aaaaaattat ccgaaaaaat 3300
tttctagagt gttgacactt tatacttccg gctcgtataa tacgacaagg tgtaaggagg 3360
actaaaccat gggtaaggaa aagactcacg tttcgaggcc gcgattaaat tccaacatgg 3420
atgctgattt atatgggtat aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa 3480
tctatcgatt gtatgggaag cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta 3540
gcgttgccaa tgatgttaca gatgagatgg tcagactaaa ctggctgacg gaatttatgc 3600
ctcttccgac catcaagcat tttatccgta ctcctgatga tgcatggtta ctcaccactg 3660
cgatccccgg caaaacagca ttccaggtat tagaagaata tcctgattca ggtgaaaata 3720
ttgttgatgc gctggcagtg ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc 3780
cttttaacag cgatcgcgta tttcgtctcg ctcaggcgca atcacgaatg aataacggtt 3840
tggttgatgc gagtgatttt gatgacgagc gtaatggctg gcctgttgaa caagtctgga 3900
aagaaatgca taagcttttg ccattctcac cggattcagt cgtcactcat ggtgatttct 3960
cacttgataa ccttattttt gacgagggga aattaatagg ttgtattgat gttggacgag 4020
tcggaatcgc agaccgatac caggatcttg ccatcctatg gaactgcctc ggtgagtttt 4080
ctccttcatt acagaaacgg ctttttcaaa aatatggtat tgataatcct gatatgaata 4140
aattgcagtt tcatttgatg ctcgatgagt ttttctaaca attgacacct tacgattatt 4200
tagagagtat ttattagttt tattgtatgt atacggatgt tttattatct atttatgccc 4260
ttatattctg taactatcca aaagtcctat cttatcaagc cagcaatcta tgtccgcgaa 4320
cgtcaactaa aaataagctt tttatgctgt tctctctttt tttcccttcg gtataattat 4380
accttgcatc cacagattct cctgccaaat tttgcataat cctttacaac atggctatat 4440
gggagcactt agcgccctcc aaaacccata ttgcctacgc atgtataggt gttttttcca 4500
caatattttc tctgtgctct ctttttatta aagagaagct ctatatcgga gaagcttctg 4560
tggccgttat attcggcctt atcgtgggac cacattgcct gaattggttt gccccggaag 4620
attggggaaa cttggatctg attaccttag ctgcaggtac cactgagcgt cagaccccgt 4680
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 4740
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 4800
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta 4860
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 4920
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 4980
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 5040
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 5100
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 5160
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 5220
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 5280
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 5340
tgctcacatg ttctttcctg cggtacccag atccaattcc cgctttgact gcctgaaatc 5400
tccatcgcct acaatgatga catttggatt tggttgactc atgttggtat tgtgaaatag 5460
acgcagatcg ggaacactga aaaatacaca gttattattc atttaaat 5508
<210> 15
<211> 7605
<212> DNA
<213> 人工序列
<220>
<223> MMV156
<400> 15
tgcaggtacc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 60
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 120
tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 180
cagataccaa atactgttct tctagtgtag ccgtagttag gccaccactt caagaactct 240
gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 300
gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 360
tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 420
ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 480
gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 540
ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 600
tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 660
ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc ggtacccaga 720
tccaattccc gctttgactg cctgaaatct ccatcgccta caatgatgac atttggattt 780
ggttgactca tgttggtatt gtgaaataga cgcagatcgg gaacactgaa aaatacacag 840
ttattattca tttcagaagc gatagagaga ctgcgctaag cattaatgag attatttttg 900
agcattcgtc aatcaatacc aaacaagaca aacggtatgc cgacttttgg aagtttcttt 960
ttgaccaact ggccgttagc atttcaacga accaaactta gttcatcttg gatgagatca 1020
cgcttttgtc atattaggtt ccaagacagc gtttaaactg tcagttttgg gccatttggg 1080
gaacatgaaa ctatttgacc ccacactcag aaagccctca tctggagtga tgttcgggtg 1140
taatgcggag cttgttgcat tcggaaataa acaaacatga acctcgccag gggggccagg 1200
atagacaggc taataaagtc atggtgttag tagcctaata gaaggaattg gaataaatga 1260
cccttgtgac tgacactttg ggagtcccta ttctacttag tctcatatcg catgaaactt 1320
ttgataaatt attttctgat aggaattttt catcagatat tatcatcgcg gcttacgtaa 1380
taacaaaaaa aattgatgga gtctatacta ggctaacata aactaagtta ttaattaaac 1440
aaaacaaaac gtactagcat tactgtcata tataagggct cctaactaaa actgtaaaga 1500
cttcccgtaa aattatcatt ctaattctga caatgtgcat ggcctcctaa actcttgacc 1560
tctctcatgc agccacttat tggaaaccca cttattaccg actaagacgg gacaagcagc 1620
atgtctagtg ctgtaatcac cttctccaga tgcaaacaga ttgtaccaaa atacggccgt 1680
gcccttttta ggccaaacag aagcacctac ctcagggaaa actgtggctc ctccagcaag 1740
cacatcggac atatagaaca accacgttgc gattctattt ccagtaccta gctccttaaa 1800
agcatcaggc tcgtcctttc tggcgaaatc aaagtggggt tcatactgac cgcccacacc 1860
atagttggca acttgtagtt cctcagcagt gcttacgtca agaccagtca aatcttgaat 1920
acgcatattg atacggctga ccacgggatt ctcgtaaccg gacaaccatg ctgatttaga 1980
gacacgatat tgtgcggtag tcaattttcc agtctcaggg tcatggacgg tagccctact 2040
caatcttggt ttggccaagt ctttcacaac ctctatttct gcatcggaga tgatgtcatg 2100
aaaacgaatg attctaggct tgtcccattc atcttcctgt ttcgctggag caagaatgaa 2160
ttttgggtta cggttcccat catgatatct acagaacagc tttttctgtc tccttggagt 2220
catcttgata ccctctcctc tacacagcat ttcatacttt tgtctctctg ggaggtagtc 2280
aacagctgca cctttttttt tcagagtggt cttttgatcg gattggtcat cggacgagga 2340
cttatttgcg tccttttcct tagccatgat gtattcaaag tatttcagat taccgttagc 2400
tctttgatgc tccgggtcca gctccaacaa ctttttagtt aaaagtagag ctttgtccag 2460
atcaccttgc tggtaaacag cgtatgataa gtaatccaaa actgaaacct tatcaacggt 2520
agaaacttca ccttcgtcca actgacgcag agcttgctcc atccataatt ctgtgtgata 2580
gtagtcggct tctgtatatg cgacttttcc caattcaaaa caatcttcca cagtgaggaa 2640
ggacttatgc ttcacaccag gtaaatcacc cttcgatatc gtgtcggtgt ccaaattgta 2700
tgtgtcctgc aatcgcaaca aagcttttgc tgctcctact tggtcctcat cgtttggaaa 2760
gtattgtctt tgaattgtta agttagaaat gaatccatca ctcatatctt taagtaccaa 2820
gttttccaat tctgaccact ctgtattaag tctcttcatc agcttgaaag cattcactgg 2880
gtgacccaca aaaccctcag gatcttttgt tgcagtacta gtcaatctat cgagtttctc 2940
tgcccacttt ttgatttgct ccaacttatc ctcttcagct ttgatatagt ctttaaggct 3000
tgtaactagg tctttttctg tgtgaatcaa atcagtcatc tgtcctatag aagtgaagaa 3060
gcctgggtga gccagtgact gtggcaacaa aataccaacg actaggatat accaaatcat 3120
gcggcctgtt gtagttttaa tatagtttga gtatgagatg gaactcagaa cgaaggaatt 3180
atcaccagtt tatatattct gaggaaaggg tgtgtcctaa attggacagt cacgatggca 3240
ataaacgctc agccaatcag aatgcaggag ccataaattg ttgtattatt gctgcaagat 3300
ttatgtgggt tcacattcca ctgaatggtt ttcactgtag aattggtgtc ctagttgtta 3360
tgtttcgaga tgttttcaag aaaaactaaa atgcacaaac tgaccaataa tgtgccgtcg 3420
cgcttggtac aaacgtcagg attgccacca cttttttcgc actctggtac aaaagttcgc 3480
acttcccact cgtatgtaac gaaaaacaga gcagtctatc cagaacgaga caaattagcg 3540
cgtactgtcc cattccataa ggtatcatag gaaacgagag tcctcccccc atcacgtata 3600
tataaacaca ctgatatccc acatccgctt gtcaccaaac taatacatcc agttcaagtt 3660
acctaaacaa atcaaagcat gagattccca tctattttca ccgctgtctt gttcgctgcc 3720
tcctctgcat tggctgcacc cgatgaggaa gatcatgttt tagtattgca taaaggaaat 3780
ttcgatgaag ctttggccgc tcacaaatat ctgctcgtcg agttttacgc tccctggtgc 3840
ggtcattgta aggcccttgc accagagtac gccaaggcag ctggtaagtt aaaggccgaa 3900
ggttcagaga tcagattagc aaaagttgat gctacagaag agtccgatct tgctcaacaa 3960
tacggggttc gaggataccc aacaattaag tttttcaaaa atggtgatac tgcttcccca 4020
aaggaatata ctgctggtag agaggcagac gacatagtca actggctcaa aaagagaacg 4080
ggcccagctg cgtctacatt aagcgacgga gcagcagccg aagctcttgt ggaatctagt 4140
gaagttgctg taatcggttt ctttaaggac atggaatctg attcagctaa acagttcctt 4200
ttagcagctg aagcaatcga tgacatccct ttcggaatca cctcaaatag tgacgtgttc 4260
agcaagtacc aacttgacaa agatggagtg gtcttgttca aaaagtttga cgaaggcaga 4320
aacaatttcg agggtgaggt tacaaaggag aaactgcttg atttcattaa acataaccaa 4380
ctacccttag ttatcgaatt cactgaacaa actgctccta agattttcgg tggagaaatc 4440
aaaacacata tcttgttgtt tttgccaaag tccgtatcgg attatgaagg taaactctcc 4500
aatttcaaaa aggccgctga gagctttaag ggcaagattt tgttcatctt tattgactca 4560
gaccacacag acaatcagag gattttggag tttttcggtt tgaaaaagga ggaatgtcca 4620
gcagtccgtt tgatcacctt ggaggaggag atgaccaaat acaaaccaga gtcggatgag 4680
ttgactgccg agaagataac agaattttgt cacagatttc tggaaggtaa gatcaagcct 4740
catcttatgt ctcaagagtt gcctgatgac tgggataagc aaccagttaa agtattggtg 4800
ggtaaaaact ttgaggaagt ggccttcgac gagaaaaaaa atgtctttgt tgaattctat 4860
gctccgtggt gtggtcactg taagcagctg gcaccaattt gggataaact gggtgaaact 4920
tacaaagatc acgaaaacat tgttattgca aagatggaca gtactgctaa cgaagtggag 4980
gctgtgaaag ttcactcctt ccctacgctg aagttctttc ctgcatctgc tgacagaact 5040
gttatcgact ataatggaga gaggacattg gatggtttta aaaagtttct tgaatccgga 5100
ggtcaagacg gagctggtga cgacgatgat ttggaagatc tggaggaggc tgaggaacct 5160
gatcttgagg aggatgacga ccagaaggca gtcaaagatg aactgtgata aggggtcaag 5220
aggatgtcag aatgccattt gcctgagaga tgcaggcttc atttttgata cttttttatt 5280
tgtaacctat atagtatagg attttttttg tcattttgtt tcttctcgta cgagcttgct 5340
cctgatcagc ctatctcgca gcagatgaat atcttgtggt aggggtttgg gaaaatcatt 5400
cgagtttgat gtttttcttg gtatttccca ctcctcttca gagtacagaa gattaagtga 5460
gaccttcgtt tgtgcggatc cttcagtaat gtcttgtttc ttttgttgca gtggtgagcc 5520
attttgactt cgtgaaagtt tctttagaat agttgtttcc agaggccaaa cattccaccc 5580
gtagtaaagt gcaagcgtag gaagaccaag actggcataa atcaggtata agtgtcgagc 5640
actggcaggt gatcttctga aagtttctac tagcagataa gatccagtag tcatgcatat 5700
ggcaacaatg taccgtgtgg atctaagaac gcgtcctact aaccttcgca ttcgttggtc 5760
cagtttgttg ttatcgatca acgtgacaag gttgtcgatt ccgcgtaagc atgcataccc 5820
aaggacgcct gttgcaattc caagtgagcc agttccaaca atctttgtaa tattagagca 5880
cttcattgtg ttgcgcttga aagtaaaatg cgaacaaatt aagagataat ctcgaaaccg 5940
cgacttcaaa cgccaatatg atgtgcggca cacaataagc gttcatatcc gctgggtgac 6000
tttctcgctt taaaaaatta tccgaaaaaa ttttctagag tgttgacact ttatacttcc 6060
ggctcgtata atacgacaag gtgtaaggag gactaaacca tgggtaaaaa gcctgaactc 6120
accgcgacgt ctgtcgagaa gtttctgatc gaaaagttcg acagcgtctc cgacctgatg 6180
cagctctcgg agggcgaaga atctcgtgct ttcagcttcg atgtaggagg gcgtggatat 6240
gtcctgcggg taaatagctg cgccgatggt ttctacaaag atcgttatgt ttatcggcac 6300
tttgcatcgg ccgcgctccc gattccggaa gtgcttgaca ttggggaatt cagcgagagc 6360
ctgacctatt gcatctcccg ccgtgcacag ggtgtcacgt tgcaagacct gcctgaaacc 6420
gaactgcccg ctgttctgca gccggtcgcg gaggccatgg atgcgatcgc tgcggccgat 6480
cttagccaga cgagcgggtt cggcccattc ggaccgcaag gaatcggtca atacactaca 6540
tggcgtgatt tcatatgcgc gattgctgat ccccatgtgt atcactggca aactgtgatg 6600
gacgacaccg tcagtgcgtc cgtcgcgcag gctctcgatg agctgatgct ttgggccgag 6660
gactgccccg aagtccggca cctcgtgcac gcggatttcg gctccaacaa tgtcctgacg 6720
gacaatggcc gcataacagc ggtcattgac tggagcgagg cgatgttcgg ggattcccaa 6780
tacgaggtcg ccaacatctt cttctggagg ccgtggttgg cttgtatgga gcagcagacg 6840
cgctacttcg agcggaggca tccggagctt gcaggatcgc cgcggctccg ggcgtatatg 6900
ctccgcattg gtcttgacca actctatcag agcttggttg acggcaattt cgatgatgca 6960
gcttgggcgc agggtcgatg cgacgcaatc gtccgatccg gagccgggac tgtcgggcgt 7020
acacaaatcg cccgcagaag cgcggccgtc tggaccgatg gctgtgtaga agtactcgcc 7080
gatagtggaa accgacgccc cagcactcgt ccgagggcaa aggaataaca attgacacct 7140
tacgattatt tagagagtat ttattagttt tattgtatgt atacggatgt tttattatct 7200
atttatgccc ttatattctg taactatcca aaagtcctat cttatcaagc cagcaatcta 7260
tgtccgcgaa cgtcaactaa aaataagctt tttatgctct tctctctttt tttcccttcg 7320
gtataattat accttgcatc cacagattct cctgccaaat tttgcataat cctttacaac 7380
atggctatat gggagcactt agcgccctcc aaaacccata ttgcctacgc atgtataggt 7440
gttttttcca caatattttc tctgtgctct ctttttatta aagagaagct ctatatcgga 7500
gaagcttctg tggccgttat attcggcctt atcgtgggac cacattgcct gaattggttt 7560
gccccggaag attggggaaa cttggatctg attaccttag ctgca 7605
<210> 16
<211> 8743
<212> DNA
<213> 人工序列
<220>
<223> MMV191
<400> 16
ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60
aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120
cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180
tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240
tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300
gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360
aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420
cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480
atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540
aattatccga aaaaattttc tagacttctc ttccaaatat cgtctccaca aaatgggtaa 600
ggaaaagact cacgtttcga ggccgcgatt aaattccaac atggatgctg atttatatgg 660
gtataaatgg gctcgcgata atgtcgggca atcaggtgcg acaatctatc gattgtatgg 720
gaagcccgat gcgccagagt tgtttctgaa acatggcaaa ggtagcgttg ccaatgatgt 780
tacagatgag atggtcagac taaactggct gacggaattt atgcctcttc cgaccatcaa 840
gcattttatc cgtactcctg atgatgcatg gttactcacc actgcgatcc ccggcaaaac 900
agcattccag gtattagaag aatatcctga ttcaggtgaa aatattgttg atgcgctggc 960
agtgttcctg cgccggttgc attcgattcc tgtttgtaat tgtcctttta acagcgatcg 1020
cgtatttcgt ctcgctcagg cgcaatcacg aatgaataac ggtttggttg atgcgagtga 1080
ttttgatgac gagcgtaatg gctggcctgt tgaacaagtc tggaaagaaa tgcataagct 1140
tttgccattc tcaccggatt cagtcgtcac tcatggtgat ttctcacttg ataaccttat 1200
ttttgacgag gggaaattaa taggttgtat tgatgttgga cgagtcggaa tcgcagaccg 1260
ataccaggat cttgccatcc tatggaactg cctcggtgag ttttctcctt cattacagaa 1320
acggcttttt caaaaatatg gtattgataa tcctgatatg aataaattgc agtttcattt 1380
gatgctcgat gagtttttct aaaattgaca ccttacgatt atttagagag tatttattag 1440
ttttattgta tgtatacgga tgttttatta tctatttatg cccttatatt ctgtaactat 1500
ccaaaagtcc tatcttatca agccagcaat ctatgtccgc gaacgtcaac taaaaataag 1560
ctttttatgc tgttctctct ttttttccct tcggtataat tataccttgc atccacagat 1620
tctcctgcca aattttgcat aatcctttac aacatggcta tatgggagca cttagcgccc 1680
tccaaaaccc atattgccta cgcatgtata ggtgtttttt ccacaatatt ttctctgtgc 1740
tctcttttta ttaaagagaa gctctatatc ggagaagctt ctgtggccgt tatattcggc 1800
cttatcgtgg gaccacattg cctgaattgg tttgccccgg aagattgggg aaacttggat 1860
ctgattacct tagctgcatc agaattggtt aattggttgt aacactgacc cctatttgtt 1920
tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc 1980
ttcaataata ttgaaaaagg aagaatatga gtattcaaca tttccgtgtc gcccttattc 2040
ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa 2100
aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg 2160
gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag 2220
ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc 2280
gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta 2340
cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg 2400
cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca 2460
acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac 2520
caaacgacga gcgtgacacc acgatgcctg tagcgatggc aacaacgttg cgcaaactat 2580
taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg 2640
ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata 2700
aatccggagc cggtgagcgt ggttctcgcg gtatcatcgc agcgctgggg ccagatggta 2760
agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa 2820
atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaaggt accactgagc 2880
gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 2940
ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 3000
gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 3060
tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 3120
cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 3180
cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 3240
ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 3300
tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 3360
cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 3420
ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 3480
aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 3540
ttgctggcct tttgctcaca atttaaatga cccttgtgac tgacactttg ggagtcccta 3600
ttctacttag tctcatatcg catgaaactt ttgataaatt attttctgat aggaattttt 3660
catcagatat tatcatcgcg gcttacgtaa taacaaaaaa aattgatgga gtctatacta 3720
ggctaacata aactaagtta ttaattaaac aaaacaaaac gtactagcat tactgtcata 3780
tataagggct cctaactaaa actgtaaaga cttcccgtaa aattatcatt ctaattctga 3840
caatgtgcat ggcctcctaa actcttgacc tctctcatgc agccacttat tggaaaccca 3900
cttattaccg actaagacgg gacaagcagc atgtctagtg ctgtaatcac cttctccaga 3960
tgcaaacaga ttgtaccaaa atacggccgt gcccttttta ggccaaacag aagcacctac 4020
ctcagggaaa actgtggctc ctccagcaag cacatcggac atatagaaca accacgttgc 4080
gattctattt ccagtaccta gctccttaaa agcatcaggc tcgtcctttc tggcgaaatc 4140
aaagtggggt tcatactgac cgcccacacc atagttggca acttgtagtt cctcagcagt 4200
gcttacgtca agaccagtca aatcttgaat acgcatattg atacggctga ccacgggatt 4260
ctcgtaaccg gacaaccatg ctgatttaga gacacgatat tgtgcggtag tcaattttcc 4320
agtctcaggg tcatggacgg tagccctact caatcttggt ttggccaagt ctttcacaac 4380
ctctatttct gcatcggaga tgatgtcatg aaaacgaatg attctaggct tgtcccattc 4440
atcttcctgt ttcgctggag caagaatgaa ttttgggtta cggttcccat catgatatct 4500
acagaacagc tttttctgtc tccttggagt catcttgata ccctctcctc tacacagcat 4560
ttcatacttt tgtctctctg ggaggtagtc aacagctgca cctttttttt tcagagtggt 4620
cttttgatcg gattggtcat cggacgagga cttatttgcg tccttttcct tagccatgat 4680
gtattcaaag tatttcagat taccgttagc tctttgatgc tccgggtcca gctccaacaa 4740
ctttttagtt aaaagtagag ctttgtccag atcaccttgc tggtaaacag cgtatgataa 4800
gtaatccaaa actgaaacct tatcaacggt agaaacttca ccttcgtcca actgacgcag 4860
agcttgctcc atccataatt ctgtgtgata gtagtcggct tctgtatatg cgacttttcc 4920
caattcaaaa caatcttcca cagtgaggaa ggacttatgc ttcacaccag gtaaatcacc 4980
cttcgatatc gtgtcggtgt ccaaattgta tgtgtcctgc aatcgcaaca aagcttttgc 5040
tgctcctact tggtcctcat cgtttggaaa gtattgtctt tgaattgtta agttagaaat 5100
gaatccatca ctcatatctt taagtaccaa gttttccaat tctgaccact ctgtattaag 5160
tctcttcatc agcttgaaag cattcactgg gtgacccaca aaaccctcag gatcttttgt 5220
tgcagtacta gtcaatctat cgagtttctc tgcccacttt ttgatttgct ccaacttatc 5280
ctcttcagct ttgatatagt ctttaaggct tgtaactagg tctttttctg tgtgaatcaa 5340
atcagtcatc tgtcctatag aagtgaagaa gcctgggtga gccagtgact gtggcaacaa 5400
aataccaacg actaggatat accaaatcat gcttttgttg ttgagtgaag cgagtgacgg 5460
aacggtaaaa tgtaagtaac aaaagaaaaa gagaaccagg ggggggagga gagtatgtat 5520
ttataccgta cggcaccagg cgaaaagcta taaacaaacc tttttcgcgg tatatttgtt 5580
tatatttcct attttaaact caaaatctgc cctaatctgg acttttcatg caaagttatg 5640
cacctgaggc aggaatgaag caggctcgac gacgaaaagg ctggaatggg taactatgga 5700
tcgattgatt tgtctgttga aatcttgatt tggcactcgt ttaaattaac attctgcatc 5760
atggtgaatt gcggtcacag gtactggttt ttcctgaagc tctaggcggt gttactgttc 5820
ccacaactta aaacctaaaa gaggtgggtg cttctttgcg tgggtgacca aaaataaaac 5880
cgactgccta gtggcattga tacctttttt tgggtgttgt cctggaaacc actgaacgta 5940
tctgcgagat acaaaagtat ttttagataa gtggcaaatg caaaaaatct gattggtcag 6000
ttaatgattg atgaacgact ttaaggttaa aaagcaaaat agtgactgct gccatgtgcc 6060
tgtatagcac atgaactgat tattctgttc ccacgctacg atgaaaacgc cttctctgcc 6120
gaaagattaa agctgcgcgg gaaaaaaaaa ttaactttac ggggcgagca cggttccccg 6180
aaacaaaaga tggttggctt tcacccagcg agctcactgg atgccagtta aaaatagtta 6240
ggtgggttca cctgtttttg tagaaatgtc ttggtgtcct cgaccaatca ggtagccatc 6300
cctgaaatac ctggctccgt ggcaacaccg aacgacctgc tggcaacgtt aaattctccg 6360
gggtaaaact taaatgtgga gtaatagaac cagaaacgtc tcttcccttc tctctccttc 6420
caccgcccgt taccgtccct aggaaatttt actctgctgg agagcttctt ctacggcccc 6480
cttgcagcaa tgctcttccc agcattacgt tgcgggtaaa acggaggtcg tgtacccgac 6540
ctagcagccc agggatggaa agtcccggcc gtcgctggca ataactgcgg gcggacgcat 6600
gtcttgagat tattggaaac caccagaatc gaatataaaa ggcgaacacc tttcccaatt 6660
ttggtttctc ctgacccaaa gactttaaat ttaatttatt tgtccctatt tcaatcaatt 6720
gaacaactat ggccgcatga gattcccatc tattttcacc gctgtcttgt tcgctgcctc 6780
ctctgcattg gctgcccctg ttaacactac cactgaagac gagactgctc aaattccagc 6840
tgaagcagtt atcggttact ctgaccttga gggtgatttc gacgtcgctg ttttgccttt 6900
ctctaactcc actaacaacg gtttgttgtt cattaacacc actatcgctt ccattgctgc 6960
taaggaagag ggtgtctctc tcgagaaaag agaggccgaa gctgcacccg atgaggaaga 7020
tcatgtttta gtattgcata aaggaaattt cgatgaagct ttggccgctc acaaatatct 7080
gctcgtcgag ttttacgctc cctggtgcgg tcattgtaag gcccttgcac cagagtacgc 7140
caaggcagct ggtaagttaa aggccgaagg ttcagagatc agattagcaa aagttgatgc 7200
tacagaagag tccgatcttg ctcaacaata cggggttcga ggatacccaa caattaagtt 7260
tttcaaaaat ggtgatactg cttccccaaa ggaatatact gctggtagag aggcagacga 7320
catagtcaac tggctcaaaa agagaacggg cccagctgcg tctacattaa gcgacggagc 7380
agcagccgaa gctcttgtgg aatctagtga agttgctgta atcggtttct ttaaggacat 7440
ggaatctgat tcagctaaac agttcctttt agcagctgaa gcaatcgatg acatcccttt 7500
cggaatcacc tcaaatagtg acgtgttcag caagtaccaa cttgacaaag atggagtggt 7560
cttgttcaaa aagtttgacg aaggcagaaa caatttcgag ggtgaggtta caaaggagaa 7620
actgcttgat ttcattaaac ataaccaact acccttagtt atcgaattca ctgaacaaac 7680
tgctcctaag attttcggtg gagaaatcaa aacacatatc ttgttgtttt tgccaaagtc 7740
cgtatcggat tatgaaggta aactctccaa tttcaaaaag gccgctgaga gctttaaggg 7800
caagattttg ttcatcttta ttgactcaga ccacacagac aatcagagga ttttggagtt 7860
tttcggtttg aaaaaggagg aatgtccagc agtccgtttg atcaccttgg aggaggagat 7920
gaccaaatac aaaccagagt cggatgagtt gactgccgag aagataacag aattttgtca 7980
cagatttctg gaaggtaaga tcaagcctca tcttatgtct caagagttgc ctgatgactg 8040
ggataagcaa ccagttaaag tattggtggg taaaaacttt gaggaagtgg ccttcgacga 8100
gaaaaaaaat gtctttgttg aattctatgc tccgtggtgt ggtcactgta agcagctggc 8160
accaatttgg gataaactgg gtgaaactta caaagatcac gaaaacattg ttattgcaaa 8220
gatggacagt actgctaacg aagtggaggc tgtgaaagtt cactccttcc ctacgctgaa 8280
gttctttcct gcatctgctg acagaactgt tatcgactat aatggagaga ggacattgga 8340
tggttttaaa aagtttcttg aatccggagg tcaagacgga gctggtgacg acgatgattt 8400
ggaagatctg gaggaggctg aggaacctga tcttgaggag gatgacgacc agaaggcagt 8460
caaagatgaa ctgtgataag gggtcaagag gatgtcagaa tgccatttgc ctgagagatg 8520
caggcttcat ttttgatact tttttatttg taacctatat agtataggat tttttttgtc 8580
attttgtttc ttctcgtacg agcttgctcc tgatcagcct atctcgcagc agatgaatat 8640
cttgtggtag gggtttggga aaatcattcg agtttgatgt ttttcttggt atttcccact 8700
cctcttcaga gtacagaaga ttaagtgaga ccttcgtttg tgc 8743
<210> 17
<211> 12068
<212> DNA
<213> 人工序列
<220>
<223> MMV208
<400> 17
cggatgtttt attatctatt tatgccctta tattctgtaa ctatccaaaa gtcctatctt 60
atcaagccag caatctatgt ccgcgaacgt caactaaaaa taagcttttt atgctcttct 120
ctcttttttt cccttcggta taattatacc ttgcatccac agattctcct gccaaatttt 180
gcataatcct ttacaacatg gctatatggg agcacttagc gccctccaaa acccatattg 240
cctacgcatg tataggtgtt ttttccacaa tattttctct gtgctctctt tttattaaag 300
agaagctcta tatcggagaa gcttctgtgg ccgttatatt cggccttatc gtgggaccac 360
attgcctgaa ttggtttgcc ccggaagatt ggggaaactt ggatctgatt accttagctg 420
cagaaaaggg taccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 480
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 540
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 600
agcgcagata ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa 660
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 720
tggcgataag tcgtgtctta ccgggttgga cccaagacga tagttaccgg ataaggcgca 780
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 840
cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 900
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 960
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 1020
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 1080
ctttttacgg ttcctggcct tttgctggcc ttttgctcat atgtaagctt tgaacactta 1140
tgtaagctcg aaaccagtta ggtaagcagc tttgtaagca atctggacaa tatgtaagcg 1200
ggttacgtaa acagttatgt aagcagaaaa atttcaaacg acaaaacttg gggtctacag 1260
acacagtagc cagaagattg cactaccatt cgactcctca tgacccactc tttcgatcca 1320
tgtagttagg ttaccgtttt tcctaatatt taaggatgtt gaaaattcat tttcattttt 1380
tttcgttttt aagattttct cacaactctt ccaaagatta ctagttgact tttcaaaata 1440
tttagggtat ttttctcact ttttcctagc aaactccaat tggtgggttc agtgcaatgg 1500
agtaccacct tgcaaccaca acgtaatagc taacttgtgg ccaccatgtc tggttgtaga 1560
gataattgga ttctaatgtg gatcacatga ctactcacgt gtcaaaaacc caacctgact 1620
tggcccagct tagcaagaat atttcgaatc cactcttgtg gcctagtgga caactgggac 1680
ctagggaccc ttgtgactga cactttggga gtccctattc tacttagtct catatcgcat 1740
gaaacttttg ataaattatt ttctgatagg aatttttcat cagatattat catcgcggct 1800
tacgtaataa caaaaaaaat tgatggagtc tatactaggc taacataaac taagttatta 1860
attaaacaaa acaaaacgta ctagcattac tgtcatatat aagggctcct aactaaaact 1920
gtaaagactt cccgtaaaat tatcattcta attctgacaa tgtgcatggc ctcctaaact 1980
cttgacctct ctcatgcagc cacttattgg aaacccactt attaccgact aagacgggac 2040
aagcagcatg tctagtgctg taatcacctt ctccagatgc aaacagattg taccaaaata 2100
cggccgtgcc ctttttaggc caaacagaag caccaacctc agggaaaact gtggctcctc 2160
cagcaagcac atcggacata tagaacaacc acgttgcgat tctatttcca gtacctagct 2220
ccttaaaagc atcaggctcg tcctttctgg cgaaatcaaa gtggggttca tactgaccgc 2280
ccacaccata gttggcaact tgtagttctt cagcagtgct tacgtcaaga ccagtcaaat 2340
cttgaatacg catattgata cggctgacca cgggattctc gtaaccggac aaccatgctg 2400
atttagagac acgatattgt gcggtagtca attttccagt ctcagggtca tggacggtag 2460
ccctactcaa tcttggtttg gccaagtctt tcacaacctc tatttctgca tcggagatga 2520
tgtcatgaaa acgaatgatt ctaggcttgt cccattcatc ttcctgtttc gctggagcaa 2580
gaatgaattt tgggttacgg ttcccatcat gatatctaca gaacagcttt ttctgtctcc 2640
ttggagtcat cttgataccc tctcctctac acagcatttc atacttttgt ctctctggga 2700
ggtagtcaac agccgcacct ttttttttca gagtggtctt ttgatcggat tggtcatcgg 2760
acgaggactt atttgcgtcc ttttccttag ccatgatgta ttcaaagtat ttcagattac 2820
cgttagctct ttgatgctcc gggtccagct ccaacaactt tttagttaaa agtagagctt 2880
tgtccagatc accttgctgg taaacagcgt atgataagta atccaaaact gaaaccttat 2940
caacggtaga aacttcacct tcgtccaact gacgtagagc ttgctccatc cataattctg 3000
tgtgatagta gtcggcttct gtatatgcga cttttcccaa ttcaaaacaa tcttccacag 3060
tgaggaagga cttatgcttc acaccaggta aatcaccctt cgatatcgtg tcggtgtcca 3120
aattgtatgt gtcctgcaat cgcaacaaag cttttgctgc tcctacttgg tcctcatcgt 3180
ttggaaagta ttgtctttga attgttaagt tagaaatgaa tccatcactc atatctttaa 3240
gtaccaagtt ttccaattct gaccactctg tattaagtct cttcatcagc ttgaaagcat 3300
tcactgggtg acccacaaaa ccctcaggat cttttgttgc agtacttgtc aatctatcga 3360
gtttctctgc ccactttttg atttgctcca acttatcctc ttcagctttg atatagtctt 3420
taaggcttgt aactaggtct ttttctgtgt gaatcaaatc agtcatctgt cctatagaag 3480
tgaagaagcc tgggtgagcc agtgactgtg gcaacaaaat accaacgact aggatatacc 3540
aaatcatgcg gccgcatggc ccccgacgag gaggaccacg tcctggtgct ccataagggc 3600
aacttcgacg aggcgctggc ggcccacaag tacctgctgg tggagttcta cgccccatgg 3660
tgcggccact gcaaggctct ggccccggag tatgccaaag cagctgggaa gctgaaggca 3720
gaaggttctg agatcagact ggccaaggtg gatgccactg aagagtctga cctggcccag 3780
cagtatggtg tccgaggcta ccccaccatc aagttcttca agaatggaga cacagcttcc 3840
cccaaagagt acacagctgg ccgggaagcg gatgatatcg tgaactggct gaagaagcgc 3900
acgggccccg ctgccagcac gctgtccgac ggggctgctg cagaggcttt ggtggagtcc 3960
agtgaggtgg ccgtcattgg cttcttcaag gatatggagt cggactccgc aaagcagttc 4020
ttcttggcag cagaggtcat tgatgacatc cccttcggga tcacatctaa cagcgatgtg 4080
ttctccaaat accagctgga caaggatggg gttgtcctct ttaagaagtt tgacgaaggc 4140
cggaacaact ttgaggggga ggtcaccaaa gaaaagcttc tggacttcat caagcacaac 4200
cagttgcccc tggtcattga gttcaccgag cagacagccc cgaagatctt cggaggggaa 4260
atcaagactc acatcctgct gttcctgccg aaaagcgtgt ctgactatga gggcaagctg 4320
agtaacttca aaaaagcggc tgagagcttc aagggcaaga tcctgtttat cttcatcgac 4380
agcgaccaca ctgacaacca gcgcatcctg gagttcttcg gcctaaagaa agaggagtgc 4440
ccggccgtgc gcctcatcac gctggaggag gagatgacca aatataagcc agagtcagat 4500
gagctgacgg cagagaagat caccgagttc tgccaccgct tcctggaggg caagattaag 4560
ccccacctga tgagccagga gctgcctgac gactgggaca agcagcctgt caaagtgctg 4620
gttgggaaga actttgaaga ggttgctttt gatgagaaaa agaacgtctt tgtagagttc 4680
tatgccccgt ggtgcggtca ctgcaagcag ctggccccca tctgggataa gctgggagag 4740
acgtacaagg accacgagaa catagtcatc gccaagatgg actccacggc caacgaggtg 4800
gaggcggtga aagtgcacag cttccccacg ctcaagttct tccccgccag cgccgacagg 4860
acggtcatcg actacaatgg ggaacggaca ctggatggtt ttaagaagtt cctggagagt 4920
ggtggccagg atggggccgg agatgatgac gatcttgaag atcttgaaga agcagaagag 4980
cctgatctgg aggaagatga tgatcaaaaa gctgtgaaag atgaactgta atcaagagga 5040
tgtcagaatg ccatttgcct gagagatgca ggcttcattt ttgatacttt tttatttgta 5100
acctatatag tataggattt tttttgtcat tttgtttctt ctcgtacgag cttgctcctg 5160
atcagcctat ctcgcagcag atgaatatct tgtggtaggg gtttgggaaa atcattcgag 5220
tttgatgttt ttcttggtat ttcccactcc tcttcagagt acagaagatt aagtgagacc 5280
ttcgtttgtg ccgatcggtt cagaagcgat agagagactg cgctaagcat taatgagatt 5340
atttttgagc attcgtcaat caataccaaa caagacaaac ggtatgccga cttttggaag 5400
tttctttttg accaactggc cgttagcatt tcaacgaacc aaacttagtt catcttggat 5460
gagatcacgc ttttgtcata ttaggttcca agacagcgtt taaactgtca gttttgggcc 5520
atttggggaa catgaaacta tttgacccca cactcagaaa gccctcatct ggagtgatgt 5580
tcgggtgtaa tgcggagctt gttgcattcg gaaataaaca aacatgaacc tcgccagggg 5640
ggccaggata gacaggctaa taaagtcatg gtgttagtag cctaatagaa ggaattggaa 5700
tgagcggatc caatgtatct aaacgcaaac tccgagctgg aaaaatgtta ccggcgatgc 5760
gcggacaatt tagaggcggc gatcaagaaa cacctgctgg gcgagcagtc tggagcacag 5820
tcttcgatgg gcccgagatc ccaccgcgtt cctgggtacc gggacgtgag gcagcgcgac 5880
atccatcaaa tataccaggc gccaaccgag tctctcggaa aacagcttct ggatatcttc 5940
cgctggcggc gcaacgacga ataatagtcc ctggaggtga cggaatatat atgtgtggag 6000
ggtaaatctg acagggtgta gcaaaggtaa tattttccta aaacatgcaa tcggctgccc 6060
cgcaacggga aaaagaatga ctttggcact cttcaccaga gtggggtgtc ccgctcgtgt 6120
gtgcaaatag gctcccactg gtcaccccgg attttgcaga aaaacagcaa gttccggggt 6180
gtctcactgg tgtccgccaa taagaggagc cggcaggcac ggagtctaca tcaagctgtc 6240
tccgatacac tcgactacca tccgggtctc tcagagaggg gaatggcact ataaataccg 6300
cctccttgcg ctctctgcct tcatcaatca aatcggatcc atgtcttttg tccaaaaggg 6360
tacttggtta ctttttgctc tgttgcaccc aactgttatt ctcgcacaac aggaagcagt 6420
agatggtggt tgctcacatt taggtcaatc ttacgcagat agagatgtat ggaaacctga 6480
accatgtcaa atttgcgtgt gtgactcagg ttcagtgctc tgcgacgata tcatatgtga 6540
cgaccaggaa ttggactgtc caaacccaga gataccattc ggtgaatgtt gtgctgtttg 6600
tccacagcca ccaactgctc ctacaagacc tccaaacggt caaggtccac aaggtcctaa 6660
aggtgatccg ggtccacctg gtattcctgg tagaaatggt gaccctggac ctcccggttc 6720
cccaggtagc ccaggatcac ctgggcctcc tggaatatgt gaatcctgcc caactggtgg 6780
tcagaactat agcccacaat acgaggccta cgacgtcaaa tctggtgttg ctggaggagg 6840
tattgcaggc taccctggtc ccgcagggcc cccaggtccg ccgggtccgc ccggaacatc 6900
aggtcatccc ggagcccctg gtgcaccagg ttatcaggga ccgcccggag agcctggaca 6960
agctggtccc gctggacccc ctggtccacc aggtgctatt ggaccaagtg gtcctgccgg 7020
aaaagacggt gaatccggta gacctggtag acccggcgaa aggggtttcc caggtcctcc 7080
cggaatgaag ggtccagccg gtatgcccgg ttttcctggg atgaagggtc acagaggatt 7140
tgatggtaga aacggagaga aaggcgaaac cggtgctccc ggactgaagg gtgaaaacgg 7200
tgtccctggt gagaacggcg ctcctggacc tatgggtcca cgtggtgctc caggagaaag 7260
aggcagacca ggattgcctg gtgcagctgg tgctagaggt aacgatggtg cccgtggttc 7320
cgatggacaa cccgggccac ccggccctcc aggtaccgct ggatttcctg gaagccctgg 7380
tgctaagggg gaggttggtc cggctggtag tcccggaagt agcggtgccc caggtcaaag 7440
aggcgaacca ggccctcagg gtcacgcagg agcacctgga ccgcctggtc ctcctggttc 7500
gaatggttcg cctggaggaa aaggtgaaat ggggcccgca ggaatccccg gtgcgcctgg 7560
tcttattggt gccaggggtc ctccaggccc gccaggtaca aatggtgtac ccggacagcg 7620
aggagcagct ggtgaacctg gtaaaaacgg tgccaaagga gatccaggtc ctcgtggaga 7680
gcgtggtgaa gctggctctc ccggtatcgc cggtccaaaa ggtgaggacg gtaaggacgg 7740
ttcccctggt gagccaggtg cgaacggact gccaggtgca gccggagagc gaggagtccc 7800
aggattcagg ggaccagccg gtgctaacgg cttgcctggt gaaaaagggc cccctggtga 7860
taggggagga cccggtccag caggccctcg tggagttgct ggtgagcctg gacgtgacgg 7920
tttaccagga gggccaggtt tgaggggtat tcccgggtcc cctggcggtc ctggatcgga 7980
tggaaaacca gggccaccag gttcgcaggg tgaaacagga cgtccaggcc cacccggctc 8040
acctggtcca aggggtcagc ctggtgtcat gggtttcccc ggtccaaagg gtaatgacgg 8100
agcaccgggt aaaaatggtg aacgtggtgg cccaggtggt ccaggacccc aaggtccagc 8160
tggaaaaaac ggtgagacag gtcctcaagg acctccagga cctaccggtc ctagcggaga 8220
taagggagat acgggaccgc caggacctca aggattgcaa ggtttgcctg gtacatctgg 8280
ccctcccgga gaaaatggta agcctggaga gccaggacca aaaggcgaag ctggagcccc 8340
aggtatcccc ggaggtaagg gagactcagg tgctccgggt gagcgtggtc ctccgggtgc 8400
cggtggtcca cctggaccta gaggtggtgc cgggccgcca ggtcctgaag gtggtaaagg 8460
tgctgctggt ccaccgggac cgcctggctc tgctggtact cctggcttgc agggaatgcc 8520
aggagagaga ggtggacctg gaggtcccgg tccgaagggt gataaagggg agccaggatc 8580
atccggtgtt gacggcgcac ctggtaaaga cggaccaagg ggaccaacgg gtccaatcgg 8640
accaccagga cccgctggcc agccaggaga taaaggcgag tccggagcac ccggtgttcc 8700
tggtatagct ggacccaggg gtggtcccgg tgaaagaggt gaacagggcc caccgggtcc 8760
cgccggtttc cctggcgccc ctggtcaaaa tggagaacca ggtgcaaagg gcgagagagg 8820
agccccagga gaaaagggtg agggaggacc acccggtgct gccggtccag ctgggggttc 8880
aggtcctgct ggaccaccag gtccacaggg cgttaaaggt gagagaggaa gtccaggtgg 8940
tcctggagct gctggattcc caggtggccg tggacctcct ggtccccctg gatcgaatgg 9000
taatcctggt ccgccaggta gttcgggtgc tcctgggaag gacggtccac ctggcccccc 9060
aggtagtaac ggtgcacctg gtagtccagg tatatccgga cctaaaggag attccggtcc 9120
accaggcgaa agaggggccc caggcccaca gggtccacca ggagcccccg gtcctctggg 9180
tattgctggt cttactggtg cacgtggact ggccggtcca cccggaatgc ctggagcaag 9240
aggttcacct ggaccacaag gtattaaagg agagaacggt aaacctggac cttccggtca 9300
aaacggagag cggggacccc caggccccca aggtctgcca ggactagctg gtaccgcagg 9360
ggaaccagga agagatggaa atccaggttc agacggacta cccggtagag atggtgcacc 9420
gggggccaag ggcgacaggg gtgagaatgg atctcctggt gcgccagggg caccaggcca 9480
cccaggtccc ccaggtcctg tgggccctgc tggaaagtca ggtgacaggg gagagacagg 9540
cccggctggt ccatctggcg cacccggacc agctggttcc agaggcccac ctggtccgca 9600
aggccctaga ggtgacaagg gagagactgg agaacgaggt gctatgggta tcaagggtca 9660
tagaggtttt ccgggtaatc ccggcgcccc aggttctcct ggtccagctg gccatcaagg 9720
tgcagtcgga tcgcccggcc cagccggtcc caggggccct gttggtccat ccggtcctcc 9780
aggaaaggat ggtgcttctg gacacccagg acctatcgga cctccgggtc ctagaggtaa 9840
tagaggagaa cgtggttccg agggtagtcc tggtcaccct ggtcaacctg gcccaccagg 9900
gcctccaggt gcacccggtc catgttgtgg tgcaggcggt gtggctgcaa ttgctggtgt 9960
gggtgctgaa aaggccggcg gtttcgctcc atattatggt gatgaaccga ttgattttaa 10020
gatcaatact gacgaaatca tgacttcctt aaagtccgtt aatggtcaaa ttgagtctct 10080
aatctcccca gatggttcac gtaaaaatcc tgctagaaat tgtagagatt tgaagttttg 10140
tcaccccgag ttgcagtccg gtgagtactg ggtggacccc aatcaaggtt gtaagttaga 10200
cgctattaaa gtttactgca atatggagac aggagaaact tgcatcagcg cttctccatt 10260
gactatccca caaaaaaatt ggtggactga ctctggagct gagaaaaagc atgtatggtt 10320
cggggaatcg atggaaggtg gtttccaatt cagctacggt aaccctgaac ttcctgaaga 10380
tgttcttgac gttcaattgg catttctgag attgttgtcc agtcgtgcaa gccaaaacat 10440
tacataccat tgcaaaaatt ccatcgcata tatggatcat gctagcggaa atgtgaaaaa 10500
ggcattgaag ctgatgggat caaatgaagg tgaatttaaa gcagagggta attctaagtt 10560
tacttacact gtattggagg atggttgtac gaagcataca ggtgaatggg gtaaaacagt 10620
gtttcaatat caaacccgca aagcagttag attgccaatc gtcgatatcg caccatacga 10680
cattggagga ccagatcaag agttcggagc tgacatcggt ccggtgtgtt tcctttgata 10740
atcaagagga tgtcagaatg ccatttgcct gagagatgca ggcttcattt ttgatacttt 10800
tttatttgta acctatatag tataggattt tttttgtcat tttgtttctt ctcgtacgag 10860
cttgctcctg atcagcctat ctcgcagctg atgaatatct tgtggtaggg gtttgggaaa 10920
atcattcgag tttgatgttt ttcttggtat ttcccactcc tcttcagagt acagaagatt 10980
aagtgagacg ttcgtttgtg cccgcggatt taaatgatcc ttcagtaatg tcttgtttct 11040
tttgttgcag tggtgagcca ttttgacttc gtgaaagttt ctttagaata gttgtttcca 11100
gaggccaaac attccacccg tagtaaagtg caagcgtagg aagaccaaga ctggcataaa 11160
tcaggtataa gtgtcgagca ctggcaggtg atcttctgaa agtttctact agcagataag 11220
atccagtagt catgcatatg gcaacaatgt accgtgtgga tctaagaacg cgtcctacta 11280
accttcgcat tcgttggtcc agtttgttgt tatcgatcaa cgtgacaagg ttgtcgattc 11340
cgcgtaagca tgcataccca aggacgcctg ttgcaattcc aagtgagcca gttccaacaa 11400
tctttgtaat attagagcac ttcattgtgt tgcgcttgaa agtaaaatgc gaacaaatta 11460
agagataatc tcgaaaccgc gacttcaaac gccaatatga tgtgcggcac acaataagcg 11520
ttcatatccg ctgggtgact ttctcgcttt aaaaaattat ccgaaaaaat tttctagagt 11580
gttgttactt tatacttccg gctcgtataa tacgacaagg tgtaaggagg actaaaccat 11640
ggctaaactc acctctgctg ttccagtcct gactgctcgt gatgttgctg gtgctgttga 11700
gttctggact gataggctcg gtttctcccg tgacttcgta gaggacgact ttgccggtgt 11760
tgtacgtgac gacgttaccc tgttcatctc cgcagttcag gaccaggttg tgccagacaa 11820
cactctggca tgggtatggg ttcgtggtct ggacgaactg tacgctgagt ggtctgaggt 11880
cgtgtctacc aacttccgtg atgcatctgg tccagctatg accgagatcg gtgaacagcc 11940
ctggggtcgt gagtttgcac tgcgtgatcc agctggtaac tgcgtgcatt tcgtcgcaga 12000
agagcaggac taacaattga caccttacga ttatttagag agtatttatt agttttattg 12060
tatgtata 12068
<210> 18
<211> 5735
<212> DNA
<213> 人工序列
<220>
<223> MMV84
<400> 18
aacatccaaa gacgaaaggt tgaatgaaac ctttttgcca tccgacatcc acaggtccat 60
tctcacacat aagtgccaaa cgcaacagga ggggatacac tagcagcaga ccgttgcaaa 120
cgcaggacct ccactcctct tctcctcaac acccactttt gccatcgaaa aaccagccca 180
gttattgggc ttgattggag ctcgctcatt ccaattcctt ctattaggct actaacacca 240
tgactttatt agcctgtcta tcctggcccc cctggcgagg ttcatgtttg tttatttccg 300
aatgcaacaa gctccgcatt acacccgaac atcactccag atgagggctt tctgagtgtg 360
gggtcaaata gtttcatgtt ccccaaatgg cccaaaactg acagtttaaa cgctgtcttg 420
gaacctaata tgacaaaagc gtgatctcat ccaagatgaa ctaagtttgg ttcgttgaaa 480
tgctaacggc cagttggtca aaaagaaact tccaaaagtc ggcataccgt ttgtcttgtt 540
tggtattgat tgacgaatgc tcaaaaataa tctcattaat gcttagcgca gtctctctat 600
cgcttctgaa ccccggtgca cctgtgccga aacgcaaatg gggaaacacc cgctttttgg 660
atgattatgc attgtctcca cattgtatgc ttccaagatt ctggtgggaa tactgctgat 720
agcctaacgt tcatgatcaa aatttaactg ttctaacccc tacttgacag caatatataa 780
acagaaggaa gctgccctgt cttaaacctt tttttttatc atcattatta gcttactttc 840
ataattgcga ctggttccaa ttgacaagct tttgatttta acgactttta acgacaactt 900
gagaagatca aaaaacaact aattattgaa agaattcaaa acgaaaatga gattcccatc 960
tattttcacc gctgtcttgt tcgctgcctc ctctgcattg gctgcccctg ttaacactac 1020
cactgaagac gagactgctc aaattccagc tgaagcagtt atcggttact ctgaccttga 1080
gggtgatttc gacgtcgctg ttttgccttt ctctaactcc actaacaacg gtttgttgtt 1140
cattaacacc actatcgctt ccattgctgc taaggaagag ggtgtctctc tcgagaaaag 1200
agaggccgaa gctgcacccg atgaggaaga tcatgtttta gtattgcata aaggaaattt 1260
cgatgaagct ttggccgctc acaaatatct gctcgtcgag ttttacgctc cctggtgcgg 1320
tcattgtaag gcccttgcac cagagtacgc caaggcagct ggtaagttaa aggccgaagg 1380
ttcagagatc agattagcaa aagttgatgc tacagaagag tccgatcttg ctcaacaata 1440
cggggttcga ggatacccaa caattaagtt tttcaaaaat ggtgatactg cttccccaaa 1500
ggaatatact gctggtagag aggcagacga catagtcaac tggctcaaaa agagaacggg 1560
cccagctgcg tctacattaa gcgacggagc agcagccgaa gctcttgtgg aatctagtga 1620
agttgctgta atcggtttct ttaaggacat ggaatctgat tcagctaaac agttcctttt 1680
agcagctgaa gcaatcgatg acatcccttt cggaatcacc tcaaatagtg acgtgttcag 1740
caagtaccaa cttgacaaag atggagtggt cttgttcaaa aagtttgacg aaggcagaaa 1800
caatttcgag ggtgaggtta caaaggagaa actgcttgat ttcattaaac ataaccaact 1860
acccttagtt atcgaattca ctgaacaaac tgctcctaag attttcggtg gagaaatcaa 1920
aacacatatc ttgttgtttt tgccaaagtc cgtatcggat tatgaaggta aactctccaa 1980
tttcaaaaag gccgctgaga gctttaaggg caagattttg ttcatcttta ttgactcaga 2040
ccacacagac aatcagagga ttttggagtt tttcggtttg aaaaaggagg aatgtccagc 2100
agtccgtttg atcaccttgg aggaggagat gaccaaatac aaaccagagt cggatgagtt 2160
gactgccgag aagataacag aattttgtca cagatttctg gaaggtaaga tcaagcctca 2220
tcttatgtct caagagttgc ctgatgactg ggataagcaa ccagttaaag tattggtggg 2280
taaaaacttt gaggaagtgg ccttcgacga gaaaaaaaat gtctttgttg aattctatgc 2340
tccgtggtgt ggtcactgta agcagctggc accaatttgg gataaactgg gtgaaactta 2400
caaagatcac gaaaacattg ttattgcaaa gatggacagt actgctaacg aagtggaggc 2460
tgtgaaagtt cactccttcc ctacgctgaa gttctttcct gcatctgctg acagaactgt 2520
tatcgactat aatggagaga ggacattgga tggttttaaa aagtttcttg aatccggagg 2580
tcaagacgga gctggtgacg acgatgattt ggaagatctg gaggaggctg aggaacctga 2640
tcttgaggag gatgacgacc agaaggcagt caaagatgaa ctgtgataag gggggttaaa 2700
ggggcggccg ctcaagagga tgtcagaatg ccatttgcct gagagatgca ggcttcattt 2760
ttgatacttt tttatttgta acctatatag tataggattt tttttgtcat tttgtttctt 2820
ctcgtacgag cttgctcctg atcagcctat ctcgcagcag atgaatatct tgtggtaggg 2880
gtttgggaaa atcattcgag tttgatgttt ttcttggtat ttcccactcc tcttcagagt 2940
acagaagatt aagtgaaacc ttcgtttgtg cggatccttc agtaatgtct tgtttctttt 3000
gttgcagtgg tgagccattt tgacttcgtg aaagtttctt tagaatagtt gtttccagag 3060
gccaaacatt ccacccgtag taaagtgcaa gcgtaggaag accaagactg gcataaatca 3120
ggtataagtg tcgagcactg gcaggtgatc ttctgaaagt ttctactagc agataagatc 3180
cagtagtcat gcatatggca acaatgtacc gtgtggatct aagaacgcgt cctactaacc 3240
ttcgcattcg ttggtccagt ttgttgttat cgatcaacgt gacaaggttg tcgattccgc 3300
gtaagcatgc atacccaagg acgcctgttg caattccaag tgagccagtt ccaacaatct 3360
ttgtaatatt agagcacttc attgtgttgc gcttgaaagt aaaatgcgaa caaattaaga 3420
gataatctcg aaaccgcgac ttcaaacgcc aatatgatgt gcggcacaca ataagcgttc 3480
atatccgctg ggtgactttc tcgctttaaa aaattatccg aaaaaatttt ctagagtgtt 3540
gttactttat acttccggct cgtataatac gacaaggtgt aaggaggact aaaccatggg 3600
taaggaaaag actcacgttt cgaggccgcg attaaattcc aacatggatg ctgatttata 3660
tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt gcgacaatct atcgattgta 3720
tgggaagccc gatgcgccag agttgtttct gaaacatggc aaaggtagcg ttgccaatga 3780
tgttacagat gagatggtca gactaaactg gctgacggaa tttatgcctc ttccgaccat 3840
caagcatttt atccgtactc ctgatgatgc atggttactc accactgcga tccccggcaa 3900
aacagcattc caggtattag aagaatatcc tgattcaggt gaaaatattg ttgatgcgct 3960
ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt aattgtcctt ttaacagcga 4020
tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag 4080
tgattttgat gacgagcgta atggctggcc tgttgaacaa gtctggaaag aaatgcataa 4140
gcttttgcca ttctcaccgg attcagtcgt cactcatggt gatttctcac ttgataacct 4200
tatttttgac gaggggaaat taataggttg tattgatgtt ggacgagtcg gaatcgcaga 4260
ccgataccag gatcttgcca tcctatggaa ctgcctcggt gagttttctc cttcattaca 4320
gaaacggctt tttcaaaaat atggtattga taatcctgat atgaataaat tgcagtttca 4380
tttgatgctc gatgagtttt tctaacaatt gacaccttac gattatttag agagtattta 4440
ttagttttat tgtatgtata cggatgtttt attatctatt tatgccctta tattctgtaa 4500
ctatccaaaa gtcctatctt atcaagccag caatctatgt ccgcgaacgt caactaaaaa 4560
taagcttttt atgctgttct ctcttttttt cccttcggta taattatacc ttgcatccac 4620
agattctcct gccaaatttt gcataatcct ttacaacatg gctatatggg agcacttagc 4680
gccctccaaa acccatattg cctacgcatg tataggtgtt ttttccacaa tattttctct 4740
gtgctctctt tttattaaag agaagctcta tatcggagaa gcttctgtgg ccgttatatt 4800
cggccttatc gtgggaccac attgcctgaa ttggtttgcc ccggaagatt ggggaaactt 4860
ggatctgatt accttagctg caggtaccac tgagcgtcag accccgtaga aaagatcaaa 4920
ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 4980
ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 5040
actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc 5100
caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 5160
gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 5220
ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 5280
cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 5340
cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 5400
acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 5460
ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 5520
gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 5580
tttcctgcgg tacccagatc caattcccgc tttgactgcc tgaaatctcc atcgcctaca 5640
atgatgacat ttggatttgg ttgactcatg ttggtattgt gaaatagacg cagatcggga 5700
acactgaaaa atacacagtt attattcatt taaat 5735
<210> 19
<211> 7204
<212> DNA
<213> 人工序列
<220>
<223> MMV150
<400> 19
aaaaataagc tttttatgct cttctctctt tttttccctt cggtataatt ataccttgca 60
tccacagatt ctcctgccaa attttgcata atcctttaca acatggctat atgggagcac 120
ttagcgccct ccaaaaccca tattgcctac gcatgtatag gtgttttttc cacaatattt 180
tctctgtgct ctctttttat taaagagaag ctctatatcg gagaagcttc tgtggccgtt 240
atattcggcc ttatcgtggg accacattgc ctgaattggt ttgccccgga agattgggga 300
aacttggatc tgattacctt agctgcagaa aagggtacca ctgagcgtca gaccccgtag 360
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 420
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 480
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgttctt ctagtgtagc 540
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 600
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggacccaa 660
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 720
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 780
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 840
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 900
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 960
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 1020
ctcacatgta ttttatgtaa gctttgaaca cttatgtaag ctcgaaacca gttaggtaag 1080
cagctttgta agcaatctgg acaatatgta agcgggttac gtaaacagtt atgtaagcag 1140
aaaaatttca aacgacaaaa cttggggtct acagacacag tagccagaag attgcactac 1200
cattcgactc ctcatgaccc actctttcga tccatgtagt taggttaccg tttttcctaa 1260
tatttaagga tgttgaaaat tcattttcat tttttttcgt ttttaagatt ttctcacaac 1320
tcttccaaag attactagtt gacttttcaa aatatttagg gtatttttct cactttttcc 1380
tagcaaactc caattggtgg gttcagtgca atggagtacc accttgcaac cacaacgtaa 1440
tagctaactt gtggccacca tgtctggttg tagagataat tggattctaa tgtggatcac 1500
atgactactc acgtgtcaaa aacccaacct gacttggccc agcttagcaa gaatatttcg 1560
aatccactct tgtggcctag tggacaactg ggaaagcttg cgacgcagtc gtttttggcg 1620
atccaggcgt agtactagga aataatgtat ctaaacgcaa actccgagct ggaaaaatgt 1680
taccggcgat gcgcggacaa tttagaggcg gcgatcaaga aacacctgct gggcgagcag 1740
tctggagcac agtcttcgat gggcccgaga tcccaccgcg ttcctgggta ccgggacgtg 1800
aggcagcgcg acatccatca aatataccag gcgccaaccg agtgtctcgg aaaacagctt 1860
ctggatatct tccgctggcg gcgcaacgac gaataatagt ccctggaggt gacggaatat 1920
atatgtgtgg agggtaaatc tgacagggtg tagcaaaggt aatattttcc taaaacatgc 1980
aatcggctgc cccgcaacgg gaaaaagaat gactttggca ctcttcacca gagtggggtg 2040
tcccgctcgt gtgtgcaaat aggctcccac tggtcacccc ggattttgca gaaaaacagc 2100
aagttccggg gtgtctcact ggtgtccgcc aataagagga gccggcaggc acggagttta 2160
catcaagctg tctccgatac actcgactac catccgggtc tctcagagag gggaatggca 2220
ctataaatac cgcctccttg cgctctctgc cttcatcaat caaatcatgc tgaggactcg 2280
aattccctag gatgttctct ccaattttgt ccttggaaat tattttagct ttggctactt 2340
tgcaatctgt cttcgctcaa cagtatccgt atgatgtgcc ggattatgcg tctccccagt 2400
acgaagcata tgatgtcaag tctggagtag caggaggagg aatcgcaggc tatcctgggc 2460
cagctggtcc tcctggccca cccggacccc ctggcacatc tggccatcct ggtgcccctg 2520
gcgctccagg ataccaaggt ccccccggtg aacctgggca agctggtccg gcaggtcctc 2580
caggacctcc tggtgctata ggtccatctg gccctgctgg aaaagatggg gaatcaggaa 2640
gacccggacg acctggagag cgaggatttc ctggccctcc tggtatgaaa ggcccagctg 2700
gtatgcctgg attccctggt atgaaaggac acagaggctt tgatggacga aatggagaga 2760
aaggcgaaac tggtgctcct ggattaaagg gggaaaatgg cgttccaggt gaaaatggag 2820
ctcctggacc catgggtcca agaggggctc ccggtgagag aggacggcca ggacttcctg 2880
gagccgcagg ggctcgaggt aatgatggag ctcgaggaag tgatggacaa ccgggccccc 2940
ctggtcctcc tggaactgca ggattccctg gttcccctgg tgctaagggt gaagttggac 3000
ctgcaggatc tcctggttca agtggcgccc ctggacaaag aggagaacct ggacctcagg 3060
gacatgctgg tgctccaggt ccccctgggc ctcctgggag taatggtagt cctggtggca 3120
aaggtgaaat gggtcctgct ggcattcctg gggctcctgg gctgatagga gctcgtggtc 3180
ctccagggcc acctggcacc aatggtgttc ccgggcaacg aggtgctgca ggtgaacccg 3240
gtaagaatgg agccaaagga gacccaggac cacgtgggga acgcggagaa gctggttctc 3300
caggtatcgc aggacctaag ggtgaagatg gcaaagatgg ttctcctgga gaacctggtg 3360
caaatggact tcctggagct gcaggagaaa ggggtgtgcc tggattccga ggacctgctg 3420
gagcaaatgg ccttccagga gaaaagggtc ctcctgggga ccgtggtggc ccaggccctg 3480
cagggcccag aggtgttgct ggagagcccg gcagagatgg tctccctgga ggtccaggat 3540
tgaggggtat tcctggtagc cccggaggac caggcagtga tgggaaacca gggcctcctg 3600
gaagccaagg agagacgggt cgacccggtc ctccaggttc acctggtccg cgaggccagc 3660
ctggtgtcat gggcttccct ggtcccaaag gaaacgatgg tgctcctgga aaaaatggag 3720
aacgaggtgg ccctggaggt cctggccctc agggtcctgc tggaaagaat ggtgagaccg 3780
gacctcaggg tcctccagga cctactggcc cttctggtga caaaggagac acaggacccc 3840
ctggtccaca aggactacaa ggcttgcctg gaacgagtgg tcccccagga gaaaacggaa 3900
aacctggtga acctggtcca aagggtgagg ctggtgcacc tggaattcca ggaggcaagg 3960
gtgattctgg tgctcccggt gaacgcggac ctcctggagc aggagggccc cctggaccta 4020
gaggtggagc tggcccccct ggtcccgaag gaggaaaggg tgctgctggt ccccctgggc 4080
cacctggttc tgctggtaca cctggtctgc aaggaatgcc tggagaaaga gggggtcctg 4140
gaggccctgg tccaaagggt gataagggtg agcctggcag ctcaggtgtc gatggtgctc 4200
cagggaaaga tggtccacgg ggtcccactg gtcccattgg tcctcctggc ccagctggtc 4260
agcctggaga taagggtgaa agtggtgccc ctggagttcc gggtatagct ggtcctcgcg 4320
gtggccctgg tgagagaggc gaacaggggc ccccaggacc tgctggcttc cctggtgctc 4380
ctggccagaa tggtgagcct ggtgctaaag gagaaagagg cgctcctggt gagaaaggtg 4440
aaggaggccc tcccggagcc gcaggacccg ccggaggttc tgggcctgcc ggtcccccag 4500
gcccccaagg tgtcaaaggc gaacgtggca gtcctggtgg tcctggtgct gctggcttcc 4560
ccggtggtcg tggtcctcct ggccctcctg gcagtaatgg taacccaggc cccccaggct 4620
ccagtggtgc tccaggcaaa gatggtcccc caggtccacc tggcagtaat ggtgctcctg 4680
gcagccccgg gatctctgga ccaaagggtg attctggtcc accaggtgag aggggagcac 4740
ctggccccca gggccctccg ggagctccag gcccactagg aattgcagga cttactggag 4800
cacgaggtct tgcaggccca ccaggcatgc caggtgctag gggcagcccc ggcccacagg 4860
gcatcaaggg tgaaaatggt aaaccaggac ctagtggtca gaatggagaa cgtggtcctc 4920
ctggccccca gggtcttcct ggtctggctg gtacagctgg tgagcctgga agagatggaa 4980
accctggatc agatggtctg ccaggccgag atggagctcc aggtgccaag ggtgaccgtg 5040
gtgaaaatgg ctctcctggt gcccctggag ctcctggtca cccaggccct cctggtcctg 5100
tcggtccagc tggaaagagc ggtgacagag gagaaactgg ccctgctggt ccttctgggg 5160
cccccggtcc tgccggatca agaggtcctc ctggtcccca aggcccacgc ggtgacaaag 5220
gggaaaccgg tgagcgtggt gctatgggca tcaaaggaca tcgcggattc cctggcaacc 5280
caggggcccc cggatctccg ggtcccgctg gtcatcaagg tgcagttggc agtccaggcc 5340
ctgcaggccc cagaggacct gttggaccta gcgggccccc tggaaaggac ggagcaagtg 5400
gacaccctgg tcccattgga ccaccggggc cccgaggtaa cagaggtgaa agaggatctg 5460
agggctcccc aggccaccca ggacaaccag gccctcctgg acctcctggt gcccctggtc 5520
catgttgtgg tgctggcggg gttgctgcca ttgctggtgt tggagccgaa aaagctggtg 5580
gttttgcccc atattatgga gctagcggtt acattcctga agctcctaga gacggacaag 5640
catacgttag aaaggacggt gagtgggtgt tgctgtccac cttcttagct agcgattaca 5700
aggatgacga cgataaggga tcgtgttgcc cgggctgctg tcatcaccat catcaccata 5760
gatcttaagc ggccgcgagt cgtgagtaat caagaggatg tcagaatgcc atttgcctga 5820
gagatgcagg cttcattttt gatacttttt tatttgtaac ctatatagta taggattttt 5880
tttgtcattt tgtttcttct cgtacgagct tgctcctgat cagcctatct cgcagctgat 5940
gaatatcttg tggtaggggt ttgggaaaat cattcgagtt tgatgttttt cttggtattt 6000
cccactcctc ttcagagtac agaagattaa gtgagacgtt cgtttgtgct ccggaggatc 6060
cttcagtaat gtcttgtttc ttttgttgca gtggtgagcc attttgactt cgtgaaagtt 6120
tctttagaat agttgtttcc agaggccaaa cattccaccc gtagtaaagt gcaagcgtag 6180
gaagaccaag actggcataa atcaggtata agtgtcgagc actggcaggt gatcttctga 6240
aagtttctac tagcagataa gatccagtag tcatgcatat ggcaacaatg taccgtgtgg 6300
atctaagaac gcgtcctact aaccttcgca ttcgttggtc cagtttgttg ttatcgatca 6360
acgtgacaag gttgtcgatt ccgcgtaagc atgcataccc aaggacgcct gttgcaattc 6420
caagtgagcc agttccaaca atctttgtaa tattagagca cttcattgtg ttgcgcttga 6480
aagtaaaatg cgaacaaatt aagagataat ctcgaaaccg cgacttcaaa cgccaatatg 6540
atgtgcggca cacaataagc gttcatatcc gctgggtgac tttctcgctt taaaaaatta 6600
tccgaaaaaa ttttctagag tgttgttact ttatacttcc ggctcgtata atacgacaag 6660
gtgtaaggag gactaaacca tggctaaact cacctctgct gttccagtcc tgactgctcg 6720
tgatgttgct ggtgctgttg agttctggac tgataggctc ggtttctccc gtgacttcgt 6780
agaggacgac tttgccggtg ttgtacgtga cgacgttacc ctgttcatct ccgcagttca 6840
ggaccaggtt gtgccagaca acactctggc atgggtatgg gttcgtggtc tggacgaact 6900
gtacgctgag tggtctgagg tcgtgtctac caacttccgt gatgcatctg gtccagctat 6960
gaccgagatc ggtgaacagc cctggggtcg tgagtttgca ctgcgtgatc cagctggtaa 7020
ctgcgtgcat ttcgtcgcag aagagcagga ctaacaattg acaccttacg attatttaga 7080
gagtatttat tagttttatt gtatgtatac ggatgtttta ttatctattt atgcccttat 7140
attctgtaac tatccaaaag tcctatctta tcaagccagc aatctatgtc cgcgaacgtc 7200
aact 7204
<210> 20
<211> 6601
<212> DNA
<213> 人工序列
<220>
<223> MMV140
<400> 20
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 60
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 120
gaaggtaact ggcttcagca gagcgcagat accaaatact gttcttctag tgtagccgta 180
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 240
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg acccaagacg 300
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 360
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 420
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 480
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 540
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 600
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 660
catgtattta aataatgtat ctaaacgcaa actccgagct ggaaaaatgt taccggcgat 720
gcgcggacaa tttagaggcg gcgatcaaga aacacctgct gggcgagcag tctggagcac 780
agtcttcgat gggcccgaga tcccaccgcg ttcctgggta ccgggacgtg aggcagcgcg 840
acatccatca aatataccag gcgccaaccg agtgtctcgg aaaacagctt ctggatatct 900
tccgctggcg gcgcaacgac gaataatagt ccctggaggt gacggaatat atatgtgtgg 960
agggtaaatc tgacagggtg tagcaaaggt aatattttcc taaaacatgc aatcggctgc 1020
cccgcaacgg gaaaaagaat gactttggca ctcttcacca gagtggggtg tcccgctcgt 1080
gtgtgcaaat aggctcccac tggtcacccc ggattttgca gaaaaacagc aagttccggg 1140
gtgtctcact ggtgtccgcc aataagagga gccggcaggc acggagttta catcaagctg 1200
tctccgatac actcgactac catccgggtc tctcagagag gggaatggca ctataaatac 1260
cgcctccttg cgctctctgc cttcatcaat caaatcatgc tgaggactcg aattccctag 1320
gatgatgagc tttgtgcaaa aggggacctg gttacttttc gctctgcttc atcccactgt 1380
tattttggca caacagtatc cgtatgatgt gccggattat gcgtctcccc agtacgaagc 1440
atatgatgtc aagtctggag tagcaggagg aggaatcgca ggctatcctg ggccagctgg 1500
tcctcctggc ccacccggac cccctggcac atctggccat cctggtgccc ctggcgctcc 1560
aggataccaa ggtccccccg gtgaacctgg gcaagctggt ccggcaggtc ctccaggacc 1620
tcctggtgct ataggtccat ctggccctgc tggaaaagat ggggaatcag gaagacccgg 1680
acgacctgga gagcgaggat ttcctggccc tcctggtatg aaaggcccag ctggtatgcc 1740
tggattccct ggtatgaaag gacacagagg ctttgatgga cgaaatggag agaaaggcga 1800
aactggtgct cctggattaa agggggaaaa tggcgttcca ggtgaaaatg gagctcctgg 1860
acccatgggt ccaagagggg ctcccggtga gagaggacgg ccaggacttc ctggagccgc 1920
aggggctcga ggtaatgatg gagctcgagg aagtgatgga caaccgggcc cccctggtcc 1980
tcctggaact gcaggattcc ctggttcccc tggtgctaag ggtgaagttg gacctgcagg 2040
atctcctggt tcaagtggcg cccctggaca aagaggagaa cctggacctc agggacatgc 2100
tggtgctcca ggtccccctg ggcctcctgg gagtaatggt agtcctggtg gcaaaggtga 2160
aatgggtcct gctggcattc ctggggctcc tgggctgata ggagctcgtg gtcctccagg 2220
gccacctggc accaatggtg ttcccgggca acgaggtgct gcaggtgaac ccggtaagaa 2280
tggagccaaa ggagacccag gaccacgtgg ggaacgcgga gaagctggtt ctccaggtat 2340
cgcaggacct aagggtgaag atggcaaaga tggttctcct ggagaacctg gtgcaaatgg 2400
acttcctgga gctgcaggag aaaggggtgt gcctggattc cgaggacctg ctggagcaaa 2460
tggccttcca ggagaaaagg gtcctcctgg ggaccgtggt ggcccaggcc ctgcagggcc 2520
cagaggtgtt gctggagagc ccggcagaga tggtctccct ggaggtccag gattgagggg 2580
tattcctggt agccccggag gaccaggcag tgatgggaaa ccagggcctc ctggaagcca 2640
aggagagacg ggtcgacccg gtcctccagg ttcacctggt ccgcgaggcc agcctggtgt 2700
catgggcttc cctggtccca aaggaaacga tggtgctcct ggaaaaaatg gagaacgagg 2760
tggccctgga ggtcctggcc ctcagggtcc tgctggaaag aatggtgaga ccggacctca 2820
gggtcctcca ggacctactg gcccttctgg tgacaaagga gacacaggac cccctggtcc 2880
acaaggacta caaggcttgc ctggaacgag tggtccccca ggagaaaacg gaaaacctgg 2940
tgaacctggt ccaaagggtg aggctggtgc acctggaatt ccaggaggca agggtgattc 3000
tggtgctccc ggtgaacgcg gacctcctgg agcaggaggg ccccctggac ctagaggtgg 3060
agctggcccc cctggtcccg aaggaggaaa gggtgctgct ggtccccctg ggccacctgg 3120
ttctgctggt acacctggtc tgcaaggaat gcctggagaa agagggggtc ctggaggccc 3180
tggtccaaag ggtgataagg gtgagcctgg cagctcaggt gtcgatggtg ctccagggaa 3240
agatggtcca cggggtccca ctggtcccat tggtcctcct ggcccagctg gtcagcctgg 3300
agataagggt gaaagtggtg cccctggagt tccgggtata gctggtcctc gcggtggccc 3360
tggtgagaga ggcgaacagg ggcccccagg acctgctggc ttccctggtg ctcctggcca 3420
gaatggtgag cctggtgcta aaggagaaag aggcgctcct ggtgagaaag gtgaaggagg 3480
ccctcccgga gccgcaggac ccgccggagg ttctgggcct gccggtcccc caggccccca 3540
aggtgtcaaa ggcgaacgtg gcagtcctgg tggtcctggt gctgctggct tccccggtgg 3600
tcgtggtcct cctggccctc ctggcagtaa tggtaaccca ggccccccag gctccagtgg 3660
tgctccaggc aaagatggtc ccccaggtcc acctggcagt aatggtgctc ctggcagccc 3720
cgggatctct ggaccaaagg gtgattctgg tccaccaggt gagaggggag cacctggccc 3780
ccagggccct ccgggagctc caggcccact aggaattgca ggacttactg gagcacgagg 3840
tcttgcaggc ccaccaggca tgccaggtgc taggggcagc cccggcccac agggcatcaa 3900
gggtgaaaat ggtaaaccag gacctagtgg tcagaatgga gaacgtggtc ctcctggccc 3960
ccagggtctt cctggtctgg ctggtacagc tggtgagcct ggaagagatg gaaaccctgg 4020
atcagatggt ctgccaggcc gagatggagc tccaggtgcc aagggtgacc gtggtgaaaa 4080
tggctctcct ggtgcccctg gagctcctgg tcacccaggc cctcctggtc ctgtcggtcc 4140
agctggaaag agcggtgaca gaggagaaac tggccctgct ggtccttctg gggcccccgg 4200
tcctgccgga tcaagaggtc ctcctggtcc ccaaggccca cgcggtgaca aaggggaaac 4260
cggtgagcgt ggtgctatgg gcatcaaagg acatcgcgga ttccctggca acccaggggc 4320
ccccggatct ccgggtcccg ctggtcatca aggtgcagtt ggcagtccag gccctgcagg 4380
ccccagagga cctgttggac ctagcgggcc ccctggaaag gacggagcaa gtggacaccc 4440
tggtcccatt ggaccaccgg ggccccgagg taacagaggt gaaagaggat ctgagggctc 4500
cccaggccac ccaggacaac caggccctcc tggacctcct ggtgcccctg gtccatgttg 4560
tggtgctggc ggggttgctg ccattgctgg tgttggagcc gaaaaagctg gtggttttgc 4620
cccatattat ggagctagcg gttacattcc tgaagctcct agagacggac aagcatacgt 4680
tagaaaggac ggtgagtggg tgttgctgtc caccttctta gctagcgatt acaaggatga 4740
cgacgataag ggatcgtgtt gcccgggctg ctgtcatcac catcatcacc atagatctta 4800
agcggccgcg agtcgtgagt aatcaagagg atgtcagaat gccatttgcc tgagagatgc 4860
aggcttcatt tttgatactt ttttatttgt aacctatata gtataggatt ttttttgtca 4920
ttttgtttct tctcgtacga gcttgctcct gatcagccta tctcgcagct gatgaatatc 4980
ttgtggtagg ggtttgggaa aatcattcga gtttgatgtt tttcttggta tttcccactc 5040
ctcttcagag tacagaagat taagtgagac gttcgtttgt gctccggagg atccttcagt 5100
aatgtcttgt ttcttttgtt gcagtggtga gccattttga cttcgtgaaa gtttctttag 5160
aatagttgtt tccagaggcc aaacattcca cccgtagtaa agtgcaagcg taggaagacc 5220
aagactggca taaatcaggt ataagtgtcg agcactggca ggtgatcttc tgaaagtttc 5280
tactagcaga taagatccag tagtcatgca tatggcaaca atgtaccgtg tggatctaag 5340
aacgcgtcct actaaccttc gcattcgttg gtccagtttg ttgttatcga tcaacgtgac 5400
aaggttgtcg attccgcgta agcatgcata cccaaggacg cctgttgcaa ttccaagtga 5460
gccagttcca acaatctttg taatattaga gcacttcatt gtgttgcgct tgaaagtaaa 5520
atgcgaacaa attaagagat aatctcgaaa ccgcgacttc aaacgccaat atgatgtgcg 5580
gcacacaata agcgttcata tccgctgggt gactttctcg ctttaaaaaa ttatccgaaa 5640
aaattttcta gagtgttgtt actttatact tccggctcgt ataatacgac aaggtgtaag 5700
gaggactaaa ccatggctaa actcacctct gctgttccag tcctgactgc tcgtgatgtt 5760
gctggtgctg ttgagttctg gactgatagg ctcggtttct cccgtgactt cgtagaggac 5820
gactttgccg gtgttgtacg tgacgacgtt accctgttca tctccgcagt tcaggaccag 5880
gttgtgccag acaacactct ggcatgggta tgggttcgtg gtctggacga actgtacgct 5940
gagtggtctg aggtcgtgtc taccaacttc cgtgatgcat ctggtccagc tatgaccgag 6000
atcggtgaac agccctgggg tcgtgagttt gcactgcgtg atccagctgg taactgcgtg 6060
catttcgtcg cagaagagca ggactaacaa ttgacacctt acgattattt agagagtatt 6120
tattagtttt attgtatgta tacggatgtt ttattatcta tttatgccct tatattctgt 6180
aactatccaa aagtcctatc ttatcaagcc agcaatctat gtccgcgaac gtcaactaaa 6240
aataagcttt ttatgctctt ctctcttttt ttcccttcgg tataattata ccttgcatcc 6300
acagattctc ctgccaaatt ttgcataatc ctttacaaca tggctatatg ggagcactta 6360
gcgccctcca aaacccatat tgcctacgca tgtataggtg ttttttccac aatattttct 6420
ctgtgctctc tttttattaa agagaagctc tatatcggag aagcttctgt ggccgttata 6480
ttcggcctta tcgtgggacc acattgcctg aattggtttg ccccggaaga ttggggaaac 6540
ttggatctga ttaccttagc tgcagaaaag ggtaccactg agcgtcagac cccgtagaaa 6600
a 6601
<210> 21
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> α因子Pre
<400> 21
atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggct 57
<210> 22
<211> 267
<212> DNA
<213> 人工序列
<220>
<223> α因子Pre pro
<400> 22
atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggctgcc 60
cctgttaaca ctaccactga agacgagact gctcaaattc cagctgaagc agttatcggt 120
tactctgacc ttgagggtga tttcgacgtc gctgttttgc ctttctctaa ctccactaac 180
aacggtttgt tgttcattaa caccactatc gcttccattg ctgctaagga agagggtgtc 240
tctctcgaga aaagagaggc cgaagct 267
<210> 23
<211> 1298
<212> DNA
<213> 人工序列
<220>
<223> pGCW14-GAP1双向启动子
<400> 23
ttttgttgtt gagtgaagcg agtgacggaa cggtaaaatg taagtaacaa aagaaaaaga 60
gaaccagggg ggggaggaga gtatgtattt ataccgtacg gcaccaggcg aaaagctata 120
aacaaacctt tttcgcggta tatttgttta tatttcctat tttaaactca aaatctgccc 180
taatctggac ttttcatgca aagttatgca cctgaggcag gaatgaagca ggctcgacga 240
cgaaaaggct ggaatgggta actatggatc gattgatttg tctgttgaaa tcttgatttg 300
gcactcgttt aaattaacat tctgcatcat ggtgaattgc ggtcacaggt actggttttt 360
cctgaagctc taggcggtgt tactgttccc acaacttaaa acctaaaaga ggtgggtgct 420
tctttgcgtg ggtgaccaaa aataaaaccg actgcctagt ggcattgata cctttttttg 480
ggtgttgtcc tggaaaccac tgaacgtatc tgcgagatac aaaagtattt ttagataagt 540
ggcaaatgca aaaaatctga ttggtcagtt aatgattgat gaacgacttt aaggttaaaa 600
agcaaaatag tgactgctgc catgtgcctg tatagcacat gaactgatta ttctgttccc 660
acgctacgat gaaaacgcct tctctgccga aagattaaag ctgcgcggga aaaaaaaatt 720
aactttacgg ggcgagcacg gttccccgaa acaaaagatg gttggctttc acccagcgag 780
ctcactggat cccagttaaa aatagttagg tgggttcacc tgtttttgta gaaatgtctt 840
ggtgtcctcg accaatcagg tagccatccc tgaaatacct ggctccgtgg caacaccgaa 900
cgacctgctg gcaacgttaa attctccggg gtaaaactta aatgtggagt aatagaacca 960
gaaacgtctc ttcccttctc tctccttcca ccgcccgtta ccgtccctag gaaattttac 1020
tctgctggag agcttcttct acggccccct tgcagcaatg ctcttcccag cattacgttg 1080
cgggtaaaac ggaggtcgtg tacccgacct agcagcccag ggatggaaag tcccggccgt 1140
cgctggcaat aactgcgggc ggacgcatgt cttgagatta ttggaaacca ccagaatcga 1200
atataaaagg cgaacacctt tcccaatttt ggtttctcct gacccaaaga ctttaaattt 1260
aatttatttg tccctatttc aatcaattga acaactat 1298
<210> 24
<211> 1251
<212> DNA
<213> 人工序列
<220>
<223> Das1-Das2双向启动子
<400> 24
ttttgatgtt tgatagtttg ataagagtga actttagtgt ttagaggggt tataatttgt 60
tgtaactggt tttggtctta agttaaaacg aacttgttat attaaacaca acggtcactc 120
aggatacaag aataggaaag aaaaacttta aactggggac atgttgtctt tatataattt 180
ggcggttaac ccttaatgcc cgtttccgtc tcttcatgat aacaaagctg cccatctatg 240
actgaatgtg gagaagtatc ggaacaaccc ttcactaagg atatctaggc taaactcatt 300
cgcgccttag atttctccaa ggtatcggtt aagtttcctc tttcgtactg gctaacgatg 360
gtgttgctca acaaagggat ggaacggcag ctaaagggag tgcatggaat gactttaatt 420
ggctgagaaa gtgttctatt tgtccgaatt tcttttttct attatctgtt cgtttgggcg 480
gatctctcca gtggggggta aatggaagat ttctgttcat ggggtaagga agctgaaatc 540
cttcgtttct tataggggca agtatactaa atctcggaac attgaatggg gtttactttc 600
attggctaca gaaattatta agtttgttat ggggtgaagt taccagtaat tttcattttt 660
tcacttcaac ttttggggta tttctgtggg gtagcataga gcaatgatat aaacaacaat 720
tgagtgacag gtctactttg ttctcaaaag gccataacca tctgtttgca tctcttatca 780
ccacaccatc ctcctcatct ggccttcaat tgtggggaac aactagcatc ccaacaccag 840
actaactcca cccagatgaa accagttgtc gcttaccagt caatgaatgt tgagctaacg 900
ttccttgaaa ctcgaatgat cccagccttg ctgcgtatca tccctccgct attccgccgc 960
ttgctccaac catgtttccg cctttttcga acaagttcaa atacctatct ttggcaggac 1020
ttttcctcct gcctttttta gcctcagctc tcggttagcc tctaggcaaa ttctggtctt 1080
catacctata tcaacttttc atcagatagc ctttgggttc aaaaaagaac taaagcagga 1140
tgcctgatat ataaatccca gatgatctgc ttttgaaact attttcagta tcttgattcg 1200
tttacttaca aacaactatt gttgatttta tctggagaat aatcgaacaa a 1251
<210> 25
<211> 550
<212> DNA
<213> 人工序列
<220>
<223> pHTX1双向启动子
<400> 25
tgttgtagtt ttaatatagt ttgagtatga gatggaactc agaacgaagg aattatcacc 60
agtttatata ttctgaggaa agggtgtgtc ctaaattgga cagtcacgat ggcaataaac 120
gctcagccaa tcagaatgca ggagccataa attgttgtat tattgctgca agatttatgt 180
gggttcacat tccactgaat ggttttcact gtagaattgg tgtcctagtt gttatgtttc 240
gagatgtttt caagaaaaac taaaatgcac aaactgacca ataatgtgcc gtcgcgcttg 300
gtacaaacgt caggattgcc accacttttt tcgcactctg gtacaaaagt tcgcacttcc 360
cactcgtatg taacgaaaaa cagagcagtc tatccagaac gagacaaatt agcgcgtact 420
gtcccattcc ataaggtatc ataggaaacg agagtcctcc ccccatcacg tatatataaa 480
cacactgata tcccacatcc gcttgtcacc aaactaatac atccagttca agttacctaa 540
acaaatcaaa 550

Claims (38)

1.一种遗传改造以产生非羟基化胶原的酵母菌株,其包含:
(i)酵母菌株;和
(ii)载体,所述载体包含胶原的DNA序列;胶原启动子的DNA序列;胶原终止子的DNA序列;选择标记物的DNA序列、用于所述选择标记物的启动子的DNA序列;用于所述选择标记物的终止子的DNA序列;选自细菌和酵母的复制起点的DNA序列;以及含有与酵母基因组的同源性的DNA序列,其中所述载体已插入所述酵母菌株中或游离型维持。
2.如权利要求1所述的酵母菌株,其中所述酵母菌株是选自由来自以下属的那些组成的组:阿叙拉属、假丝酵母属、驹形氏酵母属、毕赤氏酵母属、汉逊酵母属、欧伽铁酵母属、糖酵母属、隐球菌属和其组合。
3.如权利要求1所述的酵母菌株,其中所述胶原的DNA序列是选自由以下各项组成的组:牛、猪、袋鼠、钝吻鳄、鳄鱼、大象、长颈鹿、斑马、骆马、羊驼、羔羊、恐龙胶原、海洋生物、细菌和其组合。
4.如权利要求3所述的酵母菌株,其中所述胶原的DNA序列是选自天然胶原DNA、改造的胶原DNA和密码子优化的胶原DNA。
5.如权利要求1所述的酵母菌株,其中所述启动子的DNA序列是选自由以下各项组成的组:AOX1甲醇诱导的启动子的DNA、PDF脱阻抑启动子的DNA、PCAT脱阻抑启动子的DNA、Das1-Das2甲醇诱导的双向启动子的DNA、PHTX1组成型双向启动子的DNA、CHO组织蛋白启动子的DNA、PGCW14-PGAP1组成型双向启动子的DNA和其组合。
6.如权利要求1所述的酵母菌株,其中所述选择标记物的DNA序列是选自由以下各项组成的组:抗生素抗性的DNA和营养缺陷型标记物的DNA。
7.如权利要求6所述的酵母菌株,其中所述抗生素是选自由以下各项组成的组:潮霉素、吉欧霉素、建那霉素和其组合。
8.如权利要求1所述的酵母菌株,其中所述载体通过选自由电穿孔、化学转化和交配组成的组的方法插入所述酵母中。
9.一种产生非羟基化胶原的方法,其包括:
(i)提供根据权利要求1所述的酵母菌株;以及
(ii)使所述菌株在培养基中生长足以产生胶原的时间段。
10.如权利要求9所述的方法,其中所述酵母菌株是选自由来自以下属的那些组成的组:阿叙拉属、假丝酵母属、驹形氏酵母属、毕赤氏酵母属、汉逊酵母属、欧伽铁酵母属、糖酵母属、隐球菌属和其组合。
11.如权利要求9所述的方法,其中所述培养基是选自由以下各项组成的组:缓冲的甘油复合培养基(BMGY)、缓冲的甲醇复合培养基(BMMY)和酵母提取物蛋白胨右旋糖(YPD)。
12.如权利要求9所述的方法,其中所述时间段是24小时到72小时。
13.如权利要求12所述的方法,其中所述酵母是选自由来自以下属的那些组成的组:阿叙拉属、假丝酵母属、驹形氏酵母属、毕赤氏酵母属、汉逊酵母属、欧伽铁酵母属、糖酵母属、隐球菌属和其组合。
14.如权利要求9所述的方法,其中所述胶原的DNA序列是选自由以下各项组成的组:牛、猪、袋鼠、钝吻鳄、鳄鱼、大象、长颈鹿、斑马、骆马、羊驼、羔羊、恐龙胶原和其组合。
15.如权利要求9所述的方法,其中所述启动子的DNA序列是选自由以下各项组成的组:PHTX1组成型双向启动子的DNA和PGCW14-PGAP1组成型双向启动子的DNA。
16.如权利要求9所述的方法,其中所述选择标记物的DNA序列是选自由以下各项组成的组:抗生素抗性DNA的DNA和营养缺陷型标记物的DNA。
17.一种遗传改造以产生羟基化胶原的酵母菌株,其包含:
(i)酵母菌株;
(ii)载体,所述载体包含胶原的DNA序列、胶原启动子的DNA序列、终止子的DNA序列、选择标记物的DNA序列、用于所述选择标记物的启动子的DNA序列、用于所述选择标记物的终止子的DNA序列、用于细菌和/或酵母的复制起点的DNA序列、含有与酵母基因组的同源性的DNA序列,其中所述载体已插入所述酵母菌株中;以及
(iii)第二载体,所述第二载体包含P4HA1的DNA序列、P4HB的DNA序列以及启动子的至少一个DNA序列,其中所述载体已插入所述酵母菌株中。
18.如权利要求17所述的酵母菌株,其中所述酵母菌株是选自由来自以下属的那些组成的组:阿叙拉属、假丝酵母属、驹形氏酵母属、毕赤氏酵母属、汉逊酵母属、欧伽铁酵母属、糖酵母属、隐球菌属和其组合。
19.如权利要求17所述的酵母菌株,其中所述胶原的DNA序列是选自由以下各项组成的组:牛、猪、袋鼠、钝吻鳄、鳄鱼、大象、长颈鹿、斑马、骆马、羊驼、羔羊、恐龙胶原和其组合。
20.如权利要求19所述的酵母菌株,其中所述胶原的DNA序列是选自天然胶原DNA、改造的胶原DNA和优化的胶原DNA。
21.如权利要求17所述的酵母菌株,其中所述启动子的DNA序列是选自由以下各项组成的组:AOX1甲醇诱导的启动子的DNA、PDF脱阻抑启动子的DNA、PCAT脱阻抑启动子的DNA、Das1-Das2甲醇诱导的双向启动子的DNA、PHTX1组成型双向启动子的DNA、CHO组织蛋白启动子的DNA、PGCW14-PGAP1组成型双向启动子的DNA和其组合。
22.如权利要求21所述的酵母菌株,其中所述启动子的DNA序列是选自由以下各项组成的组:PHTX1组成型双向启动子的DNA和PGCW14-PGAP1组成型双向启动子的DNA。
23.如权利要求17所述的酵母菌株,其中所述选择标记物的DNA序列是选自由以下各项组成的组:抗生素抗性DNA的DNA和营养缺陷型标记物的DNA。
24.如权利要求23所述的酵母菌株,其中所述抗生素是选自由以下各项组成的组:潮霉素、吉欧霉素、建那霉素和其组合。
25.如权利要求17所述的酵母菌株,其中所述载体通过选自由电穿孔、化学转化和交配组成的组的方法插入所述酵母中。
26.一种产生羟基化胶原的方法,其包括:
(iii)提供根据权利要求17所述的酵母菌株;以及
(iv)使所述菌株在培养基中生长足以产生胶原的时间段。
27.如权利要求26所述的方法,其中所述酵母菌株是选自由来自以下属的那些组成的组:阿叙拉属、假丝酵母属、驹形氏酵母属、毕赤氏酵母属、汉逊酵母属、欧伽铁酵母属、糖酵母属、隐球菌属和其组合。
28.如权利要求26所述的方法,其中所述培养基是选自由以下各项组成的组:BMGY、BMMY和YPD。
29.如权利要求26所述的方法,其中所述时间段是24小时到72小时。
30.如权利要求29所述的方法,其中所述酵母是选自由来自以下属的那些组成的组:阿叙拉属、假丝酵母属、驹形氏酵母属、毕赤氏酵母属、汉逊酵母属、欧伽铁酵母属、糖酵母属、隐球菌属和其组合。
31.如权利要求26所述的方法,其中所述胶原的DNA是选自由以下各项组成的组:牛、猪、袋鼠、钝吻鳄、鳄鱼、大象、长颈鹿、斑马、骆马、羊驼、羔羊、恐龙胶原和其组合。
32.如权利要求26所述的方法,其中所述启动子的DNA是选自由以下各项组成的组:PHTX1组成型双向启动子的DNA和PGCW14-PGAP1组成型双向启动子的DNA。
33.如权利要求26所述的方法,其中所述选择标记物的DNA是选自由以下各项组成的组:抗生素抗性DNA的DNA和营养缺陷型标记物的DNA。
34.一种全合一载体,其包含:
(i)产生胶原所必需的DNA,包括启动子和终止子;
(ii)选自由P4HA1和P4HB组成的组的羟基化酶的DNA,包括启动子和终止子;
(iii)选择标记物的DNA,包括启动子和终止子;
(iv)用于酵母和细菌的复制起点的DNA;
(v)用于整合到基因组中的与酵母基因组具有同源性的DNA;以及
(vi)在选自由5’、3’、上述DNA内和其组合组成的组的位置处的限制位点,其允许模块化克隆。
35.如权利要求34所述的全合一载体,其中产生胶原所必需的DNA序列是选自由以下各项组成的组:牛、猪、袋鼠、钝吻鳄、鳄鱼、大象、长颈鹿、斑马、骆马、羊驼、羔羊、恐龙和其组合。
36.如权利要求34所述的全合一载体,其中所述启动子的DNA序列是选自由以下各项组成的组:PHTX1组成型双向启动子的DNA和PGCW14-PGAP1组成型双向启动子的DNA。
37.如权利要求34所述的全合一载体,其中所述选择标记物的DNA序列是选自由以下各项组成的组:抗生素抗性的DNA和营养缺陷型标记物的DNA。
38.如权利要求37所述的全合一载体,其中所述抗生素是选自由以下各项组成的组:潮霉素、吉欧霉素、建那霉素和其组合。
CN201810695336.2A 2017-06-29 2018-06-29 用于产生胶原的酵母菌株和方法 Pending CN109207387A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201762526912P 2017-06-29 2017-06-29
US62/526,912 2017-06-29

Publications (1)

Publication Number Publication Date
CN109207387A true CN109207387A (zh) 2019-01-15

Family

ID=62841873

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810695336.2A Pending CN109207387A (zh) 2017-06-29 2018-06-29 用于产生胶原的酵母菌株和方法

Country Status (7)

Country Link
US (1) US11312968B2 (zh)
EP (1) EP3473647A1 (zh)
JP (1) JP7208722B2 (zh)
KR (1) KR20190002363A (zh)
CN (1) CN109207387A (zh)
BR (1) BR102018013305A2 (zh)
CA (1) CA3008850A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109321480A (zh) * 2017-07-31 2019-02-12 现代牧场股份有限公司 用于控制重组胶原羟基化的酵母菌株和方法
CN110184291A (zh) * 2019-06-03 2019-08-30 江南大学 一种游离型非甲醇诱导毕赤酵母表达载体的构建及其应用
CN111500479A (zh) * 2020-04-29 2020-08-07 江南大学 一种非甲醇诱导双启动子毕赤酵母工程菌的构建及其应用
CN117264859A (zh) * 2023-09-18 2023-12-22 广东丸美生物技术股份有限公司 一种原核表达系统及其制备方法和应用

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220177546A1 (en) * 2019-03-27 2022-06-09 Phoenix Tissue Repair, Inc. Systems and methods for producing collagen 7 compositions
CN112626074B (zh) * 2021-01-11 2021-11-23 肽源(广州)生物科技有限公司 一种含羟脯氨酸修饰化的重组人iii型胶原蛋白成熟肽及其制备方法与应用
US11993792B2 (en) 2021-05-27 2024-05-28 New England Biolabs, Inc. DNase I variants, compositions, methods, and kits
GB2616246A (en) 2021-12-21 2023-09-06 Thermo Pressure Tech Limited Thermal-pressure hydrolysis of sustainable biomass for the production of alternative proteins and bio-materials
WO2023235776A2 (en) * 2022-06-01 2023-12-07 Modern Meadow, Inc. Methods of inhibiting cancer growth

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997014431A1 (en) * 1995-10-20 1997-04-24 Collagen Corporation Production of recombinant procollagen in yeast
WO1998018918A1 (en) * 1996-10-29 1998-05-07 Commonwealth Scientific And Industrial Research Organisation Stable expression of triple helical proteins
US6413742B1 (en) * 1998-05-08 2002-07-02 Cohesion Technologies, Inc. Recombinant gelatin and full-length triple helical collagen
CN1420892A (zh) * 1999-11-12 2003-05-28 法布罗根股份有限公司 动物胶原和明胶
US6992172B1 (en) * 1999-11-12 2006-01-31 Fibrogen, Inc. Recombinant gelatins
EP1232182B1 (en) * 1999-11-12 2007-10-03 Fibrogen, Inc. Bovine collagen and method for producing recombinant gelatin
WO2014146175A1 (en) * 2013-03-21 2014-09-25 Commonwealth Scientific And Industrial Research Organisation Purification of triple helical proteins
US20150011407A1 (en) * 2013-07-05 2015-01-08 Technische Universität Graz Bidirectional Promoter
CN106256911A (zh) * 2016-07-22 2016-12-28 江苏江山聚源生物技术有限公司 一种适用于规模化生产重组人源胶原蛋白的毕赤酵母发酵培养基
WO2018124189A1 (ja) * 2016-12-28 2018-07-05 協和発酵キリン株式会社 細胞を選抜する方法

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4215051A (en) 1979-08-29 1980-07-29 Standard Oil Company (Indiana) Formation, purification and recovery of phthalic anhydride
US4407956A (en) 1981-03-13 1983-10-04 The Regents Of The University Of California Cloned cauliflower mosaic virus DNA as a plant vehicle
CA1192510A (en) 1981-05-27 1985-08-27 Lawrence E. Pelcher Rna plant virus vector or portion thereof, a method of construction thereof, and a method of producing a gene derived product therefrom
NL8200523A (nl) 1982-02-11 1983-09-01 Univ Leiden Werkwijze voor het in vitro transformeren van planteprotoplasten met plasmide-dna.
US4536475A (en) 1982-10-05 1985-08-20 Phytogen Plant vector
US4736866B1 (en) 1984-06-22 1988-04-12 Transgenic non-human mammals
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
ZA859400B (en) 1984-12-10 1986-10-29 Monsanto Co Insertion of the bacillus thuringiensis crystal protein gene into plant-colonizing microorganisms and their use
DE3687364T2 (de) 1985-04-30 1993-07-15 Monsanto Co Pflanzenkolonisierende mikroorganismen, die das bacillus thuringiensis-toxingen als chromosomeinsetzung enthalten.
TR27832A (tr) 1987-04-29 1995-08-31 Monsanto Co Zararli ucucu hasarata mukavim bitkiler.
ATE126005T1 (de) 1988-04-25 1995-08-15 Monsanto Co Insektenresistente salatpflanzen.
US4970168A (en) 1989-01-27 1990-11-13 Monsanto Company Virus-resistant plants
US5185253A (en) 1989-01-27 1993-02-09 Monsanto Company Virus resistant plants
US5464764A (en) 1989-08-22 1995-11-07 University Of Utah Research Foundation Positive-negative selection methods and vectors
DK0426641T3 (da) 1989-10-31 2000-10-23 Monsanto Co Promotor til transgene planter
US5614396A (en) 1990-06-14 1997-03-25 Baylor College Of Medicine Methods for the genetic modification of endogenous genes in animal cells by homologous recombination
WO1991019806A1 (en) 1990-06-18 1991-12-26 Monsanto Company Increased starch content in plants
US5633435A (en) 1990-08-31 1997-05-27 Monsanto Company Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases
US5304730A (en) 1991-09-03 1994-04-19 Monsanto Company Virus resistant plants and method therefore
US5763245A (en) 1991-09-23 1998-06-09 Monsanto Company Method of controlling insects
US5593874A (en) 1992-03-19 1997-01-14 Monsanto Company Enhanced expression in plants
CA2100116C (en) 1992-07-09 2001-09-18 Joseph M. Jilka Virus resistant plants
US5589612A (en) 1992-07-09 1996-12-31 Monsanto Company Virus resistant plants transformed with a PVY protease gene
AU5676394A (en) 1992-11-20 1994-06-22 Agracetus, Inc. Transgenic cotton plants producing heterologous bioplastic
DE69429249T2 (de) 1993-02-03 2002-08-08 Monsanto Technology Llc Gegen plrv-infektion resistente pflanzen
US5362865A (en) 1993-09-02 1994-11-08 Monsanto Company Enhanced expression in plants using non-translated leader sequences
AU7925094A (en) 1993-09-30 1995-04-18 Agracetus, Inc. Transgenic cotton plants producing heterologous peroxidase
US5689052A (en) 1993-12-22 1997-11-18 Monsanto Company Synthetic DNA sequences having enhanced expression in monocotyledonous plants and method for preparation thereof
US6310194B1 (en) 1994-09-26 2001-10-30 Carnegie Institution Of Washington Plant fatty acid hydroxylases
US5631152A (en) 1994-10-26 1997-05-20 Monsanto Company Rapid and efficient regeneration of transgenic plants
US5716837A (en) 1995-02-10 1998-02-10 Monsanto Company Expression of sucrose phosphorylase in plants
US5792933A (en) 1995-10-04 1998-08-11 Mississippi State University Fiber-specific protein expression in the cotton plant
GB9522896D0 (en) 1995-11-08 1996-01-10 Zeneca Ltd Polyester production
US5932439A (en) 1995-11-13 1999-08-03 Monsanto Comapny Escherichia coli K-12 strains for production of recombinant proteins
US5866121A (en) 1996-02-23 1999-02-02 The Regents Of The University Of California Method for targeting degradation of intracellular proteins
US5959179A (en) 1996-03-13 1999-09-28 Monsanto Company Method for transforming soybeans
US5824838A (en) 1996-05-09 1998-10-20 Cedars-Sinai Medical Center Transgenic mouse model for pituitary disorders associated with LIF overexpression and/or GH underexpression, and its use for testing therapeutic drugs for the conditions
HUP9902123A3 (en) 1996-06-21 2002-01-28 Monsanto Technology Llc St Louis Methods for the production of stably-transformed, fertile wheat employing agrobacterium-mediated transformation
US5981841A (en) 1996-08-30 1999-11-09 Monsanto Company Early seed 5' regulatory sequence
BR9714439A (pt) 1996-12-26 2000-03-21 Monsanto Co Plantas transgênicas com composições esterol modificadas
CA2278796A1 (en) 1997-01-21 1998-07-23 Monsanto Company Strawberry promoters and genes
EP1002114A1 (en) 1997-06-17 2000-05-24 Monsanto Company Expression of fructose 1,6 bisphosphate aldolase in transgenic plants
US6228644B1 (en) 1997-08-06 2001-05-08 Cornell Research Foundation, Inc. Hypersensitive response elicitor from Erwinia amylovora, its use, and encoding gene
ES2276475T5 (es) 1997-09-30 2014-07-11 The Regents Of The University Of California Producción de proteínas en semillas de plantas
CN100340666C (zh) 1997-12-18 2007-10-03 孟山都技术有限公司 抗昆虫的转基因植物以及用于改善δ-内毒素抵抗目标昆虫活性的方法
US6150081A (en) 1997-12-24 2000-11-21 Fuji Photo Film B.V. Silver halide emulsions with recombinant collagen suitable for photographic application and also the preparation thereof
WO1999040210A1 (en) 1998-02-06 1999-08-12 The United States Of America, As Represented By The Secretary Of Agriculture Suppression of alpha-amylase and protease expression using a serine/threonine protein kinase
ITGE20130040A1 (it) * 2013-04-18 2014-10-19 Univ Degli Studi Genova Metodo per la produzione di collagene marino ricombinante e organismo capace di produrre detto collagene marino
US10519285B2 (en) 2016-02-15 2019-12-31 Modern Meadow, Inc. Method for biofabricating composite material
CA3012006A1 (en) 2017-07-31 2019-01-31 Modern Meadow, Inc. Yeast strains and methods for controlling hydroxylation of recombinant collagen
US11028146B2 (en) 2017-09-22 2021-06-08 Modern Meadow, Inc. Recombinant yeast strains

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997014431A1 (en) * 1995-10-20 1997-04-24 Collagen Corporation Production of recombinant procollagen in yeast
WO1998018918A1 (en) * 1996-10-29 1998-05-07 Commonwealth Scientific And Industrial Research Organisation Stable expression of triple helical proteins
US6413742B1 (en) * 1998-05-08 2002-07-02 Cohesion Technologies, Inc. Recombinant gelatin and full-length triple helical collagen
CN1420892A (zh) * 1999-11-12 2003-05-28 法布罗根股份有限公司 动物胶原和明胶
US6992172B1 (en) * 1999-11-12 2006-01-31 Fibrogen, Inc. Recombinant gelatins
EP1232182B1 (en) * 1999-11-12 2007-10-03 Fibrogen, Inc. Bovine collagen and method for producing recombinant gelatin
WO2014146175A1 (en) * 2013-03-21 2014-09-25 Commonwealth Scientific And Industrial Research Organisation Purification of triple helical proteins
JP2016514708A (ja) * 2013-03-21 2016-05-23 コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガナイゼーション 三重らせんタンパク質の精製
US20150011407A1 (en) * 2013-07-05 2015-01-08 Technische Universität Graz Bidirectional Promoter
CN106256911A (zh) * 2016-07-22 2016-12-28 江苏江山聚源生物技术有限公司 一种适用于规模化生产重组人源胶原蛋白的毕赤酵母发酵培养基
WO2018124189A1 (ja) * 2016-12-28 2018-07-05 協和発酵キリン株式会社 細胞を選抜する方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
NCBI: ""PREDICTED: Panthera leo collagen type III alpha 1 chain (COL3A1), mRNA"", 《GENBANK》, pages 042949415 *
杨立霞等: ""重组生产胶原蛋白的研究进展"", 《河北化工》 *
杨立霞等: ""重组生产胶原蛋白的研究进展"", 《河北化工》, no. 7, 31 July 2007 (2007-07-31), pages 43 - 46 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109321480A (zh) * 2017-07-31 2019-02-12 现代牧场股份有限公司 用于控制重组胶原羟基化的酵母菌株和方法
CN109321480B (zh) * 2017-07-31 2024-01-02 现代牧场股份有限公司 用于控制重组胶原羟基化的酵母菌株和方法
CN110184291A (zh) * 2019-06-03 2019-08-30 江南大学 一种游离型非甲醇诱导毕赤酵母表达载体的构建及其应用
CN111500479A (zh) * 2020-04-29 2020-08-07 江南大学 一种非甲醇诱导双启动子毕赤酵母工程菌的构建及其应用
CN111500479B (zh) * 2020-04-29 2022-12-27 江南大学 一种非甲醇诱导双启动子毕赤酵母工程菌的构建及其应用
CN117264859A (zh) * 2023-09-18 2023-12-22 广东丸美生物技术股份有限公司 一种原核表达系统及其制备方法和应用

Also Published As

Publication number Publication date
CA3008850A1 (en) 2018-12-29
JP2019010096A (ja) 2019-01-24
BR102018013305A2 (pt) 2019-03-12
EP3473647A1 (en) 2019-04-24
KR20190002363A (ko) 2019-01-08
JP7208722B2 (ja) 2023-01-19
US11312968B2 (en) 2022-04-26
US20190002893A1 (en) 2019-01-03

Similar Documents

Publication Publication Date Title
CN109207387A (zh) 用于产生胶原的酵母菌株和方法
CN109321480B (zh) 用于控制重组胶原羟基化的酵母菌株和方法
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
AU2020264325A1 (en) Plant genome modification using guide rna/cas endonuclease systems and methods of use
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
CA2999347C (en) Lowering saturated fatty acid content of plant seeds
CN101835901B (zh) 遗传修饰的光合生物的高通量筛选
KR101982360B1 (ko) 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도
KR102528337B1 (ko) 정의된 서열 및 길이의 dna 단일 가닥 분자의 확장 가능한 생명공학적 생산
DK2324120T3 (en) Manipulating SNF1 protein kinase OF REVISION OF OIL CONTENT IN OLEAGINOUS ORGANISMS
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
AU2016253639B2 (en) Promoters for regulating expression in plants
CN109661403A (zh) 前导序列修饰的葡糖淀粉酶多肽和具有增强的生物产物产生的工程化的酵母菌株
KR20150033726A (ko) 프로테아제 스크리닝 방법 및 이에 의해 확인된 프로테아제
US20030024009A1 (en) Manipulation of the phenolic acid content and digestibility of plant cell walls by targeted expression of genes encoding cell wall degrading enzymes
CN101001951A (zh) 分离转录终止序列的方法
KR20210151916A (ko) 뒤시엔느 근육 이영양증의 치료를 위한 aav 벡터-매개된 큰 돌연변이 핫스팟의 결실
JP2024037919A (ja) モルフィナンアルカロイドおよび誘導体を生成する方法
CN111542610A (zh) 精确基因组编辑的新策略
CN112646820B (zh) 改变玉米开花期的基因及方法
KR20180124777A (ko) 형질전환 생물체 선별용 마커 조성물, 형질전환 생물체 및 형질전환 방법
NL2027815B1 (en) Genomic integration
US20230340036A1 (en) Heterologous proteins with axonemal proteins
WO2023177885A2 (en) Therapeutic adeno-associated virus using codon optimized nucleic acid encoding alpha-glucosidase (gaa) for treating pompe disease, with signal peptide modifications
CN115128266A (zh) 用于检测自身抗体的方法和试剂

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1259717

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination