CN1533432A - 高水平、大规模生产重组蛋白的组合体和方法 - Google Patents
高水平、大规模生产重组蛋白的组合体和方法 Download PDFInfo
- Publication number
- CN1533432A CN1533432A CNA028143825A CN02814382A CN1533432A CN 1533432 A CN1533432 A CN 1533432A CN A028143825 A CNA028143825 A CN A028143825A CN 02814382 A CN02814382 A CN 02814382A CN 1533432 A CN1533432 A CN 1533432A
- Authority
- CN
- China
- Prior art keywords
- polypeptide
- molectron
- host cell
- carrier
- ucoe
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
- C12N2510/04—Immortalised cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/108—Plasmid DNA episomal vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/20—Vector systems having a special element relevant for transcription transcription of more than one cistron
- C12N2830/205—Vector systems having a special element relevant for transcription transcription of more than one cistron bidirectional
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/42—Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/46—Vector systems having a special element relevant for transcription elements influencing chromatin structure, e.g. scaffold/matrix attachment region, methylation free island
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/20—Vectors comprising a special translation-regulating system translation of more than one cistron
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/20—Vectors comprising a special translation-regulating system translation of more than one cistron
- C12N2840/203—Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明公开用于高水平、大规模生产重组蛋白的组合体和方法。示范的组合体包含一种或多种能够高水平表达重组蛋白和/或多肽的表达载体,和能够在无血清、悬浮培养条件下生长的无限增殖化宿主细胞系。双向UCOE载体允许在单个基于UCOE的质粒载体上同时高水平表达两种或多种重组蛋白和/或多肽。
Description
发明背景
发明领域
本发明总的涉及基因表达和蛋白生产,更具体涉及过量表达重组蛋白的组合体(composition)和方法。这种组合体和方法在重组蛋白的高水平、大规模生产中十分有用。
相关技术描述
生物技术产业的主要目标是发展用于大规模表达重组蛋白,例如重组抗体的基于稳定细胞系的系统。开发适合的重组宿主细胞系的标准方法耗时费力。常规情况下,在含有胎牛血清的条件下培养细胞,例如CHO-K1或CHO DUX,将目的表达载体转染到细胞内。接着整个细胞群经过筛选去除未转入表达载体的细胞。所有含载体的细胞一般再经过亚克隆和高表达株筛选过程。扩增这样获得的每一株高表达株,并使之逐渐适应无血清悬浮培养,但这种适应通常导致重组蛋白和/或多肽表达的丧失。
除了这些常见的重组蛋白表达中的限制因素,有效的表达功能性多亚基蛋白,例如抗体,要求能够适当平衡的表达两条亚基链。例如,传统表达抗体重链和轻链的方法需要共转染分别带有重链和轻链编码区的质粒,但这仍难以使重链和轻链保持相同的拷贝数,而且可能由于载体彼此之间在基因组中整合的位置相近导致基因间的转录干扰。
因此,尽管有大量的研究,本领域仍需要改良的组合体和方法用于高水平大规模表达包括抗体重链和轻链在内的重组蛋白和/或多肽。通过使用预先适应了无血清悬浮培养的宿主细胞系以及适当的重组蛋白表达载体,本发明满足了这一需要,并进一步提供了其它相关有利之处。本文还提供了一种双向UCOE载体,使得能够在基于单个UCOE质粒载体上同时高水平表达两种或多种重组蛋白和/或多肽。
发明概述
本法明旨在提供快速有效培养适于高水平表达、大规模生产重组蛋白和/或多肽的重组细胞系的组合体和方法。
一方面,本发明提供的组合体包括:(a)无限增殖化宿主细胞系,能够持续在培养基中生长,这种宿主细胞系能够在无血清悬浮培养条件下生长,以及(b)能够持续过表达重组蛋白和/或多肽的载体,例如本文描述的基于UCOE的载体。
本发明另一方面提供高水平大规模生产多肽的方法。特指的方法包括下述步骤:(a)获得能够以悬浮方式生长的无限增殖化宿主细胞系;(b)使宿主细胞系适应无血清培养;(c)用适于过表达重组蛋白和/或多肽的载体转染获得的能够在无血清培养基中悬浮生长的无限增殖化宿主细胞系。
根据本发明的组合体和方法,适当的无限增殖化宿主细胞系可以具有下述一种或多种特性:(a)倍增时间不超过16小时,优选的介于12和16小时之间;(b)转染效率至少70%,优选至少75%,80%,85%,90%或95%;(c)易受常用的筛选试剂,例如,潮霉素,G418,嘌呤霉素的影响;(d)缺失半乳糖-半乳糖糖基化的重组蛋白和/或多肽。
在本发明权限范围中可被采用的示范性无限增殖化宿主细胞系包括,但不局限于下述可购买获得的宿主细胞系:(a)CHO-S(中国仓鼠卵巢细胞系);(b)293-F(人宿主细胞系);(c)293-H(人宿主细胞系);(d)COS-7L(猴宿主细胞系);(e)D.Mel-2(昆虫宿主细胞系);(f)Sf21(昆虫宿主细胞系);以及(g)Sf9(昆虫宿主细胞系)。或者,可以根据本文描述的方法通过常规试验获得适当的宿主细胞系。
本发明的组合体和方法中适用的过表达重组蛋白和/或多肽的载体具有下述一种或多种特性:(a)含有一种或多种有助于在无限增殖化宿主细胞系中高水平大规模表达的元件,及(b)对重组蛋白和/或多肽的阻遏有抗性。
在特定的实施方案中,本发明的载体可以进一步包括一个或多个如下文中定义的通用染色质开放元件(UCOE)。而且或者选择性地,本文所述的载体可以包括一个或多个转录启动子,例如,CMV启动子。
本发明优选的组合体和方法能够获得表达水平是每升培养物至少产生50mg重组蛋白和/或多肽,更优选的每升培养物至少100mg重组蛋白和/或多肽,更优选的至少每升200mg重组蛋白和/或多肽。
本发明进一步提供的组合体和方法能够将规模扩大至至少100升,产量(每100升培养物)至少1克蛋白和/或多肽,更优选的至少5克蛋白和/或多肽,更为优选的至少10克蛋白/或多肽,而最优选的至少20克蛋白和/或多肽。
本发明进一步提供的组合体和方法采用能够在基于单个UCOE的质粒载体上高水平表达两种或多种重组蛋白的双向载体系统。示范性的双向载体系统可以包括一个或多个选自鼠CMV启动子,人CMV启动子和人β-肌动蛋白启动子中的转录启动子。
本发明还提供用于改良表达一种或多种重组蛋白的组合体和方法,它们含有基于RNP UCOE的质粒载体,例如CET720GFP,或者在8kb的RNP UCOE部分内含有一个或多个缺失。例证性的UCOE缺失结构优选保留显著的UCOE活性,例如,相对本文所述的8kb RNPUCOE元件有至少约50%,优选至少75%,而且更优选的至少90%或更高的UCOE活性。有代表的缺失可以,或者选择性的,包括在RNPUCOE区域内选自ΔBS,ΔEcoNI,ΔEM,ΔmluI,和ΔRV中的缺失,如表4和图14所示。本发明范围内的缺失优选至少100bp,更优选至少250bp,更为优选至少1000bp,更优选的至少2500bp,更优选甚至至少4000bp。因此本发明中特指的例证性UCOE载体最低包括至少一个或多个UCOE部分,其中UCOE部分保留所需水平的UCOE活性。在一个说明性实施方案中,采用至少约4.1kb UCOE部分,对应于CET720GFP(SEQ ID NO:9)的5152-9254位核苷酸残基。这种UCOE部分,例如本文中所述的,与位于CET720GFP(SEQ ID NO:9)的2225-10525位核苷酸残基的8kb全长UCOE元件观察到的活性相比仍具有一定的活性。根据本文所述的路线和本领域承认的技术,这些UCOE及其它UCOE部分易于鉴定,其活性也易于测定。
参考下文详细的说明和附图,本发明的各个方面均明白易懂。本文描述的所有参考文献均以其全文引作参考,如同每一参考文献独立地纳入本文。
附图与序列标识符简述
图1图示了基于UCOE的的抗体表达盒。
图2A和2B是可用于表达重组人抗体的载体的质粒图谱。图2A显示表达重组人Ig重链的质粒。图2B显示表达重组人Ig kappa轻链的质粒。
图3描述了用与不用UCOE转染的CHO细胞的抗体表达水平。
图4显示在摇瓶和2升生物反应器中,用表达抗体Ab1重链和轻链的载体转染CHO-S细胞系放大培养的结果。左图显示了ELISA方法检测的抗体滴度。右图显示细胞的生长。
图5描述了鼠杂交瘤、CHO-K1和CHO-S细胞表面上Gal-Gal残基的水平。
图6图示了双向UCOE质粒载体pBDUneo100。
图7图示了双向UCOE质粒载体pBDUneo200。
图8图示了双向UCOE质粒载体pBDUpuro300。
图9图示了双向UCOE质粒载体pBDUpuro400。
图10图示了双向UCOE质粒载体pBDUneo500。
图11图示了双向UCOE质粒载体pBDUneo600。
图12图示了双向UCOE质粒载体pBDUpuro700。
图13图示了双向UCOE质粒载体pBDUpuro800。
图14图示了删除了CET720GFP中8kb的RNP UCOE。
图15图示了双向UCOE质粒载体pBDUpuro350。
图16图示了双向UCOE质粒载体pBDUpuro450。
图17图示了双向UCOE质粒载体pBDUneo1200。
图18图示了双向UCOE质粒载体pBDUpuro1450。
图19图示了双向UCOE质粒载体pBDUneo1600。
图20图示了双向UCOE质粒载体pBDUpuro1800。
图21描述了含双向UCOE质粒载体的示例性细胞系产生抗体的速率。
序列标识简述
SEQ ID NO:1是pBDUneo100的多核苷酸序列。
SEQ ID NO:2是pBDUneo200的多核苷酸序列。
SEQ ID NO:3是pBDUpuro300的多核苷酸序列。
SEQ ID NO:4是pBDUpuro400的多核苷酸序列。
SEQ ID NO:5是pBDUneo500的多核苷酸序列。
SEQ ID NO:6是pBDUneo600的多核苷酸序列。
SEQ ID NO:7是pBDUpuro700的多核苷酸序列。
SEQ ID NO:8是pBDUpuro800的多核苷酸序列。
SEQ ID NO:9是载体CET720GFP的多核苷酸序列。
SEQ ID NOs:10-26代表了根据本发明为了制备改良UCOE载体,在实施例4中使用的示例性引物序列。
SEQ ID NO:27是pBDUpuro350的多核苷酸序列。
SEQ ID NO:28是pBDUpuro450的多核苷酸序列。
SEQ ID NO:29是pBDUneo1200的多核苷酸序列。
SEQ ID NO:30是pBDUpuro1450的多核苷酸序列。
SEQ ID NO:31是pBDUneo1600的多核苷酸序列。
SEQ ID NO:32是pBDUpuro1800的多核苷酸序列。
发明详述
本发明总的涉及用于高水平大规模生产重组蛋白和/或多肽的组份和方法。如下详述,本发明示例的组合体包括无限增殖化、无血清悬浮宿主细胞系连同一个或多个适于高水平大规模表达重组蛋白和/或多肽的表达载体,但并不局限于此。
除非特别指出,本发明使用的操作均是本领域熟悉的传统病毒学、免疫学、微生物学、分子生物学和重组DNA技术的方法,下面描述了其中的许多方法进行说明。这些技术在一些文献中有充分的说明。参考,例如,Sambrook等,分子克隆:实验室手册(第二版,1989);Maniatis等,分子克隆:实验室手册(1982);DNA克隆:实用方法,(DNACloning:A Practical Approach)第一、二卷(D.Glover编);寡聚核苷合成(N.Gai编,1984);核酸杂交(B.Hames & S.Higgins编,1985);转录和翻译(B.Hames & S.Higgins编,1984);动物细胞培养(R.Frshney编,1986);Perbal,分子克隆应用指南(A Practical Guide to MolecularCloning)(1984)。
本文引用的所用著作,专利和专利申请,无论是上文提及的还是下文将要提到的,均以其全文在此引作参考。
在本说明及所附权利要求中使用的单数形式“一个”及“这个”包括复数含义,除非内容中有清楚的其它说明。
制备并筛选无血清,悬浮培养的宿主细胞系
理想的适用于本发明的组合体及方法的宿主细胞系可以具有下述一种或多种特征:(a)能够永生,持续在培养基中生长;(b)适应悬浮生长;(c)生长快速,倍增时间优选为12-16小时;(d)高转染效率,优选至少70%;(e)易于通过常用的筛选试剂,优选潮霉素,G418或嘌呤霉素加以筛选;(f)蛋白糖基化模式与用于人体治疗一致,优选缺失半乳糖-半乳糖糖基化形式;(g)适于在无血清培基中生长,优选在无间接动物来源组分的化学组成的无蛋白的培养基中生长。
具有上述一种或多种特征的宿主细胞系可用于开发快速培养重组宿主细胞系的系统,这种重组细胞系较现有的方法更省时省力,能够转化成重组蛋白和/或多肽高水平、大规模生产的研发和制造中。
长期高产量生产重组蛋白,通常优选稳定表达。例如,稳定表达目的多核苷酸的细胞系可以用同时含有内源性表达元件和筛选标记基因的表达载体或表达元件和筛选基因独立存在的表达载体进行转染。细胞中引入载体后,在丰富培养基中生长1-2天换用筛选培养基。筛选标记可以使细胞对筛选产生抗性,其存在使得成功表达引入序列的细胞生长和回收。利用与细胞类型相适应的组织培养技术可增殖稳定的具有抗性的转化细胞株。
任何筛选系统都可用于获得转化细胞系。包括,但不局限于,单纯疱疹病毒胸苷激酶(Wigler,M.等(1977)细胞11:223-32)基因和腺嘌呤磷酸核糖基转移酶(Lowy,L.等(1990)细胞22:817-23)基因可分别用于筛选tk.sup.-或aprt.sup-细胞。同样,抗代谢药、抗生素或除草剂抗性也可以用于选择;例如,dhfr可以使细胞对氨甲蝶呤产生抗性(Wigler,M.等(1980)美国国家科学院院报(Proc.Natl.Acad.Sci.)77:3567-70);谷氨酰胺合成酶(GS)可以使细胞不依赖谷氨酰胺生长并对Sulphoximine产生抗性(Bebbingtong等(1992)生物技术10(2):169-75;和Cockett等(1991)核酸研究25;19(2):319-25;npt可以使细胞对氨基葡糖苷、新霉素和G-418产生抗性(Colbere-Garapin,F.等(1981)分子生物学杂志150:1-14);以及als或pat可以使细胞分别对绿磺隆(chlorsulfuron)和phosphinotricin乙酰基转移酶产生抗性(Murry,同上)。还描述了其他可选择的基因,例如,trpB使细胞可以利用色氨酸上的吲哚基团,hisD使细胞可以利用组氨酸上的histinol基团(Hartman,S.C.和R.C.Mulligan(1998)美国国家科学院院报85:8047-51)。利用可视标记物已获得广泛欢迎,例如,花色素苷、β-葡萄糖苷酸酶和它的底物GUS,以及荧光素酶和它的底物荧光素不仅广泛用于鉴定转化子还用于对特定载体系统进行瞬时或稳定蛋白表达的定量分析(Rhodes,C.A.等(1995)分子生物学方法55:121-131)。
虽然标记基因表达存在/缺乏说明目的基因存在,但是目的基因的存在与表达仍需鉴定。例如,如果编码多肽的序列插入标记基因内,含有此序列的重组细胞可以通过标记基因功能的缺失得到确认。或者,标记基因与多肽编码序列串联排列并受同一个启动子调控。标记基因经诱导或在筛选条件下表达通常也说明与其串联的基因表达。
或者,含有并表达所需多核苷序列的宿主细胞可以通过本领域技术人员熟知的多种程序得到鉴定。这些程序包括,但不局限于,DNA-DNA或DNA-RNA杂交和蛋白生物分析或免疫分析技术,这些技术包括,例如,检测和/或定量核酸或蛋白的基于膜、溶液或芯片的技术。
使用对多核苷酸编码的产物特定的多克隆或单克隆抗体检测和测量所述产物的多种方法是本领域技术人员熟知的。例子包括酶联免疫吸附分析(ELISA),放免分析(RIA),及荧光活化细胞分类(FACS)。在一些应用中优选使用针对特定多肽上的两个独立表位的单克隆抗体进行两点单抗免疫分析,但是也可以采用竞争性结合分析。这些及其他分析方法在其它著作中也有描述,如Hampto,R等(1990;血清学方法,实验室手册,APS出版社,St.Paul.Minn.)及Maddox,D.E.等(1983,实验医学杂志158:1211-1216)。
广泛使用的多种标记和偶联技术是本领域熟练技术人员熟知的,可以用于各种核酸和氨基酸分析。制备检测相关多核苷酸的序列的标记杂交或PCR探针的方法包括寡聚标记,缺刻翻译,末尾标记或用标记核苷酸的PCR扩增。或者,将序列或其任何区段克隆到载体上制备mRNA探针。这些载体为本领域熟知,可购买获得,在加入适当的RNA聚合酶如T7,T3或SP6及标记核苷酸后能够用于体外合成RNA探针。可以购买各种试剂盒进行这些操作。能够使用的适当的报告分子或标记包括放射核素,酶,荧光,化学发光,或发色剂以及底物,辅助因子,抑制因子,磁性颗粒等等。
转化有目的多核苷酸序列的宿主细胞可在适宜于表达蛋白和从细胞培养物中回收蛋白的条件下培养。根据所用的序列和/或表达载体,重组细胞所产生的蛋白分泌出来或存在于细胞内。熟悉本领域的技术人员能够知道,含有本发明多核苷酸的表达载体可以包括信号序列,这段序列可以指引编码的多肽分泌通过原核细胞或真核细胞膜。还可以将编码多肽区的核苷酸序列与编码目的多肽的序列连接,这样的重组构建有助于可溶性蛋白的纯化。这种利于纯化的区域包括,但不局限于,金属螯合肽例如组氨酸-色氨酸模块可以在固定金属上纯化,蛋白A区在固定的免疫球蛋白上纯化,以及利用FLAGS扩展/亲和纯化系统(Immunex公司,Seattle,WA)的结构域。可切割的接头序列包括如因子XA或肠激酶(Invitrogen)的特异识别序列,其位于纯化区和编码多肽之间,可便于纯化。一种这样的表达载体涉及含有目的多肽和编码6个组氨酸残基的融合蛋白的表达,6个组氨酸残基之后有硫氧还蛋白或肠激酶的切割位点。如Porath,J等人(1992,蛋白表达纯化3:263-281)所述,组氨酸残基有助于在IMIAC(固定金属离子亲和色谱)上纯化,而肠激酶切割位点可以把目的多肽从融合蛋白中纯化出来。Kroll,D.J.等人对含有融合蛋白的载体进行过讨论(1993;DNA细胞生物学12:441-453)。
无血清无限增殖化宿主细胞系易于从各种公开的和/或商业途径获得,例如,美国典型培养物保藏中心(ATCC;Manassas,VA),Celox(St.Paul,MN);Invitrogen(Carlsban,CA);欧洲和日本细胞库(分别为ECACC,Salisbury,Wiltshire(UK)和JCRB,Shinjuky,Japan)。
适宜的宿主细胞系可以通过筛选具有一种或多种上述特点的现有宿主细胞系获得,并改造和/或选择宿主细胞系的变异株以获得其它特性。使用预先改造的宿主细胞系确保细胞能够在转染和重组蛋白表达前获得想要的条件。如下所示,这种细胞系适合与含有UCOE的表达载体共同使用,因为这些载体系统具有长期稳定高水平表达蛋白的特点。
根据本发明的组合体和方法,可以用于改良和/或改造的适宜的示范性宿主细胞系包括,但不局限于,(a)293-F,人宿主细胞系;(b)293-H,人宿主细胞系;(c)COS-7L,猴宿主细胞系;(d)D.MEL-2,昆虫宿主细胞系;(e)SF-21,昆虫宿主细胞系;(f)SF9,昆虫宿主细胞系;(g)CHO-S,中国仓鼠卵巢宿主细胞系。
例如,中国仓鼠卵巢亚克隆(CHO-S;Invitrogen/Gibco)已经能够获得商品化化学组成的无蛋白培养基,适合在本发明的组合体和方法中使用。见,D Anna等,放射研究148:260-271(1997);D Anna等,细胞科学方法(Methods in Cell Science)18:115-125(1996);Deaven等,染色体41:129-144(1973);Gorfein等,动物细胞技术:基础和应用9:247-252(Kluwer Academic Publishers,Netherlands,1998)。CHO-S宿主细胞系摇瓶培养12到16小时生长一倍,细胞密度达到峰值9-11×106细胞/ml。它们对浓度为400ug/ml的潮霉素和浓度为600ug/ml的新霉素(G418)敏感。即使静止培养,这些细胞也是悬浮单细胞生长。
临床上使用的重组蛋白存在Galα1→3Galβ1→4GlcNAc-R(Gal-Gal)碳水化合物残基,这与蛋白被快速从血清中清除有关。虽然在人的糖蛋白中没有发现Gal-Gal残基,但啮齿动物细胞分泌的糖蛋白碳水化合物结构是Gal-Gal二糖末端。因此,制备没有这种特定碳水化合物结构的重组蛋白是有利的。
如下所述,CHO-S宿主细胞系是优选的,它与含有一个或多个UCOE元件的表达载体共同使用。这种宿主细胞系具有良好的生长特性,并且在它表面的糖蛋白中未检测到Gal-Gal碳水化合物。因此,CHO-S宿主细胞系适合表达临床使用的重组蛋白和/或多肽。
表达载体的制备和选择
根据本发明,适合表达重组蛋白和/或多肽的载体系统包括一种或多种如下特点:(a)易于操作;(b)使高水平表达整合位点独立的元件;(c)使表达能抗沉默/阻遏的元件,从而获得持久稳定的长期表达;以及(d)在不同细胞型和不同物种中高水平表达的元件。
为了表达目的蛋白和/或多肽,将编码多肽的核苷酸序列或功能等效物插入到适宜的表达载体,即载体含有对插入的编码序列的转录和翻译所必须的元件。构建含有编码目的多肽的序列和适当转录和翻译控制元件的表达载体,所使用的方法是本领域的技术人员所熟知的。这些方法包括体外重组DNA技术、合成技术和体内遗传重组。这些技术参见如Sambrook,J等(1989)分子克隆:实验室手册,冷泉港出版社,Plainview,N.Y.和Ausubel,F.M.等(1989)当代分子生物学指南(Current Protocols in Molecular Biology),John Wiley&Sons,New York.N.Y.。
含有和表达多核苷酸序列的各种表达载体/宿主系统均可使用。这些系统包括但不局限于质粒或粘粒DNA表达载体;用病毒表达载体(如杆状病毒)感染的昆虫细胞系统;病毒表达载体(菜花花叶病毒,CaMV;烟草花叶病毒,TMV)转化的植物细胞系统;或动物细胞系统。
表达载体中的“控制元件”或“调控序列”是载体中的非翻译区——增强子,启动子,5’和3’非翻译区——这些非翻译区与宿主细胞蛋白相互作用以调控转录和翻译。这些元件的长度和特异性可有变异。根据使用的载体系统和宿主细胞可以选用任何适当的组成型和诱导型的转录和表达元件。在哺乳细胞系统中,哺乳细胞基因或哺乳细胞病毒基因的启动子都是优选的。如果必须获得含有多拷贝编码多肽序列的细胞系,含有GS或DHFR选择标记的载体或带有适合选择标记的基于SV40或EBV的载体优先使用。
昆虫表达系统也可以用于表达目的多肽。例如,在秋粘虫(Spodoptera frugiperda)细胞或粉纹夜蛾(Trichoplusia)幼虫中,使用Autographa加利福尼亚核多角体病毒(AcNPV)做载体表达外源基因。编码多肽的序列可以克隆到病毒的非必需区,如多角体蛋白基因,并且置于多角体蛋白启动子的控制下。成功插入编码多肽的序列使多角体蛋白基因失活并且产生缺乏衣壳蛋白的重组蛋白。然后,重组病毒可用于感染,如秋粘虫细胞或粉纹夜蛾幼虫,从而目的蛋白在其中得以表达(Engelhard,E.K.等(1994)美国国家科学院院报92:3224-3227)。
在哺乳动物宿主细胞,通常可以获得来源于病毒的多种表达系统。例如,如果使用腺病毒作为表达载体,可以将编码目的多肽的序列连接到腺病毒转录/翻译复合物中,该复合物由晚启动子和三分式先导序列组成。在病毒基因组的非必需区E1或E3区插入则可以获得有活性的病毒,其在感染宿主细胞中能够表达多肽(Logan,J.和Shenk,T(1984)美国科学院院报81:3655-3659)。另外,转录增强子,例如劳氏肉瘤病毒(RSV)增强子,能够用于提高哺乳动物宿主细胞的表达水平。
还可以使用特异起始信号获得更有效的目的多肽编码序列的翻译。这种信号包括ATG起始密码子和邻近序列。如果多肽编码序列的起始密码子和上游序列都插入到适当的表达载体中,就不需要其它的转录或翻译调控信号。然而,如果只有编码序列或其一部分插入载体中,则需提供外源转录调控信号,包括ATG起始密码子。而且,起始密码子必须在正确的阅读框架内以确保整个插入序列的翻译。外源翻译元件和起始密码子可以有不同的来源,天然的及合成的。表达效率可以通过加入增强子得以提高,增强子适用于特定的细胞系统,例如一些著作中描述的那些增强子(Scharf,D.等(1994)Results Probl.Cell Differ.,20:125-162)。
实施例优选的元件适于使高表达水平与插入位点无关,包括,通用染色质开放元件(UCOE)。UCOE是保持染色质处于“开放”构型的多核苷酸序列。参照,例如,Crombie等,PCT专利申请号WO0005393(2000)。在表达载体启动子上游含有UCOE能够产生高表达水平,这与插入位点无关并对基因沉寂具有抗性。与通常含有非UCOE的载体相比,单拷贝插入基因位点即可获得有效的表达,这使得在筛选的细胞群体中表达标记基因的细胞百分率提高。再结合使用适于无血清悬浮培养的亲代细胞系就可在短时间内快速生产大量蛋白。使用UCOE载体能够提高效率,显著减少了需经筛选才能获得高产亚克隆的转化子数目。
在悬浮培养的宿主细胞系中,利用含有一个或多个UCOE的载体,可以快速研发和大规模生产蛋白和/或多肽,例如,抗体或其片段。由于UCOE的存在,只需筛选少量亚克隆即可在无血清条件下于5周内获得产量至少为50mg/L蛋白和/或多肽,优选至少为100mg/L蛋白和/或多肽,更优选至少为200mg/L蛋白和/或多肽的克隆。
优选的,本发明的成分和方法中使用的表达载体系统每升悬浮培养物的表达产量能够超过1g蛋白和/或多肽。更优选的,能够用于稳定的宿主细胞系中的表达载体至少每个细胞每天产生20pg蛋白和/或多肽。
如下文中详细讨论的,本发明特定实施方案中,蛋白和/或多肽可以含有一个或多个亚基,例如,抗体重链和轻链及其片段。正如本领域熟知的,有效的功能性抗体需要适当平衡的表达重链和轻链。转染分别含有重链或轻链的不同质粒难以保持它们相同的拷贝数,而且如果两种载体在基因组中插入位点彼此邻近可能产生基因间的转录干扰。因此,可以采用能够在同一载体上共表达两种基因的双向载体。如本文下述实施例中详述的,作为范例的双向基于UCOE的载体系统,在本发明范围内,可以根据“杂交”RNP/β-肌动蛋白UCOE(CobraTherapeutics)任选加以构建。载体可以含有一个或多个抗生素抗性标记,例如,新霉素或嘌呤霉素抗性标记,和/或可含有一个或多个哺乳动物启动子,例如,鼠CMV启动子(mCMV),人CMV启动子(hCMV),或人肌动蛋白启动子,以驱动轻链或重链的表达。
用本发明的表达载体转染宿主细胞系
转染常用的宿主细胞系,事先已适应了在大规模培养装置中生长,能够快速进行细胞系培养从而加速了从研究到开发应用的转换速度。相反,传统方法使用转染后逐步适应无血清悬浮培养的亲代细胞系,更需要筛选大量亚克隆,这是由于许多亚克隆不能在大规模生产蛋白的条件下生长。使用预先适应的细胞系能够将研发细胞系的时间从几个月缩短至几周。预先适应了化学组成、无蛋白培养基的细胞系能够在摇瓶或生物反应器中快速生长至高细胞密度。
适用的转染程序很容易为本领域熟练技术人员掌握或获得。作为范例的转染程序适用于获得高水平、大规模的转染,如Invitrogen/Gibco推荐的CHO-S宿主细胞系的转染。通常,筛选阳性转化细胞可以使用的试剂,如,潮霉素,G418,及嘌呤霉素。典型的转染效率至少是70%,更优选至少75%,80%,85%,90%或95%。转染和筛选后的所有克隆可以任选进一步被亚克隆以鉴定出蛋白表达水平最高的单个克隆。
细胞培养条件的选择
专业人员根据本发明通过常规试验即可挑选和测试适于无限增殖化悬浮细胞培养的无血清培养基。对于上文描述的CHO-S细胞,适用CD-CHO培养基(例如可获自Invitrogen或Gibco)。
适于高水平大规模生产的示例性蛋白和/或多肽
本文使用的术语“蛋白”和“多肽”是常见的含义,即是氨基酸序列。多肽并不限制为特定长度的产物;因此,肽,寡肽,和蛋白均在多肽的范畴内,除非特别说明这些术语可以替换使用。此术语也并非特指或排除表达后修饰的多肽,例如,糖基化,乙酰基化,磷酸化等,以及本领域熟悉的其它修饰,无论天然存在的还是非天然存在的。如上文所述,无论如何本发明优选的蛋白和/或多肽缺失半乳糖-半乳糖糖基化。多肽可以是完整的蛋白,或是其部分序列。本发明上下文中特定的目的多肽是包括表位的部分氨基酸序列,所述表位即是基本上使多肽产生免疫原性并引发免疫反应的抗原决定簇。
特定优选的实施例中,本发明产生和/或使用的多肽有免疫原性,即,在免疫分析中(如ELISA或T细胞刺激分析)能够检测到与抗血清和/或癌症病人的T细胞反应。可以使用专业人员熟知的技术筛选免疫原活性。例如,使用Harlow和Lane在《抗体:实验室指南(Antibodies:A Laboratory Manual),冷泉港实验室,1988》中描述的方法进行筛选。在一个说明性实施例中,多肽固定于固相支持物上,与病人的血清接触以使血清中的抗体结合到固定化的多肽上。去除未结合的血清,检测结合的抗体,例如使用125I标记的蛋白A检测。
根据本文提供的说明制备的多肽免疫原部分可能被专业人员识别,因此这些免疫原部分也属于本发明范畴。本文使用的“免疫原部分”是本发明中免疫原性多肽的片段,本身可与识别多肽的B细胞和/或T细胞表面抗原受体产生免疫反应(例如特异性结合)。免疫原部分通常可以经本领域熟知的技术进行鉴定,如Paul在《基础免疫学,第三版,243-247(Raven出版社,1993)》中概述的以及本文引用的其它文献。这些技术包括筛选能够与抗原特异性抗体,抗血清和/或T细胞系或克隆反应的多肽。如本文中应用的抗血清和抗体,如果可以特异地与抗原结合则是“抗原特异性”的(即在ELISA或其它免疫分析中与蛋白反应,但不能检测到与其它不相关的蛋白反应)。这种抗血清和抗体可以根据本文描述及熟知的技术进行制备。
在一个优选实施方案中,本发明多肽的免疫原部分是能够与抗血清和/或T细胞进行反应,反应活性基本上不低于全长多肽(如ELISA和/或T细胞反应分析)。优选的,免疫原部分免疫原性活性至少为全长多肽的50%,优选至少70%,最优选的大于约90%。在一些情况下,优选免疫原部分的免疫原性活性与对应的全长多肽相比更强,例如活性强于约100%或150%或者更高的免疫原性活性。
在其它一些实施方案中,示例的免疫原部分可能包括N-末端先导序列和/或跨膜区序列缺失的肽。其它示例的免疫原部分相对成熟蛋白可以含有少量N-和/或C-末端缺失(例如1-30个氨基酸,优选5-15个氨基酸)。
另一实施例中,本发明制备和/或使用的蛋白和/或多肽可以包括一种或多种多肽,它们可以与针对本发明多肽所产生的T细胞和/或抗体发生免疫反应,尤其是含有本文描述的氨基酸序列的多肽,或其免疫原性片段或变体。
本文使用的术语多肽“变体”,与本文具体描述的多肽有明显差别,有单个或多个替换,缺失,添加和/或插入。这种变体是天然存在的或合成的,例如,修饰上述本发明的一种或多种多肽序列并用本文描述的方法和/或其他本领域熟知的技术检测其活性。本发明中示例的变体序列与本文提供的8kb RNP UCOE序列,或其部分序列相关、有一定的同源性,并保留所需的UCOE活性。
在一实施方案中,例如,特别是本发明示例的变异序列包含的多核苷酸序列与此处特别涉及的UCOD多核苷酸至少有70%、75%、80%、85%、90%、95%或99%或更高的同一性。当与本发明涉及的8kbRNP UCOE元件所示的UCOE活性比较时,这些优选的变体显示了至少70%、75%、80%、85%、90%、95%或100%或更高的UCOE活性。
在许多情况中,变体会含有保守取代。“保守取代”是一个氨基酸取代另一个氨基酸,而特性相似,熟悉肽化学领域的技术人员希望多肽的二级结构和水疗性没有根本改变。如上说述,对本发明的多核苷酸和多肽的结构可进行修饰,还得到了编码变异或衍生多肽的功能性分子,它们具有所要的特征,比如具有免疫原性特征。当想要改变多肽的氨基酸序列产生一个与本发明多肽等效或甚至改良的变体或部分,熟悉本领域的技术人员根据表1有代表性的改变一个或多个编码DNA序列的密码子。
例如,在蛋白结构中某个氨基酸被另一个氨基酸取代,而与结构的相互作用结合能力没有明显降低,比如与抗体的抗原结合区或底物分子上的结合位点的结合能力。因为蛋白的相互作用能力和性质限定了蛋白的生物学功能活性,所以可以在蛋白序列中进行某个氨基酸取代,当然,DNA编码序列先发生改变,仍然可以得到特性相近的蛋白。因此,预计本发明公开的组合体的肽序列和编码该肽的相应DNA序列可以进行各种改变,而它们的生物利用度或活性不会显著降低。
表1
氨基酸 | 密码子 | |||||||
丙氨酸 | Ala | A | GCA | GCC | GCG | GCU | ||
半胱氨酸 | Cys | C | UGC | UGU | ||||
天冬氨酸 | Asp | D | GAC | GAU | ||||
谷氨酸 | Glu | E | GAA | GAG | ||||
苯丙氨酸 | Phe | F | UUC | UUU | ||||
甘氨酸 | Gly | G | GGA | GGC | GGG | GGU | ||
组氨酸 | His | H | CAC | CAU | ||||
异亮氨酸 | Ile | I | AUA | AUC | AUU | |||
赖氨酸 | Lys | K | AAA | AAG | ||||
亮氨酸 | Leu | L | UUA | UUG | CUA | CUC | CUG | CUU |
甲硫氨酸 | Met | M | AUG | |||||
天冬酰胺 | Asn | N | AAC | AAU | ||||
脯氨酸 | Pro | P | CCA | CCC | CCG | CCU | ||
谷氨酰胺 | Gln | Q | CAA | CAG | ||||
精氨酸 | Arg | R | AGA | AGG | CGA | CGC | CGG | CGU |
丝氨酸 | Ser | S | AGC | AGU | UCA | UCC | UCG | UCU |
苏氨酸 | Thr | T | ACA | ACC | ACG | ACU | ||
缬氨酸 | Val | V | GUA | GUC | GUG | GUU | ||
色氨酸 | Trp | W | UGG | |||||
酪氨酸 | Tyr | Y | UAC | UAU |
在进行这些变化时,应考虑氨基酸的水疗指数。在本领域,通常可以理解水疗氨基酸指数对蛋白相互作用的生物功能很重要(Kyte和Doolittle,1982,此处引作参考)。认为氨基酸的相对水疗特性影响蛋白的二级结构,从而规定了蛋白与其它分子的相互作用,例如,酶、底物、受体、DNA、抗体、抗原等。每个氨基酸根据它的疏水性和电荷都有一个水疗指数(Kyte和Doolittle,1982)。这些值为:异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9)和精氨酸(-4.5)。
本领域已知某些氨基酸可被其它具有相似水疗指数或分数的氨基酸取代,所得到的蛋白仍具有相似的生物学活性,即仍得到生物学功能等同的蛋白。在进行这些改变时,取代氨基酸的水疗指数在±2以内为优选,±1为特别优选,±0.5为更优选。根据亲水性有效地替代相似的氨基酸也是本领域熟知的。美国专利4,554,101(以其全文具体在此引作参考),说明蛋白局部平均最大的亲水性,由其邻近氨基酸决定,与蛋白的生物特性有关。
如美国专利4,554,101所述,氨基酸残基的亲水值如下,精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。已知氨基酸可被其它具有相近亲水值的氨基酸取代,所得到的蛋白仍具有等同的生物学活性,特别是免疫学上等同的蛋白。在进行这些改变时,取代氨基酸的亲水值在±2以内为优选,±1为特别优选,而±0.5为更优选。
综上所述,氨基酸取代通常基于氨基酸侧链取代基的相对相似性,例如,它们的疏水性、亲水性、电荷、大小等。熟悉本领域的技术人员考虑到上述各种特征已知可以举例的取代包括:精氨酸和赖氨酸;丝氨酸和苏氨酸;谷氨酰胺和天冬酰胺;缬氨酸、亮氨酸和异亮氨酸。
另外,可以进一步修饰多核苷酸以增加它在体内的稳定性。可能的修饰包括,不但局限于,增加5’和/或3’末端的侧翼序列;在骨架中使用硫代磷酸酯或2’O-甲基而不用磷酸二酯酶连接;和/或含有非传统的碱基如次黄嘌呤核苷、Q核苷(queosine)和wybutosine,以及腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶和尿嘧啶的乙酰、甲基、硫代和其它修饰形式。
进行氨基酸取代还基于残基的极性、电荷、可溶性、疏水性、亲水性和/或两性分子的本性中的相似性。例如,带负电荷氨基酸包括天冬氨酸和谷氨酸;带正电荷的氨基酸包括赖氨酸和精氨酸;不带电荷的极性首基的氨基酸具有相似的亲水值,包括亮氨酸、异亮氨酸和缬氨酸;甘氨酸和丙氨酸;天冬酰胺和谷氨酰胺;以及丝氨酸、苏氨酸、苯丙氨酸和酪氨酸。其他组的氨基酸可能意味保守改变,包括(1)ala,pro,gly,glu,asp,gln,asn,ser,thr;(2)cys,ser,tyr,thr;(3)val,ile,leu,met,ala,phe;(4)lys,arg,his;和(5)phe,tyr,trp,his。变体可能还含有非保守的改变。在一个优选的实施方案中,通过取代、删除或增加5个或5个以下的氨基酸,得到的变异多肽与天然序列不同。变体还可能被修饰,如删除或增加对多肽的免疫原性、二级结构和水疗性有极微影响的氨基酸。
如上所述,在蛋白的N末端,多肽可能含有一个信号(或引导)序列,共同翻译或翻译后引导蛋白转移。多肽还可以与接头和其它序列结合,使多肽易于合成、纯化或鉴定(如聚组氨酸接头),或增加多肽与固相支持物的结合。例如,多肽可以与免疫球蛋白的Fc区结合。
如下所述,当比较两个多肽序列时,如果氨基酸序列完全一致,则说明这两个序列是“同一性”的。两个序列的比对通常是比较比对窗内的序列,鉴定和比较序列局部区域的近似性。本文使用的“比对窗”是指至少有20个邻近位点的区段,通常30-约75,40-约50,其中一个序列可以与具有同样数目邻近位点的参考序列在这两个序列最佳比对后进行比较。
使用生物信息学软件(DNASTAR,Inc.,Madison,WI)Lasergene组中的Megalign程序,使用默认参数可以进行序列的最佳比对。此程序包含几个同源性比较方案,描述见下面参考文献:Dayhoff,M.O.(1978)蛋白进化模型——检测远源关系的矩阵。蛋白序列和结构图集Dayhoff,M.O.(编),国家生物医学研究基金会,Washington DC Vol.5,Suppl.3,第345-358页;Hein J.(1990)同源性比较和系统发育统一标准化方法,第626-645页,酶学方法,183卷,Academic Press,Inc.,San Diego,CA;Higgins,D.G.和Sharp,P.M.(1989)CABIOS 5:151-153;Myers,E.W.和Muller W.(1988)CABIOS 4:11-17;Robinson,E.D.(1971)Comb.Theor11:105;Saitou,N.Nei,M.(1987)分子生物学进展。4:406-425;Sneath,P.H.A.和Sokal,R.R.(1973)数字分类学——数字分类学原理和应用,Freeman出版社,San Francisco,CA;Wilbur,W.J.和Lipman,D.J.(1983)美国国家科学院院报(Proc.Natl.Acad.,Sci.USA)80:726-730。
另外,最佳的同源性序列比较可以运用Smith和Waterman的局部同一性算法(1981),加法应用数学2:482,运用Needleman和Wunsch的同源性比较算法(1970),分子生物杂志48:443,运用Pearson和Lipman的相似性方法检索(1988)美国国家科学院院报85:2444,运用计算机执行这些算法(Wisconsin遗传学软件包中的GAP,BESTFIT,BLAST,FASTA和TFASTA,遗传学计算小组(GCG),575 Science Dr.,Madison,WI),或通过检查的方法进行比对。
算法的一个优选实施例,适于判定序列的同一性和相似性的比例是BLAST和BLAST 2.0算法,分别见Altschul等(1977)核酸研究,25:3389-3402和Altschul等(1990)分子生物学杂志215:403-410。例如,BLAST和BLAST 2.0适用于此处所描述的参数,以判定本发明多核苷酸和多肽序列同一性的比例。国家生物技术信息中心公开提供BLAST分析软件。对于氨基酸序列,使用得分矩阵计算累计分数。当碰到下列情况时,各方向上的字击打的延伸停止:通过X累计比对得分从它的最大值下降;由于累加一个或多个负分的残基比对值,累加得分为零或更低;或者抵达序列的末端。BLAST算法参数W,T和X确定比较序列的敏感性和速度。
在一个优选的方法中,通过在一个至少20个位点的对比窗中比较两个理想的对比序列来确定“序列同一性百分数”,其中相对用于两条最佳对比序列的参考序列(不含碱基添加或缺失),比对窗中的多肽序列部分可以含有20%或更少,通常5-15%,或10-12%的碱基添加或缺失。通过确定相同氨基酸残基同时出现在两条序列中产生的匹配位点数目计算百分数,即用参考序列中的位点总数(即,对比窗大小)除匹配位点数,再将结果乘以100得出序列同一性的百分数。
在另一个说明性实施方案中,根据本发明产生的和/或采用的多肽可以是异种多肽,它与作为参考序列的人类多肽(也称为自体同源抗原)基本上具有如上所述的序列同一性,但是来源于不同的、非人类的物种。本领域专业技术人员会发现“自身”抗原并非好的CD8+和CD4+T淋巴细胞应答反应刺激物,因此有效的针对肿瘤多肽的免疫治疗策略需要研发一种能够克服特定自身肿瘤多肽免疫耐受性的方法。例如,用异种(非人类的)前列腺蛋白(Prostase Protein)免疫的人能够产生抗相应的人类蛋白的免疫反应,例如存在于人肿瘤细胞的人前列腺(Prostase)肿瘤蛋白。因此,本发明的一个方面还提供了本文描述的蛋白和/或多肽的异种变体。
更特别的,本发明中用作上文提及的人类多肽的异种形式是指小鼠、大鼠、猴、猪和其它非人类多肽。
在其它说明性实施方案中,本发明采用和/或产生的融合多肽包括如本文所描述的多种多肽和/或多肽亚基,或包括至少一种本文描述的多肽和其它不相关的序列。融合对象,例如,可以帮助提供T辅助表位(一种免疫学融合对象),优选可被人类识别的T辅助表位,或帮助表达蛋白(表达增强子)使产量高于天然重组蛋白。某些优选的融合对象既是免疫学也是表达增强的融合对象。也可以选用其它融合对象提高多肽可溶性,或使多肽可以靶向目的胞内小室。而且融合对象还可以包括亲和标记物,有助于多肽的纯化。
通常使用常规技术制备融合多肽,包括化学偶联。优选的,采用本发明的组合体和方法表达出重组多肽形式的融合多肽,并使表达系统的产量提高。简言之,例如编码多肽组分的DNA序列可以分别组装,并连接入适当的表达载体。编码一个多肽组分的DNA序列3’端,通过肽接头或者直接与编码另一个多肽组分的DNA序列5’端连接以保持序列的读码框一致。这样可以翻译出一条融合多肽并保持两个多肽组分的生物学活性。
使用多肽接头序列可以使第一和第二两个多肽组分分开足够的距离以确保每个组分能够折叠形成其二级和三级结构。这种多肽接头序列可以通过本领域熟知的常规技术整合到融合多肽中。可根据下述因素选择适当的肽接头序列:(1)具有柔韧性良好的构型;(2)不会产生二级结构与第一和第二多肽组分上的功能表位相互作用;及(3)没有可能会与多肽功能表位反应的疏水性或带电残基。优选的肽接头序列包括甘氨酸,天冬氨酸和丝氨酸残基。其它接近中性的氨基酸,例如苏氨酸和丙氨酸也可用于接头序列。可以用作接头的氨基酸序列包括Maratea等在《基因》40:39-46,1985中;Murphy等在《美国科学院院报》83:8258-8262,1986中;美国专利号4,935,233和美国专利号4,751,180中描述的。接头序列长度通常为1至约50个氨基酸。当第一和第二多肽的非必需N-端氨基酸区可以用于分离功能结构域和防止空间位阻影响时不需要接头序列。
连在一起的DNA序列可以与适当的转录或翻译调控元件可操作连接。负责DNA表达的调控元件只能位于编码第一多肽的DNA序列的5’端。同样,用于终止翻译的终止密码子和转录终止信号只能位于编码第二多肽的3’端。
融合多肽可以包括本发明中生产和/或描述的多肽和不相关的蛋白,例如能够引发记忆反应的免疫原性蛋白。这种蛋白的实例有破伤风、肺结核和肝炎蛋白(参照,例如,Stoute等,新英格兰医学杂志(NewEngl.J.Med.),336:86-91,1997)。
在一个优选实施例中,免疫学融合对象衍生于分支杆菌属,例如结核分支杆菌衍生的Ra12片段。Ra12用于增强表达和/或增强异源多核苷酸/多肽序列的免疫原性的组合体和方法在美国专利申请60/158,585中有说明,其公开内容以全文引入本文作为参考。简言之,Ra12是一段多核苷酸序列,是结核分支杆菌MTB32A核酸的亚序列。MTB32A是结核分支杆菌毒株和无毒株的基因编码的分子量为32kD的丝氨酸蛋白酶。MTB32A的核苷酸序列和氨基酸序列已有说明(例如,美国专利申请60/158,585;或参照,Skeiky等,感染和免疫(1999)67:3998-4007,本文引作参考)。MTB32A的C-末端片段编码序列能够高水平表达,纯化全过程维持为可溶性多肽。而且,Ra12可以增强与其融合的异源免疫原性多肽的免疫原性。一种优选的Ra12融合多肽包括对应于MTB32A的第192-323位氨基酸残基的14KD C-端片段。其它优选的Ra12多核苷酸通常包括连续至少约15个,至少约30个,至少约60个,至少约100个,至少约200个,或至少约300个编码Ra12多肽部分的核苷酸。Ra12多核苷酸可以包括天然序列(即编码Ra12多肽或其部分的内源序列)或包括这种序列的变体。Ra12多核苷酸变体可包括一个或多个替换,碱基添加,缺失和/或插入,与包含天然Ra12多肽的融合多肽相比,这种编码的融合多肽生物学活性基本上没有下降。与编码天然Ra12多肽或其部分的多核苷酸序列相比,变体优选具有至少约70%同一性,更优选至少约80%同一性,最优选的至少约90%同一性。
其它优选实施方案中,免疫学融合对象衍生于蛋白D,它是革兰氏阴性细菌流感嗜血菌B的表面蛋白(WO 91/18926)。优选的,蛋白D衍生物包括蛋白的大约三分之一(例如,N-端前100-110个氨基酸),蛋白D衍生物可以被脂质化。在某些优选的实施方案中,脂蛋白D融合对象的前109个残基定位于N-端可以使多肽额外具有外源性T-细胞表位并提高在大肠杆菌中的表达水平(从而功能相当于表达增强子)。尾部的脂类确保更好的将抗原递呈于抗原递呈细胞。其它融合对象包括流感病毒的非结构蛋白,NS1(红血球凝集素)。尽管可以使用包括T-辅助表位的不同片段,但是通常使用N-端81个氨基酸。
另一实施方案中,免疫学融合对象是已知的LYTA蛋白,或其部分(优选C-端部分)。LYTA衍生于肺炎链球菌(Streptococcuspneumoniae),其合成的N-乙酰化-L-丙氨酸酰胺酶即是已知的酰胺酶LYTA(LytA基因编码;基因43:265-292,1986)。LYTA是自溶素,特异性降解肽聚糖骨架中特定的键。LYTA蛋白C-端结构域负责与胆碱或胆碱类似物如DEAE的亲和反应。此特性可以用于能够表达融合蛋白的大肠杆菌C-LYTA表达质粒的开发。氨基端含有C-LYTA片段的杂合蛋白的纯化已有描述(参照生物技术10:795-798,1992)。在一个优选实施方案中,融合多肽中可整入LYTA的重复部分。重复部分位于C-末端,起始于第178位残基。特别优选的重复部分整入第188-305位残基。
然而另一个说明性实施方案涉及融合多肽,和其编码的多核苷酸,其中融合对象包括导向信号能够将多肽定位于内吞小泡/溶酶体小泡中,如美国专利号5,633,234中所述。本发明的免疫原性多肽与这种导向信号融合能够更有效的与MHC II类分子结合,因此能够增强体内这种多肽特异的CD4+T细胞刺激。
通常,本发明的蛋白和/多肽(包括融合多肽)是分离的。“分离的”多肽是指与其原始环境分离。例如,天然存在的蛋白或多肽如果与一些或所有的在天然环境下和其共存的物质分离,就是分离的。优选的这些多肽也经过纯化,例如,至少有约90%的纯度,更优选的至少约95%的纯度,最优选的至少约99%的纯度。
用本发明中的方法生产的特别优选的多肽包括结合剂,例如抗体和其抗原结合片段,能够与目的靶多肽发生免疫结合,例如与特定病态关联的多肽,或其部分、变体或衍生物。抗体或其抗原结合片段被认为能够与本发明的多肽“特异性结合”,“免疫结合”,和/或对其具有“免疫反应性”,条件是其与多肽在可检测的水平(在如ELISA反应中)发生反应,并且不能检测到与不相关的多肽在相似条件下的反应。
本文中使用的免疫结合,通常是指在免疫球蛋白分子和其特异的抗原之间发生的非共价反应类型。免疫结合反应的强度,或亲和力可以用反应的解离常数(kd)这个术语表示,其中kd越小表示亲和力越大。选用多肽的免疫结合特性能够通过本领域熟知的方法定量。一种方法必须测定抗原结合位点/抗原复合物形成和解离的速率,其中速率依赖于复合物对象的浓度,相互作用的亲和力,和均等影响两个方向速率的几何参数。这样,“结合速度常数”(Kon)和“解离速度常数”(Koff)可以通过计算浓度和实际的结合和解离速度确定。Koff/Kon的比率能够消除所有与亲和力无关的参数,所以与解离常数Kd相等。通常参照,Davies等(1990)生物化学年报59:439-473。
抗体的“抗原结合位点”,或“结合部分”是指免疫球蛋白分子参与抗原结合的部分。抗原结合位点是由重链(“H”)和轻链(“L”)N-末端可变区(“V”)的氨基酸残基形成。重链和轻链V区的三个高度多样化区段是指“高变区”,两侧为更保守的区段称为“框架区”,或“FR”。术语“FR”是指天然存在于免疫球蛋白分子的高变区之间或与其临近的氨基酸序列。抗体分子中,轻链的三个高变区和重链的三个高变区在三维空间中处于相互对应的位置能够形成抗原结合表面。抗原结合表面与结合抗原的三维空间表面互补,重链和轻链各自的三个高变区也称作“互补决定区”,或“CDR”。
使用本文提供和本领域已知的具有代表性的分析方法,例如那些特异于肿瘤相关蛋白的某些结合剂,还能够用于区分患有肿瘤和未患肿瘤的病人。例如,与肿瘤蛋白结合的抗体或结合剂优选产生一种信号,说明至少约20%的病人患有肿瘤,更优选至少约30%病人。或者,或另外,抗体可以产生负信号说明至少约90%的个体没有肿瘤。为了测定结合剂是否满足这种要求,可以用本文描述的方法对患有肿瘤和未患肿瘤的病人(用常规临床检测法确定)的生物样品(例如,血液,血清,痰液,尿和/或肿瘤活检)加以检测从而确定是否存在与结合剂结合的多肽。优选的,分析的患有癌症和未患癌症的样品数目具有统计学意义。每种结合剂都应符合上述标准;然而本领域普通技术人员应该认识到结合剂可以联合使用提高灵敏度。其它根据本发明生产的结合剂亦可能由于其对肿瘤相关多肽序列的特异性而具有治疗价值。
任何满足上述要求的作用物都可以是结合剂。例如,结合剂可以是核酶,含有或不含多肽组分,RNA分子或多肽。在一个优选实施方案中,结合剂是抗体或其抗原结合片段。可以用本领域普通技术人员熟知的各种技术制备抗体。例如,参照,Harlow和Lane,抗体:实验室手册,冷泉港实验室,1988。除了本文作为范例所述的本发明方法,专业人员还可获得大量的抗体制备技术。例如,采用细胞培养技术制备抗体,包括生成本文所述的单克隆抗体,或将抗体基因转染到适当的细菌或哺乳细胞宿主中,以产生重组抗体。在一种技术中,首先将含有多肽的免疫原注射到多种多样的任一哺乳动物(例如,小鼠,大鼠,兔子,绵羊或山羊)中。在这一步中,本发明的多肽可以用作不加修饰的免疫原。或者,特别对于较短的多肽,如果多肽与载体蛋白,例如牛血清蛋白或匙孔血蓝蛋白相连,可以引发很强的免疫反应。免疫原注入宿主动物中,优选根据预先制定的计划引入一次或多次加强免疫接种,并分时段给动物取血。针对多肽的特异性多克隆抗体可以再进行纯化从抗血清中分离,通过例如,用偶联于适当的固相支持物上的多肽进行亲和层析。
制备针对目的抗原多肽的特异性单克隆抗体可以通过,例如Kohler和Milstein在《欧洲免疫学杂志》6:511-519,1976中描述的技术或其改良技术进行。简言之,这些方法包括能够产生具有所需特异性的抗体(即与目的多肽反应)的无限增殖化细胞系的制备。这些细胞系可以产生于例如,按上述方法免疫动物的脾细胞。脾细胞接着被无限增殖化,通过例如与骨髓瘤细胞融合对象融合,优选是一种免疫动物的同源细胞。可以采用各种融合技术。例如,用非离子去垢剂混合脾细胞和骨髓瘤细胞数分钟,再以较低浓度涂布于支持杂交细胞生长而不支持骨髓瘤细胞生长的选择性培养基上。优选筛选技术使用HAT(次黄嘌呤,氨基蝶呤,胸苷)筛选。经过充足的时间,通常1-2周,可以观察到杂交株。挑选单个克隆,测定其培养上清液对多肽的结合活性。优选具有高活性和特异性的杂交瘤。
可以从培养杂交瘤克隆的上清液中分离出单克隆抗体。而且可采用各种技术提高产量,例如将杂交瘤细胞系注入适当的脊椎动物,如小鼠的宿主腹腔中。然后从腹水或血液中收获单克隆抗体。通过常规技术去除抗体中的污染物,例如色谱,凝胶过滤,沉淀,和抽提。本发明的多肽可以用于纯化过程,例如亲和层析步骤中。
本领域已知的许多治疗用分子含有抗原结合位点,能显示抗体分子的免疫结合特性。木瓜蛋白水解酶优选切割IgG分子产生若干片段,其中两个片段(“F(ab)”片段)各含有包括完整抗原结合位点的共价异二聚体。胃蛋白酶能切割IgG分子提供若干个片段,包括含有两个抗原结合位点的“F(ab′)2”片段。可以通过优选的蛋白水解酶切割IgM产生“Fv”片段,少数情况下切割IgG或IgA免疫球蛋白分子。然而,使用本领域熟知的重组技术生产Fv片段更常见。Fv片段含有包括了抗原结合位点的非共价VH∷VL异二聚体,此位点很大程度保留了天然抗体的抗原识别和结合能力。Inbar等(1972)美国科学院院报69:2659-2662;Hochman等(1976)生物化学15:2706-2710;及Ehrlich等(1980)生物化学19:4091-4096。
单链Fv(“sFv”)多肽是自通过多肽编码接头连接的包括VH和VL编码基因的融合基因表达而成的共价连接的VH∷VL异二聚体。Huston等(1988)美国科学院院报85(16):5879-5883。已描述了许多分辨化学结构的方法可以将天然聚合的——但是化学分离的——抗体V区的重链和轻链转变成sFv分子,它可以折叠成与抗原结合位点基本相似的三维结构。参照,例如授权于Huston等人的美国专利号5,091,513和5,132,405以及授权于Ladner等的美国专利号4,946,778。
上述每种分子均包括重链和轻链CDR区,分别位于重链和轻链的FR区之间,FR区对CDR区有支持作用而且界定了CDR相互之间的空间关系。如本文使用的术语“CDR区”指重链或轻链V区中的高变区。从重链或轻链的N-端起,这些区段分别命名为“CDR1”,“CDR2”,和“CDR3”。所以抗原结合位点包括六个CDR,包括重链和轻链各自V区的CDR区。含有一个CDR(例如CDR1,CDR2或CDR3)的多肽在本文中是指“分子识别单位”。晶体学分析了大量的抗原-抗体复合物,结果显示CDR的氨基酸残基与结合的抗原形成了广泛的接触,其中接触最多的是重链的CDR3。所以,分子识别单位是主要负责抗原结合位点的特异性。
如本文使用的术语“FR区”指重链或轻链V区的CDR区中构成CDR两侧的四条氨基酸序列。某些FR残基可与结合抗原接触;然而,FR主要负责V区的折叠以形成抗原结合位点,特别是直接临近CDR的FR残基。FR内一些氨基酸残基和结构特征是高度保守的。在这方面,所有的V区序列含有大约90个氨基酸残基的内部二硫环。当V区折叠成结合位点,CDR显示出突出的环基序形成抗原结合表面。通常认为影响CDR环折叠成某些“规范”结构的形状的是FR的保守结构区而不是CDR精确的氨基酸序列。而且,已知一些FR残基参与了结构域间的非共价接触稳定了抗体重链和轻链间的相互作用。
已描述了大量“人源化的”抗体分子,它们含有衍生于非人的免疫球蛋白分子的抗原结合位点,包括嵌合抗体,它们含有啮齿类的V区及相连的CDR并与人的恒定区融合(Winter等(1991)自然349:293-299;Lobuglio等(1989)美国科学院院报86:4220-4224;Shaw等(1987)免疫学杂志138:4534-4538;Brown等(1987)癌症研究47:3577-3583),啮齿类CDR在与适当的人抗体恒定区融合之前嫁接到人的有支持作用的FR上(Riechmann等(1988)自然332:323-327;Verhoeyen等(1988)科学239:1534-1536;Jones等(1986)自然321:522-525),及啮齿类CDR由重组修饰的啮齿类FR支持(欧洲专利公开号519,596,出版日期1992年12月23日)。这些“人源化的”分子是为了减弱不必要的针对啮齿类抗人的抗体分子的免疫反应而设计的,这种反应限制了这些部分在人类受体治疗应用时的持续时间和效果。
如本文中使用的术语“修饰的FR”和“重组修饰的FR”指选择性的替换FR残基,例如,用人FR残基替换啮齿类重链或轻链V区中的FR残基形成具有抗原结合位点的异源分子,该位点基本上保留了所有天然FR多肽折叠结构。修饰技术的根据是抗原结合位点的配体结合特性主要由其结构和抗原结合表面中重链和轻链的CDR区的相对位置决定。Davis等(1990)生物化学年报59:439-473。所以抗原结合特性可以在人源化抗体中保留只要CDR结构、它们相互之间的相互作用及与其它V区结构域的相互作用能小心地得以维持即可。使用修饰技术,容易为免疫系统识别的外部(如溶剂可接近的)FR残基可以选择使用人类的残基替换,形成具有较弱免疫原性或基本上无免疫原性的表面经修饰的杂合分子。
修饰过程利用可以得到的人类抗体可变区序列数据,Kabat等汇编,免疫学所需蛋白序列(Sequences of Proteins of ImmunologicalInterest),第4版(美国卫生与人类服务部,美国政府印刷局,1987),Kabat更新数据库,和其它可以得到的美国和外国数据库(核酸和蛋白)。V区与溶剂可接触的氨基酸可以从已知的人和鼠抗体片段的三维结构推测获得。修饰鼠的抗原结合位点通常有两步。首先,比较目的抗体分子可变区FR与对应的来自上述确定数据的人可变结构域FR序列。然后逐个氨基酸残基对比同源性最高的人V区与相应的鼠氨基酸。鼠FR中不同于人相应部分的氨基酸残基用本领域熟知的技术替换为人类部分中存在的残基。残基替换只能选用至少部分暴露的部分进行(溶剂可以接触的),而且氨基酸替换时必须小心,因其会对V区结构域的三级结构产生显著影响,例如脯氨酸,甘氨酸和带电氨基酸。
这样,获得“修饰的”鼠抗原结合位点的设计要保留鼠CDR残基,与CDR基本上邻近的残基,经鉴定被包埋或大部分被包埋的残基(溶剂不能接触的),认为参与重链和轻链间的非共价(例如静电作用和疏水作用)相互作用的残基,以及认为影响CDR环的“规范”三级结构的FR保守结构结构区的残基。再根据这些设计标准制备连接了鼠重链和轻链CDR及人源FR的重组核苷酸序列,此序列可以转染哺乳动物细胞表达具有鼠抗体分子抗原特异性的重组人抗体。
本发明另一个实施方案中,根据本发明生产的抗体可以与一个或多个治疗剂偶联。这方面适用的试剂包括放射性核素,分化诱导物,药物,毒素,和它们的衍生物。优选的放射性核素包括90Y,123I,125I,131I,186Re,188Re,211At,和212Bi。优选的药物包括氨甲蝶呤,嘧啶和嘌呤类似物。优选的分化诱导物包括佛波酯和丁酸。优选的毒素包括蓖麻毒素,相思豆毒素,白喉毒素,霍乱毒素,核糖体失活蛋白(gelonin),假单孢菌外毒素,痢疾毒素,和美洲商陆抗病毒蛋白。
治疗剂可以直接或间接(例如通过接头基团)与适当的单克隆抗体偶联(例如共价连接)。如果试剂和抗体各具有能彼此相互作用的取代基,两者可以直接反应。例如,一种分子上的亲核基团,如氨基或巯基基团,能够与另一分子上的含羰基的基团,例如酐或酰卤,或含容易取代的基团(例如卤化物)的烷基反应。
或者,适合通过接头基团偶联治疗剂和抗体。接头基团用作抗体和试剂间的间隔子能将两者分开以避免对结合能力的影响。接头基团也可以用于提高在试剂或抗体上取代基的化学活性,从而提高偶联效率。化学活性的提高也便于使用试剂,或试剂上的官能团,否则不可能使用它们。
使用各种双官能团或多官能团试剂,功能相同和功能不同的(例如Pierce化学公司Rockford,IL目录中描述的那些)作为接头基团对本领熟练技术人员是显而易见的。偶联可能会受到例如,氨基基团,羧基基团,巯基基团或氧化的碳水化合物残基的影响。有很多参考文献描述了这些方法,例如,授权于Rodwell等人的美国专利号4,671,958。
如果本发明的免疫偶联物的治疗剂脱离抗体会更有使用价值,则使用能够在进入细胞的过程中或进入细胞后发生切割的接头基团更为理想。大量可被切割的不同接头基团已有描述。胞内从接头基团上释放偶联剂的机理包括还原二硫键的切割(例如,授权于Spitler的美国专利号4,489,710),照射光敏键(例如,授权于Kohn等的美国专利号4,638,045),衍生化氨基酸侧链的水解(例如,授权于Kohn等人的美国专利号4,638,045),血清补体介导的水解(例如,授权于Rodwell等的美国专利号4,671,958),以及酸催化水解(例如,授权于Blattler等的美国专利号4,569,789)。
适合蛋白和/或多肽表达的多核苷酸
另一方面本发明提供了编码上文描述的重组蛋白和/或多肽的多核苷酸。术语“DNA”和“多核苷酸”在本文交换使用,指从特定物种总基因组DNA中分离出的游离DNA分子。本文用的“分离”意思是多核苷酸基本上与其它编码序列分离,而且该DNA分子不含大部分不相关的编码DNA,例如大的染色体片段或其它功能基因或多肽编码区。当然,所指的DNA分子是分离出的原始片段,不排除后来人工添加到这些区段上的基因或编码区。
多核苷酸可以包括原始序列(即编码蛋白和/或多肽的内源序列,例如抗体,或其部分)或包括编码变体或衍生物的序列,优选这种序列的免疫原性变体或衍生物。在一些实施方案中,多核苷酸序列可以编码如上文所述的免疫原性多肽。
通常,多核苷酸变体含有一个或多个替换,添加,缺失和/或插入,优选由变体多核苷酸编码的多肽的免疫原性与本文特意提及的多核苷酸序列编码的多肽相比基本上没有下降。对术语“变体”的理解应包括异种来源的同源基因。
本发明的多核苷酸或其片段,无论编码序列本身的长度,可以与其它DNA序列,例如启动子,多聚腺苷酸信号,附加内切酶位点,多克隆位点,其它编码区段等等联合使用,这样它们总长度差异较大。因此预期可以使用各种长度的核酸片段,优选总长度受制备的难易度和要使用的重组DNA技术限制。例如,作为范例的多核苷酸区段总长度约为10,000,5000,3000,2000,1000,500,100,50个碱基对等,(包括所有中间产物的长度)预期在本发明的许多方面是有用的。
根据本发明适用于高表达、大规模生产的多核苷酸可以使用许多已有的技术鉴定,制备和/或操作(参照,Sambrook等,分子克隆:实验室手册,冷泉港实验室,冷泉港,纽约,1989,以及其它参考文献)。例如,通过cDNA微阵列筛选肿瘤相关表达的方法可鉴定多核苷酸。这种筛选可以根据制造商的说明书(并基本上如Schena等,美国科学院院报93:10614-10619,1996及Heller等,美国科学院院报94:2150-2155,1997)所述采用,例如Affymetrix公司的微阵列技术(Santa Clara,加利福尼亚)来进行。或者,可从表达本文描述的蛋白的细胞,例如肿瘤细胞,制备的cDNA扩增多核苷酸。
可以使用许多依赖模板的方法扩增样品中存在的目的靶序列。最著名的扩增方法是多聚酶链式反应(PCRTM),在美国专利号4,683,196,4,683,202和4,800,159中有详述,分别以其全文在此引作参考。简言之,PCRTM中,制备两条与靶序列反相互补链的区域互补的引物序列。将过量的脱氧三磷酸核苷与DNA聚合酶(例如Taq聚合酶)一起加入到反应混合物中。如果样品中存在靶序列,引物就会与靶结合,聚合酶通过添加核苷酸使引物沿靶序列延伸。升高和降低反应混合物的温度,延伸的引物会与靶解离形成反应产物,多余的引物与靶及反应产物结合,延伸过程得以重复。采用优选的反转录和PCRTM扩增程序可定量扩增的mRNA数量。聚合酶链式反应方法是本领域熟知的。
其他众多依赖模板的任何方法,其中许多都是PCRTM扩增技术的变化形式,为本领域熟知并可以获得的。作为范例的一些方法包括连接酶链式反应(称作LCR),在例如,欧洲专利申请公开号320,308和美国专利号4,883,750中有描述;Qbeta复制酶,在PCT国际专利申请公开号PCT/US87/00880中有描述;链替换扩增(SDA)和修复链式反应(RCR)。还有其它扩增方法在大英国专利申请号2 202 328,和PCT国际专利申请公开号PCT/US89/01025中有描述。其它核酸扩增程序包括以转录为基础的扩增系统(TAS)(PCT国际专利申请公开号WO88/10315),包括基于核酸序列的扩增(NASBA)和3SR。欧洲专利申请公开号329,822描述了包括循环合成单链RNA(“ssRNA”),ssDNA和双链DNA(dsDNA)的核酸扩增程序。PCT国际专利申请公开号WO89/06700描述了一种基于启动子/引物与靶单链DNA(“ssDNA”)杂交接着转录出该序列的许多RNA拷贝的核酸扩增方法。其它扩增方法如“RACE”(Frohman,1990),和“一侧PCR(one-sided PCR)”(Ohara,1989)也是本领域熟练技术人员熟知的。
可以采用熟知的技术,用本发明多核苷酸的扩增部分从适当的文库(例如,肿瘤cDNA文库)中分离出全长基因。这些技术中,用适合于扩增的一种或多种多核苷酸探针或引物筛选文库(cDNA或基因组)。优选的,文库的大小经过筛选并包括较大的分子。随机引物文库优选用于鉴定基因的5’端和上游区。基因组文库优选用于获得内含子和延长的5’序列。或者,或另外,根据本发明在常规的亚克隆技术中基本上可使用任何扩增的多核苷酸以获得基于UCOE的载体。
对杂交技术而言,可以使用众所周知的技术标记部分序列(例如,使用32p进行缺刻翻译或末端标记)。通常用标记探针和含有变性细菌克隆(或长有噬菌斑的菌苔)的膜杂交筛选细菌或噬菌体文库(参照,Sambrook等,分子克隆:实验室手册,冷泉港实验室,冷泉港,纽约,1989)。筛选并扩增杂交克隆或噬菌斑,分离DNA作进一步分析。例如,使用一条与部分序列相同的引物和一条与载体序列相同的引物进行PCR,可以分析cDNA克隆从而确定附加序列的量。制作限制性内切酶图谱和部分序列鉴定一个或多个重叠克隆。通过常用技术,可能包括制备一系列缺失克隆,确定完整的序列。产生的重叠序列可以再组装成一条连续的序列。使用已知的技术,可以通过连接适当的片段获得全长cDNA分子。
或者,如上所述的扩增技术可用来从部分cDNA序列获得全长编码序列。一种这样的扩增技术是反向PCR(参照,Triglia等,核酸研究,16:8186,1988),它采用限制性内切酶在基因的已知区域产生片段。再通过分子内连接环化该片段并以其为模板用已知区域的趋异引物进行PCR。在一个替代方法中,部分序列的邻近序列的恢复可以通过使用一条接头序列的引物和一条特异于已知区域的引物扩增进行。扩增得到的序列通常在使用同一条接头引物和另一条特异于已知区域的引物进行第二轮扩增。这一方法的不同之处在WO96/38591中有描述,它采用两条引物从已知序列的不同方向进行初始延伸。另一技术称为“cDNA末端快速扩增”或RACE。这一技术要使用一条内引物和一条外引物,后者与多聚腺苷酸区或载体序列杂交,鉴定已知序列的5’和3’端。其它技术包括捕获PCR(Lagerstrom等,PCR方法应用1:111-19,1991)和行走PCR(Parker等,核酸研究19:3055-60,1991)。也可使用其它扩增方法获得全长cDNA序列。
在一些情形下,可以通过分析表达序列标签(EST)数据库中提供的序列来获得全长cDNA序列,所述数据库诸如从GenBank中获得的数据库。寻找重叠EST通常可以通过使用众所周知的程序(例如NCBIBLAST搜索)进行,可以使用这些EST产生连续的全长序列。也可以通过分析基因组片段获得全长DNA序列。
本发明一些优选的实施方案中,多核苷酸序列或其片段可以用于基于UCOE的载体的构建和/或使用中,并编码一条或多条目的多肽,例如抗体或融合蛋白或其功能等价物。由于遗传密码本身的简关性,会产生其它基本上编码相同或功能相当的氨基酸序列的DNA序列,这些序列可用于克隆和表达给定蛋白。
如本领域技术人员理解的,在一些情形下产生具有非天然存在的密码子的多肽编码核苷酸序列是有利的。例如,可以选用特定的原核或真核宿主优选的密码子提高蛋白表达速率或产生具有所需特性的重组RNA转录本,例如半衰期比天然序列生成的转录本更长。
而且,本发明的多核苷酸序列能够通过本领域广泛熟知的方法加以改造,以适应多种需求改变多肽编码序列,包括但不局限于,修饰克隆,加工,和/或基因产物的表达而造成的改变。例如,可以采用随机片段化重组DNA,PCR重新组装基因片段及合成寡核苷酸来改造核苷酸序列。另外,可以采用定点突变插入新的内切酶位点,改变糖基化模式,改变密码子嗜好性,形成剪切变体或引入突变等等。
新合成的多肽应基本上纯化,例如,采用制备高效液相色谱(例如,Creighton,T.(1983)蛋白,结构和分子原理,WH Freeman和Co.,纽约市,纽约州)或其它相应的本领域可以获得的技术。合成多肽的组成可以用氨基酸分析或测序的方法进行鉴定(例如,Edman降解法)。另外,多肽或其部分的氨基酸序列可以经直接合成和/或用化学法与其它蛋白或其部分的序列组合而得到改变,产生变体多肽。
提供下述实施例进行说明,但本发明不局限于此。
实施例
实施例1
用基于UCOE的载体系统表达重组抗体
本实施例比较了使用含有或不含有UCOE的载体表达重组抗体的水平。
用如图1所示的含有人RNP UCOE的载体表达改造的人抗体Ab3。还构建了相同的但不含UCOE元件的载体。本实施例中Ig重链编码序列含有改造的人V区序列,此序列位于人Igγ-1恒定区编码基因组DNA片段上游并保持读码框一致。Ig轻链编码区包含改造的人V区序列,此序列位于人Igκ恒定区编码cDNA片段上游并与之保持读码框一致。表达Ig重链的载体还含有一个neo筛选标记基因,表达Ig轻链的载体含有潮霉素筛选标记。参照图2A。
根据厂商说明用lipofectamine(Life Techndogies)对CHO-K1细胞进行轻链和重链载体的共转染。细胞筛选用潮霉素和G418。培养转染的细胞群,在转染后不同时间用ELISA检测分泌到培养基中组装的免疫球蛋白水平。(图3)。不含RNP UCOE的载体转染48小时抗体表达水平很低(大约48ng/ml),之后表达水平下降。相反,用含RNP UCOE的表达载体转染的细胞群中,随着转染细胞扩大培养抗体水平持续累积,转染后15天可达3毫克/ml。所以使用UCOE使得高水平表达重组免疫球蛋白的转染细胞群快速增殖。
实施例2
在转染有基于UCOE的表达载体系统的CHO宿主细胞系中实现高水平大规模表达
用含有UCOE抗体表达盒的载体共转染CHO-S细胞(如图1所示)获得改造的人抗体Ab1。Ig重链编码序列含有改造的人V区序列,此序列位于人Igγ-4恒定区编码基因组DNA片段上游并保持读码框一致。Ig轻链编码区包含改造的人V区序列,此序列位于人Igκ恒定区编码cDNA片段上游并保持读码框一致。表达Ig重链的载体还含有一个neo筛选标记基因,表达Ig轻链的载体含有潮霉素筛选标记。参照图2B。
根据厂商说明用lipofectamine(Life Technologies)进行转染。在CD-CHO培养基(Life Technologies)中加入潮霉素和G418筛选细胞,挑选亚克隆。此过程大约需5周。将一个亚克隆扩大培养,在2L生物反应器中进行最终参数优化,再扩大到100L的生物反应器中。采用此方法表达重组抗体的大部分转化子典型的生产率大约为5pg/细胞/天。细胞培养悬液中一种抗体的产量大约可达200mg/l。参照图4。共转染到CHO-S细胞中的两种表达载体含有UCOE,它使得可以快速分离转化子克隆并立即悬浮培养于组成培养基中。
实施例3
CHO-K1和CHO-S宿主细胞系的低水平Gal-Gal残基
如上文所述,含有Galα1→3Galβ1→4GlcNAc-R(Gal-Gal)糖残基的抗体在用于人体治疗时,已经与蛋白在血清中被迅速清除有关。所以,生产不含这种糖残基的重组蛋白是有利的。参照,例如,Borrebaeck等,当代免疫学
14:477-479(1993)和Kagawa等生物化学杂志
263:17508-17515(1988)。使用FITC标记的IB4凝集素和流式细胞仪可见CHO-S细胞表面没有Gal-Gal残基。参照图5;方法描述参见Cho等,生物化学杂志
272;13622-13628(1997)和Gorelik等,癌症研究55:4185-4173(1995)。在这方面,CHO-S与另一种广泛使用并经测试的CHO细胞系,CHO-K1相似。相反,小鼠杂交瘤细胞系在此试验测试中显示细胞表面有高水平的Gal-Gal糖基。上述细胞系表达的重组蛋白纯化后质谱分析显示无Gal-Gal糖基(数据未显示)。
实施例4
改良的多亚基重组蛋白表达水平的双向UCOE载体
此实施例公开了双向UCOE载体系统上重组抗体重链和轻链蛋白表达水平的提高。
引入接头分子将pORT1(Cobra Therapeutics)的两个Sfi I位点变为Mfe I位点,接头分子含有退火的寡核苷酸Mfe.F,5’-AACAATTGGCGGC(SEQ ID NO:10)和Mfe.R,5’-GCCAATTGTTGCC(SEQ IDNO:11)。使用引物TK.F,5’-ACGCGTCGACGGAAGGAGACAATACCGGAAG(SEQ ID NO:12)和TK.R,5’-CCGCTCGAGTTGGGGTGGGGAAAAGGAA(SEQ ID NO:13)从pVgRXR(Invitrogen)上扩增HSV TK多聚腺苷酸位点,在SalI位点插入Sal I-Xho I的片段。接着,从雄性BALB/c基因组DNA(Clontech)扩增鼠PKG多聚腺苷酸位点,使用引物mPGK.F,5’-CGGGATCCGCCTGAGAAAGGAAGTGAGCTG(SEQID NO:14)和mPGK.R,5’-GAAGATCTG GAGGAATGAGCTGGCCCTTA(SEQ ID NO:15),将BamH I-Bgl II片段克隆到BamH I位点。用T4 DNA聚合酶处理含有neo表达盒的pcDNA3.1的Ase I-Sal I片段,与Spe I接头连接(5’-GACTAGTC;SEQ ID NO:16)连接,接着将SpeI片段克隆到Spe I位点中产生pORTneoF;或者用T4 DNA聚合酶处理携带嘌呤霉素抗性表达盒的CET700(Cobra Therapeutics)的EcoR I-Not I片段,与Xba I接头连接,再将Xba I片段克隆到Xba I位点中产生pORTpuroF。将来自pCMVEGFPN-1(Cobra)的Hind III-BamH I鼠CMV启动子片段亚克隆到BKS+(Cobra)的杂合UCOE的Hind III-BamH I位点。从质粒pIRESneo(Clontech)上扩增人CMV启动子,使用引物hCMVF,5’-CTCGAGTTATTAATAGTAATCAATTACGGGGTCAT(SEQ ID NO:17)和hCMVR,5’-GTCGACGATCTGACGGTTCACTAAA CCAGCTCT(SEQ ID NO:18),将Xho I-Sal I片段克隆到SalI位点。再将BamH I-SalI片段克隆到pORTneoF的BamH I-SalI位点产生pBDUneo100,或者克隆到pORTpuroF产生pBDUpuro300。通过定点突变改变BKS+中杂合UCOE Sal I克隆位点上游的两个ATG密码子,再将BamH I-Sal I片段克隆到pORTneoF的BamH I-Sal I位点产生pBDUneo200,或者克隆到pORpuroF产生pBDUpuro400。
将人抗体轻链克隆到四种双向UCOE载体(pBDUneo100,pBDUneo200,pBDUpuro300和pBDUpruo400;分别见图6-9及SEQ IDNO:1-4)的任一BamH I或SalI位点,接着将重链插入留下的BamH I或Sal I克隆位点产生pBDUneo112,pBDUneo121,pBDUneo212,pBDUneo221,pBDUpuro112,pBDUpuro121,pBDUpuro212和pBDUpuro221。
其它适于共表达两种或多种重组蛋白的双向UCOE载体如图10-13所示(SEQ ID NO:5-8),分别称为pBDUneo500,pBDUneo600,pBDUpuro700和pBDUpuro800。可以使用这些载体,例如优化杂合UCOE表达抗体的方向,并提供替代启动子的组合进行优化。
用Xba I(部分)和NsiI消化质粒pORTpuroF以去除牛生长激素多聚腺苷酸位点,再与SV40早多聚腺苷酸位点相连,此位点用引物14506,5’-CCAATGCATAGGTTGGGCTTCGGGAATCGT(SEQ IDNO:19)和14507,5’-GCTCTAGATCTCGACGGTATACAGACATGAT(SEQ ID NO:20)扩增而来并经XbaI和NsiI消化,产生质粒pORTpuroF2。杂合UCOE载体含有位于人RNP UCOE下游的鼠CMV启动子和两个突变的位于肌动蛋白启动子和Sal I位点之间的ATG密码子,用BamHI和HindIII消化此载体去除鼠CMV启动子,然后与人CMV启动子相连,此启动子用引物14425,5’-CCCAAGCTTATTAATAGTAATCAATTACGGGGTCAT(SEQ ID NO:21)和14426,5’-CAAGGATCCGATCTGACGGTTCACTAAACCAGCTCT(SEQ ID NO:22)扩增而来并经BamHI和HindIII消化。将含有退火的寡核苷酸14466,5’-TCGAGTCGTTTAAACTCTAG(SEQ ID NO:23)和14465,5’-TCGACTAGAGTTTAAACGAC(SEQ ID NO:24)的接头插入SalI位点,用PmeI和SalI消化,再与鼠CMV启动子相连,此启动子已由引物14435,5’-GAATTCGAGCTCGCCCAACTCCGCCCGTTTTAT(SEQID NO;25)和14436,5’-ATTTGTCGACTCTAGACCCGGGCTGCAGCGAGGAGCTCT(SEQ ID NO:26)扩增而来并经SalI消化。用BamHI和SalI消化含有或不含鼠CMV启动子的质粒,与BamHI和SalI消化的pORTneoF相连产生质粒pBDUneo500和pBDUneo600;或与BamHI和SalI消化的质粒pORTpuroF2相连分别产生质粒pBDUpruo700和pBDUpuro800。
根据厂商说明用lipofectamine或DMRIE-C(Invitrogen)分别将表达重链和轻链的G418或嘌呤霉素抗性的双向UCOE载体转染到CHO-K1或CHO-S细胞中,用500ug/ml G418(neo载体)或12.5ug/ml嘌呤霉素(puro载体)筛选。挑选细胞群并比较不同构建体之间的抗体生产率以确定CHO细胞表达抗体联合使用的优化的启动子和筛选标记。
CHO-S悬浮细胞表达研究结果归纳于表2。这些数据显示含有轻链的载体用鼠CMV启动子表达,获得最佳的抗体表达水平。使用的载体含有嘌呤霉素或G418抗性筛选标记。另外,将两种双向载体,一种含有嘌呤霉素抗性标记,一种含有G418抗性标记,进行共转染。挑选细胞群,确定抗体生产率。只转染G418或只转染嘌呤霉素抗性的转化子生产率相似,但是共转染的细胞群生产率显著增高。这说明有可能通过用不同的筛选标记保持双拷贝的抗体表达载体来提高生产率。用高浓度嘌呤霉素(25-50μg/ml相对12.5μg/ml)挑选出的细胞群与增高的产量不相关。
从携带pBDUpuro421的嘌呤霉素抗性细胞群中分离克隆细胞系。二十二个克隆细胞系中有十五个表达的抗体量能够检测到。测量的初始生产率显示细胞系分泌蛋白的速率最大为16pg/细胞/天(表3)。Southern印迹法分析鉴定出至少一个克隆的生产率为13pg/细胞/天,而且大致含有一个拷贝的载体DNA(克隆S421.7)。从细胞群中分离出生产率为3-18pg/细胞/天的克隆。选用表达量约为5pg/细胞/天的克隆进行初始发酵试验。
表2
双向UCOE载体表达hAb1(IgG4)
载体 | H3启动子 | K1启动子 | 生产率 (pg/细胞/天) |
PBDUneo112 | 鼠CMV | 人CMV | 0.3 |
PBDUneo121 | 人CMV | 鼠CMV | 1.5 |
PBDUneo212 | 鼠CMV | 人β-肌动蛋白 | 0.06 |
PBDUneo221 | 人β-肌动蛋白 | 鼠CMV | 1.3 |
PBDUpuro312 | 鼠CMV | 人CMV | 0.5 |
PBDUpuro321 | 人CMV | 鼠CMV | 1.4 |
PBDUpuro412 | 鼠CMV | 人β-肌动蛋白 | 0.05 |
PBDUpuro421 | 人β-肌动蛋白 | 鼠CMV | 2.3 |
共转染** | 人CMV | 人CMV | 0.7 |
PBDUneo221 | 人β-肌动蛋白 | 鼠CMV | 1.3 |
PBDUpuro421 | 人β-肌动蛋白 | 鼠CMV | 1 |
PBDUneo221+ | 人β-肌动蛋白 | 鼠CMV | 5 |
PBDUpuro421 |
**以前使用均由4kb UCOE CMV载体(潮霉素和新霉素筛选)驱动的相同抗体基因实施共转染
表3
转染有pBDUpuro421的克隆CHO-S细胞系表达hAb1
潮霉素抗性细胞系 | 生产率 (pg/细胞/天) |
S421.2 | 5.4 |
S421.3 | 0.5 |
S421.4 | 0.5 |
S421.7 | 13.4 |
S421.8 | 5.4 |
S421.9 | 0.04 |
S421.12 | 1.4 |
S421.14 | 6.7 |
S421.15 | 0.3 |
S421.16 | 7.2 |
S421.17 | 5 |
S421.18 | 0.8 |
S421.20 | 1.2 |
S421.21 | 0.3 |
S421.22 | 16 |
实施例5
RNP UCOE的缺失分析
本实施例描述了在RNP UCOE质粒载体内缺失多核苷酸来提高重组蛋白的表达水平。简言之,在8kb RNP UCOE内制备一系列缺失,以鉴定在不影响UCOE功能的情况下可以被删除的重要的功能元件和区域。将绿色荧光蛋白基因(GFP)克隆到质粒CET720(CobraTherapeutics),再将缺失的序列导入UCOE区域(图14)。将第一套缺失序列转染CHO-S细胞,并检测是否可以表达GFP。瞬时转染分析(转染两天后)中,荧光显微技术检测所有的质粒都可以表达GFP。筛选稳定的携带不同构建体的细胞群,用FACS分析确定GFP的表达。转染后一个月,相对不含UCOE的对照质粒,所有的缺失都显示出更高的阳性细胞百分数(>50%对不含UCOE的10%),阳性群体的平均荧光高于不含UCOE的对照质粒(表4)。
这些数据更精确地界定了完全活性所需的人RNP UCOE的区域,并鉴定出更短(大约7kb)的完全活性的UCOE元件。通过缺失ΔRV形成这段新的7kb UCOE元件并从第2225位延伸至第9254位核苷酸,如图14。
表4
在8kb RNP UCOE内含有缺失的质粒的GFP表达
质粒 | 缺失区 | 阳性百分数 | 阳性细胞群的平均 荧光性 |
CET720GFP(8kbUCOE) | 无 | 68 | 516 |
CET700GFP(无UCOE) | 核苷酸2225-10525 | 10 | 136 |
ΔBS(4 kb UCOE) | 核苷酸2225-6341 | 61 | 370 |
ΔEcoNI | 核苷酸3875-6916 | 65 | 439 |
ΔEX2 | 核苷酸6916-7053 | 53 | 384 |
ΔEM | 核苷酸6916-7209 | 66 | 423 |
ΔMX | 核苷酸7053-7209 | 66 | 464 |
ΔMluI | 核苷酸7209-8293 | 58 | 448 |
ΔRV | 核苷酸9254-10342 | 72 | 548 |
用EcoRV,MluI,EcoNI,或BamHI加上SalI消化载体CET720GFP(如SEQ ID NO:9所示,含有8kb人RNP UCOE),用T4 DNA聚合酶补平末端,再使载体重新连接分别产生载体δRV,δMluI,δEcoNI和δBS。用PflMI消化CET720,T4 DNA聚合酶补平末端,再用BamHI切割。将平末端到BamHI粘端的片段克隆到pBluescript II SK(+)的EcoRV-BamHI位点产生pPB720。用EcoNI和MluI,MluI和XhoI(部分),或EocNI和XhoI(部分)消化pPB720,用T4 DNA聚合酶处理末端后再环化。将每一个这样产生的载体的PshAI片段克隆到CET720GFP的PshAI位点分别产生范例载体δEM,δEX和δMX。
实施例6
RNP UCOE其它缺失分析
上文所述的实施例通过缺失分析已鉴定出载体CET720GFP(SEQID NO:9)的第2225-6916位和第9254-10342位核苷酸的UCOE区域可以被去除而不损失UCOE活性(参照上文实施例5)。本实施例中,进一步确定了最小的对活性很重要的8kb UCOE区域。重要的是,此分析更精确地界定了保留全部活性的4.1kb的范例性人RNP UCOE。
简言之,补平8kb RNP UCOE片段,与HindIII接头连接(NewEngland Biolabs;目录编号S1098S),用HindIII消化并与HindIII消化及小牛肠碱性磷酸酶处理的载体CET700GFP连接。用DMRIE-C(Invitrogen)将载体转染到CHO-S细胞中,其中瞬时转染分析显示所有的构建体都可以表达GFP(数据未显示)。嘌呤霉素筛选两周后,用FACS确定阳性细胞群的荧光几何平均数,并以对照(CET720GFP)的百分数表达,结果总结于下文表5中。载体700FRV含有4.1kb的MfeI-EcoRV的RNP UCOE片段,相应于CET720GFP的第5152-9254位核苷酸残基,相对于CET720 GFP的第2225-10525位核苷酸残基的8kb UCOE区域保留了全部UCOE活性。所以,此4.1kb UCOE片段代表一种新型最小的UCOE元件,它保留了与全长8kb UCOE元件相当的活性。
表5
质粒 | 存在的UCOE区域 | 对照百分数 |
CET720GFP(8kb UCOE) | 核苷酸2225-10525 | 100 |
CET700(无UCOE) | 无 | 10 |
δRV | 核苷酸2225-9254核苷酸10342-10525 | 99 |
700HRV.F | 核苷酸2240-9254 | 121 |
700FRV.F | 核苷酸5152-9254 | 122 |
700BRV.F | 核苷酸6341-9254 | 73 |
还测定了三个包含于700HRV.R,700FRV.R和700BRV.R中的UCOE片段的活性,UCOE片段以相反方向插入分别产生质粒700HRV.F,700FRV.F和700BRV.F。同样的,瞬时转染分析中所有的质粒都可以表达GFP。嘌呤霉素筛选三周后,用FACS确定阳性细胞群的荧光几何平均数,并以对照(CET720GFP)百分数表示,结果总结于下文表6中。然而含有相反方向UCOE的质粒观察到的活性水平较低,但是所有片段仍然都保留了UCOE活性。
表6
质粒 | 存在的UCOE区域 | 对照百分数 |
CET720GFP(8kb UCOE) | 核苷酸2225-10525 | 100 |
CET700(无UCOE) | 无 | 6 |
700HRV.F | 核苷酸2240-9254 | 59 |
700FRV.F | 核苷酸5152-9254 | 43 |
700BRV.F | 核苷酸6341-9254 | 30 |
实施例7
制备其它范例性双向UCOE载体
上述实施例描述了各种范例性UCOE载体的制备和评估。本实施例中,构建了其它UCOE载体。例如,制备载体pBDpuro350(SEQ IDNO:27)和pBDUpuro450(SEQ ID NO:28)使与上文描述的载体pBDpuro300和pBDpuro450相当,除了用SV40多聚腺苷酸位点替代嘌呤霉素抗性基因之后的多聚腺苷酸位点(参照图15和16)。其它几个载体中用上文缺失分析鉴定含有全部UCOE活性的4.1kb MfeI-EcoRV片段替代8kb RNP UCOE元件。为了改变pBDUpuro系列载体嘌呤霉素抗性盒的多聚腺苷酸位点,从pBSneo.23上用聚合酶链式反应扩增SV40多聚腺苷酸位点,反应产物用NsiI和XbaI消化并插入pORTpuroF的NsiI-XbaI位点以替代BGH多聚腺苷酸位点。再用BamHI和SalI消化这个新载体pORTpuroF’,并克隆到HUCMV(与鼠CMV启动子杂合的UCOE)的BamHI-SalI位点产生质粒pBDUpuro350(SEQ IDNO:27;仍参照图15),或克隆到pUCOEact3的BamHI位点(与ATG密码子定点突变的肌动蛋白启动子杂合的UCOE)产生pBDUpuro450(SEQ ID NO:28;参照图16)。其它UCOE载体的构建是在质粒pUCOEact3和pUCOEact3hCMV的人β-肌动蛋白和RNP UCOE片段之间边缘的KpnI位点处插入HindIII位点。然后去除携带RNPUCOE的4kb HindIII片段,替换为700FRV.R的4.1kb RNP UCOE片段。将SalI-BamHI(部分)片段克隆到pORTneoF和pORTpuroF’的SalI-BamHI位点产生pBDUpuro1200(SEQ ID NO:29;参照图17),pBDUpuro1450(SEQ ID NO:30;参照图18),pBDUneo1600(SEQ IDNO:31;参照图19)和pBDUpuro1800(SEQ ID NO:32;参照图20)。
实施例8
对双向UCOE活性重要的载体特征评定
1.
双向UCOE载体拷贝数对CHO-S细胞中抗体生产率的影响:
CHO-S细胞系S421.7显示含有单拷贝的表达hAb1(IgG4)的载体pBDUpuro421。为了确定增加载体拷贝数是否能提高抗体表达水平,用也表达hAb1但携带不同筛选标记(G418)抗性的载体pBDUneo221重新转染S421.7。分离克隆细胞并分析生产率(图21)。许多细胞系显示出比亲代细胞系S421.7更高的生产率,说明增加载体拷贝数可以提高产量。初步拷贝数分析显示细胞系S7.16,S7.20和S7.23含有1-2个拷贝的pBDUneo221载体(未显示数据)。
2.
杂合UCOE方向和启动子的选择对CHO-S细胞中抗体生产率的影 响
分析稳定的含有表达hAb1(IgG4)的不同的双向UCOE载体的CHO-S细胞群,以确定杂合UCOE相对于抗体基因的方向的影响,及不同启动子对抗体表达速率的影响。用一系列的表达hAb1(IgG4)的双向UCOE载体转染CHO-S细胞,用12.5μg/ml嘌呤霉素或500μg/mlG418筛选出稳定的细胞群。重链(H)和轻链(K)相对于杂合UCOE元件(肌动蛋白末端对RNP末端)和使用的启动子的定位如下文表7所示。用ELISA测定抗体生产率,western印迹分析确定轻链和重链相对细胞裂解物在上清液中的分布。杂合UCOE的方向对抗体表达水平仅显示极小的作用,然而联合使用的启动子的选择对生产率具有一定的影响。这些试验中获得的最高生产率是使用人β-肌动蛋白启动子表达重链,及使用鼠CMV或人CMV表达轻链的范例性载体(例如,pBDUpuro454和pBDUpuro804)。
表7
载体 | 肌动蛋白末 端 | RNP末端 | 重链( 上清 液) | 重链( 细胞 裂解 物) | κ链( 上清 液) | κ链( 细胞 裂解 物) | 生产率( pg/细 胞/天) |
pBDUpuro352 | hCMV-K | mCMV-H | + | ++ | + | - | 0.159 |
PBDUpuro354 | hCMV-H | mCMV-K | + | + | +++ | + | 0.256 |
PBDUpuro452 | 肌动蛋白-K | mCMV-H | +/- | ++ | +/- | - | 0.0056 |
PBDUpuro454 | 肌动蛋白-H | mCMV-K | ++ | + | +++ | ++ | 0.657 |
PBDUpuro702 | hCMV-K | mCMV-H | ++ | ++ | ++ | + | 0.391 |
PBDUpuro704 | hCMV-H | mCMV-K | ++ | ++ | ++ | +/- | 0.170 |
PBDUpuro802 | 肌动蛋白-K | mCMV-H | +/- | +++ | +/- | - | 0.020 |
PBDUpuro804 | 肌动蛋白-H | mCMV-K | +++ | +++ | +++ | ++ | 0.608 |
3.
CHO-S细胞中的转录对生产率
从携带pBDUpuro452,pBDUpuro454和pBDUpuro804的嘌呤霉素抗性细胞群中分离出克隆细胞系。大约三分之二的携带pBDUpuro454和pBDUpuro804的克隆细胞系的抗体生产率可以测出为1-10pg/细胞/天,与上文用pBDUpuro421载体获得的结果相似(结果未显示)。基因组样品进行的TaqMan分析显示克隆细胞系S452.3,S454.5和S804.4分别携带单拷贝的双向UCOE载体pBDUpuro452,pBDUpuro454和pBDUpuro804。细胞系S421.7,上文中Southern分析显示具有单拷贝的pBDUpuro421(重链由人肌动蛋白启动子表达,轻链由鼠CMV启动子表达的pBDUpuro400),用作对照。为了研究生产率和抗体链转录之间的相关性,对这些细胞系进行TaqMan RT-PCR分析,其结果总结于下表8中。S452.3细胞系中的重链和轻链RNA水平均明显低于已显示抗体表达水平高的对照细胞系D6和S421.7中观察到的结果。然而,细胞系S454.5和S804.4的RNA水平和产量与阳性对照细胞系相似。加上western印迹分析(结果未显示),这些结果说明所述细胞系中观察到的抗体重链和轻链的RNA水平与观察到的生产率具有相关性。
表8
细胞系 | 生产率 (pg/细胞/天) | 轻链 (Ct) | 重链 (Ct) |
CHO-S | 0 | 40 | 40 |
D6 | 5.5 | 20.39 | 22.86 |
S421.7 | 4.57 | 21.91 | 23.90 |
S454.5 | 3.52 | 22.12 | 23.96 |
S804.4 | 3.62 | 22.40 | 24.11 |
S452.3 | 0.07 | 29.62 | 26.47 |
Ct,循环数阈值;CHO-S,亲代细胞系;D6,克隆细胞系携带表达hAb1的轻链的载体和4-6拷贝由hCMV启动子表达重链的载体;S421.7,克隆细胞系携带单个拷贝的pBDUpuro421;S454.5,克隆细胞系携带单个拷贝的pBDUpuro454;S804.4,克隆细胞系携带单个拷贝的pBDUpuro804;S452.3,克隆细胞系携带单个拷贝的pBDUpuro452。
在本说明书特别提及和/或在申请数据页列出的美国专利,美国专利申请出版物,美国专利申请,外国专利,外国专利申请以及非专利著作均以其全文在此引作参考。
根据上文可以理解,尽管以说明为目的对本发明的特定实施方案予以描述,仍可以在不偏离本发明主旨和范围的前提下进行各种修改。因此,本发明除所附权利要求外不受其它限制。
序列表
<110>ML实验室公开有限公司
<120>高水平、大规模生产重组蛋白的组合体和方法
(COMPOSITIONS AND METHODS FOR HIGH-LEVEL,LARGE-SCALE
PRODUCTION OF RECOMBINANT PROTEINS)
<130>SCT033644-47
<140>PCT/US02/17763
<141>2002-06-04
<160>32
<210>1
<211>12701
<212>DNA
<213>载体
<220>
<221>misc_特征
<222>9602
<223>n=A,T,C或G
<400>1
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgacgatctg acggttcact aaaccagctc 300
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 360
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 420
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 480
actgccaaaa ccgcatcacc atggtaatag cgatgactaa tacgtagatg tactgccaag 540
taggaaagtc ccataaggtc atgtactggg cataatgcca ggcgggccat ttaccgtcat 600
tgacgtcaat agggggcgta cttggcatat gatacacttg atgtactgcc aagtgggcag 660
tttaccgtaa atactccacc cattgacgtc aatggaaagt ccctattggc gttactatgg 720
gaacatacgt cattattgac gtcaatgggc gggggtcgtt gggcggtcag ccaggcgggc 780
catttaccgt aagttatgta acgcggaact ccatatatgg gctatgaact aatgaccccg 840
taattgatta ctattaataa ctcgacggta tcatggtggc gaccggcatg gtgagctgcg 900
agaatagccg ggcgcgctgt gagccgaagt cgcccccgcc ctggccactt ccggcgcgcc 960
gagtccttag gccgccaggg ggcgccggcg cgcgcccaga ttggggacaa aggaagccgg 1020
gccggccgcg ttattaccat aaaaggcaaa cactggtcgg aggcgtcccc gcggcgcgcg 1080
gcaggaagcc aggccccaac cccctcccaa ccgggcgcca gccccgcctc cgcccggttc 1140
aaacagcgac cgggtcgcgc gcgcgcacgc agcggccaca ccctcgggcg ccagcggctc 1200
gggcaggaag tggcgcaagc gcccgggccc cagaacgcac gcgcgattag cgccattgag 1260
tcccagcgcg cacgcgcaat tagcgccaat tcccagcgcg cacgcagtta gcgcccaaag 1320
gaccagcgcg cacgcgcatg gcgccccagc ccccaccggg cctgacgggg gctacgccgc 1380
gcccaccgtg cgatccccat tggcaagagc ccggctcaga caaagacccc gccggttgcc 1440
cccgccccga gagcggcacc cccggagcgc gcccgcccga gcgcggcctc gcgcctgcga 1500
actggcgtgg ggtgtccccc atctccggag gcccaggggc ttctcccgcg ccccccacgg 1560
cggtccggtt ccgccccatg cgccccccgc tgcggcccag acggcggctc tgcacgggcg 1620
aagggccgcg gccgcatgcc ccggtcggct ggccgggctt acctggcggc gggtgtggac 1680
gggcggcgga tcggcaaagg cgaggctctg tgctcgcggg cggacgcggt ctcggcggtg 1740
gtggcgcgtc gcgccgctgg gttttatagg gcgccgccgc ggccgctcga gccataaaag 1800
gcaactttcg gaacggcgca cgctgattgg ccccgcgccg ctcactcacc ggcttcgccg 1860
cacagtgcag cattttttta ccccctctcc cctccttttg cgaaaaaaaa aaagagcgag 1920
agcgagattg aggaagagga ggagggagag ttttggcgtt ggccgccttg gggtgctggg 1980
cccgggggct gggggcgcgc gccgtggccc ccgcgcccca cgctgggcag tgcccggttc 2040
ggccccgcat ggccaggcct gcccccggcc tgcccgtctc tcgggccccc cacccaccgc 2100
gggacatcct aggtgtggac atctcttggg cactgagcgc ccaggtgggg tgggccaggg 2160
tctgcacggg tgccagggcc ctgggttctg tacgctcctg cagaaggagc tcttggaggg 2220
catggagtgg ccaggcagtc actccccctt gccgacttca gagcaactgc cctgaaagca 2280
gggcctgagg acctctggct gtggggctca gctagctaaa tgtgctgggt gggtcactag 2340
ggagagacct gggcttgaga ggtagagtgt ggtgttgggg gagtcaggtg gcttgcggcc 2400
attagagtcg caggaccaca ctccccagga cagggcaggg gccagcggtc cagtggctgg 2460
aggtggcccg tgatgaaggc tacaaaccta cccagccgca gccctgggaa ggaagtgggc 2520
tctacagggc agggcacctt ttaccctgga gctgcctgct tttgagggta acagtcacgc 2580
ccagccaaga ccaggcctgg ggcgttagtg ggtgacctag gcactgcggg gcgggggggc 2640
tgggtctaca cagcctgggt ctgggcccac cgtccgttgt atgtctgcta tgcgcagcca 2700
cagctgaact gccctcccag accatctgga ggccgctggg ggactctggg gaccaagact 2760
ccatgtgcca cagaggattg ggggcggggc ggtgctagga actcaaagcc agcctgggaa 2820
gaccctgtcc ttgtcaccct ttcttgcctt gggtctgtcc actgagtagc acacaagacc 2880
gggtgggcag ggtccgttct gctccgggaa tcacagactg tgtgtaccca ggtggtgggc 2940
atgcagcgat cagtggcgtg ggaccacaga gggggcccgc ggtacctaaa acagcttcac 3000
atggcttaaa ataggggacc aatgtctttt ccaatctaag tcccatttat aataaagtcc 3060
atgttccatt tttaaaggac aatcctttcg gtttaaaacc aggcacgatt acccaaacaa 3120
ctcacaacgg taaagcactg tgaatcttct ctgttctgca atcccaactt ggtttctgct 3180
cagaaaccct ccctctttcc aatcggtaat taaataacaa aaggaaaaaa cttaagatgc 3240
ttcaaccccg tttcgtgaca ctttgaaaaa agaatcacct cttgcaaaca cccgctcccg 3300
acccccgccg ctgaagcccg gcgtccagag gcctaagcgc gggtgcccgc ccccacccgg 3360
gagcgcgggc ctcgtggtca gcgcatccgc ggggagaaac aaaggccgcg gcacgggggc 3420
tcaagggcac tgcgccacac cgcacgcgcc tacccccgcg cggccacgtt aactggcggt 3480
cgccgcagcc tcgggacagc cggccgcgcg ccgccaggct cgcggacgcg ggaccacgcg 3540
ccgccctccg ggaggcccaa gtctcgaccc agccccgcgt ggcgctgggg gagggggcgc 3600
ctccgccgga acgcgggtgg gggaggggag ggggaaatgc gctttgtctc gaaatggggc 3660
aaccgtcgcc acagctccct accccctcga gggcagagca gtccccccac taactaccgg 3720
gctggccgcg cgccaggcca gccgcgaggc caccgcccga ccctccactc cttcccgcag 3780
ctcccggcgc ggggtccggc gagaagggga ggggagggga gcggagaacc gggcccccgg 3840
gacgcgtgtg gcatctgaag caccaccagc gagcgagagc tagagagaag gaaagccacc 3900
gacttcaccg cctccgagct gctccgggtc gcgggtctgc agcgtctccg gccctccgcg 3960
cctacagctc aagccacatc cgaaggggga gggagccggg agctgcgcgc ggggccgccg 4020
gggggagggg tggcaccgcc cacgccgggc ggccacgaag ggcggggcag cgggcgcgcg 4080
cgcggcgggg ggaggggccg gcgccgcgcc cgctgggaat tggggcccta gggggagggc 4140
ggaggcgccg acgaccgcgg cacttaccgt tcgcggcgtg gcgcccggtg gtccccaagg 4200
ggagggaagg gggaggcggg gcgaggacag tgaccggagt ctcctcagcg gtggcttttc 4260
tgcttggcag cctcagcggc tggcgccaaa accggactcc gcccacttcc tcgcccgccg 4320
gtgcgagggt gtggaatcct ccagacgctg ggggaggggg agttgggagc ttaaaaacta 4380
gtaccccttt gggaccactt tcagcagcga actctcctgt acaccagggg tcagttccac 4440
agacgcgggc caggggtggg tcattgcggc gtgaacaata atttgactag aagttgattc 4500
gggtgtttcc ggaaggggcc gagtcaatcc gccgagttgg ggcacggaaa acaaaaaggg 4560
aaggctacta agatttttct ggcgggggtt atcattggcg taactgcagg gaccacctcc 4620
cgggttgagg gggctggatc tccaggctgc ggattaagcc cctcccgtcg gcgttaattt 4680
caaactgcgc gacgtttctc acctgccttc gccaaggcag gggccgggac cctattccaa 4740
gaggtagtaa ctagcaggac tctagccttc cgcaattcat tgagcgcatt tacggaagta 4800
acgtcgggta ctgtctctgg ccgcaagggt gggaggagta cgcatttggc gtaaggtggg 4860
gcgtagagcc ttcccgccat tggcggcgga tagggcgttt acgcgacggc ctgacgtagc 4920
ggaagacgcg ttagtggggg ggaaggttct agaaaagcgg cggcagcggc tctagcggca 4980
gtagcagcag cgccgggtcc cgtgcggagg tgctcctcgc agagttgttt ctcgagcagc 5040
ggcagttctc actacagcgc caggacgagt ccggttcgtg ttcgtccgcg gagatctctc 5100
tcatctcgct cggctgcggg aaatcgggct gaagcgactg agtccgcgat ggaggtaacg 5160
ggtttgaaat caatgagtta ttgaaaaggg catggcgagg ccgttggcgc ctcagtggaa 5220
gtcggccagc cgcctccgtg ggagagaggc aggaaatcgg accaattcag tagcagtggg 5280
gcttaaggtt tatgaacggg gtcttgagcg gaggcctgag cgtacaaaca gcttccccac 5340
cctcagcctc ccggcgccat ttcccttcac tgggggtggg ggatggggag ctttcacatg 5400
gcggacgctg ccccgctggg gtgaaagtgg ggcgcggagg cgggaattct tattcccttt 5460
ctaaagcacg ctgcttcggg ggccacggcg tctcctcggc gagcgtttcg gcgggcagca 5520
ggtcctcgtg agcgaggctg cggagcttcc cctccccctc tctcccggga accgatttgg 5580
cggccgccat tttcatggct cgccttcctc tcagcgtttt ccttataact cttttatttt 5640
cttagtgtgc tttctctatc aagaagtaga agtggttaac tatttttttt ttcttctcgg 5700
gctgttttca tatcgtttcg aggtggattt ggagtgtttt gtgagcttgg atctttagag 5760
tcctgcgcac ctcattaaag gcgctcagcc ttcccctcga tgaaatggcg ccattgcgtt 5820
cggaagccac accgaagagc ggggaggggg ggtgctccgg gtttgcgggc ccggtttcag 5880
agaagatatc accacccagg gcgtcgggcc gggttcaatg cgagccgtag gacaaagaaa 5940
ccattttatg tttttcctgt cttttttttc ctttgagtaa cggttttatc tgggtctgca 6000
gtcagtaaaa cgacagatga accgcggcaa aataaacata aattggaagc catcggccac 6060
gaggggcagg gacgaaggtg gttttctggg cgggggaggg atattcgcgt cagaatcctt 6120
tactgttctt aaggattccg tttaagttgt agagctgact cattttaagt aatgttgtta 6180
ctgagaagtttaacccttac gggacagatc catggacctt tatagatgat tacgaggaaa 6240
gtgaaataac gattttgtcc ttagttatac ttcgattaaa acatggcttc agaggctcct 6300
tcctgtaatg cgtatggatt gatgtgcaaa actgttttgg gcctgggccg ctctgtattt 6360
gaactttgtt acttttctca ttttgtttgc aatcttggtt gaacattaca ttgataagca 6420
taaggtctca agcgaagggg gtctacctgg ttatttttct ttgaccctaa gcacgtttat 6480
aaaataacat tgtttaaaat cgatagtgga catcgggtaa gtttggataa attgtgaggt 6540
aagtaatgag tttttgcttt ttgttagtga tttgtaaaac ttgttataaa tgtacattat 6600
ccgtaatttc agtttagaga taacctatgt gctgacgaca attaagaata aaaactagct 6660
gaaaaaatga aaataactat cgtgacaagt aaccatttca aaagactgct ttgtgtctca 6720
taggagctag tttgatcatt tcagttaatt ttttctttaa tttttacgag tcatgaaaac 6780
tacaggaaaa aaaatctgaa ctgggtttta ccactacttt ttaggagttg ggagcatgcg 6840
aatggaggga gagctccgta gaactgggat gagagcagca attaatgctg cttgctagga 6900
acaaaaaata attgattgaa aattacgtgt gactttttag tttgcattat gcgtttgtag 6960
cagttggtcc tggatatcac tttctctcgt ttgaggtttt ttaacctagt taacttttaa 7020
gacaggtttc cttaacattc ataagtgccc agaatacagc tgtgtagtac agcatataaa 7080
gatttcagct ctgaggtttt tcctattgac ttggaaaatt gttttgtgcc tgtcgcttgc 7140
cacatggcca atcaagtaag cttcgaattc gagctcgccc aactccgccc gttttatgac 7200
tagaaccaat agtttttaat gccaaatgca ctgaaatccc ctaatttgca aagccaaacg 7260
ccccctatgt gagtaatacg gggacttttt acccaatttc ccaagcggaa agccccctaa 7320
tacactcata tggcatatga atcagcacgg tcatgcactc taatggcggc ccatagggac 7380
tttccacata gggggcgttc accatttccc agcatagggg tggtgactca atggccttta 7440
cccaagtaca ttgggtcaat gggaggtaag ccaatgggtt tttcccatta ctggcaagca 7500
cactgagtca aatgggactt tccactgggt tttgcccaag tacattgggt caatgggagg 7560
tgagccaatg ggaaaaaccc attgctgcca agtacactga ctcaataggg actttccaat 7620
gggtttttcc attgttggca agcatataag gtcaatgtgg gtgagtcaat agggactttc 7680
cattgtattc tgcccagtac ataaggtcaa tagggggtga atcaacagga aagtcccatt 7740
ggagccaagt acactgcgtc aatagggact ttccattggg ttttgcccag tacataaggt 7800
caatagggga tgagtcaatg ggaaaaaccc attggagcca agtacactga ctcaataggg 7860
actttccatt gggttttgcc cagtacataa ggtcaatagg gggtgagtca acaggaaagt 7920
cccattggag ccaagtacat tgagtcaata gggactttcc aatgggtttt gcccagtaca 7980
taaggtcaat gggaggtaag ccaatgggtt tttcccatta ctggcacgta tactgagtca 8040
ttagggactt tccaatgggt tttgcccagt acataaggtc aataggggtg aatcaacagg 8100
aaagtcccat tggagccaag tacactgagt caatagggac tttccattgg gttttgccca 8160
gtacaaaagg tcaatagggg gtgagtcaat gggtttttcc cattattggc acgtacataa 8220
ggtcaatagg ggtgagtcat tgggtttttc cagccaattt aattaaaacg ccatgtactt 8280
tcccaccatt gacgtcaatg ggctattgaa actaatgcaa cgtgaccttt aaacggtact 8340
ttcccatagc tgattaatgg gaaagtaccg ttctcgagcc aatacacgtc aatgggaagt 8400
gaaagggcag ccaaaacgta acaccgcccc ggttttcccc tggaaattcc atattggcac 8460
gcattctatt ggctgagctg cgttctacgt gggtataaga ggcgcgacca gcgtcggtac 8520
cgtcgcagtc ttcggtctga ccaccgtaga acgcagagct cctcgctgca gcccgggtct 8580
agaggatccg cctgagaaag gaagtgagct gtaaaggctg agctctctct ctgacgtatg 8640
tagcctctgg ttagcttcgt cactcactgt tcttgactca gcatggcaat ctgatgaaat 8700
cccagctgta agtctgcaga aattgatgat ctattaaaca ataaagatgt ccactaaaat 8760
ggaagttttt cctgtcatac tttgttaaga agggtgagaa cagagtacct acattttgaa 8820
tggaaggatt ggagctacgg gggtgggggt ggggtgggat tagataaatg cctgctcttt 8880
actgaaggct ctttactatt gctttatgat aatgtttcat agttggatat cataatttaa 8940
acaagcaaaa ccaaattaag ggccagctca ttcctccaga tccactagta attctgtgga 9000
atgtgtgtca gttagggtgt ggaaagtccc caggctcccc agcaggcaga agtatgcaaa 9060
gcatgcatct caattagtca gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca 9120
gaagtatgca aagcatgcat ctcaattagt cagcaaccat agtcccgccc ctaactccgc 9180
ccatcccgcc cctaactccg cccagttccg cccattctcc gccccatggc tgactaattt 9240
tttttattta tgcagaggcc gaggccgcct ctgcctctga gctattccag aagtagtgag 9300
gaggcttttt tggaggccta ggcttttgca aaaagctccc gggagcttgt atatccattt 9360
tcggatctga tcaagagaca ggatgaggat cgtttcgcat gattgaacaa gatggattgc 9420
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 9480
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 9540
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 9600
cstggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 9660
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 9720
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 9780
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 9840
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 9900
ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 9960
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 10020
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 10080
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 10140
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagcgggac 10200
tctggggttc gaaatgaccg accaagcgac gcccaacctg ccatcacgag atttcgattc 10260
caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat 10320
gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact tgtttattgc 10380
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 10440
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgtat 10500
accgtcgaga ctagttctag agcggccgcc accgcggtgg agctccagct tttgttccct 10560
ttagtgaggg ttaatttcga gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa 10620
ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 10680
gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca 10740
gtcgggaaac ctgtcgtgcc agggggtacc taggccgggc aacaattggc ggccggccgc 10800
acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 10860
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 10920
agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 10980
cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 11040
gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga gagttttcgc 11100
cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta 11160
tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac 11220
ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa 11280
ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 11340
atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 11400
cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 11460
atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta 11520
gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 11580
cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 11640
tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 11700
tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 11760
gcctcactga ttaagcattg gtaactgtca gaccctaggc cgggcaacaa ttggcggccg 11820
gccctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct 11880
tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 11940
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 12000
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 12060
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 12120
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 12180
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 12240
gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 12300
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 12360
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 12420
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 12480
aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc 12540
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 12600
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 12660
atcttttcta cggggtctga cgctcagtgg aacgaaaact c 12701
<210>2
<211>12109
<212>DNA
<213>载体
<220>
<221>misc_特征
<222>9010
<223>n=A,T,C或G
<400>2
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgacggtatc aaggtggcga ccggaatggt 300
gagctgcgag aatagccggg cgcgctgtga gccgaagtcg cccccgccct ggccacttcc 360
ggcgcgccga gtccttaggc cgccaggggg cgccggcgcg cgcccagatt ggggacaaag 420
gaagccgggc cggccgcgtt attaccataa aaggcaaaca ctggtcggag gcgtccccgc 480
ggcgcgcggc aggaagccag gccccaaccc cctcccaacc gggcgccagc cccgcctccg 540
cccggttcaa acagcgaccg ggtcgcgcgc gcgcacgcag cggccacacc ctcgggcgcc 600
agcggctcgg gcaggaagtg gcgcaagcgc ccgggcccca gaacgcacgc gcgattagcg 660
ccattgagtc ccagcgcgca cgcgcaatta gcgccaattc ccagcgcgca cgcagttagc 720
gcccaaagga ccagcgcgca cgcgcatggc gccccagccc ccaccgggcc tgacgggggc 780
tacgccgcgc ccaccgtgcg atccccattg gcaagagccc ggctcagaca aagaccccgc 840
cggttgcccc cgccccgaga gcggcacccc cggagcgcgc ccgcccgagc gcggcctcgc 900
gcctgcgaac tggcgtgggg tgtcccccat ctccggaggc ccaggggctt ctcccgcgcc 960
ccccacggcg gtccggttcc gccccatgcg ccccccgctg cggcccagac ggcggctctg 1020
cacgggcgaa gggccgcggc cgcatgcccc ggtcggctgg ccgggcttac ctggcggcgg 1080
gtgtggacgg gcggcggatc ggcaaaggcg aggctctgtg ctcgcgggcg gacgcggtct 1140
cggcggtggt ggcgcgtcgc gccgctgggt tttatagggc gccgccgcgg ccgctcgagc 1200
cataaaaggc aactttcgga acggcgcacg ctgattggcc ccgcgccgct cactcaccgg 1260
cttcgccgca cagtgcagca tttttttacc ccctctcccc tccttttgcg aaaaaaaaaa 1320
agagcgagag cgagattgag gaagaggagg agggagagtt ttggcgttgg ccgccttggg 1380
gtgctgggcc cgggggctgg gggcgcgcgc cgtggccccc gcgccccacg ctgggcagtg 1440
cccggttcgg ccccgcatgg ccaggcctgc ccccggcctg cccgtctctc gggcccccca 1500
cccaccgcgg gacatcctag gtgtggacat ctcttgggca ctgagcgccc aggtggggtg 1560
ggccagggtc tgcacgggtg ccagggccct gggttctgta cgctcctgca gaaggagctc 1620
ttggagggca tggagtggcc aggcagtcac tcccccttgc cgacttcaga gcaactgccc 1680
tgaaagcagg gcctgaggac ctctggctgt ggggctcagc tagctaaatg tgctgggtgg 1740
gtcactaggg agagacctgg gcttgagagg tagagtgtgg tgttggggga gtcaggtggc 1800
ttgcggccat tagagtcgca ggaccacact ccccaggaca gggcaggggc cagcggtcca 1860
gtggctggag gtggcccgtg atgaaggcta caaacctacc cagccgcagc cctgggaagg 1920
aagtgggctc tacagggcag ggcacctttt accctggagc tgcctgcttt tgagggtaac 1980
agtcacgccc agccaagacc aggcctgggg cgttagtggg tgacctaggc actgcggggc 2040
gggggggctg ggtctacaca gcctgggtct gggcccaccg tccgttgtat gtctgctatg 2100
cgcagccaca gctgaactgc cctcccagac catctggagg ccgctggggg actctgggga 2160
ccaagactcc atgtgccaca gaggattggg ggcggggcgg tgctaggaac tcaaagccag 2220
cctgggaaga ccctgtcctt gtcacccttt cttgccttgg gtctgtccac tgagtagcac 2280
acaagaccgg gtgggcaggg tccgttctgc tccgggaatc acagactgtg tgtacccagg 2340
tggtgggcat gcagcgatca gtggcgtggg accacagagg gggcccgcgg tacctaaaac 2400
agcttcacat ggcttaaaat aggggaccaa tgtcttttcc aatctaagtc ccatttataa 2460
taaagtccat gttccatttt taaaggacaa tcctttcggt ttaaaaccag gcacgattac 2520
ccaaacaact cacaacggta aagcactgtg aatcttctct gttctgcaat cccaacttgg 2580
tttctgctca gaaaccctcc ctctttccaa tcggtaatta aataacaaaa ggaaaaaact 2640
taagatgctt caaccccgtt tcgtgacact ttgaaaaaag aatcacctct tgcaaacacc 2700
cgctcccgac ccccgccgct gaagcccggc gtccagaggc ctaagcgcgg gtgcccgccc 2760
ccacccggga gcgcgggcct cgtggtcagc gcatccgcgg ggagaaacaa aggccgcggc 2820
acgggggctc aagggcactg cgccacaccg cacgcgccta cccccgcgcg gccacgttaa 2880
ctggcggtcg ccgcagcctc gggacagccg gccgcgcgcc gccaggctcg cggacgcggg 2940
accacgcgcc gccctccggg aggcccaagt ctcgacccag ccccgcgtgg cgctggggga 3000
gggggcgcct ccgccggaac gcgggtgggg gaggggaggg ggaaatgcgc tttgtctcga 3060
aatggggcaa ccgtcgccac agctccctac cccctcgagg gcagagcagt ccccccacta 3120
actaccgggc tggccgcgcg ccaggccagc cgcgaggcca ccgcccgacc ctccactcct 3180
tcccgcagct cccggcgcgg ggtccggcga gaaggggagg ggaggggagc ggagaaccgg 3240
gcccccggga cgcgtgtggc atctgaagca ccaccagcga gcgagagcta gagagaagga 3300
aagccaccga cttcaccgcc tccgagctgc tccgggtcgc gggtctgcag cgtctccggc 3360
cctccgcgcc tacagctcaa gccacatccg aagggggagg gagccgggag ctgcgcgcgg 3420
ggccgccggg gggaggggtg gcaccgccca cgccgggcgg ccacgaaggg cggggcagcg 3480
ggcgcgcgcg cggcgggggg aggggccggc gccgcgcccg ctgggaattg gggccctagg 3540
gggagggcgg aggcgccgac gaccgcggca cttaccgttc gcggcgtggc gcccggtggt 3600
ccccaagggg agggaagggg gaggcggggc gaggacagtg accggagtct cctcagcggt 3660
ggcttttctg cttggcagcc tcagcggctg gcgccaaaac cggactccgc ccacttcctc 3720
gcccgccggt gcgagggtgt ggaatcctcc agacgctggg ggagggggag ttgggagctt 3780
aaaaactagt acccctttgg gaccactttc agcagcgaac tctcctgtac accaggggtc 3840
agttccacag acgcgggcca ggggtgggtc attgcggcgt gaacaataat ttgactagaa 3900
gttgattcgg gtgtttccgg aaggggccga gtcaatccgc cgagttgggg cacggaaaac 3960
aaaaagggaa ggctactaag atttttctgg cgggggttat cattggcgta actgcaggga 4020
ccacctcccg ggttgagggg gctggatctc caggctgcgg attaagcccc tcccgtcggc 4080
gttaatttca aactgcgcga cgtttctcac ctgccttcgc caaggcaggg gccgggaccc 4140
tattccaaga ggtagtaact agcaggactc tagccttccg caattcattg agcgcattta 4200
cggaagtaac gtcgggtact gtctctggcc gcaagggtgg gaggagtacg catttggcgt 4260
aaggtggggc gtagagcctt cccgccattg gcggcggata gggcgtttac gcgacggcct 4320
gacgtagcgg aagacgcgtt agtggggggg aaggttctag aaaagcggcg gcagcggctc 4380
tagcggcagt agcagcagcg ccgggtcccg tgcggaggtg ctcctcgcag agttgtttct 4440
cgagcagcgg cagttctcac tacagcgcca ggacgagtcc ggttcgtgtt cgtccgcgga 4500
gatctctctc atctcgctcg gctgcgggaa atcgggctga agcgactgag tccgcgatgg 4560
aggtaacggg tttgaaatca atgagttatt gaaaagggca tggcgaggcc gttggcgcct 4620
cagtggaagt cggccagccg cctccgtggg agagaggcag gaaatcggac caattcagta 4680
gcagtggggc ttaaggttta tgaacggggt cttgagcgga ggcctgagcg tacaaacagc 4740
ttccccaccc tcagcctccc ggcgccattt cccttcactg ggggtggggg atggggagct 4800
ttcacatggc ggacgctgcc ccgctggggt gaaagtgggg cgcggaggcg ggaattctta 4860
ttccctttct aaagcacgct gcttcggggg ccacggcgtc tcctcggcga gcgtttcggc 4920
gggcagcagg tcctcgtgag cgaggctgcg gagcttcccc tccccctctc tcccgggaac 4980
cgatttggcg gccgccattt tcatggctcg ccttcctctc agcgttttcc ttataactct 5040
tttattttct tagtgtgctt tctctatcaa gaagtagaag tggttaacta tttttttttt 5100
cttctcgggc tgttttcata tcgtttcgag gtggatttgg agtgttttgt gagcttggat 5160
ctttagagtc ctgcgcacct cattaaaggc gctcagcctt cccctcgatg aaatggcgcc 5220
attgcgttcg gaagccacac cgaagagcgg ggaggggggg tgctccgggt ttgcgggccc 5280
ggtttcagag aagatatcac cacccagggc gtcgggccgg gttcaatgcg agccgtagga 5340
caaagaaacc attttatgtt tttcctgtct tttttttcct ttgagtaacg gttttatctg 5400
ggtctgcagt cagtaaaacg acagatgaac cgcggcaaaa taaacataaa ttggaagcca 5460
tcggccacga ggggcaggga cgaaggtggt tttctgggcg ggggagggat attcgcgtca 5520
gaatccttta ctgttcttaa ggattccgtt taagttgtag agctgactca ttttaagtaa 5580
tgttgttact gagaagttta acccttacgg gacagatcca tggaccttta tagatgatta 5640
cgaggaaagt gaaataacga ttttgtcctt agttatactt cgattaaaac atggcttcag 5700
aggctccttc ctgtaatgcg tatggattga tgtgcaaaac tgttttgggc ctgggccgct 5760
ctgtatttga actttgttac ttttctcatt ttgtttgcaa tcttggttga acattacatt 5820
gataagcata aggtctcaag cgaagggggt ctacctggtt atttttcttt gaccctaagc 5880
acgtttataa aataacattg tttaaaatcg atagtggaca tcgggtaagt ttggataaat 5940
tgtgaggtaa gtaatgagtt tttgcttttt gttagtgatt tgtaaaactt gttataaatg 6000
tacattatcc gtaatttcag tttagagata acctatgtgc tgacgacaat taagaataaa 6060
aactagctga aaaaatgaaa ataactatcg tgacaagtaa ccatttcaaa agactgcttt 6120
gtgtctcata ggagctagtt tgatcatttc agttaatttt ttctttaatt tttacgagtc 6180
atgaaaacta caggaaaaaa aatctgaact gggttttacc actacttttt aggagttggg 6240
agcatgcgaa tggagggaga gctccgtaga actgggatga gagcagcaat taatgctgct 6300
tgctaggaac aaaaaataat tgattgaaaa ttacgtgtga ctttttagtt tgcattatgc 6360
gtttgtagca gttggtcctg gatatcactt tctctcgttt gaggtttttt aacctagtta 6420
acttttaaga caggtttcct taacattcat aagtgcccag aatacagctg tgtagtacag 6480
catataaaga tttcagctct gaggtttttc ctattgactt ggaaaattgt tttgtgcctg 6540
tcgcttgcca catggccaat caagtaagct tcgaattcga gctcgcccaa ctccgcccgt 6600
tttatgacta gaaccaatag tttttaatgc caaatgcact gaaatcccct aatttgcaaa 6660
gccaaacgcc ccctatgtga gtaatacggg gactttttac ccaatttccc aagcggaaag 6720
ccccctaata cactcatatg gcatatgaat cagcacggtc atgcactcta atggcggccc 6780
atagggactt tccacatagg gggcgttcac catttcccag cataggggtg gtgactcaat 6840
ggcctttacc caagtacatt gggtcaatgg gaggtaagcc aatgggtttt tcccattact 6900
ggcaagcaca ctgagtcaaa tgggactttc cactgggttt tgcccaagta cattgggtca 6960
atgggaggtg agccaatggg aaaaacccat tgctgccaag tacactgact caatagggac 7020
tttccaatgg gtttttccat tgttggcaag catataaggt caatgtgggt gagtcaatag 7080
ggactttcca ttgtattctg cccagtacat aaggtcaata gggggtgaat caacaggaaa 7140
gtcccattgg agccaagtac actgcgtcaa tagggacttt ccattgggtt ttgcccagta 7200
cataaggtca ataggggatg agtcaatggg aaaaacccat tggagccaag tacactgact 7260
caatagggac tttccattgg gttttgccca gtacataagg tcaatagggg gtgagtcaac 7320
aggaaagtcc cattggagcc aagtacattg agtcaatagg gactttccaa tgggttttgc 7380
ccagtacata aggtcaatgg gaggtaagcc aatgggtttt tcccattact ggcacgtata 7440
ctgagtcatt agggactttc caatgggttt tgcccagtac ataaggtcaa taggggtgaa 7500
tcaacaggaa agtcccattg gagccaagta cactgagtca atagggactt tccattgggt 7560
tttgcccagt acaaaaggtc aatagggggt gagtcaatgg gtttttccca ttattggcac 7620
gtacataagg tcaatagggg tgagtcattg ggtttttcca gccaatttaa ttaaaacgcc 7680
atgtactttc ccaccattga cgtcaatggg ctattgaaac taatgcaacg tgacctttaa 7740
acggtacttt cccatagctg attaatggga aagtaccgtt ctcgagccaa tacacgtcaa 7800
tgggaagtga aagggcagcc aaaacgtaac accgccccgg ttttcccctg gaaattccat 7860
attggcacgc attctattgg ctgagctgcg ttctacgtgg gtataagagg cgcgaccagc 7920
gtcggtaccg tcgcagtctt cggtctgacc accgtagaac gcagagctcc tcgctgcagc 7980
ccgggtctag aggatccgcc tgagaaagga agtgagctgt aaaggctgag ctctctctct 8040
gacgtatgta gcctctggtt agcttcgtca ctcactgttc ttgactcagc atggcaatct 8100
gatgaaatcc cagctgtaag tctgcagaaa ttgatgatct attaaacaat aaagatgtcc 8160
actaaaatgg aagtttttcc tgtcatactt tgttaagaag ggtgagaaca gagtacctac 8220
attttgaatg gaaggattgg agctacgggg gtgggggtgg ggtgggatta gataaatgcc 8280
tgctctttac tgaaggctct ttactattgc tttatgataa tgtttcatag ttggatatca 8340
taatttaaac aagcaaaacc aaattaaggg ccagctcatt cctccagatc cactagtaat 8400
tctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag 8460
tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc 8520
agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct 8580
aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg 8640
actaattttt tttatttatg cagaggccga ggccgcctct gcctctgagc tattccagaa 8700
gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcccgg gagcttgtat 8760
atccattttc ggatctgatc aagagacagg atgaggatcg tttcgcatga ttgaacaaga 8820
tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct atgactgggc 8880
acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc 8940
ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcagg acgaggcagc 9000
gcggctatcs tggctggcca cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac 9060
tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc tcctgtcatc 9120
tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc ggctgcatac 9180
gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg agcgagcacg 9240
tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc atcaggggct 9300
cgcgccagcc gaactgttcg ccaggctcaa ggcgcgcatg cccgacggcg aggatctcgt 9360
cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg 9420
attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag cgttggctac 9480
ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg tgctttacgg 9540
tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg agttcttctg 9600
agcgggactc tggggttcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat 9660
ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc 9720
ggctggatga tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg 9780
tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa 9840
gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat 9900
gtctgtatac cgtcgagact agttctagag cggccgccac cgcggtggag ctccagcttt 9960
tgttcccttt agtgagggtt aatttcgagc ttggcgtaat catggtcata gctgtttcct 10020
gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag cataaagtgt 10080
aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc 10140
gctttccagt cgggaaacct gtcgtgccag ggggtaccta ggccgggcaa caattggcgg 10200
ccggccgcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 10260
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 10320
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 10380
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 10440
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 10500
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 10560
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 10620
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 10680
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 10740
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 10800
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 10860
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 10920
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 10980
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 11040
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 11100
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 11160
agataggtgc ctcactgatt aagcattggt aactgtcaga ccctaggccg ggcaacaatt 11220
ggcggccggc cctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 11280
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 11340
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 11400
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 11460
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 11520
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 11580
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 11640
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 11700
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 11760
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 11820
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 11880
ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 11940
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 12000
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 12060
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactc 12109
<210>3
<211>12680
<212>DNA
<213>载体
<220>
<221>misc_特征
<222>10382
<223>n=A,T,C或G
<400>3
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgacgatctg acggttcact aaaccagctc 300
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 360
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 420
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 480
actgccaaaa ccgcatcacc atggtaatag cgatgactaa tacgtagatg tactgccaag 540
taggaaagtc ccataaggtc atgtactggg cataatgcca ggcgggccat ttaccgtcat 600
tgacgtcaat agggggcgta cttggcatat gatacacttg atgtactgcc aagtgggcag 660
tttaccgtaa atactccacc cattgacgtc aatggaaagt ccctattggc gttactatgg 720
gaacatacgt cattattgac gtcaatgggc gggggtcgtt gggcggtcag ccaggcgggc 780
catttaccgt aagttatgta acgcggaact ccatatatgg gctatgaact aatgaccccg 840
taattgatta ctattaataa ctcgacggta tcatggtggc gaccggcatg gtgagctgcg 900
agaatagccg ggcgcgctgt gagccgaagt cgcccccgcc ctggccactt ccggcgcgcc 960
gagtccttag gccgccaggg ggcgccggcg cgcgcccaga ttggggacaa aggaagccgg 1020
gccggccgcg ttattaccat aaaaggcaaa cactggtcgg aggcgtcccc gcggcgcgcg 1080
gcaggaagcc aggccccaac cccctcccaa ccgggcgcca gccccgcctc cgcccggttc 1140
aaacagcgac cgggtcgcgc gcgcgcacgc agcggccaca ccctcgggcg ccagcggctc 1200
gggcaggaag tggcgcaagc gcccgggccc cagaacgcac gcgcgattag cgccattgag 1260
tcccagcgcg cacgcgcaat tagcgccaat tcccagcgcg cacgcagtta gcgcccaaag 1320
gaccagcgcg cacgcgcatg gcgccccagc ccccaccggg cctgacgggg gctacgccgc 1380
gcccaccgtg cgatccccat tggcaagagc ccggctcaga caaagacccc gccggttgcc 1440
cccgccccga gagcggcacc cccggagcgc gcccgcccga gcgcggcctc gcgcctgcga 1500
actggcgtgg ggtgtccccc atctccggag gcccaggggc ttctcccgcg ccccccacgg 1560
cggtccggtt ccgccccatg cgccccccgc tgcggcccag acggcggctc tgcacgggcg 1620
aagggccgcg gccgcatgcc ccggtcggct ggccgggctt acctggcggc gggtgtggac 1680
gggcggcgga tcggcaaagg cgaggctctg tgctcgcggg cggacgcggt ctcggcggtg 1740
gtggcgcgtc gcgccgctgg gttttatagg gcgccgccgc ggccgctcga gccataaaag 1800
gcaactttcg gaacggcgca cgctgattgg ccccgcgccg ctcactcacc ggcttcgccg 1860
cacagtgcag cattttttta ccccctctcc cctccttttg cgaaaaaaaa aaagagcgag 1920
agcgagattg aggaagagga ggagggagag ttttggcgtt ggccgccttg gggtgctggg 1980
cccgggggct gggggcgcgc gccgtggccc ccgcgcccca cgctgggcag tgcccggttc 2040
ggccccgcat ggccaggcct gcccccggcc tgcccgtctc tcgggccccc cacccaccgc 2100
gggacatcct aggtgtggac atctcttggg cactgagcgc ccaggtgggg tgggccaggg 2160
tctgcacggg tgccagggcc ctgggttctg tacgctcctg cagaaggagc tcttggaggg 2220
catggagtgg ccaggcagtc actccccctt gccgacttca gagcaactgc cctgaaagca 2280
gggcctgagg acctctggct gtggggctca gctagctaaa tgtgctgggt gggtcactag 2340
ggagagacct gggcttgaga ggtagagtgt ggtgttgggg gagtcaggtg gcttgcggcc 2400
attagagtcg caggaccaca ctccccagga cagggcaggg gccagcggtc cagtggctgg 2460
aggtggcccg tgatgaaggc tacaaaccta cccagccgca gccctgggaa ggaagtgggc 2520
tctacagggc agggcacctt ttaccctgga gctgcctgct tttgagggta acagtcacgc 2580
ccagccaaga ccaggcctgg ggcgttagtg ggtgacctag gcactgcggg gcgggggggc 2640
tgggtctaca cagcctgggt ctgggcccac cgtccgttgt atgtctgcta tgcgcagcca 2700
cagctgaact gccctcccag accatctgga ggccgctggg ggactctggg gaccaagact 2760
ccatgtgcca cagaggattg ggggcggggc ggtgctagga actcaaagcc agcctgggaa 2820
gaccctgtcc ttgtcaccct ttcttgcctt gggtctgtcc actgagtagc acacaagacc 2880
gggtgggcag ggtccgttct gctccgggaa tcacagactg tgtgtaccca ggtggtgggc 2940
atgcagcgat cagtggcgtg ggaccacaga gggggcccgc ggtacctaaa acagcttcac 3000
atggcttaaa ataggggacc aatgtctttt ccaatctaag tcccatttat aataaagtcc 3060
atgttccatt tttaaaggac aatcctttcg gtttaaaacc aggcacgatt acccaaacaa 3120
ctcacaacgg taaagcactg tgaatcttct ctgttctgca atcccaactt ggtttctgct 3180
cagaaaccct ccctctttcc aatcggtaat taaataacaa aaggaaaaaa cttaagatgc 3240
ttcaaccccg tttcgtgaca ctttgaaaaa agaatcacct cttgcaaaca cccgctcccg 3300
acccccgccg ctgaagcccg gcgtccagag gcctaagcgc gggtgcccgc ccccacccgg 3360
gagcgcgggc ctcgtggtca gcgcatccgc ggggagaaac aaaggccgcg gcacgggggc 3420
tcaagggcac tgcgccacac cgcacgcgcc tacccccgcg cggccacgtt aactggcggt 3480
cgccgcagcc tcgggacagc cggccgcgcg ccgccaggct cgcggacgcg ggaccacgcg 3540
ccgccctccg ggaggcccaa gtctcgaccc agccccgcgt ggcgctgggg gagggggcgc 3600
ctccgccgga acgcgggtgg gggaggggag ggggaaatgc gctttgtctc gaaatggggc 3660
aaccgtcgcc acagctccct accccctcga gggcagagca gtccccccac taactaccgg 3720
gctggccgcg cgccaggcca gccgcgaggc caccgcccga ccctccactc cttcccgcag 3780
ctcccggcgc ggggtccggc gagaagggga ggggagggga gcggagaacc gggcccccgg 3840
gacgcgtgtg gcatctgaag caccaccagc gagcgagagc tagagagaag gaaagccacc 3900
gacttcaccg cctccgagct gctccgggtc gcgggtctgc agcgtctccg gccctccgcg 3960
cctacagctc aagccacatc cgaaggggga gggagccggg agctgcgcgc ggggccgccg 4020
gggggagggg tggcaccgcc cacgccgggc ggccacgaag ggcggggcag cgggcgcgcg 4080
cgcggcgggg ggaggggccg gcgccgcgcc cgctgggaat tggggcccta gggggagggc 4140
ggaggcgccg acgaccgcgg cacttaccgt tcgcggcgtg gcgcccggtg gtccccaagg 4200
ggagggaagg gggaggcggg gcgaggacag tgaccggagt ctcctcagcg gtggcttttc 4260
tgcttggcag cctcagcggc tggcgccaaa accggactcc gcccacttcc tcgcccgccg 4320
gtgcgagggt gtggaatcct ccagacgctg ggggaggggg agttgggagc ttaaaaacta 4380
gtaccccttt gggaccactt tcagcagcga actctcctgt acaccagggg tcagttccac 4440
agacgcgggc caggggtggg tcattgcggc gtgaacaata atttgactag aagttgattc 4500
gggtgtttcc ggaaggggcc gagtcaatcc gccgagttgg ggcacggaaa acaaaaaggg 4560
aaggctacta agatttttct ggcgggggtt atcattggcg taactgcagg gaccacctcc 4620
cgggttgagg gggctggatc tccaggctgc ggattaagcc cctcccgtcg gcgttaattt 4680
caaactgcgc gacgtttctc acctgccttc gccaaggcag gggccgggac cctattccaa 4740
gaggtagtaa ctagcaggac tctagccttc cgcaattcat tgagcgcatt tacggaagta 4800
acgtcgggta ctgtctctgg ccgcaagggt gggaggagta cgcatttggc gtaaggtggg 4860
gcgtagagcc ttcccgccat tggcggcgga tagggcgttt acgcgacggc ctgacgtagc 4920
ggaagacgcg ttagtggggg ggaaggttct agaaaagcgg cggcagcggc tctagcggca 4980
gtagcagcag cgccgggtcc cgtgcggagg tgctcctcgc agagttgttt ctcgagcagc 5040
ggcagttctc actacagcgc caggacgagt ccggttcgtg ttcgtccgcg gagatctctc 5100
tcatctcgct cggctgcggg aaatcgggct gaagcgactg agtccgcgat ggaggtaacg 5160
ggtttgaaat caatgagtta ttgaaaaggg catggcgagg ccgttggcgc ctcagtggaa 5220
gtcggccagc cgcctccgtg ggagagaggc aggaaatcgg accaattcag tagcagtggg 5280
gcttaaggtt tatgaacggg gtcttgagcg gaggcctgag cgtacaaaca gcttccccac 5340
cctcagcctc ccggcgccat ttcccttcac tgggggtggg ggatggggag ctttcacatg 5400
gcggacgctg ccccgctggg gtgaaagtgg ggcgcggagg cgggaattct tattcccttt 5460
ctaaagcacg ctgcttcggg ggccacggcg tctcctcggc gagcgtttcg gcgggcagca 5520
ggtcctcgtg agcgaggctg cggagcttcc cctccccctc tctcccggga accgatttgg 5580
cggccgccat tttcatggct cgccttcctc tcagcgtttt ccttataact cttttatttt 5640
cttagtgtgc tttctctatc aagaagtaga agtggttaac tatttttttt ttcttctcgg 5700
gctgttttca tatcgtttcg aggtggattt ggagtgtttt gtgagcttgg atctttagag 5760
tcctgcgcac ctcattaaag gcgctcagcc ttcccctcga tgaaatggcg ccattgcgtt 5820
cggaagccac accgaagagc ggggaggggg ggtgctccgg gtttgcgggc ccggtttcag 5880
agaagatatc accacccagg gcgtcgggcc gggttcaatg cgagccgtag gacaaagaaa 5940
ccattttatg tttttcctgt cttttttttc ctttgagtaa cggttttatc tgggtctgca 6000
gtcagtaaaa cgacagatga accgcggcaa aataaacata aattggaagc catcggccac 6060
gaggggcagg gacgaaggtg gttttctggg cgggggaggg atattcgcgt cagaatcctt 6120
tactgttctt aaggattccg tttaagttgt agagctgact cattttaagt aatgttgtta 6180
ctgagaagtt taacccttac gggacagatc catggacctt tatagatgat tacgaggaaa 6240
gtgaaataac gattttgtcc ttagttatac ttcgattaaa acatggcttc agaggctcct 6300
tcctgtaatg cgtatggatt gatgtgcaaa actgttttgg gcctgggccg ctctgtattt 6360
gaactttgtt acttttctca ttttgtttgc aatcttggtt gaacattaca ttgataagca 6420
taaggtctca agcgaagggg gtctacctgg ttatttttct ttgaccctaa gcacgtttat 6480
aaaataacat tgtttaaaat cgatagtgga catcgggtaa gtttggataa attgtgaggt 6540
aagtaatgag tttttgcttt ttgttagtga tttgtaaaac ttgttataaa tgtacattat 6600
ccgtaatttc agtttagaga taacctatgt gctgacgaca attaagaata aaaactagct 6660
gaaaaaatga aaataactat cgtgacaagt aaccatttca aaagactgct ttgtgtctca 6720
taggagctag tttgatcatt tcagttaatt ttttctttaa tttttacgag tcatgaaaac 6780
tacaggaaaa aaaatctgaa ctgggtttta ccactacttt ttaggagttg ggagcatgcg 6840
aatggaggga gagctccgta gaactgggat gagagcagca attaatgctg cttgctagga 6900
acaaaaaata attgattgaa aattacgtgt gactttttag tttgcattat gcgtttgtag 6960
cagttggtcc tggatatcac tttctctcgt ttgaggtttt ttaacctagt taacttttaa 7020
gacaggtttc cttaacattc ataagtgccc agaatacagc tgtgtagtac agcatataaa 7080
gatttcagct ctgaggtttt tcctattgac ttggaaaatt gttttgtgcc tgtcgcttgc 7140
cacatggcca atcaagtaag cttcgaattc gagctcgccc aactccgccc gttttatgac 7200
tagaaccaat agtttttaat gccaaatgca ctgaaatccc ctaatttgca aagccaaacg 7260
ccccctatgt gagtaatacg gggacttttt acccaatttc ccaagcggaa agccccctaa 7320
tacactcata tggcatatga atcagcacgg tcatgcactc taatggcggc ccatagggac 7380
tttccacata gggggcgttc accatttccc agcatagggg tggtgactca atggccttta 7440
cccaagtaca ttgggtcaat gggaggtaag ccaatgggtt tttcccatta ctggcaagca 7500
cactgagtca aatgggactt tccactgggt tttgcccaag tacattgggt caatgggagg 7560
tgagccaatg ggaaaaaccc attgctgcca agtacactga ctcaataggg actttccaat 7620
gggtttttcc attgttggca agcatataag gtcaatgtgg gtgagtcaat agggactttc 7680
cattgtattc tgcccagtac ataaggtcaa tagggggtga atcaacagga aagtcccatt 7740
ggagccaagt acactgcgtc aatagggact ttccattggg ttttgcccag tacataaggt 7800
caatagggga tgagtcaatg ggaaaaaccc attggagcca agtacactga ctcaataggg 7860
actttccatt gggttttgcc cagtacataa ggtcaatagg gggtgagtca acaggaaagt 7920
cccattggag ccaagtacat tgagtcaata gggactttcc aatgggtttt gcccagtaca 7980
taaggtcaat gggaggtaag ccaatgggtt tttcccatta ctggcacgta tactgagtca 8040
ttagggactt tccaatgggt tttgcccagt acataaggtc aataggggtg aatcaacagg 8100
aaagtcccat tggagccaag tacactgagt caatagggac tttccattgg gttttgccca 8160
gtacaaaagg tcaatagggg gtgagtcaat gggtttttcc cattattggc acgtacataa 8220
ggtcaatagg ggtgagtcat tgggtttttc cagccaattt aattaaaacg ccatgtactt 8280
tcccaccatt gacgtcaatg ggctattgaa actaatgcaa cgtgaccttt aaacggtact 8340
ttcccatagc tgattaatgg gaaagtaccg ttctcgagcc aatacacgtc aatgggaagt 8400
gaaagggcag ccaaaacgta acaccgcccc ggttttcccc tggaaattcc atattggcac 8460
gcattctatt ggctgagctg cgttctacgt gggtataaga ggcgcgacca gcgtcggtac 8520
cgtcgcagtc ttcggtctga ccaccgtaga acgcagagct cctcgctgca gcccgggtct 8580
agaggatccg cctgagaaag gaagtgagct gtaaaggctg agctctctct ctgacgtatg 8640
tagcctctgg ttagcttcgt cactcactgt tcttgactca gcatggcaat ctgatgaaat 8700
cccagctgta agtctgcaga aattgatgat ctattaaaca ataaagatgt ccactaaaat 8760
ggaagttttt cctgtcatac tttgttaaga agggtgagaa cagagtacct acattttgaa 8820
tggaaggatt ggagctacgg gggtgggggt ggggtgggat tagataaatg cctgctcttt 8880
actgaaggct ctttactatt gctttatgat aatgtttcat agttggatat cataatttaa 8940
acaagcaaaa ccaaattaag ggccagctca ttcctccaga tccactagtt ctagagcaaa 9000
ttctaccggg taggggaggc gcttttccca aggcagtctg gagcatgcgc tttagcagcc 9060
ccgctgggca cttggcgcta cacaagtggc ctctggcctc gcacacattc cacatccacc 9120
ggtaggcgcc aaccggctcc gttctttggt ggccccttcg cgccaccttc tactcctccc 9180
ctagtcagga agttcccccc cgccccgcag ctcgcgtcgt gcaggacgtg acaaatggaa 9240
gtagcacgtc tcactagtct cgtgcagatg gacagcaccg ctgagcaatg gaagcgggta 9300
ggcctttggg gcagcggcca atagcagctt tgctccttcg ctttctgggc tcagaggctg 9360
ggaaggggtg ggtccggggg cgggctcagg ggcgggctca ggggcggggc gggcgcccga 9420
aggtcctccg gaggcccggc attctgcacg cttcaaaagc gcacgtctgc cgcgctgttc 9480
tcctcttcct catctccggg cctttcgacc agcttaccat gaccgagtac aagcccacgg 9540
tgcgcctcgc cacccgcgac gacgtcccca gggccgtacg caccctcgcc gccgcgttcg 9600
ccgactaccc cgccacgcgc cacaccgtcg atccggaccg ccacatcgag cgggtcaccg 9660
agctgcaaga actcttcctc acgcgcgtcg ggctcgacat cggcaaggtg tgggtcgcgg 9720
acgacggcgc cgcggtggcg gtctggacca cgccggagag cgtcgaagcg ggggcggtgt 9780
tcgccgagat cggcccgcgc atggccgagt tgagcggttc ccggctggcc gcgcagcaac 9840
agatggaagg cctcctggcg ccgcaccggc ccaaggagcc cgcgtggttc ctggccaccg 9900
tcggcgtctc gcccgaccac cagggcaagg gtctgggcag cgccgtcgtg ctccccggag 9960
tggaggcggc cgagcgcgcc ggggtgcccg ccttcctgga gacctccgcg ccccgcaacc 10020
tccccttcta cgagcggctc ggcttcaccg tcaccgccga cgtcgaggtg cccgaaggac 10080
cgcgcacctg gtgcatgacc cgcaagcccg gtgcctgacg cccgccccac gacccgcagc 10140
gcccgaccga aaggagcgca cgaccccatg catcgtagag ctcgctgatc agcctcgact 10200
gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 10260
gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 10320
agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg gggggattgg 10380
gragacaata gcaggcatgc tgggggggcg gtgggggcta tggcttctga ggcggaaaga 10440
accagctggg gctcgagatc cactagttct agcctcgagg ctagagcggc ctgctctaga 10500
gcggccgcca ccgcggtgga gctccagctt ttgttccctt tagtgagggt taatttcgag 10560
cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 10620
acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 10680
actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 10740
gggggtacct aggccgggca acaattggcg gccggccgca cttttcgggg aaatgtgcgc 10800
ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 10860
taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 10920
cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 10980
acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 11040
ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 11100
atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 11160
gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 11220
acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 11280
atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 11340
accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 11400
ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 11460
acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 11520
gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 11580
tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 11640
ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 11700
actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 11760
taactgtcag accctaggcc gggcaacaat tggcggccgg ccctgcatta atgaatcggc 11820
caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 11880
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 11940
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 12000
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 12060
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 12120
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 12180
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 12240
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 12300
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 12360
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 12420
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg 12480
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 12540
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 12600
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 12660
gctcagtgga acgaaaactc 12680
<210>4
<211>12088
<212>DNA
<213>载体
<220>
<221>misc_特征
<222>9790
<223>n=A,T,C或G
<400>4
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgacggtatc aaggtggcga ccggaatggt 300
gagctgcgag aatagccggg cgcgctgtga gccgaagtcg cccccgccct ggccacttcc 360
ggcgcgccga gtccttaggc cgccaggggg cgccggcgcg cgcccagatt ggggacaaag 420
gaagccgggc cggccgcgtt attaccataa aaggcaaaca ctggtcggag gcgtccccgc 480
ggcgcgcggc aggaagccag gccccaaccc cctcccaacc gggcgccagc cccgcctccg 540
cccggttcaa acagcgaccg ggtcgcgcgc gcgcacgcag cggccacacc ctcgggcgcc 600
agcggctcgg gcaggaagtg gcgcaagcgc ccgggcccca gaacgcacgc gcgattagcg 660
ccattgagtc ccagcgcgca cgcgcaatta gcgccaattc ccagcgcgca cgcagttagc 720
gcccaaagga ccagcgcgca cgcgcatggc gccccagccc ccaccgggcc tgacgggggc 780
tacgccgcgc ccaccgtgcg atccccattg gcaagagccc ggctcagaca aagaccccgc 840
cggttgcccc cgccccgaga gcggcacccc cggagcgcgc ccgcccgagc gcggcctcgc 900
gcctgcgaac tggcgtgggg tgtcccccat ctccggaggc ccaggggctt ctcccgcgcc 960
ccccacggcg gtccggttcc gccccatgcg ccccccgctg cggcccagac ggcggctctg 1020
cacgggcgaa gggccgcggc cgcatgcccc ggtcggctgg ccgggcttac ctggcggcgg 1080
gtgtggacgg gcggcggatc ggcaaaggcg aggctctgtg ctcgcgggcg gacgcggtct 1140
cggcggtggt ggcgcgtcgc gccgctgggt tttatagggc gccgccgcgg ccgctcgagc 1200
cataaaaggc aactttcgga acggcgcacg ctgattggcc ccgcgccgct cactcaccgg 1260
cttcgccgca cagtgcagca tttttttacc ccctctcccc tccttttgcg aaaaaaaaaa 1320
agagcgagag cgagattgag gaagaggagg agggagagtt ttggcgttgg ccgccttggg 1380
gtgctgggcc cgggggctgg gggcgcgcgc cgtggccccc gcgccccacg ctgggcagtg 1440
cccggttcgg ccccgcatgg ccaggcctgc ccccggcctg cccgtctctc gggcccccca 1500
cccaccgcgg gacatcctag gtgtggacat ctcttgggca ctgagcgccc aggtggggtg 1560
ggccagggtc tgcacgggtg ccagggccct gggttctgta cgctcctgca gaaggagctc 1620
ttggagggca tggagtggcc aggcagtcac tcccccttgc cgacttcaga gcaactgccc 1680
tgaaagcagg gcctgaggac ctctggctgt ggggctcagc tagctaaatg tgctgggtgg 1740
gtcactaggg agagacctgg gcttgagagg tagagtgtgg tgttggggga gtcaggtggc 1800
ttgcggccat tagagtcgca ggaccacact ccccaggaca gggcaggggc cagcggtcca 1860
gtggctggag gtggcccgtg atgaaggcta caaacctacc cagccgcagc cctgggaagg 1920
aagtgggctc tacagggcag ggcacctttt accctggagc tgcctgcttt tgagggtaac 1980
agtcacgccc agccaagacc aggcctgggg cgttagtggg tgacctaggc actgcggggc 2040
gggggggctg ggtctacaca gcctgggtct gggcccaccg tccgttgtat gtctgctatg 2100
cgcagccaca gctgaactgc cctcccagac catctggagg ccgctggggg actctgggga 2160
ccaagactcc atgtgccaca gaggattggg ggcggggcgg tgctaggaac tcaaagccag 2220
cctgggaaga ccctgtcctt gtcacccttt cttgccttgg gtctgtccac tgagtagcac 2280
acaagaccgg gtgggcaggg tccgttctgc tccgggaatc acagactgtg tgtacccagg 2340
tggtgggcat gcagcgatca gtggcgtggg accacagagg gggcccgcgg tacctaaaac 2400
agcttcacat ggcttaaaat aggggaccaa tgtcttttcc aatctaagtc ccatttataa 2460
taaagtccat gttccatttt taaaggacaa tcctttcggt ttaaaaccag gcacgattac 2520
ccaaacaact cacaacggta aagcactgtg aatcttctct gttctgcaat cccaacttgg 2580
tttctgctca gaaaccctcc ctctttccaa tcggtaatta aataacaaaa ggaaaaaact 2640
taagatgctt caaccccgtt tcgtgacact ttgaaaaaag aatcacctct tgcaaacacc 2700
cgctcccgac ccccgccgct gaagcccggc gtccagaggc ctaagcgcgg gtgcccgccc 2760
ccacccggga gcgcgggcct cgtggtcagc gcatccgcgg ggagaaacaa aggccgcggc 2820
acgggggctc aagggcactg cgccacaccg cacgcgccta cccccgcgcg gccacgttaa 2880
ctggcggtcg ccgcagcctc gggacagccg gccgcgcgcc gccaggctcg cggacgcggg 2940
accacgcgcc gccctccggg aggcccaagt ctcgacccag ccccgcgtgg cgctggggga 3000
gggggcgcct ccgccggaac gcgggtgggg gaggggaggg ggaaatgcgc tttgtctcga 3060
aatggggcaa ccgtcgccac agctccctac cccctcgagg gcagagcagt ccccccacta 3120
actaccgggc tggccgcgcg ccaggccagc cgcgaggcca ccgcccgacc ctccactcct 3180
tcccgcagct cccggcgcgg ggtccggcga gaaggggagg ggaggggagc ggagaaccgg 3240
gcccccggga cgcgtgtggc atctgaagca ccaccagcga gcgagagcta gagagaagga 3300
aagccaccga cttcaccgcc tccgagctgc tccgggtcgc gggtctgcag cgtctccggc 3360
cctccgcgcc tacagctcaa gccacatccg aagggggagg gagccgggag ctgcgcgcgg 3420
ggccgccggg gggaggggtg gcaccgccca cgccgggcgg ccacgaaggg cggggcagcg 3480
ggcgcgcgcg cggcgggggg aggggccggc gccgcgcccg ctgggaattg gggccctagg 3540
gggagggcgg aggcgccgac gaccgcggca cttaccgttc gcggcgtggc gcccggtggt 3600
ccccaagggg agggaagggg gaggcggggc gaggacagtg accggagtct cctcagcggt 3660
ggcttttctg cttggcagcc tcagcggctg gcgccaaaac cggactccgc ccacttcctc 3720
gcccgccggt gcgagggtgt ggaatcctcc agacgctggg ggagggggag ttgggagctt 3780
aaaaactagt acccctttgg gaccactttc agcagcgaac tctcctgtac accaggggtc 3840
agttccacag acgcgggcca ggggtgggtc attgcggcgt gaacaataat ttgactagaa 3900
gttgattcgg gtgtttccgg aaggggccga gtcaatccgc cgagttgggg cacggaaaac 3960
aaaaagggaa ggctactaag atttttctgg cgggggttat cattggcgta actgcaggga 4020
ccacctcccg ggttgagggg gctggatctc caggctgcgg attaagcccc tcccgtcggc 4080
gttaatttca aactgcgcga cgtttctcac ctgccttcgc caaggcaggg gccgggaccc 4140
tattccaaga ggtagtaact agcaggactc tagccttccg caattcattg agcgcattta 4200
cggaagtaac gtcgggtact gtctctggcc gcaagggtgg gaggagtacg catttggcgt 4260
aaggtggggc gtagagcctt cccgccattg gcggcggata gggcgtttac gcgacggcct 4320
gacgtagcgg aagacgcgtt agtggggggg aaggttctag aaaagcggcg gcagcggctc 4380
tagcggcagt agcagcagcg ccgggtcccg tgcggaggtg ctcctcgcag agttgtttct 4440
cgagcagcgg cagttctcac tacagcgcca ggacgagtcc ggttcgtgtt cgtccgcgga 4500
gatctctctc atctcgctcg gctgcgggaa atcgggctga agcgactgag tccgcgatgg 4560
aggtaacggg tttgaaatca atgagttatt gaaaagggca tggcgaggcc gttggcgcct 4620
cagtggaagt cggccagccg cctccgtggg agagaggcag gaaatcggac caattcagta 4680
gcagtggggc ttaaggttta tgaacggggt cttgagcgga ggcctgagcg tacaaacagc 4740
ttccccaccc tcagcctccc ggcgccattt cccttcactg ggggtggggg atggggagct 4800
ttcacatggc ggacgctgcc ccgctggggt gaaagtgggg cgcggaggcg ggaattctta 4860
ttccctttct aaagcacgct gcttcggggg ccacggcgtc tcctcggcga gcgtttcggc 4920
gggcagcagg tcctcgtgag cgaggctgcg gagcttcccc tccccctctc tcccgggaac 4980
cgatttggcg gccgccattt tcatggctcg ccttcctctc agcgttttcc ttataactct 5040
tttattttct tagtgtgctt tctctatcaa gaagtagaag tggttaacta tttttttttt 5100
cttctcgggc tgttttcata tcgtttcgag gtggatttgg agtgttttgt gagcttggat 5160
ctttagagtc ctgcgcacct cattaaaggc gctcagcctt cccctcgatg aaatggcgcc 5220
attgcgttcg gaagccacac cgaagagcgg ggaggggggg tgctccgggt ttgcgggccc 5280
ggtttcagag aagatatcac cacccagggc gtcgggccgg gttcaatgcg agccgtagga 5340
caaagaaacc attttatgtt tttcctgtct tttttttcct ttgagtaacg gttttatctg 5400
ggtctgcagt cagtaaaacg acagatgaac cgcggcaaaa taaacataaa ttggaagcca 5460
tcggccacga ggggcaggga cgaaggtggt tttctgggcg ggggagggat attcgcgtca 5520
gaatccttta ctgttcttaa ggattccgtt taagttgtag agctgactca ttttaagtaa 5580
tgttgttact gagaagttta acccttacgg gacagatcca tggaccttta tagatgatta 5640
cgaggaaagt gaaataacga ttttgtcctt agttatactt cgattaaaac atggcttcag 5700
aggctccttc ctgtaatgcg tatggattga tgtgcaaaac tgttttgggc ctgggccgct 5760
ctgtatttga actttgttac ttttctcatt ttgtttgcaa tcttggttga acattacatt 5820
gataagcata aggtctcaag cgaagggggt ctacctggtt atttttcttt gaccctaagc 5880
acgtttataa aataacattg tttaaaatcg atagtggaca tcgggtaagt ttggataaat 5940
tgtgaggtaa gtaatgagtt tttgcttttt gttagtgatt tgtaaaactt gttataaatg 6000
tacattatcc gtaatttcag tttagagata acctatgtgc tgacgacaat taagaataaa 6060
aactagctga aaaaatgaaa ataactatcg tgacaagtaa ccatttcaaa agactgcttt 6120
gtgtctcata ggagctagtt tgatcatttc agttaatttt ttctttaatt tttacgagtc 6180
atgaaaacta caggaaaaaa aatctgaact gggttttacc actacttttt aggagttggg 6240
agcatgcgaa tggagggaga gctccgtaga actgggatga gagcagcaat taatgctgct 6300
tgctaggaac aaaaaataat tgattgaaaa ttacgtgtga ctttttagtt tgcattatgc 6360
gtttgtagca gttggtcctg gatatcactt tctctcgttt gaggtttttt aacctagtta 6420
acttttaaga caggtttcct taacattcat aagtgcccag aatacagctg tgtagtacag 6480
catataaaga tttcagctct gaggtttttc ctattgactt ggaaaattgt tttgtgcctg 6540
tcgcttgcca catggccaat caagtaagct tcgaattcga gctcgcccaa ctccgcccgt 6600
tttatgacta gaaccaatag tttttaatgc caaatgcact gaaatcccct aatttgcaaa 6660
gccaaacgcc ccctatgtga gtaatacggg gactttttac ccaatttccc aagcggaaag 6720
ccccctaata cactcatatg gcatatgaat cagcacggtc atgcactcta atggcggccc 6780
atagggactt tccacatagg gggcgttcac catttcccag cataggggtg gtgactcaat 6840
ggcctttacc caagtacatt gggtcaatgg gaggtaagcc aatgggtttt tcccattact 6900
ggcaagcaca ctgagtcaaa tgggactttc cactgggttt tgcccaagta cattgggtca 6960
atgggaggtg agccaatggg aaaaacccat tgctgccaag tacactgact caatagggac 7020
tttccaatgg gtttttccat tgttggcaag catataaggt caatgtgggt gagtcaatag 7080
ggactttcca ttgtattctg cccagtacat aaggtcaata gggggtgaat caacaggaaa 7140
gtcccattgg agccaagtac actgcgtcaa tagggacttt ccattgggtt ttgcccagta 7200
cataaggtca ataggggatg agtcaatggg aaaaacccat tggagccaag tacactgact 7260
caatagggac tttccattgg gttttgccca gtacataagg tcaatagggg gtgagtcaac 7320
aggaaagtcc cattggagcc aagtacattg agtcaatagg gactttccaa tgggttttgc 7380
ccagtacata aggtcaatgg gaggtaagcc aatgggtttt tcccattact ggcacgtata 7440
ctgagtcatt agggactttc caatgggttt tgcccagtac ataaggtcaa taggggtgaa 7500
tcaacaggaa agtcccattg gagccaagta cactgagtca atagggactt tccattgggt 7560
tttgcccagt acaaaaggtc aatagggggt gagtcaatgg gtttttccca ttattggcac 7620
gtacataagg tcaatagggg tgagtcattg ggtttttcca gccaatttaa ttaaaacgcc 7680
atgtactttc ccaccattga cgtcaatggg ctattgaaac taatgcaacg tgacctttaa 7740
acggtacttt cccatagctg attaatggga aagtaccgtt ctcgagccaa tacacgtcaa 7800
tgggaagtga aagggcagcc aaaacgtaac accgccccgg ttttcccctg gaaattccat 7860
attggcacgc attctattgg ctgagctgcg ttctacgtgg gtataagagg cgcgaccagc 7920
gtcggtaccg tcgcagtctt cggtctgacc accgtagaac gcagagctcc tcgctgcagc 7980
ccgggtctag aggatccgcc tgagaaagga agtgagctgt aaaggctgag ctctctctct 8040
gacgtatgta gcctctggtt agcttcgtca ctcactgttc ttgactcagc atggcaatct 8100
gatgaaatcc cagctgtaag tctgcagaaa ttgatgatct attaaacaataaagatgtcc 8160
actaaaatgg aagtttttcc tgtcatactt tgttaagaag ggtgagaaca gagtacctac 8220
attttgaatg gaaggattgg agctacgggg gtgggggtgg ggtgggatta gataaatgcc 8280
tgctctttac tgaaggctct ttactattgc tttatgataa tgtttcatag ttggatatca 8340
taatttaaac aagcaaaacc aaattaaggg ccagctcatt cctccagatc cactagttct 8400
agagcaaatt ctaccgggta ggggaggcgc ttttcccaag gcagtctgga gcatgcgctt 8460
tagcagcccc gctgggcact tggcgctaca caagtggcct ctggcctcgc acacattcca 8520
catccaccgg taggcgccaa ccggctccgt tctttggtgg ccccttcgcg ccaccttcta 8580
ctcctcccct agtcaggaag ttcccccccg ccccgcagct cgcgtcgtgc aggacgtgac 8640
aaatggaagt agcacgtctc actagtctcg tgcagatgga cagcaccgct gagcaatgga 8700
agcgggtagg cctttggggc agcggccaat agcagctttg ctccttcgct ttctgggctc 8760
agaggctggg aaggggtggg tccgggggcg ggctcagggg cgggctcagg ggcggggcgg 8820
gcgcccgaag gtcctccgga ggcccggcat tctgcacgct tcaaaagcgc acgtctgccg 8880
cgctgttctc ctcttcctca tctccgggcc tttcgaccag cttaccatga ccgagtacaa 8940
gcccacggtg cgcctcgcca cccgcgacga cgtccccagg gccgtacgca ccctcgccgc 9000
cgcgttcgcc gactaccccg ccacgcgcca caccgtcgat ccggaccgcc acatcgagcg 9060
ggtcaccgag ctgcaagaac tcttcctcac gcgcgtcggg ctcgacatcg gcaaggtgtg 9120
ggtcgcggac gacggcgccg cggtggcggt ctggaccacg ccggagagcg tcgaagcggg 9180
ggcggtgttc gccgagatcg gcccgcgcat ggccgagttg agcggttccc ggctggccgc 9240
gcagcaacag atggaaggcc tcctggcgcc gcaccggccc aaggagcccg cgtggttcct 9300
ggccaccgtc ggcgtctcgc ccgaccacca gggcaagggt ctgggcagcg ccgtcgtgct 9360
ccccggagtg gaggcggccg agcgcgccgg ggtgcccgcc ttcctggaga cctccgcgcc 9420
ccgcaacctc cccttctacg agcggctcgg cttcaccgtc accgccgacg tcgaggtgcc 9480
cgaaggaccg cgcacctggt gcatgacccg caagcccggt gcctgacgcc cgccccacga 9540
cccgcagcgc ccgaccgaaa ggagcgcacg accccatgca tcgtagagct cgctgatcag 9600
cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 9660
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 9720
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 9780
gggattgggr agacaatagc aggcatgctg ggggggcggt gggggctatg gcttctgagg 9840
cggaaagaac cagctggggc tcgagatcca ctagttctag cctcgaggct agagcggcct 9900
gctctagagc ggccgccacc gcggtggagc tccagctttt gttcccttta gtgagggtta 9960
atttcgagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 10020
acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 10080
gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 10140
tcgtgccagg gggtacctag gccgggcaac aattggcggc cggccgcact tttcggggaa 10200
atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca 10260
tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc 10320
aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc 10380
acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt 10440
acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt 10500
ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg 10560
ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact 10620
caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg 10680
ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga 10740
aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg 10800
aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa 10860
tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac 10920
aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc 10980
cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca 11040
ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga 11100
gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta 11160
agcattggta actgtcagac cctaggccgg gcaacaattg gcggccggcc ctgcattaat 11220
gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 11280
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 11340
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 11400
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 11460
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 11520
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 11580
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 11640
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 11700
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 11760
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 11820
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 11880
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 11940
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 12000
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 12060
ggtctgacgc tcagtggaac gaaaactc 12088
<210>5
<211>12704
<212>DNA
<213>载体
<220>
<221>misc_特征
<222>9605
<223>n=A,T,C或G
<400>5
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgactctaga cccgggctgc agcgaggagc 300
tctgcgttct acggtggtca gaccgaagac tgcgacggta ccgacgctgg tcgcgcctct 360
tatacccacg tagaacgcag ctcagccaat agaatgcgtg ccaatatgga atttccaggg 420
gaaaaccggg gcggtgttac gttttggctg ccctttcact tcccattgac gtgtattggc 480
tcgagaacgg tactttccca ttaatcagct atgggaaagt accgtttaaa ggtcacgttg 540
cattagtttc aatagcccat tgacgtcaat ggtgggaaag tacatggcgt tttaattaaa 600
ttggctggaa aaacccaatg actcacccct attgacctta tgtacgtgcc aataatggga 660
aaaacccatt gactcacccc ctattgacct tttgtactgg gcaaaaccca atggaaagtc 720
cctattgact cagtgtactt ggctccaatg ggactttcct gttgattcac ccctattgac 780
cttatgtact gggcaaaacc cattggaaag tccctaatga ctcagtatac gtgccagtaa 840
tgggaaaaac ccattggctt acctcccatt gaccttatgt actgggcaaa acccattgga 900
aagtccctat tgactcaatg tacttggctc caatgggact ttcctgttga ctcaccccct 960
attgacctta tgtactgggc aaaacccaat ggaaagtccc tattgagtca gtgtacttgg 1020
ctccaatggg tttttcccat tgactcatcc cctattgacc ttatgtactg ggcaaaaccc 1080
aatggaaagt ccctattgac gcagtgtact tggctccaat gggactttcc tgttgattca 1140
ccccctattg accttatgta ctgggcagaa tacaatggaa agtccctatt gactcaccca 1200
cattgacctt atatgcttgc caacaatgga aaaacccatt ggaaagtccc tattgagtca 1260
gtgtacttgg cagcaatggg tttttcccat tggctcacct cccattgacc caatgtactt 1320
gggcaaaacc cagtggaaag tcccatttga ctcagtgtgc ttgccagtaa tgggaaaaac 1380
ccattggctt acctcccatt gacccaatgt acttgggtaa aggccattga gtcaccaccc 1440
ctatgctggg aaatggtgaa cgccccctat gtggaaagtc cctatgggcc gccattagag 1500
tgcatgaccg tgctgattca tatgccatat gagtgtatta gggggctttc cgcttgggaa 1560
attgggtaaa aagtccccgt attactcaca tagggggcgt ttggctttgc aaattagggg 1620
atttcagtgc atttggcatt aaaaactatt ggttctagtc ataaaacggg cggagttggg 1680
cgagctcgaa ttcaaacgac tcgacggtat caaggtggcg accggaatgg tgagctgcga 1740
gaatagccgg gcgcgctgtg agccgaagtc gcccccgccc tggccacttc cggcgcgccg 1800
agtccttagg ccgccagggg gcgccggcgc gcgcccagat tggggacaaa ggaagccggg 1860
ccggccgcgt tattaccata aaaggcaaac actggtcgga ggcgtccccg cggcgcgcgg 1920
caggaagcca ggccccaacc ccctcccaac cgggcgccag ccccgcctcc gcccggttca 1980
aacagcgacc gggtcgcgcg cgcgcacgca gcggccacac cctcgggcgc cagcggctcg 2040
ggcaggaagt ggcgcaagcg cccgggcccc agaacgcacg cgcgattagc gccattgagt 2100
cccagcgcgc acgcgcaatt agcgccaatt cccagcgcgc acgcagttag cgcccaaagg 2160
accagcgcgc acgcgcatgg cgccccagcc cccaccgggc ctgacggggg ctacgccgcg 2220
cccaccgtgc gatccccatt ggcaagagcc cggctcagac aaagaccccg ccggttgccc 2280
ccgccccgag agcggcaccc ccggagcgcg cccgcccgag cgcggcctcg cgcctgcgaa 2340
ctggcgtggg gtgtccccca tctccggagg cccaggggct tctcccgcgc cccccacggc 2400
ggtccggttc cgccccatgc gccccccgct gcggcccaga cggcggctct gcacgggcga 2460
agggccgcgg ccgcatgccc cggtcggctg gccgggctta cctggcggcg ggtgtggacg 2520
ggcggcggat cggcaaaggc gaggctctgt gctcgcgggc ggacgcggtc tcggcggtgg 2580
tggcgcgtcg cgccgctggg ttttataggg cgccgccgcg gccgctcgag ccataaaagg 2640
caactttcgg aacggcgcac gctgattggc cccgcgccgc tcactcaccg gcttcgccgc 2700
acagtgcagc atttttttac cccctctccc ctccttttgc gaaaaaaaaa aagagcgaga 2760
gcgagattga ggaagaggag gagggagagt tttggcgttg gccgccttgg ggtgctgggc 2820
ccgggggctg ggggcgcgcg ccgtggcccc cgcgccccac gctgggcagt gcccggttcg 2880
gccccgcatg gccaggcctg cccccggcct gcccgtctct cgggcccccc acccaccgcg 2940
ggacatccta ggtgtggaca tctcttgggc actgagcgcc caggtggggt gggccagggt 3000
ctgcacgggt gccagggccc tgggttctgt acgctcctgc agaaggagct cttggagggc 3060
atggagtggc caggcagtca ctcccccttg ccgacttcag agcaactgcc ctgaaagcag 3120
ggcctgagga cctctggctg tggggctcag ctagctaaat gtgctgggtg ggtcactagg 3180
gagagacctg ggcttgagag gtagagtgtg gtgttggggg agtcaggtgg cttgcggcca 3240
ttagagtcgc aggaccacac tccccaggac agggcagggg ccagcggtcc agtggctgga 3300
ggtggcccgt gatgaaggct acaaacctac ccagccgcag ccctgggaag gaagtgggct 3360
ctacagggca gggcaccttt taccctggag ctgcctgctt ttgagggtaa cagtcacgcc 3420
cagccaagac caggcctggg gcgttagtgg gtgacctagg cactgcgggg cgggggggct 3480
gggtctacac agcctgggtc tgggcccacc gtccgttgta tgtctgctat gcgcagccac 3540
agctgaactg ccctcccaga ccatctggag gccgctgggg gactctgggg accaagactc 3600
catgtgccac agaggattgg gggcggggcg gtgctaggaa ctcaaagcca gcctgggaag 3660
accctgtcct tgtcaccctt tcttgccttg ggtctgtcca ctgagtagca cacaagaccg 3720
ggtgggcagg gtccgttctg ctccgggaat cacagactgt gtgtacccag gtggtgggca 3780
tgcagcgatc agtggcgtgg gaccacagag ggggcccgcg gtacctaaaa cagcttcaca 3840
tggcttaaaa taggggacca atgtcttttc caatctaagt cccatttata ataaagtcca 3900
tgttccattt ttaaaggaca atcctttcgg tttaaaacca ggcacgatta cccaaacaac 3960
tcacaacggt aaagcactgt gaatcttctc tgttctgcaa tcccaacttg gtttctgctc 4020
agaaaccctc cctctttcca atcggtaatt aaataacaaa aggaaaaaac ttaagatgct 4080
tcaaccccgt ttcgtgacac tttgaaaaaa gaatcacctc ttgcaaacac ccgctcccga 4140
cccccgccgc tgaagcccgg cgtccagagg cctaagcgcg ggtgcccgcc cccacccggg 4200
agcgcgggcc tcgtggtcag cgcatccgcg gggagaaaca aaggccgcgg cacgggggct 4260
caagggcact gcgccacacc gcacgcgcct acccccgcgc ggccacgtta actggcggtc 4320
gccgcagcct cgggacagcc ggccgcgcgc cgccaggctc gcggacgcgg gaccacgcgc 4380
cgccctccgg gaggcccaag tctcgaccca gccccgcgtg gcgctggggg agggggcgcc 4440
tccgccggaa cgcgggtggg ggaggggagg gggaaatgcg ctttgtctcg aaatggggca 4500
accgtcgcca cagctcccta ccccctcgag ggcagagcag tccccccact aactaccggg 4560
ctggccgcgc gccaggccag ccgcgaggcc accgcccgac cctccactcc ttcccgcagc 4620
tcccggcgcg gggtccggcg agaaggggag gggaggggag cggagaaccg ggcccccggg 4680
acgcgtgtgg catctgaagc accaccagcg agcgagagct agagagaagg aaagccaccg 4740
acttcaccgc ctccgagctg ctccgggtcg cgggtctgca gcgtctccgg ccctccgcgc 4800
ctacagctca agccacatcc gaagggggag ggagccggga gctgcgcgcg gggccgccgg 4860
ggggaggggt ggcaccgccc acgccgggcg gccacgaagg gcggggcagc gggcgcgcgc 4920
gcggcggggg gaggggccgg cgccgcgccc gctgggaatt ggggccctag ggggagggcg 4980
gaggcgccga cgaccgcggc acttaccgtt cgcggcgtgg cgcccggtgg tccccaaggg 5040
gagggaaggg ggaggcgggg cgaggacagt gaccggagtc tcctcagcgg tggcttttct 5100
gcttggcagc ctcagcggct ggcgccaaaa ccggactccg cccacttcct cgcccgccgg 5160
tgcgagggtg tggaatcctc cagacgctgg gggaggggga gttgggagct taaaaactag 5220
tacccctttg ggaccacttt cagcagcgaa ctctcctgta caccaggggt cagttccaca 5280
gacgcgggcc aggggtgggt cattgcggcg tgaacaataa tttgactaga agttgattcg 5340
ggtgtttccg gaaggggccg agtcaatccg ccgagttggg gcacggaaaa caaaaaggga 5400
aggctactaa gatttttctg gcgggggtta tcattggcgt aactgcaggg accacctccc 5460
gggttgaggg ggctggatct ccaggctgcg gattaagccc ctcccgtcgg cgttaatttc 5520
aaactgcgcg acgtttctca cctgccttcg ccaaggcagg ggccgggacc ctattccaag 5580
aggtagtaac tagcaggact ctagccttcc gcaattcatt gagcgcattt acggaagtaa 5640
cgtcgggtac tgtctctggc cgcaagggtg ggaggagtac gcatttggcg taaggtgggg 5700
cgtagagcct tcccgccatt ggcggcggat agggcgttta cgcgacggcc tgacgtagcg 5760
gaagacgcgt tagtgggggg gaaggttcta gaaaagcggc ggcagcggct ctagcggcag 5820
tagcagcagc gccgggtccc gtgcggaggt gctcctcgca gagttgtttc tcgagcagcg 5880
gcagttctca ctacagcgcc aggacgagtc cggttcgtgt tcgtccgcgg agatctctct 5940
catctcgctc ggctgcggga aatcgggctg aagcgactga gtccgcgatg gaggtaacgg 6000
gtttgaaatc aatgagttat tgaaaagggc atggcgaggc cgttggcgcc tcagtggaag 6060
tcggccagcc gcctccgtgg gagagaggca ggaaatcgga ccaattcagt agcagtgggg 6120
cttaaggttt atgaacgggg tcttgagcgg aggcctgagc gtacaaacag cttccccacc 6180
ctcagcctcc cggcgccatt tcccttcact gggggtgggg gatggggagc tttcacatgg 6240
cggacgctgc cccgctgggg tgaaagtggg gcgcggaggc gggaattctt attccctttc 6300
taaagcacgc tgcttcgggg gccacggcgt ctcctcggcg agcgtttcgg cgggcagcag 6360
gtcctcgtga gcgaggctgc ggagcttccc ctccccctct ctcccgggaa ccgatttggc 6420
ggccgccatt ttcatggctc gccttcctct cagcgttttc cttataactc ttttattttc 6480
ttagtgtgct ttctctatca agaagtagaa gtggttaact attttttttt tcttctcggg 6540
ctgttttcat atcgtttcga ggtggatttg gagtgttttg tgagcttgga tctttagagt 6600
cctgcgcacc tcattaaagg cgctcagcct tcccctcgat gaaatggcgc cattgcgttc 6660
ggaagccaca ccgaagagcg gggagggggg gtgctccggg tttgcgggcc cggtttcaga 6720
gaagatatca ccacccaggg cgtcgggccg ggttcaatgc gagccgtagg acaaagaaac 6780
cattttatgt ttttcctgtc ttttttttcc tttgagtaac ggttttatct gggtctgcag 6840
tcagtaaaac gacagatgaa ccgcggcaaa ataaacataa attggaagcc atcggccacg 6900
aggggcaggg acgaaggtgg ttttctgggc gggggaggga tattcgcgtc agaatccttt 6960
actgttctta aggattccgt ttaagttgta gagctgactc attttaagta atgttgttac 7020
tgagaagttt aacccttacg ggacagatcc atggaccttt atagatgatt acgaggaaag 7080
tgaaataacg attttgtcct tagttatact tcgattaaaa catggcttca gaggctcctt 7140
cctgtaatgc gtatggattg atgtgcaaaa ctgttttggg cctgggccgc tctgtatttg 7200
aactttgtta cttttctcat tttgtttgca atcttggttg aacattacat tgataagcat 7260
aaggtctcaa gcgaaggggg tctacctggt tatttttctt tgaccctaag cacgtttata 7320
aaataacatt gtttaaaatc gatagtggac atcgggtaag tttggataaa ttgtgaggta 7380
agtaatgagt ttttgctttt tgttagtgat ttgtaaaact tgttataaat gtacattatc 7440
cgtaatttca gtttagagat aacctatgtg ctgacgacaa ttaagaataa aaactagctg 7500
aaaaaatgaa aataactatc gtgacaagta accatttcaa aagactgctt tgtgtctcat 7560
aggagctagt ttgatcattt cagttaattt tttctttaat ttttacgagt catgaaaact 7620
acaggaaaaa aaatctgaac tgggttttac cactactttt taggagttgg gagcatgcga 7680
atggagggag agctccgtag aactgggatg agagcagcaa ttaatgctgc ttgctaggaa 7740
caaaaaataa ttgattgaaa attacgtgtg actttttagt ttgcattatg cgtttgtagc 7800
agttggtcct ggatatcact ttctctcgtt tgaggttttt taacctagtt aacttttaag 7860
acaggtttcc ttaacattca taagtgccca gaatacagct gtgtagtaca gcatataaag 7920
atttcagctc tgaggttttt cctattgact tggaaaattg ttttgtgcct gtcgcttgcc 7980
acatggccaa tcaagtaagc ttattaatag taatcaatta cggggtcatt agttcatagc 8040
ccatatatgg agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc 8100
aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg 8160
actttccatt gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat 8220
caagtgtatc atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc 8280
tggcattatg cccagtacat gaccttatgg gactttccta cttggcagta catctacgta 8340
ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag 8400
cggtttgact cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt 8460
tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa 8520
atgggcggta ggcgtgtacg gtgggaggtc tatataagca gagctggttt agtgaaccgt 8580
cagatcggat ccgcctgaga aaggaagtga gctgtaaagg ctgagctctc tctctgacgt 8640
atgtagcctc tggttagctt cgtcactcac tgttcttgac tcagcatggc aatctgatga 8700
aatcccagct gtaagtctgc agaaattgat gatctattaa acaataaaga tgtccactaa 8760
aatggaagtt tttcctgtca tactttgtta agaagggtga gaacagagta cctacatttt 8820
gaatggaagg attggagcta cgggggtggg ggtggggtgg gattagataa atgcctgctc 8880
tttactgaag gctctttact attgctttat gataatgttt catagttgga tatcataatt 8940
taaacaagca aaaccaaatt aagggccagc tcattcctcc agatccacta gtaattctgt 9000
ggaatgtgtg tcagttaggg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc 9060
aaagcatgca tctcaattag tcagcaacca ggtgtggaaa gtccccaggc tccccagcag 9120
gcagaagtat gcaaagcatg catctcaatt agtcagcaac catagtcccg cccctaactc 9180
cgcccatccc gcccctaact ccgcccagtt ccgcccattc tccgccccat ggctgactaa 9240
ttttttttat ttatgcagag gccgaggccg cctctgcctc tgagctattc cagaagtagt 9300
gaggaggctt ttttggaggc ctaggctttt gcaaaaagct cccgggagct tgtatatcca 9360
ttttcggatc tgatcaagag acaggatgag gatcgtttcg catgattgaa caagatggat 9420
tgcacgcagg ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac 9480
agacaatcgg ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc 9540
tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaggacgag gcagcgcggc 9600
tatcstggct ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag 9660
cgggaaggga ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc 9720
ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg 9780
atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc 9840
ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc 9900
cagccgaact gttcgccagg ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga 9960
cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca 10020
tcgactgtgg ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg 10080
atattgctga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg 10140
ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgagcgg 10200
gactctgggg ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac gagatttcga 10260
ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg acgccggctg 10320
gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca acttgtttat 10380
tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 10440
tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg 10500
tataccgtcg agactagttc tagagcggcc gccaccgcgg tggagctcca gcttttgttc 10560
cctttagtga gggttaattt cgagcttggc gtaatcatgg tcatagctgt ttcctgtgtg 10620
aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc 10680
ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 10740
ccagtcggga aacctgtcgt gccagggggt acctaggccg ggcaacaatt ggcggccggc 10800
cgcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca 10860
aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg 10920
aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc 10980
cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg 11040
ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt 11100
cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta 11160
ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat 11220
gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga 11280
gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca 11340
acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact 11400
cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc 11460
acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact 11520
ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt 11580
ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt 11640
gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt 11700
atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata 11760
ggtgcctcac tgattaagca ttggtaactg tcagacccta ggccgggcaa caattggcgg 11820
ccggccctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 11880
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 11940
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 12000
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 12060
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 12120
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 12180
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 12240
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 12300
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 12360
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 12420
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 12480
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 12540
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 12600
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 12660
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actc 12704
<210>6
<211>11273
<212>DNA
<213>载体
<220>
<221>misc_特征
<222>8174
<223>n=A,T,C或G
<400>6
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgacggtatc aaggtggcga ccggaatggt 300
gagctgcgag aatagccggg cgcgctgtga gccgaagtcg cccccgccct ggccacttcc 360
ggcgcgccga gtccttaggc cgccaggggg cgccggcgcg cgcccagatt ggggacaaag 420
gaagccgggc cggccgcgtt attaccataa aaggcaaaca ctggtcggag gcgtccccgc 480
ggcgcgcggc aggaagccag gccccaaccc cctcccaacc gggcgccagc cccgcctccg 540
cccggttcaa acagcgaccg ggtcgcgcgc gcgcacgcag cggccacacc ctcgggcgcc 600
agcggctcgg gcaggaagtg gcgcaagcgc ccgggcccca gaacgcacgc gcgattagcg 660
ccattgagtc ccagcgcgca cgcgcaatta gcgccaattc ccagcgcgca cgcagttagc 720
gcccaaagga ccagcgcgca cgcgcatggc gccccagccc ccaccgggcc tgacgggggc 780
tacgccgcgc ccaccgtgcg atccccattg gcaagagccc ggctcagaca aagaccccgc 840
cggttgcccc cgccccgaga gcggcacccc cggagcgcgc ccgcccgagc gcggcctcgc 900
gcctgcgaac tggcgtgggg tgtcccccat ctccggaggc ccaggggctt ctcccgcgcc 960
ccccacggcg gtccggttcc gccccatgcg ccccccgctg cggcccagac ggcggctctg 1020
cacgggcgaa gggccgcggc cgcatgcccc ggtcggctgg ccgggcttac ctggcggcgg 1080
gtgtggacgg gcggcggatc ggcaaaggcg aggctctgtg ctcgcgggcg gacgcggtct 1140
cggcggtggt ggcgcgtcgc gccgctgggt tttatagggc gccgccgcgg ccgctcgagc 1200
cataaaaggc aactttcgga acggcgcacg ctgattggcc ccgcgccgct cactcaccgg 1260
cttcgccgca cagtgcagca tttttttacc ccctctcccc tccttttgcg aaaaaaaaaa 1320
agagcgagag cgagattgag gaagaggagg agggagagtt ttggcgttgg ccgccttggg 1380
gtgctgggcc cgggggctgg gggcgcgcgc cgtggccccc gcgccccacg ctgggcagtg 1440
cccggttcgg ccccgcatgg ccaggcctgc ccccggcctg cccgtctctc gggcccccca 1500
cccaccgcgg gacatcctag gtgtggacat ctcttgggca ctgagcgccc aggtggggtg 1560
ggccagggtc tgcacgggtg ccagggccct gggttctgta cgctcctgca gaaggagctc 1620
ttggagggca tggagtggcc aggcagtcac tcccccttgc cgacttcaga gcaactgccc 1680
tgaaagcagg gcctgaggac ctctggctgt ggggctcagc tagctaaatg tgctgggtgg 1740
gtcactaggg agagacctgg gcttgagagg tagagtgtgg tgttggggga gtcaggtggc 1800
ttgcggccat tagagtcgca ggaccacact ccccaggaca gggcaggggc cagcggtcca 1860
gtggctggag gtggcccgtg atgaaggcta caaacctacc cagccgcagc cctgggaagg 1920
aagtgggctc tacagggcag ggcacctttt accctggagc tgcctgcttt tgagggtaac 1980
agtcacgccc agccaagacc aggcctgggg cgttagtggg tgacctaggc actgcggggc 2040
gggggggctg ggtctacaca gcctgggtct gggcccaccg tccgttgtat gtctgctatg 2100
cgcagccaca gctgaactgc cctcccagac catctggagg ccgctggggg actctgggga 2160
ccaagactcc atgtgccaca gaggattggg ggcggggcgg tgctaggaac tcaaagccag 2220
cctgggaaga ccctgtcctt gtcacccttt cttgccttgg gtctgtccac tgagtagcac 2280
acaagaccgg gtgggcaggg tccgttctgc tccgggaatc acagactgtg tgtacccagg 2340
tggtgggcat gcagcgatca gtggcgtggg accacagagg gggcccgcgg tacctaaaac 2400
agcttcacat ggcttaaaat aggggaccaa tgtcttttcc aatctaagtc ccatttataa 2460
taaagtccat gttccatttt taaaggacaa tcctttcggt ttaaaaccag gcacgattac 2520
ccaaacaact cacaacggta aagcactgtg aatcttctct gttctgcaat cccaacttgg 2580
tttctgctca gaaaccctcc ctctttccaa tcggtaatta aataacaaaa ggaaaaaact 2640
taagatgctt caaccccgtt tcgtgacact ttgaaaaaag aatcacctct tgcaaacacc 2700
cgctcccgac ccccgccgct gaagcccggc gtccagaggc ctaagcgcgg gtgcccgccc 2760
ccacccggga gcgcgggcct cgtggtcagc gcatccgcgg ggagaaacaa aggccgcggc 2820
acgggggctc aagggcactg cgccacaccg cacgcgccta cccccgcgcg gccacgttaa 2880
ctggcggtcg ccgcagcctc gggacagccg gccgcgcgcc gccaggctcg cggacgcggg 2940
accacgcgcc gccctccggg aggcccaagt ctcgacccag ccccgcgtgg cgctggggga 3000
gggggcgcct ccgccggaac gcgggtgggg gaggggaggg ggaaatgcgc tttgtctcga 3060
aatggggcaa ccgtcgccac agctccctac cccctcgagg gcagagcagt ccccccacta 3120
actaccgggc tggccgcgcg ccaggccagc cgcgaggcca ccgcccgacc ctccactcct 3180
tcccgcagct cccggcgcgg ggtccggcga gaaggggagg ggaggggagc ggagaaccgg 3240
gcccccggga cgcgtgtggc atctgaagca ccaccagcga gcgagagcta gagagaagga 3300
aagccaccga cttcaccgcc tccgagctgc tccgggtcgc gggtctgcag cgtctccggc 3360
cctccgcgcc tacagctcaa gccacatccg aagggggagg gagccgggag ctgcgcgcgg 3420
ggccgccggg gggaggggtg gcaccgccca cgccgggcgg ccacgaaggg cggggcagcg 3480
ggcgcgcgcg cggcgggggg aggggccggc gccgcgcccg ctgggaattg gggccctagg 3540
gggagggcgg aggcgccgac gaccgcggca cttaccgttc gcggcgtggc gcccggtggt 3600
ccccaagggg agggaagggg gaggcggggc gaggacagtg accggagtct cctcagcggt 3660
ggcttttctg cttggcagcc tcagcggctg gcgccaaaac cggactccgc ccacttcctc 3720
gcccgccggt gcgagggtgt ggaatcctcc agacgctggg ggagggggag ttgggagctt 3780
aaaaactagt acccctttgg gaccactttc agcagcgaac tctcctgtac accaggggtc 3840
agttccacag acgcgggcca ggggtgggtc attgcggcgt gaacaataat ttgactagaa 3900
gttgattcgg gtgtttccgg aaggggccga gtcaatccgc cgagttgggg cacggaaaac 3960
aaaaagggaa ggctactaag atttttctgg cgggggttat cattggcgta actgcaggga 4020
ccacctcccg ggttgagggg gctggatctc caggctgcgg attaagcccc tcccgtcggc 4080
gttaatttca aactgcgcga cgtttctcac ctgccttcgc caaggcaggg gccgggaccc 4140
tattccaaga ggtagtaact agcaggactc tagccttccg caattcattg agcgcattta 4200
cggaagtaac gtcgggtact gtctctggcc gcaagggtgg gaggagtacg catttggcgt 4260
aaggtggggc gtagagcctt cccgccattg gcggcggata gggcgtttac gcgacggcct 4320
gacgtagcgg aagacgcgtt agtggggggg aaggttctag aaaagcggcg gcagcggctc 4380
tagcggcagt agcagcagcg ccgggtcccg tgcggaggtg ctcctcgcag agttgtttct 4440
cgagcagcgg cagttctcac tacagcgcca ggacgagtcc ggttcgtgtt cgtccgcgga 4500
gatctctctc atctcgctcg gctgcgggaa atcgggctga agcgactgag tccgcgatgg 4560
aggtaacggg tttgaaatca atgagttatt gaaaagggca tggcgaggcc gttggcgcct 4620
cagtggaagt cggccagccg cctccgtggg agagaggcag gaaatcggac caattcagta 4680
gcagtggggc ttaaggttta tgaacggggt cttgagcgga ggcctgagcg tacaaacagc 4740
ttccccaccc tcagcctccc ggcgccattt cccttcactg ggggtggggg atggggagct 4800
ttcacatggc ggacgctgcc ccgctggggt gaaagtgggg cgcggaggcg ggaattctta 4860
ttccctttct aaagcacgct gcttcggggg ccacggcgtc tcctcggcga gcgtttcggc 4920
gggcagcagg tcctcgtgag cgaggctgcg gagcttcccc tccccctctc tcccgggaac 4980
cgatttggcg gccgccattt tcatggctcg ccttcctctc agcgttttcc ttataactct 5040
tttattttct tagtgtgctt tctctatcaa gaagtagaag tggttaacta tttttttttt 5100
cttctcgggc tgttttcata tcgtttcgag gtggatttgg agtgttttgt gagcttggat 5160
ctttagagtc ctgcgcacct cattaaaggc gctcagcctt cccctcgatg aaatggcgcc 5220
attgcgttcg gaagccacac cgaagagcgg ggaggggggg tgctccgggt ttgcgggccc 5280
ggtttcagag aagatatcac cacccagggc gtcgggccgg gttcaatgcg agccgtagga 5340
caaagaaacc attttatgtt tttcctgtct tttttttcct ttgagtaacg gttttatctg 5400
ggtctgcagt cagtaaaacg acagatgaac cgcggcaaaa taaacataaa ttggaagcca 5460
tcggccacga ggggcaggga cgaaggtggt tttctgggcg ggggagggat attcgcgtca 5520
gaatccttta ctgttcttaa ggattccgtt taagttgtag agctgactca ttttaagtaa 5580
tgttgttact gagaagttta acccttacgg gacagatcca tggaccttta tagatgatta 5640
cgaggaaagt gaaataacga ttttgtcctt agttatactt cgattaaaac atggcttcag 5700
aggctccttc ctgtaatgcg tatggattga tgtgcaaaac tgttttgggc ctgggccgct 5760
ctgtatttga actttgttac ttttctcatt ttgtttgcaa tcttggttga acattacatt 5820
gataagcata aggtctcaag cgaagggggt ctacctggtt atttttcttt gaccctaagc 5880
acgtttataa aataacattg tttaaaatcg atagtggaca tcgggtaagt ttggataaat 5940
tgtgaggtaa gtaatgagtt tttgcttttt gttagtgatt tgtaaaactt gttataaatg 6000
tacattatcc gtaatttcag tttagagata acctatgtgc tgacgacaat taagaataaa 6060
aactagctga aaaaatgaaa ataactatcg tgacaagtaa ccatttcaaa agactgcttt 6120
gtgtctcata ggagctagtt tgatcatttc agttaatttt ttctttaatt tttacgagtc 6180
atgaaaacta caggaaaaaa aatctgaact gggttttacc actacttttt aggagttggg 6240
agcatgcgaa tggagggaga gctccgtaga actgggatga gagcagcaat taatgctgct 6300
tgctaggaac aaaaaataat tgattgaaaa ttacgtgtga ctttttagtt tgcattatgc 6360
gtttgtagca gttggtcctg gatatcactt tctctcgttt gaggtttttt aacctagtta 6420
acttttaaga caggtttcct taacattcat aagtgcccag aatacagctg tgtagtacag 6480
catataaaga tttcagctct gaggtttttc ctattgactt ggaaaattgt tttgtgcctg 6540
tcgcttgcca catggccaat caagtaagct tattaatagt aatcaattac ggggtcatta 6600
gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 6660
tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 6720
ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 6780
gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 6840
tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 6900
atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg 6960
cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg 7020
agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca 7080
ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta 7140
gtgaaccgtc agatcggatc cgcctgagaa aggaagtgag ctgtaaaggc tgagctctct 7200
ctctgacgta tgtagcctct ggttagcttc gtcactcact gttcttgact cagcatggca 7260
atctgatgaa atcccagctg taagtctgca gaaattgatg atctattaaa caataaagat 7320
gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 7380
ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 7440
tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 7500
atcataattt aaacaagcaa aaccaaatta agggccagct cattcctcca gatccactag 7560
taattctgtg gaatgtgtgt cagttagggt gtggaaagtc cccaggctcc ccagcaggca 7620
gaagtatgca aagcatgcat ctcaattagt cagcaaccag gtgtggaaag tccccaggct 7680
ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc atagtcccgc 7740
ccctaactcc gcccatcccg cccctaactc cgcccagttc cgcccattct ccgccccatg 7800
gctgactaat tttttttatt tatgcagagg ccgaggccgc ctctgcctct gagctattcc 7860
agaagtagtg aggaggcttt tttggaggcc taggcttttg caaaaagctc ccgggagctt 7920
gtatatccat tttcggatct gatcaagaga caggatgagg atcgtttcgc atgattgaac 7980
aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc ggctatgact 8040
gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc 8100
gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg caggacgagg 8160
cagcgcggct atcstggctg gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg 8220
tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag gatctcctgt 8280
catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg cggcggctgc 8340
atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc atcgagcgag 8400
cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa gagcatcagg 8460
ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac ggcgaggatc 8520
tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt 8580
ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac atagcgttgg 8640
ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt 8700
acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt gacgagttct 8760
tctgagcggg actctggggt tcgaaatgac cgaccaagcg acgcccaacc tgccatcacg 8820
agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg ttttccggga 8880
cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg cccaccccaa 8940
cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa 9000
taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta 9060
tcatgtctgt ataccgtcga gactagttct agagcggccg ccaccgcggt ggagctccag 9120
cttttgttcc ctttagtgag ggttaatttc gagcttggcg taatcatggt catagctgtt 9180
tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 9240
gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact 9300
gcccgctttc cagtcgggaa acctgtcgtg ccagggggta cctaggccgg gcaacaattg 9360
gcggccggcc gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa 9420
atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat 9480
tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg 9540
gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa 9600
gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt 9660
gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt 9720
ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat 9780
tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg 9840
acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta 9900
cttctgacaa cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat 9960
catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag 10020
cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa 10080
ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca 10140
ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc 10200
ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt 10260
atcgtagtta tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc 10320
gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccctag gccgggcaac 10380
aattggcggc cggccctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 10440
attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 10500
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 10560
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 10620
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 10680
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 10740
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 10800
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 10860
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 10920
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 10980
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 11040
aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 11100
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 11160
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 11220
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctc 11273
<210>7
<211>12591
<212>DNA
<213>载体
<400>7
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgactctaga cccgggctgc agcgaggagc 300
tctgcgttct acggtggtca gaccgaagac tgcgacggta ccgacgctgg tcgcgcctct 360
tatacccacg tagaacgcag ctcagccaat agaatgcgtg ccaatatgga atttccaggg 420
gaaaaccggg gcggtgttac gttttggctg ccctttcact tcccattgac gtgtattggc 480
tcgagaacgg tactttccca ttaatcagct atgggaaagt accgtttaaa ggtcacgttg 540
cattagtttc aatagcccat tgacgtcaat ggtgggaaag tacatggcgt tttaattaaa 600
ttggctggaa aaacccaatg actcacccct attgacctta tgtacgtgcc aataatggga 660
aaaacccatt gactcacccc ctattgacct tttgtactgg gcaaaaccca atggaaagtc 720
cctattgact cagtgtactt ggctccaatg ggactttcct gttgattcac ccctattgac 780
cttatgtact gggcaaaacc cattggaaag tccctaatga ctcagtatac gtgccagtaa 840
tgggaaaaac ccattggctt acctcccatt gaccttatgt actgggcaaa acccattgga 900
aagtccctat tgactcaatg tacttggctc caatgggact ttcctgttga ctcaccccct 960
attgacctta tgtactgggc aaaacccaat ggaaagtccc tattgagtca gtgtacttgg 1020
ctccaatggg tttttcccat tgactcatcc cctattgacc ttatgtactg ggcaaaaccc 1080
aatggaaagt ccctattgac gcagtgtact tggctccaat gggactttcc tgttgattca 1140
ccccctattg accttatgta ctgggcagaa tacaatggaa agtccctattgactcaccca 1200
cattgacctt atatgcttgc caacaatgga aaaacccatt ggaaagtccc tattgagtca 1260
gtgtacttgg cagcaatggg tttttcccat tggctcacct cccattgacc caatgtactt 1320
gggcaaaacc cagtggaaag tcccatttga ctcagtgtgc ttgccagtaa tgggaaaaac 1380
ccattggctt acctcccatt gacccaatgt acttgggtaa aggccattga gtcaccaccc 1440
ctatgctggg aaatggtgaa cgccccctat gtggaaagtc cctatgggcc gccattagag 1500
tgcatgaccg tgctgattca tatgccatat gagtgtatta gggggctttc cgcttgggaa 1560
attgggtaaa aagtccccgt attactcaca tagggggcgt ttggctttgc aaattagggg 1620
atttcagtgc atttggcatt aaaaactatt ggttctagtc ataaaacggg cggagttggg 1680
cgagctcgaa ttcaaacgac tcgacggtat caaggtggcg accggaatgg tgagctgcga 1740
gaatagccgg gcgcgctgtg agccgaagtc gcccccgccc tggccacttc cggcgcgccg 1800
agtccttagg ccgccagggg gcgccggcgc gcgcccagat tggggacaaa ggaagccggg 1860
ccggccgcgt tattaccata aaaggcaaac actggtcgga ggcgtccccg cggcgcgcgg 1920
caggaagcca ggccccaacc ccctcccaac cgggcgccag ccccgcctcc gcccggttca 1980
aacagcgacc gggtcgcgcg cgcgcacgca gcggccacac cctcgggcgc cagcggctcg 2040
ggcaggaagt ggcgcaagcg cccgggcccc agaacgcacg cgcgattagc gccattgagt 2100
cccagcgcgc acgcgcaatt agcgccaatt cccagcgcgc acgcagttag cgcccaaagg 2160
accagcgcgc acgcgcatgg cgccccagcc cccaccgggc ctgacggggg ctacgccgcg 2220
cccaccgtgc gatccccatt ggcaagagcc cggctcagac aaagaccccg ccggttgccc 2280
ccgccccgag agcggcaccc ccggagcgcg cccgcccgag cgcggcctcg cgcctgcgaa 2340
ctggcgtggg gtgtccccca tctccggagg cccaggggct tctcccgcgc cccccacggc 2400
ggtccggttc cgccccatgc gccccccgct gcggcccaga cggcggctct gcacgggcga 2460
agggccgcgg ccgcatgccc cggtcggctg gccgggctta cctggcggcg ggtgtggacg 2520
ggcggcggat cggcaaaggc gaggctctgt gctcgcgggc ggacgcggtc tcggcggtgg 2580
tggcgcgtcg cgccgctggg ttttataggg cgccgccgcg gccgctcgag ccataaaagg 2640
caactttcgg aacggcgcac gctgattggc cccgcgccgc tcactcaccg gcttcgccgc 2700
acagtgcagc atttttttac cccctctccc ctccttttgc gaaaaaaaaa aagagcgaga 2760
gcgagattga ggaagaggag gagggagagt tttggcgttg gccgccttgg ggtgctgggc 2820
ccgggggctg ggggcgcgcg ccgtggcccc cgcgccccac gctgggcagt gcccggttcg 2880
gccccgcatg gccaggcctg cccccggcct gcccgtctct cgggcccccc acccaccgcg 2940
ggacatccta ggtgtggaca tctcttgggc actgagcgcc caggtggggt gggccagggt 3000
ctgcacgggt gccagggccc tgggttctgt acgctcctgc agaaggagct cttggagggc 3060
atggagtggc caggcagtca ctcccccttg ccgacttcag agcaactgcc ctgaaagcag 3120
ggcctgagga cctctggctg tggggctcag ctagctaaat gtgctgggtg ggtcactagg 3180
gagagacctg ggcttgagag gtagagtgtg gtgttggggg agtcaggtgg cttgcggcca 3240
ttagagtcgc aggaccacac tccccaggac agggcagggg ccagcggtcc agtggctgga 3300
ggtggcccgt gatgaaggct acaaacctac ccagccgcag ccctgggaag gaagtgggct 3360
ctacagggca gggcaccttt taccctggag ctgcctgctt ttgagggtaa cagtcacgcc 3420
cagccaagac caggcctggg gcgttagtgg gtgacctagg cactgcgggg cgggggggct 3480
gggtctacac agcctgggtc tgggcccacc gtccgttgta tgtctgctat gcgcagccac 3540
agctgaactg ccctcccaga ccatctggag gccgctgggg gactctgggg accaagactc 3600
catgtgccac agaggattgg gggcggggcg gtgctaggaa ctcaaagcca gcctgggaag 3660
accctgtcct tgtcaccctt tcttgccttg ggtctgtcca ctgagtagca cacaagaccg 3720
ggtgggcagg gtccgttctg ctccgggaat cacagactgt gtgtacccag gtggtgggca 3780
tgcagcgatc agtggcgtgg gaccacagag ggggcccgcg gtacctaaaa cagcttcaca 3840
tggcttaaaa taggggacca atgtcttttc caatctaagt cccatttata ataaagtcca 3900
tgttccattt ttaaaggaca atcctttcgg tttaaaacca ggcacgatta cccaaacaac 3960
tcacaacggt aaagcactgt gaatcttctc tgttctgcaa tcccaacttg gtttctgctc 4020
agaaaccctc cctctttcca atcggtaatt aaataacaaa aggaaaaaac ttaagatgct 4080
tcaaccccgt ttcgtgacac tttgaaaaaa gaatcacctc ttgcaaacac ccgctcccga 4140
cccccgccgc tgaagcccgg cgtccagagg cctaagcgcg ggtgcccgcc cccacccggg 4200
agcgcgggcc tcgtggtcag cgcatccgcg gggagaaaca aaggccgcgg cacgggggct 4260
caagggcact gcgccacacc gcacgcgcct acccccgcgc ggccacgtta actggcggtc 4320
gccgcagcct cgggacagcc ggccgcgcgc cgccaggctc gcggacgcgg gaccacgcgc 4380
cgccctccgg gaggcccaag tctcgaccca gccccgcgtg gcgctggggg agggggcgcc 4440
tccgccggaa cgcgggtggg ggaggggagg gggaaatgcg ctttgtctcg aaatggggca 4500
accgtcgcca cagctcccta ccccctcgag ggcagagcag tccccccact aactaccggg 4560
ctggccgcgc gccaggccag ccgcgaggcc accgcccgac cctccactcc ttcccgcagc 4620
tcccggcgcg gggtccggcg agaaggggag gggaggggag cggagaaccg ggcccccggg 4680
acgcgtgtgg catctgaagc accaccagcg agcgagagct agagagaagg aaagccaccg 4740
acttcaccgc ctccgagctg ctccgggtcg cgggtctgca gcgtctccgg ccctccgcgc 4800
ctacagctca agccacatcc gaagggggag ggagccggga gctgcgcgcg gggccgccgg 4860
ggggaggggt ggcaccgccc acgccgggcg gccacgaagg gcggggcagc gggcgcgcgc 4920
gcggcggggg gaggggccgg cgccgcgccc gctgggaatt ggggccctag ggggagggcg 4980
gaggcgccga cgaccgcggc acttaccgtt cgcggcgtgg cgcccggtgg tccccaaggg 5040
gagggaaggg ggaggcgggg cgaggacagt gaccggagtc tcctcagcgg tggcttttct 5100
gcttggcagc ctcagcggct ggcgccaaaa ccggactccg cccacttcct cgcccgccgg 5160
tgcgagggtg tggaatcctc cagacgctgg gggaggggga gttgggagct taaaaactag 5220
tacccctttg ggaccacttt cagcagcgaa ctctcctgta caccaggggt cagttccaca 5280
gacgcgggcc aggggtgggt cattgcggcg tgaacaataa tttgactaga agttgattcg 5340
ggtgtttccg gaaggggccg agtcaatccg ccgagttggg gcacggaaaa caaaaaggga 5400
aggctactaa gatttttctg gcgggggtta tcattggcgt aactgcaggg accacctccc 5460
gggttgaggg ggctggatct ccaggctgcg gattaagccc ctcccgtcgg cgttaatttc 5520
aaactgcgcg acgtttctca cctgccttcg ccaaggcagg ggccgggacc ctattccaag 5580
aggtagtaac tagcaggact ctagccttcc gcaattcatt gagcgcattt acggaagtaa 5640
cgtcgggtac tgtctctggc cgcaagggtg ggaggagtac gcatttggcg taaggtgggg 5700
cgtagagcct tcccgccatt ggcggcggat agggcgttta cgcgacggcc tgacgtagcg 5760
gaagacgcgt tagtgggggg gaaggttcta gaaaagcggc ggcagcggct ctagcggcag 5820
tagcagcagc gccgggtccc gtgcggaggt gctcctcgca gagttgtttc tcgagcagcg 5880
gcagttctca ctacagcgcc aggacgagtc cggttcgtgt tcgtccgcgg agatctctct 5940
catctcgctc ggctgcggga aatcgggctg aagcgactga gtccgcgatg gaggtaacgg 6000
gtttgaaatc aatgagttat tgaaaagggc atggcgaggc cgttggcgcc tcagtggaag 6060
tcggccagcc gcctccgtgg gagagaggca ggaaatcgga ccaattcagt agcagtgggg 6120
cttaaggttt atgaacgggg tcttgagcgg aggcctgagc gtacaaacag cttccccacc 6180
ctcagcctcc cggcgccatt tcccttcact gggggtgggg gatggggagc tttcacatgg 6240
cggacgctgc cccgctgggg tgaaagtggg gcgcggaggc gggaattctt attccctttc 6300
taaagcacgc tgcttcgggg gccacggcgt ctcctcggcg agcgtttcgg cgggcagcag 6360
gtcctcgtga gcgaggctgc ggagcttccc ctccccctct ctcccgggaa ccgatttggc 6420
ggccgccatt ttcatggctc gccttcctct cagcgttttc cttataactc ttttattttc 6480
ttagtgtgct ttctctatca agaagtagaa gtggttaact attttttttt tcttctcggg 6540
ctgttttcat atcgtttcga ggtggatttg gagtgttttg tgagcttgga tctttagagt 6600
cctgcgcacc tcattaaagg cgctcagcct tcccctcgat gaaatggcgc cattgcgttc 6660
ggaagccaca ccgaagagcg gggagggggg gtgctccggg tttgcgggcc cggtttcaga 6720
gaagatatca ccacccaggg cgtcgggccg ggttcaatgc gagccgtagg acaaagaaac 6780
cattttatgt ttttcctgtc ttttttttcc tttgagtaac ggttttatct gggtctgcag 6840
tcagtaaaac gacagatgaa ccgcggcaaa ataaacataa attggaagcc atcggccacg 6900
aggggcaggg acgaaggtgg ttttctgggc gggggaggga tattcgcgtc agaatccttt 6960
actgttctta aggattccgt ttaagttgta gagctgactc attttaagta atgttgttac 7020
tgagaagttt aacccttacg ggacagatcc atggaccttt atagatgatt acgaggaaag 7080
tgaaataacg attttgtcct tagttatact tcgattaaaa catggcttca gaggctcctt 7140
cctgtaatgc gtatggattg atgtgcaaaa ctgttttggg cctgggccgc tctgtatttg 7200
aactttgtta cttttctcat tttgtttgca atcttggttg aacattacat tgataagcat 7260
aaggtctcaa gcgaaggggg tctacctggt tatttttctt tgaccctaag cacgtttata 7320
aaataacatt gtttaaaatc gatagtggac atcgggtaag tttggataaa ttgtgaggta 7380
agtaatgagt ttttgctttt tgttagtgat ttgtaaaact tgttataaat gtacattatc 7440
cgtaatttca gtttagagat aacctatgtg ctgacgacaa ttaagaataa aaactagctg 7500
aaaaaatgaa aataactatc gtgacaagta accatttcaa aagactgctt tgtgtctcat 7560
aggagctagt ttgatcattt cagttaattt tttctttaat ttttacgagt catgaaaact 7620
acaggaaaaa aaatctgaac tgggttttac cactactttt taggagttgg gagcatgcga 7680
atggagggag agctccgtag aactgggatg agagcagcaa ttaatgctgc ttgctaggaa 7740
caaaaaataa ttgattgaaa attacgtgtg actttttagt ttgcattatg cgtttgtagc 7800
agttggtcct ggatatcact ttctctcgtt tgaggttttt taacctagtt aacttttaag 7860
acaggtttcc ttaacattca taagtgccca gaatacagct gtgtagtaca gcatataaag 7920
atttcagctc tgaggttttt cctattgact tggaaaattg ttttgtgcct gtcgcttgcc 7980
acatggccaa tcaagtaagc ttattaatag taatcaatta cggggtcatt agttcatagc 8040
ccatatatgg agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc 8100
aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg 8160
actttccatt gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat 8220
caagtgtatc atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc 8280
tggcattatg cccagtacat gaccttatgg gactttccta cttggcagta catctacgta 8340
ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag 8400
cggtttgact cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt 8460
tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa 8520
atgggcggta ggcgtgtacg gtgggaggtc tatataagca gagctggttt agtgaaccgt 8580
cagatcggat ccgcctgaga aaggaagtga gctgtaaagg ctgagctctc tctctgacgt 8640
atgtagcctc tggttagctt cgtcactcac tgttcttgac tcagcatggc aatctgatga 8700
aatcccagct gtaagtctgc agaaattgat gatctattaa acaataaaga tgtccactaa 8760
aatggaagtt tttcctgtca tactttgtta agaagggtga gaacagagta cctacatttt 8820
gaatggaagg attggagcta cgggggtggg ggtggggtgg gattagataa atgcctgctc 8880
tttactgaag gctctttact attgctttat gataatgttt catagttgga tatcataatt 8940
taaacaagca aaaccaaatt aagggccagc tcattcctcc agatccacta gttctagagc 9000
aaattctacc gggtagggga ggcgcttttc ccaaggcagt ctggagcatg cgctttagca 9060
gccccgctgg gcacttggcg ctacacaagt ggcctctggc ctcgcacaca ttccacatcc 9120
accggtaggc gccaaccggc tccgttcttt ggtggcccct tcgcgccacc ttctactcct 9180
cccctagtca ggaagttccc ccccgccccg cagctcgcgt cgtgcaggac gtgacaaatg 9240
gaagtagcac gtctcactag tctcgtgcag atggacagca ccgctgagca atggaagcgg 9300
gtaggccttt ggggcagcgg ccaatagcag ctttgctcct tcgctttctg ggctcagagg 9360
ctgggaaggg gtgggtccgg gggcgggctc aggggcgggc tcaggggcgg ggcgggcgcc 9420
cgaaggtcct ccggaggccc ggcattctgc acgcttcaaa agcgcacgtc tgccgcgctg 9480
ttctcctctt cctcatctcc gggcctttcg accagcttac catgaccgag tacaagccca 9540
cggtgcgcct cgccacccgc gacgacgtcc ccagggccgt acgcaccctc gccgccgcgt 9600
tcgccgacta ccccgccacg cgccacaccg tcgatccgga ccgccacatc gagcgggtca 9660
ccgagctgca agaactcttc ctcacgcgcg tcgggctcga catcggcaag gtgtgggtcg 9720
cggacgacgg cgccgcggtg gcggtctgga ccacgccgga gagcgtcgaa gcgggggcgg 9780
tgttcgccga gatcggcccg cgcatggccg agttgagcgg ttcccggctg gccgcgcaga 9840
acagatggaa ggcctcctgg cgccgcaccg gcccaaggag cccgcgtggt tcctggccac 9900
cgtcgcgtct cgcccgacca ccagggcaag ggtctgggca gcgccgtcgt gctccccgga 9960
gtggaggcgg ccgagcgcgc cggggtgccc gccttcctgg agacctccgc gccccgcaac 10020
ctccccttct acgagcggct cggcttcacc gtcaccgccg acgtcgaggt gcccgaagga 10080
ccgcgcacct ggtgcatgac ccgcaagccc ggtgcctgac gcccgcccca cgacccgcag 10140
cgcccgaccg aaaggagcgc acgaccccat gcataggttg ggcttcggaa tcgttttccg 10200
ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc 10260
caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 10320
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 10380
ttatcatgtc tgtataccgt cgagatctag agcggccgcc accgcggtgg agctccagct 10440
tttgttccct ttagtgaggg ttaatttcga gcttggcgta atcatggtca tagctgtttc 10500
ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt 10560
gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc 10620
ccgctttcca gtcgggaaac ctgtcgtgcc agggggtacc taggccgggc aacaattggc 10680
ggccggccgc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 10740
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 10800
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 10860
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 10920
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 10980
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 11040
cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc 11100
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 11160
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 11220
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 11280
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 11340
tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact 11400
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 11460
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 11520
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 11580
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 11640
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccctaggc cgggcaacaa 11700
ttggcggccg gccctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 11760
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 11820
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 11880
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 11940
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 12000
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 12060
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 12120
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 12180
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 12240
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 12300
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 12360
gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa 12420
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 12480
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 12540
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact c 12591
<210>8
<211>11160
<212>DNA
<213>载体
<400>8
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgacggtatc aaggtggcga ccggaatggt 300
gagctgcgag aatagccggg cgcgctgtga gccgaagtcg cccccgccct ggccacttcc 360
ggcgcgccga gtccttaggc cgccaggggg cgccggcgcg cgcccagatt ggggacaaag 420
gaagccgggc cggccgcgtt attaccataa aaggcaaaca ctggtcggag gcgtccccgc 480
ggcgcgcggc aggaagccag gccccaaccc cctcccaacc gggcgccagc cccgcctccg 540
cccggttcaa acagcgaccg ggtcgcgcgc gcgcacgcag cggccacacc ctcgggcgcc 600
agcggctcgg gcaggaagtg gcgcaagcgc ccgggcccca gaacgcacgc gcgattagcg 660
ccattgagtc ccagcgcgca cgcgcaatta gcgccaattc ccagcgcgca cgcagttagc 720
gcccaaagga ccagcgcgca cgcgcatggc gccccagccc ccaccgggcc tgacgggggc 780
tacgccgcgc ccaccgtgcg atccccattg gcaagagccc ggctcagaca aagaccccgc 840
cggttgcccc cgccccgaga gcggcacccc cggagcgcgc ccgcccgagc gcggcctcgc 900
gcctgcgaac tggcgtgggg tgtcccccat ctccggaggc ccaggggctt ctcccgcgcc 960
ccccacggcg gtccggttcc gccccatgcg ccccccgctg cggcccagac ggcggctctg 1020
cacgggcgaa gggccgcggc cgcatgcccc ggtcggctgg ccgggcttac ctggcggcgg 1080
gtgtggacgg gcggcggatc ggcaaaggcg aggctctgtg ctcgcgggcg gacgcggtct 1140
cggcggtggt ggcgcgtcgc gccgctgggt tttatagggc gccgccgcgg ccgctcgagc 1200
cataaaaggc aactttcgga acggcgcacg ctgattggcc ccgcgccgct cactcaccgg 1260
cttcgccgca cagtgcagca tttttttacc ccctctcccc tccttttgcg aaaaaaaaaa 1320
agagcgagag cgagattgag gaagaggagg agggagagtt ttggcgttgg ccgccttggg 1380
gtgctgggcc cgggggctgg gggcgcgcgc cgtggccccc gcgccccacg ctgggcagtg 1440
cccggttcgg ccccgcatgg ccaggcctgc ccccggcctg cccgtctctc gggcccccca 1500
cccaccgcgg gacatcctag gtgtggacat ctcttgggca ctgagcgccc aggtggggtg 1560
ggccagggtc tgcacgggtg ccagggccct gggttctgta cgctcctgca gaaggagctc 1620
ttggagggca tggagtggcc aggcagtcac tcccccttgc cgacttcaga gcaactgccc 1680
tgaaagcagg gcctgaggac ctctggctgt ggggctcagc tagctaaatg tgctgggtgg 1740
gtcactaggg agagacctgg gcttgagagg tagagtgtgg tgttggggga gtcaggtggc 1800
ttgcggccat tagagtcgca ggaccacact ccccaggaca gggcaggggc cagcggtcca 1860
gtggctggag gtggcccgtg atgaaggcta caaacctacc cagccgcagc cctgggaagg 1920
aagtgggctc tacagggcag ggcacctttt accctggagc tgcctgcttt tgagggtaac 1980
agtcacgccc agccaagacc aggcctgggg cgttagtggg tgacctaggc actgcggggc 2040
gggggggctg ggtctacaca gcctgggtct gggcccaccg tccgttgtat gtctgctatg 2100
cgcagccaca gctgaactgc cctcccagac catctggagg ccgctggggg actctgggga 2160
ccaagactcc atgtgccaca gaggattggg ggcggggcgg tgctaggaac tcaaagccag 2220
cctgggaaga ccctgtcctt gtcacccttt cttgccttgg gtctgtccac tgagtagcac 2280
acaagaccgg gtgggcaggg tccgttctgc tccgggaatc acagactgtg tgtacccagg 2340
tggtgggcat gcagcgatca gtggcgtggg accacagagg gggcccgcgg tacctaaaac 2400
agcttcacat ggcttaaaat aggggaccaa tgtcttttcc aatctaagtc ccatttataa 2460
taaagtccat gttccatttt taaaggacaa tcctttcggt ttaaaaccag gcacgattac 2520
ccaaacaact cacaacggta aagcactgtg aatcttctct gttctgcaat cccaacttgg 2580
tttctgctca gaaaccctcc ctctttccaa tcggtaatta aataacaaaa ggaaaaaact 2640
taagatgctt caaccccgtt tcgtgacact ttgaaaaaag aatcacctct tgcaaacacc 2700
cgctcccgac ccccgccgct gaagcccggc gtccagaggc ctaagcgcgg gtgcccgccc 2760
ccacccggga gcgcgggcct cgtggtcagc gcatccgcgg ggagaaacaa aggccgcggc 2820
acgggggctc aagggcactg cgccacaccg cacgcgccta cccccgcgcg gccacgttaa 2880
ctggcggtcg ccgcagcctc gggacagccg gccgcgcgcc gccaggctcg cggacgcggg 2940
accacgcgcc gccctccggg aggcccaagt ctcgacccag ccccgcgtgg cgctggggga 3000
gggggcgcct ccgccggaac gcgggtgggg gaggggaggg ggaaatgcgc tttgtctcga 3060
aatggggcaa ccgtcgccac agctccctac cccctcgagg gcagagcagt ccccccacta 3120
actaccgggc tggccgcgcg ccaggccagc cgcgaggcca ccgcccgacc ctccactcct 3180
tcccgcagct cccggcgcgg ggtccggcga gaaggggagg ggaggggagc ggagaaccgg 3240
gcccccggga cgcgtgtggc atctgaagca ccaccagcga gcgagagcta gagagaagga 3300
aagccaccga cttcaccgcc tccgagctgc tccgggtcgc gggtctgcag cgtctccggc 3360
cctccgcgcc tacagctcaa gccacatccg aagggggagg gagccgggag ctgcgcgcgg 3420
ggccgccggg gggaggggtg gcaccgccca cgccgggcgg ccacgaaggg cggggcagcg 3480
ggcgcgcgcg cggcgggggg aggggccggc gccgcgcccg ctgggaattg gggccctagg 3540
gggagggcgg aggcgccgac gaccgcggca cttaccgttc gcggcgtggc gcccggtggt 3600
ccccaagggg agggaagggg gaggcggggc gaggacagtg accggagtct cctcagcggt 3660
ggcttttctg cttggcagcc tcagcggctg gcgccaaaac cggactccgc ccacttcctc 3720
gcccgccggt gcgagggtgt ggaatcctcc agacgctggg ggagggggag ttgggagctt 3780
aaaaactagt acccctttgg gaccactttc agcagcgaac tctcctgtac accaggggtc 3840
agttccacag acgcgggcca ggggtgggtc attgcggcgt gaacaataat ttgactagaa 3900
gttgattcgg gtgtttccgg aaggggccga gtcaatccgc cgagttgggg cacggaaaac 3960
aaaaagggaa ggctactaag atttttctgg cgggggttat cattggcgta actgcaggga 4020
ccacctcccg ggttgagggg gctggatctc caggctgcgg attaagcccc tcccgtcggc 4080
gttaatttca aactgcgcga cgtttctcac ctgccttcgc caaggcaggg gccgggaccc 4140
tattccaaga ggtagtaact agcaggactc tagccttccg caattcattg agcgcattta 4200
cggaagtaac gtcgggtact gtctctggcc gcaagggtgg gaggagtacg catttggcgt 4260
aaggtggggc gtagagcctt cccgccattg gcggcggata gggcgtttac gcgacggcct 4320
gacgtagcgg aagacgcgtt agtggggggg aaggttctag aaaagcggcg gcagcggctc 4380
tagcggcagt agcagcagcg ccgggtcccg tgcggaggtg ctcctcgcag agttgtttct 4440
cgagcagcgg cagttctcac tacagcgcca ggacgagtcc ggttcgtgtt cgtccgcgga 4500
gatctctctc atctcgctcg gctgcgggaa atcgggctga agcgactgag tccgcgatgg 4560
aggtaacggg tttgaaatca atgagttatt gaaaagggca tggcgaggcc gttggcgcct 4620
cagtggaagt cggccagccg cctccgtggg agagaggcag gaaatcggac caattcagta 4680
gcagtggggc ttaaggttta tgaacggggt cttgagcgga ggcctgagcg tacaaacagc 4740
ttccccaccc tcagcctccc ggcgccattt cccttcactg ggggtggggg atggggagct 4800
ttcacatggc ggacgctgcc ccgctggggt gaaagtgggg cgcggaggcg ggaattctta 4860
ttccctttct aaagcacgct gcttcggggg ccacggcgtc tcctcggcga gcgtttcggc 4920
gggcagcagg tcctcgtgag cgaggctgcg gagcttcccc tccccctctc tcccgggaac 4980
cgatttggcg gccgccattt tcatggctcg ccttcctctc agcgttttcc ttataactct 5040
tttattttct tagtgtgctt tctctatcaa gaagtagaag tggttaacta tttttttttt 5100
cttctcgggc tgttttcata tcgtttcgag gtggatttgg agtgttttgt gagcttggat 5160
ctttagagtc ctgcgcacct cattaaaggc gctcagcctt cccctcgatg aaatggcgcc 5220
attgcgttcg gaagccacac cgaagagcgg ggaggggggg tgctccgggt ttgcgggccc 5280
ggtttcagag aagatatcac cacccagggc gtcgggccgg gttcaatgcg agccgtagga 5340
caaagaaacc attttatgtt tttcctgtct tttttttcct ttgagtaacg gttttatctg 5400
ggtctgcagt cagtaaaacg acagatgaac cgcggcaaaa taaacataaa ttggaagcca 5460
tcggccacga ggggcaggga cgaaggtggt tttctgggcg ggggagggat attcgcgtca 5520
gaatccttta ctgttcttaa ggattccgtt taagttgtag agctgactca ttttaagtaa 5580
tgttgttact gagaagttta acccttacgg gacagatcca tggaccttta tagatgatta 5640
cgaggaaagt gaaataacga ttttgtcctt agttatactt cgattaaaac atggcttcag 5700
aggctccttc ctgtaatgcg tatggattga tgtgcaaaac tgttttgggc ctgggccgct 5760
ctgtatttga actttgttac ttttctcatt ttgtttgcaa tcttggttga acattacatt 5820
gataagcata aggtctcaag cgaagggggt ctacctggtt atttttcttt gaccctaagc 5880
acgtttataa aataacattg tttaaaatcg atagtggaca tcgggtaagt ttggataaat 5940
tgtgaggtaa gtaatgagtt tttgcttttt gttagtgatt tgtaaaactt gttataaatg 6000
tacattatcc gtaatttcag tttagagata acctatgtgc tgacgacaat taagaataaa 6060
aactagctga aaaaatgaaa ataactatcg tgacaagtaa ccatttcaaa agactgcttt 6120
gtgtctcata ggagctagtt tgatcatttc agttaatttt ttctttaatt tttacgagtc 6180
atgaaaacta caggaaaaaa aatctgaact gggttttacc actacttttt aggagttggg 6240
agcatgcgaa tggagggaga gctccgtaga actgggatga gagcagcaat taatgctgct 6300
tgctaggaac aaaaaataat tgattgaaaa ttacgtgtga ctttttagtt tgcattatgc 6360
gtttgtagca gttggtcctg gatatcactt tctctcgttt gaggtttttt aacctagtta 6420
acttttaaga caggtttcct taacattcat aagtgcccag aatacagctg tgtagtacag 6480
catataaaga tttcagctct gaggtttttc ctattgactt ggaaaattgt tttgtgcctg 6540
tcgcttgcca catggccaat caagtaagct tattaatagt aatcaattac ggggtcatta 6600
gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 6660
tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 6720
ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 6780
gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 6840
tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 6900
atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg 6960
cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg 7020
agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca 7080
ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta 7140
gtgaaccgtc agatcggatc cgcctgagaa aggaagtgag ctgtaaaggc tgagctctct 7200
ctctgacgta tgtagcctct ggttagcttc gtcactcact gttcttgact cagcatggca 7260
atctgatgaa atcccagctg taagtctgca gaaattgatg atctattaaa caataaagat 7320
gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 7380
ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 7440
tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 7500
atcataattt aaacaagcaa aaccaaatta agggccagct cattcctcca gatccactag 7560
ttctagagca aattctaccg ggtaggggag gcgcttttcc caaggcagtc tggagcatgc 7620
gctttagcag ccccgctggg cacttggcgc tacacaagtg gcctctggcc tcgcacacat 7680
tccacatcca ccggtaggcg ccaaccggct ccgttctttg gtggcccctt cgcgccacct 7740
tctactcctc ccctagtcag gaagttcccc cccgccccgc agctcgcgtc gtgcaggacg 7800
tgacaaatgg aagtagcacg tctcactagt ctcgtgcaga tggacagcac cgctgagcaa 7860
tggaagcggg taggcctttg gggcagcggc caatagcagc tttgctcctt cgctttctgg 7920
gctcagaggc tgggaagggg tgggtccggg ggcgggctca ggggcgggct caggggcggg 7980
gcgggcgccc gaaggtcctc cggaggcccg gcattctgca cgcttcaaaa gcgcacgtct 8040
gccgcgctgt tctcctcttc ctcatctccg ggcctttcga ccagcttacc atgaccgagt 8100
acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta cgcaccctcg 8160
ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac cgccacatcg 8220
agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac atcggcaagg 8280
tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag agcgtcgaag 8340
cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt tcccggctgg 8400
ccgcgcagaa cagatggaag gcctcctggc gccgcaccgg cccaaggagc ccgcgtggtt 8460
cctggccacc gtcgcgtctc gcccgaccac cagggcaagg gtctgggcag cgccgtcgtg 8520
ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg ccttcctgga gacctccgcg 8580
ccccgcaacc tccccttcta cgagcggctc ggcttcaccg tcaccgccga cgtcgaggtg 8640
cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg gtgcctgacg cccgccccac 8700
gacccgcagc gcccgaccga aaggagcgca cgaccccatg cataggttgg gcttcggaat 8760
cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc tggagttctt 8820
cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 8880
aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 8940
caatgtatct tatcatgtct gtataccgtc gagatctaga gcggccgcca ccgcggtgga 9000
gctccagctt ttgttccctt tagtgagggt taatttcgag cttggcgtaa tcatggtcat 9060
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 9120
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 9180
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gggggtacct aggccgggca 9240
acaattggcg gccggccgca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 9300
tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 9360
ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 9420
ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 9480
tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 9540
gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 9600
gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 9660
acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 9720
tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 9780
caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 9840
gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 9900
cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 9960
tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 10020
agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 10080
tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 10140
ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 10200
acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accctaggcc 10260
gggcaacaat tggcggccgg ccctgcatta atgaatcggc caacgcgcgg ggagaggcgg 10320
tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 10380
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 10440
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 10500
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 10560
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 10620
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 10680
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 10740
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 10800
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 10860
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 10920
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc 10980
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 11040
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 11100
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 11160
<210>9
<211>14262
<212>DNA
<213>载体
<220>
<221>misc_特征
<222>13483
<223>n=A,T,C或G
<400>9
ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat 60
tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa 120
aggaagagta tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt 180
tgccttcctg tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag 240
ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt 300
tttcgccccg aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg 360
gtattatccc gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag 420
aatgacttgg ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta 480
agagaattat gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg 540
acaacgatcg gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta 600
actcgccttg atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac 660
accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt 720
actctagctt cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca 780
cttctgcgct cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag 840
cgtgggtctc gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta 900
gttatctaca cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag 960
ataggtgcct cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt 1020
tagattgatt taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat 1080
aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta 1140
gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 1200
acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 1260
tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag 1320
ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 1380
atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca 1440
agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 1500
cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 1560
agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 1620
acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 1680
gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 1740
ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 1800
gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt 1860
gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag 1920
gaagcggaag agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa 1980
tgcagctggc acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat 2040
gtgagttagc tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg 2100
ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac 2160
gccaagcgcg caattaaccc tcactaaagg gaacaaaagc tgggtaccgg gccccccctc 2220
gaggtcgacg gtatcgataa gcttcaatgt ttttagcacc ctctgtgtgg aggaaaataa 2280
tgcagattat tctaattagt gtaatatcta accacattaa aatatattac atagtaaact 2340
acactccata attttataaa tttgactccc cagggtaata aactagtctc tagtctgctc 2400
accttcaact gtacaataaa gtcttggttc ttttgaaata gacctcaaat gagacaccta 2460
aaattcaaag tgtctttaca tttaaagaca cctacaggaa agcaggtaaa agagccaggt 2520
taaaaacaaa ttctaaaacc acttagctgc agttaaacat atagtaaaga tgcactaaag 2580
tttcttactc tgtaaatccc ttccacttca ggaaatattc cactttccca ttcactacac 2640
gtcgatctag tactttttcc acgacaaatt cttcaggctc tgcctcttca acttttttac 2700
tctttccatt ctgttttttt cccatttttt gctaaaataa aacaaaagag aaattaagaa 2760
atattcctct tgaattttga gcacattttc aaggctcaat tgcttatatt attatcacat 2820
tcgacataaa tttttacttc tatatcccag ggcagacacc ttctggaaag attaaaagtc 2880
aacagacaat aaaataaaag aatgctttat cttgttcatt tagttcaaac ttacaaccca 2940
ccaccaaaat aatacaataa aaaaacacta tctggaaaca gttatttttt tccagtcttt 3000
ttttttgaga cagggtctca cactcttgtc gcccaggctg gagtgcagtg gcgtgatctc 3060
agctcactgc aacctccgcc tccccaggtt caagcagttc tcatgcctca gcctccagag 3120
tagctgggat tataggcgga tgccaccatg ccgggctaat tttttttgtg tttttattag 3180
aaacagggtt tcaccatgtt gaccaggctg gtctcaaact cctgacctga agtgattcac 3240
cagcctgggc ctcccaaagt gctggcatta caggcgtgag ccactgcgcc cggccctgta 3300
gtcttaaaag accaagttta ctaattttca ctcattttaa caacactgca acaaacaact 3360
atgcaggaag tacctaaagg gtgatccaga gaagcaagta gtagtgacag gtcttaggtg 3420
aacctatgac agaccttgta tccaccccca gatggtaaaa gccccagccc ccttctcaat 3480
tcaaatatta atgtcaaaag catcaatgat acagagaaaa gataaatgca gaatgaaaac 3540
atggttcaaa atcctgatac caactgcagg gtcaactata gagaccacta ggaggttcaa 3600
ttaaaggaca agattatttt tccataatct ctgtagataa tatttcctac cacttagaac 3660
aaaactataa agctatcact tcaagagacc aacattacaa atttatttta attccctaag 3720
gtgaaaaaaa tccttccttc ctggtttctc aagagaaagt ctatactggt aaccaaattc 3780
actttaaaca ggcattttct ttggtatgac actatttaag agaagcagga aaccaacgtg 3840
aaccagctct ttccaatggc tcaagatttc ctatgagagg actaaaaatg gggaaaattt 3900
ttatgagagg attaaaaatg ggggaaaaaa aaccctgaaa tggttaatca gaagatccta 3960
tgggctgaga aggaatccat cttaacattt catcttaaag caaatgctat tgccgggggc 4020
agtggctcat gcctgtaatc ccagcacttt gggaggccga ggtgggcaga tcatctgagg 4080
tcaggagttt gagaccagcc tgaccaacat ggagaaaccc cgtttctact aaaaatacaa 4140
aattagccag gcatagtggt gcatgcctgt aatcccagct acttgggagg ctgaggcagg 4200
agaactgctt gaacccagga ggcttaagtt gcggtgagcc aagatcacgc cattgcactc 4260
tagcctggac aacaagagaa aaactctgtc tcaaaaaaac acaaaaacaa aaaacccaaa 4320
tactatttaa aaaagataaa ccttaattgc tcaatcatta aagccatccc acaagtaaag 4380
cagcaagcag aaaaaagtta agaacacctc aaggctacag aaggacattt caagctatgc 4440
aggcatatga agtgtgcaga cagatatgta agaaaggcct caagactgca aaagggcatt 4500
tcaagctatg caagcatata ggtaacacat acacacacac aaaataaaat cccctgaaat 4560
acaaaaacat gcagcaaaca cctgacgttt ttggatacca tttctaagtc aggtgttatg 4620
attctcatta gtcaagatac ttgagtactg ggcccaaaca gctttctgcc actgtacagt 4680
acaagaaggt aggaataatg gtgggaggag caaagacaaa ctgtaataga cagaagtgta 4740
tcagatacct atactacatg aaaaacaaaa cagctactgc cacaaaggga gaaggctaac 4800
aaaataaagt caacaataaa tacagaaaat gaaaaggata cacactaagg tttacaaaaa 4860
aaaaaaggca gacaaaatgc catacagtat tcattcacta ctatggcatt cataagctag 4920
tttcaaatgc tcactatttt cttttatagt atatatttgc cttaacccag cacttttttc 4980
caaaagtgga tgagtcaaaa taaatttccc attatttaag tgaaattaac agcacacata 5040
tctcacaaca ctaatgaatt tttaaaatgg aaagttaaga acttttaaag tggccaacct 5100
gtgatccttc acaaaataaa ctaaatacaa taacagaccc caaaggctat caattgcgtg 5160
caaaaacaac ttctgttttc cagggtaaac agaatctaat gcagaatcta atgcagggta 5220
aacagactta atgcagaatc taatgatggc acaaattaaa aatcactaac gtgccctttt 5280
tagtgtgaaa cccagagaga gcacatacaa gccaaaaaca aatgctttat tttacctagg 5340
agacattaac attcaccttt acgtgtttaa gattaatgca atgttaaata ttgtgaaaac 5400
tgtaactttg aatttcatga tttttatgtg aatattccag ggtttaaaaa aacttgtaac 5460
atgacatggc tgaataagat aaaaaaaaaa tctagccttt tctcccttct ggctcatatt 5520
tgcgatttcg atcattttgt ttaaaaaaca aaacactgca atgaattaaa cttaatattc 5580
ttctatgttt tagagtaagt taaaacaaga taaagtgacc aaagtaattt gaaagattca 5640
atgacttttg ctccaaccta ggtgcacaag gtaccttgtt ctttaaattg ggctttaatg 5700
aaaatacttc tccagaattc tggggattta agaaaaatta tgccaaccaa caagggcttt 5760
accattttat gtaacatttt tcaacgctgc aaaaatgtgt gtatttctat ttgaagataa 5820
aaatcctcag caaaatccac attgcactgt ccttcaaaga ttagccttct ttgaactagt 5880
taagacacta ttaagccaag ccagtatctc cctgtaatga attcgttttt ctcttaattt 5940
tcccctgtaa tttacactgg gagagctggg aaatatgtgg atgtaaattt ctcagccaca 6000
gagatgcaaa gttatactgt ggggaaaaaa aacttgagtt aaatccttac atattttagg 6060
ttttcattaa cttaccaatg tagttttgtt ggaggccatt ttttttattg cagacttgaa 6120
gagctattac tagaaaaatg catgacagtt aaggtaagtt tgcatgacac aaaaaaggta 6180
actaaataca aattctgttt ggattccaac ccccaagtag agagcgcaca ctttcaaacg 6240
tgaatacaaa tccagagtag atctgcgctc ctacctacat tgcttatgat gtacttaagt 6300
acgtgtccta accatgtgag tctagaaaga ctttactggg gatcctggta cctaaaacag 6360
cttcacatgg cttaaaatag gggaccaatg tcttttccaa tctaagtccc atttataata 6420
aagtccatgt tccattttta aaggacaatc ctttcggttt aaaaccaggc acgattaccc 6480
aaacaactca caacggtaaa gcactgtgaa tcttctctgt tctgcaatcc caacttggtt 6540
tctgctcaga aaccctccct ctttccaatc ggtaattaaa taacaaaagg aaaaaactta 6600
agatgcttca accccgtttc gtgacacttt gaaaaaagaa tcacctcttg caaacacccg 6660
ctcccgaccc ccgccgctga agcccggcgt ccagaggcct aagcgcgggt gcccgccccc 6720
acccgggagc gcgggcctcg tggtcagcgc atccgcgggg agaaacaaag gccgcggcac 6780
gggggctcaa gggcactgcg ccacaccgca cgcgcctacc cccgcgcggc cacgttaact 6840
ggcggtcgcc gcagcctcgg gacagccggc cgcgcgccgc caggctcgcg gacgcgggac 6900
cacgcgccgc cctccgggag gcccaagtct cgacccagcc ccgcgtggcg ctgggggagg 6960
gggcgcctcc gccggaacgc gggtggggga ggggaggggg aaatgcgctt tgtctcgaaa 7020
tggggcaacc gtcgccacag ctccctaccc cctcgagggc agagcagtcc ccccactaac 7080
taccgggctg gccgcgcgcc aggccagccg cgaggccacc gcccgaccct ccactccttc 7140
ccgcagctcc cggcgcgggg tccggcgaga aggggagggg aggggagcgg agaaccgggc 7200
ccccgggacg cgtgtggcat ctgaagcacc accagcgagc gagagctaga gagaaggaaa 7260
gccaccgact tcaccgcctc cgagctgctc cgggtcgcgg gtctgcagcg tctccggccc 7320
tccgcgccta cagctcaagc cacatccgaa gggggaggga gccgggagct gcgcgcgggg 7380
ccgccggggg gaggggtggc accgcccacg ccgggcggcc acgaagggcg gggcagcggg 7440
cgcgcgcgcg gcggggggag gggccggcgc cgcgcccgct gggaattggg gccctagggg 7500
gagggcggag gcgccgacga ccgcggcact taccgttcgc ggcgtggcgc ccggtggtcc 7560
ccaaggggag ggaaggggga ggcggggcga ggacagtgac cggagtctcc tcagcggtgg 7620
cttttctgct tggcagcctc agcggctggc gccaaaaccg gactccgccc acttcctcgc 7680
ccgccggtgc gagggtgtgg aatcctccag acgctggggg agggggagtt gggagcttaa 7740
aaactagtac ccctttggga ccactttcag cagcgaactc tcctgtacac caggggtcag 7800
ttccacagac gcgggccagg ggtgggtcat tgcggcgtga acaataattt gactagaagt 7860
tgattcgggt gtttccggaa ggggccgagt caatccgccg agttggggca cggaaaacaa 7920
aaagggaagg ctactaagat ttttctggcg ggggttatca ttggcgtaac tgcagggacc 7980
acctcccggg ttgagggggc tggatctcca ggctgcggat taagcccctc ccgtcggcgt 8040
taatttcaaa ctgcgcgacg tttctcacct gccttcgcca aggcaggggc cgggacccta 8100
ttccaagagg tagtaactag caggactcta gccttccgca attcattgag cgcatttacg 8160
gaagtaacgt cgggtactgt ctctggccgc aagggtggga ggagtacgca tttggcgtaa 8220
ggtggggcgt agagccttcc cgccattggc ggcggatagg gcgtttacgc gacggcctga 8280
cgtagcggaa gacgcgttag tgggggggaa ggttctagaa aagcggcggc agcggctcta 8340
gcggcagtag cagcagcgcc gggtcccgtg cggaggtgct cctcgcagag ttgtttctcg 8400
agcagcggca gttctcacta cagcgccagg acgagtccgg ttcgtgttcg tccgcggaga 8460
tctctctcat ctcgctcggc tgcgggaaat cgggctgaag cgactgagtc cgcgatggag 8520
gtaacgggtt tgaaatcaat gagttattga aaagggcatg gcgaggccgt tggcgcctca 8580
gtggaagtcg gccagccgcc tccgtgggag agaggcagga aatcggacca attcagtagc 8640
agtggggctt aaggtttatg aacggggtct tgagcggagg cctgagcgta caaacagctt 8700
ccccaccctc agcctcccgg cgccatttcc cttcactggg ggtgggggat ggggagcttt 8760
cacatggcgg acgctgcccc gctggggtga aagtggggcg cggaggcggg aattcttatt 8820
ccctttctaa agcacgctgc ttcgggggcc acggcgtctc ctcggcgagc gtttcggcgg 8880
gcagcaggtc ctcgtgagcg aggctgcgga gcttcccctc cccctctctc ccgggaaccg 8940
atttggcggc cgccattttc atggctcgcc ttcctctcag cgttttcctt ataactcttt 9000
tattttctta gtgtgctttc tctatcaaga agtagaagtg gttaactatt ttttttttct 9060
tctcgggctg ttttcatatc gtttcgaggt ggatttggag tgttttgtga gcttggatct 9120
ttagagtcct gcgcacctca ttaaaggcgc tcagccttcc cctcgatgaa atggcgccat 9180
tgcgttcgga agccacaccg aagagcgggg agggggggtg ctccgggttt gcgggcccgg 9240
tttcagagaa gatatcacca cccagggcgt cgggccgggt tcaatgcgag ccgtaggaca 9300
aagaaaccat tttatgtttt tcctgtcttt tttttccttt gagtaacggt tttatctggg 9360
tctgcagtca gtaaaacgac agatgaaccg cggcaaaata aacataaatt ggaagccatc 9420
ggccacgagg ggcagggacg aaggtggttt tctgggcggg ggagggatat tcgcgtcaga 9480
atcctttact gttcttaagg attccgttta agttgtagag ctgactcatt ttaagtaatg 9540
ttgttactga gaagtttaac ccttacggga cagatccatg gacctttata gatgattacg 9600
aggaaagtga aataacgatt ttgtccttag ttatacttcg attaaaacat ggcttcagag 9660
gctccttcct gtaatgcgta tggattgatg tgcaaaactg ttttgggcct gggccgctct 9720
gtatttgaac tttgttactt ttctcatttt gtttgcaatc ttggttgaac attacattga 9780
taagcataag gtctcaagcg aagggggtct acctggttat ttttctttga ccctaagcac 9840
gtttataaaa taacattgtt taaaatcgat agtggacatc gggtaagttt ggataaattg 9900
tgaggtaagt aatgagtttt tgctttttgt tagtgatttg taaaacttgt tataaatgta 9960
cattatccgt aatttcagtt tagagataac ctatgtgctg acgacaatta agaataaaaa 10020
ctagctgaaa aaatgaaaat aactatcgtg acaagtaacc atttcaaaag actgctttgt 10080
gtctcatagg agctagtttg atcatttcag ttaatttttt ctttaatttt tacgagtcat 10140
gaaaactaca ggaaaaaaaa tctgaactgg gttttaccac tactttttag gagttgggag 10200
catgcgaatg gagggagagc tccgtagaac tgggatgaga gcagcaatta atgctgcttg 10260
ctaggaacaa aaaataattg attgaaaatt acgtgtgact ttttagtttg cattatgcgt 10320
ttgtagcagt tggtcctgga tatcactttc tctcgtttga ggttttttaa cctagttaac 10380
ttttaagaca ggtttcctta acattcataa gtgcccagaa tacagctgtg tagtacagca 10440
tataaagatt tcagctctga ggtttttcct attgacttgg aaaattgttt tgtgcctgtc 10500
gcttgccaca tggccaatca agtaagcttg attaatagta atcaattacg gggtcattag 10560
ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 10620
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 10680
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 10740
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 10800
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 10860
tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 10920
gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 10980
gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 11040
tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag 11100
tgaaccgtca gatccgctag ccggtcgcca ccatggtgag caagggcgag gagctgttca 11160
ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg 11220
tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca 11280
ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc tacggcgtgc 11340
agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc 11400
ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc 11460
gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg 11520
acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac aacagccaca 11580
acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc aagatccgcc 11640
acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg 11700
gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca 11760
aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga 11820
tcactctcgg catggacgag ctgtacaagt aaagcggccg cgactctaga tcataatcag 11880
ccataccaca tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa 11940
cctgaaacat aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg 12000
ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc 12060
tagttgtggt ttgtccaaac tcatcaatgt atcttaaatc gaattctacc gggtagggga 12120
ggcgcttttc ccaaggcagt ctggagcatg cgctttagca gccccgctgg gcacttggcg 12180
ctacacaagt ggcctctggc ctcgcacaca ttccacatcc accggtaggc gccaaccggc 12240
tccgttcttt ggtggcccct tcgcgccacc ttctactcct cccctagtca ggaagttccc 12300
ccccgccccg cagctcgcgt cgtgcaggac gtgacaaatg gaagtagcac gtctcactag 12360
tctcgtgcag atggacagca ccgctgagca atggaagcgg gtaggccttt ggggcagcgg 12420
ccaatagcag ctttgctcct tcgctttctg ggctcagagg ctgggaaggg gtgggtccgg 12480
gggcgggctc aggggcgggc tcaggggcgg ggcgggcgcc cgaaggtcct ccggaggccc 12540
ggcattctgc acgcttcaaa agcgcacgtc tgccgcgctg ttctcctctt cctcatctcc 12600
gggcctttcg accagcttac catgaccgag tacaagccca cggtgcgcct cgccacccgc 12660
gacgacgtcc ccagggccgt acgcaccctc gccgccgcgt tcgccgacta ccccgccacg 12720
cgccacaccg tcgatccgga ccgccacatc gagcgggtca ccgagctgca agaactcttc 12780
ctcacgcgcg tcgggctcga catcggcaag gtgtgggtcg cggacgacgg cgccgcggtg 12840
gcggtctgga ccacgccgga gagcgtcgaa gcgggggcgg tgttcgccga gatcggcccg 12900
cgcatggccg agttgagcgg ttcccggctg gccgcgcaga acagatggaa ggcctcctgg 12960
cgccgcaccg gcccaaggag cccgcgtggt tcctggccac cgtcgcgtct cgcccgacca 13020
ccagggcaag ggtctgggca gcgccgtcgt gctccccgga gtggaggcgg ccgagcgcgc 13080
cggggtgccc gccttcctgg agacctccgc gccccgcaac ctccccttct acgagcggct 13140
cggcttcacc gtcaccgccg acgtcgaggt gcccgaagga ccgcgcacct ggtgcatgac 13200
ccgcaagccc ggtgcctgac gcccgcccca cgacccgcag cgcccgaccg aaaggagcgc 13260
acgaccccat gcatcgtaga gctcgctgat cagcctcgac tgtgccttct agttgccagc 13320
catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg 13380
tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc 13440
tggggggtgg ggtggggcag gacagcaagg ggggggattg ggragacaat agcaggcatg 13500
ctgggggggc ggtgggggct atggcttctg aggcggaaag aaccagctgg ggctcgagat 13560
ccactagttc tagcctcgag gctagagcgg ccgccaccgc ggtggagctc caattcgccc 13620
tatagtgagt cgtattacgc gcgctcactg gccgtcgttt tacaacgtcg tgactgggaa 13680
aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt 13740
aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa 13800
tggaaattgt aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct 13860
cattttttaa ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg 13920
agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact 13980
ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac 14040
cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga 14100
gcccccgatt tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga 14160
aagcgaaagg agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca 14220
ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc ag 14262
<210>10
<211>13
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>10
aacaattggc ggc 13
<210>11
<211>13
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>11
gccaattgtt gcc 13
<210>12
<211>31
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>12
acgcgtcgac ggaaggagac aataccggaa g 31
<210>13
<211>28
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>13
ccgctcgagt tggggtgggg aaaaggaa 28
<210>14
<211>30
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>14
cgggatccgc ctgagaaagg aagtgagctg 30
<210>15
<211>29
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>15
gaagatctgg aggaatgagc tggccctta 29
<210>16
<211>8
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>16
gactagtc 8
<210>17
<211>35
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>17
ctcgagttat taatagtaat caattacggg gtcat 35
<210>18
<211>33
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>18
gtcgacgatc tgacggttca ctaaaccagc tct 33
<210>19
<211>30
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>19
ccaatgcata ggttgggctt cgggaatcgt 30
<210>20
<211>31
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>20
gctctagatc tcgacggtat acagacatga t 31
<210>21
<211>36
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>21
cccaagctta ttaatagtaa tcaattacgg ggtcat 36
<210>22
<211>36
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>22
caaggatccg atctgacggt tcactaaacc agctct 36
<210>23
<211>20
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>23
tcgagtcgtt taaactctag 20
<210>24
<211>20
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>24
tcgactagag tttaaacgac 20
<210>25
<211>33
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>25
gaattcgagc tcgcccaact ccgcccgttt tat 33
<210>26
<211>39
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>26
atttgtcgac tctagacccg ggctgcagcg aggagctct 39
<210>27
<211>12588
<212>DNA
<213>载体
<400>27
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgacgatctg acggttcact aaaccagctc 300
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 360
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 420
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 480
actgccaaaa ccgcatcacc atggtaatag cgatgactaa tacgtagatg tactgccaag 540
taggaaagtc ccataaggtc atgtactggg cataatgcca ggcgggccat ttaccgtcat 600
tgacgtcaat agggggcgta cttggcatat gatacacttg atgtactgcc aagtgggcag 660
tttaccgtaa atactccacc cattgacgtc aatggaaagt ccctattggc gttactatgg 720
gaacatacgt cattattgac gtcaatgggc gggggtcgtt gggcggtcag ccaggcgggc 780
catttaccgt aagttatgta acgcggaact ccatatatgg gctatgaact aatgaccccg 840
taattgatta ctattaataa ctcgacggta tcatggtggc gaccggcatg gtgagctgcg 900
agaatagccg ggcgcgctgt gagccgaagt cgcccccgcc ctggccactt ccggcgcgcc 960
gagtccttag gccgccaggg ggcgccggcg cgcgcccaga ttggggacaa aggaagccgg 1020
gccggccgcg ttattaccat aaaaggcaaa cactggtcgg aggcgtcccc gcggcgcgcg 1080
gcaggaagcc aggccccaac cccctcccaa ccgggcgcca gccccgcctc cgcccggttc 1140
aaacagcgac cgggtcgcgc gcgcgcacgc agcggccaca ccctcgggcg ccagcggctc 1200
gggcaggaag tggcgcaagc gcccgggccc cagaacgcac gcgcgattag cgccattgag 1260
tcccagcgcg cacgcgcaat tagcgccaat tcccagcgcg cacgcagtta gcgcccaaag 1320
gaccagcgcg cacgcgcatg gcgccccagc ccccaccggg cctgacgggg gctacgccgc 1380
gcccaccgtg cgatccccat tggcaagagc ccggctcaga caaagacccc gccggttgcc 1440
cccgccccga gagcggcacc cccggagcgc gcccgcccga gcgcggcctc gcgcctgcga 1500
actggcgtgg ggtgtccccc atctccggag gcccaggggc ttctcccgcg ccccccacgg 1560
cggtccggtt ccgccccatg cgccccccgc tgcggcccag acggcggctc tgcacgggcg 1620
aagggccgcg gccgcatgcc ccggtcggct ggccgggctt acctggcggc gggtgtggac 1680
gggcggcgga tcggcaaagg cgaggctctg tgctcgcggg cggacgcggt ctcggcggtg 1740
gtggcgcgtc gcgccgctgg gttttatagg gcgccgccgc ggccgctcga gccataaaag 1800
gcaactttcg gaacggcgca cgctgattgg ccccgcgccg ctcactcacc ggcttcgccg 1860
cacagtgcag cattttttta ccccctctcc cctccttttg cgaaaaaaaa aaagagcgag 1920
agcgagattg aggaagagga ggagggagag ttttggcgtt ggccgccttg gggtgctggg 1980
cccgggggct gggggcgcgc gccgtggccc ccgcgcccca cgctgggcag tgcccggttc 2040
ggccccgcat ggccaggcct gcccccggcc tgcccgtctc tcgggccccc cacccaccgc 2100
gggacatcct aggtgtggac atctcttggg cactgagcgc ccaggtgggg tgggccaggg 2160
tctgcacggg tgccagggcc ctgggttctg tacgctcctg cagaaggagc tcttggaggg 2220
catggagtgg ccaggcagtc actccccctt gccgacttca gagcaactgc cctgaaagca 2280
gggcctgagg acctctggct gtggggctca gctagctaaa tgtgctgggt gggtcactag 2340
ggagagacct gggcttgaga ggtagagtgt ggtgttgggg gagtcaggtg gcttgcggcc 2400
attagagtcg caggaccaca ctccccagga cagggcaggg gccagcggtc cagtggctgg 2460
aggtggcccg tgatgaaggc tacaaaccta cccagccgca gccctgggaa ggaagtgggc 2520
tctacagggc agggcacctt ttaccctgga gctgcctgct tttgagggta acagtcacgc 2580
ccagccaaga ccaggcctgg ggcgttagtg ggtgacctag gcactgcggg gcgggggggc 2640
tgggtctaca cagcctgggt ctgggcccac cgtccgttgt atgtctgcta tgcgcagcca 2700
cagctgaact gccctcccag accatctgga ggccgctggg ggactctggg gaccaagact 2760
ccatgtgcca cagaggattg ggggcggggc ggtgctagga actcaaagcc agcctgggaa 2820
gaccctgtcc ttgtcaccct ttcttgcctt gggtctgtcc actgagtagc acacaagacc 2880
gggtgggcag ggtccgttct gctccgggaa tcacagactg tgtgtaccca ggtggtgggc 2940
atgcagcgat cagtggcgtg ggaccacaga gggggcccgc ggtacctaaa acagcttcac 3000
atggcttaaa ataggggacc aatgtctttt ccaatctaag tcccatttat aataaagtcc 3060
atgttccatt tttaaaggac aatcctttcg gtttaaaacc aggcacgatt acccaaacaa 3120
ctcacaacgg taaagcactg tgaatcttct ctgttctgca atcccaactt ggtttctgct 3180
cagaaaccct ccctctttcc aatcggtaat taaataacaa aaggaaaaaa cttaagatgc 3240
ttcaaccccg tttcgtgaca ctttgaaaaa agaatcacct cttgcaaaca cccgctcccg 3300
acccccgccg ctgaagcccg gcgtccagag gcctaagcgc gggtgcccgc ccccacccgg 3360
gagcgcgggc ctcgtggtca gcgcatccgc ggggagaaac aaaggccgcg gcacgggggc 3420
tcaagggcac tgcgccacac cgcacgcgcc tacccccgcg cggccacgtt aactggcggt 3480
cgccgcagcc tcgggacagc cggccgcgcg ccgccaggct cgcggacgcg ggaccacgcg 3540
ccgccctccg ggaggcccaa gtctcgaccc agccccgcgt ggcgctgggg gagggggcgc 3600
ctccgccgga acgcgggtgg gggaggggag ggggaaatgc gctttgtctc gaaatggggc 3660
aaccgtcgcc acagctccct accccctcga gggcagagca gtccccccac taactaccgg 3720
gctggccgcg cgccaggcca gccgcgaggc caccgcccga ccctccactc cttcccgcag 3780
ctcccggcgc ggggtccggc gagaagggga ggggagggga gcggagaacc gggcccccgg 3840
gacgcgtgtg gcatctgaag caccaccagc gagcgagagc tagagagaag gaaagccacc 3900
gacttcaccg cctccgagct gctccgggtc gcgggtctgc agcgtctccg gccctccgcg 3960
cctacagctc aagccacatc cgaaggggga gggagccggg agctgcgcgc ggggccgccg 4020
gggggagggg tggcaccgcc cacgccgggc ggccacgaag ggcggggcag cgggcgcgcg 4080
cgcggcgggg ggaggggccg gcgccgcgcc cgctgggaat tggggcccta gggggagggc 4140
ggaggcgccg acgaccgcgg cacttaccgt tcgcggcgtg gcgcccggtg gtccccaagg 4200
ggagggaagg gggaggcggg gcgaggacag tgaccggagt ctcctcagcg gtggcttttc 4260
tgcttggcag cctcagcggc tggcgccaaa accggactcc gcccacttcc tcgcccgccg 4320
gtgcgagggt gtggaatcct ccagacgctg ggggaggggg agttgggagc ttaaaaacta 4380
gtaccccttt gggaccactt tcagcagcga actctcctgt acaccagggg tcagttccac 4440
agacgcgggc caggggtggg tcattgcggc gtgaacaata atttgactag aagttgattc 4500
gggtgtttcc ggaaggggcc gagtcaatcc gccgagttgg ggcacggaaa acaaaaaggg 4560
aaggctacta agatttttct ggcgggggtt atcattggcg taactgcagg gaccacctcc 4620
cgggttgagg gggctggatc tccaggctgc ggattaagcc cctcccgtcg gcgttaattt 4680
caaactgcgc gacgtttctc acctgccttc gccaaggcag gggccgggac cctattccaa 4740
gaggtagtaa ctagcaggac tctagccttc cgcaattcat tgagcgcatt tacggaagta 4800
acgtcgggta ctgtctctgg ccgcaagggt gggaggagta cgcatttggc gtaaggtggg 4860
gcgtagagcc ttcccgccat tggcggcgga tagggcgttt acgcgacggc ctgacgtagc 4920
ggaagacgcg ttagtggggg ggaaggttct agaaaagcgg cggcagcggc tctagcggca 4980
gtagcagcag cgccgggtcc cgtgcggagg tgctcctcgc agagttgttt ctcgagcagc 5040
ggcagttctc actacagcgc caggacgagt ccggttcgtg ttcgtccgcg gagatctctc 5100
tcatctcgct cggctgcggg aaatcgggct gaagcgactg agtccgcgat ggaggtaacg 5160
ggtttgaaat caatgagtta ttgaaaaggg catggcgagg ccgttggcgc ctcagtggaa 5220
gtcggccagc cgcctccgtg ggagagaggc aggaaatcgg accaattcag tagcagtggg 5280
gcttaaggtt tatgaacggg gtcttgagcg gaggcctgag cgtacaaaca gcttccccac 5340
cctcagcctc ccggcgccat ttcccttcac tgggggtggg ggatggggag ctttcacatg 5400
gcggacgctg ccccgctggg gtgaaagtgg ggcgcggagg cgggaattct tattcccttt 5460
ctaaagcacg ctgcttcggg ggccacggcg tctcctcggc gagcgtttcg gcgggcagca 5520
ggtcctcgtg agcgaggctg cggagcttcc cctccccctc tctcccggga accgatttgg 5580
cggccgccat tttcatggct cgccttcctc tcagcgtttt ccttataact cttttatttt 5640
cttagtgtgc tttctctatc aagaagtaga agtggttaac tatttttttt ttcttctcgg 5700
gctgttttca tatcgtttcg aggtggattt ggagtgtttt gtgagcttgg atctttagag 5760
tcctgcgcac ctcattaaag gcgctcagcc ttcccctcga tgaaatggcg ccattgcgtt 5820
cggaagccac accgaagagc ggggaggggg ggtgctccgg gtttgcgggc ccggtttcag 5880
agaagatatc accacccagg gcgtcgggcc gggttcaatg cgagccgtag gacaaagaaa 5940
ccattttatg tttttcctgt cttttttttc ctttgagtaa cggttttatc tgggtctgca 6000
gtcagtaaaa cgacagatga accgcggcaa aataaacata aattggaagc catcggccac 6060
gaggggcagg gacgaaggtg gttttctggg cgggggaggg atattcgcgt cagaatcctt 6120
tactgttctt aaggattccg tttaagttgt agagctgact cattttaagt aatgttgtta 6180
ctgagaagtt taacccttac gggacagatc catggacctt tatagatgat tacgaggaaa 6240
gtgaaataac gattttgtcc ttagttatac ttcgattaaa acatggcttc agaggctcct 6300
tcctgtaatg cgtatggatt gatgtgcaaa actgttttgg gcctgggccg ctctgtattt 6360
gaactttgtt acttttctca ttttgtttgc aatcttggtt gaacattaca ttgataagca 6420
taaggtctca agcgaagggg gtctacctgg ttatttttct ttgaccctaa gcacgtttat 6480
aaaataacat tgtttaaaat cgatagtgga catcgggtaa gtttggataa attgtgaggt 6540
aagtaatgag tttttgcttt ttgttagtga tttgtaaaac ttgttataaa tgtacattat 6600
ccgtaatttc agtttagaga taacctatgt gctgacgaca attaagaata aaaactagct 6660
gaaaaaatga aaataactat cgtgacaagt aaccatttca aaagactgct ttgtgtctca 6720
taggagctag tttgatcatt tcagttaatt ttttctttaa tttttacgag tcatgaaaac 6780
tacaggaaaa aaaatctgaa ctgggtttta ccactacttt ttaggagttg ggagcatgcg 6840
aatggaggga gagctccgta gaactgggat gagagcagca attaatgctg cttgctagga 6900
acaaaaaata attgattgaa aattacgtgt gactttttag tttgcattat gcgtttgtag 6960
cagttggtcc tggatatcac tttctctcgt ttgaggtttt ttaacctagt taacttttaa 7020
gacaggtttc cttaacattc ataagtgccc agaatacagc tgtgtagtac agcatataaa 7080
gatttcagct ctgaggtttt tcctattgac ttggaaaatt gttttgtgcc tgtcgcttgc 7140
cacatggcca atcaagtaag cttcgaattc gagctcgccc aactccgccc gttttatgac 7200
tagaaccaat agtttttaat gccaaatgca ctgaaatccc ctaatttgca aagccaaacg 7260
ccccctatgt gagtaatacg gggacttttt acccaatttc ccaagcggaa agccccctaa 7320
tacactcata tggcatatga atcagcacgg tcatgcactc taatggcggc ccatagggac 7380
tttccacata gggggcgttc accatttccc agcatagggg tggtgactca atggccttta 7440
cccaagtaca ttgggtcaat gggaggtaag ccaatgggtt tttcccatta ctggcaagca 7500
cactgagtca aatgggactt tccactgggt tttgcccaag tacattgggt caatgggagg 7560
tgagccaatg ggaaaaaccc attgctgcca agtacactga ctcaataggg actttccaat 7620
gggtttttcc attgttggca agcatataag gtcaatgtgg gtgagtcaat agggactttc 7680
cattgtattc tgcccagtac ataaggtcaa tagggggtga atcaacagga aagtcccatt 7740
ggagccaagt acactgcgtc aatagggact ttccattggg ttttgcccag tacataaggt 7800
caatagggga tgagtcaatg ggaaaaaccc attggagcca agtacactga ctcaataggg 7860
actttccatt gggttttgcc cagtacataa ggtcaatagg gggtgagtca acaggaaagt 7920
cccattggag ccaagtacat tgagtcaata gggactttcc aatgggtttt gcccagtaca 7980
taaggtcaat gggaggtaag ccaatgggtt tttcccatta ctggcacgta tactgagtca 8040
ttagggactt tccaatgggt tttgcccagt acataaggtc aataggggtg aatcaacagg 8100
aaagtcccat tggagccaag tacactgagt caatagggac tttccattgg gttttgccca 8160
gtacaaaagg tcaatagggg gtgagtcaat gggtttttcc cattattggc acgtacataa 8220
ggtcaatagg ggtgagtcat tgggtttttc cagccaattt aattaaaacg ccatgtactt 8280
tcccaccatt gacgtcaatg ggctattgaa actaatgcaa cgtgaccttt aaacggtact 8340
ttcccatagc tgattaatgg gaaagtaccg ttctcgagcc aatacacgtc aatgggaagt 8400
gaaagggcag ccaaaacgta acaccgcccc ggttttcccc tggaaattcc atattggcac 8460
gcattctatt ggctgagctg cgttctacgt gggtataaga ggcgcgacca gcgtcggtac 8520
cgtcgcagtc ttcggtctga ccaccgtaga acgcagagct cctcgctgca gcccgggtct 8580
agaggatccg cctgagaaag gaagtgagct gtaaaggctg agctctctct ctgacgtatg 8640
tagcctctgg ttagcttcgt cactcactgt tcttgactca gcatggcaat ctgatgaaat 8700
cccagctgta agtctgcaga aattgatgat ctattaaaca ataaagatgt ccactaaaat 8760
ggaagttttt cctgtcatac tttgttaaga agggtgagaa cagagtacct acattttgaa 8820
tggaaggatt ggagctacgg gggtgggggt ggggtgggat tagataaatg cctgctcttt 8880
actgaaggct ctttactatt gctttatgat aatgtttcat agttggatat cataatttaa 8940
acaagcaaaa ccaaattaag ggccagctca ttcctccaga tccactagtt ctagagcaaa 9000
ttctaccggg taggggaggc gcttttccca aggcagtctg gagcatgcgc tttagcagcc 9060
ccgctgggca cttggcgcta cacaagtggc ctctggcctc gcacacattc cacatccacc 9120
ggtaggcgcc aaccggctcc gttctttggt ggccccttcg cgccaccttc tactcctccc 9180
ctagtcagga agttcccccc cgccccgcag ctcgcgtcgt gcaggacgtg acaaatggaa 9240
gtagcacgtc tcactagtct cgtgcagatg gacagcaccg ctgagcaatg gaagcgggta 9300
ggcctttggg gcagcggcca atagcagctt tgctccttcg ctttctgggc tcagaggctg 9360
ggaaggggtg ggtccggggg cgggctcagg ggcgggctca ggggcggggc gggcgcccga 9420
aggtcctccg gaggcccggc attctgcacg cttcaaaagc gcacgtctgc cgcgctgttc 9480
tcctcttcct catctccggg cctttcgacc agcttaccat gaccgagtac aagcccacgg 9540
tgcgcctcgc cacccgcgac gacgtcccca gggccgtacg caccctcgcc gccgcgttcg 9600
ccgactaccc cgccacgcgc cacaccgtcg atccggaccg ccacatcgag cgggtcaccg 9660
agctgcaaga actcttcctc acgcgcgtcg ggctcgacat cggcaaggtg tgggtcgcgg 9720
acgacggcgc cgcggtggcg gtctggacca cgccggagag cgtcgaagcg ggggcggtgt 9780
tcgccgagat cggcccgcgc atggccgagt tgagcggttc ccggctggcc gcgcagaaca 9840
gatggaaggc ctcctggcgc cgcaccggcc caaggagccc gcgtggttcc tggccaccgt 9900
cgcgtctcgc ccgaccacca gggcaagggt ctgggcagcg ccgtcgtgct ccccggagtg 9960
gaggcggccg agcgcgccgg ggtgcccgcc ttcctggaga cctccgcgcc ccgcaacctc 10020
cccttctacg agcggctcgg cttcaccgtc accgccgacg tcgaggtgcc cgaaggaccg 10080
cgcacctggt gcatgacccg caagcccggt gcctgacgcc cgccccacga cccgcagcgc 10140
ccgaccgaaa ggagcgcacg accccatgca taggttgggc ttcggaatcg ttttccggga 10200
cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg cccaccccaa 10260
cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa 10320
taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta 10380
tcatgtctgt ataccgtcga gatctagagc ggccgccacc gcggtggagc tccagctttt 10440
gttcccttta gtgagggtta atttcgagct tggcgtaatc atggtcatag ctgtttcctg 10500
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 10560
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 10620
ctttccagtc gggaaacctg tcgtgccagg gggtacctag gccgggcaac aattggcggc 10680
cggccgcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 10740
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 10800
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 10860
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 10920
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 10980
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 11040
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 11100
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 11160
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 11220
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 11280
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 11340
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 11400
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 11460
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 11520
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 11580
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 11640
gataggtgcc tcactgatta agcattggta actgtcagac cctaggccgg gcaacaattg 11700
gcggccggcc ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 11760
gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 11820
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 11880
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 11940
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 12000
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 12060
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 12120
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 12180
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 12240
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 12300
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 12360
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 12420
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 12480
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 12540
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactc 12588
<210>28
<211>11998
<212>DNA
<213>载体
<400>28
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgacggtatc aaggtggcga ccggaatggt 300
gagctgcgag aatagccggg cgcgctgtga gccgaagtcg cccccgccct ggccacttcc 360
ggcgcgccga gtccttaggc cgccaggggg cgccggcgcg cgcccagatt ggggacaaag 420
gaagccgggc cggccgcgtt attaccataa aaggcaaaca ctggtcggag gcgtccccgc 480
ggcgcgcggc aggaagccag gccccaaccc cctcccaacc gggcgccagc cccgcctccg 540
cccggttcaa acagcgaccg ggtcgcgcgc gcgcacgcag cggccacacc ctcgggcgcc 600
agcggctcgg gcaggaagtg gcgcaagcgc ccgggcccca gaacgcacgc gcgattagcg 660
ccattgagtc ccagcgcgca cgcgcaatta gcgccaattc ccagcgcgca cgcagttagc 720
gcccaaagga ccagcgcgca cgcgcatggc gccccagccc ccaccgggcc tgacgggggc 780
tacgccgcgc ccaccgtgcg atccccattg gcaagagccc ggctcagaca aagaccccgc 840
cggttgcccc cgccccgaga gcggcacccc cggagcgcgc ccgcccgagc gcggcctcgc 900
gcctgcgaac tggcgtgggg tgtcccccat ctccggaggc ccaggggctt ctcccgcgcc 960
ccccacggcg gtccggttcc gccccatgcg ccccccgctg cggcccagac ggcggctctg 1020
cacgggcgaa gggccgcggc cgcatgcccc ggtcggctgg ccgggcttac ctggcggcgg 1080
gtgtggacgg gcggcggatc ggcaaaggcg aggctctgtg ctcgcgggcg gacgcggtct 1140
cggcggtggt ggcgcgtcgc gccgctgggt tttatagggc gccgccgcgg ccgctcgagc 1200
cataaaaggc aactttcgga acggcgcacg ctgattggcc ccgcgccgct cactcaccgg 1260
cttcgccgca cagtgcagca tttttttacc ccctctcccc tccttttgcg aaaaaaaaaa 1320
agagcgagag cgagattgag gaagaggagg agggagagtt ttggcgttgg ccgccttggg 1380
gtgctgggcc cgggggctgg gggcgcgcgc cgtggccccc gcgccccacg ctgggcagtg 1440
cccggttcgg ccccgcatgg ccaggcctgc ccccggcctg cccgtctctc gggcccccca 1500
cccaccgcgg gacatcctag gtgtggacat ctcttgggca ctgagcgccc aggtggggtg 1560
ggccagggtc tgcacgggtg ccagggccct gggttctgta cgctcctgca gaaggagctc 1620
ttggagggca tggagtggcc aggcagtcac tcccccttgc cgacttcaga gcaactgccc 1680
tgaaagcagg gcctgaggac ctctggctgt ggggctcagc tagctaaatg tgctgggtgg 1740
gtcactaggg agagacctgg gcttgagagg tagagtgtgg tgttggggga gtcaggtggc 1800
ttgcggccat tagagtcgca ggaccacact ccccaggaca gggcaggggc cagcggtcca 1860
gtggctggag gtggcccgtg atgaaggcta caaacctacc cagccgcagc cctgggaagg 1920
aagtgggctc tacagggcag ggcacctttt accctggagc tgcctgcttt tgagggtaac 1980
agtcacgccc agccaagacc aggcctgggg cgttagtggg tgacctaggc actgcggggc 2040
gggggggctg ggtctacaca gcctgggtct gggcccaccg tccgttgtat gtctgctatg 2100
cgcagccaca gctgaactgc cctcccagac catctggagg ccgctggggg actctgggga 2160
ccaagactcc atgtgccaca gaggattggg ggcggggcgg tgctaggaac tcaaagccag 2220
cctgggaaga ccctgtcctt gtcacccttt cttgccttgg gtctgtccac tgagtagcac 2280
acaagaccgg gtgggcaggg tccgttctgc tccgggaatc acagactgtg tgtacccagg 2340
tggtgggcat gcagcgatca gtggcgtggg accacagagg gggcccgcgg tacctaaaac 2400
agcttcacat ggcttaaaat aggggaccaa tgtcttttcc aatctaagtc ccatttataa 2460
taaagtccat gttccatttt taaaggacaa tcctttcggt ttaaaaccag gcacgattac 2520
ccaaacaact cacaacggta aagcactgtg aatcttctct gttctgcaat cccaacttgg 2580
tttctgctca gaaaccctcc ctctttccaa tcggtaatta aataacaaaa ggaaaaaact 2640
taagatgctt caaccccgtt tcgtgacact ttgaaaaaag aatcacctct tgcaaacacc 2700
cgctcccgac ccccgccgct gaagcccggc gtccagaggc ctaagcgcgg gtgcccgccc 2760
ccacccggga gcgcgggcct cgtggtcagc gcatccgcgg ggagaaacaa aggccgcggc 2820
acgggggctc aagggcactg cgccacaccg cacgcgccta cccccgcgcg gccacgttaa 2880
ctggcggtcg ccgcagcctc gggacagccg gccgcgcgcc gccaggctcg cggacgcggg 2940
accacgcgcc gccctccggg aggcccaagt ctcgacccag ccccgcgtgg cgctggggga 3000
gggggcgcct ccgccggaac gcgggtgggg gaggggaggg ggaaatgcgc tttgtctcga 3060
aatggggcaa ccgtcgccac agctccctac cccctcgagg gcagagcagt ccccccacta 3120
actaccgggc tggccgcgcg ccaggccagc cgcgaggcca ccgcccgacc ctccactcct 3180
tcccgcagct cccggcgcgg ggtccggcga gaaggggagg ggaggggagc ggagaaccgg 3240
gcccccggga cgcgtgtggc atctgaagca ccaccagcga gcgagagcta gagagaagga 3300
aagccaccga cttcaccgcc tccgagctgc tccgggtcgc gggtctgcag cgtctccggc 3360
cctccgcgcc tacagctcaa gccacatccg aagggggagg gagccgggag ctgcgcgcgg 3420
ggccgccggg gggaggggtg gcaccgccca cgccgggcgg ccacgaaggg cggggcagcg 3480
ggcgcgcgcg cggcgggggg aggggccggc gccgcgcccg ctgggaattg gggccctagg 3540
gggagggcgg aggcgccgac gaccgcggca cttaccgttc gcggcgtggc gcccggtggt 3600
ccccaagggg agggaagggg gaggcggggc gaggacagtg accggagtct cctcagcggt 3660
ggcttttctg cttggcagcc tcagcggctg gcgccaaaac cggactccgc ccacttcctc 3720
gcccgccggt gcgagggtgt ggaatcctcc agacgctggg ggagggggag ttgggagctt 3780
aaaaactagt acccctttgg gaccactttc agcagcgaac tctcctgtac accaggggtc 3840
agttccacag acgcgggcca ggggtgggtc attgcggcgt gaacaataat ttgactagaa 3900
gttgattcgg gtgtttccgg aaggggccga gtcaatccgc cgagttgggg cacggaaaac 3960
aaaaagggaa ggctactaag atttttctgg cgggggttat cattggcgta actgcaggga 4020
ccacctcccg ggttgagggg gctggatctc caggctgcgg attaagcccc tcccgtcggc 4080
gttaatttca aactgcgcga cgtttctcac ctgccttcgc caaggcaggg gccgggaccc 4140
tattccaaga ggtagtaact agcaggactc tagccttccg caattcattg agcgcattta 4200
cggaagtaac gtcgggtact gtctctggcc gcaagggtgg gaggagtacg catttggcgt 4260
aaggtggggc gtagagcctt cccgccattg gcggcggata gggcgtttac gcgacggcct 4320
gacgtagcgg aagacgcgtt agtggggggg aaggttctag aaaagcggcg gcagcggctc 4380
tagcggcagt agcagcagcg ccgggtcccg tgcggaggtg ctcctcgcag agttgtttct 4440
cgagcagcgg cagttctcac tacagcgcca ggacgagtcc ggttcgtgtt cgtccgcgga 4500
gatctctctc atctcgctcg gctgcgggaa atcgggctga agcgactgag tccgcgatgg 4560
aggtaacggg tttgaaatca atgagttatt gaaaagggca tggcgaggcc gttggcgcct 4620
cagtggaagt cggccagccg cctccgtggg agagaggcag gaaatcggac caattcagta 4680
gcagtggggc ttaaggttta tgaacggggt cttgagcgga ggcctgagcg tacaaacagc 4740
ttccccaccc tcagcctccc ggcgccattt cccttcactg ggggtggggg atggggagct 4800
ttcacatggc ggacgctgcc ccgctggggt gaaagtgggg cgcggaggcg ggaattctta 4860
ttccctttct aaagcacgct gcttcggggg ccacggcgtc tcctcggcga gcgtttcggc 4920
gggcagcagg tcctcgtgag cgaggctgcg gagcttcccc tccccctctc tcccgggaac 4980
cgatttggcg gccgccattt tcatggctcg ccttcctctc agcgttttcc ttataactct 5040
tttattttct tagtgtgctt tctctatcaa gaagtagaag tggttaacta tttttttttt 5100
cttctcgggc tgttttcata tcgtttcgag gtggatttgg agtgttttgt gagcttggat 5160
ctttagagtc ctgcgcacct cattaaaggc gctcagcctt cccctcgatg aaatggcgcc 5220
attgcgttcg gaagccacac cgaagagcgg ggaggggggg tgctccgggt ttgcgggccc 5280
ggtttcagag aagatatcac cacccagggc gtcgggccgg gttcaatgcg agccgtagga 5340
caaagaaacc attttatgtt tttcctgtct tttttttcct ttgagtaacg gttttatctg 5400
ggtctgcagt cagtaaaacg acagatgaac cgcggcaaaa taaacataaa ttggaagcca 5460
tcggccacga ggggcaggga cgaaggtggt tttctgggcg ggggagggat attcgcgtca 5520
gaatccttta ctgttcttaa ggattccgtt taagttgtag agctgactca ttttaagtaa 5580
tgttgttact gagaagttta acccttacgg gacagatcca tggaccttta tagatgatta 5640
cgaggaaagt gaaataacga ttttgtcctt agttatactt cgattaaaac atggcttcag 5700
aggctccttc ctgtaatgcg tatggattga tgtgcaaaac tgttttgggc ctgggccgct 5760
ctgtatttga actttgttac ttttctcatt ttgtttgcaa tcttggttga acattacatt 5820
gataagcata aggtctcaag cgaagggggt ctacctggtt atttttcttt gaccctaagc 5880
acgtttataa aataacattg tttaaaatcg atagtggaca tcgggtaagt ttggataaat 5940
tgtgaggtaa gtaatgagtt tttgcttttt gttagtgatt tgtaaaactt gttataaatg 6000
tacattatcc gtaatttcag tttagagata acctatgtgc tgacgacaat taagaataaa 6060
aactagctga aaaaatgaaa ataactatcg tgacaagtaa ccatttcaaa agactgcttt 6120
gtgtctcata ggagctagtt tgatcatttc agttaatttt ttctttaatt tttacgagtc 6180
atgaaaacta caggaaaaaa aatctgaact gggttttacc actacttttt aggagttggg 6240
agcatgcgaa tggagggaga gctccgtaga actgggatga gagcagcaat taatgctgct 6300
tgctaggaac aaaaaataat tgattgaaaa ttacgtgtga ctttttagtt tgcattatgc 6360
gtttgtagca gttggtcctg gatatcactt tctctcgttt gaggtttttt aacctagtta 6420
acttttaaga caggtttcct taacattcat aagtgcccag aatacagctg tgtagtacag 6480
catataaaga tttcagctct gaggtttttc ctattgactt ggaaaattgt tttgtgcctg 6540
tcgcttgcca catggccaat caagtaagct tcgaattcga gctcgcccaa ctccgcccgt 6600
tttatgacta gaaccaatag tttttaatgc caaatgcact gaaatcccct aatttgcaaa 6660
gccaaacgcc ccctatgtga gtaatacggg gactttttac ccaatttccc aagcggaaag 6720
ccccctaata cactcatatg gcatatgaat cagcacggtc atgcactcta atggcggccc 6780
atagggactt tccacatagg gggcgttcac catttcccag cataggggtg gtgactcaat 6840
ggcctttacc caagtacatt gggtcaatgg gaggtaagcc aatgggtttt tcccattact 6900
ggcaagcaca ctgagtcaaa tgggactttc cactgggttt tgcccaagta cattgggtca 6960
atgggaggtg agccaatggg aaaaacccat tgctgccaag tacactgact caatagggac 7020
tttccaatgg gtttttccat tgttggcaag catataaggt caatgtgggt gagtcaatag 7080
ggactttcca ttgtattctg cccagtacat aaggtcaata gggggtgaat caacaggaaa 7140
gtcccattgg agccaagtac actgcgtcaa tagggacttt ccattgggtt ttgcccagta 7200
cataaggtca ataggggatg agtcaatggg aaaaacccat tggagccaag tacactgact 7260
caatagggac tttccattgg gttttgccca gtacataagg tcaatagggg gtgagtcaac 7320
aggaaagtcc cattggagcc aagtacattg agtcaatagg gactttccaa tgggttttgc 7380
ccagtacata aggtcaatgg gaggtaagcc aatgggtttt tcccattact ggcacgtata 7440
ctgagtcatt agggactttc caatgggttt tgcccagtac ataaggtcaa taggggtgaa 7500
tcaacaggaa agtcccattg gagccaagta cactgagtca atagggactt tccattgggt 7560
tttgcccagt acaaaaggtc aatagggggt gagtcaatgg gtttttccca ttattggcac 7620
gtacataagg tcaatagggg tgagtcattg ggtttttcca gccaatttaa ttaaaacgcc 7680
atgtactttc ccaccattga cgtcaatggg ctattgaaac taatgcaacg tgacctttaa 7740
acggtacttt cccatagctg attaatggga aagtaccgtt ctcgagccaa tacacgtcaa 7800
tgggaagtga aagggcagcc aaaacgtaac accgccccgg ttttcccctg gaaattccat 7860
attggcacgc attctattgg ctgagctgcg ttctacgtgg gtataagagg cgcgaccagc 7920
gtcggtaccg tcgcagtctt cggtctgacc accgtagaac gcagagctcc tcgctgcagc 7980
ccgggtctag aggatccgcc tgagaaagga agtgagctgt aaaggctgag ctctctctct 8040
gacgtatgta gcctctggtt agcttcgtca ctcactgttc ttgactcagc atggcaatct 8100
gatgaaatcc cagctgtaag tctgcagaaa ttgatgatct attaaacaat aaagatgtcc 8160
actaaaatgg aagtttttcc tgtcatactt tgttaagaag ggtgagaaca gagtacctac 8220
attttgaatg gaaggattgg agctacgggg gtgggggtgg ggtgggatta gataaatgcc 8280
tgctctttac tgaaggctct ttactattgc tttatgataa tgtttcatag ttggatatca 8340
taatttaaac aagcaaaacc aaattaaggg ccagctcatt cctccagatc cactagttct 8400
agagcaaatt ctaccgggta ggggaggcgc ttttcccaag gcagtctgga gcatgcgctt 8460
tagcagcccc gctgggcact tggcgctaca caagtggcct ctggcctcgc acacattcca 8520
catccaccgg taggcgccaa ccggctccgt tctttggtgg ccccttcgcg ccaccttcta 8580
ctcctcccct agtcaggaag ttcccccccg ccccgcagct cgcgtcgtgc aggacgtgac 8640
aaatggaagt agcacgtctc actagtctcg tgcagatgga cagcaccgct gagcaatgga 8700
agcgggtagg cctttggggc agcggccaat agcagctttg ctccttcgct ttctgggctc 8760
agaggctggg aaggggtggg tccgggggcg ggctcagggg cgggctcagg ggcggggcgg 8820
gcgcccgaag gtcctccgga ggcccggcat tctgcacgct tcaaaagcgc acgtctgccg 8880
cgctgttctc ctcttcctca tctccgggcc tttcgaccag cttaccatga ccgagtacaa 8940
gcccacggtg cgcctcgcca cccgcgacga cgtccccagg gccgtacgca ccctcgccgc 9000
cgcgttcgcc gactaccccg ccacgcgcca caccgtcgat ccggaccgcc acatcgagcg 9060
ggtcaccgag ctgcaagaac tcttcctcac gcgcgtcggg ctcgacatcg gcaaggtgtg 9120
ggtcgcggac gacggcgccg cggtggcggt ctggaccacg ccggagagcg tcgaagcggg 9180
ggcggtgttc gccgagatcg gcccgcgcat ggccgagttg agcggttccc ggctggccgc 9240
gcagcaacag atggaaggcc tcctggcgcc gcaccggccc aaggagcccg cgtggttcct 9300
ggccaccgtc ggcgtctcgc ccgaccacca gggcaagggt ctgggcagcg ccgtcgtgct 9360
ccccggagtg gaggcggccg agcgcgccgg ggtgcccgcc ttcctggaga cctccgcgcc 9420
ccgcaacctc cccttctacg agcggctcgg cttcaccgtc accgccgacg tcgaggtgcc 9480
cgaaggaccg cgcacctggt gcatgacccg caagcccggt gcctgacgcc cgccccacga 9540
cccgcagcgc ccgaccgaaa ggagcgcacg accccatgca taggttgggc ttcggaatcg 9600
ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 9660
cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 9720
atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 9780
atgtatctta tcatgtctgt ataccgtcga gatctagagc ggccgccacc gcggtggagc 9840
tccagctttt gttcccttta gtgagggtta atttcgagct tggcgtaatc atggtcatag 9900
ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 9960
ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 10020
tcactgcccg ctttccagtc gggaaacctg tcgtgccagg gggtacctag gccgggcaac 10080
aattggcggc cggccgcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 10140
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 10200
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 10260
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 10320
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 10380
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 10440
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 10500
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 10560
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 10620
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 10680
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 10740
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 10800
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 10860
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 10920
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 10980
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 11040
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac cctaggccgg 11100
gcaacaattg gcggccggcc ctgcattaat gaatcggcca acgcgcgggg agaggcggtt 11160
tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 11220
tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 11280
ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 11340
ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 11400
gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 11460
gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 11520
ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg 11580
tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 11640
gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 11700
tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 11760
tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc 11820
tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 11880
ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 11940
ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactc 11998
<210>29
<211>12052
<212>DNA
<213>载体
<220>
<221>misc_特征
<222>8953
<223>n=A,T,C或G
<400>29
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgacggtatc aaggtggcga ccggaatggt 300
gagctgcgag aatagccggg cgcgctgtga gccgaagtcg cccccgccct ggccacttcc 360
ggcgcgccga gtccttaggc cgccaggggg cgccggcgcg cgcccagatt ggggacaaag 420
gaagccgggc cggccgcgtt attaccataa aaggcaaaca ctggtcggag gcgtccccgc 480
ggcgcgcggc aggaagccag gccccaaccc cctcccaacc gggcgccagc cccgcctccg 540
cccggttcaa acagcgaccg ggtcgcgcgc gcgcacgcag cggccacacc ctcgggcgcc 600
agcggctcgg gcaggaagtg gcgcaagcgc ccgggcccca gaacgcacgc gcgattagcg 660
ccattgagtc ccagcgcgca cgcgcaatta gcgccaattc ccagcgcgca cgcagttagc 720
gcccaaagga ccagcgcgca cgcgcatggc gccccagccc ccaccgggcc tgacgggggc 780
tacgccgcgc ccaccgtgcg atccccattg gcaagagccc ggctcagaca aagaccccgc 840
cggttgcccc cgccccgaga gcggcacccc cggagcgcgc ccgcccgagc gcggcctcgc 900
gcctgcgaac tggcgtgggg tgtcccccat ctccggaggc ccaggggctt ctcccgcgcc 960
ccccacggcg gtccggttcc gccccatgcg ccccccgctg cggcccagac ggcggctctg 1020
cacgggcgaa gggccgcggc cgcatgcccc ggtcggctgg ccgggcttac ctggcggcgg 1080
gtgtggacgg gcggcggatc ggcaaaggcg aggctctgtg ctcgcgggcg gacgcggtct 1140
cggcggtggt ggcgcgtcgc gccgctgggt tttatagggc gccgccgcgg ccgctcgagc 1200
cataaaaggc aactttcgga acggcgcacg ctgattggcc ccgcgccgct cactcaccgg 1260
cttcgccgca cagtgcagca tttttttacc ccctctcccc tccttttgcg aaaaaaaaaa 1320
agagcgagag cgagattgag gaagaggagg agggagagtt ttggcgttgg ccgccttggg 1380
gtgctgggcc cgggggctgg gggcgcgcgc cgtggccccc gcgccccacg ctgggcagtg 1440
cccggttcgg ccccgcatgg ccaggcctgc ccccggcctg cccgtctctc gggcccccca 1500
cccaccgcgg gacatcctag gtgtggacat ctcttgggca ctgagcgccc aggtggggtg 1560
ggccagggtc tgcacgggtg ccagggccct gggttctgta cgctcctgca gaaggagctc 1620
ttggagggca tggagtggcc aggcagtcac tcccccttgc cgacttcaga gcaactgccc 1680
tgaaagcagg gcctgaggac ctctggctgt ggggctcagc tagctaaatg tgctgggtgg 1740
gtcactaggg agagacctgg gcttgagagg tagagtgtgg tgttggggga gtcaggtggc 1800
ttgcggccat tagagtcgca ggaccacact ccccaggaca gggcaggggc cagcggtcca 1860
gtggctggag gtggcccgtg atgaaggcta caaacctacc cagccgcagc cctgggaagg 1920
aagtgggctc tacagggcag ggcacctttt accctggagc tgcctgcttt tgagggtaac 1980
agtcacgccc agccaagacc aggcctgggg cgttagtggg tgacctaggc actgcggggc 2040
gggggggctg ggtctacaca gcctgggtct gggcccaccg tccgttgtat gtctgctatg 2100
cgcagccaca gctgaactgc cctcccagac catctggagg ccgctggggg actctgggga 2160
ccaagactcc atgtgccaca gaggattggg ggcggggcgg tgctaggaac tcaaagccag 2220
cctgggaaga ccctgtcctt gtcacccttt cttgccttgg gtctgtccac tgagtagcac 2280
acaagaccgg gtgggcaggg tccgttctgc tccgggaatc acagactgtg tgtacccagg 2340
tggtgggcat gcagcgatca gtggcgtggg accacagagg gggcccgcgg taccaagctt 2400
gggaattgcg tgcaaaaaca acttctgttt tccagggtaa acagaatcta atgcagaatc 2460
taatgcaggg taaacagact taatgcagaa tctaatgatg gcacaaatta aaaatcacta 2520
acgtgccct ttttagtgtga aacccagaga gagcacatac aagccaaaaa caaatgcttt 2580
attttaccta ggagacatta acattcacct ttacgtgttt aagattaatg caatgttaaa 2640
tattgtgaaa actgtaactt tgaatttcat gatttttatg tgaatattcc agggtttaaa 2700
aaaacttgta acatgacatg gctgaataag ataaaaaaaa aatctagcct tttctccctt 2760
ctggctcata tttgcgattt cgatcatttt gtttaaaaaa caaaacactg caatgaatta 2820
aacttaatat tcttctatgt tttagagtaa gttaaaacaa gataaagtga ccaaagtaat 2880
ttgaaagatt caatgacttt tgctccaacc taggtgcaca aggtaccttg ttctttaaat 2940
tgggctttaa tgaaaatact tctccagaat tctggggatt taagaaaaat tatgccaacc 3000
aacaagggct ttaccatttt atgtaacatt tttcaacgct gcaaaaatgt gtgtatttct 3060
atttgaagat aaaaatcctc agcaaaatcc acattgcact gtccttcaaa gattagcctt 3120
ctttgaacta gttaagacac tattaagcca agccagtatc tccctgtaat gaattcgttt 3180
ttctcttaat tttcccctgt aatttacact gggagagctg ggaaatatgt ggatgtaaat 3240
ttctcagcca cagagatgca aagttatact gtggggaaaa aaaacttgag ttaaatcctt 3300
acatatttta ggttttcatt aacttaccaa tgtagttttg ttggaggcca ttttttttat 3360
tgcagacttg aagagctatt actagaaaaa tgcatgacag ttaaggtaag tttgcatgac 3420
acaaaaaagg taactaaata caaattctgt ttggattcca acccccaagt agagagcgca 3480
cactttcaaa cgtgaataca aatccagagt agatctgcgc tcctacctac attgcttatg 3540
atgtacttaa gtacgtgtcc taaccatgtg agtctagaaa gactttactg gggatcctgg 3600
tacctaaaac agcttcacat ggcttaaaat aggggaccaa tgtcttttcc aatctaagtc 3660
ccatttataa taaagtccat gttccatttt taaaggacaa tcctttcggt ttaaaaccag 3720
gcacgattac ccaaacaact cacaacggta aagcactgtg aatcttctct gttctgcaat 3780
cccaacttgg tttctgctca gaaaccctcc ctctttccaa tcggtaatta aataacaaaa 3840
ggaaaaaact taagatgctt caaccccgtt tcgtgacact ttgaaaaaag aatcacctct 3900
tgcaaacacc cgctcccgac ccccgccgct gaagcccggc gtccagaggc ctaagcgcgg 3960
gtgcccgccc ccacccggga gcgcgggcct cgtggtcagc gcatccgcgg ggagaaacaa 4020
aggccgcggc acgggggctc aagggcactg cgccacaccg cacgcgccta cccccgcgcg 4080
gccacgttaa ctggcggtcg ccgcagcctc gggacagccg gccgcgcgcc gccaggctcg 4140
cggacgcggg accacgcgcc gccctccggg aggcccaagt ctcgacccag ccccgcgtgg 4200
cgctggggga gggggcgcct ccgccggaac gcgggtgggg gaggggaggg ggaaatgcgc 4260
tttgtctcga aatggggcaa ccgtcgccac agctccctac cccctcgagg gcagagcagt 4320
ccccccacta actaccgggc tggccgcgcg ccaggccagc cgcgaggcca ccgcccgacc 4380
ctccactcct tcccgcagct cccggcgcgg ggtccggcga gaaggggagg ggaggggagc 4440
ggagaaccgg gcccccggga cgcgtgtggc atctgaagca ccaccagcga gcgagagcta 4500
gagagaagga aagccaccga cttcaccgcc tccgagctgc tccgggtcgc gggtctgcag 4560
cgtctccggc cctccgcgcc tacagctcaa gccacatccg aagggggagg gagccgggag 4620
ctgcgcgcgg ggccgccggg gggaggggtg gcaccgccca cgccgggcgg ccacgaaggg 4680
cggggcagcg ggcgcgcgcg cggcgggggg aggggccggc gccgcgcccg ctgggaattg 4740
gggccctagg gggagggcgg aggcgccgac gaccgcggca cttaccgttc gcggcgtggc 4800
gcccggtggt ccccaagggg agggaagggg gaggcggggc gaggacagtg accggagtct 4860
cctcagcggt ggcttttctg cttggcagcc tcagcggctg gcgccaaaac cggactccgc 4920
ccacttcctc gcccgccggt gcgagggtgt ggaatcctcc agacgctggg ggagggggag 4980
ttgggagctt aaaaactagt acccctttgg gaccactttc agcagcgaac tctcctgtac 5040
accaggggtc agttccacag acgcgggcca ggggtgggtc attgcggcgt gaacaataat 5100
ttgactagaa gttgattcgg gtgtttccgg aaggggccga gtcaatccgc cgagttgggg 5160
cacggaaaac aaaaagggaa ggctactaag atttttctgg cgggggttat cattggcgta 5220
actgcaggga ccacctcccg ggttgagggg gctggatctc caggctgcgg attaagcccc 5280
tcccgtcggc gttaatttca aactgcgcga cgtttctcac ctgccttcgc caaggcaggg 5340
gccgggaccc tattccaaga ggtagtaact agcaggactc tagccttccg caattcattg 5400
agcgcattta cggaagtaac gtcgggtact gtctctggcc gcaagggtgg gaggagtacg 5460
catttggcgt aaggtggggc gtagagcctt cccgccattg gcggcggata gggcgtttac 5520
gcgacggcct gacgtagcgg aagacgcgtt agtggggggg aaggttctag aaaagcggcg 5580
gcagcggctc tagcggcagt agcagcagcg ccgggtcccg tgcggaggtg ctcctcgcag 5640
agttgtttct cgagcagcgg cagttctcac tacagcgcca ggacgagtcc ggttcgtgtt 5700
cgtccgcgga gatctctctc atctcgctcg gctgcgggaa atcgggctga agcgactgag 5760
tccgcgatgg aggtaacggg tttgaaatca atgagttatt gaaaagggca tggcgaggcc 5820
gttggcgcct cagtggaagt cggccagccg cctccgtggg agagaggcag gaaatcggac 5880
caattcagta gcagtggggc ttaaggttta tgaacggggt cttgagcgga ggcctgagcg 5940
tacaaacagc ttccccaccc tcagcctccc ggcgccattt cccttcactg ggggtggggg 6000
atggggagct ttcacatggc ggacgctgcc ccgctggggt gaaagtgggg cgcggaggcg 6060
ggaattctta ttccctttct aaagcacgct gcttcggggg ccacggcgtc tcctcggcga 6120
gcgtttcggc gggcagcagg tcctcgtgag cgaggctgcg gagcttcccc tccccctctc 6180
tcccgggaac cgatttggcg gccgccattt tcatggctcg ccttcctctc agcgttttcc 6240
ttataactct tttattttct tagtgtgctt tctctatcaa gaagtagaag tggttaacta 6300
tttttttttt cttctcgggc tgttttcata tcgtttcgag gtggatttgg agtgttttgt 6360
gagcttggat ctttagagtc ctgcgcacct cattaaaggc gctcagcctt cccctcgatg 6420
aaatggcgcc attgcgttcg gaagccacac cgaagagcgg ggaggggggg tgctccgggt 6480
ttgcgggccc ggtttcagag aagatcccaa gcttcgaatt cgagctcgcc caactccgcc 6540
cgttttatga ctagaaccaa tagtttttaa tgccaaatgc actgaaatcc cctaatttgc 6600
aaagccaaac gccccctatg tgagtaatac ggggactttt tacccaattt cccaagcgga 6660
aagcccccta atacactcat atggcatatg aatcagcacg gtcatgcact ctaatggcgg 6720
cccataggga ctttccacat agggggcgtt caccatttcc cagcataggg gtggtgactc 6780
aatggccttt acccaagtac attgggtcaa tgggaggtaa gccaatgggt ttttcccatt 6840
actggcaagc acactgagtc aaatgggact ttccactggg ttttgcccaa gtacattggg 6900
tcaatgggag gtgagccaat gggaaaaacc cattgctgcc aagtacactg actcaatagg 6960
gactttccaa tgggtttttc cattgttggc aagcatataa ggtcaatgtg ggtgagtcaa 7020
tagggacttt ccattgtatt ctgcccagta cataaggtca atagggggtg aatcaacagg 7080
aaagtcccat tggagccaag tacactgcgt caatagggac tttccattgg gttttgccca 7140
gtacataagg tcaatagggg atgagtcaat gggaaaaacc cattggagcc aagtacactg 7200
actcaatagg gactttccat tgggttttgc ccagtacata aggtcaatag ggggtgagtc 7260
aacaggaaag tcccattgga gccaagtaca ttgagtcaat agggactttc caatgggttt 7320
tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt ttttcccatt actggcacgt 7380
atactgagtc attagggact ttccaatggg ttttgcccag tacataaggt caataggggt 7440
gaatcaacag gaaagtccca ttggagccaa gtacactgag tcaataggga ctttccattg 7500
ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa tgggtttttc ccattattgg 7560
cacgtacata aggtcaatag gggtgagtca ttgggttttt ccagccaatt taattaaaac 7620
gccatgtact ttcccaccat tgacgtcaat gggctattga aactaatgca acgtgacctt 7680
taaacggtac tttcccatag ctgattaatg ggaaagtacc gttctcgagc caatacacgt 7740
caatgggaag tgaaagggca gccaaaacgt aacaccgccc cggttttccc ctggaaattc 7800
catattggca cgcattctat tggctgagct gcgttctacg tgggtataag aggcgcgacc 7860
agcgtcggta ccgtcgcagt cttcggtctg accaccgtag aacgcagagc tcctcgctgc 7920
agcccgggtc tagaggatcc gcctgagaaa ggaagtgagc tgtaaaggct gagctctctc 7980
tctgacgtat gtagcctctg gttagcttcg tcactcactg ttcttgactc agcatggcaa 8040
tctgatgaaa tcccagctgt aagtctgcag aaattgatga tctattaaac aataaagatg 8100
tccactaaaa tggaagtttt tcctgtcata ctttgttaag aagggtgaga acagagtacc 8160
tacattttga atggaaggat tggagctacg ggggtggggg tggggtggga ttagataaat 8220
gcctgctctt tactgaaggc tctttactat tgctttatga taatgtttca tagttggata 8280
tcataattta aacaagcaaa accaaattaa gggccagctc attcctccag atccactagt 8340
aattctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag 8400
aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc 8460
cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc 8520
cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg 8580
ctgactaatt ttttttattt atgcagaggc cgaggccgcc tctgcctctg agctattcca 8640
gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagctcc cgggagcttg 8700
tatatccatt ttcggatctg atcaagagac aggatgagga tcgtttcgca tgattgaaca 8760
agatggattg cacgcaggtt ctccggccgc ttgggtggag aggctattcg gctatgactg 8820
ggcacaacag acaatcggct gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg 8880
cccggttctt tttgtcaaga ccgacctgtc cggtgccctg aatgaactgc aggacgaggc 8940
agcgcggcta tcstggctgg ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt 9000
cactgaagcg ggaagggact ggctgctatt gggcgaagtg ccggggcagg atctcctgtc 9060
atctcacctt gctcctgccg agaaagtatc catcatggct gatgcaatgc ggcggctgca 9120
tacgcttgat ccggctacct gcccattcga ccaccaagcg aaacatcgca tcgagcgagc 9180
acgtactcgg atggaagccg gtcttgtcga tcaggatgat ctggacgaag agcatcaggg 9240
gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc atgcccgacg gcgaggatct 9300
cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc 9360
tggattcatc gactgtggcc ggctgggtgt ggcggaccgc tatcaggaca tagcgttggc 9420
tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta 9480
cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg acgagttctt 9540
ctgagcggga ctctggggtt cgaaatgacc gaccaagcga cgcccaacct gccatcacga 9600
gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 9660
gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac 9720
ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 9780
aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 9840
catgtctgta taccgtcgag actagttcta gagcggccgc caccgcggtg gagctccagc 9900
ttttgttccc tttagtgagg gttaatttcg agcttggcgt aatcatggtc atagctgttt 9960
cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag 10020
tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg 10080
cccgctttcc agtcgggaaa cctgtcgtgc cagggggtac ctaggccggg caacaattgg 10140
cggccggccg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 10200
tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt 10260
gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg 10320
cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag 10380
atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg 10440
agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg 10500
gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt 10560
ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga 10620
cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac 10680
ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc 10740
atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc 10800
gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac 10860
tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag 10920
gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg 10980
gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta 11040
tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg 11100
ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccctagg ccgggcaaca 11160
attggcggcc ggccctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 11220
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 11280
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 11340
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 11400
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 11460
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 11520
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 11580
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 11640
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 11700
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 11760
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 11820
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 11880
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 11940
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 12000
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tc 12052
<210>30
<211>11941
<212>DNA
<213>载体
<400>30
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgacggtatc aaggtggcga ccggaatggt 300
gagctgcgag aatagccggg cgcgctgtga gccgaagtcg cccccgccct ggccacttcc 360
ggcgcgccga gtccttaggc cgccaggggg cgccggcgcg cgcccagatt ggggacaaag 420
gaagccgggc cggccgcgtt attaccataa aaggcaaaca ctggtcggag gcgtccccgc 480
ggcgcgcggc aggaagccag gccccaaccc cctcccaacc gggcgccagc cccgcctccg 540
cccggttcaa acagcgaccg ggtcgcgcgc gcgcacgcag cggccacacc ctcgggcgcc 600
agcggctcgg gcaggaagtg gcgcaagcgc ccgggcccca gaacgcacgc gcgattagcg 660
ccattgagtc ccagcgcgca cgcgcaatta gcgccaattc ccagcgcgca cgcagttagc 720
gcccaaagga ccagcgcgca cgcgcatggc gccccagccc ccaccgggcc tgacgggggc 780
tacgccgcgc ccaccgtgcg atccccattg gcaagagccc ggctcagaca aagaccccgc 840
cggttgcccc cgccccgaga gcggcacccc cggagcgcgc ccgcccgagc gcggcctcgc 900
gcctgcgaac tggcgtgggg tgtcccccat ctccggaggc ccaggggctt ctcccgcgcc 960
ccccacggcg gtccggttcc gccccatgcg ccccccgctg cggcccagac ggcggctctg 1020
cacgggcgaa gggccgcggc cgcatgcccc ggtcggctgg ccgggcttac ctggcggcgg 1080
gtgtggacgg gcggcggatc ggcaaaggcg aggctctgtg ctcgcgggcg gacgcggtct 1140
cggcggtggt ggcgcgtcgc gccgctgggt tttatagggc gccgccgcgg ccgctcgagc 1200
cataaaaggc aactttcgga acggcgcacg ctgattggcc ccgcgccgct cactcaccgg 1260
cttcgccgca cagtgcagca tttttttacc ccctctcccc tccttttgcg aaaaaaaaaa 1320
agagcgagag cgagattgag gaagaggagg agggagagtt ttggcgttgg ccgccttggg 1380
gtgctgggcc cgggggctgg gggcgcgcgc cgtggccccc gcgccccacg ctgggcagtg 1440
cccggttcgg ccccgcatgg ccaggcctgc ccccggcctg cccgtctctc gggcccccca 1500
cccaccgcgg gacatcctag gtgtggacat ctcttgggca ctgagcgccc aggtggggtg 1560
ggccagggtc tgcacgggtg ccagggccct gggttctgta cgctcctgca gaaggagctc 1620
ttggagggca tggagtggcc aggcagtcac tcccccttgc cgacttcaga gcaactgccc 1680
tgaaagcagg gcctgaggac ctctggctgt ggggctcagc tagctaaatg tgctgggtgg 1740
gtcactaggg agagacctgg gcttgagagg tagagtgtgg tgttggggga gtcaggtggc 1800
ttgcggccat tagagtcgca ggaccacact ccccaggaca gggcaggggc cagcggtcca 1860
gtggctggag gtggcccgtg atgaaggcta caaacctacc cagccgcagc cctgggaagg 1920
aagtgggctc tacagggcag ggcacctttt accctggagc tgcctgcttt tgagggtaac 1980
agtcacgccc agccaagacc aggcctgggg cgttagtggg tgacctaggc actgcggggc 2040
gggggggctg ggtctacaca gcctgggtct gggcccaccg tccgttgtat gtctgctatg 2100
cgcagccaca gctgaactgc cctcccagac catctggagg ccgctggggg actctgggga 2160
ccaagactcc atgtgccaca gaggattggg ggcggggcgg tgctaggaac tcaaagccag 2220
cctgggaaga ccctgtcctt gtcacccttt cttgccttgg gtctgtccac tgagtagcac 2280
acaagaccgg gtgggcaggg tccgttctgc tccgggaatc acagactgtg tgtacccagg 2340
tggtgggcat gcagcgatca gtggcgtggg accacagagg gggcccgcgg taccaagctt 2400
gggaattgcg tgcaaaaaca acttctgttt tccagggtaa acagaatcta atgcagaatc 2460
taatgcaggg taaacagact taatgcagaa tctaatgatg gcacaaatta aaaatcacta 2520
acgtgccctt tttagtgtga aacccagaga gagcacatac aagccaaaaa caaatgcttt 2580
attttaccta ggagacatta acattcacct ttacgtgttt aagattaatg caatgttaaa 2640
tattgtgaaa actgtaactt tgaatttcat gatttttatg tgaatattcc agggtttaaa 2700
aaaacttgta acatgacatg gctgaataag ataaaaaaaa aatctagcct tttctccctt 2760
ctggctcata tttgcgattt cgatcatttt gtttaaaaaa caaaacactg caatgaatta 2820
aacttaatat tcttctatgt tttagagtaa gttaaaacaa gataaagtga ccaaagtaat 2880
ttgaaagatt caatgacttt tgctccaacc taggtgcaca aggtaccttg ttctttaaat 2940
tgggctttaa tgaaaatact tctccagaat tctggggatt taagaaaaat tatgccaacc 3000
aacaagggct ttaccatttt atgtaacatt tttcaacgct gcaaaaatgt gtgtatttct 3060
atttgaagat aaaaatcctc agcaaaatcc acattgcact gtccttcaaa gattagcctt 3120
ctttgaacta gttaagacac tattaagcca agccagtatc tccctgtaat gaattcgttt 3180
ttctcttaat tttcccctgt aatttacact gggagagctg ggaaatatgt ggatgtaaat 3240
ttctcagcca cagagatgca aagttatact gtggggaaaa aaaacttgag ttaaatcctt 3300
acatatttta ggttttcatt aacttaccaa tgtagttttg ttggaggcca ttttttttat 3360
tgcagacttg aagagctatt actagaaaaa tgcatgacag ttaaggtaag tttgcatgac 3420
acaaaaaagg taactaaata caaattctgt ttggattcca acccccaagt agagagcgca 3480
cactttcaaa cgtgaataca aatccagagt agatctgcgc tcctacctac attgcttatg 3540
atgtacttaa gtacgtgtcc taaccatgtg agtctagaaa gactttactg gggatcctgg 3600
tacctaaaac agcttcacat ggcttaaaat aggggaccaa tgtcttttcc aatctaagtc 3660
ccatttataa taaagtccat gttccatttt taaaggacaa tcctttcggt ttaaaaccag 3720
gcacgattac ccaaacaact cacaacggta aagcactgtg aatcttctct gttctgcaat 3780
cccaacttgg tttctgctca gaaaccctcc ctctttccaa tcggtaatta aataacaaaa 3840
ggaaaaaact taagatgctt caaccccgtt tcgtgacact ttgaaaaaag aatcacctct 3900
tgcaaacacc cgctcccgac ccccgccgct gaagcccggc gtccagaggc ctaagcgcgg 3960
gtgcccgccc ccacccggga gcgcgggcct cgtggtcagc gcatccgcgg ggagaaacaa 4020
aggccgcggc acgggggctc aagggcactg cgccacaccg cacgcgccta cccccgcgcg 4080
gccacgttaa ctggcggtcg ccgcagcctc gggacagccg gccgcgcgcc gccaggctcg 4140
cggacgcggg accacgcgcc gccctccggg aggcccaagt ctcgacccag ccccgcgtgg 4200
cgctggggga gggggcgcct ccgccggaac gcgggtgggg gaggggaggg ggaaatgcgc 4260
tttgtctcga aatggggcaa ccgtcgccac agctccctac cccctcgagg gcagagcagt 4320
ccccccacta actaccgggc tggccgcgcg ccaggccagc cgcgaggcca ccgcccgacc 4380
ctccactcct tcccgcagct cccggcgcgg ggtccggcga gaaggggagg ggaggggagc 4440
ggagaaccgg gcccccggga cgcgtgtggc atctgaagca ccaccagcga gcgagagcta 4500
gagagaagga aagccaccga cttcaccgcc tccgagctgc tccgggtcgc gggtctgcag 4560
cgtctccggc cctccgcgcc tacagctcaa gccacatccg aagggggagg gagccgggag 4620
ctgcgcgcgg ggccgccggg gggaggggtg gcaccgccca cgccgggcgg ccacgaaggg 4680
cggggcagcg ggcgcgcgcg cggcgggggg aggggccggc gccgcgcccg ctgggaattg 4740
gggccctagg gggagggcgg aggcgccgac gaccgcggca cttaccgttc gcggcgtggc 4800
gcccggtggt ccccaagggg agggaagggg gaggcggggc gaggacagtg accggagtct 4860
cctcagcggt ggcttttctg cttggcagcc tcagcggctg gcgccaaaac cggactccgc 4920
ccacttcctc gcccgccggt gcgagggtgt ggaatcctcc agacgctggg ggagggggag 4980
ttgggagctt aaaaactagt acccctttgg gaccactttc agcagcgaac tctcctgtac 5040
accaggggtc agttccacag acgcgggcca ggggtgggtc attgcggcgt gaacaataat 5100
ttgactagaa gttgattcgg gtgtttccgg aaggggccga gtcaatccgc cgagttgggg 5160
cacggaaaac aaaaagggaa ggctactaag atttttctgg cgggggttat cattggcgta 5220
actgcaggga ccacctcccg ggttgagggg gctggatctc caggctgcgg attaagcccc 5280
tcccgtcggc gttaatttca aactgcgcga cgtttctcac ctgccttcgc caaggcaggg 5340
gccgggaccc tattccaaga ggtagtaact agcaggactc tagccttccg caattcattg 5400
agcgcattta cggaagtaac gtcgggtact gtctctggcc gcaagggtgg gaggagtacg 5460
catttggcgt aaggtggggc gtagagcctt cccgccattg gcggcggata gggcgtttac 5520
gcgacggcct gacgtagcgg aagacgcgtt agtggggggg aaggttctag aaaagcggcg 5580
gcagcggctc tagcggcagt agcagcagcg ccgggtcccg tgcggaggtg ctcctcgcag 5640
agttgtttct cgagcagcgg cagttctcac tacagcgcca ggacgagtcc ggttcgtgtt 5700
cgtccgcgga gatctctctc atctcgctcg gctgcgggaa atcgggctga agcgactgag 5760
tccgcgatgg aggtaacggg tttgaaatca atgagttatt gaaaagggca tggcgaggcc 5820
gttggcgcct cagtggaagt cggccagccg cctccgtggg agagaggcag gaaatcggac 5880
caattcagta gcagtggggc ttaaggttta tgaacggggt cttgagcgga ggcctgagcg 5940
tacaaacagc ttccccaccc tcagcctccc ggcgccattt cccttcactg ggggtggggg 6000
atggggagct ttcacatggc ggacgctgcc ccgctggggt gaaagtgggg cgcggaggcg 6060
ggaattctta ttccctttct aaagcacgct gcttcggggg ccacggcgtc tcctcggcga 6120
gcgtttcggc gggcagcagg tcctcgtgag cgaggctgcg gagcttcccc tccccctctc 6180
tcccgggaac cgatttggcg gccgccattt tcatggctcg ccttcctctc agcgttttcc 6240
ttataactct tttattttct tagtgtgctt tctctatcaa gaagtagaag tggttaacta 6300
tttttttttt cttctcgggc tgttttcata tcgtttcgag gtggatttgg agtgttttgt 6360
gagcttggat ctttagagtc ctgcgcacct cattaaaggc gctcagcctt cccctcgatg 6420
aaatggcgcc attgcgttcg gaagccacac cgaagagcgg ggaggggggg tgctccgggt 6480
ttgcgggccc ggtttcagag aagatcccaa gcttcgaatt cgagctcgcc caactccgcc 6540
cgttttatga ctagaaccaa tagtttttaa tgccaaatgc actgaaatcc cctaatttgc 6600
aaagccaaac gccccctatg tgagtaatac ggggactttt tacccaattt cccaagcgga 6660
aagcccccta atacactcat atggcatatg aatcagcacg gtcatgcact ctaatggcgg 6720
cccataggga ctttccacat agggggcgtt caccatttcc cagcataggg gtggtgactc 6780
aatggccttt acccaagtac attgggtcaa tgggaggtaa gccaatgggt ttttcccatt 6840
actggcaagc acactgagtc aaatgggact ttccactggg ttttgcccaa gtacattggg 6900
tcaatgggag gtgagccaat gggaaaaacc cattgctgcc aagtacactg actcaatagg 6960
gactttccaa tgggtttttc cattgttggc aagcatataa ggtcaatgtg ggtgagtcaa 7020
tagggacttt ccattgtatt ctgcccagta cataaggtca atagggggtg aatcaacagg 7080
aaagtcccat tggagccaag tacactgcgt caatagggac tttccattgg gttttgccca 7140
gtacataagg tcaatagggg atgagtcaat gggaaaaacc cattggagcc aagtacactg 7200
actcaatagg gactttccat tgggttttgc ccagtacata aggtcaatag ggggtgagtc 7260
aacaggaaag tcccattgga gccaagtaca ttgagtcaat agggactttc caatgggttt 7320
tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt ttttcccatt actggcacgt 7380
atactgagtc attagggact ttccaatggg ttttgcccag tacataaggt caataggggt 7440
gaatcaacag gaaagtccca ttggagccaa gtacactgag tcaataggga ctttccattg 7500
ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa tgggtttttc ccattattgg 7560
cacgtacata aggtcaatag gggtgagtca ttgggttttt ccagccaatt taattaaaac 7620
gccatgtact ttcccaccat tgacgtcaat gggctattga aactaatgca acgtgacctt 7680
taaacggtac tttcccatag ctgattaatg ggaaagtacc gttctcgagc caatacacgt 7740
caatgggaag tgaaagggca gccaaaacgt aacaccgccc cggttttccc ctggaaattc 7800
catattggca cgcattctat tggctgagct gcgttctacg tgggtataag aggcgcgacc 7860
agcgtcggta ccgtcgcagt cttcggtctg accaccgtag aacgcagagc tcctcgctgc 7920
agcccgggtc tagaggatcc gcctgagaaa ggaagtgagc tgtaaaggct gagctctctc 7980
tctgacgtat gtagcctctg gttagcttcg tcactcactg ttcttgactc agcatggcaa 8040
tctgatgaaa tcccagctgt aagtctgcag aaattgatga tctattaaac aataaagatg 8100
tccactaaaa tggaagtttt tcctgtcata ctttgttaag aagggtgaga acagagtacc 8160
tacattttga atggaaggat tggagctacg ggggtggggg tggggtggga ttagataaat 8220
gcctgctctt tactgaaggc tctttactat tgctttatga taatgtttca tagttggata 8280
tcataattta aacaagcaaa accaaattaa gggccagctc attcctccag atccactagt 8340
tctagagcaa attctaccgg gtaggggagg cgcttttccc aaggcagtct ggagcatgcg 8400
ctttagcagc cccgctgggc acttggcgct acacaagtgg cctctggcct cgcacacatt 8460
ccacatccac cggtaggcgc caaccggctc cgttctttgg tggccccttc gcgccacctt 8520
ctactcctcc cctagtcagg aagttccccc ccgccccgca gctcgcgtcg tgcaggacgt 8580
gacaaatgga agtagcacgt ctcactagtc tcgtgcagat ggacagcacc gctgagcaat 8640
ggaagcgggt aggcctttgg ggcagcggcc aatagcagct ttgctccttc gctttctggg 8700
ctcagaggct gggaaggggt gggtccgggg gcgggctcag gggcgggctc aggggcgggg 8760
cgggcgcccg aaggtcctcc ggaggcccgg cattctgcac gcttcaaaag cgcacgtctg 8820
ccgcgctgtt ctcctcttcc tcatctccgg gcctttcgac cagcttacca tgaccgagta 8880
caagcccacg gtgcgcctcg ccacccgcga cgacgtcccc agggccgtac gcaccctcgc 8940
cgccgcgttc gccgactacc ccgccacgcg ccacaccgtc gatccggacc gccacatcga 9000
gcgggtcacc gagctgcaag aactcttcct cacgcgcgtc gggctcgaca tcggcaaggt 9060
gtgggtcgcg gacgacggcg ccgcggtggc ggtctggacc acgccggaga gcgtcgaagc 9120
gggggcggtg ttcgccgaga tcggcccgcg catggccgag ttgagcggtt cccggctggc 9180
cgcgcagcaa cagatggaag gcctcctggc gccgcaccgg cccaaggagc ccgcgtggtt 9240
cctggccacc gtcggcgtct cgcccgacca ccagggcaag ggtctgggca gcgccgtcgt 9300
gctccccgga gtggaggcgg ccgagcgcgc cggggtgccc gccttcctgg agacctccgc 9360
gccccgcaac ctccccttct acgagcggct cggcttcacc gtcaccgccg acgtcgaggt 9420
gcccgaagga ccgcgcacct ggtgcatgac ccgcaagccc ggtgcctgac gcccgcccca 9480
cgacccgcag cgcccgaccg aaaggagcgc acgaccccat gcataggttg ggcttcggaa 9540
tcgttttccg ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct 9600
tcgcccaccc caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca 9660
caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca 9720
tcaatgtatc ttatcatgtc tgtataccgt cgagatctag agcggccgcc accgcggtgg 9780
agctccagct tttgttccct ttagtgaggg ttaatttcga gcttggcgta atcatggtca 9840
tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 9900
agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 9960
cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agggggtacc taggccgggc 10020
aacaattggc ggccggccgc acttttcggg gaaatgtgcg cggaacccct atttgtttat 10080
ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc 10140
aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct 10200
tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag 10260
atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta 10320
agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc 10380
tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca 10440
tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg 10500
atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg 10560
ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca 10620
tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa 10680
acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa 10740
ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata 10800
aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat 10860
ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc 10920
cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata 10980
gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccctaggc 11040
cgggcaacaa ttggcggccg gccctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 11100
gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 11160
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 11220
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 11280
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 11340
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 11400
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 11460
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 11520
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 11580
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 11640
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 11700
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 11760
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 11820
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 11880
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 11940
c 11941
<210>31
<211>11216
<212>DNA
<213>载体
<220>
<221>misc_特征
<222>8117
<223>n=A,T,C或G
<400>31
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgacggtatc aaggtggcga ccggaatggt 300
gagctgcgag aatagccggg cgcgctgtga gccgaagtcg cccccgccct ggccacttcc 360
ggcgcgccga gtccttaggc cgccaggggg cgccggcgcg cgcccagatt ggggacaaag 420
gaagccgggc cggccgcgtt attaccataa aaggcaaaca ctggtcggag gcgtccccgc 480
ggcgcgcggc aggaagccag gccccaaccc cctcccaacc gggcgccagc cccgcctccg 540
cccggttcaa acagcgaccg ggtcgcgcgc gcgcacgcag cggccacacc ctcgggcgcc 600
agcggctcgg gcaggaagtg gcgcaagcgc ccgggcccca gaacgcacgc gcgattagcg 660
ccattgagtc ccagcgcgca cgcgcaatta gcgccaattc ccagcgcgca cgcagttagc 720
gcccaaagga ccagcgcgca cgcgcatggc gccccagccc ccaccgggcc tgacgggggc 780
tacgccgcgc ccaccgtgcg atccccattg gcaagagccc ggctcagaca aagaccccgc 840
cggttgcccc cgccccgaga gcggcacccc cggagcgcgc ccgcccgagc gcggcctcgc 900
gcctgcgaac tggcgtgggg tgtcccccat ctccggaggc ccaggggctt ctcccgcgcc 960
ccccacggcg gtccggttcc gccccatgcg ccccccgctg cggcccagac ggcggctctg 1020
cacgggcgaa gggccgcggc cgcatgcccc ggtcggctgg ccgggcttac ctggcggcgg 1080
gtgtggacgg gcggcggatc ggcaaaggcg aggctctgtg ctcgcgggcg gacgcggtct 1140
cggcggtggt ggcgcgtcgc gccgctgggt tttatagggc gccgccgcgg ccgctcgagc 1200
cataaaaggc aactttcgga acggcgcacg ctgattggcc ccgcgccgct cactcaccgg 1260
cttcgccgca cagtgcagca tttttttacc ccctctcccc tccttttgcg aaaaaaaaaa 1320
agagcgagag cgagattgag gaagaggagg agggagagtt ttggcgttgg ccgccttggg 1380
gtgctgggcc cgggggctgg gggcgcgcgc cgtggccccc gcgccccacg ctgggcagtg 1440
cccggttcgg ccccgcatgg ccaggcctgc ccccggcctg cccgtctctc gggcccccca 1500
cccaccgcgg gacatcctag gtgtggacat ctcttgggca ctgagcgccc aggtggggtg 1560
ggccagggtc tgcacgggtg ccagggccct gggttctgta cgctcctgca gaaggagctc 1620
ttggagggca tggagtggcc aggcagtcac tcccccttgc cgacttcaga gcaactgccc 1680
tgaaagcagg gcctgaggac ctctggctgt ggggctcagc tagctaaatg tgctgggtgg 1740
gtcactaggg agagacctgg gcttgagagg tagagtgtgg tgttggggga gtcaggtggc 1800
ttgcggccat tagagtcgca ggaccacact ccccaggaca gggcaggggc cagcggtcca 1860
gtggctggag gtggcccgtg atgaaggcta caaacctacc cagccgcagc cctgggaagg 1920
aagtgggctc tacagggcag ggcacctttt accctggagc tgcctgcttt tgagggtaac 1980
agtcacgccc agccaagacc aggcctgggg cgttagtggg tgacctaggc actgcggggc 2040
gggggggctg ggtctacaca gcctgggtct gggcccaccg tccgttgtat gtctgctatg 2100
cgcagccaca gctgaactgc cctcccagac catctggagg ccgctggggg actctgggga 2160
ccaagactcc atgtgccaca gaggattggg ggcggggcgg tgctaggaac tcaaagccag 2220
cctgggaaga ccctgtcctt gtcacccttt cttgccttgg gtctgtccac tgagtagcac 2280
acaagaccgg gtgggcaggg tccgttctgc tccgggaatc acagactgtg tgtacccagg 2340
tggtgggcat gcagcgatca gtggcgtggg accacagagg gggcccgcgg taccaagctt 2400
gggaattgcg tgcaaaaaca acttctgttt tccagggtaa acagaatcta atgcagaatc 2460
taatgcaggg taaacagact taatgcagaa tctaatgatg gcacaaatta aaaatcacta 2520
acgtgccctt tttagtgtga aacccagaga gagcacatac aagccaaaaa caaatgcttt 2580
attttaccta ggagacatta acattcacct ttacgtgttt aagattaatg caatgttaaa 2640
tattgtgaaa actgtaactt tgaatttcat gatttttatg tgaatattcc agggtttaaa 2700
aaaacttgta acatgacatg gctgaataag ataaaaaaaa aatctagcct tttctccctt 2760
ctggctcata tttgcgattt cgatcatttt gtttaaaaaa caaaacactg caatgaatta 2820
aacttaatat tcttctatgt tttagagtaa gttaaaacaa gataaagtga ccaaagtaat 2880
ttgaaagatt caatgacttt tgctccaacc taggtgcaca aggtaccttg ttctttaaat 2940
tgggctttaa tgaaaatact tctccagaat tctggggatt taagaaaaat tatgccaacc 3000
aacaagggct ttaccatttt atgtaacatt tttcaacgct gcaaaaatgt gtgtatttct 3060
atttgaagat aaaaatcctc agcaaaatcc acattgcact gtccttcaaa gattagcctt 3120
ctttgaacta gttaagacac tattaagcca agccagtatc tccctgtaat gaattcgttt 3180
ttctcttaat tttcccctgt aatttacact gggagagctg ggaaatatgt ggatgtaaat 3240
ttctcagcca cagagatgca aagttatact gtggggaaaa aaaacttgag ttaaatcctt 3300
acatatttta ggttttcatt aacttaccaa tgtagttttg ttggaggcca ttttttttat 3360
tgcagacttg aagagctatt actagaaaaa tgcatgacag ttaaggtaag tttgcatgac 3420
acaaaaaagg taactaaata caaattctgt ttggattcca acccccaagt agagagcgca 3480
cactttcaaa cgtgaataca aatccagagt agatctgcgc tcctacctac attgcttatg 3540
atgtacttaa gtacgtgtcc taaccatgtg agtctagaaa gactttactg gggatcctgg 3600
tacctaaaac agcttcacat ggcttaaaat aggggaccaa tgtcttttcc aatctaagtc 3660
ccatttataa taaagtccat gttccatttt taaaggacaa tcctttcggt ttaaaaccag 3720
gcacgattac ccaaacaact cacaacggta aagcactgtg aatcttctct gttctgcaat 3780
cccaacttgg tttctgctca gaaaccctcc ctctttccaa tcggtaatta aataacaaaa 3840
ggaaaaaact taagatgctt caaccccgtt tcgtgacact ttgaaaaaag aatcacctct 3900
tgcaaacacc cgctcccgac ccccgccgct gaagcccggc gtccagaggc ctaagcgcgg 3960
gtgcccgccc ccacccggga gcgcgggcct cgtggtcagc gcatccgcgg ggagaaacaa 4020
aggccgcggc acgggggctc aagggcactg cgccacaccg cacgcgccta cccccgcgcg 4080
gccacgttaa ctggcggtcg ccgcagcctc gggacagccg gccgcgcgcc gccaggctcg 4140
cggacgcggg accacgcgcc gccctccggg aggcccaagt ctcgacccag ccccgcgtgg 4200
cgctggggga gggggcgcct ccgccggaac gcgggtgggg gaggggaggg ggaaatgcgc 4260
tttgtctcga aatggggcaa ccgtcgccac agctccctac cccctcgagg gcagagcagt 4320
ccccccacta actaccgggc tggccgcgcg ccaggccagc cgcgaggcca ccgcccgacc 4380
ctccactcct tcccgcagct cccggcgcgg ggtccggcga gaaggggagg ggaggggagc 4440
ggagaaccgg gcccccggga cgcgtgtggc atctgaagca ccaccagcga gcgagagcta 4500
gagagaagga aagccaccga cttcaccgcc tccgagctgc tccgggtcgc gggtctgcag 4560
cgtctccggc cctccgcgcc tacagctcaa gccacatccg aagggggagg gagccgggag 4620
ctgcgcgcgg ggccgccggg gggaggggtg gcaccgccca cgccgggcgg ccacgaaggg 4680
cggggcagcg ggcgcgcgcg cggcgggggg aggggccggc gccgcgcccg ctgggaattg 4740
gggccctagg gggagggcgg aggcgccgac gaccgcggca cttaccgttc gcggcgtggc 4800
gcccggtggt ccccaagggg agggaagggg gaggcggggc gaggacagtg accggagtct 4860
cctcagcggt ggcttttctg cttggcagcc tcagcggctg gcgccaaaac cggactccgc 4920
ccacttcctc gcccgccggt gcgagggtgt ggaatcctcc agacgctggg ggagggggag 4980
ttgggagctt aaaaactagt acccctttgg gaccactttc agcagcgaac tctcctgtac 5040
accaggggtc agttccacag acgcgggcca ggggtgggtc attgcggcgt gaacaataat 5100
ttgactagaa gttgattcgg gtgtttccgg aaggggccga gtcaatccgc cgagttgggg 5160
cacggaaaac aaaaagggaa ggctactaag atttttctgg cgggggttat cattggcgta 5220
actgcaggga ccacctcccg ggttgagggg gctggatctc caggctgcgg attaagcccc 5280
tcccgtcggc gttaatttca aactgcgcga cgtttctcac ctgccttcgc caaggcaggg 5340
gccgggaccc tattccaaga ggtagtaact agcaggactc tagccttccg caattcattg 5400
agcgcattta cggaagtaac gtcgggtact gtctctggcc gcaagggtgg gaggagtacg 5460
catttggcgt aaggtggggc gtagagcctt cccgccattg gcggcggata gggcgtttac 5520
gcgacggcct gacgtagcgg aagacgcgtt agtggggggg aaggttctag aaaagcggcg 5580
gcagcggctc tagcggcagt agcagcagcg ccgggtcccg tgcggaggtg ctcctcgcag 5640
agttgtttct cgagcagcgg cagttctcac tacagcgcca ggacgagtcc ggttcgtgtt 5700
cgtccgcgga gatctctctc atctcgctcg gctgcgggaa atcgggctga agcgactgag 5760
tccgcgatgg aggtaacggg tttgaaatca atgagttatt gaaaagggca tggcgaggcc 5820
gttggcgcct cagtggaagt cggccagccg cctccgtggg agagaggcag gaaatcggac 5880
caattcagta gcagtggggc ttaaggttta tgaacggggt cttgagcgga ggcctgagcg 5940
tacaaacagc ttccccaccc tcagcctccc ggcgccattt cccttcactg ggggtggggg 6000
atggggagct ttcacatggc ggacgctgcc ccgctggggt gaaagtgggg cgcggaggcg 6060
ggaattctta ttccctttct aaagcacgct gcttcggggg ccacggcgtc tcctcggcga 6120
gcgtttcggc gggcagcagg tcctcgtgag cgaggctgcg gagcttcccc tccccctctc 6180
tcccgggaac cgatttggcg gccgccattt tcatggctcg ccttcctctc agcgttttcc 6240
ttataactct tttattttct tagtgtgctt tctctatcaa gaagtagaag tggttaacta 6300
tttttttttt cttctcgggc tgttttcata tcgtttcgag gtggatttgg agtgttttgt 6360
gagcttggat ctttagagtc ctgcgcacct cattaaaggc gctcagcctt cccctcgatg 6420
aaatggcgcc attgcgttcg gaagccacac cgaagagcgg ggaggggggg tgctccgggt 6480
ttgcgggccc ggtttcagag aagatcccaa gcttattaat agtaatcaat tacggggtca 6540
ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct 6600
ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta 6660
acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac 6720
ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 6780
aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag 6840
tacatctacg tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat 6900
gggcgtggat agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat 6960
gggagtttgt tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc 7020
ccattgacgc aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctggt 7080
ttagtgaacc gtcagatcgg atccgcctga gaaaggaagt gagctgtaaa ggctgagctc 7140
tctctctgac gtatgtagcc tctggttagc ttcgtcactc actgttcttg actcagcatg 7200
gcaatctgat gaaatcccag ctgtaagtct gcagaaattg atgatctatt aaacaataaa 7260
gatgtccact aaaatggaag tttttcctgt catactttgt taagaagggt gagaacagag 7320
tacctacatt ttgaatggaa ggattggagc tacgggggtg ggggtggggt gggattagat 7380
aaatgcctgc tctttactga aggctcttta ctattgcttt atgataatgt ttcatagttg 7440
gatatcataa tttaaacaag caaaaccaaa ttaagggcca gctcattcct ccagatccac 7500
tagtaattct gtggaatgtg tgtcagttag ggtgtggaaa gtccccaggc tccccagcag 7560
gcagaagtat gcaaagcatg catctcaatt agtcagcaac caggtgtgga aagtccccag 7620
gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accatagtcc 7680
cgcccctaac tccgcccatc ccgcccctaa ctccgcccag ttccgcccat tctccgcccc 7740
atggctgact aatttttttt atttatgcag aggccgaggc cgcctctgcc tctgagctat 7800
tccagaagta gtgaggaggc ttttttggag gcctaggctt ttgcaaaaag ctcccgggag 7860
cttgtatatc cattttcgga tctgatcaag agacaggatg aggatcgttt cgcatgattg 7920
aacaagatgg attgcacgca ggttctccgg ccgcttgggt ggagaggcta ttcggctatg 7980
actgggcaca acagacaatc ggctgctctg atgccgccgt gttccggctg tcagcgcagg 8040
ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg 8100
aggcagcgcg gctatcstgg ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg 8160
ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg caggatctcc 8220
tgtcatctca ccttgctcct gccgagaaag tatccatcat ggctgatgca atgcggcggc 8280
tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat cgcatcgagc 8340
gagcacgtac tcggatggaa gccggtcttg tcgatcagga tgatctggac gaagagcatc 8400
aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc gcgcatgccc gacggcgagg 8460
atctcgtcgt gacccatggc gatgcctgct tgccgaatat catggtggaa aatggccgct 8520
tttctggatt catcgactgt ggccggctgg gtgtggcgga ccgctatcag gacatagcgt 8580
tggctacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc 8640
tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt 8700
tcttctgagc gggactctgg ggttcgaaat gaccgaccaa gcgacgccca acctgccatc 8760
acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg 8820
ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc 8880
caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 8940
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 9000
ttatcatgtc tgtataccgt cgagactagt tctagagcgg ccgccaccgc ggtggagctc 9060
cagcttttgt tccctttagt gagggttaat ttcgagcttg gcgtaatcat ggtcatagct 9120
gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat 9180
aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc 9240
actgcccgct ttccagtcgg gaaacctgtc gtgccagggg gtacctaggc cgggcaacaa 9300
ttggcggccg gccgcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 9360
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 9420
tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 9480
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 9540
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 9600
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 9660
tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 9720
tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 9780
atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 9840
ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 9900
gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 9960
gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 10020
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 10080
gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 10140
gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 10200
cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 10260
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagaccc taggccgggc 10320
aacaattggc ggccggccct gcattaatga atcggccaac gcgcggggag aggcggtttg 10380
cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 10440
cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 10500
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 10560
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 10620
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 10680
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 10740
ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 10800
taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 10860
gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 10920
gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 10980
ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg 11040
ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 11100
gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 11160
caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactc 11216
<210>32
<211>11105
<212>DNA
<213>载体
<400>32
acgttgtaaa acgacggcca gtgaattgta atacgactca ctatagggcg aattgggtac 60
cgggcccccc ctcgaggtcg agttggggtg gggaaaagga agaaacgcgg gcgtattggc 120
cccaatgggg tctcggtggg gtatcgacag agtgccagcc ctgggaccga accccgcgtt 180
tatgaacaaa cgacccaaca cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg 240
cgggttcctt ccggtattgt ctccttccgt cgacggtatc aaggtggcga ccggaatggt 300
gagctgcgag aatagccggg cgcgctgtga gccgaagtcg cccccgccct ggccacttcc 360
ggcgcgccga gtccttaggc cgccaggggg cgccggcgcg cgcccagatt ggggacaaag 420
gaagccgggc cggccgcgtt attaccataa aaggcaaaca ctggtcggag gcgtccccgc 480
ggcgcgcggc aggaagccag gccccaaccc cctcccaacc gggcgccagc cccgcctccg 540
cccggttcaa acagcgaccg ggtcgcgcgc gcgcacgcag cggccacacc ctcgggcgcc 600
agcggctcgg gcaggaagtg gcgcaagcgc ccgggcccca gaacgcacgc gcgattagcg 660
ccattgagtc ccagcgcgca cgcgcaatta gcgccaattc ccagcgcgca cgcagttagc 720
gcccaaagga ccagcgcgca cgcgcatggc gccccagccc ccaccgggcc tgacgggggc 780
tacgccgcgc ccaccgtgcg atccccattg gcaagagccc ggctcagaca aagaccccgc 840
cggttgcccc cgccccgaga gcggcacccc cggagcgcgc ccgcccgagc gcggcctcgc 900
gcctgcgaac tggcgtgggg tgtcccccat ctccggaggc ccaggggctt ctcccgcgcc 960
ccccacggcg gtccggttcc gccccatgcg ccccccgctg cggcccagac ggcggctctg 1020
cacgggcgaa gggccgcggc cgcatgcccc ggtcggctgg ccgggcttac ctggcggcgg 1080
gtgtggacgg gcggcggatc ggcaaaggcg aggctctgtg ctcgcgggcg gacgcggtct 1140
cggcggtggt ggcgcgtcgc gccgctgggt tttatagggc gccgccgcgg ccgctcgagc 1200
cataaaaggc aactttcgga acggcgcacg ctgattggcc ccgcgccgct cactcaccgg 1260
cttcgccgca cagtgcagca tttttttacc ccctctcccc tccttttgcg aaaaaaaaaa 1320
agagcgagag cgagattgag gaagaggagg agggagagtt ttggcgttgg ccgccttggg 1380
gtgctgggcc cgggggctgg gggcgcgcgc cgtggccccc gcgccccacg ctgggcagtg 1440
cccggttcgg ccccgcatgg ccaggcctgc ccccggcctg cccgtctctc gggcccccca 1500
cccaccgcgg gacatcctag gtgtggacat ctcttgggca ctgagcgccc aggtggggtg 1560
ggccagggtc tgcacgggtg ccagggccct gggttctgta cgctcctgca gaaggagctc 1620
ttggagggca tggagtggcc aggcagtcac tcccccttgc cgacttcaga gcaactgccc 1680
tgaaagcagg gcctgaggac ctctggctgt ggggctcagc tagctaaatg tgctgggtgg 1740
gtcactaggg agagacctgg gcttgagagg tagagtgtgg tgttggggga gtcaggtggc 1800
ttgcggccat tagagtcgca ggaccacact ccccaggaca gggcaggggc cagcggtcca 1860
gtggctggag gtggcccgtg atgaaggcta caaacctacc cagccgcagc cctgggaagg 1920
aagtgggctc tacagggcag ggcacctttt accctggagc tgcctgcttt tgagggtaac 1980
agtcacgccc agccaagacc aggcctgggg cgttagtggg tgacctaggc actgcggggc 2040
gggggggctg ggtctacaca gcctgggtct gggcccaccg tccgttgtat gtctgctatg 2100
cgcagccaca gctgaactgc cctcccagac catctggagg ccgctggggg actctgggga 2160
ccaagactcc atgtgccaca gaggattggg ggcggggcgg tgctaggaac tcaaagccag 2220
cctgggaaga ccctgtcctt gtcacccttt cttgccttgg gtctgtccac tgagtagcac 2280
acaagaccgg gtgggcaggg tccgttctgc tccgggaatc acagactgtg tgtacccagg 2340
tggtgggcat gcagcgatca gtggcgtggg accacagagg gggcccgcgg taccaagctt 2400
gggaattgcg tgcaaaaaca acttctgttt tccagggtaa acagaatcta atgcagaatc 2460
taatgcaggg taaacagact taatgcagaa tctaatgatg gcacaaatta aaaatcacta 2520
acgtgccctt tttagtgtga aacccagaga gagcacatac aagccaaaaa caaatgcttt 2580
attttaccta ggagacatta acattcacct ttacgtgttt aagattaatg caatgttaaa 2640
tattgtgaaa actgtaactt tgaatttcat gatttttatg tgaatattcc agggtttaaa 2700
aaaacttgta acatgacatg gctgaataag ataaaaaaaa aatctagcct tttctccctt 2760
ctggctcata tttgcgattt cgatcatttt gtttaaaaaa caaaacactg caatgaatta 2820
aacttaatat tcttctatgt tttagagtaa gttaaaacaa gataaagtga ccaaagtaat 2880
ttgaaagatt caatgacttt tgctccaacc taggtgcaca aggtaccttg ttctttaaat 2940
tgggctttaa tgaaaatact tctccagaat tctggggatt taagaaaaat tatgccaacc 3000
aacaagggct ttaccatttt atgtaacatt tttcaacgct gcaaaaatgt gtgtatttct 3060
atttgaagat aaaaatcctc agcaaaatcc acattgcact gtccttcaaa gattagcctt 3120
ctttgaacta gttaagacac tattaagcca agccagtatc tccctgtaat gaattcgttt 3180
ttctcttaat tttcccctgt aatttacact gggagagctg ggaaatatgt ggatgtaaat 3240
ttctcagcca cagagatgca aagttatact gtggggaaaa aaaacttgag ttaaatcctt 3300
acatatttta ggttttcatt aacttaccaa tgtagttttg ttggaggcca ttttttttat 3360
tgcagacttg aagagctatt actagaaaaa tgcatgacag ttaaggtaag tttgcatgac 3420
acaaaaaagg taactaaata caaattctgt ttggattcca acccccaagt agagagcgca 3480
cactttcaaa cgtgaataca aatccagagt agatctgcgc tcctacctac attgcttatg 3540
atgtacttaa gtacgtgtcc taaccatgtg agtctagaaa gactttactg gggatcctgg 3600
tacctaaaac agcttcacat ggcttaaaat aggggaccaa tgtcttttcc aatctaagtc 3660
ccatttataa taaagtccat gttccatttt taaaggacaa tcctttcggt ttaaaaccag 3720
gcacgattac ccaaacaact cacaacggta aagcactgtg aatcttctct gttctgcaat 3780
cccaacttgg tttctgctca gaaaccctcc ctctttccaa tcggtaatta aataacaaaa 3840
ggaaaaaact taagatgctt caaccccgtt tcgtgacact ttgaaaaaag aatcacctct 3900
tgcaaacacc cgctcccgac ccccgccgct gaagcccggc gtccagaggc ctaagcgcgg 3960
gtgcccgccc ccacccggga gcgcgggcct cgtggtcagc gcatccgcgg ggagaaacaa 4020
aggccgcggc acgggggctc aagggcactg cgccacaccg cacgcgccta cccccgcgcg 4080
gccacgttaa ctggcggtcg ccgcagcctc gggacagccg gccgcgcgcc gccaggctcg 4140
cggacgcggg accacgcgcc gccctccggg aggcccaagt ctcgacccag ccccgcgtgg 4200
cgctggggga gggggcgcct ccgccggaac gcgggtgggg gaggggaggg ggaaatgcgc 4260
tttgtctcga aatggggcaa ccgtcgccac agctccctac cccctcgagg gcagagcagt 4320
ccccccacta actaccgggc tggccgcgcg ccaggccagc cgcgaggcca ccgcccgacc 4380
ctccactcct tcccgcagct cccggcgcgg ggtccggcga gaaggggagg ggaggggagc 4440
ggagaaccgg gcccccggga cgcgtgtggc atctgaagca ccaccagcga gcgagagcta 4500
gagagaagga aagccaccga cttcaccgcc tccgagctgc tccgggtcgc gggtctgcag 4560
cgtctccggc cctccgcgcc tacagctcaa gccacatccg aagggggagg gagccgggag 4620
ctgcgcgcgg ggccgccggg gggaggggtg gcaccgccca cgccgggcgg ccacgaaggg 4680
cggggcagcg ggcgcgcgcg cggcgggggg aggggccggc gccgcgcccg ctgggaattg 4740
gggccctagg gggagggcgg aggcgccgac gaccgcggca cttaccgttc gcggcgtggc 4800
gcccggtggt ccccaagggg agggaagggg gaggcggggc gaggacagtg accggagtct 4860
cctcagcggt ggcttttctg cttggcagcc tcagcggctg gcgccaaaac cggactccgc 4920
ccacttcctc gcccgccggt gcgagggtgt ggaatcctcc agacgctggg ggagggggag 4980
ttgggagctt aaaaactagt acccctttgg gaccactttc agcagcgaac tctcctgtac 5040
accaggggtc agttccacag acgcgggcca ggggtgggtc attgcggcgt gaacaataat 5100
ttgactagaa gttgattcgg gtgtttccgg aaggggccga gtcaatccgc cgagttgggg 5160
cacggaaaac aaaaagggaa ggctactaag atttttctgg cgggggttat cattggcgta 5220
actgcaggga ccacctcccg ggttgagggg gctggatctc caggctgcgg attaagcccc 5280
tcccgtcggc gttaatttca aactgcgcga cgtttctcac ctgccttcgc caaggcaggg 5340
gccgggaccc tattccaaga ggtagtaact agcaggactc tagccttccg caattcattg 5400
agcgcattta cggaagtaac gtcgggtact gtctctggcc gcaagggtgg gaggagtacg 5460
catttggcgt aaggtggggc gtagagcctt cccgccattg gcggcggata gggcgtttac 5520
gcgacggcct gacgtagcgg aagacgcgtt agtggggggg aaggttctag aaaagcggcg 5580
gcagcggctc tagcggcagt agcagcagcg ccgggtcccg tgcggaggtg ctcctcgcag 5640
agttgtttct cgagcagcgg cagttctcac tacagcgcca ggacgagtcc ggttcgtgtt 5700
cgtccgcgga gatctctctc atctcgctcg gctgcgggaa atcgggctga agcgactgag 5760
tccgcgatgg aggtaacggg tttgaaatca atgagttatt gaaaagggca tggcgaggcc 5820
gttggcgcct cagtggaagt cggccagccg cctccgtggg agagaggcag gaaatcggac 5880
caattcagta gcagtggggc ttaaggttta tgaacggggt cttgagcgga ggcctgagcg 5940
tacaaacagc ttccccaccc tcagcctccc ggcgccattt cccttcactg ggggtggggg 6000
atggggagct ttcacatggc ggacgctgcc ccgctggggt gaaagtgggg cgcggaggcg 6060
ggaattctta ttccctttct aaagcacgct gcttcggggg ccacggcgtc tcctcggcga 6120
gcgtttcggc gggcagcagg tcctcgtgag cgaggctgcg gagcttcccc tccccctctc 6180
tcccgggaac cgatttggcg gccgccattt tcatggctcg ccttcctctc agcgttttcc 6240
ttataactct tttattttct tagtgtgctt tctctatcaa gaagtagaag tggttaacta 6300
tttttttttt cttctcgggc tgttttcata tcgtttcgag gtggatttgg agtgttttgt 6360
gagcttggat ctttagagtc ctgcgcacct cattaaaggc gctcagcctt cccctcgatg 6420
aaatggcgcc attgcgttcg gaagccacac cgaagagcgg ggaggggggg tgctccgggt 6480
ttgcgggccc ggtttcagag aagatcccaa gcttattaat agtaatcaat tacggggtca 6540
ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct 6600
ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta 6660
acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac 6720
ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 6780
aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag 6840
tacatctacg tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat 6900
gggcgtggat agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat 6960
gggagtttgt tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc 7020
ccattgacgc aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctggt 7080
ttagtgaacc gtcagatcgg atccgcctga gaaaggaagt gagctgtaaa ggctgagctc 7140
tctctctgac gtatgtagcc tctggttagc ttcgtcactc actgttcttg actcagcatg 7200
gcaatctgat gaaatcccag ctgtaagtct gcagaaattg atgatctatt aaacaataaa 7260
gatgtccact aaaatggaag tttttcctgt catactttgt taagaagggt gagaacagag 7320
tacctacatt ttgaatggaa ggattggagc tacgggggtg ggggtggggt gggattagat 7380
aaatgcctgc tctttactga aggctcttta ctattgcttt atgataatgt ttcatagttg 7440
gatatcataa tttaaacaag caaaaccaaa ttaagggcca gctcattcct ccagatccac 7500
tagttctaga gcaaattcta ccgggtaggg gaggcgcttt tcccaaggca gtctggagca 7560
tgcgctttag cagccccgct gggcacttgg cgctacacaa gtggcctctg gcctcgcaca 7620
cattccacat ccaccggtag gcgccaaccg gctccgttct ttggtggccc cttcgcgcca 7680
ccttctactc ctcccctagt caggaagttc ccccccgccc cgcagctcgc gtcgtgcagg 7740
acgtgacaaa tggaagtagc acgtctcact agtctcgtgc agatggacag caccgctgag 7800
caatggaagc gggtaggcct ttggggcagc ggccaatagc agctttgctc cttcgctttc 7860
tgggctcaga ggctgggaag gggtgggtcc gggggcgggc tcaggggcgg gctcaggggc 7920
ggggcgggcg cccgaaggtc ctccggaggc ccggcattct gcacgcttca aaagcgcacg 7980
tctgccgcgc tgttctcctc ttcctcatct ccgggccttt cgaccagctt accatgaccg 8040
agtacaagcc cacggtgcgc ctcgccaccc gcgacgacgt ccccagggcc gtacgcaccc 8100
tcgccgccgc gttcgccgac taccccgcca cgcgccacac cgtcgatccg gaccgccaca 8160
tcgagcgggt caccgagctg caagaactct tcctcacgcg cgtcgggctc gacatcggca 8220
aggtgtgggt cgcggacgac ggcgccgcgg tggcggtctg gaccacgccg gagagcgtcg 8280
aagcgggggc ggtgttcgcc gagatcggcc cgcgcatggc cgagttgagc ggttcccggc 8340
tggccgcgca gcaacagatg gaaggcctcc tggcgccgca ccggcccaag gagcccgcgt 8400
ggttcctggc caccgtcggc gtctcgcccg accaccaggg caagggtctg ggcagcgccg 8460
tcgtgctccc cggagtggag gcggccgagc gcgccggggt gcccgccttc ctggagacct 8520
ccgcgccccg caacctcccc ttctacgagc ggctcggctt caccgtcacc gccgacgtcg 8580
aggtgcccga aggaccgcgc acctggtgca tgacccgcaa gcccggtgcc tgacgcccgc 8640
cccacgaccc gcagcgcccg accgaaagga gcgcacgacc ccatgcatag gttgggcttc 8700
ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 8760
ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc 8820
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 8880
ctcatcaatg tatcttatca tgtctgtata ccgtcgagat ctagagcggc cgccaccgcg 8940
gtggagctcc agcttttgtt ccctttagtg agggttaatt tcgagcttgg cgtaatcatg 9000
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 9060
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 9120
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccaggggg tacctaggcc 9180
gggcaacaat tggcggccgg ccgcactttt cggggaaatg tgcgcggaac ccctatttgt 9240
ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg 9300
cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt 9360
cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta 9420
aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga tctcaacagc 9480
ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag cacttttaaa 9540
gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca actcggtcgc 9600
cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga aaagcatctt 9660
acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag tgataacact 9720
gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc ttttttgcac 9780
aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa tgaagccata 9840
ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta 9900
ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg gatggaggcg 9960
gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt tattgctgat 10020
aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg gccagatggt 10080
aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat ggatgaacga 10140
aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact gtcagaccct 10200
aggccgggca acaattggcg gccggccctg cattaatgaa tcggccaacg cgcggggaga 10260
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 10320
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 10380
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 10440
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 10500
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 10560
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 10620
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 10680
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 10740
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 10800
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 10860
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 10920
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 10980
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 11040
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 11100
aactc 11105
Claims (48)
1.一种获得高水平、大规模蛋白和/或多肽表达的组合体,所述组合体包括:
(a)能够在培养基中持续生长的无限增殖化宿主细胞系,其中所述宿主细胞系能够在无血清悬浮培养基中生长;以及
(b)持续过表达重组蛋白和/或多肽的载体,
其中所述宿主细胞系用所述载体转染。
2.权利要求1的组合体,其中所述无限增殖化宿主细胞系倍增时间不大于16小时。
3.权利要求2的组合体,其中所述倍增时间不大于12小时。
4.权利要求1的组合体,其转染效率至少70%。
5.权利要求4的组合体,其中所述转染效率至少75%。
6.权利要求4的组合体,其中所述转染效率至少85%。
7.权利要求4的组合体,其中所述转染效率至少95%。
8.权利要求1的组合体,其中所述宿主细胞系易受选自潮霉素,G418和嘌呤霉素的筛选剂的影响。
9.权利要求1的组合体,其中所述宿主细胞系的特征在于所述重组蛋白和/或多肽没有半乳糖-半乳糖糖基化形式。
10.权利要求1的组合体,其中所述宿主细胞选自CHO-S,293-F,293-H,COS-7L,D.Mel-2,Sf21和Sf9。
11.权利要求1的组合体,其中所述载体进一步具有下述特征:(a)含有一个或多个元件有助于在无限增殖化宿主细胞系中高水平、大规模表达;以及(b)对重组蛋白和/或多肽的阻遏作用有抗性。
12.权利要求1的组合体,其中所述载体进一步包括一个或多个通用染色质开放元件(UCOE)。
13.权利要求1的组合体,其中所述组合体的特征在于每升培养基中能够得到至少50mg重组蛋白和/或多肽的表达水平。
14.权利要求13的组合体,其中所述组合体的特征在于每升培养基中能够得到至少100mg重组蛋白和/或多肽的表达水平。
15.权利要求13的组合体,其中所述组合体的特征在于每升培养基中能够得到至少200mg重组蛋白和/或多肽的表达水平。
16.权利要求1的组合体,其中所述组合体能够扩大培养至至少100升规模,并且其中所述组合体能够生产至少1克蛋白和/或多肽。
17.权利要求16的组合体,其中所述组合体能够产生至少10克蛋白和/或多肽。
18.权利要求16的组合体,其中所述组合体能够产生至少20克蛋白和/或多肽。
19.一种高水平、大规模生产蛋白和/或多肽的方法,其中所述方法包括下列步骤:
(a)获得能够以悬浮方式生长的无限增殖化宿主细胞系;
(b)使所述无限增殖化宿主细胞系适合在无血清培养基中生长;
(c)用适用于高水平表达重组蛋白和/或多肽的载体转染所述适合无血清生长的无限增殖化细胞系。
20.权利要求19的方法,其中所述无限增殖化宿主细胞系倍增时间不超过16小时。
21.权利要求19的方法,其中所述倍增时间不超过12小时。
22.权利要求19的方法,其转染效率至少70%。
23.权利要求22的方法,其中所述转染效率至少75%。
24.权利要求22的方法,其中所述转染效率至少85%。
25.权利要求22的方法,其中所述转染效率至少95%。
26.权利要求19的方法,其中所述宿主细胞系易受选自潮霉素,G418和嘌呤霉素的筛选剂的影响。
27.权利要求19的方法,其中所述宿主细胞系的特征在于所述重组蛋白和/或多肽没有半乳糖-半乳糖糖基化形式。
28.权利要求19的方法,其中所述宿主细胞系选自CHO-S,293-F,293-H,COS-7L,D.Mel-2,Sf21和Sf9。
29.权利要求19的方法,其中所述载体进一步包括下列特性:(a)具有一个或多个元件有助于在无限增殖化宿主细胞中高水平、大规模表达以及(b)对重组蛋白和/或多肽的阻遏作用有抗性。
30.权利要求19的方法,其中所述载体进一步包括一个或多个通用染色质开放元件(UCOE)。
31.权利要求19的方法,其中所述方法的特征在于每升培养物能够获得至少50mg重组蛋白和/或多肽的表达水平。
32.权利要求31的方法,其中所述方法的特征在于每升培养物能够获得至少100mg重组蛋白和/或多肽的表达水平。
33.权利要求31的方法,其中所述方法的特征在于每升培养物能够获得至少200mg重组蛋白和/或多肽的表达水平。
34.权利要求19的方法,其中所述方法能够扩大培养至至少100升规模,并且其中所述方法能够生产至少1克蛋白和/或多肽。
35.权利要求34的方法,其中所述方法能够产生至少10克蛋白和/或多肽。
36.权利要求34的方法,其中所述方法能够产生至少20克蛋白和/或多肽。
37.一种用于高水平、大规模表达多亚基蛋白和/或多肽的双向载体,所述组合体包括:
(a)至少一个UCOE元件;及
(b)第一个转录启动子;及
(c)第二个转录启动子;
其中所述UCOE元件与所述第一和第二个转录启动子可操作连接,以及其中所述第一个转录启动子与所述第二个转录启动子方向相反。
38.权利要求37的双向载体,其中所述UCOE元件是RNPUCOE。
39.权利要求37的双向载体,其中所述第一个转录启动子选自人CMV启动子,鼠CMV启动子和人β-肌动蛋白启动子。
40.一种获得高水平、大规模蛋白和/或多肽表达的组合体,所述组合体包括:
(a)无限增殖化宿主细胞系,其能够在培养基中持续生长,其中所述宿主细胞系能够在无血清悬浮培养基中生长,以及
(b)权利要求37的双向载体,
其中所述宿主细胞系用所述载体转染。
41.一种用于高水平、大规模生产蛋白和/或多肽的方法,所述方法包括下列步骤:
(a)获得能够持续生长的宿主细胞系;
(b)使所述宿主细胞系适应在无血清培养基中生长以产生能够在无血清培养基中持续生长的细胞系;
(c)用权利要求37的载体转染能够在无血清培养基中持续生长的所述细胞系。
42.权利要求41的方法,其中所述宿主细胞系能够持续生长,也能够以悬浮方式生长。
43.权利要求42的方法,其中能够以悬浮方式持续生长的所述宿主细胞系是CHO-S细胞系。
44.一种用于高水平、大规模表达多亚基蛋白和/或多肽的载体,其中所述组合体包括:
(a)至少一个UCOE元件;及
(b)转录启动子;
所述载体进一步含有如表4和图14所述的在RNP UCOE区域内选自ΔBS,ΔEcoNI,ΔEM,ΔMluI,和ΔRV中的的一个或多个缺失。
45.权利要求44的载体,其中所述缺失为在RNP UCOE区域内如表4和图14中所述的ΔBS。
46.权利要求44的载体,其中所述缺失至少100bp。
47.权利要求44的载体,其中所述缺失至少1,000bp。
48.权利要求44的载体,其中所述缺失至少4,000bp。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US29596101P | 2001-06-04 | 2001-06-04 | |
US60/295,961 | 2001-06-04 | ||
US33362001P | 2001-11-26 | 2001-11-26 | |
US60/333,620 | 2001-11-26 | ||
US35240402P | 2002-01-29 | 2002-01-29 | |
US60/352,404 | 2002-01-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1533432A true CN1533432A (zh) | 2004-09-29 |
Family
ID=27404392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA028143825A Pending CN1533432A (zh) | 2001-06-04 | 2002-06-04 | 高水平、大规模生产重组蛋白的组合体和方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20040161817A1 (zh) |
EP (1) | EP1402006A4 (zh) |
JP (1) | JP2004535189A (zh) |
KR (1) | KR20040032105A (zh) |
CN (1) | CN1533432A (zh) |
AU (1) | AU2002310321A1 (zh) |
CA (1) | CA2463310A1 (zh) |
WO (2) | WO2002099089A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104341505A (zh) * | 2013-07-29 | 2015-02-11 | 西藏海思科药业集团股份有限公司 | 对蒙古人种和高加索人种低免疫原性的、抗egfr的人鼠嵌合抗体 |
CN104341503A (zh) * | 2013-07-29 | 2015-02-11 | 西藏海思科药业集团股份有限公司 | 对蒙古人种和高加索人种低免疫原性的、抗cd20的人抗体 |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7812148B2 (en) | 2001-04-05 | 2010-10-12 | Millipore Corporation | Vectors comprising CpG islands without position effect varigation and having increased expression |
EP1572994B1 (en) | 2002-12-20 | 2007-02-21 | Chromagenics B.V. | Means and methods for producing a protein through chromatin openers that are capable of rendering chromatin more accessible to transcription factors |
ES2345335T3 (es) | 2003-02-01 | 2010-09-21 | Millipore Corporation | Elementos geneticos mejorados que proporcionan altos niveles de expresion. |
SI1601776T1 (sl) * | 2003-03-11 | 2008-10-31 | Serono Lab | Ekspresijski vektorji, ki vsebujejo mcmv ie2 promotor |
US8039230B2 (en) | 2004-11-08 | 2011-10-18 | Chromagenics B.V. | Selection of host cells expressing protein at high levels |
SI1809750T1 (sl) | 2004-11-08 | 2012-08-31 | Chromagenics Bv | Izbira gostiteljskih celic, ki imajo visok nivo izraĹľanja proteina |
US8999667B2 (en) | 2004-11-08 | 2015-04-07 | Chromagenics B.V. | Selection of host cells expressing protein at high levels |
JP5291341B2 (ja) | 2004-11-08 | 2013-09-18 | クロマジェニックス ベー ヴェー | タンパク質を高レベルで発現する宿主細胞の選定 |
US20060195935A1 (en) | 2004-11-08 | 2006-08-31 | Chromagenics B.V. | Selection of host cells expressing protein at high levels |
GB0504587D0 (en) | 2005-03-05 | 2005-04-13 | Ml Lab Plc | Vectors comprising guinea pig CMV regulatory elements |
WO2006095156A1 (en) * | 2005-03-05 | 2006-09-14 | Millipore Corporation | Vectors comprising novel regulatory elements |
GB0509965D0 (en) * | 2005-05-17 | 2005-06-22 | Ml Lab Plc | Improved expression elements |
EP1739179A1 (en) * | 2005-06-30 | 2007-01-03 | Octapharma AG | Serum-free stable transfection and production of recombinant human proteins in human cell lines |
EP1996705B1 (en) | 2006-03-20 | 2011-08-31 | ChromaGenics B.V. | Expression augmenting dna fragments, use thereof, and methods for finding thereof |
AU2009338190C1 (en) | 2009-01-22 | 2014-07-17 | Momenta Pharmaceuticals, Inc. | Galactose-alpha-1, 3-galactose-containing N-glycans in glycoprotein products derived from CHO cells |
KR102208505B1 (ko) | 2012-12-11 | 2021-01-27 | 앨버트 아인슈타인 컬리지 오브 메디신 | 고처리량 수용체:리간드 확인을 위한 방법 |
WO2014134412A1 (en) * | 2013-03-01 | 2014-09-04 | Regents Of The University Of Minnesota | Talen-based gene correction |
JP6875126B2 (ja) * | 2014-01-21 | 2021-05-19 | アルバート アインシュタイン カレッジ オブ メディシン | 迅速かつ包括的なt細胞免疫モニタリング用の細胞プラットフォーム |
WO2017201210A1 (en) | 2016-05-18 | 2017-11-23 | Cue Biopharma, Inc. | T-cell modulatory multimeric polypeptides and methods of use thereof |
US11339201B2 (en) | 2016-05-18 | 2022-05-24 | Albert Einstein College Of Medicine | Variant PD-L1 polypeptides, T-cell modulatory multimeric polypeptides, and methods of use thereof |
AU2017379900A1 (en) | 2016-12-22 | 2019-06-13 | Cue Biopharma, Inc. | T-cell modulatory multimeric polypeptides and methods of use thereof |
EP3565829A4 (en) | 2017-01-09 | 2021-01-27 | Cue Biopharma, Inc. | MULTIMER POLYPEPTIDES T-LYMPHOCYTE MODULATORS AND THEIR METHODS OF USE |
EP3596118B1 (en) | 2017-03-15 | 2024-08-21 | Cue Biopharma, Inc. | Combination of multimeric fusion polypeptides and immune checkpoint inhibitor for treating hpv-associated cancer |
WO2019139896A1 (en) | 2018-01-09 | 2019-07-18 | Cue Biopharma, Inc. | Multimeric t-cell modulatory polypeptides and methods of use thereof |
CA3099955A1 (en) * | 2018-05-24 | 2019-11-28 | National University Corporation Hokkaido University | Novel vector and use thereof |
IL296209A (en) | 2020-05-12 | 2022-11-01 | Cue Biopharma Inc | Multimeric t-cell modulatory polypeptides and methods of using them |
JP2023541366A (ja) | 2020-09-09 | 2023-10-02 | キュー バイオファーマ, インコーポレイテッド | 1型真性糖尿病(t1d)を治療するためのmhcクラスii t細胞調節多量体ポリペプチド及びその使用方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NO162160C (no) * | 1987-01-09 | 1989-11-15 | Medi Cult As | Serumfritt vekstmedium, samt anvendelse derav. |
IL87737A (en) * | 1987-09-11 | 1993-08-18 | Genentech Inc | Method for culturing polypeptide factor dependent vertebrate recombinant cells |
SE9303601D0 (sv) * | 1993-11-01 | 1993-11-01 | Kabi Pharmacia Ab | Improved cell cultivation method and medium |
KR100795626B1 (ko) * | 1998-07-21 | 2008-01-17 | 코브라 바이오매뉴팩쳐링 피엘씨. | 도처에 있는 염색질 개방 요소(유씨오이)를 포함하는폴리뉴클레오티드 |
-
2002
- 2002-06-04 WO PCT/US2002/017763 patent/WO2002099089A1/en not_active Application Discontinuation
- 2002-06-04 KR KR10-2003-7015872A patent/KR20040032105A/ko not_active Application Discontinuation
- 2002-06-04 CA CA002463310A patent/CA2463310A1/en not_active Abandoned
- 2002-06-04 WO PCT/US2002/017770 patent/WO2002099070A2/en not_active Application Discontinuation
- 2002-06-04 US US10/163,863 patent/US20040161817A1/en not_active Abandoned
- 2002-06-04 CN CNA028143825A patent/CN1533432A/zh active Pending
- 2002-06-04 EP EP02734688A patent/EP1402006A4/en not_active Withdrawn
- 2002-06-04 AU AU2002310321A patent/AU2002310321A1/en not_active Abandoned
- 2002-06-04 JP JP2003502199A patent/JP2004535189A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104341505A (zh) * | 2013-07-29 | 2015-02-11 | 西藏海思科药业集团股份有限公司 | 对蒙古人种和高加索人种低免疫原性的、抗egfr的人鼠嵌合抗体 |
CN104341503A (zh) * | 2013-07-29 | 2015-02-11 | 西藏海思科药业集团股份有限公司 | 对蒙古人种和高加索人种低免疫原性的、抗cd20的人抗体 |
Also Published As
Publication number | Publication date |
---|---|
CA2463310A1 (en) | 2002-12-12 |
AU2002310321A8 (en) | 2008-01-10 |
JP2004535189A (ja) | 2004-11-25 |
WO2002099070A3 (en) | 2007-11-15 |
EP1402006A1 (en) | 2004-03-31 |
WO2002099089A1 (en) | 2002-12-12 |
AU2002310321A1 (en) | 2002-12-16 |
EP1402006A4 (en) | 2005-11-23 |
KR20040032105A (ko) | 2004-04-14 |
WO2002099070A2 (en) | 2002-12-12 |
US20040161817A1 (en) | 2004-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20040161817A1 (en) | Compositions and methods for high-level, large-scale production of recombinant proteins | |
US11672874B2 (en) | Methods and compositions for genomic integration | |
AU2015263150B2 (en) | Lentiviral vectors | |
AU2021204620A1 (en) | Central nervous system targeting polynucleotides | |
US20030119104A1 (en) | Chromosome-based platforms | |
US6410266B1 (en) | Compositions and methods for non-targeted activation of endogenous genes | |
DK2864489T3 (en) | LOCATION-SPECIFIC INTEGRATION | |
KR20190065251A (ko) | 모듈러 AAV 전달 시스템을 통한 CRISPR-Cas 게놈 가공 | |
US20040003420A1 (en) | Modified recombinase | |
US20040219516A1 (en) | Viral vectors containing recombination sites | |
KR20210143897A (ko) | 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합 | |
KR20080031024A (ko) | 폴리단백질, 프로단백질 및 단백질분해를 사용한 sORF작제물 포함 다중 유전자 발현 및 방법 | |
CN101208435A (zh) | 改进的表达元件 | |
KR20210144861A (ko) | 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위 | |
JP2003534775A (ja) | タンパク質を不安定化する方法とその使用 | |
CN111094569A (zh) | 光控性病毒蛋白质、其基因及包含该基因的病毒载体 | |
KR20240037192A (ko) | 게놈 통합을 위한 방법 및 조성물 | |
CN110582305A (zh) | 用于治疗血红蛋白病的载体和组合物 | |
EP1395612A2 (en) | Modified recombinase | |
CA2514941A1 (en) | High-expression vector for animal cells | |
CN101481704A (zh) | 一种四环素严紧调控的真核表达载体 | |
US20030166890A1 (en) | Gene expression | |
RU2817770C2 (ru) | Интеграция конструкций нуклеиновой кислоты в эукариотические клетки с транспозазой из oryzias | |
RU2814721C2 (ru) | Транспозиция конструкций нуклеиновой кислоты в эукариотические геномы с транспозазой из amyelois | |
CA2522166C (en) | Lambda integrase mutein for use in recombination |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |