CN109627290B - α螺旋自组装短肽及其在蛋白质纯化中的应用 - Google Patents

α螺旋自组装短肽及其在蛋白质纯化中的应用 Download PDF

Info

Publication number
CN109627290B
CN109627290B CN201811557416.8A CN201811557416A CN109627290B CN 109627290 B CN109627290 B CN 109627290B CN 201811557416 A CN201811557416 A CN 201811557416A CN 109627290 B CN109627290 B CN 109627290B
Authority
CN
China
Prior art keywords
protein
self
alpha
short peptide
cleavage site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811557416.8A
Other languages
English (en)
Other versions
CN109627290A (zh
Inventor
林章凛
仙丹华
杨晓锋
赵镭
王胥
周碧红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Publication of CN109627290A publication Critical patent/CN109627290A/zh
Application granted granted Critical
Publication of CN109627290B publication Critical patent/CN109627290B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/001Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof by chemical synthesis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43595Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from coelenteratae, e.g. medusae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • C12N9/20Triglyceride splitting, e.g. by means of lipase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/01Carboxylic ester hydrolases (3.1.1)
    • C12Y301/01003Triacylglycerol lipase (3.1.1.3)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/735Fusion polypeptide containing domain for protein-protein interaction containing a domain for self-assembly, e.g. a viral coat protein (includes phage display)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification
    • C07K2319/92Fusion polypeptide containing a motif for post-translational modification containing an intein ("protein splicing")domain

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Toxicology (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了α螺旋自组装短肽及其在蛋白质纯化中的应用,属于基因工程领域。该α螺旋自组装短肽的氨基酸序列如SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3所示。将该α螺旋自组装短肽与目的蛋白形成的融合蛋白在宿主细胞内表达后形成有活性的聚集体,通过表达所述融合蛋白来生产和纯化目的蛋白。本发明的α螺旋自组装短肽可以诱导融合蛋白形成大量的有活性的蛋白聚集体,纯化得到的目的蛋白产量和纯度都很高,而且该纯化方法对设备要求低,不需要纯化柱,生产成本低,操作简便,可应用于蛋白质的生产和纯化中。

Description

α螺旋自组装短肽及其在蛋白质纯化中的应用
技术领域
本发明涉及基因工程领域,具体涉及α螺旋自组装短肽及其在蛋白质纯化中的应用。
背景技术
利用基因重组技术表达外源蛋白在现代生物学技术的发展和应用中起着重要的作用,重组蛋白类生物制品在生物催化和生物医药领域的应用越来越广泛,利用原核系统重组表达生产酶制剂和多肽类药物已取得重大进展,但是,在原核系统中表达外源基因时,目的蛋白容易以不可溶的蛋白聚集体(包涵体)的形式存在[Williams,D.C.,et al.,Cytoplasmic inclusion bodies in Escherichia coli producing biosynthetic humaninsulin proteins.Science,1982.215(4533):p.687-9]。包涵体表达虽然可以避免蛋白酶对外源蛋白的降解,但是对表达产物的活性不利,需要后续的变复性才能得到具有生物活性的功能蛋白,蛋白变复性技术存在成本高、收率低、技术复杂等问题[von Maltzahn,G.,et al.,Positively Charged Surfactant-like Peptides Self-assemble intoNanostructures.Langmuir,2003.19(10):p.4332-4337],限制了包涵体表达的应用。
研究发现,目的蛋白和易于聚集的短肽融合表达可以使表达得到的包涵体具有活性,这一发现改变了人们对包涵体的看法[Garcia-Fruitos,E.,Inclusion bodies:a newconcept.Microb Cell Fact,2010.9:p.80]、[Mitraki,A.,Protein Aggregation:FromInclusion Bodies to Amyloid and Biomaterials,in Advances in Protein Chemistryand Structural Biology,A.McPherson,Editor.2010,Academic Press.p.89-125]、[García-Fruitós,E.,et al.,Bacterial inclusion bodies:making gold from waste.Trendsin Biotechnology,2012.30(2):p.65-70],这种具有生物活性的包涵体可以避免复杂的蛋白复性操作,具有良好的应用前景。
蛋白的分离纯化是重组生产蛋白中关键的一步,该步骤的技术难度和成本均高,据报道,重组蛋白的分离和纯化成本约占其全部成本的60%-80%[陈浩等人,中国生物工程杂志,2002.22(5):p.87-92]。目前最常用的蛋白分离纯化方法是亲和层析,但是其高昂的成本限制了其在工业中的应用。
目的蛋白、内含肽和自组装短肽融合表达时可以诱导融合蛋白形成有活性的蛋白聚集体[Wu,W.,et al.,Active protein aggregates induced by terminally attachedself-assembling peptide ELK16 in Escherichia coli.Microbial Cell Factories,2011.10(1):p.9]、[Zhou,B.,et al.,Small surfactant-like peptides can drivesoluble proteins into active aggregates.Microbial Cell Factories,2012.11(1):p.10]、[Wang,X.,et al.,Formation of active inclusion bodies induced byhydrophobic self-assembling peptide GFIL8.Microb Cell Fact,2015.14:p.88],聚集体通过内含肽的自切割使得目的蛋白释放到上清中,这种蛋白质的分离纯化方法成本低、操作简单,在工业生产中具有良好的应用前景。
发明内容
为了克服现有技术的不足,本发明的目的是提供α螺旋自组装短肽及其在蛋白质纯化中的应用。
本发明的目的通过以下技术方案实现。
α螺旋自组装短肽,所述短肽是α螺旋自组装短肽,氨基酸序列如SEQ ID NO:1、SEQID NO:2或SEQ ID NO:3所示。
所述α螺旋自组装短肽,在水中通过形成卷曲螺旋(colied-coil)结构实现自组装,colied-coil区域由重复的7个氨基酸残基组成。
所述α螺旋自组装短肽是两亲性α螺旋自组装短肽,每7个氨基酸形成的螺旋表面划分为一个亲水面和一个疏水面,亲水面由亲水性氨基酸组成,疏水面由疏水性氨基酸组成。
所述两亲性α螺旋自组装短肽是疏水面大于亲水面的两亲性α螺旋自聚集短肽,氨基酸序列如SEQ ID NO:1所示,结构如图1a所示,疏水面由4个疏水性氨基酸组成,亲水面由3个亲水性氨基酸组成,螺旋表面有两个相邻的带相反电荷的氨基酸,即左上半面由两个疏水L(亮氨酸)和两个疏水A(丙氨酸)组成,形成一个疏水面,右下半面由E(谷氨酸)、K(赖氨酸)和T(苏氨酸)三个亲水氨基酸组成,形成一个亲水面,E带负电,K带正电,有正负电荷的吸引作用,α螺旋通过疏水作用相互结合,通过带正负电荷的氨基酸的作用稳定这种结合。
所述两亲性α螺旋自组装短肽是亲水面大于疏水面的两亲性α螺旋自聚集短肽,氨基酸序列如SEQ ID NO:2所示,结构如图1b所示,短肽是前两段七个氨基酸的串联重复,两个重复之间有两个A(丙氨酸),丙氨酸的插入可以导致两个疏水界面的相转变,亲水面由4-5个氨基酸组成,疏水面由2-3个氨基酸组成,亲水面和疏水面交界处有3个带电的氨基酸,α螺旋通过疏水作用相互结合,通过带正负电荷的氨基酸的作用稳定这种结合。
所述α螺旋自组装短肽可组装成三股的螺旋束,氨基酸序列如SEQ ID NO:3所示,结构如图1c所示,E(谷氨酸)和K(赖氨酸)存在正负电荷的吸引作用,α螺旋通过疏水作用相互结合,通过交替的谷氨酸和赖氨酸的电荷作用稳定这种结合。
以上所述的α螺旋自组装短肽在蛋白质纯化中的应用,包括以下步骤:
(1)将重组表达构建体导入宿主细胞中;所述重组表达构建体包括编码融合蛋白的多核苷酸序列与表达控制序列;所述融合蛋白是所述α螺旋自组装短肽和目的蛋白通过接头连接得到;
(2)培养步骤(1)所得宿主细胞,表达所述融合蛋白;所述α螺旋自组装短肽和目的蛋白形成的融合蛋白在宿主细胞表达后形成大量的有活性的蛋白聚集体。
(3)裂解步骤(2)所得宿主细胞,离心去除上清,收集不可溶部分。
在本发明的重组表达构建体中,编码所述融合蛋白的多核苷酸的序列与表达控制序列可操纵地连接以进行希望的转录及最终在宿主细胞中生产所述融合蛋白。合适的表达控制序列包括但不限于启动子、增强子、核糖体作用位点如核糖体结合位点、聚腺苷酸化位点、转录剪接序列、转录终止序列和稳定mRNA的序列等等。
本发明用的表达构建体的载体包括那些在宿主细胞中自主复制的载体,如质粒载体;还包括能够整合到宿主细胞DNA中并和宿主细胞DNA一起复制的载体。可商购获得许多适于本发明的载体。在一个具体实施方案中,本发明的表达构建体衍生自Novagen公司的pET30a(+)。
优选的,步骤(1)所述宿主细胞,其导入本发明的表达构建体,其中所述宿主细胞能够表达所述融合蛋白。
用于表达本发明融合蛋白的宿主细胞包括原核生物、酵母和高等真核细胞。示例性的原核生物包括埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、沙门氏菌属(Salmonella)以及假单胞菌属(Pseudomonas)和链霉菌属(Streptomyces)的细菌。在优选的实施方案中,宿主细胞是埃希氏菌属细胞,优选是大肠杆菌。在本发明的一个具体实施方案中,所使用的宿主细胞为大肠杆菌BL21(DE3)菌株细胞(Novagen)。
优选的,步骤(1)所述目的蛋白可以是任何长度的多肽和蛋白。可以通过本发明产生和纯化的目的蛋白包括但不限于枯草芽孢杆菌脂肪酶(LipA)和绿色荧光蛋白(GFP)。
优选的,可以通过许多已熟知的技术之一将本发明的重组表达构建体导入宿主细胞,这样的技术包括但不限于:热激转化,电穿孔,DEAE-葡聚糖转染,显微注射,脂质体接介导的转染,磷酸钙沉淀,原生质融合,微粒轰击,病毒转化及类似技术。
优选的,步骤(1)所述接头是指一定长度的由低电荷效应和低疏水性的氨基酸组成,可以使连接的多肽或蛋白各自充分展开,互不影响,各自折叠成自己的天然构象。常用的接头例如,富含甘氨酸(G)和丝氨酸(S)的GS型接头;富含脯氨酸(P)和苏氨酸(T)的PT型接头。本发明选用GS接头,在一些实施方案中,所使用的接头包含序列GGGGSGGGGSGGGGS(如SEQ ID NO:7所示)。
为了纯化目的蛋白,在一些实施方案中,融合蛋白的接头还包含切割位点,切割位点包括化学切割位点、酶法切割位点、自切割位点或本领域其他技术人员知道的切割位点。本发明优选自切割位点,例如,接头包括可自切割的内含肽序列,改变聚集体所处的环境就能诱导内含肽的自切割,见文献[Telenti,A.,et al.,The Mycobacterium xenopi GyrAprotein splicing element:characterization of a minimalintein.Vol.179.1997.6378-82],不需要外加酶或者有害物质。
本领域包含多种自切割内含肽,本发明的一些实施方案中,内含肽选用Mxe GyrA内含肽,具有SEQ ID NO:8所示的氨基酸序列,在缓冲buffer中加入二硫苏糖醇(DTT)就可诱导Mxe GyrA内含肽在其氨基端的自切割。
优选的,所述融合蛋白中目的蛋白和α螺旋自组装短肽之间的接头含有自切割位点,在蛋白质纯化中的应用还包括以下步骤:
(a)对从步骤(3)收集的不可溶部分的切割位点进行切割,使目的蛋白释放到上清中;
(b)去除步骤(a)中的不可溶部分,回收含有目的蛋白的可溶部分。
在本发明中,使宿主细胞裂解的方法选自本领域常用的处理方式,例如超声、匀浆、高压(例如在弗氏压碎器中)、低渗(osmolysis)、去垢剂、裂解酶、有机溶剂或其组合,并且所述破碎在第一pH条件(即近中性pH,例如pH 6.8-7.2)下进行,由此使得宿主细胞的细胞膜和包涵体破碎,活性聚集体从包涵体中释放出来,但仍然保持不溶状态。
细胞破碎后,通过离心的方法收集聚集体,用缓冲液清洗2次,除去可溶的上清部分,然后通过DTT诱导切割目的蛋白和多肽之间接头中的Mxe GyrA切割位点,使得目的蛋白释放到上清中,通过离心的方法除去不可溶沉淀,收集可溶的含有目的蛋白的上清。
与现有技术相比,本发明具有如下优点:
1、本发明的α螺旋自组装短肽可以诱导融合蛋白形成大量的有活性的蛋白聚集体,可避免目标蛋白在宿主内被降解,或是目标蛋白对宿主造成毒性。
2、本发明蛋白纯化方法,纯化得到的目的蛋白产量和纯度都很高。
3、本发明蛋白质纯化方法对设备要求低,不需要纯化柱,生产成本低,操作简便。
附图说明
图1a为α螺旋自组装短肽α3-peptide的螺旋轮图。
图1b为α螺旋自组装短肽CpA-m的螺旋轮图。
图1c为α螺旋自组装短肽TZ1H的螺旋轮图。
图2a为不带切割位点的融合蛋白的表达载体图谱。
图2b为带自切割位点的融合蛋白的表达载体图谱。
图3a为包含自聚体短肽和LipA的融合蛋白SDS-PAGE的分析结果图。
图3b为包含自聚体短肽和LipA的融合蛋白的酶活测定结果图。
图4a为包含自聚体短肽和GFP的融合蛋白的表达的SDS-PAGE分析结果图。
图4b、图4c、图4d为聚集体在大肠杆菌中的分布结果图。
图5为包含自聚体短肽、内含肽和LipA的融合蛋白的表达和纯化结果图。
具体实施方式
以下通过实例与附图对本发明的具体实施方式作进一步的说明,但本发明的实施方式不限于此。以下实施例中所用方法如无特别说明均为常规方法,具体步骤可参见,例如,《Molecular Cloning:A Laboratory Manual》(Sambrook,J.,Russell,David W.,Molecular Cloning:A Laboratory Manual,3rd edition,2001,NY,Cold SpringHarbor)。所用引物均由英俊生物(Invitrogen)合成。
实施例1:以枯草芽孢杆菌脂肪酶(LipA)和绿色荧光蛋白(GFP)为目的蛋白构建融合表达载体
本实施例中使用一组多肽:α3-peptide、CpA-m、TZ1H,其氨基酸序列分别如SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3,核苷酸序列分别如SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6所示。
1.1扩增3种多肽多核苷酸片段
首先用在线工具DNAworks设计GS型接头和α3-peptide/CpA-m/TZ1H的核苷酸序列。通过DNAWorks设计并合成如表1所示的寡聚核苷酸引物,具体方法见文献[Hoover,D.M.and J.Lubkowski,DNAWorks:an automated method for designingoligonucleotides for PCR-based gene synthesis.Nucleic Acids Res,2002.30(10):p.e43.],进而通过重叠PCR(overlapping PCR)法得到编码3种肽(Hind III-GS接头-α3-peptide/CpA-m/TZ1H-Xho I)的完整多核苷酸序列。
表1
Figure BDA0001912326370000061
Figure BDA0001912326370000071
a引物下划线部分分别为限制性内切酶Hind III和Xho I的识别位点。
下面,以其中一种肽α3-peptide为例,说明编码α3-peptide(Hind III-GS接头-α3-peptide-Xho I)的多核苷酸片段扩增的方法。
DNAWorks输出用于合成将GS接头α3-peptide基因的4条相互重叠的寡核苷酸片段(包括GS接头的一套引物和α3-peptide的一套引物,序列如表1所示)。这些寡核苷酸片段由英俊生物(Invitrogen)公司合成。
将合成的寡聚核苷酸片段用10mM Tris-HCl,pH8.0的缓冲液溶解。
配制如下PCR反应液:寡聚核苷酸片段混合物,每条片段终浓度625nM;5×fastpfu缓冲液,10μL;Fast pfu(全式金公司),1μL;dNTPs,5μL;双重蒸馏水,32μL;总计50μL。
PCR反应程序如下:步骤1,95℃,5min;步骤2,95℃,20sec;步骤3,59℃,20sec;步骤4,72℃,15sec;步骤5,返回步骤2共24次;步骤6,72℃,5min;步骤7,4℃,保存。
将上述得到的PCR产物作为模板,利用如下正向引物和反向引物,按照常规方法进行PCR扩增获得GS接头-α3-peptide核苷酸片段:上游引物5′-CCCAAGCTTGGCGGCGGTGGTTCTGGCGGTGGCGGTTCCGGT-3′(核苷酸序列如SEQ ID NO:9所示SEQ ID NO:9所示,带下划线碱基为限制性内切酶Hind III识别位点),和下游引物5′-CCGCTCGAGTCACGCTTTAGCGAGCGTTTCGAGCGCTTTCGCCAGG-3′(核苷酸序列如SEQ ID NO:12所示,带下划线碱基为限制性内切酶XhoI识别位点)。
配制如下PCR反应液:模板(PCR产物),2μL;5×fast pfu缓冲液,20μL;dNTPs,8μL;上游引物(20mM),4μL;下游引物(20mM),4μL;Fast pfu(全式金公司),2μL;双重蒸馏水,60μL;总计100μL。
按照如下反应程序扩增GS-α3-peptide基因:步骤1,95℃,5min;步骤2,95℃,20sec;步骤3,59℃,20sec;步骤4,72℃,15sec;步骤5,返回步骤2共29次;步骤6,72℃,5min;步骤7,4℃,保存。
反应结束后,对PCR扩增产物进行1%琼脂糖凝胶电泳检测,结果PCR扩增出与预期相符的正确条带。
1.2构建LipA/GFP与3种肽的融合蛋白表达载体,以及非融合LipA/GFP蛋白表达载体
本发明实施例中所使用的表达载体pET-30a(+)-LipA-α3-peptide/CpA-m/TZ1H和pET-30a(+)-GFP-α3-peptide/CpA-m/TZ1H的构建过程如下:将由步骤1.1得到重叠PCR产物用限制性内切酶Hind III和Xho I进行双酶切后分别与经同样酶双酶切的质粒pET-30a(+)-LipA-ELK16和pET-30a(+)-GFP-ELK16(所述质粒的全长序列可见于SEQ ID NO:23和SEQ ID NO:24)用T4连接酶进行连接,用α3-peptide/CpA-m/TZ1H取代ELK16标签,从而获得融合表达载体。
下面以pET-30a(+)-LipA-α3-peptide和pET-30a(+)-GFP-α3-peptide为例说明具体的构建过程。
构建pET-30a(+)-LipA-α3-peptide载体,该载体结构如图2a所示,其中“Targetprotein”序列为枯草芽孢杆菌脂肪酶A(LipA)的序列(见SEQ ID NO:25)。将步骤1.1得到的重叠PCR产物(Hind III-GS接头-α3-peptide-Xho I)和质粒pET-30a(+)-LipA-ELK16同时用限制性内切酶Hind III和Xho I进行双酶切,之后用T4连接酶连接,然后,将连接产物转化到大肠杆菌BL21(DE3)(Novagen)感受态细胞,将转化细胞涂布于添加有50μg/mL卡那霉素的LB平板上筛选阳性克隆,提取质粒,对其进行测序,测序结果表明所克隆的pET-30a(+)-LipA-α3peptide序列正确。
构建pET-30a(+)-GFP-α3-peptide载体,该载体结构如图2a所示,其中“Targetprotein”序列为绿色荧光蛋白(GFP)的序列(见SEQ ID NO:26)。将实施例1.1得到的重叠PCR产物(Hind III-GS接头-α3-peptide-Xho I)和质粒pET-30a(+)-GFP-ELK16同时用限制性内切酶Hind III和Xho I进行双酶切,之后用T4连接酶连接,然后,将连接产物转化到大肠杆菌BL21(DE3)(Novagen)感受态细胞,将转化细胞涂布于添加有50μg/mL卡那霉素的LB平板上筛选阳性克隆,提取质粒,对其进行测序,测序结果表明所克隆的pET-30a(+)-GFP-α3-peptide序列正确。
此外,本申请实施例中所使用的表达载体pET-30a(+)-LipA-native和pET-30a(+)-GFP-native全长序列分别如SEQ ID NO:27和SEQ ID NO:28所示。本领域技术人员可以容易地制备这些质粒。
实施例2:以枯草芽胞杆菌脂肪酶A(LipA)作为目的蛋白的融合蛋白的表达和酶活测定
2.1融合蛋白的诱导表达
将实施例1中构建好的菌株(含有质粒pET-30a(+)-LipA-native、pET-30a(+)-LipA-α3-peptide、pET-30a(+)-LipA-CpA-m和pET-30a(+)-LipA-TZ1H)接种到含50μg/mL卡那霉素的LB液体培养基中,并在37℃摇床中培养至对数期(OD600=0.4-0.6),加入0.2mMIPTG,在30℃下诱导6小时,收获细胞,并测量菌浓度OD600
2.2 SDS-PAGE测定
收获步骤2.1所得的细胞,用等体积的缓冲液(50mM Tris-HCl,50mM NaCl,5%甘油,pH7.2)重悬。在冰上通过超声破碎细胞(破碎条件为:功率200W,超声时间3sec,间隔时间3sec,超声次数99次)。超声完成后,通过离心分离缓冲液的上清和沉淀。为了尽可能去除沉淀中混杂的可溶成分,用等体积的缓冲液将得到的沉淀洗涤两遍。上清液和沉淀重悬液直接用于SDS-PAGE测定。
SDS-PAGE的分析结果如图3a所示。LipA-α3-peptide、LipA-CpA-m和LipA-TZ1H这3种融合蛋白均大量地分布在沉淀中,有78-92%的融合蛋白形成了聚集体。而对照组融合蛋白LipA-native则大量以可溶形式表达,可溶蛋白占总蛋白量的比例约为92%。该结果表明,α3-peptide、CpA-m和TZ1H这3个短肽都可以诱导LipA在大肠杆菌中形成聚集体,α3-peptide的聚集效果最好,CpA-m和TZ1H的聚集效果差不多。
2.3酶活检测
收获步骤2.1所得的细胞,用等体积的缓冲液(50mM Tris-HCl,50mM NaCl,5%甘油,pH7.2)重悬。在冰上通过超声破碎细胞(破碎条件为:功率200W,超声时间3sec,间隔时间3sec,超声次数99次)。超声完成后,通过离心小心地分离上清和沉淀。为了尽可能去除沉淀中混杂的可溶成分,用等体积的缓冲液将得到的沉淀洗涤两遍。上清液和沉淀重悬液直接用于相应的酶活测定。其中,脂肪酶活性的定量测定方法如下:
测定LipA对棕榈酸对硝基苯脂(p-nitrophenyl palmitate,pNPP)的活性。对pNPP测量方法详见文献(Winkler,U.K.,M.Stuckmann,Glycogen,Hyaluronate,and Some OtherPolysaccharides Greatly Enhance the Formation of Exolipase by Serratiamarcescens,Journal of Bacteriology,1979,138(3):663-670)。活性定义为:在测定条件下,1分钟内水解上述底物产生1nmol的对硝基苯酚(p-nitrophenol)或是脂肪酸(fattyacid)所需要的酶量定义为1个活性单位。
融合蛋白的酶活数据如图3b所示,LipA-α3-peptide、LipA-CpA-m和LipA-TZ1H融合蛋白沉淀均表现出对pNPP底物的水解活性,3种融合蛋白沉淀的活性占总融合蛋白活性的比例分别为96%、93%和87%。可溶的LipA-native融合蛋白对pNPP也表现出水解活性。以LipA-native的总酶活为100%,LipA-α3-peptide、LipA-CpA-m和LipA-TZ1H这3种沉淀的酶活分别89%、114%和171%。
综合SDS-PAGE和酶活数据(图3a和3b),本实施例中的3种肽(α3-peptide、CpA-m和TZ1H)都能够诱导LipA在大肠杆菌中形成具有脂肪酶催化活性的融合蛋白聚集体。
实施例3:以绿色荧光蛋白(GFP)作为目的多肽的融合蛋白的表达及其在胞内的分布
3.1融合蛋白的诱导表达
将实施例1中构建好的菌株(含有质粒pET-30a(+)-GFP-α3-peptide、pET-30a(+)-GFP-CpA-m和pET-30a(+)-GFP-TZ1H)接种到含50μg/mL卡那霉素的LB液体培养基中,并在37℃摇床中培养至对数期(OD600=0.4-0.6),加入0.2mM IPTG,在23℃下诱导22小时,收获细胞,并测量菌浓度OD600
3.2 SDS-PAGE测定
收获步骤3.1所得的细胞,用等体积的缓冲液(50mM Tris-HCl,50mM NaCl,5%甘油,pH7.2)重悬。在冰上通过超声破碎细胞(破碎条件为:功率200W,超声时间3sec,间隔时间3sec,超声次数99次)。超声完成后,通过离心分离缓冲液的上清和沉淀。为了尽可能去除沉淀中混杂的可溶成分,用等体积的缓冲液将得到的沉淀洗涤两遍。上清液和沉淀重悬液直接用于SDS-PAGE测定。
SDS-PAGE的分析结果如图4a所示。GFP-α3-peptide、GFP-CpA-m和GFP-TZ1H这3种融合蛋白均大量地分布在沉淀中,该结果表明,α3-peptide、CpA-m和TZ1H这3个短肽都可以诱导GFP在大肠杆菌中形成聚集体,α3-peptide的聚集效果最好,CpA-m和TZ1H的聚集效果差不多。
3.3融合蛋白的胞内分布
收获步骤3.1所得的细胞,用4%(w/v)的多聚甲醛在4℃处理1h。GFP细胞的荧光共焦显微观测在Zeiss710倒置共聚焦显微镜(Zeiss LSM 710confocal microscope)上完成,激发波长为488nm。
GFP融合蛋白在细胞内的分布情况如图4b、图4c、图4d所示,表达了GFP-α3-peptide、GFP-CpA-m和GFP-TZ1H这3种融合蛋白的大肠杆菌,其荧光分布非常相似,都呈现出明显的局部分布,都聚集在细胞质中,位于细胞的两端,结果说明,GFP-α3-peptide、GFP-CpA-m和GFP-TZ1H这3种融合蛋白都以聚集体的形式表达,而且聚集体中的GFP具有生物活性。
实施例4:构建以枯草芽胞杆菌脂肪酶A(LipA)为目的蛋白的包含切割位点的融合蛋白表达载体
本实施例中选择LipA作为目的蛋白,构建包含Mxe GyrA自切割位点的融合蛋白,通过本发明的方法进行重组生产和纯化。
本申请实施例中所使用的表达载体pET-30a(+)-LipA-Mxe-α3-peptide/CpA-m/TZ1H的构建过程:将由实施例1得到重叠PCR产物用限制性内切酶Hind III和Xho I进行双酶切后与经同样酶双酶切的质粒pET-30a(+)-LipA-Mxe-ELK16(全长序列如SEQ ID NO:29所示)进行连接,从而获得所需融合表达载体(载体结构见图2b)。将连接产物转化到大肠杆菌BL21(DE3)(Novagen)感受态细胞,将转化细胞涂布于添加有50μg/mL卡那霉素的LB平板上筛选阳性克隆,提取质粒,对其进行测序,测序结果表明所克隆的pET-30a(+)-LipA-Mxe-α3-peptide/CpA-m/TZ1H序列正确。
实施例5:融合蛋白LipA-Mxe-α3-peptide/CpA-m/TZ1H的表达和纯化
将实施例4中构建好的菌株(含有质粒pET-30a(+)-LipA-Mxe-α3-peptide、pET-30a(+)-LipA-Mxe-CpAm、pET-30a(+)-LipA-Mxe-TZ1H)接种到含50μg/mL卡那霉素的LB液体培养基中,并在37℃摇床中培养至对数期(OD600=0.4-0.6),加入0.2mM IPTG,在30℃下诱导6小时,收获细胞,并测量菌浓度OD600
将菌体用裂解缓冲液B1(2.4g的Tris、29.22g的NaCl、0.37g的Na2EDTA·2H2O溶解于800mL水中,调pH至8.5,加水定容至1L)重悬至10OD/mL,超声破碎。在4℃,10000rpm的条件下离心10min,分别收集上清和沉淀部分。将沉淀用裂解缓冲液洗涤2次后,使用切割缓冲液(20mM Tris-HCl pH8.0,500mM NaCl,40mM二硫苏糖醇,1mM EDTA)重悬充分,置于4℃过夜24h,使得内含肽充分进行自切割。之后将悬浊液离心分离,得到的上清和沉淀与切割前的沉淀一起进行SDS-PAGE检测(沉淀部分用与上一重悬步骤相同的体积的裂解缓冲液重悬)。结果如图5所示。分别为泳道1:细胞裂解物沉淀,可检测到清晰的三元融合蛋白表达成的酶聚集体;泳道2:切割后分离的沉淀;泳道3:切割后分离的上清,可检测到清晰的目的蛋白条带;泳道a-e:含有牛血清蛋白BSA的蛋白定量标准品,上样量依次为8μg、4μg、2μg、1μg、0.5μg。
依照蛋白定量标准品,应用Bio-Rad公司的Quantity ONE凝胶定量分析软件对目的条带进行光密度分析,可计算得出融合蛋白形成的聚集体产量、在内含肽介导的自切割之后释放到上清中的目的蛋白产量、Mxe GyrA切割效率、以及目的多肽在上清中的纯度,结果如表2所示。
表2
Figure BDA0001912326370000121
a蛋白聚集体产量
b内含肽介导的自切割后的目的多肽产量(以菌浓度OD600为2时,每升LB培养基中的大肠杆菌细胞产生2.66mg细胞湿重计算);
c内含肽介导的自切割效率=100%×(切割前聚集体表达量-切割后聚集体剩余量)/切割前聚集体产量。
3种三联体融合蛋白(LipA-Mxe-α3-peptide、LipA-Mxe-CpA-m、LipA-Mxe-TZ1H)均以沉淀形式存在,说明三种自组装短肽α3-peptide、CpA-m、TZ1H均可诱导LipA和Mxe GyrA的融合蛋白在大肠杆菌中形成聚集体,聚集体表达量分别为61.3μg/mg,84.2μg/mg和87.6μg/mg,3种不可溶的三联体融合蛋白经内含肽Mxe GyrA自切割,LipA同Mxe-α3-peptide/CpA-m/TZ1H分离,切割效率产量是38.7~61.3%,切割后释放到上清中的LipA的产量有所不同,产量是5.1~25.8μg/mg,切割后的上清中除了LipA,还有Mxe-α3-peptide/CpA-m/TZ1H和未切割完全的三联体融合蛋白,LipA的纯度为46~90.8%,其中,LipA-Mxe-α3-peptide融合蛋白切割后得到的LipA的纯度最高。
序列表
<110> 华南理工大学
<120> α螺旋自组装短肽及其在蛋白质纯化中的应用
<150> 2018115182674
<151> 2018-12-12
<160> 29
<170> SIPOSequenceListing 1.0
<210> 1
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Leu Glu Thr Leu Ala Lys Ala Leu Glu Thr Leu Ala Lys Ala Leu Glu
1 5 10 15
Thr Leu Ala Lys Ala
20
<210> 2
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Met Lys Gln Leu Glu Asp Lys Ile Glu Glu Leu Leu Ser Lys Ala Ala
1 5 10 15
Met Lys Gln Leu Glu Asp Lys Ile Glu Glu Leu Leu Ser Lys
20 25 30
<210> 3
<211> 41
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Glu Ile Ala Gln His Glu Lys Glu Ile Gln Ala Ile Glu Lys Lys Ile
1 5 10 15
Ala Gln His Glu Tyr Lys Ile Gln Ala Ile Glu Glu Lys Ile Ala Gln
20 25 30
His Lys Glu Lys Ile Gln Ala Ile Lys
35 40
<210> 4
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ctggaaaccc tcgcgaaggc tctggagacc ctggcgaaag cgctcgaaac gctcgctaaa 60
gcg 63
<210> 5
<211> 90
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atgaagcagc tggaagacaa aattgaggaa ctcctgtcta aagcggcgat gaaacaactg 60
gaggacaaga tcgaagagct gctctctaaa 90
<210> 6
<211> 123
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gaaatcgcac aacacgagaa agagatccaa gccatcgaaa agaaaattgc tcagcacgaa 60
tacaaaattc aagcgattga agaaaaaatc gcgcagcaca aagagaaaat ccaggcgatc 120
aaa 123
<210> 7
<211> 15
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 8
<211> 198
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Cys Ile Thr Gly Asp Ala Leu Val Ala Leu Pro Glu Gly Glu Ser Val
1 5 10 15
Arg Ile Ala Asp Ile Val Pro Gly Ala Arg Pro Asn Ser Asp Asn Ala
20 25 30
Ile Asp Leu Lys Val Leu Asp Arg His Gly Asn Pro Val Leu Ala Asp
35 40 45
Arg Leu Phe His Ser Gly Glu His Pro Val Tyr Thr Val Arg Thr Val
50 55 60
Glu Gly Leu Arg Val Thr Gly Thr Ala Asn His Pro Leu Leu Cys Leu
65 70 75 80
Val Asp Val Ala Gly Val Pro Thr Leu Leu Trp Lys Leu Ile Asp Glu
85 90 95
Ile Lys Pro Gly Asp Tyr Ala Val Ile Gln Arg Ser Ala Phe Ser Val
100 105 110
Asp Cys Ala Gly Phe Ala Arg Gly Lys Pro Glu Phe Ala Pro Thr Thr
115 120 125
Tyr Thr Val Gly Val Pro Gly Leu Val Arg Phe Leu Glu Ala His His
130 135 140
Arg Asp Pro Asp Ala Gln Ala Ile Ala Asp Glu Leu Thr Asp Gly Arg
145 150 155 160
Phe Tyr Tyr Ala Lys Val Ala Ser Val Thr Asp Ala Gly Val Gln Pro
165 170 175
Val Tyr Ser Leu Arg Val Asp Thr Ala Asp His Ala Phe Ile Thr Asn
180 185 190
Gly Phe Val Ser His Ala
195
<210> 9
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
cccaagcttg gcggcggtgg ttctggcggt ggcggttccg gt 42
<210> 10
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
cttcgcgagg gtttccaggc taccgccgcc accggaaccg ccacc 45
<210> 11
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ctggaaaccc tcgcgaaggc tctggagacc ctggcgaaag cgctc 45
<210> 12
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ccgctcgagt cacgctttag cgagcgtttc gagcgctttc gccagg 46
<210> 13
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
cccaagcttg gcggcggtgg ttctggcggt ggcggttccg gtggcggcgg tagc 54
<210> 14
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
agacaggagt tcctcaattt tgtcttccag ctgcttcatg ctaccgccgc cacc 54
<210> 15
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
acaaaattga ggaactcctg tctaaagcgg cgatgaaaca actggaggac aaga 54
<210> 16
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
ccgctcgagt catttagaga gcagctcttc gatcttgtcc tccagttgtt tca 53
<210> 17
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
cccaagcttg gcggcggtgg ttctggcggt ggcggttccg gtggcggcgg 50
<210> 18
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
tggcttggat ctctttctcg tgttgtgcga tttcgctacc gccgccaccg g 51
<210> 19
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
cgagaaagag atccaagcca tcgaaaagaa aattgctcag cacgaataca a 51
<210> 20
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gcgcgatttt ttcttcaatc gcttgaattt tgtattcgtg ctgagcaatt t 51
<210> 21
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
cgattgaaga aaaaatcgcg cagcacaaag agaaaatcca ggcgatcaaa t 51
<210> 22
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
ccgctcgagt catttgatcg cctggatttt ctc 33
<210> 23
<211> 5922
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980
gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040
ataattttgt ttaactttaa gaaggagata tacatatgca ccatcaccat caccacccca 5100
cccctatggc tgaacacaat ccagtcgtta tggttcacgg tattggaggg gcatcattca 5160
attttgcggg aattaagagc tatctcgtat ctcagggctg gtcgcgggac aagctgtatg 5220
cagttgattt ttgggacaag acaggcacaa attataacaa tggaccggta ttatcacgat 5280
ttgtgcaaaa ggttttagat gaaacgggtg cgaaaaaagt ggatattgtc gctcacagca 5340
tggggggcgc gaacacactt tactacataa aaaatctgga cggcggaaat aaagttgcaa 5400
acgtcgtgac gcttggcggc gcgaaccgtt tgacgacagg caaggcgctt ccgggaacag 5460
atccaaatca aaagatttta tacacatcca tttacagcag tgccgatatg attgtcatga 5520
attacttatc aagattagat ggtgctagaa acgttcaaat ccatggcgtt ggacacatcg 5580
gccttctgta cagcagccaa gtcaacagcc tgattaaaga agggctgaac ggcgggggcc 5640
agaatacgaa taagcttccg accccaccga ccacgccaac gccaccaacc accccaaccc 5700
cgacgccgct ggaacttgaa ctgaagttaa aactggaatt agaattaaag ctgaaatgac 5760
tcgagcacca ccaccaccac cactgagatc cggctgctaa caaagcccga aaggaagctg 5820
agttggctgc tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg 5880
tcttgagggg ttttttgctg aaaggaggaa ctatatccgg at 5922
<210> 24
<211> 6093
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980
gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040
ataattttgt ttaactttaa gaaggagata tacatatgag taaaggagaa gaacttttca 5100
ctggagttgt cccaattctt gttgaattag atggtgatgt taatgggcac aaattttctg 5160
tcagtggaga gggtgaaggt gatgcaacat acggaaaact tacccttaaa tttatttgca 5220
ctactggaaa actacctgtt ccatggccaa cacttgtcac tactttcact tatggtgttc 5280
aatgcttttc aagataccca gatcacatga aacggcatga ctttttcaag agtgccatgc 5340
ccgaaggtta tgtacaggaa agaactatat ttttcaaaga tgacgggaac tacaagacac 5400
gtgctgaagt caagtttgaa ggtgataccc ttgttaatag aatcgagtta aaaggtattg 5460
attttaaaga agatggaaac attcttggac acaaattgga atacaactat aacccacaca 5520
atgtatacat catggcagac aaacaaaaga atggaatcaa agttaacttc aaaattagac 5580
acaacattga agatggaagc gctcaactag cagaccatta tcaacaaaat actccaattg 5640
gcgatggccc tgtcctttta ccagacaacc attacctgtc cacacaatct gccctttcga 5700
aagatcccaa cgaaaggaga gaccacatgg tccttcttga gtttgtaaca gctgctggga 5760
ttacacatgg catggatgaa ctatacaaag gtaccccggg tcgacctgca gccaagctga 5820
ataagcttcc gaccccaccg accacgccaa cgccaccaac caccccaacc ccgacgccgc 5880
tggaacttga actgaagtta aaactggaat tagaattaaa gctgaaatga ctcgagcacc 5940
accaccacca ccactgagat ccggctgcta acaaagcccg aaaggaagct gagttggctg 6000
ctgccaccgc tgagcaataa ctagcataac cccttggggc ctctaaacgg gtcttgaggg 6060
gttttttgct gaaaggagga actatatccg gat 6093
<210> 25
<211> 546
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
atggctgaac acaatccagt cgttatggtt cacggtattg gaggggcatc attcaatttt 60
gcgggaatta agagctatct cgtatctcag ggctggtcgc gggacaagct gtatgcagtt 120
gatttttggg acaagacagg cacaaattat aacaatggac cggtattatc acgatttgtg 180
caaaaggttt tagatgaaac gggtgcgaaa aaagtggata ttgtcgctca cagcatgggg 240
ggcgcgaaca cactttacta cataaaaaat ctggacggcg gaaataaagt tgcaaacgtc 300
gtgacgcttg gcggcgcgaa ccgtttgacg acaggcaagg cgcttccggg aacagatcca 360
aatcaaaaga ttttatacac atccatttac agcagtgccg atatgattgt catgaattac 420
ttatcaagat tagatggtgc tagaaacgtt caaatccatg gcgttggaca catcggcctt 480
ctgtacagca gccaagtcaa cagcctgatt aaagaagggc tgaacggcgg gggccagaat 540
acgaat 546
<210> 26
<211> 744
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
agtaaaggag aagaactttt cactggagtt gtcccaattc ttgttgaatt agatggtgat 60
gttaatgggc acaaattttc tgtcagtgga gagggtgaag gtgatgcaac atacggaaaa 120
cttaccctta aatttatttg cactactgga aaactacctg ttccatggcc aacacttgtc 180
actactttca cttatggtgt tcaatgcttt tcaagatacc cagatcacat gaaacggcat 240
gactttttca agagtgccat gcccgaaggt tatgtacagg aaagaactat atttttcaaa 300
gatgacggga actacaagac acgtgctgaa gtcaagtttg aaggtgatac ccttgttaat 360
agaatcgagt taaaaggtat tgattttaaa gaagatggaa acattcttgg acacaaattg 420
gaatacaact ataacccaca caatgtatac atcatggcag acaaacaaaa gaatggaatc 480
aaagttaact tcaaaattag acacaacatt gaagatggaa gcgctcaact agcagaccat 540
tatcaacaaa atactccaat tggcgatggc cctgtccttt taccagacaa ccattacctg 600
tccacacaat ctgccctttc gaaagatccc aacgaaagga gagaccacat ggtccttctt 660
gagtttgtaa cagctgctgg gattacacat ggcatggatg aactatacaa aggtaccccg 720
ggtcgacctg cagccaagct gaat 744
<210> 27
<211> 5817
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980
gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040
ataattttgt ttaactttaa gaaggagata tacatatgca ccatcaccat caccacccca 5100
cccctatggc tgaacacaat ccagtcgtta tggttcacgg tattggaggg gcatcattca 5160
attttgcggg aattaagagc tatctcgtat ctcagggctg gtcgcgggac aagctgtatg 5220
cagttgattt ttgggacaag acaggcacaa attataacaa tggaccggta ttatcacgat 5280
ttgtgcaaaa ggttttagat gaaacgggtg cgaaaaaagt ggatattgtc gctcacagca 5340
tggggggcgc gaacacactt tactacataa aaaatctgga cggcggaaat aaagttgcaa 5400
acgtcgtgac gcttggcggc gcgaaccgtt tgacgacagg caaggcgctt ccgggaacag 5460
atccaaatca aaagatttta tacacatcca tttacagcag tgccgatatg attgtcatga 5520
attacttatc aagattagat ggtgctagaa acgttcaaat ccatggcgtt ggacacatcg 5580
gccttctgta cagcagccaa gtcaacagcc tgattaaaga agggctgaac ggcgggggcc 5640
agaatacgaa ttgactcgag caccaccacc accaccactg agatccggct gctaacaaag 5700
cccgaaagga agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg 5760
gggcctctaa acgggtcttg aggggttttt tgctgaaagg aggaactata tccggat 5817
<210> 28
<211> 5988
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980
gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040
ataattttgt ttaactttaa gaaggagata tacatatgag taaaggagaa gaacttttca 5100
ctggagttgt cccaattctt gttgaattag atggtgatgt taatgggcac aaattttctg 5160
tcagtggaga gggtgaaggt gatgcaacat acggaaaact tacccttaaa tttatttgca 5220
ctactggaaa actacctgtt ccatggccaa cacttgtcac tactttcact tatggtgttc 5280
aatgcttttc aagataccca gatcacatga aacggcatga ctttttcaag agtgccatgc 5340
ccgaaggtta tgtacaggaa agaactatat ttttcaaaga tgacgggaac tacaagacac 5400
gtgctgaagt caagtttgaa ggtgataccc ttgttaatag aatcgagtta aaaggtattg 5460
attttaaaga agatggaaac attcttggac acaaattgga atacaactat aacccacaca 5520
atgtatacat catggcagac aaacaaaaga atggaatcaa agttaacttc aaaattagac 5580
acaacattga agatggaagc gctcaactag cagaccatta tcaacaaaat actccaattg 5640
gcgatggccc tgtcctttta ccagacaacc attacctgtc cacacaatct gccctttcga 5700
aagatcccaa cgaaaggaga gaccacatgg tccttcttga gtttgtaaca gctgctggga 5760
ttacacatgg catggatgaa ctatacaaag gtaccccggg tcgacctgca gccaagctga 5820
attgactcga gcaccaccac caccaccact gagatccggc tgctaacaaa gcccgaaagg 5880
aagctgagtt ggctgctgcc accgctgagc aataactagc ataacccctt ggggcctcta 5940
aacgggtctt gaggggtttt ttgctgaaag gaggaactat atccggat 5988
<210> 29
<211> 6507
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840
agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900
cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020
tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080
tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140
taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200
ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260
tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320
tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340
caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400
ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520
gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580
gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640
aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700
ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760
acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880
tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940
tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000
cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060
gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120
ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600
tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740
ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800
ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860
cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920
gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980
gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040
ataattttgt ttaactttaa gaaggagata tacatatgcc cacccctatg gctgaacaca 5100
atccagtcgt tatggttcac ggtattggag gggcatcatt caattttgcg ggaattaaga 5160
gctatctcgt atctcagggc tggtcgcggg acaagctgta tgcagttgat ttttgggaca 5220
agacaggcac aaattataac aatggaccgg tattatcacg atttgtgcaa aaggttttag 5280
atgaaacggg tgcgaaaaaa gtggatattg tcgctcacag catggggggc gcgaacacac 5340
tttactacat aaaaaatctg gacggcggaa ataaagttgc aaacgtcgtg acgcttggcg 5400
gcgcgaaccg tttgacgaca ggcaaggcgc ttccgggaac agatccaaat caaaagattt 5460
tatacacatc catttacagc agtgccgata tgattgtcat gaattactta tcaagattag 5520
atggtgctag aaacgttcaa atccatggcg ttggacacat cggccttctg tacagcagcc 5580
aagtcaacag cctgattaaa gaagggctga acggcggggg ccagaatacg aatatgcgaa 5640
tgtgcatcac gggagatgca ctagttgccc tacccgaggg cgagtcggta cgcatcgccg 5700
acatcgtgcc gggtgcgcgg cccaacagtg acaacgccat cgacctgaaa gtccttgacc 5760
ggcatggcaa tcccgtgctc gccgaccggc tgttccactc cggcgagcat ccggtgtaca 5820
cggtgcgtac ggtcgaaggt ctgcgtgtga cgggcaccgc gaaccacccg ttgttgtgtt 5880
tggtcgacgt cgccggggtg ccgaccctgc tgtggaagct gatcgacgaa atcaagccgg 5940
gcgattacgc ggtgattcaa cgcagcgcat tcagcgtcga ctgtgcaggt tttgcccgcg 6000
ggaaacccga atttgcgccc acaacctaca cagtcggcgt ccctggactg gtgcgtttct 6060
tggaagcaca ccaccgagac ccggacgccc aagctatcgc cgacgagctg accgacgggc 6120
ggttctacta cgcgaaagtc gccagtgtca ccgacgccgg cgtgcagccg gtgtatagcc 6180
ttcgtgtcga cacggcagac cacgcgttta tcacgaacgg gttcgtcagc cacgctaagc 6240
ttccgacccc accgaccacg ccaacgccac caaccacccc aaccccgacg ccgctggaac 6300
ttgaactgaa gttaaaactg gaattagaat taaagctgaa atgactcgag caccaccacc 6360
accaccactg agatccggct gctaacaaag cccgaaagga agctgagttg gctgctgcca 6420
ccgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg aggggttttt 6480
tgctgaaagg aggaactata tccggat 6507

Claims (10)

1.α螺旋自组装短肽,其特征在于,氨基酸序列如SEQ ID NO:2所示,所述α螺旋自组装短肽形成卷曲螺旋结构。
2.权利要求1所述的α螺旋自组装短肽在蛋白质生产和纯化中的应用,其特征在于,包括以下步骤:
(1)将重组表达构建体导入宿主细胞中;所述重组表达构建体包括编码融合蛋白的多核苷酸序列与表达控制序列;所述融合蛋白是所述α螺旋自组装短肽和目的蛋白通过接头连接得到;
(2)培养步骤(1)所得宿主细胞,表达所述融合蛋白;
(3)裂解步骤(2)所得宿主细胞,离心去除上清,收集不可溶部分。
3.根据权利要求2所述的应用,其特征在于,步骤(1)所述接头为GS型接头。
4.根据权利要求3所述的应用,其特征在于,所述接头的氨基酸序列如SEQ ID NO:7所示。
5.根据权利要求3所述的应用,其特征在于,所述接头包含切割位点。
6.根据权利要求5所述的应用,其特征在于,所述切割位点选自化学切割位点、酶法切割位点和自切割位点。
7.根据权利要求6所述的应用,其特征在于,所述切割位点为自切割位点,其中的自切割位点为内含肽。
8.根据权利要求7所述的应用,其特征在于,所述内含肽为Mxe GyrA内含肽,氨基酸序列如SEQ ID NO:8所示。
9.根据权利要求7或8所述的应用,其特征在于,所述融合蛋白中目的蛋白和α螺旋自组装短肽之间的接头含有自切割位点,在蛋白质纯化中的应用还包括以下步骤:
(a)对从步骤(3)收集的不可溶部分的切割位点进行切割,使目的蛋白释放到上清中;
(b)去除步骤(a)中的不可溶部分,回收含有目的蛋白的可溶部分。
10.根据权利要求2所述的应用,其特征在于,步骤(3)所述裂解的方式为超声、匀浆、高压、低渗、使用去垢剂、使用裂解酶、使用有机溶剂中的一种以上。
CN201811557416.8A 2018-12-12 2018-12-19 α螺旋自组装短肽及其在蛋白质纯化中的应用 Active CN109627290B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2018115182674 2018-12-12
CN201811518267 2018-12-12

Publications (2)

Publication Number Publication Date
CN109627290A CN109627290A (zh) 2019-04-16
CN109627290B true CN109627290B (zh) 2022-03-29

Family

ID=66075639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811557416.8A Active CN109627290B (zh) 2018-12-12 2018-12-19 α螺旋自组装短肽及其在蛋白质纯化中的应用

Country Status (1)

Country Link
CN (1) CN109627290B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112745393A (zh) * 2019-10-31 2021-05-04 华南理工大学 多肽的生产和纯化方法
CN117440963A (zh) * 2021-06-03 2024-01-23 华南理工大学 重组蛋白纯化方法
CN114736309A (zh) * 2022-04-20 2022-07-12 广州市乾相生物科技有限公司 一种基于离心法的寡肽合成及纯化方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU7542698A (en) * 1997-05-23 1998-12-11 Gendaq Limited Nucleic acid binding proteins
WO2006083275A2 (en) * 2004-05-21 2006-08-10 The Uab Research Foundation Variable lymphocyte receptors, related polypeptides and nucleic acids, and uses thereof
CN104250288A (zh) * 2013-06-28 2014-12-31 清华大学 两亲性α螺旋自组装肽及其应用
CN104755502A (zh) * 2012-10-12 2015-07-01 清华大学 多肽的产生和纯化方法
CN108383912A (zh) * 2018-02-06 2018-08-10 清华大学 人工融合蛋白及其用途

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9777041B2 (en) * 2013-09-09 2017-10-03 New York University Protein nanofibers from self-assembling pentamers

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU7542698A (en) * 1997-05-23 1998-12-11 Gendaq Limited Nucleic acid binding proteins
WO2006083275A2 (en) * 2004-05-21 2006-08-10 The Uab Research Foundation Variable lymphocyte receptors, related polypeptides and nucleic acids, and uses thereof
CN104755502A (zh) * 2012-10-12 2015-07-01 清华大学 多肽的产生和纯化方法
CN104755502B (zh) * 2012-10-12 2018-05-18 清华大学 多肽的产生和纯化方法
CN104250288A (zh) * 2013-06-28 2014-12-31 清华大学 两亲性α螺旋自组装肽及其应用
CN108383912A (zh) * 2018-02-06 2018-08-10 清华大学 人工融合蛋白及其用途

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Effects of Chain Length of an Amphipathic Polypeptide Carrying the Repeated Amino Acid Sequence (LETLAKA)non α‑Helix and Fibrous Assembly Formation;Toshiaki Takei等;《Biochemistry》;pubmed;20130326;第52卷(第16期);摘要 *
Rational Design of a Reversible pH-Responsive Switch for Peptide Self-Assembly;Yuri Zimenkov等;《J. Am. Chem. Soc.》;pubmed;20060510;第128卷;第6770页图1,右栏第2段 *
Toshiaki Takei等.Effects of Chain Length of an Amphipathic Polypeptide Carrying the Repeated Amino Acid Sequence (LETLAKA)non α‑Helix and Fibrous Assembly Formation.《Biochemistry》.pubmed,2013,第52卷(第16期),摘要. *
Yuri Zimenkov等.Rational Design of a Reversible pH-Responsive Switch for Peptide Self-Assembly.《J. Am. Chem. Soc.》.pubmed,2006,第128卷第6770页图1,右栏第2段. *
自组装双亲短肽氨基酸组成及连接肽对其融合酶表达量的影响;赵伟欣等;《食品与发酵工业》;CNKI;20171231;第43卷(第12期);第1-6页 *

Also Published As

Publication number Publication date
CN109627290A (zh) 2019-04-16

Similar Documents

Publication Publication Date Title
CN111304232B (zh) 基于膜表面融合表达策略纯化蛋白的方法及其应用
CN111454978B (zh) 用于特异性吸附重金属铅的表面展示工程菌及构建方法和应用
CN109627290B (zh) α螺旋自组装短肽及其在蛋白质纯化中的应用
US20030143685A1 (en) Efficient protein expression system
CN111850007B (zh) 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36864及应用
CN111848758B (zh) 一种适用于低钙离子浓度的纤维小体对接蛋白突变体及应用
CN115074340B (zh) 一种新内含肽及其在合成人源原弹性蛋白上的应用
CN111848757B (zh) 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36862及应用
CN111850005B (zh) 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36863及应用
CN113383080B (zh) 用于增加蛋白质分泌的细菌表达载体
CN113151214B (zh) 一种具有脂肪酶活性的蛋白PnlipA及其基因和应用
CN111850006B (zh) 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36865及应用
CN110596381A (zh) 检测甜瓜蚜传黄化病毒的方法及其专用多克隆抗体的制备
CN112410361B (zh) 一种生产南极假丝酵母脂肪酶b的方法及其使用的特异dna分子
KR20060098528A (ko) 대장균 발현 시스템을 이용한 인간 단백질 타이로신 탈인산화 효소의 발현 및 정제방법
CN115074341B (zh) 第238位丝氨酸残基改造在提高酯酶DcaE4活性上的应用
CN113122561B (zh) 膜蛋白SohB的表达载体及其表达纯化方法
CN113337491B (zh) 一种提高角蛋白酶耐高温稳定性的结构域及其应用
CN113122558B (zh) 膜蛋白AmpG的表达载体及其表达纯化方法
CN113767169A (zh) 用于制备羟基化烃的基于氨基酸被丙氨酸取代的修饰的单加氧酶
CN113122559A (zh) 膜蛋白SecF的表达载体及其表达纯化方法
CN113136395A (zh) 膜蛋白YcbM的表达载体及其表达纯化方法
CN113122557A (zh) 膜蛋白AmtB的表达载体及其表达纯化方法
CN113122562A (zh) 膜蛋白YddG的表达载体及其表达纯化方法
CN113122560A (zh) 膜蛋白FieF的表达载体及其表达纯化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant