CN109627290B

CN109627290B - α螺旋自组装短肽及其在蛋白质纯化中的应用

Info

Publication number: CN109627290B
Application number: CN201811557416.8A
Authority: CN
Inventors: 林章凛; 仙丹华; 杨晓锋; 赵镭; 王胥; 周碧红
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2018-12-12
Filing date: 2018-12-19
Publication date: 2022-03-29
Anticipated expiration: 2038-12-19
Also published as: CN109627290A

Abstract

本发明公开了α螺旋自组装短肽及其在蛋白质纯化中的应用，属于基因工程领域。该α螺旋自组装短肽的氨基酸序列如SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3所示。将该α螺旋自组装短肽与目的蛋白形成的融合蛋白在宿主细胞内表达后形成有活性的聚集体，通过表达所述融合蛋白来生产和纯化目的蛋白。本发明的α螺旋自组装短肽可以诱导融合蛋白形成大量的有活性的蛋白聚集体，纯化得到的目的蛋白产量和纯度都很高，而且该纯化方法对设备要求低，不需要纯化柱，生产成本低，操作简便，可应用于蛋白质的生产和纯化中。

Description

α螺旋自组装短肽及其在蛋白质纯化中的应用

技术领域

本发明涉及基因工程领域，具体涉及α螺旋自组装短肽及其在蛋白质纯化中的应用。

背景技术

利用基因重组技术表达外源蛋白在现代生物学技术的发展和应用中起着重要的作用，重组蛋白类生物制品在生物催化和生物医药领域的应用越来越广泛，利用原核系统重组表达生产酶制剂和多肽类药物已取得重大进展，但是，在原核系统中表达外源基因时，目的蛋白容易以不可溶的蛋白聚集体(包涵体)的形式存在[Williams,D.C.,et al.,Cytoplasmic inclusion bodies in Escherichia coli producing biosynthetic humaninsulin proteins.Science,1982.215(4533):p.687-9]。包涵体表达虽然可以避免蛋白酶对外源蛋白的降解，但是对表达产物的活性不利，需要后续的变复性才能得到具有生物活性的功能蛋白，蛋白变复性技术存在成本高、收率低、技术复杂等问题[von Maltzahn,G.,et al.,Positively Charged Surfactant-like Peptides Self-assemble intoNanostructures.Langmuir,2003.19(10):p.4332-4337]，限制了包涵体表达的应用。

研究发现，目的蛋白和易于聚集的短肽融合表达可以使表达得到的包涵体具有活性，这一发现改变了人们对包涵体的看法[Garcia-Fruitos,E.,Inclusion bodies:a newconcept.Microb Cell Fact,2010.9:p.80]、[Mitraki,A.,Protein Aggregation:FromInclusion Bodies to Amyloid and Biomaterials,in Advances in Protein Chemistryand Structural Biology,A.McPherson,Editor.2010,Academic Press.p.89-125]、[García-Fruitós,E.,et al.,Bacterial inclusion bodies:making gold from waste.Trendsin Biotechnology,2012.30(2):p.65-70]，这种具有生物活性的包涵体可以避免复杂的蛋白复性操作，具有良好的应用前景。

蛋白的分离纯化是重组生产蛋白中关键的一步，该步骤的技术难度和成本均高，据报道，重组蛋白的分离和纯化成本约占其全部成本的60％-80％[陈浩等人,中国生物工程杂志,2002.22(5):p.87-92]。目前最常用的蛋白分离纯化方法是亲和层析，但是其高昂的成本限制了其在工业中的应用。

目的蛋白、内含肽和自组装短肽融合表达时可以诱导融合蛋白形成有活性的蛋白聚集体[Wu,W.,et al.,Active protein aggregates induced by terminally attachedself-assembling peptide ELK16 in Escherichia coli.Microbial Cell Factories,2011.10(1):p.9]、[Zhou,B.,et al.,Small surfactant-like peptides can drivesoluble proteins into active aggregates.Microbial Cell Factories,2012.11(1):p.10]、[Wang,X.,et al.,Formation of active inclusion bodies induced byhydrophobic self-assembling peptide GFIL8.Microb Cell Fact,2015.14:p.88]，聚集体通过内含肽的自切割使得目的蛋白释放到上清中，这种蛋白质的分离纯化方法成本低、操作简单，在工业生产中具有良好的应用前景。

发明内容

为了克服现有技术的不足，本发明的目的是提供α螺旋自组装短肽及其在蛋白质纯化中的应用。

本发明的目的通过以下技术方案实现。

α螺旋自组装短肽，所述短肽是α螺旋自组装短肽，氨基酸序列如SEQ ID NO:1、SEQID NO:2或SEQ ID NO:3所示。

所述α螺旋自组装短肽，在水中通过形成卷曲螺旋(colied-coil)结构实现自组装，colied-coil区域由重复的7个氨基酸残基组成。

所述α螺旋自组装短肽是两亲性α螺旋自组装短肽，每7个氨基酸形成的螺旋表面划分为一个亲水面和一个疏水面，亲水面由亲水性氨基酸组成，疏水面由疏水性氨基酸组成。

所述两亲性α螺旋自组装短肽是疏水面大于亲水面的两亲性α螺旋自聚集短肽，氨基酸序列如SEQ ID NO:1所示，结构如图1a所示，疏水面由4个疏水性氨基酸组成，亲水面由3个亲水性氨基酸组成，螺旋表面有两个相邻的带相反电荷的氨基酸，即左上半面由两个疏水L(亮氨酸)和两个疏水A(丙氨酸)组成，形成一个疏水面，右下半面由E(谷氨酸)、K(赖氨酸)和T(苏氨酸)三个亲水氨基酸组成，形成一个亲水面，E带负电，K带正电，有正负电荷的吸引作用，α螺旋通过疏水作用相互结合，通过带正负电荷的氨基酸的作用稳定这种结合。

所述两亲性α螺旋自组装短肽是亲水面大于疏水面的两亲性α螺旋自聚集短肽，氨基酸序列如SEQ ID NO:2所示，结构如图1b所示，短肽是前两段七个氨基酸的串联重复，两个重复之间有两个A(丙氨酸)，丙氨酸的插入可以导致两个疏水界面的相转变，亲水面由4-5个氨基酸组成，疏水面由2-3个氨基酸组成，亲水面和疏水面交界处有3个带电的氨基酸，α螺旋通过疏水作用相互结合，通过带正负电荷的氨基酸的作用稳定这种结合。

所述α螺旋自组装短肽可组装成三股的螺旋束，氨基酸序列如SEQ ID NO:3所示，结构如图1c所示，E(谷氨酸)和K(赖氨酸)存在正负电荷的吸引作用，α螺旋通过疏水作用相互结合，通过交替的谷氨酸和赖氨酸的电荷作用稳定这种结合。

以上所述的α螺旋自组装短肽在蛋白质纯化中的应用，包括以下步骤：

(1)将重组表达构建体导入宿主细胞中；所述重组表达构建体包括编码融合蛋白的多核苷酸序列与表达控制序列；所述融合蛋白是所述α螺旋自组装短肽和目的蛋白通过接头连接得到；

(2)培养步骤(1)所得宿主细胞，表达所述融合蛋白；所述α螺旋自组装短肽和目的蛋白形成的融合蛋白在宿主细胞表达后形成大量的有活性的蛋白聚集体。

(3)裂解步骤(2)所得宿主细胞，离心去除上清，收集不可溶部分。

在本发明的重组表达构建体中，编码所述融合蛋白的多核苷酸的序列与表达控制序列可操纵地连接以进行希望的转录及最终在宿主细胞中生产所述融合蛋白。合适的表达控制序列包括但不限于启动子、增强子、核糖体作用位点如核糖体结合位点、聚腺苷酸化位点、转录剪接序列、转录终止序列和稳定mRNA的序列等等。

本发明用的表达构建体的载体包括那些在宿主细胞中自主复制的载体，如质粒载体；还包括能够整合到宿主细胞DNA中并和宿主细胞DNA一起复制的载体。可商购获得许多适于本发明的载体。在一个具体实施方案中，本发明的表达构建体衍生自Novagen公司的pET30a(+)。

优选的，步骤(1)所述宿主细胞，其导入本发明的表达构建体，其中所述宿主细胞能够表达所述融合蛋白。

用于表达本发明融合蛋白的宿主细胞包括原核生物、酵母和高等真核细胞。示例性的原核生物包括埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、沙门氏菌属(Salmonella)以及假单胞菌属(Pseudomonas)和链霉菌属(Streptomyces)的细菌。在优选的实施方案中，宿主细胞是埃希氏菌属细胞，优选是大肠杆菌。在本发明的一个具体实施方案中，所使用的宿主细胞为大肠杆菌BL21(DE3)菌株细胞(Novagen)。

优选的，步骤(1)所述目的蛋白可以是任何长度的多肽和蛋白。可以通过本发明产生和纯化的目的蛋白包括但不限于枯草芽孢杆菌脂肪酶(LipA)和绿色荧光蛋白(GFP)。

优选的，可以通过许多已熟知的技术之一将本发明的重组表达构建体导入宿主细胞，这样的技术包括但不限于：热激转化，电穿孔，DEAE-葡聚糖转染，显微注射，脂质体接介导的转染，磷酸钙沉淀，原生质融合，微粒轰击，病毒转化及类似技术。

优选的，步骤(1)所述接头是指一定长度的由低电荷效应和低疏水性的氨基酸组成，可以使连接的多肽或蛋白各自充分展开，互不影响，各自折叠成自己的天然构象。常用的接头例如，富含甘氨酸(G)和丝氨酸(S)的GS型接头；富含脯氨酸(P)和苏氨酸(T)的PT型接头。本发明选用GS接头，在一些实施方案中，所使用的接头包含序列GGGGSGGGGSGGGGS(如SEQ ID NO:7所示)。

为了纯化目的蛋白，在一些实施方案中，融合蛋白的接头还包含切割位点，切割位点包括化学切割位点、酶法切割位点、自切割位点或本领域其他技术人员知道的切割位点。本发明优选自切割位点，例如，接头包括可自切割的内含肽序列，改变聚集体所处的环境就能诱导内含肽的自切割，见文献[Telenti,A.,et al.,The Mycobacterium xenopi GyrAprotein splicing element:characterization of a minimalintein.Vol.179.1997.6378-82]，不需要外加酶或者有害物质。

本领域包含多种自切割内含肽，本发明的一些实施方案中，内含肽选用Mxe GyrA内含肽，具有SEQ ID NO:8所示的氨基酸序列，在缓冲buffer中加入二硫苏糖醇(DTT)就可诱导Mxe GyrA内含肽在其氨基端的自切割。

优选的，所述融合蛋白中目的蛋白和α螺旋自组装短肽之间的接头含有自切割位点，在蛋白质纯化中的应用还包括以下步骤：

(a)对从步骤(3)收集的不可溶部分的切割位点进行切割，使目的蛋白释放到上清中；

(b)去除步骤(a)中的不可溶部分，回收含有目的蛋白的可溶部分。

在本发明中，使宿主细胞裂解的方法选自本领域常用的处理方式，例如超声、匀浆、高压(例如在弗氏压碎器中)、低渗(osmolysis)、去垢剂、裂解酶、有机溶剂或其组合，并且所述破碎在第一pH条件(即近中性pH，例如pH 6.8-7.2)下进行，由此使得宿主细胞的细胞膜和包涵体破碎，活性聚集体从包涵体中释放出来，但仍然保持不溶状态。

细胞破碎后，通过离心的方法收集聚集体，用缓冲液清洗2次，除去可溶的上清部分，然后通过DTT诱导切割目的蛋白和多肽之间接头中的Mxe GyrA切割位点，使得目的蛋白释放到上清中，通过离心的方法除去不可溶沉淀，收集可溶的含有目的蛋白的上清。

与现有技术相比，本发明具有如下优点：

1、本发明的α螺旋自组装短肽可以诱导融合蛋白形成大量的有活性的蛋白聚集体，可避免目标蛋白在宿主内被降解，或是目标蛋白对宿主造成毒性。

2、本发明蛋白纯化方法，纯化得到的目的蛋白产量和纯度都很高。

3、本发明蛋白质纯化方法对设备要求低，不需要纯化柱，生产成本低，操作简便。

附图说明

图1a为α螺旋自组装短肽α3-peptide的螺旋轮图。

图1b为α螺旋自组装短肽CpA-m的螺旋轮图。

图1c为α螺旋自组装短肽TZ1H的螺旋轮图。

图2a为不带切割位点的融合蛋白的表达载体图谱。

图2b为带自切割位点的融合蛋白的表达载体图谱。

图3a为包含自聚体短肽和LipA的融合蛋白SDS-PAGE的分析结果图。

图3b为包含自聚体短肽和LipA的融合蛋白的酶活测定结果图。

图4a为包含自聚体短肽和GFP的融合蛋白的表达的SDS-PAGE分析结果图。

图4b、图4c、图4d为聚集体在大肠杆菌中的分布结果图。

图5为包含自聚体短肽、内含肽和LipA的融合蛋白的表达和纯化结果图。

具体实施方式

以下通过实例与附图对本发明的具体实施方式作进一步的说明，但本发明的实施方式不限于此。以下实施例中所用方法如无特别说明均为常规方法，具体步骤可参见，例如，《Molecular Cloning:A Laboratory Manual》(Sambrook,J.,Russell,David W.,Molecular Cloning:A Laboratory Manual,3rd edition,2001,NY,Cold SpringHarbor)。所用引物均由英俊生物(Invitrogen)合成。

实施例1：以枯草芽孢杆菌脂肪酶(LipA)和绿色荧光蛋白(GFP)为目的蛋白构建融合表达载体

本实施例中使用一组多肽：α3-peptide、CpA-m、TZ1H，其氨基酸序列分别如SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3，核苷酸序列分别如SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6所示。

1.1扩增3种多肽多核苷酸片段

首先用在线工具DNAworks设计GS型接头和α3-peptide/CpA-m/TZ1H的核苷酸序列。通过DNAWorks设计并合成如表1所示的寡聚核苷酸引物，具体方法见文献[Hoover,D.M.and J.Lubkowski,DNAWorks:an automated method for designingoligonucleotides for PCR-based gene synthesis.Nucleic Acids Res,2002.30(10):p.e43.]，进而通过重叠PCR(overlapping PCR)法得到编码3种肽(Hind III-GS接头-α3-peptide/CpA-m/TZ1H-Xho I)的完整多核苷酸序列。

表1

^a引物下划线部分分别为限制性内切酶Hind III和Xho I的识别位点。

下面，以其中一种肽α3-peptide为例，说明编码α3-peptide(Hind III-GS接头-α3-peptide-Xho I)的多核苷酸片段扩增的方法。

DNAWorks输出用于合成将GS接头α3-peptide基因的4条相互重叠的寡核苷酸片段(包括GS接头的一套引物和α3-peptide的一套引物，序列如表1所示)。这些寡核苷酸片段由英俊生物(Invitrogen)公司合成。

将合成的寡聚核苷酸片段用10mM Tris-HCl，pH8.0的缓冲液溶解。

配制如下PCR反应液：寡聚核苷酸片段混合物，每条片段终浓度625nM；5×fastpfu缓冲液，10μL；Fast pfu(全式金公司)，1μL；dNTPs，5μL；双重蒸馏水，32μL；总计50μL。

PCR反应程序如下：步骤1，95℃，5min；步骤2，95℃，20sec；步骤3，59℃，20sec；步骤4，72℃，15sec；步骤5，返回步骤2共24次；步骤6，72℃，5min；步骤7，4℃，保存。

将上述得到的PCR产物作为模板，利用如下正向引物和反向引物，按照常规方法进行PCR扩增获得GS接头-α3-peptide核苷酸片段：上游引物5′-CCCAAGCTTGGCGGCGGTGGTTCTGGCGGTGGCGGTTCCGGT-3′(核苷酸序列如SEQ ID NO:9所示SEQ ID NO:9所示，带下划线碱基为限制性内切酶Hind III识别位点)，和下游引物5′-CCGCTCGAGTCACGCTTTAGCGAGCGTTTCGAGCGCTTTCGCCAGG-3′(核苷酸序列如SEQ ID NO:12所示，带下划线碱基为限制性内切酶XhoI识别位点)。

配制如下PCR反应液：模板(PCR产物)，2μL；5×fast pfu缓冲液，20μL；dNTPs，8μL；上游引物(20mM)，4μL；下游引物(20mM)，4μL；Fast pfu(全式金公司)，2μL；双重蒸馏水，60μL；总计100μL。

按照如下反应程序扩增GS-α3-peptide基因：步骤1，95℃，5min；步骤2，95℃，20sec；步骤3，59℃，20sec；步骤4，72℃，15sec；步骤5，返回步骤2共29次；步骤6，72℃，5min；步骤7，4℃，保存。

反应结束后，对PCR扩增产物进行1％琼脂糖凝胶电泳检测，结果PCR扩增出与预期相符的正确条带。

1.2构建LipA/GFP与3种肽的融合蛋白表达载体，以及非融合LipA/GFP蛋白表达载体

本发明实施例中所使用的表达载体pET-30a(+)-LipA-α3-peptide/CpA-m/TZ1H和pET-30a(+)-GFP-α3-peptide/CpA-m/TZ1H的构建过程如下：将由步骤1.1得到重叠PCR产物用限制性内切酶Hind III和Xho I进行双酶切后分别与经同样酶双酶切的质粒pET-30a(+)-LipA-ELK16和pET-30a(+)-GFP-ELK16(所述质粒的全长序列可见于SEQ ID NO:23和SEQ ID NO:24)用T4连接酶进行连接，用α3-peptide/CpA-m/TZ1H取代ELK16标签，从而获得融合表达载体。

下面以pET-30a(+)-LipA-α3-peptide和pET-30a(+)-GFP-α3-peptide为例说明具体的构建过程。

构建pET-30a(+)-LipA-α3-peptide载体，该载体结构如图2a所示，其中“Targetprotein”序列为枯草芽孢杆菌脂肪酶A(LipA)的序列(见SEQ ID NO:25)。将步骤1.1得到的重叠PCR产物(Hind III-GS接头-α3-peptide-Xho I)和质粒pET-30a(+)-LipA-ELK16同时用限制性内切酶Hind III和Xho I进行双酶切，之后用T4连接酶连接，然后，将连接产物转化到大肠杆菌BL21(DE3)(Novagen)感受态细胞，将转化细胞涂布于添加有50μg/mL卡那霉素的LB平板上筛选阳性克隆，提取质粒，对其进行测序，测序结果表明所克隆的pET-30a(+)-LipA-α3peptide序列正确。

构建pET-30a(+)-GFP-α3-peptide载体，该载体结构如图2a所示，其中“Targetprotein”序列为绿色荧光蛋白(GFP)的序列(见SEQ ID NO:26)。将实施例1.1得到的重叠PCR产物(Hind III-GS接头-α3-peptide-Xho I)和质粒pET-30a(+)-GFP-ELK16同时用限制性内切酶Hind III和Xho I进行双酶切，之后用T4连接酶连接，然后，将连接产物转化到大肠杆菌BL21(DE3)(Novagen)感受态细胞，将转化细胞涂布于添加有50μg/mL卡那霉素的LB平板上筛选阳性克隆，提取质粒，对其进行测序，测序结果表明所克隆的pET-30a(+)-GFP-α3-peptide序列正确。

此外，本申请实施例中所使用的表达载体pET-30a(+)-LipA-native和pET-30a(+)-GFP-native全长序列分别如SEQ ID NO:27和SEQ ID NO:28所示。本领域技术人员可以容易地制备这些质粒。

实施例2：以枯草芽胞杆菌脂肪酶A(LipA)作为目的蛋白的融合蛋白的表达和酶活测定

2.1融合蛋白的诱导表达

将实施例1中构建好的菌株(含有质粒pET-30a(+)-LipA-native、pET-30a(+)-LipA-α3-peptide、pET-30a(+)-LipA-CpA-m和pET-30a(+)-LipA-TZ1H)接种到含50μg/mL卡那霉素的LB液体培养基中，并在37℃摇床中培养至对数期(OD₆₀₀＝0.4-0.6)，加入0.2mMIPTG，在30℃下诱导6小时，收获细胞，并测量菌浓度OD₆₀₀。

2.2 SDS-PAGE测定

收获步骤2.1所得的细胞，用等体积的缓冲液(50mM Tris-HCl，50mM NaCl，5％甘油，pH7.2)重悬。在冰上通过超声破碎细胞(破碎条件为：功率200W，超声时间3sec，间隔时间3sec，超声次数99次)。超声完成后，通过离心分离缓冲液的上清和沉淀。为了尽可能去除沉淀中混杂的可溶成分，用等体积的缓冲液将得到的沉淀洗涤两遍。上清液和沉淀重悬液直接用于SDS-PAGE测定。

SDS-PAGE的分析结果如图3a所示。LipA-α3-peptide、LipA-CpA-m和LipA-TZ1H这3种融合蛋白均大量地分布在沉淀中，有78-92％的融合蛋白形成了聚集体。而对照组融合蛋白LipA-native则大量以可溶形式表达，可溶蛋白占总蛋白量的比例约为92％。该结果表明，α3-peptide、CpA-m和TZ1H这3个短肽都可以诱导LipA在大肠杆菌中形成聚集体，α3-peptide的聚集效果最好，CpA-m和TZ1H的聚集效果差不多。

2.3酶活检测

收获步骤2.1所得的细胞，用等体积的缓冲液(50mM Tris-HCl，50mM NaCl，5％甘油，pH7.2)重悬。在冰上通过超声破碎细胞(破碎条件为：功率200W，超声时间3sec，间隔时间3sec，超声次数99次)。超声完成后，通过离心小心地分离上清和沉淀。为了尽可能去除沉淀中混杂的可溶成分，用等体积的缓冲液将得到的沉淀洗涤两遍。上清液和沉淀重悬液直接用于相应的酶活测定。其中，脂肪酶活性的定量测定方法如下：

测定LipA对棕榈酸对硝基苯脂(p-nitrophenyl palmitate，pNPP)的活性。对pNPP测量方法详见文献(Winkler,U.K.,M.Stuckmann,Glycogen,Hyaluronate,and Some OtherPolysaccharides Greatly Enhance the Formation of Exolipase by Serratiamarcescens,Journal of Bacteriology,1979,138(3):663-670)。活性定义为：在测定条件下，1分钟内水解上述底物产生1nmol的对硝基苯酚(p-nitrophenol)或是脂肪酸(fattyacid)所需要的酶量定义为1个活性单位。

融合蛋白的酶活数据如图3b所示，LipA-α3-peptide、LipA-CpA-m和LipA-TZ1H融合蛋白沉淀均表现出对pNPP底物的水解活性，3种融合蛋白沉淀的活性占总融合蛋白活性的比例分别为96％、93％和87％。可溶的LipA-native融合蛋白对pNPP也表现出水解活性。以LipA-native的总酶活为100％，LipA-α3-peptide、LipA-CpA-m和LipA-TZ1H这3种沉淀的酶活分别89％、114％和171％。

综合SDS-PAGE和酶活数据(图3a和3b)，本实施例中的3种肽(α3-peptide、CpA-m和TZ1H)都能够诱导LipA在大肠杆菌中形成具有脂肪酶催化活性的融合蛋白聚集体。

实施例3：以绿色荧光蛋白(GFP)作为目的多肽的融合蛋白的表达及其在胞内的分布

3.1融合蛋白的诱导表达

将实施例1中构建好的菌株(含有质粒pET-30a(+)-GFP-α3-peptide、pET-30a(+)-GFP-CpA-m和pET-30a(+)-GFP-TZ1H)接种到含50μg/mL卡那霉素的LB液体培养基中，并在37℃摇床中培养至对数期(OD₆₀₀＝0.4-0.6)，加入0.2mM IPTG，在23℃下诱导22小时，收获细胞，并测量菌浓度OD₆₀₀。

3.2 SDS-PAGE测定

收获步骤3.1所得的细胞，用等体积的缓冲液(50mM Tris-HCl，50mM NaCl，5％甘油，pH7.2)重悬。在冰上通过超声破碎细胞(破碎条件为：功率200W，超声时间3sec，间隔时间3sec，超声次数99次)。超声完成后，通过离心分离缓冲液的上清和沉淀。为了尽可能去除沉淀中混杂的可溶成分，用等体积的缓冲液将得到的沉淀洗涤两遍。上清液和沉淀重悬液直接用于SDS-PAGE测定。

SDS-PAGE的分析结果如图4a所示。GFP-α3-peptide、GFP-CpA-m和GFP-TZ1H这3种融合蛋白均大量地分布在沉淀中，该结果表明，α3-peptide、CpA-m和TZ1H这3个短肽都可以诱导GFP在大肠杆菌中形成聚集体，α3-peptide的聚集效果最好，CpA-m和TZ1H的聚集效果差不多。

3.3融合蛋白的胞内分布

收获步骤3.1所得的细胞，用4％(w/v)的多聚甲醛在4℃处理1h。GFP细胞的荧光共焦显微观测在Zeiss710倒置共聚焦显微镜(Zeiss LSM 710confocal microscope)上完成，激发波长为488nm。

GFP融合蛋白在细胞内的分布情况如图4b、图4c、图4d所示，表达了GFP-α3-peptide、GFP-CpA-m和GFP-TZ1H这3种融合蛋白的大肠杆菌，其荧光分布非常相似，都呈现出明显的局部分布，都聚集在细胞质中，位于细胞的两端，结果说明，GFP-α3-peptide、GFP-CpA-m和GFP-TZ1H这3种融合蛋白都以聚集体的形式表达，而且聚集体中的GFP具有生物活性。

实施例4：构建以枯草芽胞杆菌脂肪酶A(LipA)为目的蛋白的包含切割位点的融合蛋白表达载体

本实施例中选择LipA作为目的蛋白，构建包含Mxe GyrA自切割位点的融合蛋白，通过本发明的方法进行重组生产和纯化。

本申请实施例中所使用的表达载体pET-30a(+)-LipA-Mxe-α3-peptide/CpA-m/TZ1H的构建过程：将由实施例1得到重叠PCR产物用限制性内切酶Hind III和Xho I进行双酶切后与经同样酶双酶切的质粒pET-30a(+)-LipA-Mxe-ELK16(全长序列如SEQ ID NO:29所示)进行连接，从而获得所需融合表达载体(载体结构见图2b)。将连接产物转化到大肠杆菌BL21(DE3)(Novagen)感受态细胞，将转化细胞涂布于添加有50μg/mL卡那霉素的LB平板上筛选阳性克隆，提取质粒，对其进行测序，测序结果表明所克隆的pET-30a(+)-LipA-Mxe-α3-peptide/CpA-m/TZ1H序列正确。

实施例5：融合蛋白LipA-Mxe-α3-peptide/CpA-m/TZ1H的表达和纯化

将实施例4中构建好的菌株(含有质粒pET-30a(+)-LipA-Mxe-α3-peptide、pET-30a(+)-LipA-Mxe-CpAm、pET-30a(+)-LipA-Mxe-TZ1H)接种到含50μg/mL卡那霉素的LB液体培养基中，并在37℃摇床中培养至对数期(OD₆₀₀＝0.4-0.6)，加入0.2mM IPTG，在30℃下诱导6小时，收获细胞，并测量菌浓度OD₆₀₀。

将菌体用裂解缓冲液B1(2.4g的Tris、29.22g的NaCl、0.37g的Na₂EDTA·2H₂O溶解于800mL水中，调pH至8.5，加水定容至1L)重悬至10OD/mL，超声破碎。在4℃，10000rpm的条件下离心10min，分别收集上清和沉淀部分。将沉淀用裂解缓冲液洗涤2次后，使用切割缓冲液(20mM Tris-HCl pH8.0，500mM NaCl，40mM二硫苏糖醇，1mM EDTA)重悬充分，置于4℃过夜24h，使得内含肽充分进行自切割。之后将悬浊液离心分离，得到的上清和沉淀与切割前的沉淀一起进行SDS-PAGE检测(沉淀部分用与上一重悬步骤相同的体积的裂解缓冲液重悬)。结果如图5所示。分别为泳道1：细胞裂解物沉淀，可检测到清晰的三元融合蛋白表达成的酶聚集体；泳道2：切割后分离的沉淀；泳道3：切割后分离的上清，可检测到清晰的目的蛋白条带；泳道a-e：含有牛血清蛋白BSA的蛋白定量标准品，上样量依次为8μg、4μg、2μg、1μg、0.5μg。

依照蛋白定量标准品，应用Bio-Rad公司的Quantity ONE凝胶定量分析软件对目的条带进行光密度分析，可计算得出融合蛋白形成的聚集体产量、在内含肽介导的自切割之后释放到上清中的目的蛋白产量、Mxe GyrA切割效率、以及目的多肽在上清中的纯度，结果如表2所示。

表2

^a蛋白聚集体产量

^b内含肽介导的自切割后的目的多肽产量(以菌浓度OD₆₀₀为2时，每升LB培养基中的大肠杆菌细胞产生2.66mg细胞湿重计算)；

^c内含肽介导的自切割效率＝100％×(切割前聚集体表达量-切割后聚集体剩余量)/切割前聚集体产量。

3种三联体融合蛋白(LipA-Mxe-α3-peptide、LipA-Mxe-CpA-m、LipA-Mxe-TZ1H)均以沉淀形式存在，说明三种自组装短肽α3-peptide、CpA-m、TZ1H均可诱导LipA和Mxe GyrA的融合蛋白在大肠杆菌中形成聚集体，聚集体表达量分别为61.3μg/mg，84.2μg/mg和87.6μg/mg，3种不可溶的三联体融合蛋白经内含肽Mxe GyrA自切割，LipA同Mxe-α3-peptide/CpA-m/TZ1H分离，切割效率产量是38.7～61.3％，切割后释放到上清中的LipA的产量有所不同，产量是5.1～25.8μg/mg，切割后的上清中除了LipA，还有Mxe-α3-peptide/CpA-m/TZ1H和未切割完全的三联体融合蛋白，LipA的纯度为46～90.8％，其中，LipA-Mxe-α3-peptide融合蛋白切割后得到的LipA的纯度最高。

序列表

<110> 华南理工大学

<120> α螺旋自组装短肽及其在蛋白质纯化中的应用

<150> 2018115182674

<151> 2018-12-12

<160> 29

<170> SIPOSequenceListing 1.0

<210> 1

<211> 21

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 1

Leu Glu Thr Leu Ala Lys Ala Leu Glu Thr Leu Ala Lys Ala Leu Glu

1 5 10 15

Thr Leu Ala Lys Ala

20

<210> 2

<211> 30

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 2

Met Lys Gln Leu Glu Asp Lys Ile Glu Glu Leu Leu Ser Lys Ala Ala

1 5 10 15

Met Lys Gln Leu Glu Asp Lys Ile Glu Glu Leu Leu Ser Lys

20 25 30

<210> 3

<211> 41

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 3

Glu Ile Ala Gln His Glu Lys Glu Ile Gln Ala Ile Glu Lys Lys Ile

1 5 10 15

Ala Gln His Glu Tyr Lys Ile Gln Ala Ile Glu Glu Lys Ile Ala Gln

20 25 30

His Lys Glu Lys Ile Gln Ala Ile Lys

35 40

<210> 4

<211> 63

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

ctggaaaccc tcgcgaaggc tctggagacc ctggcgaaag cgctcgaaac gctcgctaaa 60

gcg 63

<210> 5

<211> 90

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

atgaagcagc tggaagacaa aattgaggaa ctcctgtcta aagcggcgat gaaacaactg 60

gaggacaaga tcgaagagct gctctctaaa 90

<210> 6

<211> 123

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

gaaatcgcac aacacgagaa agagatccaa gccatcgaaa agaaaattgc tcagcacgaa 60

tacaaaattc aagcgattga agaaaaaatc gcgcagcaca aagagaaaat ccaggcgatc 120

aaa 123

<210> 7

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 7

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

<210> 8

<211> 198

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 8

Cys Ile Thr Gly Asp Ala Leu Val Ala Leu Pro Glu Gly Glu Ser Val

1 5 10 15

Arg Ile Ala Asp Ile Val Pro Gly Ala Arg Pro Asn Ser Asp Asn Ala

20 25 30

Ile Asp Leu Lys Val Leu Asp Arg His Gly Asn Pro Val Leu Ala Asp

35 40 45

Arg Leu Phe His Ser Gly Glu His Pro Val Tyr Thr Val Arg Thr Val

50 55 60

Glu Gly Leu Arg Val Thr Gly Thr Ala Asn His Pro Leu Leu Cys Leu

65 70 75 80

Val Asp Val Ala Gly Val Pro Thr Leu Leu Trp Lys Leu Ile Asp Glu

85 90 95

Ile Lys Pro Gly Asp Tyr Ala Val Ile Gln Arg Ser Ala Phe Ser Val

100 105 110

Asp Cys Ala Gly Phe Ala Arg Gly Lys Pro Glu Phe Ala Pro Thr Thr

115 120 125

Tyr Thr Val Gly Val Pro Gly Leu Val Arg Phe Leu Glu Ala His His

130 135 140

Arg Asp Pro Asp Ala Gln Ala Ile Ala Asp Glu Leu Thr Asp Gly Arg

145 150 155 160

Phe Tyr Tyr Ala Lys Val Ala Ser Val Thr Asp Ala Gly Val Gln Pro

165 170 175

Val Tyr Ser Leu Arg Val Asp Thr Ala Asp His Ala Phe Ile Thr Asn

180 185 190

Gly Phe Val Ser His Ala

195

<210> 9

<211> 42

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

cccaagcttg gcggcggtgg ttctggcggt ggcggttccg gt 42

<210> 10

<211> 45

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

cttcgcgagg gtttccaggc taccgccgcc accggaaccg ccacc 45

<210> 11

<211> 45

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

ctggaaaccc tcgcgaaggc tctggagacc ctggcgaaag cgctc 45

<210> 12

<211> 46

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

ccgctcgagt cacgctttag cgagcgtttc gagcgctttc gccagg 46

<210> 13

<211> 54

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

cccaagcttg gcggcggtgg ttctggcggt ggcggttccg gtggcggcgg tagc 54

<210> 14

<211> 54

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

agacaggagt tcctcaattt tgtcttccag ctgcttcatg ctaccgccgc cacc 54

<210> 15

<211> 54

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

acaaaattga ggaactcctg tctaaagcgg cgatgaaaca actggaggac aaga 54

<210> 16

<211> 53

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

ccgctcgagt catttagaga gcagctcttc gatcttgtcc tccagttgtt tca 53

<210> 17

<211> 50

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

cccaagcttg gcggcggtgg ttctggcggt ggcggttccg gtggcggcgg 50

<210> 18

<211> 51

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

tggcttggat ctctttctcg tgttgtgcga tttcgctacc gccgccaccg g 51

<210> 19

<211> 51

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

cgagaaagag atccaagcca tcgaaaagaa aattgctcag cacgaataca a 51

<210> 20

<211> 51

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

gcgcgatttt ttcttcaatc gcttgaattt tgtattcgtg ctgagcaatt t 51

<210> 21

<211> 51

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

cgattgaaga aaaaatcgcg cagcacaaag agaaaatcca ggcgatcaaa t 51

<210> 22

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

ccgctcgagt catttgatcg cctggatttt ctc 33

<210> 23

<211> 5922

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60

cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120

ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180

gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240

acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300

ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360

ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420

acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480

tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540

tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600

tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660

actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720

gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780

aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840

agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900

cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960

aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020

tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080

tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140

taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200

ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260

tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320

tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380

cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440

cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500

gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560

gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620

agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680

aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740

agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800

cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860

accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920

aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980

ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040

cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100

gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160

tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220

agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280

tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340

caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400

ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460

gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520

gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580

gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640

aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700

ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760

acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820

ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880

tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940

tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000

cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060

gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120

ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180

catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240

ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300

gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360

gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420

ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480

atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540

cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600

tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660

ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720

aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780

atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840

cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900

gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960

tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020

agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080

gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140

ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200

catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260

tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320

tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380

gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440

ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500

tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560

catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620

cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680

tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740

ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800

ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860

cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920

gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980

gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040

ataattttgt ttaactttaa gaaggagata tacatatgca ccatcaccat caccacccca 5100

cccctatggc tgaacacaat ccagtcgtta tggttcacgg tattggaggg gcatcattca 5160

attttgcggg aattaagagc tatctcgtat ctcagggctg gtcgcgggac aagctgtatg 5220

cagttgattt ttgggacaag acaggcacaa attataacaa tggaccggta ttatcacgat 5280

ttgtgcaaaa ggttttagat gaaacgggtg cgaaaaaagt ggatattgtc gctcacagca 5340

tggggggcgc gaacacactt tactacataa aaaatctgga cggcggaaat aaagttgcaa 5400

acgtcgtgac gcttggcggc gcgaaccgtt tgacgacagg caaggcgctt ccgggaacag 5460

atccaaatca aaagatttta tacacatcca tttacagcag tgccgatatg attgtcatga 5520

attacttatc aagattagat ggtgctagaa acgttcaaat ccatggcgtt ggacacatcg 5580

gccttctgta cagcagccaa gtcaacagcc tgattaaaga agggctgaac ggcgggggcc 5640

agaatacgaa taagcttccg accccaccga ccacgccaac gccaccaacc accccaaccc 5700

cgacgccgct ggaacttgaa ctgaagttaa aactggaatt agaattaaag ctgaaatgac 5760

tcgagcacca ccaccaccac cactgagatc cggctgctaa caaagcccga aaggaagctg 5820

agttggctgc tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg 5880

tcttgagggg ttttttgctg aaaggaggaa ctatatccgg at 5922

<210> 24

<211> 6093

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60

cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120

ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180

gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240

acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300

ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360

ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420

acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480

tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540

tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600

tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660

actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720

gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780

aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840

agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900

cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960

aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020

tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080

tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140

taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200

ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260

tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320

tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380

cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440

cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500

gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560

gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620

agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680

aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740

agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800

cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860

accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920

aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980

ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040

cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100

gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160

tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220

agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280

tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340

caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400

ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460

gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520

gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580

gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640

aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700

ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760

acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820

ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880

tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940

tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000

cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060

gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120

ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180

catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240

ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300

gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360

gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420

ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480

atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540

cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600

tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660

ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720

aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780

atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840

cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900

gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960

tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020

agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080

gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140

ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200

catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260

tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320

tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380

gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440

ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500

tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560

catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620

cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680

tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740

ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800

ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860

cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920

gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980

gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040

ataattttgt ttaactttaa gaaggagata tacatatgag taaaggagaa gaacttttca 5100

ctggagttgt cccaattctt gttgaattag atggtgatgt taatgggcac aaattttctg 5160

tcagtggaga gggtgaaggt gatgcaacat acggaaaact tacccttaaa tttatttgca 5220

ctactggaaa actacctgtt ccatggccaa cacttgtcac tactttcact tatggtgttc 5280

aatgcttttc aagataccca gatcacatga aacggcatga ctttttcaag agtgccatgc 5340

ccgaaggtta tgtacaggaa agaactatat ttttcaaaga tgacgggaac tacaagacac 5400

gtgctgaagt caagtttgaa ggtgataccc ttgttaatag aatcgagtta aaaggtattg 5460

attttaaaga agatggaaac attcttggac acaaattgga atacaactat aacccacaca 5520

atgtatacat catggcagac aaacaaaaga atggaatcaa agttaacttc aaaattagac 5580

acaacattga agatggaagc gctcaactag cagaccatta tcaacaaaat actccaattg 5640

gcgatggccc tgtcctttta ccagacaacc attacctgtc cacacaatct gccctttcga 5700

aagatcccaa cgaaaggaga gaccacatgg tccttcttga gtttgtaaca gctgctggga 5760

ttacacatgg catggatgaa ctatacaaag gtaccccggg tcgacctgca gccaagctga 5820

ataagcttcc gaccccaccg accacgccaa cgccaccaac caccccaacc ccgacgccgc 5880

tggaacttga actgaagtta aaactggaat tagaattaaa gctgaaatga ctcgagcacc 5940

accaccacca ccactgagat ccggctgcta acaaagcccg aaaggaagct gagttggctg 6000

ctgccaccgc tgagcaataa ctagcataac cccttggggc ctctaaacgg gtcttgaggg 6060

gttttttgct gaaaggagga actatatccg gat 6093

<210> 25

<211> 546

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

atggctgaac acaatccagt cgttatggtt cacggtattg gaggggcatc attcaatttt 60

gcgggaatta agagctatct cgtatctcag ggctggtcgc gggacaagct gtatgcagtt 120

gatttttggg acaagacagg cacaaattat aacaatggac cggtattatc acgatttgtg 180

caaaaggttt tagatgaaac gggtgcgaaa aaagtggata ttgtcgctca cagcatgggg 240

ggcgcgaaca cactttacta cataaaaaat ctggacggcg gaaataaagt tgcaaacgtc 300

gtgacgcttg gcggcgcgaa ccgtttgacg acaggcaagg cgcttccggg aacagatcca 360

aatcaaaaga ttttatacac atccatttac agcagtgccg atatgattgt catgaattac 420

ttatcaagat tagatggtgc tagaaacgtt caaatccatg gcgttggaca catcggcctt 480

ctgtacagca gccaagtcaa cagcctgatt aaagaagggc tgaacggcgg gggccagaat 540

acgaat 546

<210> 26

<211> 744

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

agtaaaggag aagaactttt cactggagtt gtcccaattc ttgttgaatt agatggtgat 60

gttaatgggc acaaattttc tgtcagtgga gagggtgaag gtgatgcaac atacggaaaa 120

cttaccctta aatttatttg cactactgga aaactacctg ttccatggcc aacacttgtc 180

actactttca cttatggtgt tcaatgcttt tcaagatacc cagatcacat gaaacggcat 240

gactttttca agagtgccat gcccgaaggt tatgtacagg aaagaactat atttttcaaa 300

gatgacggga actacaagac acgtgctgaa gtcaagtttg aaggtgatac ccttgttaat 360

agaatcgagt taaaaggtat tgattttaaa gaagatggaa acattcttgg acacaaattg 420

gaatacaact ataacccaca caatgtatac atcatggcag acaaacaaaa gaatggaatc 480

aaagttaact tcaaaattag acacaacatt gaagatggaa gcgctcaact agcagaccat 540

tatcaacaaa atactccaat tggcgatggc cctgtccttt taccagacaa ccattacctg 600

tccacacaat ctgccctttc gaaagatccc aacgaaagga gagaccacat ggtccttctt 660

gagtttgtaa cagctgctgg gattacacat ggcatggatg aactatacaa aggtaccccg 720

ggtcgacctg cagccaagct gaat 744

<210> 27

<211> 5817

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60

cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120

ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180

gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240

acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300

ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360

ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420

acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480

tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540

tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600

tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660

actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720

gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780

aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840

agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900

cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960

aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020

tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080

tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140

taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200

ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260

tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320

tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380

cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440

cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500

gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560

gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620

agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680

aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740

agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800

cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860

accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920

aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980

ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040

cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100

gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160

tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220

agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280

tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340

caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400

ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460

gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520

gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580

gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640

aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700

ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760

acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820

ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880

tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940

tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000

cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060

gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120

ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180

catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240

ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300

gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360

gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420

ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480

atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540

cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600

tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660

ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720

aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780

atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840

cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900

gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960

tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020

agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080

gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140

ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200

catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260

tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320

tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380

gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440

ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500

tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560

catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620

cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680

tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740

ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800

ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860

cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920

gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980

gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040

ataattttgt ttaactttaa gaaggagata tacatatgca ccatcaccat caccacccca 5100

cccctatggc tgaacacaat ccagtcgtta tggttcacgg tattggaggg gcatcattca 5160

attttgcggg aattaagagc tatctcgtat ctcagggctg gtcgcgggac aagctgtatg 5220

cagttgattt ttgggacaag acaggcacaa attataacaa tggaccggta ttatcacgat 5280

ttgtgcaaaa ggttttagat gaaacgggtg cgaaaaaagt ggatattgtc gctcacagca 5340

tggggggcgc gaacacactt tactacataa aaaatctgga cggcggaaat aaagttgcaa 5400

acgtcgtgac gcttggcggc gcgaaccgtt tgacgacagg caaggcgctt ccgggaacag 5460

atccaaatca aaagatttta tacacatcca tttacagcag tgccgatatg attgtcatga 5520

attacttatc aagattagat ggtgctagaa acgttcaaat ccatggcgtt ggacacatcg 5580

gccttctgta cagcagccaa gtcaacagcc tgattaaaga agggctgaac ggcgggggcc 5640

agaatacgaa ttgactcgag caccaccacc accaccactg agatccggct gctaacaaag 5700

cccgaaagga agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg 5760

gggcctctaa acgggtcttg aggggttttt tgctgaaagg aggaactata tccggat 5817

<210> 28

<211> 5988

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60

cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120

ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180

gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240

acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300

ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360

ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420

acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480

tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540

tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600

tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660

actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720

gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780

aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840

agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900

cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960

aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020

tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080

tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140

taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200

ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260

tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320

tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380

cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440

cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500

gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560

gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620

agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680

aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740

agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800

cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860

accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920

aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980

ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040

cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100

gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160

tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220

agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280

tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340

caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400

ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460

gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520

gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580

gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640

aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700

ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760

acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820

ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880

tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940

tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000

cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060

gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120

ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180

catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240

ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300

gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360

gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420

ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480

atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540

cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600

tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660

ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720

aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780

atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840

cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900

gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960

tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020

agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080

gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140

ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200

catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260

tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320

tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380

gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440

ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500

tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560

catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620

cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680

tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740

ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800

ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860

cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920

gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980

gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040

ataattttgt ttaactttaa gaaggagata tacatatgag taaaggagaa gaacttttca 5100

ctggagttgt cccaattctt gttgaattag atggtgatgt taatgggcac aaattttctg 5160

tcagtggaga gggtgaaggt gatgcaacat acggaaaact tacccttaaa tttatttgca 5220

ctactggaaa actacctgtt ccatggccaa cacttgtcac tactttcact tatggtgttc 5280

aatgcttttc aagataccca gatcacatga aacggcatga ctttttcaag agtgccatgc 5340

ccgaaggtta tgtacaggaa agaactatat ttttcaaaga tgacgggaac tacaagacac 5400

gtgctgaagt caagtttgaa ggtgataccc ttgttaatag aatcgagtta aaaggtattg 5460

attttaaaga agatggaaac attcttggac acaaattgga atacaactat aacccacaca 5520

atgtatacat catggcagac aaacaaaaga atggaatcaa agttaacttc aaaattagac 5580

acaacattga agatggaagc gctcaactag cagaccatta tcaacaaaat actccaattg 5640

gcgatggccc tgtcctttta ccagacaacc attacctgtc cacacaatct gccctttcga 5700

aagatcccaa cgaaaggaga gaccacatgg tccttcttga gtttgtaaca gctgctggga 5760

ttacacatgg catggatgaa ctatacaaag gtaccccggg tcgacctgca gccaagctga 5820

attgactcga gcaccaccac caccaccact gagatccggc tgctaacaaa gcccgaaagg 5880

aagctgagtt ggctgctgcc accgctgagc aataactagc ataacccctt ggggcctcta 5940

aacgggtctt gaggggtttt ttgctgaaag gaggaactat atccggat 5988

<210> 29

<211> 6507

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60

cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120

ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180

gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240

acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300

ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360

ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420

acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480

tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540

tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600

tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660

actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720

gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780

aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840

agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900

cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960

aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020

tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080

tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140

taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200

ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260

tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320

tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380

cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440

cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500

gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560

gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620

agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680

aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740

agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800

cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860

accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920

aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980

ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040

cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100

gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160

tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220

agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280

tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340

caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400

ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460

gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520

gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580

gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640

aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700

ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760

acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820

ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880

tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940

tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000

cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060

gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120

ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180

catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240

ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300

gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360

gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420

ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480

atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540

cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600

tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660

ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720

aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780

atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840

cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900

gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960

tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020

agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080

gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140

ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200

catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260

tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320

tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380

gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440

ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500

tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560

catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620

cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680

tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740

ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800

ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860

cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920

gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980

gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040

ataattttgt ttaactttaa gaaggagata tacatatgcc cacccctatg gctgaacaca 5100

atccagtcgt tatggttcac ggtattggag gggcatcatt caattttgcg ggaattaaga 5160

gctatctcgt atctcagggc tggtcgcggg acaagctgta tgcagttgat ttttgggaca 5220

agacaggcac aaattataac aatggaccgg tattatcacg atttgtgcaa aaggttttag 5280

atgaaacggg tgcgaaaaaa gtggatattg tcgctcacag catggggggc gcgaacacac 5340

tttactacat aaaaaatctg gacggcggaa ataaagttgc aaacgtcgtg acgcttggcg 5400

gcgcgaaccg tttgacgaca ggcaaggcgc ttccgggaac agatccaaat caaaagattt 5460

tatacacatc catttacagc agtgccgata tgattgtcat gaattactta tcaagattag 5520

atggtgctag aaacgttcaa atccatggcg ttggacacat cggccttctg tacagcagcc 5580

aagtcaacag cctgattaaa gaagggctga acggcggggg ccagaatacg aatatgcgaa 5640

tgtgcatcac gggagatgca ctagttgccc tacccgaggg cgagtcggta cgcatcgccg 5700

acatcgtgcc gggtgcgcgg cccaacagtg acaacgccat cgacctgaaa gtccttgacc 5760

ggcatggcaa tcccgtgctc gccgaccggc tgttccactc cggcgagcat ccggtgtaca 5820

cggtgcgtac ggtcgaaggt ctgcgtgtga cgggcaccgc gaaccacccg ttgttgtgtt 5880

tggtcgacgt cgccggggtg ccgaccctgc tgtggaagct gatcgacgaa atcaagccgg 5940

gcgattacgc ggtgattcaa cgcagcgcat tcagcgtcga ctgtgcaggt tttgcccgcg 6000

ggaaacccga atttgcgccc acaacctaca cagtcggcgt ccctggactg gtgcgtttct 6060

tggaagcaca ccaccgagac ccggacgccc aagctatcgc cgacgagctg accgacgggc 6120

ggttctacta cgcgaaagtc gccagtgtca ccgacgccgg cgtgcagccg gtgtatagcc 6180

ttcgtgtcga cacggcagac cacgcgttta tcacgaacgg gttcgtcagc cacgctaagc 6240

ttccgacccc accgaccacg ccaacgccac caaccacccc aaccccgacg ccgctggaac 6300

ttgaactgaa gttaaaactg gaattagaat taaagctgaa atgactcgag caccaccacc 6360

accaccactg agatccggct gctaacaaag cccgaaagga agctgagttg gctgctgcca 6420

ccgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg aggggttttt 6480

tgctgaaagg aggaactata tccggat 6507

Claims

1.α螺旋自组装短肽，其特征在于，氨基酸序列如SEQ ID NO:2所示，所述α螺旋自组装短肽形成卷曲螺旋结构。

2.权利要求1所述的α螺旋自组装短肽在蛋白质生产和纯化中的应用，其特征在于，包括以下步骤：

（1）将重组表达构建体导入宿主细胞中；所述重组表达构建体包括编码融合蛋白的多核苷酸序列与表达控制序列；所述融合蛋白是所述α螺旋自组装短肽和目的蛋白通过接头连接得到；

（2）培养步骤（1）所得宿主细胞，表达所述融合蛋白；

（3）裂解步骤（2）所得宿主细胞，离心去除上清，收集不可溶部分。

3.根据权利要求2所述的应用，其特征在于，步骤（1）所述接头为GS型接头。

4.根据权利要求3所述的应用，其特征在于，所述接头的氨基酸序列如SEQ ID NO:7所示。

5.根据权利要求3所述的应用，其特征在于，所述接头包含切割位点。

6.根据权利要求5所述的应用，其特征在于，所述切割位点选自化学切割位点、酶法切割位点和自切割位点。

7.根据权利要求6所述的应用，其特征在于，所述切割位点为自切割位点，其中的自切割位点为内含肽。

8.根据权利要求7所述的应用，其特征在于，所述内含肽为Mxe GyrA内含肽，氨基酸序列如SEQ ID NO:8所示。

9.根据权利要求7或8所述的应用，其特征在于，所述融合蛋白中目的蛋白和α螺旋自组装短肽之间的接头含有自切割位点，在蛋白质纯化中的应用还包括以下步骤：

（a）对从步骤（3）收集的不可溶部分的切割位点进行切割，使目的蛋白释放到上清中；

（b）去除步骤（a）中的不可溶部分，回收含有目的蛋白的可溶部分。

10.根据权利要求2所述的应用，其特征在于，步骤（3）所述裂解的方式为超声、匀浆、高压、低渗、使用去垢剂、使用裂解酶、使用有机溶剂中的一种以上。