CN112359059B - 用于表达rFC蛋白的84E突变载体及其制备方法和应用 - Google Patents

用于表达rFC蛋白的84E突变载体及其制备方法和应用 Download PDF

Info

Publication number
CN112359059B
CN112359059B CN202011243857.8A CN202011243857A CN112359059B CN 112359059 B CN112359059 B CN 112359059B CN 202011243857 A CN202011243857 A CN 202011243857A CN 112359059 B CN112359059 B CN 112359059B
Authority
CN
China
Prior art keywords
protein
rfc
vector
ser
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011243857.8A
Other languages
English (en)
Other versions
CN112359059A (zh
Inventor
王红
王玉军
黄精彩
秦虹琳
兰宇
黄晓婵
钟希发
李依敏
郑茹瑕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beibu Gulf University
Original Assignee
Beibu Gulf University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beibu Gulf University filed Critical Beibu Gulf University
Priority to CN202011243857.8A priority Critical patent/CN112359059B/zh
Publication of CN112359059A publication Critical patent/CN112359059A/zh
Application granted granted Critical
Publication of CN112359059B publication Critical patent/CN112359059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及转基因技术领域,特别涉及表达rFC蛋白的84E突变载体及其制备方法和应用;该载体通过对sNT序列进行突变,具体突变方法为:把sNT序列的保守区84位酸性氨基酸K突变为碱性氨基酸E(记作sNTK84E突变体)使得sNT对pH不敏感,有效阻止了sNT单体在低pH下形成二聚体,解决了在pSG表达系统中,外源蛋白在丝腺腔内发生纤维化导致的不溶性问题;提高外源蛋白rFC在pSG生物反应器中的可溶性表达能力和蛋白活性,是一种简单、高效的生产rFC蛋白方法,提高了对濒危野生动物的保护。

Description

用于表达rFC蛋白的84E突变载体及其制备方法和应用
【技术领域】
本发明涉及转基因技术领域,特别涉及用于表达rFC蛋白的84E突变载体及其制备方法和应用。
【背景技术】
鲎(Limulidae)别名:马蹄蟹、夫妻鱼,是一种肢口纲剑尾目海生节肢动物,最早出现在古生代泥盆纪,有“活化石”之称,具有极高的生态与经济价值。目前,鲎的最大威胁来自于人类的无节制捕捞、采血提取鲎C因子(rFC)蛋白,为此,为了降低采血对鲎带来的毁灭性伤害,采用基因工程的方法合成鲎C因子(rFC)蛋白也是目前研究的重要领域,而在鲎C因子(rFC)蛋白的表达过程中,缺少理想的表达宿主、成本高等问题严格限制了其生产应用。为此,本领域技术人员一直致力于如何利用基因工程的方法生产rFC蛋白,对表达宿主也进行了多方研究,宿主研究过程中发现:利用大肠杆菌和酵母菌作为宿主,表达rFC蛋白都不能取得良好的效果,蛋白活性均很低;采用家蚕杆状病毒在家蚕幼虫血液中表达rFC因子,灵敏度能达到0.2EU/mL,但是也存在纯化困难的问题;而家蚕(Bombyx mori)丝腺是已知外分泌蛋白质能力最强的动物器官,由于其出色的蛋白合成能力、蚕丝蛋白成分相对简单以及家蚕幼虫易于室内饲养和基因工程操作等优势而受到广泛应用。申请人自2016年以来,一直致力于pSG系统表达rFC的研究,在研究过程中发现:虽然在应用蚕丝腺载体中采取特殊家蚕品种及超强启动子等措施,rFC蛋白在家蚕后部丝腺中的表达量已达170ug/mg,活性为0.3EU/mL超出普通鲎试剂的检测水平,加之rFC基因在转基因家蚕中稳定遗传,使得其生产成本远远低于目前的昆虫细胞表达系统。但是,在pSG系统中,sNT的增溶作用受pH影响较大,rFC易与丝蛋白形成不溶性复合体,难以获得可溶性表达产物。因而提高rFC在pSG中的可溶性表达,是目前pSG表达rFC需要解决的技术问题。
【发明内容】
鉴于上述内容,有必要提供一种能高效表达rFC蛋白的载体,并为该载体选择合适的宿主,提高rFC蛋白的表达量和活力,使得基因工程法生产rFC蛋白能够达到产业化应用,降低对鲎的伤害。
为达到上述目的,本发明所采用的技术方案是:
用于表达rFC蛋白的载体,所述载体是在piggyBac载体骨架上插入DsRed表达单元与CFib-H表达单元构建得到的,所述CFib-H表达单元由PFib-H家蚕重链基因启动子、突变型增溶标签sNTK84E、his蛋白标签和rFC的表达基因组成;所述CFib-H表达单元的连接方式为PFib-H-sNTK84E-his-rFC;所述DsRed表达单元为由3xP3启动子引导的红色荧光DsRed基因组成。
进一步的,所述改良增溶标签sNTK84E的蛋白序列如序列表SEQ:NO:1所示。
进一步的,所述载体的核酸序列如序列表SEQ:NO:3所示。
本发明还包括包含所述载体的宿主细胞。
进一步的,所述宿主细胞为蚕丝腺。
本发明还包括一种应用所述用于表达rFC蛋白的载体和/或宿主细胞分泌rFC蛋白的方法,所述方法包括如下步骤:
(1)构建所述用于表达rFC蛋白的载体;
(2)采用显微注射的方法将步骤(1)的载体注射到蚕卵的胚子发育区;
(3)将步骤(2)的蚕卵孵化饲养成虫后,筛选红眼表型纯一的蛾进行连续3代的饲养,选出不产生性状分离的第3代蚕进行饲喂,育成红眼基因纯合、rFC蛋白纯合且丝腺细胞能够分泌rFC蛋白的转基因蚕;
(4)rFC蛋白在蚕丝素蛋白重链信号肽的作用下分泌到蚕的丝腺腔,并分泌到蚕茧。
进一步的,所述步骤(2)蚕卵的注射时间为蚕卵产下后的4-8h。
进一步的,所述步骤(2)蚕卵的注射时应将针孔从蚕卵的“D”型区凸面推入。
本发明还包括一种制备载体的方法,所述方法为:
(1)下载蜘蛛蛋白的sNT序列,将序列进行氨基酸序列突变,最终得到并合成的突变氨基酸序列如序列表SEQ:NO:1所示;
(2)提取鲎的血液,通过RT-PCR的方法扩增rFC蛋白基因,并对该蛋白进行进行密码子改造,改造后编码的氨基酸序列如序列表SEQ:NO:2所示;
(3)将SEQ:NO:1、SEQ:NO:2、his蛋白标签和荧光表达基因连接在piggyBac载体骨架上即得所述载体,最终得到的载体核苷酸序列如序列表SEQ:NO:3所示。
本发明具有如下有益效果:
1、在对pSG表达系统的研究过程中,申请人发现,外源蛋白在丝腺腔内发生纤维化,最终导致sNT的增溶作用受pH影响较大,在中性或弱碱性条件下sNT为单体状态,单体状态的sNT可介导蛋白质形成可溶性的胶束结构;而在酸性条件下(pH<6.5)sNT则形成反向二聚体,这时胶束结构遭到破坏,内部疏水性蛋白质向外部暴露并折叠为不溶性多聚体;因此,申请人对sNT序列进行了一系列突变,最终发现:把sNT序列的保守区84位酸性氨基酸K突变为碱性氨基酸E(记作sNTK84E突变体)时,sNTK84E突变体的构象变化导致sNT对pH不敏感,有效解决了sNT在酸性条件下容易形成二聚体的技术缺陷;提高了由其所介导的rFC等外源蛋白在pSG生物反应器中的可溶性表达能力和蛋白活性,是一种简单、高效、低成本的生产rFC蛋白方法,经实验,使用该载体生产rFC其表达量可达630ug/mg。
【附图说明】
图1是本发明实施例1中野生型载体(sNT+rFC)的构建示意图;
图2是本发明实施例1中84E突变载体(sNTK84E+rFC)的构建示意图;
图3是本发明实施例2中蚕卵的显微注射示意图;
图4是本发明实施例中鲎C蛋白的Western Blot蛋白印迹表达图;图中WT为野生型Mut为突变型;
图5是本发明84E突变载体和野生型载体rFC在蚕丝腺中的荧光表达量图。
【具体实施方式】
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
实施例1:
本实施例为鲎C蛋白基因(rFC)的载体构建:
(1)在GeneBank上调取纤维性能较好的斑络新妇蜘蛛(Nephila pilipes)蛋白的N末端序列,并将其作为野生型sNT;对野生型sNT的第84位氨基酸序列进行突变,突变方法为:将野生型sNT序列中保守位置的第84位由氨基酸K变为酸性氨基酸84E得到sNTK84E序列,突变后的氨基酸序列如序列表SEQ:NO:1所示:
(2)提取中华鲎血液,克隆鲎C蛋白基因(rFC)并测序,得到鲎C蛋白基因(rFC),其序列如序列表SEQ:NO:2所示:
根据上述步骤构建两个载体其连接顺序如图1和图2所示:
其中,图1为野生型载体(sNT+rFC)的构建示意图:图中,piggyBac表达载体的转座子上连接有DsRed表达单元与CFib-H表达单元;其中,DsRed表达单元部分有一个完整的红色标记荧光蛋白(DsRed)的表达单元,它由3xP3启动子引导;3xP3启动子可在昆虫的眼部视神经中启动其后所连接的DsRed基因的表达。CFib-H表达单元由PFib-H家蚕重链基因启动子、野生型增溶标签sNT、his蛋白标签和鲎C因子表达基因(rFC)组成;由于DsRed表达单元与CFib-H表达单元相连接,因此可以通过观察转基因家蚕的眼睛荧光的有无对转基因家蚕进行初选。
其中,图2为84E突变载体(sNTK84E+rFC)的构建示意图:图中,piggyBac表达载体的转座子上连接有DsRed表达单元与CFib-H表达单元;其中,DsRed表达单元部分有一个完整的红色标记荧光蛋白(DsRed)的表达单元,它由3xP3启动子引导;3xP3启动子可在昆虫的眼部视神经中启动其后所连接的DsRed基因的表达。CFib-H表达单元由PFib-H家蚕重链基因启动子、突变型增溶标签sNTK84E、his蛋白标签和鲎C因子表达基因(rFC)组成;由于DsRed表达单元与CFib-H表达单元相连接,因此可以通过观察转基因家蚕的眼睛荧光的有无对转基因家蚕进行初选。上述载体的核苷酸序列如序列表SEQ:NO:3。
实施例2:
本实施例为将实施例1的载体转入蚕丝腺中的方法:
(1)采用显微注射的方法将实施例1的两个载体均注射到蚕卵的胚子发育区;
(2)将步骤(1)的蚕卵孵化饲养成虫后,筛选红眼表型纯一的蛾进行连续3代的饲养,选出不产生性状分离的第3代蚕进行饲喂,育成红眼基因纯合、rFC蛋白纯合且丝腺细胞能够分泌rFC蛋白的转基因蚕;
(3)rFC蛋白在蚕丝素蛋白重链信号肽的作用下分泌到蚕的丝腺腔,并分泌到蚕茧。
为了提高孵化率,注射时需要需注意以下几点:①在蚕卵注射的合适时间范围内(蚕卵产下后4-8小时,这段时间是蚕卵受精后胚子形成之前的时间);②为减少蚕卵内容物的流出,DNA注射量要少,在显微镜下看到液珠即可(约15-20nL);③因为胚子发育区域靠近“D”型蚕卵的较凸的一面,注射时在蚕卵腹部凸面的中心部位进行开孔,DNA推入部位以刚到达胚子发育区为宜,具体如图3所示。
实施例3:
对实施例2的转基因蚕丝腺中rFC蛋白含量进行鉴定,具体如下:
解剖转基因家蚕5龄幼虫的丝腺,Western Blot(WB)鉴定rFC蛋白;结果如图4所示,图中可见在蛋白印迹中出现了rFC蛋白的结合片段,证明,在该丝腺中存在rFC蛋白,图中,野生型(WT)的条带明显比84E突变型(MUT)细,由此证明,在本实验中84E突变型的rFC蛋白表达量远高于野生型。
申请人还进行了荧光定量PCR检测:
对转基因家蚕5龄幼虫的丝腺野生型(WT)和84E突变型(MUT)的cDNA为作为定量PCR的模板,以RPL32基因为内参基因,根据rFC基因序列设计引物,引物见表1:
表1
Figure BDA0002769254160000051
实时荧光定量PCR检测采用在Applied biosystemsTM荧光定量PCR仪上进行,
PCR的反应体系如表2所示:
表2
反应物 反应体积
cDNA(50ng·μL<sup>-1</sup>) 0.5μL
上游引物(10μg·L<sup>-1</sup>) 0.4μL
下游引物(10μg·L<sup>-1</sup>) 0.4μL
RNase Free Water 3.5μL
SYBR Premix Ex Taq 5μL
Rox Reference DyeⅡ 0.2μL
合计 10μL
上述反应体系的反应条件为:
95℃预变性30s;95℃变性5s,60℃退火20s,72℃延伸10s,共计45个循环,采集荧光信号;95℃变性1s,65℃退火15s,1个循环,制定溶解曲线;40℃冷却30s。使用2-ΔΔCT法所有的数据均表示为平均值±标准偏差。实时荧光定量PCR数据分析用SPSS 17.0和Microsoft Office Excel 2007进行统计分析,采用SPSS17.0软件方差分析,采用Excel2010软件制图,结果如图5所示:从图5可见,84E突变型的相对表达量约是野生型的3.67倍。
经检测,野生型的蛋白表达量达到170ug/mg;突变型的蛋白表达量达到630ug/mg。
综上所述,84E突变载体(sNTK84E+rFC)相对于野生型载体(sNT+rFC)来说具有更高的蛋白表达量和活性。而且,采用基因重组的方法,利用蚕丝腺宿主表达rFC蛋白,使得rFC蛋白产量更高、活性更低、成本更低,能完全替代人工采血,可进行大规模的推广应用,不会造成鲎的过度捕杀,保护濒危野生动物。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。
序列表
<120> 用于表达rFC蛋白的84E突变载体及其制备方法和应用
<160> 3
<170> SIPOSequenceListing 1.0
<210> 1
<211> 141
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Thr Trp Thr Ala Arg Leu Ala Leu Ser Phe Leu Ala Val Ile Cys
1 5 10 15
Thr Gln Ser Leu Phe Ala Gln Gly Gln Asn Thr Pro Trp Ser Ser Thr
20 25 30
Glu Leu Ala Asp Ala Phe Ile Asn Ala Phe Met Asn Glu Ala Gly Arg
35 40 45
Thr Gly Ala Phe Thr Ala Asp Gln Leu Asp Asp Met Ser Thr Ile Gly
50 55 60
Asp Thr Ile Lys Thr Ala Met Asp Lys Met Ala Arg Ser Asn Lys Ser
65 70 75 80
Ser Lys Gly Glu Leu Gln Ala Leu Asn Met Ala Phe Ala Ser Ser Met
85 90 95
Ala Glu Ile Ala Ala Val Glu Gln Gly Gly Leu Ser Val Asp Ala Lys
100 105 110
Thr Asn Ala Ile Ala Asp Ser Leu Asn Ser Ala Phe Tyr Gln Thr Thr
115 120 125
Gly Ala Ala Asn Pro Gln Phe Val Asn Glu Ile Arg Ser
130 135 140
<210> 2
<211> 1019
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Met Val Leu Ala Ser Phe Leu Val Ser Gly Leu Val Leu Gly Leu Leu
1 5 10 15
Ala Gln Gln Met Arg Pro Val Gln Ser Arg Gly Val Asp Leu Gly Leu
20 25 30
Cys Asp Glu Thr Arg Phe Glu Cys Lys Cys Gly Asp Pro Gly Tyr Val
35 40 45
Phe Asn Val Pro Met Lys Gln Cys Thr Tyr Phe Tyr Arg Trp Arg Pro
50 55 60
Tyr Cys Lys Pro Cys Asp Asp Leu Glu Ala Lys Asp Ile Cys Pro Lys
65 70 75 80
Tyr Lys Arg Cys Gln Glu Cys Lys Ala Gly Leu Asp Ser Cys Val Thr
85 90 95
Cys Pro Pro Asn Lys Tyr Gly Thr Trp Cys Ser Gly Glu Cys Gln Cys
100 105 110
Lys Asn Gly Gly Ile Cys Asp Gln Arg Thr Gly Ala Cys Ala Cys Arg
115 120 125
Asp Arg Tyr Glu Gly Ala His Cys Glu Ile Leu Lys Gly Cys Pro Leu
130 135 140
Leu Pro Ser Asp Ser Gln Val Gln Glu Val Arg Asn Pro Pro Asp Asn
145 150 155 160
Pro Gln Thr Ile Asp Tyr Ser Cys Pro Pro Gly Phe Lys Leu Lys Gly
165 170 175
Val Ala Arg Ile Ser Cys Leu Pro Asn Gly Gln Trp Ser Ser Phe Pro
180 185 190
Pro Lys Cys Ile Arg Glu Cys Ala Lys Val Ser Ser Pro Glu His Gly
195 200 205
Lys Val Thr Ala Pro Ser Gly Asn Met Ile Glu Gly Ala Thr Leu Arg
210 215 220
Phe Ser Cys Asp Ser Pro His Tyr Leu Ile Gly Gln Glu Thr Leu Thr
225 230 235 240
Cys Gln Gly Asn Gly Gln Trp Ser Gly Gln Ile Pro Gln Cys Lys Lys
245 250 255
Leu Val Phe Cys Pro Asp Leu Asp Pro Val Asn His Ala Glu His Gln
260 265 270
Val Lys Ile Gly Val Glu Gln Lys Tyr Gly Gln Phe Pro Gln Gly Thr
275 280 285
Glu Val Thr Tyr Thr Cys Ser Gly Asn Tyr Phe Leu Met Gly Phe Asn
290 295 300
Thr Leu Lys Cys Asn Leu Asp Gly Ser Trp Ser Gly Ser Gln Pro Ser
305 310 315 320
Cys Val Lys Val Ala Asp Arg Glu Val Asp Cys Asp Ser Lys Ala Val
325 330 335
Asp Phe Leu Asp Asp Val Gly Glu Pro Val Arg Ile His Cys Pro Ala
340 345 350
Gly Cys Ser Leu Thr Ala Gly Thr Val Trp Gly Thr Ala Ile Tyr His
355 360 365
Glu Leu Ser Ser Val Cys Arg Ala Ala Ile His Ala Gly Lys Leu Pro
370 375 380
Asn Ser Gly Gly Ala Val His Val Val Asn Asn Gly Pro Tyr Ser Asp
385 390 395 400
Phe Leu Gly Ser Asp Leu Asn Gly Ile Lys Ser Glu Glu Leu Lys Ser
405 410 415
Leu Ala Arg Ser Phe Arg Phe Asp Tyr Val Ser Ser Ser Thr Ala Gly
420 425 430
Arg Ser Gly Cys Pro Asp Gly Trp Phe Glu Val Glu Glu Asn Cys Val
435 440 445
Tyr Val Thr Ser Lys Gln Arg Ala Trp Glu Arg Ala Gln Gly Val Cys
450 455 460
Thr Asn Met Ala Ala Arg Leu Ala Val Leu Asp Lys Asp Val Ile Pro
465 470 475 480
Ser Ser Leu Thr Glu Ala Leu Arg Gly Lys Gly Leu Thr Thr Thr Trp
485 490 495
Ile Gly Leu His Arg Leu Asp Ala Glu Lys Pro Phe Val Trp Glu Leu
500 505 510
Met Asp Arg Ser Asn Val Val Leu Asn Asp Asn Leu Thr Phe Trp Ala
515 520 525
Ser Gly Glu Pro Gly Asn Glu Thr Asn Cys Val Tyr Leu Asp Ile Arg
530 535 540
Asp Gln Leu Gln Pro Val Trp Lys Thr Lys Ser Cys Phe Gln Pro Ser
545 550 555 560
Ser Phe Ala Cys Met Met Asp Leu Ser Asp Arg Asn Lys Ala Lys Cys
565 570 575
Asp Asp Pro Gly Ser Leu Glu Asn Gly His Ala Thr Leu His Gly Gln
580 585 590
Ser Ile Asp Gly Phe Tyr Ala Gly Ser Ser Ile Arg Tyr Ser Cys Glu
595 600 605
Val Leu His Tyr Leu Ser Gly Thr Glu Thr Val Thr Cys Thr Thr Asn
610 615 620
Gly Thr Trp Ser Ala Pro Lys Pro Arg Cys Ile Lys Val Ile Thr Cys
625 630 635 640
Gln Asn Pro Pro Val Pro Ser Tyr Gly Ser Val Glu Ile Lys Pro Pro
645 650 655
Ser Arg Thr Asn Ser Ile Ser Arg Val Gly Ser Pro Phe Leu Arg Leu
660 665 670
Pro Arg Leu Pro Leu Pro Leu Ala Arg Ala Ala Lys Pro Pro Pro Lys
675 680 685
Pro Arg Ser Ser Gln Pro Ser Thr Val Asp Leu Ala Ser Lys Val Lys
690 695 700
Leu Pro Glu Gly His Tyr Arg Val Gly Ser Arg Ala Ile Tyr Thr Cys
705 710 715 720
Glu Ser Arg Tyr Tyr Glu Leu Leu Gly Ser Gln Gly Arg Arg Cys Asp
725 730 735
Ser Asn Gly Asn Trp Ser Gly Arg Pro Ala Ser Cys Ile Pro Val Cys
740 745 750
Gly Arg Ser Asp Ser Pro Arg Ser Pro Phe Ile Trp Asn Gly Asn Ser
755 760 765
Thr Glu Ile Gly Gln Trp Pro Trp Gln Ala Gly Ile Ser Arg Trp Leu
770 775 780
Ala Asp His Asn Met Trp Phe Leu Gln Cys Gly Gly Ser Leu Leu Asn
785 790 795 800
Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Thr Tyr Ser Ala Thr
805 810 815
Ala Glu Ile Ile Asp Pro Ser Gln Phe Lys Ile Tyr Leu Gly Lys Tyr
820 825 830
Tyr Arg Asp Asp Ser Arg Asp Asp Asp Tyr Val Gln Val Arg Glu Ala
835 840 845
Leu Glu Ile His Val Asn Pro Asn Tyr Asp Pro Gly Asn Leu Asn Phe
850 855 860
Asp Ile Ala Leu Ile Gln Leu Lys Thr Pro Val Thr Leu Thr Thr Arg
865 870 875 880
Val Gln Pro Ile Cys Leu Pro Thr Asp Ile Thr Thr Arg Glu His Leu
885 890 895
Lys Glu Gly Thr Leu Ala Val Val Thr Gly Trp Gly Leu Asn Glu Asn
900 905 910
Asn Thr Tyr Ser Glu Met Ile Gln Gln Ala Val Leu Pro Val Val Ala
915 920 925
Ala Ser Thr Cys Glu Glu Gly Tyr Lys Glu Ala Asp Leu Pro Leu Thr
930 935 940
Val Thr Glu Asn Met Phe Cys Ala Gly Tyr Lys Lys Gly Arg Tyr Asp
945 950 955 960
Ala Cys Ser Gly Asp Ser Gly Gly Pro Leu Val Phe Ala Asp Asp Ser
965 970 975
Arg Thr Glu Arg Arg Trp Val Leu Glu Gly Ile Val Ser Trp Gly Ser
980 985 990
Pro Ser Gly Cys Gly Lys Ala Asn Gln Tyr Gly Gly Phe Thr Lys Val
995 1000 1005
Asn Val Phe Leu Ser Trp Ile Arg Gln Phe Ile
1010 1015
<210> 3
<211> 15596
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgccaa gctttgttta aaatataaca 420
aaattgtgat cccacaaaat gaagtggggc aaaatcaaat aattaactag tgtccgtaaa 480
cttgttggtc ttcaactttt tgaggaacac gttggacggc aaatcgtgac tataacacaa 540
gttgatttaa taattttagc caacacgtcg ggctgcgtgt tttttgcgct ctgtgtacac 600
gttgattaac tggtcgatta aataatttaa tttttggttc ttctttaaat ctgtgatgaa 660
attttttaaa ataactttaa attcttcatt ggtaaaaaat gccacgtttt gcaacttgtg 720
agggtctaat atgaggtcaa actcagtagg agttttatcc aaaaaagaaa acatgattac 780
gtctgtacac gaacgcgtat taacgcagag tgcaaagtat aagagggtta aaaaatatat 840
tttacgcacc atatacgcat cgggttgata tcgttaatat ggatcaattt gaacagttga 900
ttaacgtgtc tctgctcaag tctttgatca aaacgcaaat cgacgaaaat gtgtcggaca 960
atatcaagtc gatgagcgaa aaactaaaaa ggctagaata cgacaatctc acagacagcg 1020
ttgagatata cggtattcac gacagcaggc tgaataataa aaaaattaga aactattatt 1080
taaccctaga aagataatca tattgtgacg tacgttaaag ataatcatgc gtaaaattga 1140
cgcatgtgtt ttatcggtct gtatatcgag gtttatttat taatttgaat agatattaag 1200
ttttattata tttacactta catactaata ataaattcaa caaacaattt atttatgttt 1260
atttatttat taaaaaaaaa caaaaactca aaatttcttc tataaagtaa caaaactttt 1320
aaacattctc tcttttacaa aaataaactt attttgtact ttaaaaacag tcatgttgta 1380
ttataaaata agtaattagc ttaacttata cataatagaa acaaattata cttattagtc 1440
agtcagaaac aactttggca catatcaata ttatgctctc gacaaataac ttttttgcat 1500
tttttgcacg atgcatttgc ctttcgcctt attttagagg ggcagtaagt acagtaagta 1560
cgttttttca ttactggctc ttcagtactg tcatctgatg taccaggcac ttcatttggc 1620
aaaatattag agatattatc gcgcaaatat ctcttcaaag taggagcttc taaacgctta 1680
cgcataaacg atgacgtcag gctcatgtaa aggtttctca taaatttttt gcgactttga 1740
accttttctc ccttgctact gacattatgg ctgtatataa taaaagaatt tatgcaggca 1800
atgtttatca ttccgtacaa taatgccata ggccacctat tcgtcttcct actgcaggtc 1860
atcacagaac acatttggtc tagcgtgtcc actccgcctt tagtttgatt ataatacata 1920
accatttgcg gtttaccggt actttcgttg atagaagcat cctcatcaca agatgataat 1980
aagtatacca tcttagctgg cttcggttta tatgagacga gagtaagggg tccgtcaaaa 2040
caaaacatcg atgttcccac tggcctggag cgactgtttt tcagtacttc cggtatctcg 2100
cgtttgtttg atcgcacggt tcccacaatg gttaattcga gctcgcccgg ggatctaatt 2160
caattagaga ctaattcaat tagagctaat tcaattagga tccaagctta tcgatttcga 2220
accctcgacc gccggagtat aaatagaggc gcttcgtcta cggagcgaca attcaattca 2280
aacaagcaaa gtgaacacgt cgctaagcga aagctaagca aataaacaag cgcagctgaa 2340
caagctaaac aatcggggta ccgctagagt cgacggtacc gcgggcccgg gatccaccgg 2400
tcgccaccat ggtgcgctcc tccaagaacg tcatcaagga gttcatgcgc ttcaaggtgc 2460
gcatggaggg caccgtgaac ggccacgagt tcgagatcga gggcgagggc gagggccgcc 2520
cctacgaggg ccacaacacc gtgaagctga aggtgaccaa gggcggcccc ctgcccttcg 2580
cctgggacat cctgtccccc cagttccagt acggctccaa ggtgtacgtg aagcaccccg 2640
ccgacatccc cgactacaag aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga 2700
tgaacttcga ggacggcggc gtggtgaccg tgacccagga ctcctccctg caggacggct 2760
gcttcatcta caaggtgaag ttcatcggcg tgaacttccc ctccgacggc cccgtaatgc 2820
agaagaagac catgggctgg gaggcctcca ccgagcgcct gtacccccgc gacggcgtgc 2880
tgaagggcga gatccacaag gccctgaagc tgaaggacgg cggccactac ctggtggagt 2940
tcaagtccat ctacatggcc aagaagcccg tgcagctgcc cggctactac tacgtggact 3000
ccaagctgga catcacctcc cacaacgagg actacaccat cgtggagcag tacgagcgca 3060
ccgagggccg ccaccacctg ttcctgtagc ggccgcgact ctagatcata atcagccata 3120
ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga 3180
aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca 3240
aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt 3300
gtggtttgtc caaactcatc aatgtatctt aaagcttatc gatacgcgta cggcgcgcca 3360
aggtgttcaa aatgcactgc agcaaaaccc ccccgtttac ataatcacat gagaaccttg 3420
aaagtagcag gagtgggcat actcttgggc cggcggcggt tatcttttgt ttaccgccgc 3480
cacattagta caagatataa tcaacgccat caatagaacc ggcggaagtt attatgtgca 3540
aggtagaaac gccggagaaa acgccgaggc ctgtttgtta ttgcagcgca cttgtcgtca 3600
agaccgcaat ctagctcagt cggatgttaa catttgctca agagacccct tgttggctaa 3660
cgattcgccc ctactaacca acatgtgcca aggatttaac tatgaaacag aaaaaacagt 3720
ttgtcgcggc agcaatccgg ccgctaaccc aacttcgcct caatacgtag atattagcga 3780
tcttctgcgg gccaaacaat catgtgcatc gaaccttaca cgtttagtga tttaattggc 3840
gacttgcgtt tacattggtt actgggaaga gaaggtttaa tcggcaaatc gtccaacggt 3900
agtgacagca tccgcaacaa aataatgcct catcattatg atgataggcg cgttcttgtt 3960
tttaggttta atactttatt ttatctacag atacatgaca aaaggaggag gaggaggagg 4020
aagcggtggg gcaccaactc ccattgttgt tattatgcaa caccccacat caacagcggc 4080
ccctcgtcga taataaaaga caaaaataat ataaaatata tgtataatta attaaattca 4140
aaagatatgt ataattaatt aaattcaaat tttttatatt tacaatttag tttttgttcc 4200
gcaaacgtta tagcgtcgga caacggaacc agaccctgta atattaaagc taacaatttt 4260
aacaaattat tgtgcaatgt agtgctctct cttcggttca ctttactgat tacaaacatg 4320
tgatgcttaa atctattata tttttgaatt acttgactag cgtctacatc tttaatctcg 4380
ccagaaatcc aataaaactc ttcgtttttc ttagctatag tcaaccgctc ttcgtttttg 4440
aaagacaata ctataaaatt gtgacctttt acattatcca cattctgagt caaatactgt 4500
tcgacaatgt gcatgctgcc gtcctccttc ttaacctttt ttaaattttc agcgttatta 4560
ttactcgcaa tattgtcatg atatttataa ttattaaaca aaagattagc gacactactg 4620
tatttgtacg tgagcgtact ttttttgtta acaattaaat ttaaattgtc caccacatat 4680
ttgtttgggg gattgtcggg aaactttaca ctttccgaat actttaatat ttgactcaca 4740
tacggcgata caaaaaaatt attagatgca gtctcaattt cattactctc tttacgacta 4800
agcataatag gcaaagtaaa taaattttta tcttgataca tttcgtacaa cttgctcaaa 4860
agaaacccac actttctttc gcccaacgat tgtaacaaag tcacaaatgt ggtttgcgcg 4920
taatacatat ctaaattaaa atatgaagtc agagcagctt taaacgtgtg atgcacatcg 4980
acaaagtggc attttttaca attttgtgca gccgtctcgt cgttgcacac atcttgagaa 5040
tgaggaattt ctatgccggt ttctttaacc aaattgtacg agatcataaa tctaatttta 5100
tcaaaagtta ccacaaacac gcgattatct accatgtaat agttgtttgt atattcgtac 5160
accacattgc tcacgtactt ggcaaatata atttcaaacg gctttacttc acttttttta 5220
accacaaaca tgtaataacc agtttcggac atatggtcgg agaacctatt ggaattgtag 5280
tcgttgtcgt cgaaacgcat caaatacggc gcaaaatcat tagtaaaata atgcgtaatt 5340
tcttgagttg aagcaaccgt gcaaatgttc gtgttgtgat taattgtctg ctcaagggtt 5400
gcacagcttt gaattgtgct tttcttgtat ttaggcttca atttattctt gttaaattgg 5460
cccaccacac tttgtgaatc gtccaagtat tcgtccagct tccgtttagt tccagttgcc 5520
gatggttggt tcacaccaac aggatgctca aaagattccg cattataagc agaactgggc 5580
gatggttgct ccgcaacagg cagctcaaaa gattccgcat tataagcaga actaactgct 5640
tctccgagat tatcagtggt cttgagcaaa cattccatta tatcgttatc atcagttaac 5700
gaattgacgc ttgccaaaaa gtttgaagct gcctgcagtc tgctgtcaga tactaccgtg 5760
tcggctccat ccggcgtggg attgttataa taattcaaat agtcgttggg ctgttgttta 5820
tcacaaaact ctgaatagcc gttgtcgaac gacgctcggg acggcgtcgg agcactggtg 5880
tacgacgcgt taaaattaat ttgcgtcata gatctaagct tgttgtacaa aactgccaca 5940
cgcatttttt tctccactgt aggttgtagt tacgcgaaaa caaaatcgtt ctgtgaaaat 6000
tcaaacaaaa atattttttc gtaaaaacac ttatcaatga gtaaagtaac aattcatgaa 6060
taatttcatg taaaaaaaaa atactagaaa aggaattttt cattacgaga tgcttaaaaa 6120
tctgtttcaa ggtagagatt tttcgatatt tcggaaaatt ttgtaaaact gtaaatccgt 6180
aaaattttgc taaacatata ttgtgttgtt ttggtaagta ttgacccaag ctatcacctc 6240
ctgcagtatg tcgtgctaat tactggacac attgtataac agttccactg tattgacaat 6300
aataaaacct cttcattgac ttgagaatgt ctggacagat ttggctttgt atttttgatt 6360
tacaaatgtt tttttggtga tttacccatc caaggcattc tccaggatgg ttgtggcatc 6420
acgccgattg gcaaacaaaa actaaaatga aactaaaaag aaacagtttc cgctgtcccg 6480
ttcctctagt gggagaaagc atgaagtaag ttctttaaat attacaaaaa aattgaacga 6540
tattataaaa ttctttaaaa tattaaaagt aagaacaata agatcaatta aatcataatt 6600
aatcacattg ttcatgatca caatttaatt tacttcatac gttgtattgt tatgttaaat 6660
aaaaagatta atttctatgt aattgtatct gtacaataca atgtgtagat gtttattcta 6720
tcgaaagtaa atacgtcaaa actcgaaaat tttcagtata aaaaggttca actttttcaa 6780
atcagcatca gttcggttcc aactctcaag atgagagtca aaacctttgt gatcttgtgc 6840
tgcgctctgc aggtgagtta attattttac tattatttca gaaggtggcc agacgatatc 6900
acgggccacc tgataataag tggtcgccaa aacgcacaga tatcgtaaat tgtgccattt 6960
gatttgtcac gcccgggggg gctacggaat aaactacatt tatttattta aaaaatgaac 7020
cttagattat gtaacttgtg atttatttgc gtcaaaagta ggcaagatga atctatgtaa 7080
atacctgggc agacttgcaa tatcctattt caccggtaaa tcagcattgc aatatgcaat 7140
gcatattcaa caatatgtaa aacaattcgt aaagcatcat tagaaaatag acgaaagaaa 7200
ttgcataaaa ttataaccgc attattaatt tattatgata tctattaaca attgctattg 7260
cctttttttc gcaaattata atcattttca taacctcgag gtagcattct gttacatttt 7320
aatacattgg tatgtgatta taacacgagc tgcccactga gtttctcgcc agatcttctc 7380
agtgggtcgc gttaccgatc acgtgataga ttctatgaag cactgctctt gttagggcta 7440
gtgttagcaa attctttcag gttgagtctg agagctcacc tacccatcgg agcgtagctg 7500
gaataggcta ccagctaata ggtagggaaa acaaagctcg aaacaagctc aagtaataac 7560
aacataatgt gaccataaaa tctcgtggtg tatgagatac aattatgtac tttcccacaa 7620
atgtttacat aattagaatg ttgttcaact tgcctaacgc cccagctaga acattcaatt 7680
attactatta ccactactaa ggcagtatgt cctaactcgt tccagatcag cgctaacttc 7740
gattgaatgt gcgaaattta tagctcaata ttttagcact tatcgtattg atttaagaaa 7800
aaattgttaa cattttgttt cagtatgtcg cttatacaaa tgcaaacatc aatgattttg 7860
atgaggacta tcaaaacacc ccatggagca gcacggaact cgcagatgca ttcataaatg 7920
cattcatgaa cgaagctgga aggactggag ctttcactgc ggatcaactc gatgatatga 7980
gcaccatagg agacacaatt aaaacggcga tggacaaaat ggcgaggagc aacaagagca 8040
gcaaaggaga actccaagct ctcaacatgg cattcgctag cagcatggcg gaaattgctg 8100
cagtagaaca aggaggtctc agcgtagatg caaagacaaa cgctattgca gatagcctca 8160
acagcgcatt ctaccagaca actggagcag ccaacccaca gttcgtcaat gaaataagga 8220
gcctactagc tcaacaaatg agaccagttc aatcaagagg tgttgatctg ggtttgtgtg 8280
atgaaactag atttgaatgt aaatgtggtg atccaggtta cgtttttaat gttccaatga 8340
aacaatgcac ttacttttac agatggagac catactgtaa accatgtgat gacctggaag 8400
ctaaagacat ttgtccaaaa tacaaaagat gtcaagaatg taaagctggt cttgattcat 8460
gtgttacttg tccaccaaat aaatacggta cttggtgttc aggtgaatgt caatgtaaaa 8520
atggtggtat ctgtgaccaa agaactggtg cttgtgcttg tagagacaga tacgaaggtg 8580
ctcattgtga aattctcaaa ggttgtccac ttcttccatc agattcacaa gttcaagaag 8640
ttagaaatcc accagataat ccacaaacta ttgactactc atgtccacca ggttttaaac 8700
ttaaaggtgt tgctagaatt tcatgtctcc caaatggtca atggtcatca tttccaccaa 8760
aatgtattag agaatgtgct aaagtttcat caccagaaca tggtaaagtt actgctccat 8820
caggtaatat gatagaaggt gctactttaa gattttcatg tgattcacca cattacttga 8880
ttggtcaaga aactttaact tgccaaggta atggtcaatg gtcaggtcaa ataccacaat 8940
gtaaaaaatt ggttttttgt ccagaccttg atccagttaa tcatgctgaa catcaagtta 9000
aaattggtgt tgaacaaaaa tacggtcaat ttccacaagg tactgaagtt acttacactt 9060
gttcaggtaa ttactttttg atgggtttta atactttaaa atgtaatctt gatggttcat 9120
ggtcaggttc acaaccatca tgtgttaaag ttgctgacag agaagttgac tgtgactcaa 9180
aagctgttga ctttttggat gatgttggtg aaccagttag aatccattgt ccagctggtt 9240
gttcattgac tgctggtact gtttggggta ctgctatata ccatgaactt tcatcagttt 9300
gtagagctgc tatccatgct ggtaaacttc caaattcagg tggtgctgtt catgttgtta 9360
ataatggtcc atactcagac tttctgggtt cagacctgaa tggtataaaa tcagaagaat 9420
tgaaatcact tgctagatca tttagatttg attacgtttc atcatcaact gctggtagat 9480
caggttgtcc agatggttgg tttgaagttg aagaaaattg tgtttacgtt acttcaaaac 9540
aaagagcttg ggaaagagct caaggtgttt gtactaatat ggctgctaga cttgctgttc 9600
tagacaaaga tgttattcca tcatcattga ctgaagctct aagaggtaaa ggtttaacta 9660
ctacttggat aggtttgcat agactagatg ctgaaaaacc atttgtttgg gaactaatgg 9720
atagatcaaa tgttgttctg aatgataatc taactttttg ggcttcaggt gaaccaggta 9780
atgaaactaa ttgtgtttac ctggacatca gagatcaact gcaaccagtt tggaaaacta 9840
aatcatgttt tcaaccatca tcatttgctt gcatgatgga tttgtcagac agaaataaag 9900
ctaaatgcga tgacccaggt tcactggaaa atggtcatgc tactcttcat ggtcaatcaa 9960
ttgatggttt ttacgctggt tcatcaataa gatactcatg tgaagttctc cattacctct 10020
caggtactga aactgttact tgtactacta atggtacttg gtcagctcca aaaccaagat 10080
gtatcaaagt tatcacttgc caaaatccac cagttccatc atacggttca gttgaaatca 10140
aaccaccatc aagaactaat tcaatctcaa gagttggttc accatttttg agattgccaa 10200
gattaccact cccattagct agagctgcta aaccaccacc aaaaccaaga tcatcacaac 10260
catcaactgt tgacttggct tcaaaagtta aactaccaga aggtcattac agagttggtt 10320
caagagctat ttacacttgc gaatcaagat actacgaact acttggttca caaggtagaa 10380
gatgtgactc aaatggtaat tggtcaggta gaccagcttc atgtattcca gtttgtggta 10440
gatcagactc accaagatca ccatttatct ggaatggtaa ttcaactgaa ataggtcaat 10500
ggccatggca agctggtatc tcaagatggc ttgctgacca taatatgtgg tttctccaat 10560
gtggtggttc actattgaat gaaaaatgga tcgttactgc tgctcattgt gttacttact 10620
cagctactgc tgaaataatt gatccatcac aatttaaaat ctacctgggt aaatactaca 10680
gagatgactc aagagacgat gactacgttc aagttagaga agctctcgaa atccatgtta 10740
atccaaatta cgacccaggt aatctcaatt ttgacatagc tctaattcaa ctgaaaactc 10800
cagttacttt gactactaga gttcaaccaa tctgtctgcc aactgacatc actactagag 10860
aacatttgaa agaaggtact ttagctgttg ttactggttg gggtttgaat gaaaataata 10920
cttactcaga aatgattcaa caagctgttc taccagttgt tgctgcttca acttgtgaag 10980
aaggttacaa agaagctgac ttaccactga ctgttactga aaatatgttt tgtgctggtt 11040
acaaaaaagg tagatacgat gcttgctcag gtgactcagg tggtccatta gtttttgctg 11100
atgattcaag aactgaaaga agatgggttt tggaaggtat tgtttcatgg ggttcaccat 11160
caggttgtgg taaagctaat caatacggtg gttttactaa agttaatgtt tttctatcat 11220
ggattagaca atttattatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca 11280
tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg 11340
agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc 11400
ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct 11460
accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc 11520
aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt 11580
tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg 11640
gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg 11700
ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg 11760
gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc 11820
tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga 11880
agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg 11940
acgagctgta caagtaattt ttaatataaa ataacccttg tttcttactt cgtcctggat 12000
acatctatgt tttttttttc gttaataaat gagagcattt aagttattgt ttttaattac 12060
ttttttttag aaaacagatt tcggattttt tgtatgcatt ttatttgaat gtactaggat 12120
cccttaaggc tagcctcgag agcgctcacc atcaccatca ccattaaagt tacggagctg 12180
gcaggggata cggacaaggt gcaggaagtg cagcttcctc tgtgtcatct gcttcatctc 12240
gcagttacga ctattctcgt cgtaacgtcc gcaaaaactg tggaattcct agaagacaac 12300
tagttgttaa attcagagca ctgccttgtg tgaattgcta atttttaata taaaataacc 12360
cttgtttctt acttcgtcct ggatacatct atgttttttt tttcgttaat aaatgagagc 12420
atttaagtta ttgtttttaa ttactttttt ttagaaaaca gatttcggat tttttgtatg 12480
cattttattt gaatgtacta ggccggccga tctcggatct gacaatgttc agtgcagaga 12540
ctcggctacg cctcgtggac tttgaagttg accaacaatg tttattctta cctctaatag 12600
tcctctgtgg caaggtcaag attctgttag aagccaatga agaacctggt tgttcaataa 12660
cattttgttc gtctaatatt tcactaccgc ttgacgttgg ctgcacttca tgtacctcat 12720
ctataaacgc ttcttctgta tcgctctgga cgtcatcttc acttacgtga tctgatattt 12780
cactgtcaga atcctcacca acaagctcgt catcgctttg cagaagagca gagaggatat 12840
gctcatcgtc taaagaacta cccattttat tatatattag tcacgatatc tataacaaga 12900
aaatatatat ataataagtt atcacgtaag tagaacatga aataacaata taattatcgt 12960
atgagttaaa tcttaaaagt cacgtaaaag ataatcatgc gtcattttga ctcacgcggt 13020
cgttatagtt caaaatcagt gacacttacc gcattgacaa gcacgcctca cgggagctcc 13080
aagcggcgac tgagatgtcc taaatgcaca gcgacggatt cgcgctattt agaaagagag 13140
agcaatattt caagaatgca tgcgtcaatt ttacgcagac tatctttcta gggttaaaaa 13200
agatttgcgc tttactcgac ctaaacttta aacacgtcat agaatcttcg tttgacaaaa 13260
accacattgt ggccaagctg tgtgacgcga cgcgcgctaa agaatggcaa accaagtcgc 13320
gcgagcgtcg actctagagg atccccgggt accgagctcg aattcgtaat catggtcata 13380
gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 13440
cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 13500
ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 13560
acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 13620
gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 13680
gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 13740
ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 13800
cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 13860
ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 13920
taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc aatgctcacg 13980
ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 14040
ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 14100
aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 14160
tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac 14220
agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 14280
ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 14340
tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 14400
tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 14460
cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 14520
aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 14580
atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 14640
cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 14700
tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 14760
atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 14820
taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 14880
tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 14940
gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 15000
cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 15060
cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 15120
gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 15180
aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 15240
accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 15300
ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 15360
gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 15420
aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 15480
taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac 15540
cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtc 15596

Claims (8)

1.用于表达rFC蛋白的载体,其特征在于,所述载体是在piggyBac 载体骨架上插入DsRed 表达单元与CFib-H 表达单元构建得到的,所述CFib-H 表达单元由 PFib-H家蚕重链基因启动子 、突变型增溶标签sNTK84E、his蛋白标签和rFC的表达基因组成;所述CFib-H表达单元的连接方式为 PFib-H-sNTK84E-his-rFC;所述DsRed 表达单元为由3xP3启动子引导的红色荧光DsRed 基因组成;
所述突变型增溶标签sNTK84E的蛋白序列如序列表SEQ:NO:1所示。
2.根据权利要求1用于表达rFC蛋白的载体,其特征在于,所述载体的核酸序列如序列表SEQ:NO:3所示。
3.包含如权利要求1或2任意一项所述载体的宿主细胞。
4.根据权利要求3所述的宿主细胞,其特征在于,所述宿主细胞为蚕丝腺细胞。
5.一种应用如权利要求1或2任意一项所述用于表达rFC蛋白的载体和/或权利要求3或4任意一项宿主细胞分泌rFC蛋白的方法,其特征在于,所述方法包括如下步骤:
(1)构建所述用于表达rFC蛋白的载体;
(2)采用显微注射的方法将步骤(1)的载体注射到蚕卵的胚子发育区;
(3)将步骤(2)的蚕卵孵化饲养成虫后,筛选红眼表型纯一的蛾进行连续3代的饲养,选出不产生性状分离的第3代蚕进行饲喂,育成红眼基因纯合、rFC蛋白纯合且丝腺细胞能够分泌rFC蛋白的转基因蚕;
(4)rFC蛋白在蚕丝素蛋白重链信号肽的作用下分泌到蚕的丝腺腔,并分泌到蚕茧。
6.根据权利要求5所述的分泌rFC蛋白的方法,其特征在于,所述步骤(2)蚕卵的注射时间为蚕卵产下后的4-8h。
7.根据权利要求5所述的分泌rFC蛋白的方法,其特征在于,所述步骤(2)蚕卵的注射时应将针孔从蚕卵的“D”型区凸面推入。
8.一种制备应用如权利要求1或2任意一项所述用于表达rFC蛋白的载体的方法,其特征在于,所述方法为:
(1)下载蜘蛛蛋白的sNT序列,将序列进行氨基酸序列突变,最终得到并合成的突变氨基酸序列如序列表SEQ:NO:1所示;
(2)提取鲎的血液,通过RT-PCR的方法扩增rFC蛋白基因,并对该蛋白进行密码子改造,改造后编码的氨基酸序列如序列表SEQ:NO:2所示;
(3)将SEQ:NO:1、SEQ:NO:2、his蛋白标签和荧光表达基因连接在piggyBac 载体骨架上即得所述载体,最终得到的载体核苷酸序列如序列表SEQ:NO:3所示。
CN202011243857.8A 2020-11-10 2020-11-10 用于表达rFC蛋白的84E突变载体及其制备方法和应用 Active CN112359059B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011243857.8A CN112359059B (zh) 2020-11-10 2020-11-10 用于表达rFC蛋白的84E突变载体及其制备方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011243857.8A CN112359059B (zh) 2020-11-10 2020-11-10 用于表达rFC蛋白的84E突变载体及其制备方法和应用

Publications (2)

Publication Number Publication Date
CN112359059A CN112359059A (zh) 2021-02-12
CN112359059B true CN112359059B (zh) 2021-11-30

Family

ID=74510025

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011243857.8A Active CN112359059B (zh) 2020-11-10 2020-11-10 用于表达rFC蛋白的84E突变载体及其制备方法和应用

Country Status (1)

Country Link
CN (1) CN112359059B (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3168229B1 (en) * 2010-03-18 2019-06-19 Spiber Technologies AB Production of proteins and polypeptides
CN103290041A (zh) * 2012-02-27 2013-09-11 上海拜生生物科技有限公司 中国鲎c因子原核及昆虫杆状病毒重组表达载体的构建
ES2784510T3 (es) * 2012-12-10 2020-09-28 Seikagaku Kogyo Co Ltd Método para producir un nuevo Factor C recombinante, método para mitigar la inhibición de la reacción en ensayos de endotoxina, y método para medir endotoxina

Also Published As

Publication number Publication date
CN112359059A (zh) 2021-02-12

Similar Documents

Publication Publication Date Title
CN107988246A (zh) 一种基因敲除载体及其斑马鱼胶质瘤模型
CN109735479B (zh) 一种合成2’-岩藻糖基乳糖的重组枯草芽孢杆菌及其构建方法与应用
CN108849774B (zh) 一种阻断蚕蛾出茧的方法
CN111909958B (zh) 血管平滑肌细胞条件性敲除Yap1基因小鼠模型的构建
US20050260625A1 (en) Process and system for crosslinking polynucleotide molecules
CN110343698B (zh) 构建B2m定点敲入人B2M cDNA小鼠模型的方法
CN107190001A (zh) 一种基因合成方法
KR101755965B1 (ko) Il33 n―말단 도메인 결실을 갖는 염증의 쥣과 모델
CN112746083A (zh) 一种通过单碱基编辑靶基因启动子失活基因的方法
CN114480499A (zh) 环状RNA分子表达元件以及环状RNA分子的表达载体circEXPRO
CN100510107C (zh) 一种分子量内标的制备方法及用该方法制备的分子量内标
CN112359059B (zh) 用于表达rFC蛋白的84E突变载体及其制备方法和应用
CN112342240B (zh) 用于表达rFC蛋白的59R突变载体及其制备方法和应用
CN107988202B (zh) 一种敲除酿酒酵母染色体的方法
CN110331164B (zh) Lilra3基因敲入小鼠的打靶载体和lilra3基因敲入小鼠的构建方法
CN115247166A (zh) 一种蛋白酶突变体
CN112342216B (zh) 用于提高CHO细胞的表达效率的CRISPR-Cas13d系统以及重组CHO细胞
CN108277232A (zh) 一种润肠功能的富硒酵母及其制备方法
CN113088531A (zh) 牛源性成分定量分析标准质粒、制备及检测方法及应用
CN111378677A (zh) 一种dna组装的方法及其应用
US20030213009A1 (en) Promoter and intron from maize actin depolymerizing factor
CN101899472A (zh) 一种猪内源性反转录病毒载体及其构建方法
CN116497052A (zh) 一种生产虾青素的解脂耶氏酵母基因工程菌的构建方法
CN116064728A (zh) 一种染色体外环状dna的建库以及测序方法
KR101901990B1 (ko) 대장균 및 유산균에서 복제가능한 벡터, 그를 포함한 세포, 및 그를 이용하는 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Wang Hong

Inventor after: Wang Yujun

Inventor after: Huang Jingcai

Inventor after: Qin Honglin

Inventor after: Lan Yu

Inventor after: Huang Xiaochan

Inventor after: Zhong Xifa

Inventor after: Li Yimin

Inventor after: Zheng Ruxia

Inventor before: Wang Hong

Inventor before: Wang Yujun

Inventor before: Huang Jingcai

Inventor before: Qin Honglin

Inventor before: Lan Yu

Inventor before: Huang Xiaochan

Inventor before: Zhong Xifa

Inventor before: Li Yimin

Inventor before: Zheng Ruxia

GR01 Patent grant
GR01 Patent grant