CN111269294B - 纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其制备方法和应用 - Google Patents

纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其制备方法和应用 Download PDF

Info

Publication number
CN111269294B
CN111269294B CN201910075523.5A CN201910075523A CN111269294B CN 111269294 B CN111269294 B CN 111269294B CN 201910075523 A CN201910075523 A CN 201910075523A CN 111269294 B CN111269294 B CN 111269294B
Authority
CN
China
Prior art keywords
lacy
mutant
nnnnnnnnnn nnnnnnnnnn
cellooligosaccharide
phe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910075523.5A
Other languages
English (en)
Other versions
CN111269294A (zh
Inventor
李小明
崔金明
刘陈立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Institute of Advanced Technology of CAS
Original Assignee
Guangzhou Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Institute of Advanced Technology of CAS filed Critical Guangzhou Institute of Advanced Technology of CAS
Publication of CN111269294A publication Critical patent/CN111269294A/zh
Application granted granted Critical
Publication of CN111269294B publication Critical patent/CN111269294B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)

Abstract

本发明属于基因工程领域,具体涉及纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其制备方法和应用。本发明的高效转运纤维寡糖的突变转运蛋白的制备方法,包括:(1)定向进化LacY对纤维寡糖的底物特异性;(2)分析步骤(1)进化样品的氨基酸序列,获取突变位点;(3)构建突变转运蛋白LacY的表达载体,并进行表达获得突变转运蛋白LacY。本发明还提供用上述方法得到的纤维二糖、纤维三糖、纤维四糖的突变转运蛋白LacY的表达载体,含所述表达载体的微生物,以及他们在纤维质利用领域的应用方法。本发明方法制得的突变转运蛋白LacY能够高效转运纤维寡糖,提高纤维质的利用。

Description

纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其 制备方法和应用
技术领域
本发明属于基因工程领域,具体涉及纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其制备方法和应用。
背景技术
纤维质是世界上蕴藏量最丰富的天然高分子化合物,绝大多数由绿色植物通过光合作用合成。当前利用纤维质生产工业副产品,如酒精等,首先需将纤维质进行理化处理或者用纤维素酶等预处理将纤维质降解成葡萄糖,再供微生物利用生产工业副产品。事实上经过预处理的纤维质降解产物中还含有大量的纤维二糖、纤维三糖等纤维寡糖,但是微生物中由于缺乏特异性的纤维寡糖转运蛋白,微生物无法高效利用纤维寡糖,导致资源浪费,纤维质利用率低。
LacY是乳糖或半乳糖转运蛋白,其对纤维寡糖的转运效率非常低,且当前在细菌中并未发现其他特异性转运纤维寡糖的转运蛋白,因此在纤维质利用领域,尤其是利用细菌发酵纤维质获取工业副产品方面受到制约。
发明内容
鉴于此,有必要针对上述问题提供纤维寡糖转运蛋白LacY的突变型、突变转运蛋白LacY及其制备方法和应用。本发明利用定向进化方式进化LacY的底物特异性,从而提供一种能高效转运纤维寡糖进胞内供细菌利用的转运蛋白,使其能够高效转运纤维寡糖,进化后的LacY能提高纤维质的利用。
本发明是通过以下技术方案实现的:
纤维二糖转运蛋白LacY的突变位点,包括A177T、A177V、R142C、L62M中任意一个突变位点或至少任意X个突变位点的组合而成;X大于等于2且小于等于4。
一种高效转运纤维二糖的突变转运蛋白LacY的表达载体,包括所述的纤维二糖转运蛋白LacY的突变位点或突变位点组合。
进一步的,所述转运纤维二糖的突变转运蛋白LacY的表达载体中LacY的启动子为J23109,cepA(纤维二糖磷酸化酶)的启动子为J23102。野生型LacY表达载体序列见SEQ IDNO:2,其中LacY序列为野生型的LacY序列,图谱见图1,针对不同突变型的载体序列替换相应位点为突变后序列即可。
纤维三糖转运蛋白LacY的突变位点,包括A177V、F140Y、R142C、I79T、V316I、V326I、V416I中任意一个突变位点或至少任意Y个突变位点的组合而成;Y大于等于2且小于等于7。
一种高效转运纤维三糖的突变转运蛋白LacY的表达载体,包括所述的纤维三糖转运蛋白LacY的突变位点或突变位点组合。
纤维四糖转运蛋白LacY的突变位点,包括A177T、A177V、R142C、G150S、V326I、A51V、G96E、A203D、M83V、I92V中任意一个突变位点或至少任意Z个突变位点的组合而成;Z大于等于2且小于等于10。
一种高效转运纤维四糖的突变转运蛋白LacY的表达载体,包括所述纤维四糖转运蛋白LacY的突变位点或突变位点组合。
进一步的,所述转运纤维三糖或转运纤维四糖的突变转运蛋白LacY的表达载体中包括LacY的启动子J23109、cepA(纤维二糖磷酸化酶)的启动子J23102、纤维寡糖磷酸化酶cepB。野生型LacY表达载体为J23102-cepA-J23102-cepB-J23109-LacY,图谱见图4,序列见SEQ ID NO:3,其中LacY序列为野生型的LacY序列,针对不同突变型的载体序列替换相应位点为突变后序列即可。
相较于野生型LacY的氨基酸序列(见SEQ ID NO:1)和核酸序列(见SEQ ID NO:4),本发明的各氨基酸突变位点及对应的核酸序列突变如下表所示:
表1
Figure BDA0001958615560000031
Figure BDA0001958615560000041
一种高效转运纤维寡糖的突变转运蛋白LacY的制备方法,包括:
(1)定向进化LacY对纤维寡糖的底物特异性;
(2)分析步骤(1)进化样品的氨基酸序列,获取突变位点;
(3)构建突变转运蛋白LacY的表达载体,并进行表达获得突变转运蛋白。
进一步的,所述高效转运纤维寡糖的突变转运蛋白LacY的制备方法,还包括:(4)以纤维寡糖做碳源进行代谢实验,鉴定突变后的LacY代谢纤维寡糖的能力。
进一步的,步骤(1)采用噬菌体辅助持续定向进化系统进行定向进化。
进一步的,步骤(1)的纤维寡糖包括纤维二糖、纤维三糖、纤维四糖等。
进一步的,所述步骤(3)中表达突变转运蛋白LacY的表达载体的微生物为LacY缺陷型的大肠杆菌。
一种包含所述突变转运蛋白LacY的表达载体的宿主微生物。
所述纤维寡糖转运蛋白LacY突变位点、包含所述转运蛋白LacY突变位点的表达载体或包含所述表达载体的微生物在纤维质利用、生物发酵等领域的应用。
本发明有益效果:
现有技术并没有系统去研究LacY对不同纤维寡糖的转运效率,本发明以纤维寡糖作为效应物直接定向进化LacY并获得不同的LacY突变体,对不同的LacY突变体做纤维寡糖代谢实验,证实突变后的LacY确实比野生型的LacY具有更高利用纤维寡糖的能力。
LacY的A177V突变体能够提高蔗糖转运效率,纤维二糖、麦芽糖抑制LacY A177V突变体转运β-ONPG的能力比野生型的LacY高,侧面反映LacY的A177V突变体提高了对纤维二糖或麦芽糖的亲和力。本发明直接利用纤维二糖、三糖、四糖等纤维寡糖作为LacY的效应物去定向进化,所得突变体可以明显提高纤维素的利用率。
本发明所有突变位点具有针对性,是针对能够提高纤维寡糖转运效率的突变库,能提高纤维质的利用效率。
附图说明
图1为纤维二糖的LacY突变体表达载体图谱。
图2为不同LacY突变体工程菌株代谢纤维二糖的生长曲线。
图3为不同LacY突变体的工程菌株消耗纤维二糖的耗糖曲线。
图4为纤维三糖和纤维四糖LacY突变体表达载体图谱。
图5为不同LacY突变体工程菌株代谢纤维三糖的生长曲线。
图6为不同LacY突变体工程菌株代谢纤维三糖的耗糖曲线。
图7为不同LacY突变体工程菌株代谢纤维四糖的生长曲线。
图8为不同LacY突变体工程菌株代谢纤维四糖的耗糖曲线。
图9为辅助质粒AP1的基因图谱。
图10为辅助质粒AP2的基因图谱。
图11为质粒MP的基因图谱。
具体实施方式
为了更好地说明本发明所解决的问题、所采用的技术方案和所达到的效果,现结合具体实施例和相关资料进一步阐述。需要说明的是,本发明内容包含但不限于以下实施例及其组合实施方式。
本发明实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购等途径获得的常规产品。
实施例1针对不同纤维寡糖定向进化获得的LacY突变位点
1.进化宿主的构建:
1)gIII蛋白表达质粒AP1的构建:gIII蛋白由启动子J23109启动,启动子下游插入CelR蛋白的识别位点核酸序列。AP1图谱见图9,AP1(SEQ ID NO:5)。
2)功能蛋白CelR蛋白的表达质粒AP2构建:CelR由组成型启动子表达,图谱见图10,AP2(SEQ ID NO:6)。
3)诱变质粒MP由David R Liu实验室赠送,图谱见图11,MP可以再DNA复制过程中提供更高的突变率,MP(SEQ ID NO:7)。
4)AP1、AP2及MP共转化S1030感受态细胞,获得宿主S1030-AP1/AP2/MP。
2.PACE进化LacY的底物特异性
1)宿主S1030-AP1/AP2/MP培养至对数期(0D600=0.4)。
2)第一轮进化,200uL进化体系中,初始纤维二糖终浓度29mM,初始野生型SP-lacY噬菌体1.2×105pfu/mL,阿拉伯糖终浓度始终为1%,补加宿主S1030-AP1/AP2/MP至200uL,37℃,培养进化1h。取样,梯度稀释,稀释后的噬菌体10μL与190μL对数期宿主S1030-AP1/AP2/MP混合,37℃放置15min,与50℃含有0.5%纤维二糖的0.5%的软琼脂1mL混匀,均匀铺在直径60cm固体琼脂板上,静置10min,凝固后置于37℃过夜培养,计算噬菌斑的数量,确定体系中噬菌体的浓度。取单个噬菌斑,扩增噬菌体上LacY基因片段,送往华大测序,查看突变情况。
3)第二轮进化,取第一轮进化体系离心后的上清20μL作为待进化的噬菌体SP-lacY(此时的噬菌体为野生型SP-lacY及其各种突变体的混合噬菌体),纤维二糖终浓度为14.5mM,阿拉伯糖终浓度始终为1%,补加新鲜宿主S1030-AP1/AP2/MP至200uL,37℃,培养进化1h。取样计算体系中噬菌体浓度并检测突变情况。
4)以此类推,第三轮取第二轮上清100μL继续进化,并降低纤维二糖浓度,第四轮直至最后一轮(纤维二糖做53轮,纤维三糖做50轮进化,纤维四糖做200轮进化)同理。
纤维三糖和纤维四糖的进化同理,只需将上述方法中纤维二糖换成对应的纤维寡糖即可。
通过上述定向进化得出:针对LacY对纤维二糖定向进化累积的突变位点为A177T、A177V、R142C、L62M;针对LacY对纤维三糖定向进化累积的突变位点为A177V、F140Y、R142C、I79T、V316I、V326I、V416I;针对LacY对纤维四糖定向进化累积的突变位点为A177T、A177V、R142C、G150S、V326I、A51V、G96E、A203D、M83V、I92V。
通过上述的PACE进化系统,在进化过程中不断下调纤维寡糖的浓度,这样筛选压力会不断变大,导致LacY必须产生正面突变是LacY能够转运更多的纤维寡糖进胞内,才能使噬菌体保留下来(噬菌体上携带突变后的LacY位点),否则不突变或者不好的突变由于纤维寡糖浓度不断下降,携带这种不突变或者不好突变LacY的噬菌体就会被自动淘汰,因为缺纤维寡糖,来不及产生子代就被稀释掉了,随着时间的推移,每隔一段时间取样测序,我们就会发现突变位点从无到有,从一个突变位点到多个,从占比10%到最终100%,是个自动的过程。
实施例2工程菌株的构建
将实施例1中针对纤维二糖获得的不同的突变位点组合构建不同的LacY突变体表达载体(图1,序列见SEQ ID NO:2),LacY的启动子为J23109,cepA的启动子为J23102,cepA是纤维二糖磷酸化酶,可以直接将LacY转运进胞内的纤维二糖降解为葡萄糖和1磷酸葡萄糖供细菌代谢利用。
将实施例1中针对纤维三糖或纤维四糖获得的不同突变位点组合构建不同的LacY突变体表达载体(图4,序列见SEQ ID NO:3),cepA的启动子为J23102、cepB的启动子为J23102,LacY的启动子为J23109,cepB可以将纤维三糖和纤维四糖降解为纤维二糖和1磷酸葡糖糖,然后cepA将纤维二糖降解为葡萄糖和1磷酸葡萄糖供细菌代谢利用。
载体的构建是分子生物学基本技能,本领域技术人员根据习惯或手册即可完成。所用表达宿主为LacY基因缺陷型大肠杆菌S1030(David R Liu实验室提供,遗传信息参见《Nat Chem Biol.2014March;10(3):216–222》),宿主也可以由其他商业化的LacY基因缺陷型的大肠杆菌代替。表达载体电转或化转S1030感受态细胞,通过壮观霉素筛选阳性克隆,测序验证正确获得不同LacY突变体的工程菌株;大肠杆菌的感受态制备及转化方法是本领域的基本技能,本领域技术人员按常规操作或相关实验手册操作即可。
实施例3LacY突变体工程菌株代谢实验
按实施例2中构建方法,构建得到工程菌株S1030(对照)、S1030-LacY、S1030-cepA-LacYW(野生型)、S1030-cepA-LacYA177T、S1030-cepA-LacYA177V、S1030-cepA-LacYA177V/R142C、S1030-cepA-LacYA177V/L62M、S1030-cepA-LacYA177V/R142C/L62M在M9培养基中培养并以纤维二糖为唯一碳源;测定不同工程菌株生长曲线和纤维二糖的消耗曲线,以此判断不同LacY突变体转运纤维二糖的效率。
从结果可以得出生长速度和耗糖速率(参见图2、图3)都是A177V/L62M>A177V>A177V/R142C/L62M>A177V/R142C>A177T>LacYW,因此转运纤维二糖的效率排序为:A177V/L62M>A177V>A177V/R142C/L62M>A177V/R142C>A177T>LacYW。
按实施例2中构建方法,构建得到工程菌株S1030(对照)、S1030-cepA-cepB-LacYW(野生型)、S1030-cepA-cepB-LacYA177V、S1030-cepA-cepB-LacYA177V/F140Y、S1030-cepA-cepB-LacYA177V/F140Y/R142C在M9培养基中培养并以纤维三糖为唯一碳源;测定不同工程菌株生长曲线和纤维三糖的消耗曲线(图5、图6),以此判断不同LacY突变体转运纤维三糖的效率。
按实施例2中构建方法,构建得到工程菌株S1030(对照)、S1030-cepA-cepB-LacYW(野生型)、S1030-cepA-cepB-LacYA177V、S1030-cepA-cepB-LacYA177T/R142C、S1030-cepA-cepB-LacYA177V/G150S、S1030-cepA-cepB-LacYA177V/V326I在M9培养基中培养并以纤维四糖为唯一碳源;测定不同工程菌株生长曲线和纤维四糖的消耗曲线(图7、图8),以此判断不同LacY突变体转运纤维四糖的效率。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 广州中国科学先进技术研究所
<120> 纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其制备方法和应用
<130> P201900062
<141> 2019-01-25
<150> 2018114829827
<151> 2018-12-05
<160> 7
<170> SIPOSequenceListing 1.0
<210> 1
<211> 417
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Tyr Tyr Leu Lys Asn Thr Asn Phe Trp Met Phe Gly Leu Phe Phe
1 5 10 15
Phe Phe Tyr Phe Phe Ile Met Gly Ala Tyr Phe Pro Phe Phe Pro Ile
20 25 30
Trp Leu His Asp Ile Asn His Ile Ser Lys Ser Asp Thr Gly Ile Ile
35 40 45
Phe Ala Ala Ile Ser Leu Phe Ser Leu Leu Phe Gln Pro Leu Phe Gly
50 55 60
Leu Leu Ser Asp Lys Leu Gly Leu Arg Lys Tyr Leu Leu Trp Ile Ile
65 70 75 80
Thr Gly Met Leu Val Met Phe Ala Pro Phe Phe Ile Phe Ile Phe Gly
85 90 95
Pro Leu Leu Gln Tyr Asn Ile Leu Val Gly Ser Ile Val Gly Gly Ile
100 105 110
Tyr Leu Gly Phe Cys Phe Asn Ala Gly Ala Pro Ala Val Glu Ala Phe
115 120 125
Ile Glu Lys Val Ser Arg Arg Ser Asn Phe Glu Phe Gly Arg Ala Arg
130 135 140
Met Phe Gly Cys Val Gly Trp Ala Leu Cys Ala Ser Ile Val Gly Ile
145 150 155 160
Met Phe Thr Ile Asn Asn Gln Phe Val Phe Trp Leu Gly Ser Gly Cys
165 170 175
Ala Leu Ile Leu Ala Val Leu Leu Phe Phe Ala Lys Thr Asp Ala Pro
180 185 190
Ser Ser Ala Thr Val Ala Asn Ala Val Gly Ala Asn His Ser Ala Phe
195 200 205
Ser Leu Lys Leu Ala Leu Glu Leu Phe Arg Gln Pro Lys Leu Trp Phe
210 215 220
Leu Ser Leu Tyr Val Ile Gly Val Ser Cys Thr Tyr Asp Val Phe Asp
225 230 235 240
Gln Gln Phe Ala Asn Phe Phe Thr Ser Phe Phe Ala Thr Gly Glu Gln
245 250 255
Gly Thr Arg Val Phe Gly Tyr Val Thr Thr Met Gly Glu Leu Leu Asn
260 265 270
Ala Ser Ile Met Phe Phe Ala Pro Leu Ile Ile Asn Arg Ile Gly Gly
275 280 285
Lys Asn Ala Leu Leu Leu Ala Gly Thr Ile Met Ser Val Arg Ile Ile
290 295 300
Gly Ser Ser Phe Ala Thr Ser Ala Leu Glu Val Val Ile Leu Lys Thr
305 310 315 320
Leu His Met Phe Glu Val Pro Phe Leu Leu Val Gly Cys Phe Lys Tyr
325 330 335
Ile Thr Ser Gln Phe Glu Val Arg Phe Ser Ala Thr Ile Tyr Leu Val
340 345 350
Cys Phe Cys Phe Phe Lys Gln Leu Ala Met Ile Phe Met Ser Val Leu
355 360 365
Ala Gly Asn Met Tyr Glu Ser Ile Gly Phe Gln Gly Ala Tyr Leu Val
370 375 380
Leu Gly Leu Val Ala Leu Gly Phe Thr Leu Ile Ser Val Phe Thr Leu
385 390 395 400
Ser Gly Pro Gly Pro Leu Ser Leu Leu Arg Arg Gln Val Asn Glu Val
405 410 415
Ala
<210> 2
<211> 6114
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
cgtcaaagtg gccgaacttc ataagctttt tctcctcttt ctctaactag tgctagcaca 60
gtacctagga ctgagctagc tgtcaaggta cctttacagc tagctcagtc ctagggactg 120
tgctagcgaa ttctagagaa agaggagaaa ctcgagatgt actatttaaa aaacacaaac 180
ttttggatgt tcggtttatt ctttttcttt tactttttta tcatgggagc ctacttcccg 240
tttttcccga tttggctaca tgacatcaac catatcagca aaagtgatac gggtattatt 300
tttgccgcta tttctctgtt ctcgctatta ttccaaccgc tgtttggtct gctttctgac 360
aaactcgggc tgcgcaaata cctgctgtgg attattaccg gcatgttagt gatgtttgcg 420
ccgttcttta tttttatctt cgggccactg ttacaataca acattttagt aggatcgatt 480
gttggtggta tttatctagg cttttgtttt aacgccggtg cgccagcagt agaggcattt 540
attgagaaag tcagccgtcg cagtaatttc gaatttggtc gcgcgcggat gtttggctgt 600
gttggctggg cgctgtgtgc ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt 660
gttttctggc tgggctctgg ctgtgcactc atcctcgccg ttttactctt tttcgccaaa 720
acggatgcgc cctcttctgc cacggttgcc aatgcggtag gtgccaacca ttcggcattt 780
agccttaagc tggcactgga actgttcaga cagccaaaac tgtggttttt gtcactgtat 840
gttattggcg tttcctgcac ctacgatgtt tttgaccaac agtttgctaa tttctttact 900
tcgttctttg ctaccggtga acagggtacg cgggtatttg gctacgtaac gacaatgggc 960
gaattactta acgcctcgat tatgttcttt gcgccactga tcattaatcg catcggtggg 1020
aaaaacgccc tgctgctggc tggcactatt atgtctgtac gtattattgg ctcatcgttc 1080
gccacctcag cgctggaagt ggttattctg aaaacgctgc atatgtttga agtaccgttc 1140
ctgctggtgg gctgctttaa atatattacc agccagtttg aagtgcgttt ttcagcgacg 1200
atttatctgg tctgtttctg cttctttaag caactggcga tgatttttat gtctgtactg 1260
gcgggcaata tgtatgaaag catcggtttc cagggcgctt atctggtgct gggtctggtg 1320
gcgctgggct tcaccttaat ttccgtgttc acgcttagcg gccccggccc gctttccctg 1380
ctgcgtcgtc aggtgaatga agtcgcttaa ctgcaggtcc ctaagtctcc tcagcaaaac 1440
gaaaggccca gtctttcgac tgagcctttc gttttatttg accggatgtc ctcttgttca 1500
tcatcagtaa cccgtatcgt gagcatcctc tctcgtttca tcggtatcat tacccccatg 1560
aacagaaatc ccccttacac ggaggcatca gtgaccaaac aggaaaaaac cgcccttaac 1620
atggcccgct ttatcagaag ccagacatta acgcttctgg agaaactcaa cgagctggac 1680
gcggatgaac aggcagacat ctgtgaatcg cttcacgacc acgctgatga gctttaccgc 1740
agctgcctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag 1800
acggtcacag cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca 1860
gcgggtgttg gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga tagcggagtg 1920
tatactggct taactatgcg gcatcagagc agattgtact gagagtgcac catatgcggt 1980
gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgctct tccgcttcct 2040
cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 2100
aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 2160
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 2220
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 2280
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 2340
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 2400
ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 2460
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 2520
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 2580
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 2640
acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 2700
gaggtggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 2760
gcaagcagca gattacgcgc agaaaaaaag gatctcaaac ggcctatttg gcctattttt 2820
ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata 2880
atattgaaaa aggaagagta tgagggaagc ggtgatcgcc gaagtatcga ctcaactatc 2940
agaggtagtt ggcgtcatcg agcgccatct cgaaccgacg ttgctggccg tacatttgta 3000
cggctccgca gtggatggcg gcctgaagcc acacagtgat attgatttgc tggttacggt 3060
gaccgtaagg cttgatgaaa caacgcggcg agctttgatc aacgaccttt tggaaacttc 3120
ggcttcccct ggagagagcg agattctccg cgctgtagaa gtcaccattg ttgtgcacga 3180
cgacatcatt ccgtggcgtt atccagctaa gcgcgaactg caatttggag aatggcagcg 3240
caatgacatt cttgcaggta tcttcgagcc agccacgatc gacattgatc tggctatctt 3300
gctgacaaaa gcaagagaac atagcgttgc cttggtaggt ccagcggcgg aggaactctt 3360
tgatccggtt cctgaacagg atctatttga ggcgctaaat gaaaccttaa cgctatggaa 3420
ctcgccgccc gactgggctg gcgatgagcg aaatgtagtg cttacgttgt cccgcatttg 3480
gtacagcgca gtaaccggca aaatcgcgcc gaaggatgtc gctgccgact gggcaatgga 3540
gcgcctgccg gcccagtatc agcccgtcat acttgaagct agacaggctt atcttggaca 3600
agaagaagat cgcttggcct cgcgcgcaga tcagttggaa gaatttgtcc actacgtgaa 3660
aggcgagatc accaaggtag tcggcaaata aacgccatgg ttaacccagg gtcacctcaa 3720
cgttgcaaac ggtgcccgct tgctgcggcg gcacaatgta accgtcgatc gcgttgccgt 3780
tcagggtcag gcttttaaca cccttgctca cgtgggtcgg gttggtaaca atgatgttat 3840
aggtcgcacc acggtattta cgggtcacct taaagccgtc ccagctgctc ggaatgcacg 3900
ggttgatcgc cagaccgcta taatccggtt taacgcccag aatgtattgg gtgatcgccg 3960
caaagttcca gctcgcggtg ccggtcagcc agctgttttt accttcgccc ggcagatacg 4020
cgtctttacc cgcaatcatc tggcaatacg cgtacggctc caccttgtgc agatcgctaa 4080
tttcctccag gtacgccgga gcgattttac gatagtattc aaacgcctta tcaccacggc 4140
ccagcagggt ctcggtaatc atgatccacg ggttgttgtg gcagaagata cccgcgtttt 4200
ctttataacc cgccgggtag gtgctaatct cgccatattc gatatagtac ttggtgaacg 4260
ccggttgttg cagaacaatg ccgtagtcgc aatccagcca ctctttaacg ctgtccatgc 4320
tcttttccac cagaccatcc tccagaccga tacccgccat accgcaaaag ccctggcttt 4380
caatgaagat tttgccttcc tcgttctcct tgctacccac tttcttgcca tagtagtcgt 4440
acgcacgcag gaaccattca ccatcccagc cgtgtttctt aaccgcctcc accatttggt 4500
caatgtgcgc ctgcgcctcc gccgcttcac catcttggcc gatttcacgg cacagtttaa 4560
caaactcgtt accgtacagc acgaacagac ccgcaatcat caggctttcc gcggtacgac 4620
cggtcttgtt gccggtggtc tggaagctct cgttcgggtc ctcgctgaag cagttcaggt 4680
tcaggcagtc gttccaatcc gcacgaccga tcagcggcag accgtgcggg cccaggttgt 4740
taacggtgtg gtaaaagcta cgtttcaggt gttcgaagtg gctggtcgcc ttgctcgcgt 4800
cgttatcata cggcacctgt tcctccagga tgctaaagtc gccggtctct ttaatgtaat 4860
cggtggtgct caggatcagc cacagcggat cgtcgttgaa gttaccgcca atcgcgttgt 4920
taccacgctt ggtcagcggt tgatactggt ggtacgcgct gccgtcttca aactgggtgc 4980
tcgcgatgtc aatgatacgt tcacgcgcac gctccggaac ttggtgcaca aaaccaatca 5040
ggtcctggtt gctatcacgg aaacccatgc cacgaccgat gccgctctca aagaagctcg 5100
cgctacggct catgttgaag gtaaccatgc attggtactg gttccagatg ttcaccatac 5160
ggtccagttt ttcatcaccg ctctcaacgc tataggtgct cagcagattc gcccagtagt 5220
ccgccagttt ggtcagttcc gcgtcaacct tctccacgct atcaaaacgc gcaatcagct 5280
ctttcgccgg gctcttgttg atcacgcctt tgctttccca cttgttctcc ggcgcaactt 5340
caatataacc cagcacgaag atcaggtctt tgctttcgcc cggcgccagc tcaacttcca 5400
ggtagtggct cgcgatcggg ctccaaccgt gcgcctcgct gttacgcggt tcaccctcaa 5460
acaccgcatc cggcttgtcg aaatcgttat acagaccttt ccacttgtca cgatcggtgt 5520
cgaagccttg aatcggcgcg ttaacgctat aaaacgcgta gtggttacga cgctctttga 5580
actcggtctt gtggtagatc acgctgtcct caacttccac ctcaccggtg ctaaagttac 5640
gctggaagtt ggtcatatcg tcttccgcgt tccacaggca ccactccgca aagctgaaca 5700
gcttaaattt cttggtcgca ccgctggtgt ttttcaggct aactttttga atttccgccc 5760
aggtgcccag cgggatgaag ctcagcactt ccgcctgaat accgttacgc tcgccggtga 5820
tacgggtata gctcagaccg tgcgcgcagc tgtacgcatc cagctccgct ttaaccggct 5880
tccaacccgg gctccacacg tcaccgctat cgttgatata gaagtattta ccgccgttgt 5940
caaccggcac gttgttataa cggtaacggg tcagacgacg aaatttcgca tccttataga 6000
agctgtaacc gccaccggtg ttgctaacca ggctaaagaa gtcttcgtta cccagatagt 6060
taatccacgg gtacggggtc ttcggatcgg tgatcacgta ctcacgcgct ttat 6114
<210> 3
<211> 8617
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
cgtcaaagtg gccgaacttc ataagctttt tctcctcttt ctctaactag tgctagcaca 60
gtacctagga ctgagctagc tgtcaaggta cctttacagc tagctcagtc ctagggactg 120
tgctagcgaa ttctagagaa agaggagaaa ctcgagatgt actatttaaa aaacacaaac 180
ttttggatgt tcggtttatt ctttttcttt tactttttta tcatgggagc ctacttcccg 240
tttttcccga tttggctaca tgacatcaac catatcagca aaagtgatac gggtattatt 300
tttgccgcta tttctctgtt ctcgctatta ttccaaccgc tgtttggtct gctttctgac 360
aaactcgggc tgcgcaaata cctgctgtgg attattaccg gcatgttagt gatgtttgcg 420
ccgttcttta tttttatctt cgggccactg ttacaataca acattttagt aggatcgatt 480
gttggtggta tttatctagg cttttgtttt aacgccggtg cgccagcagt agaggcattt 540
attgagaaag tcagccgtcg cagtaatttc gaatttggtc gcgcgcggat gtttggctgt 600
gttggctggg cgctgtgtgc ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt 660
gttttctggc tgggctctgg ctgtgcactc atcctcgccg ttttactctt tttcgccaaa 720
acggatgcgc cctcttctgc cacggttgcc aatgcggtag gtgccaacca ttcggcattt 780
agccttaagc tggcactgga actgttcaga cagccaaaac tgtggttttt gtcactgtat 840
gttattggcg tttcctgcac ctacgatgtt tttgaccaac agtttgctaa tttctttact 900
tcgttctttg ctaccggtga acagggtacg cgggtatttg gctacgtaac gacaatgggc 960
gaattactta acgcctcgat tatgttcttt gcgccactga tcattaatcg catcggtggg 1020
aaaaacgccc tgctgctggc tggcactatt atgtctgtac gtattattgg ctcatcgttc 1080
gccacctcag cgctggaagt ggttattctg aaaacgctgc atatgtttga agtaccgttc 1140
ctgctggtgg gctgctttaa atatattacc agccagtttg aagtgcgttt ttcagcgacg 1200
atttatctgg tctgtttctg cttctttaag caactggcga tgatttttat gtctgtactg 1260
gcgggcaata tgtatgaaag catcggtttc cagggcgctt atctggtgct gggtctggtg 1320
gcgctgggct tcaccttaat ttccgtgttc acgcttagcg gccccggccc gctttccctg 1380
ctgcgtcgtc aggtgaatga agtcgcttaa ctgcaggtcc ctaagtctcc tcagcaaaac 1440
gaaaggccca gtctttcgac tgagcctttc gttttatttg accggatgtc ctcttgttca 1500
tcatcagtaa cccgtatcgt gagcatcctc tctcgtttca tcggtatcat tacccccatg 1560
aacagaaatc ccccttacac ggaggcatca gtgaccaaac aggaaaaaac cgcccttaac 1620
atggcccgct ttatcagaag ccagacatta acgcttctgg agaaactcaa cgagctggac 1680
gcggatgaac aggcagacat ctgtgaatcg cttcacgacc acgctgatga gctttaccgc 1740
agctgcctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag 1800
acggtcacag cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca 1860
gcgggtgttg gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga tagcggagtg 1920
tatactggct taactatgcg gcatcagagc agattgtact gagagtgcac catatgcggt 1980
gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgctct tccgcttcct 2040
cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 2100
aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 2160
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 2220
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 2280
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 2340
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 2400
ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 2460
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 2520
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 2580
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 2640
acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 2700
gaggtggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 2760
gcaagcagca gattacgcgc agaaaaaaag gatctcaaac ggcctatttg gcctattttt 2820
ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata 2880
atattgaaaa aggaagagta tgagggaagc ggtgatcgcc gaagtatcga ctcaactatc 2940
agaggtagtt ggcgtcatcg agcgccatct cgaaccgacg ttgctggccg tacatttgta 3000
cggctccgca gtggatggcg gcctgaagcc acacagtgat attgatttgc tggttacggt 3060
gaccgtaagg cttgatgaaa caacgcggcg agctttgatc aacgaccttt tggaaacttc 3120
ggcttcccct ggagagagcg agattctccg cgctgtagaa gtcaccattg ttgtgcacga 3180
cgacatcatt ccgtggcgtt atccagctaa gcgcgaactg caatttggag aatggcagcg 3240
caatgacatt cttgcaggta tcttcgagcc agccacgatc gacattgatc tggctatctt 3300
gctgacaaaa gcaagagaac atagcgttgc cttggtaggt ccagcggcgg aggaactctt 3360
tgatccggtt cctgaacagg atctatttga ggcgctaaat gaaaccttaa cgctatggaa 3420
ctcgccgccc gactgggctg gcgatgagcg aaatgtagtg cttacgttgt cccgcatttg 3480
gtacagcgca gtaaccggca aaatcgcgcc gaaggatgtc gctgccgact gggcaatgga 3540
gcgcctgccg gcccagtatc agcccgtcat acttgaagct agacaggctt atcttggaca 3600
agaagaagat cgcttggcct cgcgcgcaga tcagttggaa gaatttgtcc actacgtgaa 3660
aggcgagatc accaaggtag tcggcaaata aacgccatgg aaaacgaaag gcccagtctt 3720
tcgactgagc ctttcgtttt atttggtcga cttgacagct agctcagtcc taggtactgt 3780
gctagcgaat gcatgcgaaa gaggagaaaa gatctatgcg ttatggttat ttcgatgaga 3840
aggcccgcga atatgttatt acccgcccgg atacaccgac cccgtggatc aactacatcg 3900
gtaatggtaa atatggtggc atcgtgacca ataccggcgg cggctatagc ttccacaaag 3960
atccgcagaa tcgccgtatt acccgttacc gttataacaa tctgccgacc gatcgcccgg 4020
gccgctacat ttatgtgcgt gatcgtttaa ctggtgagta ttggaatccg ggttatcagc 4080
cggtgcagcg caaattagat agctaccgct gtcgtcatgg tatgggctat accgttctgg 4140
agggcgagta caaaggtatc gccgccgacg ttacctattt cgttccggac gaccgcgact 4200
ttgaaatttg gctggtgcag attcgcaatc tgtgccatgt tgagcgcaat ttacaagttt 4260
tcagctacgc cgaattttgc ttttgggatg ccattatgga ccagcagaac gtggattggg 4320
ttcagcaaat taaccaaggt cgctacgaag atcgtctgat cacttggcat ccgcatcact 4380
tcaaggacgc atgtgccttt ttcgccacaa acgccgagat caacagcttc gacaccaatc 4440
tggaggcatt catcggtcgc taccgctgcg aaagcaatcc gatcgccgtg gagaccggcg 4500
cttgtagtaa tagcgtgagc taccgtatga acggcgtggg tgccttctgt attgatgtga 4560
acttaaaacc gggcgaggaa cgtgagatca tttttattct gggtttcacc gaaaacaaaa 4620
gtaccattcg cgacgaaatc cgcgactatt taaacgtgga gtatgccaaa gaggcactga 4680
aacgcttaaa agatagctgg gaggaatatc tggacaagtt acaaattgaa accccggacc 4740
gcgaaaccaa tctgttcgtg aacacttgga atcagtacca gtgtaagatc acatttaact 4800
ggagtcgctt cgttagcatg tattcttggg gtctgggtcg tggtattggt atccgcgaca 4860
gtgcacaaga tactttaggc gttatgcata gcatccccga actggccggt ggtctgatta 4920
aacgtttaat tcattgccag tacaccgacg gccgcgtgta tcatttattc ttccctctga 4980
ccggtgaggg tggtattggc gacgcccccg ttgttaagtt tgactggtac agcgacgacc 5040
atctgtggct gccgatcgcc gccaacgcct atctgaaaga gaccgcaaat tttgattttt 5100
tccagagtgt ggtgccttac aatgacaata aaaccgaagg caccgtgtgg gaacatctga 5160
accgcgctat ggagtttacc tacaaccatc gtggtccgca cgcattaccg tacagtcgtg 5220
ccgattggaa cgacacttta aatttagata tgggtaacgg cattgccgaa acattattta 5280
caagtatgct gttcagcgag ccgccgctga agcgttttcg ctgccgcatc agtgacaaac 5340
gtatcgccac caaataccgc tactggtacg acgagatgaa gcaagctatc aacgagtggt 5400
gttgggatgg cgaatggtat atccgcgcct ttgatgatga aggtaatgtg ctgggtagcg 5460
gcaagaaccg ttacggtaaa atcttcatca acagccagag ttgggcagtt ctgagtatgg 5520
tggcaccgga agagtacgca aaaaagtgtt tagagagcgt ttatcgtcat ttaaacacca 5580
aatacggtat cgttaaggtg tacccggcat acccggaata caatcctaag atcggcggta 5640
tgaccacata cccgccgggt gcaaaggaga atggtggcat ttttgcccac accaatccgt 5700
gggtgatgat cgccgagtgt atgatgggca atggccgccg cgcatatcag tattatcgcc 5760
agattttacc tttaacccgc aatgacgatg cagatttact ggaagttgaa ccgtacgtgt 5820
actgtcagaa cattttaggc aaggagcacc cgcaattcgg tattggccgt aacagctggc 5880
tgaccggcac tgccgcttgg aatatggtgg ccgtgagcca gtacatttta ggtattcgtc 5940
cggagtatga cggtctgacc gttgatcctt gtattcctcc ggactggaaa ggcttcaagg 6000
tgcgtcgtat ctttcgtggc tgcgtttata acattgaggt gcgcaatccg gaaggcgtgc 6060
gccgttgcga aaagaactgc cgtcgcggtg ttgagaccga taagattccg gttaaaccgg 6120
ctggcactgt ttgtgagtgc gttgttatca tgggttaagg atccaaaatc aaaggatctt 6180
cttgagatcc tttttttcca tggttaaccc agggtcacct caacgttgca aacggtgccc 6240
gcttgctgcg gcggcacaat gtaaccgtcg atcgcgttgc cgttcagggt caggctttta 6300
acacccttgc tcacgtgggt cgggttggta acaatgatgt tataggtcgc accacggtat 6360
ttacgggtca ccttaaagcc gtcccagctg ctcggaatgc acgggttgat cgccagaccg 6420
ctataatccg gtttaacgcc cagaatgtat tgggtgatcg ccgcaaagtt ccagctcgcg 6480
gtgccggtca gccagctgtt tttaccttcg cccggcagat acgcgtcttt acccgcaatc 6540
atctggcaat acgcgtacgg ctccaccttg tgcagatcgc taatttcctc caggtacgcc 6600
ggagcgattt tacgatagta ttcaaacgcc ttatcaccac ggcccagcag ggtctcggta 6660
atcatgatcc acgggttgtt gtggcagaag atacccgcgt tttctttata acccgccggg 6720
taggtgctaa tctcgccata ttcgatatag tacttggtga acgccggttg ttgcagaaca 6780
atgccgtagt cgcaatccag ccactcttta acgctgtcca tgctcttttc caccagacca 6840
tcctccagac cgatacccgc cataccgcaa aagccctggc tttcaatgaa gattttgcct 6900
tcctcgttct ccttgctacc cactttcttg ccatagtagt cgtacgcacg caggaaccat 6960
tcaccatccc agccgtgttt cttaaccgcc tccaccattt ggtcaatgtg cgcctgcgcc 7020
tccgccgctt caccatcttg gccgatttca cggcacagtt taacaaactc gttaccgtac 7080
agcacgaaca gacccgcaat catcaggctt tccgcggtac gaccggtctt gttgccggtg 7140
gtctggaagc tctcgttcgg gtcctcgctg aagcagttca ggttcaggca gtcgttccaa 7200
tccgcacgac cgatcagcgg cagaccgtgc gggcccaggt tgttaacggt gtggtaaaag 7260
ctacgtttca ggtgttcgaa gtggctggtc gccttgctcg cgtcgttatc atacggcacc 7320
tgttcctcca ggatgctaaa gtcgccggtc tctttaatgt aatcggtggt gctcaggatc 7380
agccacagcg gatcgtcgtt gaagttaccg ccaatcgcgt tgttaccacg cttggtcagc 7440
ggttgatact ggtggtacgc gctgccgtct tcaaactggg tgctcgcgat gtcaatgata 7500
cgttcacgcg cacgctccgg aacttggtgc acaaaaccaa tcaggtcctg gttgctatca 7560
cggaaaccca tgccacgacc gatgccgctc tcaaagaagc tcgcgctacg gctcatgttg 7620
aaggtaacca tgcattggta ctggttccag atgttcacca tacggtccag tttttcatca 7680
ccgctctcaa cgctataggt gctcagcaga ttcgcccagt agtccgccag tttggtcagt 7740
tccgcgtcaa ccttctccac gctatcaaaa cgcgcaatca gctctttcgc cgggctcttg 7800
ttgatcacgc ctttgctttc ccacttgttc tccggcgcaa cttcaatata acccagcacg 7860
aagatcaggt ctttgctttc gcccggcgcc agctcaactt ccaggtagtg gctcgcgatc 7920
gggctccaac cgtgcgcctc gctgttacgc ggttcaccct caaacaccgc atccggcttg 7980
tcgaaatcgt tatacagacc tttccacttg tcacgatcgg tgtcgaagcc ttgaatcggc 8040
gcgttaacgc tataaaacgc gtagtggtta cgacgctctt tgaactcggt cttgtggtag 8100
atcacgctgt cctcaacttc cacctcaccg gtgctaaagt tacgctggaa gttggtcata 8160
tcgtcttccg cgttccacag gcaccactcc gcaaagctga acagcttaaa tttcttggtc 8220
gcaccgctgg tgtttttcag gctaactttt tgaatttccg cccaggtgcc cagcgggatg 8280
aagctcagca cttccgcctg aataccgtta cgctcgccgg tgatacgggt atagctcaga 8340
ccgtgcgcgc agctgtacgc atccagctcc gctttaaccg gcttccaacc cgggctccac 8400
acgtcaccgc tatcgttgat atagaagtat ttaccgccgt tgtcaaccgg cacgttgtta 8460
taacggtaac gggtcagacg acgaaatttc gcatccttat agaagctgta accgccaccg 8520
gtgttgctaa ccaggctaaa gaagtcttcg ttacccagat agttaatcca cgggtacggg 8580
gtcttcggat cggtgatcac gtactcacgc gctttat 8617
<210> 4
<211> 1254
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
atgtactatt taaaaaacac aaacttttgg atgttcggtt tattcttttt cttttacttt 60
tttatcatgg gagcctactt cccgtttttc ccgatttggc tacatgacat caaccatatc 120
agcaaaagtg atacgggtat tatttttgcc gctatttctc tgttctcgct attattccaa 180
ccgctgtttg gtctgctttc tgacaaactc gggctgcgca aatacctgct gtggattatt 240
accggcatgt tagtgatgtt tgcgccgttc tttattttta tcttcgggcc actgttacaa 300
tacaacattt tagtaggatc gattgttggt ggtatttatc taggcttttg ttttaacgcc 360
ggtgcgccag cagtagaggc atttattgag aaagtcagcc gtcgcagtaa tttcgaattt 420
ggtcgcgcgc ggatgtttgg ctgtgttggc tgggcgctgt gtgcctcgat tgtcggcatc 480
atgttcacca tcaataatca gtttgttttc tggctgggct ctggctgtgc actcatcctc 540
gccgttttac tctttttcgc caaaacggat gcgccctctt ctgccacggt tgccaatgcg 600
gtaggtgcca accattcggc atttagcctt aagctggcac tggaactgtt cagacagcca 660
aaactgtggt ttttgtcact gtatgttatt ggcgtttcct gcacctacga tgtttttgac 720
caacagtttg ctaatttctt tacttcgttc tttgctaccg gtgaacaggg tacgcgggta 780
tttggctacg taacgacaat gggcgaatta cttaacgcct cgattatgtt ctttgcgcca 840
ctgatcatta atcgcatcgg tgggaaaaac gccctgctgc tggctggcac tattatgtct 900
gtacgtatta ttggctcatc gttcgccacc tcagcgctgg aagtggttat tctgaaaacg 960
ctgcatatgt ttgaagtacc gttcctgctg gtgggctgct ttaaatatat taccagccag 1020
tttgaagtgc gtttttcagc gacgatttat ctggtctgtt tctgcttctt taagcaactg 1080
gcgatgattt ttatgtctgt actggcgggc aatatgtatg aaagcatcgg tttccagggc 1140
gcttatctgg tgctgggtct ggtggcgctg ggcttcacct taatttccgt gttcacgctt 1200
agcggccccg gcccgctttc cctgctgcgt cgtcaggtga atgaagtcgc ttaa 1254
<210> 5
<211> 5579
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atgcctctag attaattaat taagcggccg catcgatcgg gccctgaggc ctgcagggta 60
cccatttaca gctagctcag tcctagggac tgtgctagcg aattctggga gcgctcccat 120
cacacaggaa acagctatga aaaaattatt attcgcaatt cctttagttg ttcctttcta 180
ttctcactcc gctgaaactg ttcatcacca tcaccatcac gctgaaactg ttgaaagttg 240
tttagcaaaa ccccatacag aaaattcatt tactaacgtc tggaaagacg acaaaacttt 300
agatcgttac gctaactatg agggctgtct gtggaatgct acaggcgttg tagtttgtac 360
tggtgacgaa actcagtgtt acggtacatg ggttcctatt gggcttgcta tccctgaaaa 420
tgagggtggt ggctctgagg gtggcggttc tgagggtggc ggttctgagg gtggcggtac 480
taaacctcct gagtacggtg atacacctat tccgggctat acttatatca accctctcga 540
cggcacttat ccgcctggta ctgagcaaaa ccccgctaat cctaatcctt ctcttgagga 600
gtctcagcct cttaatactt tcatgtttca gaataatagg ttccgaaata ggcagggggc 660
attaactgtt tatacgggca ctgttactca aggcactgac cccgttaaaa cttattacca 720
gtacactcct gtatcatcaa aagccatgta tgacgcttac tggaacggta aattcagaga 780
ctgcgctttc cattctggct ttaatgagga tccattcgtt tgtgaatatc aaggccaatc 840
gtctgacctg cctcaacctc ctgtcaatgc tggcggcggc tctggtggtg gttctggtgg 900
cggctctgag ggtggtggct ctgagggtgg cggttctgag ggtggcggct ctgagggagg 960
cggttccggt ggtggctctg gttccggtga ttttgattat gaaaagatgg caaacgctaa 1020
taagggggct atgaccgaaa atgccgatga aaacgcgcta cagtctgacg ctaaaggcaa 1080
acttgattct gtcgctactg attacggtgc tgctatcgat ggtttcattg gtgacgtttc 1140
cggccttgct aatggtaatg gtgctactgg tgattttgct ggctctaatt cccaaatggc 1200
tcaagtcggt gacggtgata attcaccttt aatgaataat ttccgtcaat atttaccttc 1260
cctccctcaa tcggttgaat gtcgcccttt tgtctttggc gctggtaaac cttacgagtt 1320
cagtatcgac tgcgataaga tcaacctgtt ccgcggtgtc tttgcgtttc ttttatatgt 1380
tgccaccttt atgtatgtat tttctacgtt tgctaacata ctgcgtaata aggagtctta 1440
atgaaatttg gaaacttttt gcttacatac caacctcccc aattttccca aacagaggta 1500
atgaaacgtt tggttaaatt aggtcgcatc tctgatgagt gtggttttga taccgtatgg 1560
ttactggagc atcatttcac ggagtttggt ttgcttggta acccttatgt cgctgctgca 1620
tatttacttg gcgcgactaa aaaattgaat gtaggaactg ccgctattgt tcttcccaca 1680
gcccatccag tacgccaact tgaagatgtg aatttattgg atcaaatgtc aaaaggacga 1740
tttcggtttg gtatttgccg agggctttac aacaaggact ttcgcgtatt cggcacagat 1800
atgaataaca gtcgcgcctt agcggaatgc tggtacgggc tgataaagaa tggcatgaca 1860
gagggatata tggaagctga taatgaacat atcaagttcc ataaggtaaa agtaaacccc 1920
gcggcgtata gcagaggtgg cgcaccggtt tatgtggtgg ctgaatcagc ttcgacgact 1980
gagtgggctg ctcaatttgg cctaccgatg atattaagtt ggattataaa tactaacgaa 2040
aagaaagcac aacttgagct ttataatgaa gtggctcaag aatatgggca cgatattcat 2100
aatatcgacc attgcttatc atatataaca tctgtagatc atgactcaat taaagcgaaa 2160
gagatttgcc ggaaatttct ggggcattgg tatgattctt atgtgaatgc tacgactatt 2220
tttgatgatt cagaccaaac aagaggttat gatttcaata aagggcagtg gcgtgacttt 2280
gtattaaaag gacataaaga tactaatcgc cgtattgatt acagttacga aatcaatccc 2340
gtgggaacgc cgcaggaatg tattgacata attcaaaaag acattgatgc tacaggaata 2400
tcaaatattt gttgtggatt tgaagctaat ggaacagtag acgaaattat tgcttccatg 2460
aagctcttcc agtctgatgt catgccattt cttaaagaaa aacaacgttc gctattatat 2520
tatggcggtg gcggtagcgg cggtggcggt agcggcggtg gcggtagcgg cggtggcggt 2580
agcaaatttg gattgttctt ccttaacttc atcaattcaa caactgttca agaacagagt 2640
atagttcgca tgcaggaaat aacggagtat gttgataagt tgaattttga acagatttta 2700
gtgtatgaaa atcatttttc agataatggt gttgtcggcg ctcctctgac tgtttctggt 2760
tttctgctcg gtttaacaga gaaaattaaa attggttcat taaatcacat cattacaact 2820
catcatcctg tccgcatagc ggaggaagct tgcttattgg atcagttaag tgaagggaga 2880
tttattttag ggtttagtga ttgcgaaaaa aaagatgaaa tgcatttttt taatcgcccg 2940
gttgaatatc aacagcaact atttgaagag tgttatgaaa tcattaacga tgctttaaca 3000
acaggctatt gtaatccaga taacgatttt tatagcttcc ctaaaatatc tgtaaatccc 3060
catgcttata cgccaggcgg acctcggaaa tatgtaacag caaccagtca tcatattgtt 3120
gagtgggcgg ccaaaaaagg tattcctctc atctttaagt gggatgattc taatgatgtt 3180
agatatgaat atgctgaaag atataaagcc gttgcggata aatatgacgt tgacctatca 3240
gagatagacc atcagttaat gatattagtt aactataacg aagatagtaa taaagctaaa 3300
caagagacgc gtgcatttat tagtgattat gttcttgaaa tgcaccctaa tgaaaatttc 3360
gaaaataaac ttgaagaaat aattgcagaa aacgctgtcg gaaattatac ggagtgtata 3420
actgcggcta agttggcaat tgaaaagtgt ggtgcgaaaa gtgtattgct gtactttgaa 3480
ccaatgaatg atttgatgag ccaaaaaaat gtaatcaata ttgttgatga taatattaag 3540
aagtaccaca cggaatatac ctaaacttaa ttaacggcac tcctcagcaa atataatgac 3600
cctcttgata acccaagagg gcatttttta atgcccatgg aagggcctcg tgatacgcct 3660
atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg 3720
gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 3780
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 3840
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 3900
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 3960
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4020
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat 4080
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4140
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 4200
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 4260
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 4320
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 4380
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 4440
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 4500
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 4560
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 4620
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 4680
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 4740
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 4800
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 4860
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 4920
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 4980
tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt agttaggcca 5040
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5100
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 5160
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 5220
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 5280
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 5340
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 5400
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 5460
cagcaacgcg gccgctaggt ctagggcggc ggatttgtcc tactcaggag agcgttcacc 5520
gacaaacaac agataaaacg aaaggcccag tctttcgact gagcctttcg ttttatttg 5579
<210> 6
<211> 3428
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ctttacagct agctcagtcc tagggactgt gctagcgaat tctagagaaa gaggagaaac 60
tcgagatgga acgtcgccgt cgcccgaccc tggaaatggt tgcagccctg gccggtgtct 120
gtcgtggtac ggtgagccgc gttattaacg gtagcgatca ggtctctccg gcgacccgtg 180
aagccgtgaa acgcgcaatc aaagaactgg gctatgtgcc gaatcgtgca gctcgtaccc 240
tggtgacccg tcgtaccgat acggttgcac tggtggtttc tgaaaacaat cagaaactgt 300
ttgctgaacc gttctacgcg ggtattgtgc tgggtgttgg tgtcgcactg agcgaacgtg 360
gctttcaatt cgttctggca accggccgtt ctggtatcga acatgaacgc ctgggcggtt 420
atctggcagg ccagcatgtc gatggtgtgc tgctgctgtc actgcaccgc gatgacccgc 480
tgccgcaaat gctggacgaa gcgggcgttc cgtatgtcta tggcggtcgt ccgctgggtg 540
tgccggaaga acaggtgtcg tacgttgata ttgacaacat cggtggtggc cgtcaggcaa 600
cccaacgtct gattgaaacg ggtcaccgtc gtattgcaac catcgcaggt ccgcaggata 660
tggtcgctgg cgtggaacgt ctgcaaggtt atcgcgaagc cctgctggcg gccggtatgg 720
aatacgacga aaccctggtt agttatggcg attttacgta cgactccggt gtcgcagcta 780
tgcgtgaact gctggatcgt gcgccggatg ttgacgcagt cttcgcagcc agtgacctga 840
tgggcctggc agctctgcgt gttctgcgtg cttccggtcg tcgcgtcccg gaagatgtgg 900
cagtcgtggg ttatgatgac tcaaccgtgg cagaacatgc tgaaccgccg atgacctcgg 960
ttaatcagcc gacggaactg atgggtcgtg aaatggcgcg cctgctggtg gatcgtatca 1020
ccggtgaaac cacggaaccg gtgcgcctgg ttatggaaac gcacctgatg gttcgtgaat 1080
caggctaact gcaggtccct aagtctcctc agcaaaacga aaggcccagt ctttcgactg 1140
agcctttcgt tttatttgac cggatgtcct cttgttcatc atcagtaacc cgtatcgtga 1200
gcatcctctc tcgtttcatc ggtatcatta cccccatgaa cagaaatccc ccttacacgg 1260
aggcatcagt gaccaaacag gaaaaaaccg cccttaacat ggcccgcttt atcagaagcc 1320
agacattaac gcttctggag aaactcaacg agctggacgc ggatgaacag gcagacatct 1380
gtgaatcgct tcacgaccac gctgatgagc tttaccgcag ctgcctcgcg cgtttcggtg 1440
atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag 1500
cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg 1560
gcgcagccat gacccagtca cgtagcgata gcggagtgta tactggctta actatgcggc 1620
atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt 1680
aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 1740
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 1800
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 1860
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 1920
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 1980
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 2040
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 2100
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 2160
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 2220
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 2280
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 2340
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga ggtggtagct cttgatccgg 2400
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 2460
aaaaaaagga tctcaaacgg cctatttggc ctatttttct aaatacattc aaatatgtat 2520
ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 2580
agggaagcgg tgatcgccga agtatcgact caactatcag aggtagttgg cgtcatcgag 2640
cgccatctcg aaccgacgtt gctggccgta catttgtacg gctccgcagt ggatggcggc 2700
ctgaagccac acagtgatat tgatttgctg gttacggtga ccgtaaggct tgatgaaaca 2760
acgcggcgag ctttgatcaa cgaccttttg gaaacttcgg cttcccctgg agagagcgag 2820
attctccgcg ctgtagaagt caccattgtt gtgcacgacg acatcattcc gtggcgttat 2880
ccagctaagc gcgaactgca atttggagaa tggcagcgca atgacattct tgcaggtatc 2940
ttcgagccag ccacgatcga cattgatctg gctatcttgc tgacaaaagc aagagaacat 3000
agcgttgcct tggtaggtcc agcggcggag gaactctttg atccggttcc tgaacaggat 3060
ctatttgagg cgctaaatga aaccttaacg ctatggaact cgccgcccga ctgggctggc 3120
gatgagcgaa atgtagtgct tacgttgtcc cgcatttggt acagcgcagt aaccggcaaa 3180
atcgcgccga aggatgtcgc tgccgactgg gcaatggagc gcctgccggc ccagtatcag 3240
cccgtcatac ttgaagctag acaggcttat cttggacaag aagaagatcg cttggcctcg 3300
cgcgcagatc agttggaaga atttgtccac tacgtgaaag gcgagatcac caaggtagtc 3360
ggcaaataaa cgccatggca aataaaacga aaggctcagt cgaaagactg ggcctttcgt 3420
tttggtac 3428
<210> 7
<211> 6537
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
cactcggtcg ctacgctccg ggcgtgagac tgcggcgggc gctgcggaca catacaaagt 60
tacccacaga ttccgtggat aagcagggga ctaacatgtg aggcaaaaca gcagggccgc 120
gccggtggcg tttttccata ggctccgccc tcctgccaga gttcacataa acagacgctt 180
ttccggtgca tctgtgggag ccgtgaggct caaccatgaa tctgacagta cgggcgaaac 240
ccgacaggac ttaaagatcc ccaccgtttc cggcgggtcg ctccctcttg cgctctcctg 300
ttccgaccct gccgtttacc ggatacctgt tccgcctttc tcccttacgg gaagtgtggc 360
gctttctcat agctcacaca ctggtatctc ggctcggtgt aggtcgttcg ctccaagctg 420
ggctgtaagc aagaactccc cgttcagccc gactgctgcg ccttatccgg taactgttca 480
cttgagtcca acccggaaaa gcacggtaaa acgccactgg cagcagccat tggtaactgg 540
gagttcgcag aggatttgtt tagctaaaca cgcggttgct cttgaagtgt gcgccaaagt 600
ccggctacac tggaaggaca gatttggttg ctgtgctctg cgaaagccag ttaccacggt 660
taagcagttc cccaactgac ttaaccttcg atcaaaccac ctccccaggt ggttttttcg 720
tttacagggc aaaagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 780
tctactgaac cgctctagat ttcagtgcaa tttatctctt caaatgtagc acctgaagtc 840
agcccaggag gaagaggaca tccggtcaaa taaaacgaaa ggctcagtcg aaagactggg 900
cctttcgttt tagacttagg gaccctttat gacaacttga cggctacatc attcactttt 960
tcttcacaac cggcacggaa ctcgctcggg ctggccccgg tgcatttttt aaatacccgc 1020
gagaaataga gttgatcgtc aaaaccaaca ttgcgaccga cggtggcgat aggcatccgg 1080
gtggtgctca aaagcagctt cgcctggctg atacgttggt cctcgcgcca gcttaagacg 1140
ctaatcccta actgctggcg gaaaagatgt gacagacgcg acggcgacaa gcaaacatgc 1200
tgtgcgacgc tggcgatatc aaaattgctg tctgccaggt gatcgctgat gtactgacaa 1260
gcctcgcgta cccgattatc catcggtgga tggagcgact cgttaatcgc ttccatgcgc 1320
cgcagtaaca attgctcaag cagatttatc gccagcagct ccgaatagcg cccttcccct 1380
tgcccggcgt taatgatttg cccaaacagg tcgctgaaat gcggctggtg cgcttcatcc 1440
gggcgaaaga accccgtatt ggcaaatatt gacggccagt taagccattc atgccagtag 1500
gcgcgcggac gaaagtaaac ccactggtga taccattcgc gagcctccgg atgacgaccg 1560
tagtgatgaa tctctcctgg cgggaacagc aaaatatcac ccggtcggca aacaaattct 1620
cgtccctgat ttttcaccac cccctgaccg cgaatggtga gattgagaat ataacctttc 1680
attcccagcg gtcggtcgat aaaaaaatcg agataaccgt tggcctcaat cggcgttaaa 1740
cccgccacca gatgggcatt aaacgagtat cccggcagca ggggatcatt ttgcgcttca 1800
gccatacttt tcatactccc accattcaga gaagaaacca attgtccata ttgcatcaga 1860
cattgccgtc actgcgtctt ttactggctc ttctcgctaa cccaaccggt aaccccgctt 1920
attaaaagca ttctgtaaca aagcgggacc aaagccatga caaaaacgcg taacaaaagt 1980
gtctataatc acggcagaaa agtccacatt gattatttgc acggcgtcac actttgctat 2040
gccatagcat ttttatccat aagattagcg gatcctacct gacgcttttt atcgcaactc 2100
tctactgttt ctccataccc gtttttttgg acgcgtacaa ctcaagtctg acataaatga 2160
ccgctatgag cactgcaatt acacgccaga tcgttctcgc taccgcaacc accggtatga 2220
accagattgg tgcgcactat gaaggccaca agatcattga gattggtgcc gttgaagtgg 2280
tgaaccgtcg cctgacgggc aataacttcc atgtttatct caaacccgat cggctggtgg 2340
atccggaagc ctttggcgta catggtattg ccgatgaatt tttgctcgat aagcccacgt 2400
ttgccgaagt agccgatgag ttcatggact atattcgcgg cgcggagttg gtgatccata 2460
acgcagcgtt cgatatcggc tttatggact acgagttttc gttgcttaag cgcgatattc 2520
cgaagaccaa tactttctgt aaggtcaccg atagccttgc ggtggcgagg aaaatgtttc 2580
ccggtaagcg caacagcctc gatgcgttat gtgctcgcta cgaaatagat aacagtaaac 2640
gaacgctgca cggggcatta ctcgatgccc agatccttgc ggaagtttat ctggcgatga 2700
ccggtggtca aacgtcgatg gcttttgcga tggaaggaga gacacaacag caacaaggtg 2760
aagcaacaat tcagcgcatt gtacgtcagg caagtaagtt acgcgttgtt tttgcgacag 2820
atgaagagat tgcagctcat gaagcccgtc tcgatctggt gcagaagaaa ggcggaagtt 2880
gcctctggcg agcataattt aatatcagta aaccggacat aacccatgaa gaaaaatcgc 2940
gcttttttga agtgggcagg gggcaagtat cccctgcttg atgatattaa acggcatttg 3000
cccaagggcg aatgtctggt tgagcctttt gtaggtgccg ggtcggtgtt tctcaacacc 3060
gacttttctc gttatatcct tgccgatatc aatagcgacc tgatcagtct ctataacatt 3120
gtgaagatgc gtactgatga gtacgtacag gccgcacgcg agctgtttgt tcccgaaaca 3180
aattgcgccg aggtttacta tcagttccgc gaagagttca acaaaagcca ggatccgttc 3240
cgtcgggcgg tactgttttt atatttgaac cgctacggtt acaacggcct gtgtcgttac 3300
aatctgcgcg gtgagtttaa cgtgccgttc ggccgctaca aaaaacccta tttcccggaa 3360
gcagagttgt atcacttcgc tgaaaaagcg cagaatgcct ttttctattg tgagtcttac 3420
gccgatagca tggcgcgcgc agatgatgca tccgtcgtct attgcgatcc gccttatgca 3480
ccgctgtctg cgaccgccaa ctttacggcg tatcacacaa acagttttac gcttgaacaa 3540
caagcgcatc tggcggagat cgccgaaggt ctggttgagc gccatattcc agtgctgatc 3600
tccaatcacg atacgatgtt aacgcgtgag tggtatcagc gcgcaaaatt gcatgtcgtc 3660
aaagttcgac gcagtataag cagcaacggc ggcacacgta aaaaggtgga cgaactgctg 3720
gctttgtaca aaccaggagt cgtttcaccc gcgaaaaaat aattcagcta agacactgca 3780
ctggattaag atgaaaacga ttgaagttga tgatgaactc tacagctata ttgccagcca 3840
cactaagcat atcggcgaga gcgcatccga cattttacgg cgtatgttga aattttccgc 3900
cgcatcacag cctgctgctc cggtgacgaa agaggttcgc gttgcgtcac ctgctatcgt 3960
cgaagcgaag ccggtcaaaa cgattaaaga caaggttcgc gcaatgcgtg aacttctgct 4020
ttcggatgaa tacgcagagc aaaagcgagc ggtcaatcgc tttatgctgc tgttgtctac 4080
actatattct cttgacgccc aggcgtttgc cgaagcaacg gaatcgttgc acggtcgtac 4140
acgcgtttac tttgcggcag atgaacaaac gctgctgaaa aatggtaatc agaccaagcc 4200
gaaacatgtg ccaggcacgc cgtattgggt gatcaccaac accaacaccg gccgtaaatg 4260
cagcatgatc gaacacatca tgcagtcgat gcaattcccg gcggaattga ttgagaaggt 4320
ttgcggaact atctaaactt aattaacggc actcctcagc caagtcaaaa gcctccgacc 4380
ggaggctttt gactacatgc ccatggcgtt tacgccccgc cctgccactc atcgcagtac 4440
tgttgtaatt cattaagcat tctgccgaca tggaagccat cacaaacggc atgatgaacc 4500
tgaatcgcca gcggcatcag caccttgtcg ccttgcgtat aatatttgcc catagtgaaa 4560
acgggggcga agaagttgtc catattggcc acgtttaaat caaaactggt gaaactcacc 4620
cagggattgg ctgagacgaa aaacatattc tcaataaacc ctttagggaa ataggccagg 4680
ttttcaccgt aacacgccac atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg 4740
tggtattcac tccagagcga tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa 4800
gggtgaacac tatcccatat caccagctca ccgtctttca ttgccatacg gaactccgga 4860
tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt gtgcttattt 4920
ttctttacgg tctttaaaaa ggccgtaata tccagctgaa cggtctggtt ataggtacat 4980
tgagtaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga tatatcaacg 5040
gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgat 5100
aactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt 5160
acgtgccaag ccaaataggc cgtnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5220
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5280
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5340
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5400
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5460
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5520
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5580
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5640
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5700
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5760
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5820
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5880
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5940
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6000
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6060
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6480
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnn 6537

Claims (6)

1.一种高效转运纤维二糖的LacY突变体,其特征在于,所述LacY突变体为对野生型LacY进行以下位点突变:A177V/R142C、A177V/L62M或A177V/R142C/L62M,所述野生型LacY的氨基酸序列如SEQ ID NO:1所示。
2.一种高效转运纤维三糖的LacY突变体,其特征在于,所述LacY突变体为对野生型LacY进行以下位点突变:A177V/F140Y或A177V/F140Y/R142C,所述野生型LacY的氨基酸序列如SEQ ID NO:1所示。
3.一种高效转运纤维四糖的LacY突变体,其特征在于,所述LacY突变体为对野生型LacY进行以下位点突变:A177T/R142C、A177V/G150S或A177V/V326I,所述野生型LacY的氨基酸序列如SEQ ID NO:1所示。
4.权利要求1所述的高效转运纤维二糖的LacY突变体在转运纤维二糖上应用。
5.权利要求2所述的高效转运纤维三糖的LacY突变体在转运纤维三糖上应用。
6.权利要求3所述的高效转运纤维四糖的LacY突变体在转运纤维四糖上应用。
CN201910075523.5A 2018-12-05 2019-01-25 纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其制备方法和应用 Active CN111269294B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201811482982 2018-12-05
CN2018114829827 2018-12-05

Publications (2)

Publication Number Publication Date
CN111269294A CN111269294A (zh) 2020-06-12
CN111269294B true CN111269294B (zh) 2023-03-28

Family

ID=70995144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910075523.5A Active CN111269294B (zh) 2018-12-05 2019-01-25 纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其制备方法和应用

Country Status (1)

Country Link
CN (1) CN111269294B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112210564A (zh) * 2020-10-20 2021-01-12 广西科学院 一种短双歧杆菌纤维寡糖转运蛋白基因
CN112239489B (zh) * 2020-10-20 2021-06-25 广西科学院 一种海栖热袍菌纤维寡糖转运蛋白、其编码基因及应用
CN112142832A (zh) * 2020-10-20 2020-12-29 广西科学院 一种链霉菌纤维寡糖转运蛋白基因
CN114807201B (zh) * 2021-12-15 2024-02-09 广州先进技术研究所 一种纤维寡糖转运蛋白及其制备方法和应用
CN114807202A (zh) * 2021-12-15 2022-07-29 广州先进技术研究所 噬菌体辅助的纤维寡糖转运蛋白连续定向进化系统和方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104603274A (zh) * 2012-08-05 2015-05-06 Absci有限责任公司 可诱导共表达系统
CN107418964A (zh) * 2016-05-24 2017-12-01 中国科学院深圳先进技术研究院 一种噬菌体辅助的多细菌连续定向进化系统和方法
CN107849572A (zh) * 2015-06-16 2018-03-27 Absci有限责任公司 用于可诱导共表达系统中的载体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140087435A1 (en) * 2012-08-13 2014-03-27 Georgia Tech Research Corporation Novel Microbial Biocatalysts That Enables Use Of Cellodextrin As Biofuel

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104603274A (zh) * 2012-08-05 2015-05-06 Absci有限责任公司 可诱导共表达系统
CN107849572A (zh) * 2015-06-16 2018-03-27 Absci有限责任公司 用于可诱导共表达系统中的载体
CN107418964A (zh) * 2016-05-24 2017-12-01 中国科学院深圳先进技术研究院 一种噬菌体辅助的多细菌连续定向进化系统和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Characterization of Escherichia coli lactose carrier mutants that transport protons without a cosubstrate. Probes for the energy barrier to uncoupled transport;Steven C.King等;《THE JOURNAL OF BIOLOGICAL CHEMISTRY》;19900615;第265卷(第17期);第9650页右栏第1段 *
Steven C.King等.Characterization of Escherichia coli lactose carrier mutants that transport protons without a cosubstrate. Probes for the energy barrier to uncoupled transport.《THE JOURNAL OF BIOLOGICAL CHEMISTRY》.1990,第265卷(第17期),第9650页右栏第1段. *

Also Published As

Publication number Publication date
CN111269294A (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
CN111269294B (zh) 纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其制备方法和应用
CN109943581B (zh) 一种质粒以及噬菌体辅助的连续定向进化系统和定向进化方法
KR101106253B1 (ko) 사이코스 3-에피머라제 효소를 코딩하는 폴리뉴클레오티드를 포함하는 대장균 및 그를 이용하여 사이코스를 생산하는 방법
CN104498493B (zh) CRISPR/Cas9特异性敲除乙型肝炎病毒的方法以及用于特异性靶向HBV DNA的gRNA
CN111235080B (zh) 基因重组大肠杆菌及5-羟色胺的生产方法
CN112111469B (zh) γ-谷氨酰激酶突变体及其应用
KR20170076650A (ko) 락토스 사멸에 내성인 돌연변이 미생물
CN112813037B (zh) 一种高效感染原代小胶质细胞的重组突变腺相关病毒及其相关生物材料
KR20100037031A (ko) 유전자 녹아웃 중온성 및 호열성 생물체, 및 이의 사용 방법
CN111154707B (zh) 基因工程化大肠杆菌及褪黑素的生产方法
CN110582567A (zh) 经遗传修饰的表达海藻糖酶的酵母及使用此类经遗传修饰的酵母的发酵方法
CN107988250B (zh) 一种通用型衣藻外源基因表达载体构建方法
CN114807201B (zh) 一种纤维寡糖转运蛋白及其制备方法和应用
KR102320656B1 (ko) 아세틴 화합물의 생물학적 제조 방법
CN104278031B (zh) 一种受黄嘌呤调控的启动子a及其重组表达载体和应用
CN111269822A (zh) 一种多功能高通量定向进化系统及定向进化方法
CN110241098A (zh) 酿脓链球菌的CRISPR核酸酶SpCas9的截短型高特异性变异体及其应用
CN106479928B (zh) 一株耐高盐耐高cod盐水球菌菌株和来源该菌株的内源质粒
CN113201514A (zh) 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用
CN111909914B (zh) 核酸内切酶SpCas9的高PAM兼容性截短型变异体txCas9及其应用
CN106636023B (zh) 一种增强zwf基因启动子表达强度的方法
CN113736764A (zh) 一种包含氨肽酶Amp0279编码序列的重组质粒、重组谷氨酸棒状杆菌及应用
CN113444708B (zh) 一种用于药物皮下注射制剂的透明质酸酶突变体
CN108410900B (zh) 无抗性植物乳杆菌锚定表达载体pLPSa及其制备方法
CN109136228A (zh) 长链非编码rna-nkila在骨组织损伤修复中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant