CN114958760A

CN114958760A - 一种构建阿尔兹海默症模型猪的基因编辑技术及其应用

Info

Publication number: CN114958760A
Application number: CN202110200940.5A
Authority: CN
Inventors: 牛冬; 汪滔; 马翔; 刘瑜; 曾为俊; 王磊; 程锐; 黄彩云; 赵泽英; 陶裴裴; 段星; 刘璐
Original assignee: Nanjing Qizhen Genetic Engineering Co Ltd
Current assignee: Nanjing Qizhen Genetic Engineering Co Ltd
Priority date: 2021-02-23
Filing date: 2021-02-23
Publication date: 2022-08-30
Anticipated expiration: 2041-02-23
Also published as: CN114958760B

Abstract

本发明提供了一种表达人BACE1和/或人显性突变APP的猪细胞和由该猪细胞通过体细胞克隆技术获得的阿尔茨海默症模型猪及其构建方法和在生物医药领域的应用。其中包括将编码人BACE1和/或人显性突变APP的核苷酸序列插入猪安全港位点，获得表达SEQ ID NO：14所示人BACE1和/或SEQ ID NO：16所示人显性突变APP的猪细胞和阿尔茨海默症模型猪，所述的猪安全港位点选自猪ROSA26、AAVS1、H11或COL1A1安全港位点。本申请研究对象应用性好，猪细胞中目的基因的表达量高、基因编辑效率高。

Description

一种构建阿尔兹海默症模型猪的基因编辑技术及其应用

技术领域

本发明涉及基因编辑技术领域，具体涉及一种采用CRISPR/Cas9系统及同源重组技术构建的在基因组中的特定位置整合并由神经组织特异性表达启动子Syn驱动表达人BACE1和/或人显性突变 APP的猪重组细胞，该重组猪细胞被用于克隆生产阿尔茨海默症模型猪，该模型猪可用于下一步的药物筛选及药效评价、基因及细胞治疗、阿尔茨海默症发病机制的研究等生物医药领域。

背景技术

阿尔兹海默症(alzheimer disease，AD)是一种起病隐匿的进行性发展的神经系统退行性疾病。迄今为止，尚无可用于检测AD的可靠外周生化指标，只有在尸体解剖时对大脑进行组织学检查才能做出明确的诊断。在全球范围内约有5000万人患有AD，且每年有近1000万的新发病例。在我国，目前有1000多万的 AD患者，且随着我国的老龄化程度的加剧，这个数字将预计在2050年达到2800万。一直以来都没有特别针对AD的有效药物，患者只能通过一些神经类药物延缓病程。

AD可能是一组异质性疾病，在多种因素(包括生物和社会心理因素)的作用下才发病。从目前研究来看，该病的可能因素和假说多达30余种，其中最主要的假说为β-淀粉样蛋白(Aβ)的生成与积累导致的对神经细胞的损害。Aβ一般通过几种酶的活性形成，其中包括β-分泌酶1(BACE1)。临床试验表明，大部分的阿尔茨海默病患者的BACE1表达水平均有增高，从而导致产生更多的Aβ， BACE1不止生成Aβ，还能破坏细胞生成PKA(蛋白激酶A)功能所需的因子，而PKA在记忆生成中起到重要作用。另一方面，Aβ前体蛋白(APP)的过度合成，特别是显性突变的APP将会加速Aβ的积累，从而增加AD的患病风险，这与遗传性早发AD密切相关。

一直以来，AD新疗法的进展都极其有限，目前还没有有效的治疗手段。目前的研究方向主要包括开发基因治疗、干细胞移植、神经保护性物质以及寻找新的模式生物，其中AD动物模型的构建在 AD治疗研究中具有重要的基础支撑作用。AD目前在除人类以外的其他动物中尚未发现，但通常会采用Aβ(25-35)等药物诱发实验动物来产生AD用以研究，但是这种方式产生的动物模型无法遗传。对于BACE1和APP基因，目前的研究主要在于其对AD的影响、AD中BACE1和APP蛋白的表达情况以及抑制这两种蛋白的表达在制药中的用途(例如专利CN103816540B)，但是现有技术中并没有采用该两种基因的过表达诱导动物模型的存在，更没有现有技术证实将人源BACE1和显性突变APP 基因导入非人动物后是否可以诱导产生可以稳定遗传的AD动物模型。

目前，动物模型主要以小鼠模型为主，但是小鼠不论从体型、器官大小、生理、病理等方面都与人相差巨大，不能真实地模拟人类正常的生理、病理状态。而猪作为大动物，是人类长期以来主要的肉食供应动物，其体型大小和生理功能与人类近似，易于大规模繁殖饲养，而且在伦理道德及动物保护等方面要求较低，是理想的人类疾病模型动物。

因此，本发明采用基因编辑技术及人神经组织特异启动子Syn(hSyn)构建了神经组织特异表达人BACE1和显性突变APP的猪重组细胞，为AD模型猪生产提供核移植供体细胞，所得到的模型猪将成为研究AD疾病发生机制和药物开发的有力工具。

发明内容

本发明的第一方面，提供了一种表达人BACE1(β-分泌酶1)和/或人显性突变APP(Aβ前体蛋白)的猪细胞，将编码人BACE1和/或人显性突变APP的核苷酸序列插入猪安全港位点，获得表达 SEQ ID NO：14所示人BACE1和/或SEQ ID NO：16所示人显性突变APP的猪细胞。

优选的，插入的编码人BACE1和/或人显性突变APP的核苷酸序列可以为人BACE1和/或人显性突变APP的CDS序列或者cDNA序列。

优选的，所述的编码人BACE1的核苷酸序列如SEQ ID NO：15所示。

优选的，所述的人BACE1的氨基酸序列如SEQ ID NO：14所示。

进一步优选的，所述的编码人显性突变APP的核苷酸序列如SEQ ID NO：17所示。

优选的，所述的人显性突变APP的氨基酸序列如SEQ ID NO：16所示。

优选的，所述的猪安全港位点选自猪ROSA26、AAVS1、H11或COL1A1安全港位点。

在本发明的一个具体实施方式中，ROSA26安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO：43所示，AAVS1安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO：44所示，H11安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO：45所示， COL1A1安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO：46所示。

进一步优选的，所述的猪最佳安全港位点为COL1A1位点。

优选的，所述的编码人BACE1和/或人显性突变APP的核苷酸序列在猪细胞中通过外源启动子调控，所述的外源启动子为人hSyn启动子。所述的人hSyn启动子驱动编码人BACE1和/ 或人显性突变APP的核苷酸序列在神经组织中特异表达。

人神经元内特异表达一种Synapsin I(Syn I)的蛋白，该蛋白由hSyn1基因编码，选择其启动子 (即Syn启动子)作为神经元细胞的特异启动子，用来驱动外源基因可以仅在神经组织中表达。因此， Syn启动子是研究神经系统生理、病理功能的有力工具。

在本发明的一个具体实施方式中，所述的编码人BACE1和/或人显性突变APP的核苷酸序列在猪细胞中通过人hSyn启动子驱动，所述的人hSyn启动子的核苷酸序列如SEQ IDNO：47 所示。

优选的，所述的猪细胞为猪的体细胞。进一步优选可以用于体细胞核移植技术的任意猪的体细胞。

优选的，所述的猪细胞可以为神经元细胞、神经胶质细胞、乳腺细胞、胚胎干细胞、成体干细胞、造血干细胞、骨髓间充质干细胞、神经干细胞、肝干细胞、肌肉卫星细胞、皮肤表皮干细胞、肠上皮干细胞、视网膜干细胞、胰腺干细胞、成纤维细胞、肌细胞、胶质细胞、脂肪细胞或生殖细胞等等。

在本发明的一个具体实施方式中，所述的猪细胞为猪成纤维细胞或神经细胞(优选为神经元细胞或神经胶质细胞)。

本发明的第二方面，提供了一种上述的猪细胞的构建方法，将编码人BACE1和/或人显性突变APP的核苷酸序列插入猪安全港位点，获得表达SEQ ID NO：14所示的人BACE1和/或SEQ ID NO：16所示的人显性突变APP的猪细胞。

具体可以采用基于同源重组的基因编辑、基于核酸酶的ZFN、TALEN、CRISPR/Cas9等编辑技术。

优选的，所述的构建方法包括使用安全港位点载体将编码人BACE1和/或人显性突变APP 的核苷酸序列插入猪安全港位点，所述的安全港位点载体包含编码人BACE1和/或人显性突变 APP的核苷酸序列和安全港位点载体骨架，所述的安全港位点载体骨架包含安全港插入位点的5’同源臂和3’同源臂，所述的编码人BACE1和/或人显性突变APP的核苷酸序列位于5’同源臂与3’同源臂之间，所述的安全港位点载体骨架选自下列任一项所示：

A)ROSA26安全港位点载体骨架，其5’同源臂如SEQ ID NO：5所示，3’同源臂如SEQID NO：6所示。优选的，所述的ROSA26安全港位点载体骨架的核苷酸序列如SEQ ID NO：4 所示。

B)AAVS1安全港位点载体骨架，其5’同源臂如SEQ ID NO：7所示，3’同源臂如SEQID NO：8所示。优选的，所述的AAVS1安全港位点载体骨架的核苷酸序列为将SEQ ID NO：4中ROSA26的5’同源臂和3’同源臂替换为AAVS1的5’同源臂和3’同源臂。

C)H11安全港位点载体骨架，其5’同源臂如SEQ ID NO：9所示，3’同源臂如SEQ IDNO：10所示。优选的，所述的H11安全港位点载体骨架的核苷酸序列为将SEQ ID NO：4中ROSA26的5’同源臂和3’同源臂替换为H11的5’同源臂和3’同源臂。

或D)COL1A1安全港位点载体骨架，其5’同源臂如SEQ ID NO：11所示，3’同源臂如SEQ ID NO：12所示。优选的，所述的COL1A1安全港位点载体骨架的核苷酸序列为将SEQ IDNO：4中ROSA26的5’同源臂和3’同源臂替换为COL1A1的5’同源臂和3’同源臂。

进一步优选的，所述的猪最佳安全港位点载体骨架为COL1A1安全港位点载体骨架。

优选的，所述的安全港位点载体还包含启动子、信号分子以及编码EGFP蛋白、mCherry 蛋白和puro抗性蛋白的核苷酸序列。其中，所述的启动子为EF-1α启动子、PGK启动子和/或pCAG 启动子。所述的信号分子为EF-1αpoly(A)信号、bGH poly(A)信号和/或β-globin poly(A)信号。进一步优选还包含绝缘子区域。

在本发明的一个具体实施方式中，所述的安全港位点载体骨架从5’至3’依次包括5’同源臂、绝缘子区域、EF-1αpoly(A)信号、编码EGFP的核苷酸序列、EF-1α启动子、绝缘子区域、 PGK启动子、编码mCherry的核苷酸序列、bGH poly(A)信号、loxP-puro-loxP表达框区域、绝缘子区域、β-globin poly(A)信号、pCAG启动子、绝缘子区域、3’同源臂。

在本发明的一个具体实施方式中，所述的COL1A1安全港位点载体的核苷酸序列如SEQ ID NO：13所示。

优选的，使用sgRNA载体进行猪细胞的构建，所述的sgRNA载体包含靶向ROSA26、AAVS1、 H11或COL1A1安全港位点的sgRNA，其中：

靶向ROSA26的sgRNA的核苷酸序列如SEQ ID NO：23所示，靶向AAVS1的sgRNA的核苷酸序列如SEQ ID NO：24所示，靶向H11的sgRNA的核苷酸序列如SEQ ID NO：25所示，靶向COL1A1的sgRNA的核苷酸序列如SEQ ID NO：26所示。

优选的，所述的sgRNA载体还包含骨架载体，所述的骨架载体的核苷酸序列为SEQID NO： 3。

优选的，使用Cas载体进行猪细胞的构建，所述的Cas载体包含编码Cas蛋白、EGFP和Puro 蛋白的核苷酸序列，其中，所述的Cas载体还包含EF1a启动子、CMV增强子、WPRE元件和3’ LTR序列元件，优选的，所述的Cas载体的核苷酸序列从5’-3’依次为：CMV增强子、EF1a启动子、核定位信号、核定位信号、编码Cas蛋白的核苷酸序列、核定位信号，核定位信号、编码自剪切多肽P2A的核苷酸序列、编码EGFP的核苷酸序列、编码自裂解多肽T2A的核苷酸序列、编码Puro蛋白的核苷酸序列、WPRE序列元件、3’LTR序列元件和polyA信号序列元件。

所述的Cas蛋白选自Casl、CaslB、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、 Cas6、Cas7、Cas8、Cas9、CaslO、Csyl、Csy2、Csy3、Csy4、Csel、Cse2、Cse3、Cse4、Cse5e、 Cscl、Csc2、Csa5、Csnl、Csn2、Csml、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csx17、Csx14、CsxlO、Csx16、CsaX、Csx3、Csxl、CsxlS、 Csfl、Csf2、CsO、Csf4、Csdl、Csd2、Cstl、Cst2、Cshl、Csh2、Csal、Csa2、Csa3、Csa4、Csa5、 C2cl、C2c2、C2c3、Cpfl、CARF、DinG、其同源物或其修饰形式，优选为Cas9。进一步优选的，所述的Cas载体的核苷酸序列如SEQ ID NO：1或2所示，更进一步优选的，所述的Cas载体的核苷酸序列如SEQ ID NO：2所示。

为了增加Cas9质粒的基因编辑能力，本发明在购自addgene(Plasmid#42230，fromZhang Feng lab)pX330-U6-Chimeric_BB-CBh-hSpCas9(简称PX330)载体的基础上进行改造得到 pU6gRNA-eEF1a-mNLS-hSpCas9-EGFP-PURO(简称为pKG-GE3)。PX330的图谱如图1，改造方式如下：

1)去除原载体gRNA骨架中多余无效的序列；

2)改造启动子：将原有启动子(chickenβ-actin启动子)改造为具更高表达活性的EF1a启动子，增加Cas9基因的蛋白表达能力；

3)增加核定位信号：在Cas9的N端及C端均增加核定位信号编码序列(NLS)，增加Cas9 的核定位能力；

4)增加双筛选标记：原载体无任何筛选标记，不利于阳性转化细胞的筛选和富集，在Cas9 的C端，插入P2A-EGFP-T2A-PURO，赋予载体荧光和抗性筛选能力；

5)插入WPRE和3’LTR等调控基因表达的序列：在基因读码框最后插入WPRE、3’LTR等序列，可增强Cas9基因的蛋白翻译能力。

改造后载体pU6gRNA-eEF1a-mNLS-hSpCas9-EGFP-PURO(简称pKG-GE3)及改造位点如图2，质粒全序列如SEQ ID NO：2所示；pKG-GE3的主要元件有：

1)gRNA表达元件：U6 gRNA scaffold；

2)启动子：EF1a启动子和CMV增强子；

3)含多个NLS的Cas9基因：含N端和C端多核定位信号(NLS)的Cas9基因；

4)筛选标记基因：荧光和抗性双筛选标记元件P2A-EGFP-T2A-PURO；

5)增强翻译的元件：WPRE和3’LTR增强Cas9及筛选标记基因的翻译效率；

6)转录终止信号：bGHpolyA signal；

7)载体骨架：包括Amp抗性元件和ori复制子等。

质粒pKG-GE3中，具有特异融合基因；所述特异融合基因编码特异融合蛋白；

所述特异融合蛋白自N端至C端依次包括如下元件：两个核定位信号(NLS)、Cas9蛋白、两个核定位信号、自剪切多肽P2A、荧光报告蛋白、自裂解多肽T2A、抗性筛选标记蛋白；

质粒pKG-GE3中，由EF1a启动子启动所述特异融合基因的表达；

质粒pKG-GE3中，所述特异融合基因下游具有WPRE序列元件、3’LTR序列元件和bGHpoly(A)signal序列元件。

质粒pKG-GE3中，依次具有如下元件：CMV增强子、EF1a启动子、所述特异融合基因、WPRE序列元件、3’LTR序列元件、bGH poly(A)signal序列元件。

所述特异融合蛋白中，Cas9蛋白上游的两个核定位信号为SV40核定位信号，Cas9蛋白下游的两个核定位信号为nucleoplasmin核定位信号。

所述特异融合蛋白中，荧光报告蛋白具体可为EGFP蛋白。

所述特异融合蛋白中，抗性筛选标记蛋白具体可为Puromycin蛋白。

自剪切多肽P2A的氨基酸序列为“ATNFSLLKQAGDVEENPGP”(发生自剪切的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)。

自裂解多肽T2A的氨基酸序列为“EGRGSLLTCGDVEENPGP”(发生自裂解的断裂位置为 C端开始第一个氨基酸残基和第二个氨基酸残基之间)。

特异融合基因具体如SEQ ID NO：2中第911-6706位核苷酸所示。

CMV增强子如SEQ ID NO：2中第395-680位核苷酸所示。

EF1a启动子如SEQ ID NO：2中第682-890位核苷酸所示。

WPRE序列元件如SEQ ID NO：2第6722-7310位核苷酸所示。

3’LTR序列元件如SEQ ID NO：2中第7382-7615位核苷酸所示。

bGH poly(A)signal序列元件如SEQ ID NO：2中第7647-7871位核苷酸所示。

优选的，所述的安全港位点载体、sgRNA载体或Cas载体均为环状质粒。

在本发明的一个具体实施方式中，所述的构建方法包括将安全港位点载体、sgRNA载体和 Cas载体共转染至猪细胞。

本发明的第三方面，提供了一种包含上述猪细胞的组织或器官。

优选的，所述的组织可以为神经组织。进一步优选为脑组织或海马组织或中枢神经组织或周围神经组织。

优选的，所述的器官为脑或脊髓。

本发明的第四方面，提供了一种表达人BACE1和/或人显性突变APP的模型猪的构建方法，将编码人BACE1和/或人显性突变APP的核苷酸序列插入猪安全港位点，获得表达SEQ ID NO： 14所示的人BACE1和/或SEQ ID NO：16所示的人显性突变APP的猪细胞。

优选的，所述的猪安全港位点选自猪ROSA26、AAVS1、H11或COL1A1安全港位点。进一步优选的，所述的猪最佳安全港位点为COL1A1位点。

优选的，所述的构建方法还包括制备上述猪细胞的步骤。

优选的，所述的构建方法包括将上述的猪细胞移入去核的猪卵母细胞中，获得模型猪。在本发明的一个具体实施方式中，移入位置为去核卵母细胞的卵周隙。

在本发明的一个具体实施方式中，所述的构建方法包括提供上述的猪细胞或者采用上述的猪细胞构建方法获得猪细胞，然后将该猪细胞进行体细胞核移植动物克隆，获得表达人BACE1 和/或人显性突变APP的模型猪。

本发明的第五方面，提供了一种阿尔兹海默症模型猪的构建方法，将编码人BACE1和/或人显性突变APP的核苷酸序列插入猪安全港位点，获得表达SEQ ID NO：14所示的人BACE1 和/或SEQ ID NO：16所示的人显性突变APP的猪细胞。优选的，所述的猪安全港位点选自猪ROSA26、AAVS1、H11或COL1A1安全港位点。进一步优选的，所述的猪最佳安全港位点为 COL1A1位点。

优选的，所述的构建方法包括将上述的猪细胞移入去核的猪卵母细胞中，获得模型猪。

在本发明的一个具体实施方式中，所述的构建方法包括提供上述的猪细胞或者采用上述的猪细胞构建方法获得猪细胞，然后将该猪细胞进行体细胞核移植动物克隆，获得人BACE1和/ 或人显性突变APP基因纯合或杂合敲入的阿尔兹海默症的模型猪。

本发明的第六方面，提供了一种安全港位点载体，所述的安全港位点载体包含编码人 BACE1和/或人显性突变APP的核苷酸序列和安全港位点载体骨架，所述的安全港位点载体骨架包含安全港插入位点的5’同源臂和3’同源臂，所述的编码人BACE1和/或人显性突变APP的核苷酸序列位于5’同源臂与3’同源臂之间，所述的安全港位点载体骨架选自下列任一项所示：

优选的，所述的安全港位点载体还包含启动子、信号分子以及编码EGFP蛋白、mCherry 蛋白和puro抗性蛋白的核苷酸序列。其中，所述的启动子为EF-1α启动子、PGK启动子和/或 pCAG启动子。所述的信号分子为EF-1αpoly(A)信号、bGH poly(A)信号和/或β-globin poly(A) 信号。进一步优选还包含绝缘子区域。

在本发明的一个具体实施方式中，所述的安全港位点载体骨架从5’至3’依次包括5’同源臂、绝缘子区域、EF-1αpoly(A)信号、编码EGFP的核苷酸序列、EF-1α启动子、绝缘子区域、PGK启动子、编码mCherry的核苷酸序列、bGH poly(A)信号、loxP-puro-loxP表达框区域、绝缘子区域、β-globin poly(A)信号、pCAG启动子、绝缘子区域、3’同源臂。

本发明的第七方面，提供了一种上述的安全港位点载体、上述的Cas载体、上述的sgRNA 载体或者上述的sgRNA在制备猪细胞、表达人BACE1和/或人显性突变APP的模型猪或者阿尔兹海默症的模型猪中的应用。

本发明的第八方面，提供了一种上述的猪细胞、上述的构建方法获得的猪细胞在制备阿尔兹海默症动物模型中的应用，或者在筛选治疗阿尔兹海默症的药物及药效评价中的应用，或者在基因及细胞治疗中的应用，或者在研究阿尔兹海默症的发病机制中的应用。

本发明的第九方面，提供了一种上述的组织或器官或者上述的构建方法获得的模型猪在筛选治疗阿尔兹海默症的药物及药效评价中的应用，或者在基因及细胞治疗中的应用，或者在研究阿尔兹海默症的发病机制中的应用。

术语“载体”是细胞内能够在自身控制下复制的多核苷酸，或者通过插入到宿主细胞染色体进行复制和/或表达的遗传元件，例如质粒、染色体、病毒、转座子。合适的载体包括但不限于质粒、转座子、细菌噬菌体和粘粒。

本发明所述的“gRNA”，也称指导RNA，是由sgRNA载体在细胞中转录得到的，对细胞中的靶序列具有特异性并且可与Cas蛋白形成复合体的RNA。

与现有技术相比，本发明至少具有如下有益效果：

(1)本发明研究对象(猪)比其他动物(大小鼠、灵长类)具有更好的应用性。

大小鼠等啮齿类动物不论从体型、器官大小、生理、病理等方面都与人相差巨大，无法真实地模拟人类正常的生理、病理状态。研究表明，95％以上在大小鼠中验证有效的药物在人类临床试验中是无效的。就大动物而言，灵长类是与人亲缘关系最近的动物，但其体型小、性成熟晚(6-7岁开始交配)，且为单胎动物，群体扩繁速度极慢，饲养成本很高。另外，灵长类动物克隆效率低、难度大、成本高。

而猪作为模型动物就没有上述缺点，猪是除灵长类外与人亲缘关系最近的动物，其体型、体重、器官大小等与人相近，在解剖学、生理学、免疫学、营养代谢、疾病发病机制等方面与人类极为相似。同时，猪的性成熟早(4-6个月)，繁殖力高，一胎多仔，在2-3年内即可形成一个较大群体。另外，猪的克隆技术非常成熟，克隆及饲养成本也较灵长类低得多。因此猪是非常适合作为人类疾病模型的动物。

(2)本发明中经过实验验证改造的pU6gRNA-eEF1a-mNLS-hSpCas9-EGFP-PURO(简称 pKG-GE3)载体相对改造前的pX330载体，更换了更强的启动子及添加了增强蛋白翻译的元件，提高了Cas9的表达，并且增加了核定位信号个数，提高了Cas9蛋白的核定位能力，具有更高的基因编辑效率。本发明还在载体中加入了荧光标记及抗性标记，使其更方便运用于载体阳性转化细胞的筛选及富集。采用本发明改造的Cas9高效表达载体进行基因编辑,编辑效率比原载体提高100％以上。

(3)本发明针对猪基因组进行了4个安全港位点基因敲入后表达情况的摸索，从中筛选出了最佳的供外源基因插入的猪基因组安全港位点，可有效改善基因敲入后目的基因的表达情况。

(4)本发明采用神经组织特异启动子hSyn来驱动外源基因在神经组织中的特异表达，将使外源基因在靶组织特异地发挥作用，同时避免外源基因高水平泛表达对机体造成的影响。

(5)利用本发明所得到的hSyn-hBACE1-hAPP(mut)表达框纯合敲入的单细胞克隆株进行体细胞核移植动物克隆可直接得到hSyn-hBACE1-hAPP(mut)表达框纯合敲入的克隆猪，并且该纯合插入基因可稳定遗传。进一步的，可用于下一步的药物筛选及药效评价、基因及细胞治疗、阿尔茨海默症发病机制的研究等生物医药领域。

在小鼠模型制作中，通常采用受精卵显微注射基因编辑材料后再进行胚胎移植，因其直接获得基因敲入后代的概率非常低(低于1％)，同时需要进行后代的杂交选育来筛选纯合敲入的个体，这不太适用于妊娠期较长的大动物(如猪)模型制作。因此，本发明采用技术难度大、挑战性高的原代细胞体外编辑并筛选阳性编辑单细胞克隆的方法，然后再通过体细胞核移植动物克隆技术直接获得相应模型猪，可大大缩短模型猪制作周期，并节省人力、物力、财力。

本发明通过基因编辑及体细胞克隆技术获得了人源化BACE1和显性突变APP模型猪，将有助于研究并揭示由BACE1和显性突变APP表达介导引发阿尔兹海默症的发病机制，并可用于进行药物筛选、药效检测、基因及细胞治疗等研究，能够为进一步的临床应用提供有效的实验数据，进而为预防和治疗人类阿尔兹海默症提供有力的实验手段。本发明对于人类阿尔兹海默症治疗药物的研发、临床前试验及揭示该类疾病的发病机制均具有重大应用价值。

附图说明

以下，结合附图来详细说明本发明的实施例，其中：

图1为质粒pX330的结构示意图。

图2为质粒pKG-GE3的结构示意图。

图3为pU6gRNA载体的结构示意图。

图4为将20bp左右的DNA分子(用于转录形成能结合靶序列的gRNA)插入质粒pKG-U6gRNA 的示意图。

图5为含ROSA26插入位点的荧光donor质粒的结构示意图。

图6为含AAVS1插入位点的荧光donor质粒的结构示意图。

图7为含H11插入位点的荧光donor质粒的结构示意图。

图8为含COL1A1插入位点的荧光donor质粒的结构示意图。

图9为含COL1A1插入位点的pKG-hSyn-hBACE1-hAPP(mut)donor质粒的结构示意图。

图10为质粒配比优化测试的测序结果。

图11为质粒pX330和质粒pKG-GE3编辑效果的测序结果。

图12为不同安全港位点调控GFP绿色荧光表达图。

图13为不同安全港位点调控GFP转录水平荧光定量PCR结果。

图14为不同安全港位点调控GFP蛋白表达的FACS检测结果。

图15为鉴定猪COL1A1安全港插入位点5’端hSyn-hBACE1-hAPP(mut)表达框是否重组成功的电泳图，其中，WT为野生型对照，Blank为空白对照，sh4代表安全港位点COL1A1，Lr代表5’同源臂，JDF代表鉴定引物F，JDR代表鉴定引物R，1414或5965代表检测位点信息。

图16为鉴定猪COL1A1安全港插入位点3’端hSyn-hBACE1-hAPP(mut)表达框是否重组成功的电泳图，其中，WT为野生型对照，Blank为空白对照，sh4代表安全港位点COL1A1，Rr代表3’同源臂，JDF代表鉴定引物F，JDR代表鉴定引物R，282或4723代表检测位点信息。

图17为鉴定hSyn-hBACE1-hAPP(mut)表达框是否纯合插入猪COL1A1安全港位点的电泳图，其中，WT为野生型对照，Blank为空白对照，sh4代表安全港位点COL1A1，JDF代表鉴定引物F，JDR 代表鉴定引物R，1085或1560代表检测位点信息。

图18为猪COL1A1安全港位点调控人源hBACE1和hAPP(mut)基因转录水平荧光定量PCR结果，其中2^-ΔCt代表相对荧光定量，其中，ΔCt为靶基因的Ct值-内参基因的Ct值，WT为野生型对照猪脑组织的各基因表达量，hBACE1-hAPP-1代表人BACE1和人显性突变APP基因纯合插入的模型猪脑组织的各基因表达量，hBACE1-hAPP-2代表人BACE1和人显性突变APP基因杂合插入的模型猪脑组织的各基因表达量。

图19为猪COL1A1安全港位点调控人源hBACE1表达的FACS检测结果，其中，WT代表野生型对照猪的神经元细胞，hBACE1代表hBACE1基因插入的模型猪的神经元细胞。

图20为猪COL1A1安全港位点调控人源hAPP(mut)蛋白表达的FACS检测结果，其中，WT代表野生型对照猪的神经元细胞，hAPP代表hAPP基因插入的模型猪的神经元细胞。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南，并不以任何方式构成对本发明的限制。

下述实施例中的实验方法，如无特殊说明，均为常规方法，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。实施例中构建的重组质粒，均已进行测序验证。完全培养液(％为体积比)：15％胎牛血清(Gibco)+83％ DMEM培养基(Gibco)+1％Penicillin-Streptomycin(Gibco)+1％HEPES(Solarbio)。细胞培养条件：37℃，5％ CO₂、5％O₂的恒温培养箱。

制备猪原代成纤维细胞的方法：从初生从江香猪的耳组织制备猪原代成纤维细胞。

①取猪耳组织0.5g，除毛，然后用75﹪酒精浸泡30-40s，然后用含5％(体积比)Penicillin-Streptomycin(Gibco)的PBS缓冲液洗涤5次，然后用PBS缓冲液洗涤一次；②用剪刀将组织剪碎，采用5mL0.1％胶原酶溶液(Sigma)，37℃消化1h，然后500g离心5min，弃上清；③将沉淀用1mL完全培养液重悬，然后铺入含10mL完全培养基并已用0.2％明胶(VWR)封盘的直径为10cm 的细胞培养皿中，培养至细胞长满皿底60％左右；④完成步骤③后，采用胰蛋白酶消化并收集细胞，然后重悬于完全培养液,用于进行后续电转实验。

实施例1、载体的构建

一、Cas9高效表达载体(简称pKG-GE3)的构建

出发商品质粒为：pX330-U6-Chimeric_BB-CBh-hSpCas9，简称质粒pX330，如SEQID NO：1所示。

以pX330质粒为基础，构建质粒pU6gRNAeEF1a-mNLS-hSpCas9-EGFP-PURO，简称质粒pKG-GE3，如SEQ ID NO：2所示。

质粒pX330和质粒pKG-GE3均为环形质粒。

质粒pX330的结构示意图见图1。SEQ ID NO：1中，第440-725位核苷酸组成CMV增强子，第 727-1208位核苷酸组成chickenβ-actin启动子，第1304-1324位核苷酸编码SV40核定位信号(NLS)，第 1325-5449位核苷酸编码Cas9蛋白，第5450-5497位核苷酸编码nucleoplasmin核定位信号(NLS)。

质粒pKG-GE3的结构示意图见图2。SEQ ID NO：2中，第395-680位核苷酸组成CMV增强子，第 682-890位核苷酸组成EF1a启动子，第986-1006位核苷酸编码核定位信号(NLS)，第1016-1036位核苷酸编码核定位信号(NLS)，第1037-5161位核苷酸编码Cas9蛋白，第5162-5209位核苷酸编码核定位信号(NLS)，第5219-5266位核苷酸编码核定位信号(NLS)，第5276-5332位核苷酸编码自剪切多肽P2A (自剪切多肽P2A的氨基酸序列为“ATNFSLLKQAGDVEENPGP”，发生自剪切的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)，第5333-6046位核苷酸编码EGFP蛋白，第6056-6109位核苷酸编码自裂解多肽T2A(自裂解多肽T2A的氨基酸序列为“EGRGSLLTCGDVEENPGP”，发生自裂解的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)，第6110-6703位核苷酸编码Puromycin抗性蛋白(简称Puro蛋白)，第6722-7310位核苷酸组成WPRE序列元件，第7382-7615位核苷酸组成3’LTR序列元件，第7647-7871位核苷酸组成bGH poly(A)signal序列元件。SEQ ID NO：2中，第 911-6706形成融合基因，表达融合蛋白。由于自剪切多肽P2A和T2A的存在，融合蛋白自发被裂解成三个独立的蛋白，即Cas9蛋白、EGFP蛋白和Puro抗性蛋白。

与质粒pX330相比，所构建的质粒pKG-GE3主要进行了如下改造：①去除残留的gRNA骨架序列 (GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTTT)，降低干扰；②将原有 chickenβ-actin启动子改造为具更高表达活性的EF1a启动子，增加Cas9基因的蛋白表达能力；③在Cas9 基因的上游和下游均增加核定位信号编码基因(NLS)，增加Cas9蛋白的核定位能力；④原质粒无任何真核细胞筛选标记，不利于阳性转化细胞的筛选和富集，依次在Cas9基因的下游插入 P2A-EGFP-T2A-PURO编码基因，赋予真核细胞荧光及嘌呤霉素抗性双重筛选标记；⑤插入WPRE元件和3’LTR序列元件，增强Cas9基因的蛋白翻译能力。

二、pKG-U6gRNA表达载体的构建

以pUC57为出发质粒，构建pKG-U6gRNA载体，结构示意图见图3，序列如SEQ ID NO：3所示。 SEQ ID NO：3中，第2280-2539位核苷酸组成hU6启动子，第2558-2637位核苷酸用于转录形成gRNA 骨架。使用时，将20bp左右的DNA分子(用于转录形成gRNA的靶序列结合区)插入质粒pKG-U6gRNA，形成重组质粒，示意图见图4，在细胞中重组质粒转录得到gRNA。

三、构建含GFP基因的不同安全港位点Donor载体

构建质粒PB-1G 2R 3-puro-ROSA26、PB-1G 2R 3-puro-AAVS1、PB-1G 2R 3-puro-H11和PB-1G 2R 3-puro-COL1A1。

质粒PB-1G 2R 3-puro-ROSA26结构示意图见图5。SEQ ID NO：4中，第1-345位核苷酸组成ROSA26 安全港插入位点5’端猪基因组区域(SH1左臂，如SEQ ID NO：5所示)，第9184-10195位核苷酸组成 ROSA26安全港插入位点3’端猪基因组区域(SH1右臂，如SEQ IDNO：6所示)，第346-546、3132-3531、 6506-6706、8975-9175位核苷酸分别组成4个不同的绝缘子区域，第1954-3131位核苷酸组成EF-1α启动子，第1216-1935位核苷酸编码EGFP蛋白，第637-1209位核苷酸组成EF-1αpoly(A)信号,第3543-4042位核苷酸组成PGK启动子，第4059-4769位核苷酸编码mCherry蛋白，第4791-5015位核苷酸组成bGHpoly(A) 信号，第5054-6504位核苷酸为loxP-puro-loxP表达框区域，第7259-8974位核苷酸组成pCAG启动子，第 6969-7233位核苷酸组成β-globin poly(A)信号。

质粒PB-1G 2R 3-puro-AAVS1结构示意图见图6。仅将SEQ ID NO：4中的第1-345位核苷酸替换为 AAVS1安全港插入位点5’端猪基因组区域(SH2左臂)，见SEQ ID NO：7；将SEQID NO：4中的第 9184-10195位核苷酸替换为AAVS1安全港插入位点3’端猪基因组区域(SH2右臂)，见SEQ ID NO：8。其他序列与SEQ ID NO：4一致。

质粒PB-1G 2R 3-puro-H11结构示意图见图7。仅将SEQ ID NO：4中的第1-345位核苷酸替换为H11 安全港插入位点5’端猪基因组区域(SH3左臂)，见SEQ ID NO：9；将SEQ IDNO：4中的第9184-10195 位核苷酸替换为H11安全港插入位点3’端猪基因组区域(SH3右臂)，见SEQ ID NO：10。其他序列与 SEQ ID NO：4一致。

质粒PB-1G 2R 3-puro-COL1A1结构示意图见图8。仅将SEQ ID NO：4中的第1-345位核苷酸替换为 COL1A1安全港插入位点5’端猪基因组区域(SH4左臂)，见SEQ ID NO：11；将SEQ ID NO：4中的第9184-10195位核苷酸替换为COL1A1安全港插入位点3’端猪基因组区域(SH4右臂)，见SEQ ID NO： 12。其他序列与SEQ ID NO：4一致。

四、构建pKG-hSyn-hBACE1-hAPP(mut)Donor载体

构建质粒pKG-hSyn-hBACE1-hAPP(mut)，其结构示意图见图9。SEQ ID NO：13中，第9-880位核苷酸为猪基因组COL1A1安全港插入位点5’端同源序列，第887-1087位核苷酸为绝缘子1(Insulator 1) 序列，第1088-1535位核苷酸为人hSyn启动子，第1585-3087位核苷酸为人BACE1的编码序列，第 3097-3153位核苷酸为编码P2A的核苷酸序列，第3154-5466位核苷酸为显性突变人APP的编码序列，其中突变处为c.2010G>C(K670N),c.2146A>G(I716V),c.2149G>A(V717I)。第5512-5736位核苷酸为bGH Poly(A)序列，第5843-6172位核苷酸为SV40启动子序列，第6221-6817位核苷酸为Puromycin抗性蛋白 (简称Puro^R蛋白)编码序列，第6997-7118位核苷酸为SV40 Poly(A)序列，第5767-5800及7163-7196位核苷酸分别为同向相同的LoxP序列，第7205-7405位核苷酸为绝缘子2(Insulator 2)序列，第7406-8132 位核苷酸为猪基因组COL1A1安全港插入位点3’端同源序列。

实施例2、质粒pX330和质粒pKG-GE3的效果比较

选择位于RAG1基因的高效gRNA靶点：

RAG1-gRNA4的靶点：5’-AGTTATGGCAGAACTCAGTG-3’(SEQ ID NO：18)。

用于扩增包含靶点的片段的引物如下：

RAG1-nF126：5’-CCCCATCCAAAGTTTTTAAAGGA-3’(SEQ ID NO：19)；

RAG1-nR525：5’-TGTGGCAGATGTCACAGTTTAGG-3’(SEQ ID NO：20)。

一、构建RAG1基因gRNA重组质粒

对质粒pKG-U6gRNA用限制性内切酶BbsI进行酶切，回收载体骨架(约3kb的线性大片段)。分别合成RAG1-4S和RAG1-4A，然后混合并进行退火，得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接，得到质粒pKG-U6gRNA(RAG1-gRNA4)。

RAG1-4S：5’-caccgAGTTATGGCAGAACTCAGTG-3’(SEQ ID NO：21)；

RAG1-4A：5’-aaacCACTGAGTTCTGCCATAACTc-3’(SEQ ID NO：22)。

RAG1-4S和RAG1-4A均为单链DNA分子。

二、质粒配比优化

1、质粒共转染猪原代成纤维细胞

第一组：将质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.44μg质粒pKG-U6gRNA(RAG1-gRNA4)：1.56μg质粒pKG-GE3。即质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3的摩尔配比为：1：1。

第二组：将质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.72μg质粒pKG-U6gRNA(RAG1-gRNA4)：1.28μg质粒pKG-GE3。即质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3的摩尔配比为：2：1。

第三组：将质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.92μg质粒pKG-U6gRNA(RAG1-gRNA4)：1.08μg质粒pKG-GE3。即质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3的摩尔配比为：3：1。

第四组：将质粒pKG-U6gRNA(RAG1-gRNA4)转染至猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：1μg质粒pKG-U6gRNA(RAG1-gRNA4)。

共转染采用电击转染的方式，采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为：1450V、10ms、3pulse)进行转染。

2、完成步骤1后，采用完全培养液培养16-18小时，然后更换新的完全培养液进行培养。培养总时间为48小时。

3、完成步骤2后，采用胰蛋白酶消化并收集细胞，提取基因组DNA，采用RAG1-nF126和RAG1-nR525组成的引物对进行PCR扩增，然后进行电泳。

电泳后回收目的条带并进行测序，测序结果见图10。

通过利用Synthego ICE工具分析测序峰图得出不同靶点的编辑效率。第一组至第三组的基因编辑效率依次为9％、53％、66％。第四组不发生基因编辑。结果表明，第三组编辑效率最高，确定单gRNA 质粒与Cas9质粒最适配比为摩尔比3：1，质粒实际用量为0.92μg：1.08μg。

三、质粒pX330和质粒pKG-GE3的效果比较

1、共转染

RAG1-B组：将质粒pKG-U6gRNA(RAG1-gRNA4)转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.92μg质粒pKG-U6gRNA(RAG1-gRNA4)。

RAG1-330组：将质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pX330共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.92μg质粒pKG-U6gRNA(RAG1-gRNA4)：1.08μg质粒pX330，即两种DNA的摩尔比为3:1。

RAG1-KG组：将质粒pKG-U6gRNA(RAG1-gRNA4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.92μg质粒pKG-U6gRNA(RAG1-gRNA4)：1.08μg质粒 pKG-GE3，即两种DNA的摩尔比为3:1。

共转染采用电击转染的方式，采用哺乳动物核转染试剂盒(Neon kit，Thermofisher)与Neon TM transfection system电转仪(参数设置为：1450V、10ms、3pulse)进行转染。

3、完成步骤2后，采用胰蛋白酶消化并收集细胞，提取基因组DNA，采用RAG1-nF126和 RAG1-nR525组成的引物对进行PCR扩增，将产物进行测序。

通过利用Synthego ICE工具分析测序峰图得出不同靶点的编辑效率。RAG1-B组不发生基因编辑。 RAG1-330组、RAG1-KG组的编辑效率依次为28％、68％。测序结果示例性峰图见图11。结果表明，与采用质粒pX330相比，采用质粒pKG-GE3使得基因编辑效率显著提高。

实施例3、筛选供外源基因定点插入的猪基因组最佳安全港位点

一、猪基因组ROSA26、AAVS1、H11、COL1A1安全港位点gRNA重组载体的构建及高效切割靶点筛选

通过前期筛选，ROSA26、H11、AAVS1、COL1A1安全港位点的高效切割靶点分别为sgRNA_ROSA26-g3 (切割效率38％)、sgRNA_AAVS1-g4(切割效率30％)、sgRNA_H11-g1(切割效率60％)、sgRNA_COL1A1-g3(切割效率56％)，靶点序列如下：

sgRNA_ROSA26-g3靶点：5’-GAAGGAGCAAACTGACATGG-3’(SEQ ID NO：23)；

sgRNA_AAVS1-g4靶点：5’-TGCAGTGGGTCTTTGGGGAC-3’(SEQ ID NO：24)；

sgRNA_H11-g1靶点：5’-TTCCAGGAACATAAGAAAGT-3’(SEQ ID NO：25)；

sgRNA_COL1A1-g3靶点：5’-GCAGTCTCAGCAACCACTGA-3’(SEQ ID NO：26)。

这4个gRNA靶点对应的gRNA质粒分别为pKG-U6gRNA(ROSA26-g3)、pKG-U6gRNA(AAVS1-g4)、pKG-U6gRNA(H11-g1)、pKG-U6gRNA(COL1A1-g3)，其中，骨架载体均为pKG-U6gRNA(SEQ ID NO：3)，质粒构建方法同实施例2。

二、含不同安全港插入位点两侧同源臂的荧光Donor载体(即包含外源基因GFP的不同安全港位点载体)、sgRNA载体和Cas9载体(实施例1制备的pKG-GE3)混合电转猪原代成纤维细胞

分别将PB-1G 2R 3-puro-不同安全港插入位点荧光载体与对应的高效sgRNA载体以及高效Cas9 载体共转染猪原代成纤维细胞。使用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪进行电转实验(参数设置为：1450V、10ms、3pulse)。

共转染质粒组合及配比：

第一组：将质粒PB-1G 2R 3-puro-ROSA26、质粒pKG-U6gRNA(ROSA26-g3)和质粒pKG-GE3 共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：1.26μg质粒PB-1G2R 3-puro-ROSA26、 0.82μg质粒pKG-U6gRNA(ROSA26-g3)：0.92μg质粒pKG-GE3，即3种DNA的摩尔比为：1：3：1。

第二组：将质粒PB-1G 2R 3-puro-AAVS1、质粒pKG-U6gRNA(AAVS1-g4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：1.26μg质粒PB-1G 2R 3-puro-AAVS1、 0.82μg质粒pKG-U6gRNA(AAVS1-g4)：0.92μg质粒pKG-GE3，即3种DNA的摩尔比为：1：3：1。

第三组：将质粒PB-1G 2R 3-puro-H11、质粒pKG-U6gRNA(H11-g1)和质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：1.26μg质粒PB-1G 2R 3-puro-H11、0.82μg质粒pKG-U6gRNA(H11-g1)：0.92μg质粒pKG-GE3，即3种DNA的摩尔比为：1：3：1。

第四组：将质粒PB-1G 2R 3-puro-COL1A1、质粒pKG-U6gRNA(COL1A1-g3)和质粒pKG-GE3 共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：1.26μg质粒PB-1G2R 3-puro-COL1A1、 0.82μg质粒pKG-U6gRNA(COL1A1-g3)：0.92μg质粒pKG-GE3，即3种DNA的摩尔比为：1：3： 1。

第五组：猪原代成纤维细胞，同等电转参数不加任何质粒进行电转染操作。

具体实施方法：

细胞：电转前猪原代成纤维细胞融合度达到60％，0.25％胰蛋白酶消化，台盼蓝染色计数，取等量细胞进行五组电转。

猪原代细胞电转：

(1)将细胞用胰酶消化，得到的细胞悬液用PBS磷酸缓冲液(Solarbio)洗一遍，600g离心6min，弃去上清，使用58μL电转基本溶液R buffer重悬细胞(11μL/个)，重悬过程中要避免气泡的产生；

(2)吸取10μL细胞悬液与质粒电转反应液混匀，混匀过程中注意切勿产生气泡；

(3)将试剂盒带有的电转杯放置于Neon TM transfection system电转仪杯槽内，加入3mL Buffer E；

(4)用电转枪吸取10μL步骤(2)得到的混合液，插入电击杯内，选择电转程序(1450V 10ms 3pulse)，电击转染后立即在超净台内将电转枪中混合液转入到6孔板中，每孔含3mL的完全培养液(15％胎牛血清(Gibco)+83％DMEM培养基(Gibco)+1％P/S(GibcoPenicillin-Streptomycin)+1％HEPES(Solarbio))；

(5)混匀后放置于37℃，5％CO₂、5％O₂的恒温培养箱中进行培养；

(6)电转12-24h换液，电转48h使用嘌呤霉素加压，筛选阳性细胞。

三、嘌呤霉素加压筛选及细胞GFP荧光强度检测

细胞经质粒电转48h，加入1.5μg/mL嘌呤霉素筛选，每两天更换含有相同浓度嘌呤霉素的培养基，同时进行GFP绿色荧光拍照，连续筛选两周，待细胞内质粒完全降解后再继续加压筛选一周。通过 GFP荧光表达的强弱判断安全港位点表达外源基因效率的高低。

嘌呤霉素筛选一周后，ROSA26、COL1A1安全港位点实验组荧光强度明显强于AAVS1、H11实验组；嘌呤霉素筛选两周后，荧光强度由强到弱依次为：COL1A1>ROSA26>H11>AAVS1，其中H11 组荧光强度不太均一，ROSA26组整体荧光强度较均一，且荧光强度较高，AAVS1组细胞荧光表达最弱，COL1A1组荧光细胞数最多，荧光最强；嘌呤霉素继续筛选三周后，荧光强度由强到弱依次为： COL1A1>ROSA26>H11>AAVS1，结果如图12。

四、GFP基因转录水平检测

为了比较GFP基因整合入四个不同安全港位点后mRNA转录水平的差异性，能否参与GFP的表达调控及对表达量的影响。在GFP基因外显子处设计一对引物，取嘌呤霉素筛选三周后的细胞，提取总RNA，反转录成cDNA，用于检测原代细胞在四个不同安全港位点整合GFP基因后的转录水平，同时用野生型原代细胞即第五组的细胞(无质粒的对照电转组)所得到的定量结果作为对照。以 GAPDH为内参基因按照2^-ΔCt法进行计算。

(1)引物信息(表1)

表1：荧光定量PCR引物信息

(2)细胞总RNA提取

根据Bio Flux的Simply P总RNA提取试剂盒进行细胞总RNA提取

(3)cDNA第一链获得

根据Vazyme反转录试剂盒

II 1st Strand cDNA Synthesis Kit(R211-01/02)说明书合成 cDNA第一链，具体步骤和程序如下：

1)配制第一链cDNA合成反应液

在RNase-free离心管中配制如下表2混合液

表2

用移液枪轻轻吹打混匀。

2)按下列条件进行第一链cDNA合成反应，反应条件见表3。

表3

产物立即用于qPCR反应，或存放于-80℃保存，避免反复冻融。

(4)荧光定量PCR

利用实时荧光定量PCR法检测插入四组不同安全港位点(ROSA26、AAVS1、H11、COL1A1) 猪原代成纤维细胞中GFP的表达量，GAPDH作为内参基因。操作步骤及程序如下：

1)反应体系配制见表4

表4

2)qPCR反应程序如下表5

表5

3)统计与分析

用SPSS统计学软件进行数据分析，以(平均数±标准差)表示，采用双因素方差分析进行统计学分析。2^-ΔCt值结果显示嘌呤霉素筛选三周后AAVS1、H11组GFP表达量较低，ROSA26、COL1A1组 GFP表达量较高，且COL1A1组和ROSA26组相对于AAVS1和H11组GFP转录水平差异极显著 (P<0.01)，2^-ΔCt值见表6，差异显著性分析结果如图13。

表6：2^-ΔCt值信息

综上，根据培养细胞三周后的荧光信号强度与GFP基因实时荧光定量PCR的结果，可以得出如下结论，在ROSA26、AAVS1、H11、COL1A1这四个基因组安全港位点中，COL1A1位点插入外源基因后表达效果最好。

五、GFP基因的蛋白表达水平FACS检测

为了比较GFP基因整合入四个不同安全港位点后GFP蛋白的表达情况。分别用胰蛋白酶消化嘌呤霉素筛选三周后的电转细胞，400g离心4min后，弃上清。以1mL完全培养基重悬细胞，并将细胞悬液分别转移至流式管内。在BD FACSMelody流式细胞仪的FITC通道内检测GFP信号，并以野生型细胞作为阴性对照，收集5×10⁴个细胞进行分析，结果如图14所示。结果显示GFP荧光信号 COL1A1>ROSA26>H11>AAVS1。

因此，综合上述结果，COL1A1位点是ROSA26、AAVS1、H11、COL1A1四个安全港位点中最高效表达外源基因的猪原代细胞安全港位点。

实施例4、制备hSyn-hBACE1-hAPP(mut)表达框定点插入猪COL1A1安全港位点的单细胞克隆

人(h)BACE1基因(如SEQ ID NO：15所示)信息：编码人beta-secretase 1蛋白；位于人11号染色体；共有10个外显子；GeneID为351。其编码的蛋白质片段NP_036236.1如SEQID NO：14所示。

人(h)APP基因(如SEQ ID NO：17所示)信息：编码人amyloid beta precursorprotein蛋白；位于人21号染色体；共有20个外显子；GeneID为23621。其编码的蛋白质片段NP_000475.1如SEQ ID NO：16所示。显性突变hAPP为在hAPP的原有序列基础上进行了如下突变 c.2010G>C(K670N),c.2146A>G(I716V),c.2149G>A(V717I)。

一、共转染

将质粒pKG-U6gRNA(COL1A1-g3)、质粒pKG-GE3和质粒pKG-hSyn-hBACE1-hAPP(mut)(如 SEQ ID NO：13所示)共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：0.88μg质粒 pKG-U6gRNA(COL1A1-g3)：0.98μg质粒pKG-GE3：1.14μg质粒pKG-hSyn-hBACE1-hAPP(mut)，即3种DNA的摩尔比为：3：1：1。

共转染采用电击转染的方式，采用哺乳动物核转染试剂盒(Neon kit，Thermofisher)与Neon TM transfection system电转仪(参数设置为：1450V、10ms、3pulse)进行转染。采用完全培养液培养电转后的细胞16-18小时，更换新的完全培养液进行培养，培养总时间为48小时，然后更换为含抗生素的培养基进行阳性转化细胞的筛选。

二、嘌呤霉素加压筛选及单细胞分选

1.嘌呤霉素筛选hSyn-hBACE1-hAPP(mut)表达框阳性插入细胞

细胞经质粒电转48h后，加入1.5μg/mL嘌呤霉素筛选，每天更换含有相同浓度嘌呤霉素的培养基，连续筛选一周后野生型对照孔细胞全部死亡，因电转效率较低，pKG-hSyn-hBACE1-hAPP(mut)质粒电转孔筛选一周后细胞也出现大量死亡；继续加入嘌呤霉素筛选一周，细胞只有零星死亡，部分阳性克隆开始分裂增殖，细胞数不断增多；继续加压筛选一周使细胞内质粒降解完全以排除假阳性细胞克隆。加压筛选三周后停止加压，采用不含嘌呤霉素的完全培养液恢复培养2代(每2天1代)，让细胞恢复至良好状态用于下一步的单细胞分选。

2.单细胞分选，放大培养

(1)将嘌呤霉素筛选三周后的群体细胞，进行单细胞分选，使用胰蛋白酶进行消化，完全培养基中和，500g离心5min，去上清，将沉淀用1mL完全培养基重悬，并适当稀释，用口吸管挑取单细胞转移到96孔板中(每孔预先加入100μl不含嘌呤霉素的完全培养液)，每组细胞挑取一板96孔单细胞，每孔一个细胞，放置于37℃，5％CO₂、5％O₂的恒温培养箱中进行培养，培养2天后，更换为含1.5μg/mL 嘌呤霉素的完全培养液，之后每2～3天更换一次细胞培养液(含1.5μg/mL嘌呤霉素)，期间用显微镜观察每孔细胞生长情况，排除无细胞及非单细胞克隆的孔；

(2)待96孔板的孔中细胞长满孔底(大约2周左右)，使用胰蛋白酶消化并收集细胞，其中2/3细胞接种到含有完全培养基的6孔板中，剩余的1/3的细胞收集在1.5mL离心管中用于下一步的基因型检测；

(3)待6孔板细胞长至50％丰满度时使用0.25％(Gibco)的胰蛋白酶消化并收集细胞，使用细胞冻存液(90％完全培养基+10％DMSO，体积比)将细胞冻存。

三、猪COL1A1安全港位点定点插入hSyn-hBACE1-hApp(mut)的单细胞克隆基因组水平鉴定

为了检测猪COL1A1安全港位点是否成功定点插入了hSyn-hBACE1-hAPP(mut)表达框。取嘌呤霉素加压筛选完毕后的单细胞克隆，提取基因组DNA，进行PCR扩增(分别采用sh4-Lr-JDF1414和 sh4-Lr-JDR5965组成的引物对、sh4-Rr-JDF282和sh4-Rr-JDR4723组成的引物对、sh4-wt-JDF1085和 sh4-wt-JDR1560组成的引物对)，然后进行电泳。将猪原代脂肪干细胞作为野生型对照。sh4-Lr-JDF1414 和sh4-Lr-JDR5965组成的引物对用来鉴定猪COL1A1安全港插入位点5’端hSyn-hBACE1-hAPP(mut) 表达框是否重组成功(靶序列为4552bp)；sh4-Rr-JDF282和sh4-Rr-JDR4723组成的引物对用来鉴定猪COL1A1安全港插入位点3’端hSyn-hBACE1-hAPP(mut)表达框是否重组成功(靶序列为4442bp)； sh4-wt-JDF1085和sh4-wt-JDR1560组成的引物对用来鉴定猪COL1A1安全港位点定点插入的 hSyn-hBACE1-hAPP(mut)表达框为纯合型还是杂合型(野生型基因组可扩增出476bp片段，外源插入片段太大无法扩增；因此，如果不显示扩增产物，说明细胞为插入hSyn-hBACE1-hApp(mut)表达框的纯合型；如果显示476bp扩增产物，说明细胞为插入hSyn-hBACE1-hApp(mut)表达框的杂合型或者是野生型)。

sh4-Lr-JDF1414：CCTGCTGTAAGTGCCGTAGT(SEQ ID NO：31)

sh4-Lr-JDR5965：CTAGGGGCACAGCACGTC(SEQ ID NO：32)

sh4-Rr-JDF282：AAGTTATTAGGTCTGAAGAGGAGTTT(SEQ ID NO：33)

sh4-Rr-JDR4723:CCCATCATTCCGTCCCAGAG(SEQ ID NO：34)

sh4-wt-JDF1085:TGCTGAGTTCTGGCTTCCTG(SEQ ID NO：35)

sh4-wt-JDR1560:TCTACCAAGAGAGTGACCAGCAG(SEQ ID NO：36)

电泳图分别见图15、图16和图17。通过电泳的结果，我们初步判定编号为1-20号的单细胞克隆均为成功在猪COL1A1安全港位点定点插入hSyn-hBACE1-hAPP(mut)的克隆，其中1、7、12号单细胞克隆为纯合定点插入，其他单细胞克隆为杂合定点插入(表7)。

表7 hSyn-hBACE1-hAPP(mut)表达框定点插入猪COL1A1安全港位点单细胞克隆的基因型

将表7中编号为hBACE1-hAPP-1(纯合定点插入)和hBACE1-hAPP-2(杂合定点插入)的重组细胞分别进行步骤四的体细胞核移植生产疾病模型克隆猪。

四、利用体细胞核移植技术克隆生产AD模型猪

1、卵母细胞体外成熟

从屠宰场采集新鲜的离体猪卵巢，卵巢在含75mg/mL青霉素和50mg/mL链霉素的0.9％(w/v) 氯化钠溶液中保存，于25–30℃温度下运输至实验室。从直径3～6mm的卵泡中抽取卵丘卵母细胞复合体(Cumulus-oocyte complexes，COCs)，选择至少具有三层致密卵丘细胞的COCs，接种至4孔板中，每孔装有200μL猪卵母细胞体外成熟(IVM)培养基(即以TCM-199培养基为基础，内含0.1mg/mL 丙酮酸、0.1mg/mL盐酸半胱氨酸、10ng/mL表皮生长因子、10％(v/v)猪卵泡液、75mg/mL青霉素， 50mg/mL链霉素，10IU/mLeCG和hCG)，每孔接种50个，每次移植需培养300-400个COCs。将含 COCs的培养板在38.5℃、5％CO₂和饱和湿度的培养箱中培养42-44小时。

2、体细胞核移植(SCNT)与胚胎移植

(1)体细胞核移植

体外成熟42小时后，用0.1％(w/v)透明质酸酶反复吹打去除COCs的扩张卵丘细胞。将具有完整膜且含排出的第一极体的卵母细胞在含有0.1mg/mL地美可辛、0.05M蔗糖和4mg/mL牛血清白蛋白(BSA)的NCSU23培养基中培养0.5-1h，促使卵母细胞核突起，然后使用尖部倾斜的显微注射针 (直径约20μm)在含有10μm HEPES、0.3％(w/v)聚乙烯吡咯烷酮、10％FBS，0.1mg/mL地美可辛和5mg/mL细胞松弛素B的Tyrode乳酸培养基中去除突起的细胞核和极体。分别以hBACE1-hAPP-1 (纯合定点插入)和hBACE1-hAPP-2(杂合定点插入)的重组细胞作为核供体，将单个供体细胞注入去核卵母细胞的卵周隙。使用胚胎细胞融合仪(ET3，Fujihira Industry)在含有0.25M D-山梨醇、0.05mM Mg(C₂H₃O₂)₂、20mg/mL BSA和0.5mM HEPES(acid-free)的融合培养基中用200V/mm的直流脉冲将供体细胞与受体卵母细胞融合20μs。将重构胚在PZM-3溶液(配方如下)中培养2h以允许细胞核重编程，然后在含有0.25M D-山梨醇、0.01mM Ca(C₂H₃O₂)₂、0.05mM Mg(C₂H₃O₂)₂和0.1mg/mL BSA的激活培养基中用150V/mm的单脉冲激活100μs。然后将激活的胚胎在含5μg/mL细胞松弛素B的 PZM-3中，于38.5℃、5％CO₂、5％O₂、90％N₂和饱和湿度的培养箱中培养2小时，以进一步激活胚胎。最后将小部分重构胚移入PZM-3培养基中，在38.5℃、5％CO₂、5％O₂、90％N₂和饱和湿度的培养箱中培养2d和7d，分别检测胚胎卵裂率和囊胚发育率。大部分重构胚在激活后培养6h即可用于后续的胚胎移植。

(2)胚胎移植

选择9头处于发情期的杂交母猪(大白猪/长白猪)作为重构胚的代孕母猪，将激活后培养6h的重构胚移植到受体母猪的输卵管中，每头母猪移植300-350个重构胚，每次移植1-2头母猪。9头代孕母猪中，6头用来移植采用hBACE1-hAPP-1(纯合定点插入)细胞株所构建的胚胎，3头用来移植采用hBACE1-hAPP-2(杂合定点插入)细胞株所构建的胚胎。在胚胎移植后约23天，使用超声波扫描仪(HS-101V，日本本田电子)检查妊娠情况，确认受体母猪是否怀孕，克隆猪在胚胎移植后第116-117 天左右出生。

5头成功怀孕的代孕母猪共生产8头克隆猪(其中5头为靶基因纯合插入的克隆猪，3头为靶基因杂合插入的克隆猪)，该克隆猪即为AD模型猪。

PZM-3溶液配方见表8。

表8

*使用前添加

3、野生型对照克隆猪的制备

将同一来源的猪原代成纤维细胞代替重组细胞进行步骤2，得到克隆猪，即为野生型对照猪，其遗传背景除外源插入的靶基因外，其余与重组细胞所得到的模型猪完全一致。

五、AD模型猪hBACE1和hAPP(mut)基因的转录水平检测

为了检测猪COL1A1安全港位点定点插入hSyn-hBACE1-hAPP(mut)表达框的模型猪的hBACE1 和hAPP(mut)的基因表达情况。我们针对hBACE1和hAPP(mut)基因分别设计了一对特异的引物，分别采集出生180天的AD模型猪(核供体分别为hBACE1-hAPP-1(纯合定点插入)和hBACE1-hAPP-2 (杂合定点插入)细胞株)和野生型对照克隆猪(相同动物细胞来源)的脑组织，提取总RNA，反转录成cDNA，用于检测猪脑组织内人hBACE1和hAPP基因的mRNA表达水平。以β-actin为内参基因按照2^-ΔCt法进行计算。详细步骤参照实施例3中的(四、GFP基因转录水平检测)。

(1)引物信息见表9：

表9荧光定量PCR引物信息

用SPSS统计学软件进行数据分析，以(平均数±标准差)表示，采用单因素方差分析进行统计学分析。2^-ΔCt值结果显示，AD模型猪脑组织的hBACE1和hAPP(mut)的表达量均显著高于野生型对照克隆猪脑组织的hBACE1和hAPP(mut)基因的表达量(图18)，并且靶基因纯合插入细胞株 (hBACE1-hAPP-1)所得到的克隆猪的hBACE1和hAPP(mut)基因的表达量要高于靶基因杂合插入细胞株(hBACE1-hAPP-2)所得到的克隆猪的表达量。

综上，根据hBACE1和hAPP(mut)基因实时荧光定量PCR的结果，hBACE1和hAPP(mut)在所构建的AD模型猪的脑组织中均有显著的表达。

六、AD模型猪中hBACE1和hAPP(mut)基因的蛋白表达水平FACS检测

为了比较hBACE1和hAPP(mut)基因在模型猪及野生型对照猪神经元细胞中的表达情况，进行下述实验：

1、分别采集出生180天后的AD模型猪和野生型对照猪脑组织的海马组织，去除脑膜和血管后，用含3％(v/v)青霉素/链霉素(母液为100×)的PBS洗涤3次，然后再用PBS洗涤1次，充分剪碎后，放入含0.25％(w/v)胰酶、0.1％(w/v)IV型胶原酶、1％(v/v)青霉素/链霉素(母液为100×)的DMEM消化液中，37℃震荡消化30min，然后用含10％FBS的DMEM细胞培养基中和消化酶，过200目的细胞筛，收集滤液，300g离心5min，去上清，获得神经元细胞沉淀。

2、完成步骤1后，用PBS缓冲液洗涤细胞，然后用-20℃预冷的90％甲醇水溶液充分重悬细胞，固定20min，然后离心并弃除固定液，然后加入3％BSA水溶液封闭1h，然后离心弃除封闭液，然后用完全培养基洗涤。

3、完成步骤2后，分别以人特异性的hBACE1抗体(Invitrogen，MA5-29048,1:50稀释)和hAPP 抗体(Invitrogen，PA5-13327，1：20稀释)工作液重悬细胞，室温孵育2h，然后用完全培养基充分洗涤细胞。

4、完成步骤3后，加入羊抗兔二抗(abcam，ab150077))稀释工作液(二抗工作液稀释度为1： 1000)，室温孵育1h，然后用完全培养基充分洗涤细胞。

5、完成步骤4后，用500μL完全培养基重悬细胞，并将细胞悬液转移至流式管内，在BD FACSMelody流式细胞仪的FITC通道内分别检测hBACE1和hAPP抗体荧光信号，收集5×10⁴个细胞进行分析。

结果如图19和图20。图19结果显示在AD模型猪的神经元细胞(hBACE1)中检测到明显的hBACE1 的抗体荧光信号，而在野生型对照猪的神经元细胞(WT)中没有检测到hBACE1抗体荧光信号；图20 结果显示在AD模型猪的神经元细胞(hAPP)中检测到明显的hAPP的抗体荧光信号，而在野生型对照猪的神经元细胞(WT)中没有检测到hAPP抗体荧光信号；这说明所插入的人hBACE1和hAPP(mut)基因在AD模型猪的神经元细胞中均有较高的表达，也进一步说明了AD模型猪被成功构建。

以上详细描述了本发明的优选实施方式，但是，本发明并不限于上述实施方式中的具体细节，在本发明的技术构思范围内，可以对本发明的技术方案进行多种简单变型，这些简单变型均属于本发明的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本发明对各种可能的组合方式不再另行说明。

序列表

<110> 南京启真基因工程有限公司

<120> 一种构建阿尔兹海默症模型猪的基因编辑技术及其应用

<130> 1

<160> 47

<170> SIPOSequenceListing 1.0

<210> 1

<211> 8484

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300

gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttg ttttagagct 360

agaaatagca agttaaaata aggctagtcc gtttttagcg cgtgcgccaa ttctgcagac 420

aaatggctct agaggtaccc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 480

ccaacgaccc ccgcccattg acgtcaatag taacgccaat agggactttc cattgacgtc 540

aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 600

caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tgtgcccagt 660

acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 720

ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 780

ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 840

ggggggggcg gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc 900

agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata 960

aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgcgctg ccttcgcccc gtgccccgct 1020

ccgccgccgc ctcgcgccgc ccgccccggc tctgactgac cgcgttactc ccacaggtga 1080

gcgggcggga cggcccttct cctccgggct gtaattagct gagcaagagg taagggttta 1140

agggatggtt ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca 1200

ctttttttca ggttggaccg gtgccaccat ggactataag gaccacgacg gagactacaa 1260

ggatcatgat attgattaca aagacgatga cgataagatg gccccaaaga agaagcggaa 1320

ggtcggtatc cacggagtcc cagcagccga caagaagtac agcatcggcc tggacatcgg 1380

caccaactct gtgggctggg ccgtgatcac cgacgagtac aaggtgccca gcaagaaatt 1440

caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg gagccctgct 1500

gttcgacagc ggcgaaacag ccgaggccac ccggctgaag agaaccgcca gaagaagata 1560

caccagacgg aagaaccgga tctgctatct gcaagagatc ttcagcaacg agatggccaa 1620

ggtggacgac agcttcttcc acagactgga agagtccttc ctggtggaag aggataagaa 1680

gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc acgagaagta 1740

ccccaccatc taccacctga gaaagaaact ggtggacagc accgacaagg ccgacctgcg 1800

gctgatctat ctggccctgg cccacatgat caagttccgg ggccacttcc tgatcgaggg 1860

cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg tgcagaccta 1920

caaccagctg ttcgaggaaa accccatcaa cgccagcggc gtggacgcca aggccatcct 1980

gtctgccaga ctgagcaaga gcagacggct ggaaaatctg atcgcccagc tgcccggcga 2040

gaagaagaat ggcctgttcg gaaacctgat tgccctgagc ctgggcctga cccccaactt 2100

caagagcaac ttcgacctgg ccgaggatgc caaactgcag ctgagcaagg acacctacga 2160

cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc tgtttctggc 2220

cgccaagaac ctgtccgacg ccatcctgct gagcgacatc ctgagagtga acaccgagat 2280

caccaaggcc cccctgagcg cctctatgat caagagatac gacgagcacc accaggacct 2340

gaccctgctg aaagctctcg tgcggcagca gctgcctgag aagtacaaag agattttctt 2400

cgaccagagc aagaacggct acgccggcta cattgacggc ggagccagcc aggaagagtt 2460

ctacaagttc atcaagccca tcctggaaaa gatggacggc accgaggaac tgctcgtgaa 2520

gctgaacaga gaggacctgc tgcggaagca gcggaccttc gacaacggca gcatccccca 2580

ccagatccac ctgggagagc tgcacgccat tctgcggcgg caggaagatt tttacccatt 2640

cctgaaggac aaccgggaaa agatcgagaa gatcctgacc ttccgcatcc cctactacgt 2700

gggccctctg gccaggggaa acagcagatt cgcctggatg accagaaaga gcgaggaaac 2760

catcaccccc tggaacttcg aggaagtggt ggacaagggc gcttccgccc agagcttcat 2820

cgagcggatg accaacttcg ataagaacct gcccaacgag aaggtgctgc ccaagcacag 2880

cctgctgtac gagtacttca ccgtgtataa cgagctgacc aaagtgaaat acgtgaccga 2940

gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa aaggccatcg tggacctgct 3000

gttcaagacc aaccggaaag tgaccgtgaa gcagctgaaa gaggactact tcaagaaaat 3060

cgagtgcttc gactccgtgg aaatctccgg cgtggaagat cggttcaacg cctccctggg 3120

cacataccac gatctgctga aaattatcaa ggacaaggac ttcctggaca atgaggaaaa 3180

cgaggacatt ctggaagata tcgtgctgac cctgacactg tttgaggaca gagagatgat 3240

cgaggaacgg ctgaaaacct atgcccacct gttcgacgac aaagtgatga agcagctgaa 3300

gcggcggaga tacaccggct ggggcaggct gagccggaag ctgatcaacg gcatccggga 3360

caagcagtcc ggcaagacaa tcctggattt cctgaagtcc gacggcttcg ccaacagaaa 3420

cttcatgcag ctgatccacg acgacagcct gacctttaaa gaggacatcc agaaagccca 3480

ggtgtccggc cagggcgata gcctgcacga gcacattgcc aatctggccg gcagccccgc 3540

cattaagaag ggcatcctgc agacagtgaa ggtggtggac gagctcgtga aagtgatggg 3600

ccggcacaag cccgagaaca tcgtgatcga aatggccaga gagaaccaga ccacccagaa 3660

gggacagaag aacagccgcg agagaatgaa gcggatcgaa gagggcatca aagagctggg 3720

cagccagatc ctgaaagaac accccgtgga aaacacccag ctgcagaacg agaagctgta 3780

cctgtactac ctgcagaatg ggcgggatat gtacgtggac caggaactgg acatcaaccg 3840

gctgtccgac tacgatgtgg accatatcgt gcctcagagc tttctgaagg acgactccat 3900

cgacaacaag gtgctgacca gaagcgacaa gaaccggggc aagagcgaca acgtgccctc 3960

cgaagaggtc gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg ccaagctgat 4020

tacccagaga aagttcgaca atctgaccaa ggccgagaga ggcggcctga gcgaactgga 4080

taaggccggc ttcatcaaga gacagctggt ggaaacccgg cagatcacaa agcacgtggc 4140

acagatcctg gactcccgga tgaacactaa gtacgacgag aatgacaagc tgatccggga 4200

agtgaaagtg atcaccctga agtccaagct ggtgtccgat ttccggaagg atttccagtt 4260

ttacaaagtg cgcgagatca acaactacca ccacgcccac gacgcctacc tgaacgccgt 4320

cgtgggaacc gccctgatca aaaagtaccc taagctggaa agcgagttcg tgtacggcga 4380

ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaaa tcggcaaggc 4440

taccgccaag tacttcttct acagcaacat catgaacttt ttcaagaccg agattaccct 4500

ggccaacggc gagatccgga agcggcctct gatcgagaca aacggcgaaa ccggggagat 4560

cgtgtgggat aagggccggg attttgccac cgtgcggaaa gtgctgagca tgccccaagt 4620

gaatatcgtg aaaaagaccg aggtgcagac aggcggcttc agcaaagagt ctatcctgcc 4680

caagaggaac agcgataagc tgatcgccag aaagaaggac tgggacccta agaagtacgg 4740

cggcttcgac agccccaccg tggcctattc tgtgctggtg gtggccaaag tggaaaaggg 4800

caagtccaag aaactgaaga gtgtgaaaga gctgctgggg atcaccatca tggaaagaag 4860

cagcttcgag aagaatccca tcgactttct ggaagccaag ggctacaaag aagtgaaaaa 4920

ggacctgatc atcaagctgc ctaagtactc cctgttcgag ctggaaaacg gccggaagag 4980

aatgctggcc tctgccggcg aactgcagaa gggaaacgaa ctggccctgc cctccaaata 5040

tgtgaacttc ctgtacctgg ccagccacta tgagaagctg aagggctccc ccgaggataa 5100

tgagcagaaa cagctgtttg tggaacagca caagcactac ctggacgaga tcatcgagca 5160

gatcagcgag ttctccaaga gagtgatcct ggccgacgct aatctggaca aagtgctgtc 5220

cgcctacaac aagcaccggg ataagcccat cagagagcag gccgagaata tcatccacct 5280

gtttaccctg accaatctgg gagcccctgc cgccttcaag tactttgaca ccaccatcga 5340

ccggaagagg tacaccagca ccaaagaggt gctggacgcc accctgatcc accagagcat 5400

caccggcctg tacgagacac ggatcgacct gtctcagctg ggaggcgaca aaaggccggc 5460

ggccacgaaa aaggccggcc aggcaaaaaa gaaaaagtaa gaattcctag agctcgctga 5520

tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct 5580

tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca 5640

tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag 5700

ggggaggatt gggaagagaa tagcaggcat gctggggagc ggccgcagga acccctagtg 5760

atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 5820

gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc 5880

ctgcaggggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 5940

atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6000

tggttacgcg cagcgtgacc gctacacttg ccagcgcctt agcgcccgct cctttcgctt 6060

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6120

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgatttgg 6180

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6240

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aactctatct 6300

cgggctattc ttttgattta taagggattt tgccgatttc ggtctattgg ttaaaaaatg 6360

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaattttat 6420

ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc 6480

caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag 6540

ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg 6600

cgagacgaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg 6660

tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat 6720

ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc 6780

aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct 6840

tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag 6900

atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta 6960

agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc 7020

tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca 7080

tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg 7140

atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg 7200

ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca 7260

tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa 7320

acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa 7380

ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata 7440

aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat 7500

ctggagccgg tgagcgtgga agccgcggta tcattgcagc actggggcca gatggtaagc 7560

cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata 7620

gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt 7680

actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga 7740

agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag 7800

cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa 7860

tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag 7920

agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg 7980

ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat 8040

acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta 8100

ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg 8160

gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc 8220

gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa 8280

gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc 8340

tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt 8400

caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct 8460

tttgctggcc ttttgctcac atgt 8484

<210> 2

<211> 10476

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300

gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttc tagcgcgtgc 360

gccaattctg cagacaaatg gctctagagg tacccgttac ataacttacg gtaaatggcc 420

cgcctggctg accgcccaac gacccccgcc cattgacgtc aatagtaacg ccaataggga 480

ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 540

aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 600

ggcattgtgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 660

tagtcatcgc tattaccatg ggggcagagc gcacatcgcc cacagtcccc gagaagttgg 720

ggggaggggt cggcaattga tccggtgcct agagaaggtg gcgcggggta aactgggaaa 780

gtgatgtcgt gtactggctc cgcctttttc ccgagggtgg gggagaaccg tatataagtg 840

cagtagtcgc cgtgaacgtt ctttttcgca acgggtttgc cgccagaaca caggttggac 900

cggtgccacc atggactata aggaccacga cggagactac aaggatcatg atattgatta 960

caaagacgat gacgataaga tggcccccaa aaagaaacga aaggtgggtg ggtccccaaa 1020

gaagaagcgg aaggtcggta tccacggagt cccagcagcc gacaagaagt acagcatcgg 1080

cctggacatc ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc 1140

cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga agaacctgat 1200

cggagccctg ctgttcgaca gcggcgaaac agccgaggcc acccggctga agagaaccgc 1260

cagaagaaga tacaccagac ggaagaaccg gatctgctat ctgcaagaga tcttcagcaa 1320

cgagatggcc aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga 1380

agaggataag aagcacgagc ggcaccccat cttcggcaac atcgtggacg aggtggccta 1440

ccacgagaag taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa 1500

ggccgacctg cggctgatct atctggccct ggcccacatg atcaagttcc ggggccactt 1560

cctgatcgag ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct 1620

ggtgcagacc tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc 1680

caaggccatc ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc tgatcgccca 1740

gctgcccggc gagaagaaga atggcctgtt cggaaacctg attgccctga gcctgggcct 1800

gacccccaac ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa 1860

ggacacctac gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga 1920

cctgtttctg gccgccaaga acctgtccga cgccatcctg ctgagcgaca tcctgagagt 1980

gaacaccgag atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca 2040

ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa 2100

agagattttc ttcgaccaga gcaagaacgg ctacgccggc tacattgacg gcggagccag 2160

ccaggaagag ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga 2220

actgctcgtg aagctgaaca gagaggacct gctgcggaag cagcggacct tcgacaacgg 2280

cagcatcccc caccagatcc acctgggaga gctgcacgcc attctgcggc ggcaggaaga 2340

tttttaccca ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttccgcat 2400

cccctactac gtgggccctc tggccagggg aaacagcaga ttcgcctgga tgaccagaaa 2460

gagcgaggaa accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgcttccgc 2520

ccagagcttc atcgagcgga tgaccaactt cgataagaac ctgcccaacg agaaggtgct 2580

gcccaagcac agcctgctgt acgagtactt caccgtgtat aacgagctga ccaaagtgaa 2640

atacgtgacc gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat 2700

cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga aagaggacta 2760

cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atcggttcaa 2820

cgcctccctg ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga 2880

caatgaggaa aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga 2940

cagagagatg atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg acaaagtgat 3000

gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgagccgga agctgatcaa 3060

cggcatccgg gacaagcagt ccggcaagac aatcctggat ttcctgaagt ccgacggctt 3120

cgccaacaga aacttcatgc agctgatcca cgacgacagc ctgaccttta aagaggacat 3180

ccagaaagcc caggtgtccg gccagggcga tagcctgcac gagcacattg ccaatctggc 3240

cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt 3300

gaaagtgatg ggccggcaca agcccgagaa catcgtgatc gaaatggcca gagagaacca 3360

gaccacccag aagggacaga agaacagccg cgagagaatg aagcggatcg aagagggcat 3420

caaagagctg ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa 3480

cgagaagctg tacctgtact acctgcagaa tgggcgggat atgtacgtgg accaggaact 3540

ggacatcaac cggctgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa 3600

ggacgactcc atcgacaaca aggtgctgac cagaagcgac aagaaccggg gcaagagcga 3660

caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac tactggcggc agctgctgaa 3720

cgccaagctg attacccaga gaaagttcga caatctgacc aaggccgaga gaggcggcct 3780

gagcgaactg gataaggccg gcttcatcaa gagacagctg gtggaaaccc ggcagatcac 3840

aaagcacgtg gcacagatcc tggactcccg gatgaacact aagtacgacg agaatgacaa 3900

gctgatccgg gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa 3960

ggatttccag ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta 4020

cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt 4080

cgtgtacggc gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga 4140

aatcggcaag gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac 4200

cgagattacc ctggccaacg gcgagatccg gaagcggcct ctgatcgaga caaacggcga 4260

aaccggggag atcgtgtggg ataagggccg ggattttgcc accgtgcgga aagtgctgag 4320

catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga 4380

gtctatcctg cccaagagga acagcgataa gctgatcgcc agaaagaagg actgggaccc 4440

taagaagtac ggcggcttcg acagccccac cgtggcctat tctgtgctgg tggtggccaa 4500

agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat 4560

catggaaaga agcagcttcg agaagaatcc catcgacttt ctggaagcca agggctacaa 4620

agaagtgaaa aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa 4680

cggccggaag agaatgctgg cctctgccgg cgaactgcag aagggaaacg aactggccct 4740

gccctccaaa tatgtgaact tcctgtacct ggccagccac tatgagaagc tgaagggctc 4800

ccccgaggat aatgagcaga aacagctgtt tgtggaacag cacaagcact acctggacga 4860

gatcatcgag cagatcagcg agttctccaa gagagtgatc ctggccgacg ctaatctgga 4920

caaagtgctg tccgcctaca acaagcaccg ggataagccc atcagagagc aggccgagaa 4980

tatcatccac ctgtttaccc tgaccaatct gggagcccct gccgccttca agtactttga 5040

caccaccatc gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat 5100

ccaccagagc atcaccggcc tgtacgagac acggatcgac ctgtctcagc tgggaggcga 5160

caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa aagaaaaagg gcggctccaa 5220

gcggcctgcc gcgacgaaga aagcgggaca ggccaagaaa aagaaaggat ccggcgcaac 5280

aaacttctct ctgctgaaac aagccggaga tgtcgaagag aatcctggac cggtgagcaa 5340

gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa 5400

cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac 5460

cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac 5520

cctgacctac ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc agcacgactt 5580

cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga 5640

cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat 5700

cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta 5760

caactacaac agccacaacg tctatatcat ggccgacaag cagaagaacg gcatcaaggt 5820

gaacttcaag atccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca 5880

gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac 5940

ccagtccgcc ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt 6000

cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagggct ccggcgaggg 6060

caggggaagt cttctaacat gcggggacgt ggaggaaaat cccggcccaa ccgagtacaa 6120

gcccacggtg cgcctcgcca cccgcgacga cgtccccagg gccgtacgca ccctcgccgc 6180

cgcgttcgcc gactaccccg ccacgcgcca caccgtcgat ccggaccgcc acatcgagcg 6240

ggtcaccgag ctgcaagaac tcttcctcac gcgcgtcggg ctcgacatcg gcaaggtgtg 6300

ggtcgcggac gacggcgccg cggtggcggt ctggaccacg ccggagagcg tcgaagcggg 6360

ggcggtgttc gccgagatcg gcccgcgcat ggccgagttg agcggttccc ggctggccgc 6420

gcagcaacag atggaaggcc tcctggcgcc gcaccggccc aaggagcccg cgtggttcct 6480

ggccaccgtc ggagtctcgc ccgaccacca gggcaagggt ctgggcagcg ccgtcgtgct 6540

ccccggagtg gaggcggccg agcgcgccgg ggtgcccgcc ttcctggaga cctccgcgcc 6600

ccgcaacctc cccttctacg agcggctcgg cttcaccgtc accgccgacg tcgaggtgcc 6660

cgaaggaccg cgcacctggt gcatgacccg caagcccggt gcctgaacgc gttaagtcga 6720

caatcaacct ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc 6780

tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 6840

tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 6900

gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 6960

tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 7020

tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 7080

gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct 7140

cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 7200

caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 7260

tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc gtcgacttta 7320

agaccaatga cttacaaggc agctgtagat cttagccact ttttaaaaga aaagggggga 7380

ctggaagggc taattcactc ccaacgaaga caagatctgc tttttgcttg tactgggtct 7440

ctctggttag accagatctg agcctgggag ctctctggct aactagggaa cccactgctt 7500

aagcctcaat aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac 7560

tctggtaact agagatccct cagacccttt tagtcagtgt ggaaaatctc tagcagggcc 7620

cgtttaaacc cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 7680

cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 7740

aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 7800

ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 7860

gggctctatg gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 7920

atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 7980

cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ttagcgcccg 8040

ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 8100

taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 8160

aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 8220

ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 8280

tcaactctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggtctatt 8340

ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 8400

ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 8460

cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 8520

cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 8580

caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 8640

tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 8700

ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 8760

gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 8820

cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 8880

tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 8940

tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 9000

cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 9060

tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 9120

agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 9180

ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 9240

ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 9300

aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 9360

gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 9420

tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 9480

ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 9540

cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 9600

atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 9660

cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 9720

ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 9780

cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 9840

ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 9900

tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 9960

taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 10020

caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 10080

agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 10140

gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 10200

gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 10260

ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 10320

acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 10380

tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 10440

ggttcctggc cttttgctgg ccttttgctc acatgt 10476

<210> 3

<211> 3120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60

cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120

tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180

aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240

ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300

ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360

tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420

tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480

actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540

gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600

acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660

gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720

acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780

gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840

ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900

gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960

cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020

agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080

catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140

tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200

cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260

gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320

taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 1380

ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440

tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500

ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560

cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620

agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680

gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740

atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800

gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860

gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920

ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980

cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040

cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100

acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160

cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220

accatgatta cgccaagctt gcatgcaggc ctctgcagtc gacgggcccg ggatccgatg 2280

ataaacatgt gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 2340

tgttagagag ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 2400

gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 2460

ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 2520

gtggaaagga cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag 2580

ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttc 2640

tagcgcgtgc gccaattctg cagacaaatg gctctagagg tacccataga tctagatgca 2700

ttcgcgaggt accgagctcg aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa 2760

accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta 2820

atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat 2880

ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt 2940

gcactctcag tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa 3000

cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 3060

tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 3120

<210> 4

<211> 14138

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

ggcgcgccct ctacctgctc tcggacccgt gggggtgggg ggtggaggaa ggagtggggg 60

gtcggtcctg ctggcttgtg ggtgggaggc gcatgttctc caaaaacccg cgcgagctgc 120

aatcctgagg gagctgcagt ggaggaggcg gagagaaggc cgcacccttc tccgcagggg 180

gaggggagtg ccgcaatacc tttatgggag ttctctgctg cctccttttc ctaaggaccg 240

ccctgggcct agaaaaatcc ctccctcccc cgcgatctcg tcatcgcctc catgtcagtt 300

tgctccttct cgattatggg cgggattctt ttgccctggc gcgccccaga cccgggcctg 360

gggggcaagt cggggggcgg ggggaggtcg ggcagggtcc cctgggagga tggggacgtg 420

ctgtgcccct agcggccacc agagggcacc aggacaccac tgcggtcggc tcagcggctc 480

ctgccctggt cagggggcgc caggtcctgc ccctcctggg gagggcgggg ggcgagaagg 540

gcgattttaa ttaacccacg tttcaacatg cacatcccag taatttggaa acattttgtt 600

tccaaagatt cacttaacat tggtttagca acatgaagct ttctatgcaa cccaaggact 660

cagtttttgg cctgttttag tgacaggcaa tcagcaacat gctgcatttc tctccagtgt 720

tgtaatcaaa gaaaccctcc catagcttta aatgatattc cttccccttc caattatgtg 780

gggggaaaac aaccctattc tccacccaga agtgttaact caagaattac attttcaaga 840

agtttccaga ttcgtaaaac cagaattaga tgtctttcac ctaaatgtct cggtgttgac 900

caaaggaaca cacaggtttc tcatttaact tttttaatgg gtctcaaaat tctgtgacaa 960

atttttggtc aagttgtttc cattaaaaag tactgatttt aaaaactaat aacttaaaac 1020

tgccacacgc aaaaaagaaa accaaagtgg tccacaaaac attctccttt ccttctgaag 1080

gttttacgat gcattgttat cattaaccag tcttttacta ctaaacttaa atggccaatt 1140

gaaacaaaca gttctgagac cgttcttcca ccactgatta agagtggggt ggcaggtatt 1200

agggataatg ctagcttact tgtacagctc gtccatgccg agagtgatcc cggcggcggt 1260

cacgaactcc agcaggacca tgtgatcgcg cttctcgttg gggtctttgc tcagggcgga 1320

ctgggtgctc aggtagtggt tgtcgggcag cagcacgggg ccgtcgccga tgggggtgtt 1380

ctgctggtag tggtcggcga gctgcacgct gccgtcctcg atgttgtggc ggatcttgaa 1440

gttcaccttg atgccgttct tctgcttgtc ggccatgata tagacgttgt ggctgttgta 1500

gttgtactcc agcttgtgcc ccaggatgtt gccgtcctcc ttgaagtcga tgcccttcag 1560

ctcgatgcgg ttcaccaggg tgtcgccctc gaacttcacc tcggcgcggg tcttgtagtt 1620

gccgtcgtcc ttgaagaaga tggtgcgctc ctggacgtag ccttcgggca tggcggactt 1680

gaagaagtcg tgctgcttca tgtggtcggg gtagcggctg aagcactgca cgccgtaggt 1740

cagggtggtc acgagggtgg gccagggcac gggcagcttg ccggtggtgc agatgaactt 1800

cagggtcagc ttgccgtagg tggcatcgcc ctcgccctcg ccggacacgc tgaacttgtg 1860

gccgtttacg tcgccgtcca gctcgaccag gatgggcacc accccggtga acagctcctc 1920

gcccttgctc accatggtgg cgtcgaccgt acgtcacgac acctgaaatg gaagaaaaaa 1980

actttgaacc actgtctgag gcttgagaat gaaccaagat ccaaactcaa aaagggcaaa 2040

ttccaaggag aattacatca agtgccaagc tggcctaact tcagtctcca cccactcagt 2100

gtggggaaac tccatcgcat aaaacccctc cccccaacct aaagacgacg tactccaaaa 2160

gctcgagaac taatcgaggt gcctggacgg cgcccggtac tccgtggagt cacatgaagc 2220

gacggctgag gacggaaagg cccttttcct ttgtgtgggt gactcacccg cccgctctcc 2280

cgagcgccgc gtcctccatt ttgagctccc tgcagcaggg ccgggaagcg gccatctttc 2340

cgctcacgca actggtgccg accgggccag ccttgccgcc cagggcgggg cgatacacgg 2400

cggcgcgagg ccaggcacca gagcaggccg gccagcttga gactaccccc gtccgattct 2460

cggtggccgc gctcgcaggc cccgcctcgc cgaacatgtg cgctgggacg cacgggcccc 2520

gtcgccgccc gcggccccaa aaaccgaaat accagtgtgc agatcttggc ccgcatttac 2580

aagactatct tgccagaaaa aaagcgtcgc agcaggtcat caaaaatttt aaatggctag 2640

agacttatcg aaagcagcga gacaggcgcg aaggtgccac cagattcgca cgcggcggcc 2700

ccagcgccca ggccaggcct caactcaagc acgaggcgaa ggggctcctt aagcgcaagg 2760

cctcgaactc tcccacccac ttccaacccg aagctcggga tcaagaatca cgtactgcag 2820

ccagtggaag taattcaagg cacgcaaggg ccataacccg taaagaggcc aggcccgcgg 2880

gaaccacaca cggcacttac ctgtgttctg gcggcaaacc cgttgcgaaa aagaacgttc 2940

acggcgacta ctgcacttat atacggttct cccccaccct cgggaaaaag gcggagccag 3000

tacacgacat cactttccca gtttaccccg cgccaccttc tctaggcacc ggttcaattg 3060

ccgacccctc cccccaactt ctcggggact gtgggcgatg tgcgctctgc ccactgacgg 3120

gcaccggagc cctagattcg attccctttg gggcaaaact caccgcctaa tcccctataa 3180

ctctaccggg gagcccggtg gagagcagac gggctgacgc tgccacctgc cggccatccc 3240

aggataggac cgccgtattc aagtcgccct caggaaggac cctcggggca ccagaggcct 3300

tcgaagcccc aatgagtgag gcaactgagg gtcgcgggtg ccattacaag gcccagccaa 3360

ggcctagagc caaggcttga accgtggggg acccccaagc cccacctgcc caggaacagc 3420

agacactggg acactttgtt tcaggtcctg cccaggcccc tcccactgtg aggctgggat 3480

ttgtcgccca gggtgcagat gagaagagtg gggaaagcag tcctgagcca ggaaattcta 3540

ccgggtaggg gaggcgcttt tcccaaggca gtctggagca tgcgctttag cagccccgct 3600

gggcacttgg cgctacacaa gtggcctctg gcctcgcaca cattccacat ccaccggtag 3660

gcgccaaccg gctccgttct ttggtggccc cttcgcgcca ccttctactc ctcccctagt 3720

caggaagttc ccccccgccc cgcagctcgc gtcgtgcagg acgtgacaaa tggaagtagc 3780

acgtctcact agtctcgtgc agatggacag caccgctgag caatggaagc gggtaggcct 3840

ttggggcagc ggccaatagc agctttgctc cttcgctttc tgggctcaga ggctgggaag 3900

gggtgggtcc gggggcgggc tcaggggcgg gctcaggggc ggggcgggcg cccgaaggtc 3960

ctccggaggc ccggcattct gcacgcttca aaagcgcacg tctgccgcgc tgttctcctc 4020

ttcctcatct ccgggccttt cgacctccta gggccaccat ggtgagcaag ggcgaggacg 4080

acaacatggc catcatcaag gagttcatgc gcttcaaggt gcacatggag ggctccgtga 4140

acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag ggcacccaga 4200

ccgccaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac atcctgtccc 4260

ctcagttcat gtacggctcc aaggcctacg tgaagcaccc cgccgacatc cccgactact 4320

tgaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg 4380

gcgtggtgac cgtgacccag gactcctccc tgcaggacgg cgagttcatc tacaaggtga 4440

agctgcgcgg caccaacttc ccctccgacg gccccgtaat gcagaagaag accatgggct 4500

gggaggcctc ctccgagcgg atgtaccccg aggacggcgc cctgaagggc gagatcaagc 4560

agaggctgaa gctgaaggac ggcggccact acgacgccga ggtcaagacc acctacaagg 4620

ccaagaagcc cgtgcagctg cccggcgcct acaacgtcaa catcaagctg gacatcacct 4680

cccacaacga ggactacacc atcgtggaac agtacgagcg cgccgagggc cgccactcca 4740

ccggcggcat ggacgagctg tacaagtgag gatccgctga tcagcctcga ctgtgccttc 4800

tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 4860

cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 4920

tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 4980

tagcaggcat gctggggatg cggtgggctc tatggcttct gaggcggaaa gaacccttct 5040

gaggcggaaa gaaccagctg ccttaatata acttcgtata atgtatgcta tacgaagtta 5100

ttaggtctga agaggagttt acgtccagcc aattctgtgg aatgtgtgtc agttagggtg 5160

tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc 5220

agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 5280

tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 5340

gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 5400

cgaggccgcc tctgcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 5460

aggcttttgc aaaaagctcc cgggagcttg tatatccatt ttcggcggcc gcgccaccat 5520

gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac gacgtcccca gggccgtacg 5580

caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg atccggaccg 5640

ccacatcgag cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg ggctcgacat 5700

cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca cgccggagag 5760

cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc atggccgagt tgagcggttc 5820

ccggctggcc gcgcagcaac agatggaagg cctcctggcg ccgcaccggc ccaaggagcc 5880

cgcgtggttc ctggccaccg tcggagtctc gcccgaccac cagggcaagg gtctgggcag 5940

cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg ccttcctgga 6000

gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg tcaccgccga 6060

cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg gtgcctgaga 6120

attcgcggga ctctggggtt cgaaatgacc gaccaagcga cgcccaacct gccatcacga 6180

gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 6240

gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac 6300

ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 6360

aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 6420

catgtctgta taccgctcga ctagagcttg cggaaccctt aatataactt cgtataatgt 6480

atgctatacg aagttattag gtccgctggc catctacgag ccaaagactt tcaaatcttt 6540

ggctgccttg gccagtagga ggcgacacga aggatttgct gctgccttgg gggatgggaa 6600

ggaacctgaa ggcatttttt ccagagtggt gcagtaccac tgaggactgt tgctgtattg 6660

attaggaaaa gagacagagt aatttgcagt ttgtttgatt tatactgggc tgcaggtcga 6720

gggatcttca taagagaaga gggacagcta tgactgggag tagtcaggag aggaggaaaa 6780

atctggctag taaaacatgt aaggaaaatt ttagggatgt taaagaaaaa aataacacaa 6840

aacaaaatat aaaaaaaatc taacctcaag tcaaggcttt tctatggaat aaggaatgga 6900

cagcaggggg ctgtttcata tactgatgac ctctttatag ccacctttgt tcatggcagc 6960

cagcatatgg catatgttgc caaactctaa accaaatact cattctgatg ttttaaatga 7020

tttgccctcc catatgtcct tccgagtgag agacacaaaa aattccaaca cactattgca 7080

atgaaaataa atttccttta ttagccagaa gtcagatgct caaggggctt catgatgtcc 7140

ccataatttt tggcagaggg aaaaagatct cagtggtatt tgtgagccag ggcattggcc 7200

acaccagcca ccaccttctg ataggcagcc tgcggtacct tacatggtgg cgaattcgtt 7260

tgccaaaatg atgagacagc acaataacca gcacgttgcc caggagctgt aggaaaaaga 7320

agaaggcatg aacatggtta gcagaggctc tagagccgcc ggtcacacgc cagaagccga 7380

accccgccct gccccgtccc ccccgaaggc agccgtcccc ctgcggcagc cccgaggctg 7440

gagatggaga aggggacggc ggcgcggcga cgcacgaagg ccctccccgc ccatttcctt 7500

cctgccggcg ccgcaccgct tcgcccgcgc ccgctagagg gggtgcggcg gcgcctccca 7560

gatttcggct ccgccagatt tgggacaaag gaagtccctg cgccctctcg cacgattacc 7620

ataaaaggca atggctgcgg ctcgccgcgc ctcgacagcc gccggcgctc cggggccgcc 7680

gcgcccctcc cccgagccct ccccggcccg aggcggcccc gccccgcccg gcacccccac 7740

ctgccgccac cccccgcccg gcacggcgag ccccgcgcca cgccccgcac ggagccccgc 7800

acccgaagcc gggccgtgct cagcaactcg gggagggggg tgcagggggg ggttacagcc 7860

cgaccgccgc gcccacaccc cctgctcacc cccccacgca cacaccccgc acgcagcctt 7920

tgttcccctc gcagcccccc cgcaccgcgg ggcaccgccc ccggccgcgc tcccctcgcg 7980

cacacgcgga gcgcacaaag ccccgcgccg cgcccgcagc gctcacagcc gccgggcagc 8040

gcgggccgca cgcggcgctc cccacgcaca cacacacgca cgcacccccc gagccgctcc 8100

cccccgcaca aagggccctc ccggagccct ttaaggcttt cacgcagcca cagaaaagaa 8160

acgagccgtc attaaaccaa gcgctaatta cagcccggag gagaagggcc gtcccgcccg 8220

ctcacctgtg ggagtaacgc ggtcagtcag agccggggcg ggcggcgcga ggcggcgcgg 8280

agcggggcac ggggcgaagg caacgcagcg actcccgccc gccgcgcgct tcgcttttta 8340

tagggccgcc gccgccgccg cctcgccata aaaggaaact ttcggagcgc gccgctctga 8400

ttggctgccg ccgcacctct ccgcctcgcc ccgccccgcc cctcgccccg ccccgccccg 8460

cctggcgcgc gccccccccc cccccgcccc catcgctgca caaaataatt aaaaaataaa 8520

taaatacaaa attgggggtg gggagggggg ggagatgggg agagtgaagc agaacgtggg 8580

gctcacctcg acccatggta atagcgatga ctaatacgta gatgtactgc caagtaggaa 8640

agtcccataa ggtcatgtac tgggcataat gccaggcggg ccatttaccg tcattgacgt 8700

caataggggg cgtacttggc atatgataca cttgatgtac tgccaagtgg gcagtttacc 8760

gtaaatagtc cacccattga cgtcaatgga aagtccctat tggcgttact atgggaacat 8820

acgtcattat tgacgtcaat gggcgggggt cgttgggcgg tcagccaggc gggccattta 8880

ccgtaagtta tgtaacgcgg aactccatat atgggctatg aactaatgac cccgtaattg 8940

attactatta ataactagtc aataatcaat gtcgtaaatg tcgtaaatgt ctcagctagt 9000

caggtagtaa aaggtgtcaa ctaggcagtg gcagagcagg attcaaattc agggctgttg 9060

tgatgcctcc gcagactctg agcgccacct ggtggtaatt tgtctgtgcc tcttctgacg 9120

tggaagaaca gcaactaaca cactaacacg gcatttacta tgggccagcc attgtacgcg 9180

ttgcttaacc tgattcttgg gcgttgtcct gcaggggatt gagcaggtgt acgaggacga 9240

gcccaatttc tctatattcc cacagtcttg agtttgtgtc acaaaataat tatagtgggg 9300

tggagatggg aaatgagtcc aggcaacacc taagcctgat tttatgcatt gagactgcgt 9360

gttattacta aagatctttg tgtcgcaatt tcctgatgaa gggagatagg ttaaaaagca 9420

cggatctact gagttttaca gtcatcccat ttgtagactt ttgctacacc accaaagtat 9480

agcatctgag attaaatatt aatctccaaa ccttaggccc cctcacttgc atccttacgg 9540

tcagataact ctcactcata ctttaagccc attttgtttg ttgtacttgc tcatccagtc 9600

ccagacatag cattggcttt ctcctcacct gttttaggta gccagcaagt catgaaatca 9660

gataagttcc accaccaatt aacactaccc atcttgagca taggcccaac agtgcattta 9720

ttcctcattt actgatgttc gtgaatattt accttgattt tcattttttt ctttttctta 9780

agctgggatt ttactcctga ccctattcac agtcagatga tcttgactac cactgcgatt 9840

ggacctgagg ttcagcaata ctccccttta tgtcttttga atacttttca ataaatctgt 9900

ttgtattttc attagttagt aactgagctc agttgccgta atgctaatag cttccaaact 9960

agtgtctctg tctccagtat ctgataaatc ttaggtgttg ctgggacagt tgtcctaaaa 10020

ttaagataaa gcatgaaaat aactgacaca actccattac tggctcctaa ctacttaaac 10080

aatgcattct atcatcacaa atgtgaaaaa ggagttccct cagtggacta accttatctt 10140

ttctcaacac ctttttcttt gcacaatttt ccacacatgc ctacaaaaag tacttatgcg 10200

gccgccataa aagttttgtt actttataga agaaattttg agtttttgtt ttttttaata 10260

aataaataaa cataaataaa ttgtttgttg aatttattat tagtatgtaa gtgtaaatat 10320

aataaaactt aatatctatt caaattaata aataaacctc gatatacaga ccgataaaac 10380

acatgcgtca attttacaca tgattatctt taacgtacgt cacaatatga ttatctttct 10440

agggttaatc tagctgcgtg ttctgcagcg tgtcgagcat cttcatctgc tccatcacgc 10500

tgtaaaacac atttgcaccg cgagtctgcc cgtcctccac gggttcaaaa acgtgaatga 10560

acgaggcgcg ctcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta 10620

cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg 10680

cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg gacgcgccct 10740

gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 10800

ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 10860

gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 10920

ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 10980

gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 11040

tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 11100

tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 11160

ttaacaaaat attaacgctt acaatttagg tggcactttt cggggaaatg tgcgcggaac 11220

ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc 11280

ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt 11340

cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct 11400

ggtgaaagta aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga 11460

tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag 11520

cacttttaaa gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca 11580

actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga 11640

aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag 11700

tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc 11760

ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa 11820

tgaagccata ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt 11880

gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 11940

gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 12000

tattgctgat aaatctggag ccggtgagcg tggttcacgc ggtatcattg cagcactggg 12060

gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 12120

ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 12180

gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa 12240

aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 12300

ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 12360

ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 12420

tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 12480

gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt 12540

agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 12600

taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 12660

gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 12720

gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 12780

caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 12840

aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 12900

tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 12960

acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 13020

ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 13080

gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 13140

tctccccgcg cgttggccga ttcattaatg cagctggcac gacaggtttc ccgactggaa 13200

agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg caccccaggc 13260

tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt gtgagcggat aacaatttca 13320

cacaggaaac agctatgacc atgattacgc caagcgcgcc cgccgggtaa ctcacggggt 13380

atccatgtcc atttctgcgg catccagcca ggatacccgt cctcgctgac gtaatatccc 13440

agcgccgcac cgctgtcatt aatctgcaca ccggcacggc agttccggct gtcgccggta 13500

ttgttcgggt tgctgatgcg cttcgggctg accatccgga actgtgtccg gaaaagccgc 13560

gacgaactgg tatcccaggt ggcctgaacg aacagttcac cgttaaaggc gtgcatggcc 13620

acaccttccc gaatcatcat ggtaaacgtg cgttttcgct caacgtcaat gcagcagcag 13680

tcatcctcgg caaactcttt ccatgccgct tcaacctcgc gggaaaaggc acgggcttct 13740

tcctccccga tgcccagata gcgccagctt gggcgatgac tgagccggaa aaaagacccg 13800

acgatatgat cctgatgcag ctagattaac cctagaaaga tagtctgcgt aaaattgacg 13860

catgcattct tgaaatattg ctctctcttt ctaaatagcg cgaatccgtc gctgtgcatt 13920

taggacatct cagtcgccgc ttggagctcc cgtgaggcgt gcttgtcaat gcggtaagtg 13980

tcactgattt tgaactataa cgaccgcgtg agtcaaaatg acgcatgatt atcttttacg 14040

tgacttttaa gatttaactc atacgataat tatattgtta tttcatgttc tacttacgtg 14100

ataacttatt atatatatat tttcttgtta tagatatc 14138

<210> 5

<211> 345

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

ggcgcgccct ctacctgctc tcggacccgt gggggtgggg ggtggaggaa ggagtggggg 60

gtcggtcctg ctggcttgtg ggtgggaggc gcatgttctc caaaaacccg cgcgagctgc 120

aatcctgagg gagctgcagt ggaggaggcg gagagaaggc cgcacccttc tccgcagggg 180

gaggggagtg ccgcaatacc tttatgggag ttctctgctg cctccttttc ctaaggaccg 240

ccctgggcct agaaaaatcc ctccctcccc cgcgatctcg tcatcgcctc catgtcagtt 300

tgctccttct cgattatggg cgggattctt ttgccctggc gcgcc 345

<210> 6

<211> 1012

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

cttaacctga ttcttgggcg ttgtcctgca ggggattgag caggtgtacg aggacgagcc 60

caatttctct atattcccac agtcttgagt ttgtgtcaca aaataattat agtggggtgg 120

agatgggaaa tgagtccagg caacacctaa gcctgatttt atgcattgag actgcgtgtt 180

attactaaag atctttgtgt cgcaatttcc tgatgaaggg agataggtta aaaagcacgg 240

atctactgag ttttacagtc atcccatttg tagacttttg ctacaccacc aaagtatagc 300

atctgagatt aaatattaat ctccaaacct taggccccct cacttgcatc cttacggtca 360

gataactctc actcatactt taagcccatt ttgtttgttg tacttgctca tccagtccca 420

gacatagcat tggctttctc ctcacctgtt ttaggtagcc agcaagtcat gaaatcagat 480

aagttccacc accaattaac actacccatc ttgagcatag gcccaacagt gcatttattc 540

ctcatttact gatgttcgtg aatatttacc ttgattttca tttttttctt tttcttaagc 600

tgggatttta ctcctgaccc tattcacagt cagatgatct tgactaccac tgcgattgga 660

cctgaggttc agcaatactc ccctttatgt cttttgaata cttttcaata aatctgtttg 720

tattttcatt agttagtaac tgagctcagt tgccgtaatg ctaatagctt ccaaactagt 780

gtctctgtct ccagtatctg ataaatctta ggtgttgctg ggacagttgt cctaaaatta 840

agataaagca tgaaaataac tgacacaact ccattactgg ctcctaacta cttaaacaat 900

gcattctatc atcacaaatg tgaaaaagga gttccctcag tggactaacc ttatcttttc 960

tcaacacctt tttctttgca caattttcca cacatgccta caaaaagtac tt 1012

<210> 7

<211> 1073

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

gtgctgagtc cttttcccat cccacccacc tggagctccc ctcttccagt cctgagccac 60

ttgaactggc ctggtttttg ccatcctgcg ctgccctctc tccggactcg agccactgct 120

gagggcctca ggccagtcca tcctcgtctt gtctctttcg ccctgctctt tccccacctt 180

gagcgctctt aaccagcctg gcccgtgcca cctctactct gccatcgaat gctgccccac 240

tttctcgagt ccgccacttc tcccagcttc accggtaccc actgtttccc ctagtccagg 300

caggtaccac tttccctgag cgtcctcctc ctctctcctg ggcctgtgct gcttcttttc 360

ccgctctctg gcctgggccg tttcttcggc cagcccccga gccttccatg ccctttcctt 420

caggtttctg ctcttcatcc ttggtctctg ccatctgttg ccatgtaagg gtgctctttc 480

ctgagccatc gccctcaagg cgctctgctc ctcaagtgga tgcttccctc gcctggctca 540

cctcctgctc tctctcctgc ccccttcacc tgcgtgccct cctcattctc cctctgtgcc 600

acctctggcc ttgcactgta ggctctctct tggggatgtt tctccttctc cacacacttc 660

tctttcactc tgtcctcttg ctttgtgtgg gcctgcagcg ttaccctttt ttctgggcac 720

actcagagca ccctcctctt tctggttctg ggccacctgt ctgtcctcgg gtcatcttgc 780

tctctctgcc tggatgccct cctgtggctt tgggcagctt ctccctcctt cagagtgcac 840

cgccagttct cctaggcccg gtcacttccc cttcccaggg gacctagagc cctgctaggt 900

cctctctctc cacaacctgg gcccccaaac ctttccaaaa caccttgctt tctgcctcca 960

ttggtcttgt gttccagagc cagagtcact atatgtccca gaaccaggat tccctctggt 1020

tctgagggct tttatcgcat cccctgcctg gctgcagtgg gtctttgggc gcc 1073

<210> 8

<211> 260

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

gacaggccac agaagagcct ctactcctcc ctctgtcccc gaggctgtct ccctcccagt 60

cttcccagct caggccagtc cccaggcctc tcttccctgc cagagcccgt caggttcggt 120

tactttgggg cccagagagg accctgtgaa ggaagcgtgg gtaggggcac gggaatgggg 180

aggatgcctg aagaggcccc cttagccaga agaggagcag aagaggagca ggtacccaga 240

agaggagcag ttcagggaaa 260

<210> 9

<211> 546

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

aaatacccac gtttattggg acaaaagttg ttagggaaaa tggggcctca gagttatgat 60

tcaagtcata attctttcca tttataattt cactcgagac tctgttaact gattccttgt 120

gtgttgtatc ttactcctca gctcacaatt acttttagtt attcacctta actgtatgaa 180

taacagtgga gaaaaggatt ctaccagaat actctaatta tggttttgag tcccctttcc 240

agactgaaga tttttcagtc tttttgatct gaggtgattt ttcagtcttt tcgatctgag 300

gtgacagtct caagctcctc aattcaccca gtctcttgat acttgtccat ttagggccac 360

caaagctact ttgacttcat actagagagt caattaatga ggccattctc tgatggacag 420

gtgaagcagg caaggtgact atattttgac taaacggtag aaaacagcct gagtgttaac 480

agtgtagcct ataaaaccca gagctgccca ccctgatcta aacttccagg aacataagaa 540

cgcgcc 546

<210> 10

<211> 1009

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

agtaggtcac atttcagtaa aacctggctt tgtggattga gcatggtctg tctcttcctg 60

gtacttcatt agtcccctaa gtgggatttg ctgagcaaga ctcctcaatt acagaaatac 120

tccagtttag aattctcgca aaggcttttt gtttccacaa gtagaatcta gaaagcaatc 180

tcaagtaaca acagcagaga cctgaatccc aatccatctt tcctgtgtgt cctcttttac 240

ctccttccct ttcatgttga accaacagtc ctttttcagt ctagaagcta gtacgaaaga 300

aatgtacaga tgtaggtacc aagcaaagcc attagccaat aactggtgag atggagctaa 360

gaggaaataa aagtgttcct aagaatagca cagcagaagc tagatccaca gatcttaaaa 420

caattttggt tgagtaagag tagaggcaaa agaggaagct aataatgcag tttttaggag 480

ctaagagcca gataaagggt aagggcagga ggaagtgcta tctcagctaa cgagatacat 540

gaaacaacgg tggaagtcca gcaggcacaa gatgagttga gaagcaatca gggccagaag 600

gatgtgcaag gcctcaaaat aaaaaagcac agggccacag ggaaccttat ggaaattaaa 660

aggaagagga tgcagtcagg agaggaaaaa atagtgctcc ctcccccatg cccaaggaag 720

cagctgagca gccagtactt gggaagttag tagtaataag ttggtaagag ggagttctgt 780

tcgtggctca atggttaaca aatcagacta gaaaccgtga ggttgcgggt ttgatccctg 840

gccttgctca gtgggttaag gatccggcat tgccgtgacc tgtggtgtag gtcacagacg 900

tggctcagtt cccgcattcc tgtggctctg gtgtaggctg gtggctacag ctctgattag 960

acccctaggc tgggaacctc catatgccct ggaagtggcc gtagaaaag 1009

<210> 11

<211> 878

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

ggatggggac tcatgtgaat tttctaaagg tgctatttaa acggggggca cgagtgccgg 60

ctttggacag ggccgctcgc tctccaccct ttcttcttcc ccctcggccg cctctcaccc 120

cctgaggcct ctctcccccc acgacctcct ctctctcctc tgaaaccctc tcctcctcag 180

ctgcatccca ccctcgtggc ctctctctct ctctgtctgt cctgtgtcct ctctcactgg 240

gtttcagagc acagatgccc aaagcacaaa agcagttttc ccctggggtg ggaggaagca 300

agagactttg tacctatttt gtatgtgtat aataatttga gatgttttta attattttga 360

ttgctggaat aaagcatgtg gaaatgaccc aaaccaatct tgcactggcc tcctgatttc 420

cttccttgga gacggaggga gggggagacc tgggggaggg cgcttggggg ggggtgggct 480

ctcttctttc tgcgctcccc ccccccacct ccaacacctt gacgacccct cctgcttccg 540

cttgcctttc tcaggcttta acactttctc ctcgccctct cagcatgcgc atgcgcgtgc 600

ctctacctcc cccgcacatc ctggcctgcc caccctgaat ggcctggccc agcgatgcca 660

ccaactctct cgctccgtcc acggctgggg aggggggcac tctgcagggt tggggggcac 720

tgggaggctg ggttgggtga gggaggggtg cctgggcccc caccccccag caagttctct 780

ccctaggcga actggagggt cgtctggcct cttgagcctt gttgctggct ctgagctcta 840

ccaagagagt gaccagcagg accgcaccat cacgcgcc 878

<210> 12

<211> 727

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

gtggttgctg agactgcgtg ggggcccaag gagacctgga gaaaggaatg cttcctgctc 60

cttcttctgg ggccccagga gagccttccc agggccttgg agaggtgctg tccagggact 120

aaccctgtgc tctaggaagg ctgcaggccc tgaccagctg ggcaggtcct gggtccctcc 180

tggccttcta agttccccaa acatgagacc tctgggtgtg gggtggcctg gggaggtcat 240

tttgcccagg ccctacctcc tgcccattcc taaccctttt taaaaatctg tgcgtcctct 300

tcttccttct tctccctccc ttcccttttc gctcaccctc tgctgctggc ctgagagccg 360

gaggccccca gggggaaggc gactggtctc ctccccagtc tcagggaagg gagacagaga 420

atccaggaag ccagaactca gcagacgaag cacccaggga cctagagatg ggttgaaaag 480

ttgacagctg tcccacctgc ctcccaaggt ctcagggcct aaacctccaa ggcaggaaag 540

gcccctgtcc ctccctgggg tccatagaaa gagggacaag tctgcacgga ccatttgctg 600

taatattaac accttggctg tcattaggta gtcttggctg ttaattatgt cctgtgataa 660

tgtattatta gcacgccgac cacatagggt agggaactgc agctagtaaa caaaagtttg 720

ttcctat 727

<210> 13

<211> 12075

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

ggcgcgccgg atggggactc atgtgaattt tctaaaggtg ctatttaaac ggggggcacg 60

agtgccggct ttggacaggg ccgctcgctc tccacccttt cttcttcccc ctcggccgcc 120

tctcaccccc tgaggcctct ctccccccac gacctcctct ctctcctctg aaaccctctc 180

ctcctcagct gcatcccacc ctcgtggcct ctctctctct ctgtctgtcc tgtgtcctct 240

ctcactgggt ttcagagcac agatgcccaa agcacaaaag cagttttccc ctggggtggg 300

aggaagcaag agactttgta cctattttgt atgtgtataa taatttgaga tgtttttaat 360

tattttgatt gctggaataa agcatgtgga aatgacccaa accaatcttg cactggcctc 420

ctgatttcct tccttggaga cggagggagg gggagacctg ggggagggcg cttggggggg 480

ggtgggctct cttctttctg cgctcccccc ccccacctcc aacaccttga cgacccctcc 540

tgcttccgct tgcctttctc aggctttaac actttctcct cgccctctca gcatgcgcat 600

gcgcgtgcct ctacctcccc cgcacatcct ggcctgccca ccctgaatgg cctggcccag 660

cgatgccacc aactctctcg ctccgtccac ggctggggag gggggcactc tgcagggttg 720

gggggcactg ggaggctggg ttgggtgagg gaggggtgcc tgggccccca ccccccagca 780

agttctctcc ctaggcgaac tggagggtcg tctggcctct tgagccttgt tgctggctct 840

gagctctacc aagagagtga ccagcaggac cgcaccatca cgcgccccag acccgggcct 900

ggggggcaag tcggggggcg gggggaggtc gggcagggtc ccctgggagg atggggacgt 960

gctgtgcccc tagcggccac cagagggcac caggacacca ctgcggtcgg ctcagcggct 1020

cctgccctgg tcagggggcg ccaggtcctg cccctcctgg ggagggcggg gggcgagaag 1080

ggcgattagt gcaagtgggt tttaggacca ggatgaggcg gggtgggggt gcctacctga 1140

cgaccgaccc cgacccactg gacaagcacc caacccccat tccccaaatt gcgcatcccc 1200

tatcagagag ggggagggga aacaggatgc ggcgaggcgc gtgcgcactg ccagcttcag 1260

caccgcggac agtgccttcg cccccgcctg gcggcgcgcg ccaccgccgc ctcagcactg 1320

aaggcgcgct gacgtcactc gccggtcccc cgcaaactcc ccttcccggc caccttggtc 1380

gcgtccgcgc cgccgccggc ccagccggac cgcaccacgc gaggcgcgag ataggggggc 1440

acgggcgcga ccatctgcgc tgcggcgccg gcgactcagc gctgcctcag tctgcggtgg 1500

gcagcggagg agtcgtgtcg tgcctgagag cgcagtcgac tctagagctt ggtaccgcgg 1560

gcccgggatc caccggtcgc caccatggcc caagccctgc cctggctcct gctgtggatg 1620

ggcgcgggag tgctgcctgc ccacggcacc cagcacggca tccggctgcc cctgcgcagc 1680

ggcctggggg gcgcccccct ggggctgcgg ctgccccggg agaccgacga agagcccgag 1740

gagcccggcc ggaggggcag ctttgtggag atggtggaca acctgagggg caagtcgggg 1800

cagggctact acgtggagat gaccgtgggc agccccccgc agacgctcaa catcctggtg 1860

gatacaggca gcagtaactt tgcagtgggt gctgcccccc accccttcct gcatcgctac 1920

taccagaggc agctgtccag cacataccgg gacctccgga agggtgtgta tgtgccctac 1980

acccagggca agtgggaagg ggagctgggc accgacctgg taagcatccc ccatggcccc 2040

aacgtcactg tgcgtgccaa cattgctgcc atcactgaat cagacaagtt cttcatcaac 2100

ggctccaact gggaaggcat cctggggctg gcctatgctg agattgccag gcctgacgac 2160

tccctggagc ctttctttga ctctctggta aagcagaccc acgttcccaa cctcttctcc 2220

ctgcagcttt gtggtgctgg cttccccctc aaccagtctg aagtgctggc ctctgtcgga 2280

gggagcatga tcattggagg tatcgaccac tcgctgtaca caggcagtct ctggtataca 2340

cccatccggc gggagtggta ttatgaggtg atcattgtgc gggtggagat caatggacag 2400

gatctgaaaa tggactgcaa ggagtacaac tatgacaaga gcattgtgga cagtggcacc 2460

accaaccttc gtttgcccaa gaaagtgttt gaagctgcag tcaaatccat caaggcagcc 2520

tcctccacgg agaagttccc tgatggtttc tggctaggag agcagctggt gtgctggcaa 2580

gcaggcacca ccccttggaa cattttccca gtcatctcac tctacctaat gggtgaggtt 2640

accaaccagt ccttccgcat caccatcctt ccgcagcaat acctgcggcc agtggaagat 2700

gtggccacgt cccaagacga ctgttacaag tttgccatct cacagtcatc cacgggcact 2760

gttatgggag ctgttatcat ggagggcttc tacgttgtct ttgatcgggc ccgaaaacga 2820

attggctttg ctgtcagcgc ttgccatgtg cacgatgagt tcaggacggc agcggtggaa 2880

ggcccttttg tcaccttgga catggaagac tgtggctaca acattccaca gacagatgag 2940

tcaaccctca tgaccatagc ctatgtcatg gctgccatct gcgccctctt catgctgcca 3000

ctctgcctca tggtgtgtca gtggcgctgc ctccgctgcc tgcgccagca gcatgatgac 3060

tttgctgatg acatctccct gctgaagggc agcggcgcca caaacttctc tctgctaaag 3120

caagcaggtg atgttgaaga aaaccccggg cctatgctgc ccggtttggc actgctcctg 3180

ctggccgcct ggacggctcg ggcgctggag gtacccactg atggtaatgc tggcctgctg 3240

gctgaacccc agattgccat gttctgtggc agactgaaca tgcacatgaa tgtccagaat 3300

gggaagtggg attcagatcc atcagggacc aaaacctgca ttgataccaa ggaaggcatc 3360

ctgcagtatt gccaagaagt ctaccctgaa ctgcagatca ccaatgtggt agaagccaac 3420

caaccagtga ccatccagaa ctggtgcaag cggggccgca agcagtgcaa gacccatccc 3480

cactttgtga ttccctaccg ctgcttagtt ggtgagtttg taagtgatgc ccttctcgtt 3540

cctgacaagt gcaaattctt acaccaggag aggatggatg tttgcgaaac tcatcttcac 3600

tggcacaccg tcgccaaaga gacatgcagt gagaagagta ccaacttgca tgactacggc 3660

atgttgctgc cctgcggaat tgacaagttc cgaggggtag agtttgtgtg ttgcccactg 3720

gctgaagaaa gtgacaatgt ggattctgct gatgcggagg aggatgactc ggatgtctgg 3780

tggggcggag cagacacaga ctatgcagat gggagtgaag acaaagtagt agaagtagca 3840

gaggaggaag aagtggctga ggtggaagaa gaagaagccg atgatgacga ggacgatgag 3900

gatggtgatg aggtagagga agaggctgag gaaccctacg aagaagccac agagagaacc 3960

accagcattg ccaccaccac caccaccacc acagagtctg tggaagaggt ggttcgagag 4020

gtgtgctctg aacaagccga gacggggccg tgccgagcaa tgatctcccg ctggtacttt 4080

gatgtgactg aagggaagtg tgccccattc ttttacggcg gatgtggcgg caaccggaac 4140

aactttgaca cagaagagta ctgcatggcc gtgtgtggca gcgccatgtc ccaaagttta 4200

ctcaagacta cccaggaacc tcttgcccga gatcctgtta aacttcctac aacagcagcc 4260

agtacccctg atgccgttga caagtatctc gagacacctg gggatgagaa tgaacatgcc 4320

catttccaga aagccaaaga gaggcttgag gccaagcacc gagagagaat gtcccaggtc 4380

atgagagaat gggaagaggc agaacgtcaa gcaaagaact tgcctaaagc tgataagaag 4440

gcagttatcc agcatttcca ggagaaagtg gaatctttgg aacaggaagc agccaacgag 4500

agacagcagc tggtggagac acacatggcc agagtggaag ccatgctcaa tgaccgccgc 4560

cgcctggccc tggagaacta catcaccgct ctgcaggctg ttcctcctcg gcctcgtcac 4620

gtgttcaata tgctaaagaa gtatgtccgc gcagaacaga aggacagaca gcacacccta 4680

aagcatttcg agcatgtgcg catggtggat cccaagaaag ccgctcagat ccggtcccag 4740

gttatgacac acctccgtgt gatttatgag cgcatgaatc agtctctctc cctgctctac 4800

aacgtgcctg cagtggccga ggagattcag gatgaagttg atgagctgct tcagaaagag 4860

caaaactatt cagatgacgt cttggccaac atgattagtg aaccaaggat cagttacgga 4920

aacgatgctc tcatgccatc tttgaccgaa acgaaaacca ccgtggagct ccttcccgtg 4980

aatggagagt tcagcctgga cgatctccag ccgtggcatt cttttggggc tgactctgtg 5040

ccagccaaca cagaaaacga agttgagcct gttgatgccc gccctgctgc cgaccgagga 5100

ctgaccactc gaccaggttc tgggttgaca aatatcaaga cggaggagat ctctgaagtg 5160

aacatggatg cagaattccg acatgactca ggatatgaag ttcatcatca aaaattggtg 5220

ttctttgcag aagatgtggg ttcaaacaaa ggtgcaatca ttggactcat ggtgggcggt 5280

gttgtcatag cgacagtggt catcatcacc ttggtgatgc tgaagaagaa acagtacaca 5340

tccattcatc atggtgtggt ggaggttgac gccgctgtca ccccagagga gcgccacctg 5400

tccaagatgc agcagaacgg ctacgaaaat ccaacctaca agttctttga gcagatgcag 5460

aactagagcg gccgctcgag catgcatcta gagctcgctg atcagcctcg actgtgcctt 5520

ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 5580

ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 5640

gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 5700

atagcaggca tgctggggat gcggtgggct ctatggtctg aggcggaaag aaccagctgc 5760

cttaatataa cttcgtataa tgtatgctat acgaagttat taggtctgaa gaggagttta 5820

cgtccagcca attctgtgga atgtgtgtca gttagggtgt ggaaagtccc caggctcccc 5880

agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt gtggaaagtc 5940

cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccat 6000

agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg cccattctcc 6060

gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct ctgcctctga 6120

gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca aaaagctccc 6180

gggagcttgt atatccattt tcggcggccg cgccaccatg accgagtaca agcccacggt 6240

gcgcctcgcc acccgcgacg acgtccccag ggccgtacgc accctcgccg ccgcgttcgc 6300

cgactacccc gccacgcgcc acaccgtcga tccggaccgc cacatcgagc gggtcaccga 6360

gctgcaagaa ctcttcctca cgcgcgtcgg gctcgacatc ggcaaggtgt gggtcgcgga 6420

cgacggcgcc gcggtggcgg tctggaccac gccggagagc gtcgaagcgg gggcggtgtt 6480

cgccgagatc ggcccgcgca tggccgagtt gagcggttcc cggctggccg cgcagcaaca 6540

gatggaaggc ctcctggcgc cgcaccggcc caaggagccc gcgtggttcc tggccaccgt 6600

cggagtctcg cccgaccacc agggcaaggg tctgggcagc gccgtcgtgc tccccggagt 6660

ggaggcggcc gagcgcgccg gggtgcccgc cttcctggag acctccgcgc cccgcaacct 6720

ccccttctac gagcggctcg gcttcaccgt caccgccgac gtcgaggtgc ccgaaggacc 6780

gcgcacctgg tgcatgaccc gcaagcccgg tgcctgagaa ttcgcgggac tctggggttc 6840

gaaatgaccg accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc 6900

ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag 6960

cgcggggatc tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat 7020

ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 7080

tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgtat accgctcgac 7140

tagagcttgc ggaaccctta atataacttc gtataatgta tgctatacga agttattagg 7200

tccgctggcc atctacgagc caaagacttt caaatctttg gctgccttgg ccagtaggag 7260

gcgacacgaa ggatttgctg ctgccttggg ggatgggaag gaacctgaag gcattttttc 7320

cagagtggtg cagtaccact gaggactgtt gctgtattga ttaggaaaag agacagagta 7380

atttgcagtt tgtttgattt atactgtggt tgctgagact gcgtgggggc ccaaggagac 7440

ctggagaaag gaatgcttcc tgctccttct tctggggccc caggagagcc ttcccagggc 7500

cttggagagg tgctgtccag ggactaaccc tgtgctctag gaaggctgca ggccctgacc 7560

agctgggcag gtcctgggtc cctcctggcc ttctaagttc cccaaacatg agacctctgg 7620

gtgtggggtg gcctggggag gtcattttgc ccaggcccta cctcctgccc attcctaacc 7680

ctttttaaaa atctgtgcgt cctcttcttc cttcttctcc ctcccttccc ttttcgctca 7740

ccctctgctg ctggcctgag agccggaggc ccccaggggg aaggcgactg gtctcctccc 7800

cagtctcagg gaagggagac agagaatcca ggaagccaga actcagcaga cgaagcaccc 7860

agggacctag agatgggttg aaaagttgac agctgtccca cctgcctccc aaggtctcag 7920

ggcctaaacc tccaaggcag gaaaggcccc tgtccctccc tggggtccat agaaagaggg 7980

acaagtctgc acggaccatt tgctgtaata ttaacacctt ggctgtcatt aggtagtctt 8040

ggctgttaat tatgtcctgt gataatgtat tattagcacg ccgaccacat agggtaggga 8100

actgcagcta gtaaacaaaa gtttgttcct atatgcggcc gccataaaag ttttgttact 8160

ttatagaaga aattttgagt ttttgttttt tttaataaat aaataaacat aaataaattg 8220

tttgttgaat ttattattag tatgtaagtg taaatataat aaaacttaat atctattcaa 8280

attaataaat aaacctcgat atacagaccg ataaaacaca tgcgtcaatt ttacacatga 8340

ttatctttaa cgtacgtcac aatatgatta tctttctagg gttaatctag ctgcgtgttc 8400

tgcagcgtgt cgagcatctt catctgctcc atcacgctgt aaaacacatt tgcaccgcga 8460

gtctgcccgt cctccacggg ttcaaaaacg tgaatgaacg aggcgcgctc actggccgtc 8520

gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca 8580

catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa 8640

cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg 8700

ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct 8760

ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat 8820

cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt 8880

gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg 8940

acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac 9000

cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta 9060

aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca 9120

atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 9180

tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt 9240

gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg 9300

cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag 9360

atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg 9420

agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg 9480

gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt 9540

ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga 9600

cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac 9660

ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc 9720

atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc 9780

gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac 9840

tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag 9900

gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg 9960

gtgagcgtgg ttcacgcggt atcattgcag cactggggcc agatggtaag ccctcccgta 10020

tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg 10080

ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata 10140

tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt 10200

ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc 10260

ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct 10320

tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa 10380

ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag 10440

tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc 10500

tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg 10560

actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca 10620

cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat 10680

gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg 10740

tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc 10800

ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc 10860

ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc 10920

cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg 10980

cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga 11040

gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc 11100

attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag cgcaacgcaa 11160

ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg cttccggctc 11220

gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc tatgaccatg 11280

attacgccaa gcgcgcccgc cgggtaactc acggggtatc catgtccatt tctgcggcat 11340

ccagccagga tacccgtcct cgctgacgta atatcccagc gccgcaccgc tgtcattaat 11400

ctgcacaccg gcacggcagt tccggctgtc gccggtattg ttcgggttgc tgatgcgctt 11460

cgggctgacc atccggaact gtgtccggaa aagccgcgac gaactggtat cccaggtggc 11520

ctgaacgaac agttcaccgt taaaggcgtg catggccaca ccttcccgaa tcatcatggt 11580

aaacgtgcgt tttcgctcaa cgtcaatgca gcagcagtca tcctcggcaa actctttcca 11640

tgccgcttca acctcgcggg aaaaggcacg ggcttcttcc tccccgatgc ccagatagcg 11700

ccagcttggg cgatgactga gccggaaaaa agacccgacg atatgatcct gatgcagcta 11760

gattaaccct agaaagatag tctgcgtaaa attgacgcat gcattcttga aatattgctc 11820

tctctttcta aatagcgcga atccgtcgct gtgcatttag gacatctcag tcgccgcttg 11880

gagctcccgt gaggcgtgct tgtcaatgcg gtaagtgtca ctgattttga actataacga 11940

ccgcgtgagt caaaatgacg catgattatc ttttacgtga cttttaagat ttaactcata 12000

cgataattat attgttattt catgttctac ttacgtgata acttattata tatatatttt 12060

cttgttatag atatc 12075

<210> 14

<211> 501

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 14

Met Ala Gln Ala Leu Pro Trp Leu Leu Leu Trp Met Gly Ala Gly Val

1 5 10 15

Leu Pro Ala His Gly Thr Gln His Gly Ile Arg Leu Pro Leu Arg Ser

20 25 30

Gly Leu Gly Gly Ala Pro Leu Gly Leu Arg Leu Pro Arg Glu Thr Asp

35 40 45

Glu Glu Pro Glu Glu Pro Gly Arg Arg Gly Ser Phe Val Glu Met Val

50 55 60

Asp Asn Leu Arg Gly Lys Ser Gly Gln Gly Tyr Tyr Val Glu Met Thr

65 70 75 80

Val Gly Ser Pro Pro Gln Thr Leu Asn Ile Leu Val Asp Thr Gly Ser

85 90 95

Ser Asn Phe Ala Val Gly Ala Ala Pro His Pro Phe Leu His Arg Tyr

100 105 110

Tyr Gln Arg Gln Leu Ser Ser Thr Tyr Arg Asp Leu Arg Lys Gly Val

115 120 125

Tyr Val Pro Tyr Thr Gln Gly Lys Trp Glu Gly Glu Leu Gly Thr Asp

130 135 140

Leu Val Ser Ile Pro His Gly Pro Asn Val Thr Val Arg Ala Asn Ile

145 150 155 160

Ala Ala Ile Thr Glu Ser Asp Lys Phe Phe Ile Asn Gly Ser Asn Trp

165 170 175

Glu Gly Ile Leu Gly Leu Ala Tyr Ala Glu Ile Ala Arg Pro Asp Asp

180 185 190

Ser Leu Glu Pro Phe Phe Asp Ser Leu Val Lys Gln Thr His Val Pro

195 200 205

Asn Leu Phe Ser Leu Gln Leu Cys Gly Ala Gly Phe Pro Leu Asn Gln

210 215 220

Ser Glu Val Leu Ala Ser Val Gly Gly Ser Met Ile Ile Gly Gly Ile

225 230 235 240

Asp His Ser Leu Tyr Thr Gly Ser Leu Trp Tyr Thr Pro Ile Arg Arg

245 250 255

Glu Trp Tyr Tyr Glu Val Ile Ile Val Arg Val Glu Ile Asn Gly Gln

260 265 270

Asp Leu Lys Met Asp Cys Lys Glu Tyr Asn Tyr Asp Lys Ser Ile Val

275 280 285

Asp Ser Gly Thr Thr Asn Leu Arg Leu Pro Lys Lys Val Phe Glu Ala

290 295 300

Ala Val Lys Ser Ile Lys Ala Ala Ser Ser Thr Glu Lys Phe Pro Asp

305 310 315 320

Gly Phe Trp Leu Gly Glu Gln Leu Val Cys Trp Gln Ala Gly Thr Thr

325 330 335

Pro Trp Asn Ile Phe Pro Val Ile Ser Leu Tyr Leu Met Gly Glu Val

340 345 350

Thr Asn Gln Ser Phe Arg Ile Thr Ile Leu Pro Gln Gln Tyr Leu Arg

355 360 365

Pro Val Glu Asp Val Ala Thr Ser Gln Asp Asp Cys Tyr Lys Phe Ala

370 375 380

Ile Ser Gln Ser Ser Thr Gly Thr Val Met Gly Ala Val Ile Met Glu

385 390 395 400

Gly Phe Tyr Val Val Phe Asp Arg Ala Arg Lys Arg Ile Gly Phe Ala

405 410 415

Val Ser Ala Cys His Val His Asp Glu Phe Arg Thr Ala Ala Val Glu

420 425 430

Gly Pro Phe Val Thr Leu Asp Met Glu Asp Cys Gly Tyr Asn Ile Pro

435 440 445

Gln Thr Asp Glu Ser Thr Leu Met Thr Ile Ala Tyr Val Met Ala Ala

450 455 460

Ile Cys Ala Leu Phe Met Leu Pro Leu Cys Leu Met Val Cys Gln Trp

465 470 475 480

Arg Cys Leu Arg Cys Leu Arg Gln Gln His Asp Asp Phe Ala Asp Asp

485 490 495

Ile Ser Leu Leu Lys

500

<210> 15

<211> 1503

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

atggcccaag ccctgccctg gctcctgctg tggatgggcg cgggagtgct gcctgcccac 60

ggcacccagc acggcatccg gctgcccctg cgcagcggcc tggggggcgc ccccctgggg 120

ctgcggctgc cccgggagac cgacgaagag cccgaggagc ccggccggag gggcagcttt 180

gtggagatgg tggacaacct gaggggcaag tcggggcagg gctactacgt ggagatgacc 240

gtgggcagcc ccccgcagac gctcaacatc ctggtggata caggcagcag taactttgca 300

gtgggtgctg ccccccaccc cttcctgcat cgctactacc agaggcagct gtccagcaca 360

taccgggacc tccggaaggg tgtgtatgtg ccctacaccc agggcaagtg ggaaggggag 420

ctgggcaccg acctggtaag catcccccat ggccccaacg tcactgtgcg tgccaacatt 480

gctgccatca ctgaatcaga caagttcttc atcaacggct ccaactggga aggcatcctg 540

gggctggcct atgctgagat tgccaggcct gacgactccc tggagccttt ctttgactct 600

ctggtaaagc agacccacgt tcccaacctc ttctccctgc agctttgtgg tgctggcttc 660

cccctcaacc agtctgaagt gctggcctct gtcggaggga gcatgatcat tggaggtatc 720

gaccactcgc tgtacacagg cagtctctgg tatacaccca tccggcggga gtggtattat 780

gaggtgatca ttgtgcgggt ggagatcaat ggacaggatc tgaaaatgga ctgcaaggag 840

tacaactatg acaagagcat tgtggacagt ggcaccacca accttcgttt gcccaagaaa 900

gtgtttgaag ctgcagtcaa atccatcaag gcagcctcct ccacggagaa gttccctgat 960

ggtttctggc taggagagca gctggtgtgc tggcaagcag gcaccacccc ttggaacatt 1020

ttcccagtca tctcactcta cctaatgggt gaggttacca accagtcctt ccgcatcacc 1080

atccttccgc agcaatacct gcggccagtg gaagatgtgg ccacgtccca agacgactgt 1140

tacaagtttg ccatctcaca gtcatccacg ggcactgtta tgggagctgt tatcatggag 1200

ggcttctacg ttgtctttga tcgggcccga aaacgaattg gctttgctgt cagcgcttgc 1260

catgtgcacg atgagttcag gacggcagcg gtggaaggcc cttttgtcac cttggacatg 1320

gaagactgtg gctacaacat tccacagaca gatgagtcaa ccctcatgac catagcctat 1380

gtcatggctg ccatctgcgc cctcttcatg ctgccactct gcctcatggt gtgtcagtgg 1440

cgctgcctcc gctgcctgcg ccagcagcat gatgactttg ctgatgacat ctccctgctg 1500

aag 1503

<210> 16

<211> 770

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 16

Met Leu Pro Gly Leu Ala Leu Leu Leu Leu Ala Ala Trp Thr Ala Arg

1 5 10 15

Ala Leu Glu Val Pro Thr Asp Gly Asn Ala Gly Leu Leu Ala Glu Pro

20 25 30

Gln Ile Ala Met Phe Cys Gly Arg Leu Asn Met His Met Asn Val Gln

35 40 45

Asn Gly Lys Trp Asp Ser Asp Pro Ser Gly Thr Lys Thr Cys Ile Asp

50 55 60

Thr Lys Glu Gly Ile Leu Gln Tyr Cys Gln Glu Val Tyr Pro Glu Leu

65 70 75 80

Gln Ile Thr Asn Val Val Glu Ala Asn Gln Pro Val Thr Ile Gln Asn

85 90 95

Trp Cys Lys Arg Gly Arg Lys Gln Cys Lys Thr His Pro His Phe Val

100 105 110

Ile Pro Tyr Arg Cys Leu Val Gly Glu Phe Val Ser Asp Ala Leu Leu

115 120 125

Val Pro Asp Lys Cys Lys Phe Leu His Gln Glu Arg Met Asp Val Cys

130 135 140

Glu Thr His Leu His Trp His Thr Val Ala Lys Glu Thr Cys Ser Glu

145 150 155 160

Lys Ser Thr Asn Leu His Asp Tyr Gly Met Leu Leu Pro Cys Gly Ile

165 170 175

Asp Lys Phe Arg Gly Val Glu Phe Val Cys Cys Pro Leu Ala Glu Glu

180 185 190

Ser Asp Asn Val Asp Ser Ala Asp Ala Glu Glu Asp Asp Ser Asp Val

195 200 205

Trp Trp Gly Gly Ala Asp Thr Asp Tyr Ala Asp Gly Ser Glu Asp Lys

210 215 220

Val Val Glu Val Ala Glu Glu Glu Glu Val Ala Glu Val Glu Glu Glu

225 230 235 240

Glu Ala Asp Asp Asp Glu Asp Asp Glu Asp Gly Asp Glu Val Glu Glu

245 250 255

Glu Ala Glu Glu Pro Tyr Glu Glu Ala Thr Glu Arg Thr Thr Ser Ile

260 265 270

Ala Thr Thr Thr Thr Thr Thr Thr Glu Ser Val Glu Glu Val Val Arg

275 280 285

Glu Val Cys Ser Glu Gln Ala Glu Thr Gly Pro Cys Arg Ala Met Ile

290 295 300

Ser Arg Trp Tyr Phe Asp Val Thr Glu Gly Lys Cys Ala Pro Phe Phe

305 310 315 320

Tyr Gly Gly Cys Gly Gly Asn Arg Asn Asn Phe Asp Thr Glu Glu Tyr

325 330 335

Cys Met Ala Val Cys Gly Ser Ala Met Ser Gln Ser Leu Leu Lys Thr

340 345 350

Thr Gln Glu Pro Leu Ala Arg Asp Pro Val Lys Leu Pro Thr Thr Ala

355 360 365

Ala Ser Thr Pro Asp Ala Val Asp Lys Tyr Leu Glu Thr Pro Gly Asp

370 375 380

Glu Asn Glu His Ala His Phe Gln Lys Ala Lys Glu Arg Leu Glu Ala

385 390 395 400

Lys His Arg Glu Arg Met Ser Gln Val Met Arg Glu Trp Glu Glu Ala

405 410 415

Glu Arg Gln Ala Lys Asn Leu Pro Lys Ala Asp Lys Lys Ala Val Ile

420 425 430

Gln His Phe Gln Glu Lys Val Glu Ser Leu Glu Gln Glu Ala Ala Asn

435 440 445

Glu Arg Gln Gln Leu Val Glu Thr His Met Ala Arg Val Glu Ala Met

450 455 460

Leu Asn Asp Arg Arg Arg Leu Ala Leu Glu Asn Tyr Ile Thr Ala Leu

465 470 475 480

Gln Ala Val Pro Pro Arg Pro Arg His Val Phe Asn Met Leu Lys Lys

485 490 495

Tyr Val Arg Ala Glu Gln Lys Asp Arg Gln His Thr Leu Lys His Phe

500 505 510

Glu His Val Arg Met Val Asp Pro Lys Lys Ala Ala Gln Ile Arg Ser

515 520 525

Gln Val Met Thr His Leu Arg Val Ile Tyr Glu Arg Met Asn Gln Ser

530 535 540

Leu Ser Leu Leu Tyr Asn Val Pro Ala Val Ala Glu Glu Ile Gln Asp

545 550 555 560

Glu Val Asp Glu Leu Leu Gln Lys Glu Gln Asn Tyr Ser Asp Asp Val

565 570 575

Leu Ala Asn Met Ile Ser Glu Pro Arg Ile Ser Tyr Gly Asn Asp Ala

580 585 590

Leu Met Pro Ser Leu Thr Glu Thr Lys Thr Thr Val Glu Leu Leu Pro

595 600 605

Val Asn Gly Glu Phe Ser Leu Asp Asp Leu Gln Pro Trp His Ser Phe

610 615 620

Gly Ala Asp Ser Val Pro Ala Asn Thr Glu Asn Glu Val Glu Pro Val

625 630 635 640

Asp Ala Arg Pro Ala Ala Asp Arg Gly Leu Thr Thr Arg Pro Gly Ser

645 650 655

Gly Leu Thr Asn Ile Lys Thr Glu Glu Ile Ser Glu Val Lys Met Asp

660 665 670

Ala Glu Phe Arg His Asp Ser Gly Tyr Glu Val His His Gln Lys Leu

675 680 685

Val Phe Phe Ala Glu Asp Val Gly Ser Asn Lys Gly Ala Ile Ile Gly

690 695 700

Leu Met Val Gly Gly Val Val Ile Ala Thr Val Ile Val Ile Thr Leu

705 710 715 720

Val Met Leu Lys Lys Lys Gln Tyr Thr Ser Ile His His Gly Val Val

725 730 735

Glu Val Asp Ala Ala Val Thr Pro Glu Glu Arg His Leu Ser Lys Met

740 745 750

Gln Gln Asn Gly Tyr Glu Asn Pro Thr Tyr Lys Phe Phe Glu Gln Met

755 760 765

Gln Asn

770

<210> 17

<211> 2313

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

atgctgcccg gtttggcact gctcctgctg gccgcctgga cggctcgggc gctggaggta 60

cccactgatg gtaatgctgg cctgctggct gaaccccaga ttgccatgtt ctgtggcaga 120

ctgaacatgc acatgaatgt ccagaatggg aagtgggatt cagatccatc agggaccaaa 180

acctgcattg ataccaagga aggcatcctg cagtattgcc aagaagtcta ccctgaactg 240

cagatcacca atgtggtaga agccaaccaa ccagtgacca tccagaactg gtgcaagcgg 300

ggccgcaagc agtgcaagac ccatccccac tttgtgattc cctaccgctg cttagttggt 360

gagtttgtaa gtgatgccct tctcgttcct gacaagtgca aattcttaca ccaggagagg 420

atggatgttt gcgaaactca tcttcactgg cacaccgtcg ccaaagagac atgcagtgag 480

aagagtacca acttgcatga ctacggcatg ttgctgccct gcggaattga caagttccga 540

ggggtagagt ttgtgtgttg cccactggct gaagaaagtg acaatgtgga ttctgctgat 600

gcggaggagg atgactcgga tgtctggtgg ggcggagcag acacagacta tgcagatggg 660

agtgaagaca aagtagtaga agtagcagag gaggaagaag tggctgaggt ggaagaagaa 720

gaagccgatg atgacgagga cgatgaggat ggtgatgagg tagaggaaga ggctgaggaa 780

ccctacgaag aagccacaga gagaaccacc agcattgcca ccaccaccac caccaccaca 840

gagtctgtgg aagaggtggt tcgagaggtg tgctctgaac aagccgagac ggggccgtgc 900

cgagcaatga tctcccgctg gtactttgat gtgactgaag ggaagtgtgc cccattcttt 960

tacggcggat gtggcggcaa ccggaacaac tttgacacag aagagtactg catggccgtg 1020

tgtggcagcg ccatgtccca aagtttactc aagactaccc aggaacctct tgcccgagat 1080

cctgttaaac ttcctacaac agcagccagt acccctgatg ccgttgacaa gtatctcgag 1140

acacctgggg atgagaatga acatgcccat ttccagaaag ccaaagagag gcttgaggcc 1200

aagcaccgag agagaatgtc ccaggtcatg agagaatggg aagaggcaga acgtcaagca 1260

aagaacttgc ctaaagctga taagaaggca gttatccagc atttccagga gaaagtggaa 1320

tctttggaac aggaagcagc caacgagaga cagcagctgg tggagacaca catggccaga 1380

gtggaagcca tgctcaatga ccgccgccgc ctggccctgg agaactacat caccgctctg 1440

caggctgttc ctcctcggcc tcgtcacgtg ttcaatatgc taaagaagta tgtccgcgca 1500

gaacagaagg acagacagca caccctaaag catttcgagc atgtgcgcat ggtggatccc 1560

aagaaagccg ctcagatccg gtcccaggtt atgacacacc tccgtgtgat ttatgagcgc 1620

atgaatcagt ctctctccct gctctacaac gtgcctgcag tggccgagga gattcaggat 1680

gaagttgatg agctgcttca gaaagagcaa aactattcag atgacgtctt ggccaacatg 1740

attagtgaac caaggatcag ttacggaaac gatgctctca tgccatcttt gaccgaaacg 1800

aaaaccaccg tggagctcct tcccgtgaat ggagagttca gcctggacga tctccagccg 1860

tggcattctt ttggggctga ctctgtgcca gccaacacag aaaacgaagt tgagcctgtt 1920

gatgcccgcc ctgctgccga ccgaggactg accactcgac caggttctgg gttgacaaat 1980

atcaagacgg aggagatctc tgaagtgaag atggatgcag aattccgaca tgactcagga 2040

tatgaagttc atcatcaaaa attggtgttc tttgcagaag atgtgggttc aaacaaaggt 2100

gcaatcattg gactcatggt gggcggtgtt gtcatagcga cagtgatcgt catcaccttg 2160

gtgatgctga agaagaaaca gtacacatcc attcatcatg gtgtggtgga ggttgacgcc 2220

gctgtcaccc cagaggagcg ccacctgtcc aagatgcagc agaacggcta cgaaaatcca 2280

acctacaagt tctttgagca gatgcagaac tag 2313

<210> 18

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

agttatggca gaactcagtg 20

<210> 19

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

ccccatccaa agtttttaaa gga 23

<210> 20

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

tgtggcagat gtcacagttt agg 23

<210> 21

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

caccgagtta tggcagaact cagtg 25

<210> 22

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

aaaccactga gttctgccat aactc 25

<210> 23

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

gaaggagcaa actgacatgg 20

<210> 24

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

tgcagtgggt ctttggggac 20

<210> 25

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

ttccaggaac ataagaaagt 20

<210> 26

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

gcagtctcag caaccactga 20

<210> 27

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

ggtcggagtg aacggatttg 20

<210> 28

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

ccatttgatg ttggcgggat 20

<210> 29

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

agatccgcca caacatcgag 20

<210> 30

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

gtccatgccg agagtgatcc 20

<210> 31

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

cctgctgtaa gtgccgtagt 20

<210> 32

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

ctaggggcac agcacgtc 18

<210> 33

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

aagttattag gtctgaagag gagttt 26

<210> 34

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

cccatcattc cgtcccagag 20

<210> 35

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

tgctgagttc tggcttcctg 20

<210> 36

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

tctaccaaga gagtgaccag cag 23

<210> 37

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

cacgccatcc tgcgtctgga 20

<210> 38

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

agcaccgtgt tggcgtagag 20

<210> 39

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

tggtaaagca gacccacgtt 20

<210> 40

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

tgatcatgct ccctccgaca g 21

<210> 41

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

gtgatgccct tctcgttcct 20

<210> 42

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

cgcatcagca gaatccacat t 21

<210> 43

<211> 1104

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

aataaatgca ctgttgggcc tatgctcaag atgggtagtg ttaattggtg gtggaactta 60

tctgatttca tgacttgctg gctacctaaa acaggtgagg agaaagccaa tgctatgtct 120

gggactggat gagcaagtac aacaaacaaa atgggcttaa agtatgagtg agagttatct 180

gaccgtaagg atgcaagtga gggggcctaa ggtttggaga ttaatattta atctcagatg 240

ctatactttg gtggtgtagc aaaagtctac aaatgggatg actgtaaaac tcagtagatc 300

cgtgcttttt aacctatctc ccttcatcag gaaattgcga cacaaagatc tttagtaata 360

acacgcagtc tcaatgcata aaatcaggct taggtgttgc ctggactcat ttcccatctc 420

caccccacta taattatttt gtgacacaaa ctcaagactg tgggaatata gagaaattgg 480

gctcgtcctc gtacacctgc tcaatcccct gcaggacaac gcccaagaat caggttaagc 540

cagggcaaaa gaatcccgcc cataatcgag aaggagcaaa ctgacatgga ggcgatgacg 600

agatcgcggg ggagggaggg atttttctag gcccagggcg gtccttagga aaaggaggca 660

gcagagaact cccataaagg tattgcggca ctcccctccc cctgcggaga agggtgcggc 720

cttctctccg cctcctccac tgcagctccc tcaggattgc agctcgcgcg ggtttttgga 780

gaacatgcgc ctcccaccca caagccagca ggaccgaccc cccactcctt cctccacccc 840

ccacccccac gggtccgaga gcaggtagag ggctagtctc gtccttcagg cggcggacgc 900

ccagggcgga gccgcagtca ccaccaccca gaagcctcgg cccggcagcc cgcccccgcc 960

tcctgcgcgc gcttcctgcc acgttgcgca ggggcgaggg gccagacact gcggcgctgg 1020

cctcggggag ggccgtacca aagaccgcct ccctgccgac tcgcgtagtg gtttcgctca 1080

tttgggaccc aagccaataa caag 1104

<210> 44

<211> 1056

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

tgctctctct cctgccccct tcacctgcgt gccctcctca ttctccctct gtgccacctc 60

tggccttgca ctgtaggctc tctcttgggg atgtttctcc ttctccacac acttctcttt 120

cactctgtcc tcttgctttg tgtgggcctg cagcgttacc cttttttctg ggcacactca 180

gagcaccctc ctctttctgg ttctgggcca cctgtctgtc ctcgggtcat cttgctctct 240

ctgcctggat gccctcctgt ggctttgggc agcttctccc tccttcagag tgcaccgcca 300

gttctcctag gcccggtcac ttccccttcc caggggacct agagccctgc taggtcctct 360

ctctccacaa cctgggcccc caaacctttc caaaacacct tgctttctgc ctccattggt 420

cttgtgttcc agagccagag tcactatatg tcccagaacc aggattccct ctggttctga 480

gggcttttat cgcatcccct gcctggctgc agtgggtctt tggggacagg ccacagaaga 540

gcctctactc ctccctctgt ccccgaggct gtctccctcc cagtcttccc agctcaggcc 600

agtccccagg cctctcttcc ctgccagagc ccgtcaggtt cggttacttt ggggcccaga 660

gaggaccctg tgaaggaagc gtgggtaggg gcacgggaat ggggaggatg cctgaagagg 720

cccccttagc cagaagagga gcagaagagg agcaggtacc cagaagagga gcagttcagg 780

gaaatagaag agtcccgagc tctttttttt tttttttttt atttcttttc ttttcttttc 840

tttttatggc agcatccgtg gtatatggag gttcccagcc taggggtcag atcatacctg 900

caactgccag cctacaccac agccacagca ctcaggatcc gagctgcatc tgcggcttac 960

gccacaggtc acagcaacgc tggatcctta acccactgaa tgaggccagg gattgaacct 1020

gcaacctcat gcacactatg ctggggtctt aatcgg 1056

<210> 45

<211> 1108

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

acttcctcct gcccttaccc tttatctggc tcttagctcc taaaaactgc attattagct 60

tcctcttttg cctctactct tactcaacca aaattgtttt aagatctgtg gatctagctt 120

ctgctgtgct attcttagga acacttttat ttcctcttag ctccatctca ccagttattg 180

gctaatggct ttgcttggta cctacatctg tacatttctt tcgtactagc ttctagactg 240

aaaaaggact gttggttcaa catgaaaggg aaggaggtaa aagaggacac acaggaaaga 300

tggattggga ttcaggtctc tgctgttgtt acttgagatt gctttctaga ttctacttgt 360

ggaaacaaaa agcctttgcg agaattctaa actggagtat ttctgtaatt gaggagtctt 420

gctcagcaaa tcccacttag gggactaatg aagtaccagg aagagacaga ccatgctcaa 480

tccacaaagc caggttttac tgaaatgtga cctactttct tatgttcctg gaagtttaga 540

tcagggtggg cagctctggg ttttataggc tacactgtta acactcaggc tgttttctac 600

cgtttagtca aaatatagtc accttgcctg cttcacctgt ccatcagaga atggcctcat 660

taattgactc tctagtatga agtcaaagta gctttggtgg ccctaaatgg acaagtatca 720

agagactggg tgaattgagg agcttgagac tgtcacctca gatcgaaaag actgaaaaat 780

cacctcagat caaaaagact gaaaaatctt cagtctggaa aggggactca aaaccataat 840

tagagtattc tggtagaatc cttttctcca ctgttattca tacagttaag gtgaataact 900

aaaagtaatt gtgagctgag gagtaagata caacacacaa ggaatcagtt aacagagtct 960

cgagtgaaat tataaatgga aagaattatg acttgaatca taactctgag gccccatttt 1020

ccctaacaac ttttgtccca ataaacgtgg gtatttgttt gggagaaact atcatataca 1080

tgattaccca gtaaacagac tgtttact 1108

<210> 46

<211> 1089

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

actttgtacc tattttgtat gtgtataata atttgagatg tttttaatta ttttgattgc 60

tggaataaag catgtggaaa tgacccaaac caatcttgca ctggcctcct gatttccttc 120

cttggagacg gagggagggg gagacctggg ggagggcgct tggggggggg tgggctctct 180

tctttctgcg ctcccccccc ccacctccaa caccttgacg acccctcctg cttccgcttg 240

cctttctcag gctttaacac tttctcctcg ccctctcagc atgcgcatgc gcgtgcctct 300

acctcccccg cacatcctgg cctgcccacc ctgaatgtcc tggcccagcg atgccaccaa 360

ctctctcgct ccgtccacgg ctggggaggg gggcactctg cagggttggg gggcactggg 420

aggctgggtt gggtgaggga ggggtgcctg ggcccccacc ccccagcaag ttctctccct 480

aggcgaactg gagggtcgtc tggcctcttg agccttgttg ctggctctga gctctaccaa 540

gagagtgacc agcaggaccg caccatcagt ggttgctgag actgcgtggg ggcccaagga 600

gacctggaga aaggaatgct tcctgctcct tcttctgggg ccccaggaga gccttcccag 660

ggccttggag aggtgctgtc cagggactaa ccctgtgctc taggaaggct gcaggccctg 720

accagctggg caggtcctgg gtccctcctg gccttctaag ttccccaaac atgagacctc 780

tgggtgtggg gtggcctggg gaggtcattt tgcccaggcc ctacctcctg cccattccta 840

acccttttta aaaatctgtg cgtcctcttc ttccttcttc tccctccctt cccttttcgc 900

tcaccctctg ctgctggcct gagagccgga ggcccccagg gggaaggcga ctggtctcct 960

ccccagtctc agggaaggga gacagagaat ccaggaagcc agaactcagc agacgaagca 1020

cccagggacc tagagatggg ttgaaaagtt gacagctgtc ccacctgcct cccaaggtct 1080

cagggccta 1089

<210> 47

<211> 448

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

agtgcaagtg ggttttagga ccaggatgag gcggggtggg ggtgcctacc tgacgaccga 60

ccccgaccca ctggacaagc acccaacccc cattccccaa attgcgcatc ccctatcaga 120

gagggggagg ggaaacagga tgcggcgagg cgcgtgcgca ctgccagctt cagcaccgcg 180

gacagtgcct tcgcccccgc ctggcggcgc gcgccaccgc cgcctcagca ctgaaggcgc 240

gctgacgtca ctcgccggtc ccccgcaaac tccccttccc ggccaccttg gtcgcgtccg 300

cgccgccgcc ggcccagccg gaccgcacca cgcgaggcgc gagatagggg ggcacgggcg 360

cgaccatctg cgctgcggcg ccggcgactc agcgctgcct cagtctgcgg tgggcagcgg 420

aggagtcgtg tcgtgcctga gagcgcag 448

Claims

1.一种表达人BACE1和/或人显性突变APP的猪细胞，其特征在于，将编码人BACE1和/或人显性突变APP的核苷酸序列插入猪安全港位点，获得表达SEQ ID NO：14所示人BACE1和/或SEQ ID NO：16所示人显性突变APP的猪细胞，所述的猪安全港位点选自猪ROSA26、AAVS1、H11或COL1A1安全港位点。

2.根据权利要求1所述的猪细胞，其特征在于，所述的编码人BACE1的核苷酸序列如SEQID NO：15所示，所述的编码人显性突变APP的核苷酸序列如SEQ ID NO：17所示。

3.根据权利要求1或2所述的猪细胞，其特征在于，ROSA26安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO：43所示，AAVS1安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO：44所示，H11安全港位点区域及其上下游各500bp的核苷酸序列如SEQ ID NO：45所示，COL1A1安全港位点区域及其上下游各500bp的核苷酸序列如SEQ IDNO：46所示。

4.根据权利要求1-3任一所述的猪细胞，其特征在于，所述的编码人BACE1和/或人显性突变APP的核苷酸序列在猪细胞中通过外源启动子调控，所述的外源启动子为人hSyn启动子，所述的人hSyn启动子驱动编码人BACE1和/或人显性突变APP的核苷酸序列在神经组织中特异表达，优选的，所述的人hSyn启动子的核苷酸序列如SEQ ID NO：47所示。

5.根据权利要求1-4任一所述的猪细胞，其特征在于，所述的猪细胞为猪成纤维细胞或神经细胞。

6.一种权利要求1-5任一所述的猪细胞的构建方法，其特征在于，使用安全港位点载体将编码人BACE1和/或人显性突变APP的核苷酸序列插入猪安全港位点，所述的安全港位点载体包含编码人BACE1和/或人显性突变APP的核苷酸序列和安全港位点载体骨架，所述的安全港位点载体骨架包含安全港插入位点的5’同源臂和3’同源臂，所述的编码人BACE1和/或人显性突变APP的核苷酸序列位于5’同源臂与3’同源臂之间，所述的安全港位点载体骨架选自下列任一项所示：

A)ROSA26安全港位点载体骨架，其5’同源臂如SEQ ID NO：5所示，3’同源臂如SEQ IDNO：6所示；

B)AAVS1安全港位点载体骨架，其5’同源臂如SEQ ID NO：7所示，3’同源臂如SEQ IDNO：8所示；

C)H11安全港位点载体骨架，其5’同源臂如SEQ ID NO：9所示，3’同源臂如SEQ ID NO：10所示；

或D)COL1A1安全港位点载体骨架，其5’同源臂如SEQ ID NO：11所示，3’同源臂如SEQID NO：12所示。

7.根据权利要求6所述的构建方法，其特征在于，使用sgRNA载体进行猪细胞的构建，所述的sgRNA载体包含靶向ROSA26、AAVS1、H11或COL1A1安全港位点的sgRNA，其中：

8.根据权利要求6或7所述的构建方法，其特征在于，使用Cas载体进行猪细胞的构建，所述的Cas载体包含编码Cas蛋白、EGFP和Puro蛋白的核苷酸序列，其中，所述的Cas蛋白选自Casl、CaslB、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9、CaslO、Csyl、Csy2、Csy3、Csy4、Csel、Cse2、Cse3、Cse4、Cse5e、Cscl、Csc2、Csa5、Csnl、Csn2、Csml、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csx17、Csx14、CsxlO、Csx16、CsaX、Csx3、Csxl、CsxlS、Csfl、Csf2、CsO、Csf4、Csdl、Csd2、Cstl、Cst2、Cshl、Csh2、Csal、Csa2、Csa3、Csa4、Csa5、C2cl、C2c2、C2c3、Cpfl、CARF、DinG、其同源物或其修饰形式，优选为Cas9，进一步优选的，所述的Cas载体的核苷酸序列如SEQ ID NO：1或2所示，更进一步优选的，所述的Cas载体的核苷酸序列如SEQ ID NO：2所示。

9.根据权利要求6-8任一所述的构建方法，其特征在于，所述的构建方法包括将安全港位点载体、sgRNA载体和Cas载体共转染至猪细胞。

10.一种包含权利要求1-5任一所述猪细胞的组织或器官。

11.一种阿尔兹海默症模型猪的构建方法，其特征在于，将编码人BACE1和/或人显性突变APP的核苷酸序列插入猪安全港位点，获得表达SEQ ID NO：14所示人BACE1和/或SEQ IDNO：16所示人显性突变APP的猪细胞，所述的猪安全港位点选自猪ROSA26、AAVS1、H11或COL1A1安全港位点。

12.根据权利要求11所述的构建方法，其特征在于，所述的构建方法包括将权利要求1-5任一所述的猪细胞移入去核的猪卵母细胞中，获得模型猪。

13.一种安全港位点载体，其特征在于，所述的安全港位点载体包含编码人BACE1和/或人显性突变APP的核苷酸序列和安全港位点载体骨架，所述的安全港位点载体骨架包含安全港插入位点的5’同源臂和3’同源臂，所述的编码人BACE1和/或人显性突变APP的核苷酸序列位于5’同源臂与3’同源臂之间，所述的安全港位点载体骨架选自下列任一项所示：

14.一种权利要求1-5任一所述的猪细胞、权利要求6-9任一所述的构建方法获得的猪细胞在制备阿尔茨海默症动物模型中的应用，或者在筛选治疗阿尔茨海默症的药物及药效评价中的应用，或者在基因及细胞治疗中的应用，或者在研究阿尔茨海默症的发病机制中的应用。

15.一种权利要求10所述的组织或器官或者权利要求11-12任一所述的构建方法获得的模型猪在筛选治疗阿尔茨海默症的药物及药效评价中的应用，或者在基因及细胞治疗中的应用，或者在研究阿尔茨海默症的发病机制中的应用。