人源化IL-4和/或IL-4Rα改造动物模型的制备方法及应用
技术领域
本申请涉及人源化基因改造动物模型的建立方法及应用,具体而言,涉及基于一种人源化IL-4和/或IL-4Rα基因改造动物模型的构建方法及其在生物医药的应用。
背景技术
实验动物疾病模型对于研究人类疾病发生的病因、发病机制、开发防治技术和开发药物是不可缺少的研究工具。但由于动物与人类的生理结构和代谢系统本身的差异,传统的动物模型并不能很好的反映人体的真实状况,在动物体内建立更接近人类的生理特征的疾病模型是生物医药行业的迫切需求。
随着基因工程技术的不断发展和成熟,用人类基因替代或置换动物的同源性基因已经实现,通过这种方式开发人源化实验动物模型(humanized animal model)是动物模型未来的发展方向。其中基因人源化动物模型,即,利用基因编辑技术,用人源正常或突变基因替换动物基因组的同源基因,可建立更接近人类生理或疾病特征的正常或突变基因动物模型。基因人源化动物不但本身具有重要应用价值,如通过基因人源化可改进和提升细胞或组织移植人源化动物模型,更重要的是,由于人类基因片段的插入,动物体内可表达或部分表达人源蛋白,可作为仅能识别人蛋白序列的药物的靶点,为在动物水平进行抗人抗体及其它药物的筛选提供了可能。然而,由于动物与人类在生理学及病理学方面存在差异,加上基因(即遗传因子)的复杂性,如何能构建出“有效”的人源化动物模型用于新药研发仍是最大的挑战(Scheer N,Snaith M,Wolf CR,Seibler J.Generation and utility ofgenetically humanized mouse models,Drug Discov Today;18(23-24):1200-11,2013)。
人白细胞介素4(IL4,IL-4),又称BCGF-1、BCGF1、BSF-1、BSF1等,主要由活化的T细胞产生,参与体液免疫和适应性免疫,是诱导初始辅助性T细胞向Th2细胞分化的细胞因子。人IL-4基因定位于5q31.1,由4个外显子和3个内含子组成,约10kb。成熟人IL-4分子由129个氨基酸残基组成,分子量为15kDa,含2个糖基化点。IL-4的所有生物学功能都是通过效应细胞表面的白介素4受体(IL-4R)介导的,IL4R由a和γ亚单元组成,IL-4与IL-4R通过结合IL-4Rα链进行信号传导(Kruse,Susanne,et al.International Immunology11.12(1999):1965-1970.)。人IL-4Rα定位于16p12.1区域,该区域基因及其多态性与哮喘、过敏性皮炎相关。
在机体免疫反应中,IL-4/IL-4R是重要促炎症因子,可通过调节T细胞分化,抑制B淋巴细胞凋亡,参与多种生物学过程,包括控制B淋巴细胞从分泌IgM转向分泌IgE、与Th2细胞因子共同参与过敏性哮喘患者的气道炎症发生、与IL-13共同参与慢性利什曼血吸虫感染、M2巨噬细胞极化等。此外IL-4/IL-4R还可能参与了肝细胞肝癌、乳腺癌和糖尿病等疾病发生过程。
目前针对IL-4/IL-4R开发的抗体药在临床上的适应症主要为过敏、特应性皮炎、哮喘和癌症等,一些生物制药大公司已经对IL-4/IL-4R抗体进行研发,包括安进、阿斯利康、史克必成、赛诺菲和再生元等。其中再生元和赛诺菲研发的单克隆抗体Dupixent(dupilumab、IL-4R)已经分别于2017年4月19日和2017年9月27日获FDA和EMA的批准。
由于人IL-4蛋白和IL-4R蛋白序列与啮齿类,如小鼠IL-4蛋白和IL-4Rα蛋白序列的一致性分别为53%和41%,存在显著差异。所以,一般情况下识别人IL-4或IL-4R蛋白的抗体,无法识别小鼠IL-4或IL-4R,无法用普通小鼠来筛选和评价靶向IL-4或IL-4R药物的药效。鉴于IL-4/IL-4R在疾病发生过程中的广泛参与性和巨大的应用价值,为了使临床前期的试验更有效并使研发失败最小化,本领域仍急需开发涉及IL-4和/或IL-4R的非人动物模型。本发明在学术和临床研究中具有广阔的应用前景。
发明内容
本发明的第一方面,涉及了一种包含IL-4Rα基因的人源化非人动物的构建方法,所述的人源化非人动物的基因组中包括人IL-4Rα基因的外显子4、外显子5、外显子6和/或外显子7,所述的人源化非人动物体内可表达人或人源化IL-4Rα蛋白,同时内源IL-4Rα蛋白表达降低或缺失。
优选的,所述的人或人源化IL-4Rα蛋白结合靶向人特定抗原的抗体。
优选的,所述的人源化非人动物的基因组中包括人IL-4Rα基因的外显子4、外显子5、外显子6或外显子7中的一种或两种以上的组合。
优选的,所述的人源化非人动物的基因组中包括人IL-4Rα基因的外显子4至外显子7的全部或部分。
进一步优选的,所述的人源化非人动物的基因组中包括人IL-4Rα基因的外显子4的全部或部分序列、外显子5的全部序列、外显子6的全部序列和外显子7的全部或部分序列。
优选的,所述的人IL-4Rα基因通过内源性调控元件调控。进一步优选的,所述的内源性调控元件包括启动子。
优选的,所述的人源化IL-4Rα蛋白包括胞外区、跨膜区及胞内参与信号传导的区域,其中,所述的胞外区包括人IL-4Rα蛋白胞外区的全部或部分,所述的跨膜区及胞内参与信号传导的区域来源于非人动物IL-4Rα蛋白。
进一步优选的,所述的胞外区氨基酸序列至少50个与人IL-4Rα胞外区序列相同,优选的,所述的胞外区序列包含SEQ ID NO:42第30-216位所示氨基酸序列的全部或部分。
优选的,所述的胞外区序列连续5-187个氨基酸与人TNFR2胞外区序列一致。进一步优选的,所述的胞外区序列连续10-100个氨基酸与人TNFR2胞外区序列一致。
优选的,所述的人源化非人动物的基因组中包括内源IL-4Rα基因的外显子1的全部序列、外显子2的全部序列、外显子3的全部序列、外显子4的部分序列、外显子7的部分序列及其后所有外显子的全部序列。
优选的,所述的人源化非人动物的基因组中的IL-4Rα基因是纯合的或杂合的。
在本发明的一个具体实施方式中,所述的人源化非人动物表达由内源IL-4基因编码的内源IL-4蛋白。
在本发明的另一个具体实施方式中,所述的人源化非人动物的基因组中包括人IL-4基因,该人源化非人动物表达人或人源化IL-4蛋白,同时内源IL-4蛋白表达降低或缺失。
优选的,所述的人源化非人动物的基因组中包括人IL-4基因的至少从外显子1的起始密码子至外显子4的终止密码子的连续序列;优选的,所述的人IL-4基因通过内源性调控元件调控或所述的人IL-4基因通过人源的调控元件调控。
进一步优选的,所述的人源化非人动物的基因组中包括人IL-4基因长度至少8.5kb。
进一步优选的,所述的人源化非人动物的基因组中包括人IL-4基因长度至少10.0kb。
本发明使用基因编辑技术进行人源化非人动物的构建,所述基因编辑技术包括利用胚胎干细胞的基因打靶技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。
本发明所述的非人动物为啮齿类动物;优选的,所述啮齿类动物为大鼠或小鼠。
在本发明的一个具体实施方式中,所述非人动物为小鼠,所述小鼠IL-4Rα的mRNA序列的全部或部分片段如SEQ ID NO:39中的全部或部分片段所示,所述小鼠IL-4Rα的蛋白序列的全部或部分片段如SEQ ID NO:40中的全部或部分片段所示。
在本发明的另一个具体实施方式中,所述人IL-4Rα的mRNA序列的全部或部分片段如SEQ ID NO:41中的全部或部分片段所示,所述人IL-4Rα的蛋白序列的全部或部分片段如SEQ ID NO:42中的全部或部分片段所示。
本发明所述的构建方法,包括将编码胞外区全部或部分的内源IL-4Rα基因替换为人的编码胞外区全部或部分的人IL-4Rα基因。
优选的,使用sgRNA靶向技术实现将内源IL-4Rα基因的外显子4的全部或部分序列至外显子7的全部或部分序列替换为人IL-4Rα基因的外显子4的全部或部分序列至外显子7的全部或部分序列;更优选的,sgRNA靶向的5’端靶位点序列如SEQ ID NO:65-71任一项所示,3’端靶位点序列如SEQ ID NO:72-79任一项所示;进一步优选的,使用的sgRNA靶位点序列为SEQ ID NO:65和/或SEQ ID NO:78。
优选的,利用胚胎干细胞的基因打靶技术,使用靶向载体将内源IL-4Rα基因的外显子4的全部或部分序列至外显子7的全部或部分序列替换为人IL-4Rα基因的外显子4的全部或部分序列至外显子7的全部或部分序列;所述的靶向载体包含:a)与待改变的转换区5’端同源的DNA片段,即5’臂,其选自与NCBI登录号为NC_000073.6至少具有90%同源性的核苷酸;b)插入或替换的供体DNA序列,其编码供体转换区;c)与待改变的转换区3’端同源的第二个DNA片段,即3’臂,其选自NCBI登录号为NC_000073.6至少具有90%同源性的核苷酸。
本发明所述的人源化IL-4Rα蛋白为嵌合IL-4Rα蛋白,所述的嵌合IL-4Rα蛋白选自下列组中的一种:
a)嵌合IL-4Rα蛋白序列为SEQ ID NO:44所述氨基酸序列的部分或全部;
b)嵌合IL-4Rα蛋白序列与SEQ ID NO:44所示氨基酸的序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)编码嵌合IL-4Rα蛋白的核酸序列在严格条件下,与编码SEQ ID NO:44所示蛋白的核苷酸序列杂交;
d)嵌合IL-4Rα蛋白序列与SEQ ID NO:44所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
e)嵌合IL-4Rα蛋白序列具有SEQ ID NO:44所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
本发明所述的人源化非人动物基因组中包括嵌合IL-4Rα基因,所述的嵌合IL-4Rα基因编码上述的嵌合IL-4Rα蛋白,或所述的嵌合IL-4Rα基因选自下列组中的一种:
a)嵌合IL-4Rα基因的mRNA序列为SEQ ID NO:43所示的序列的部分或全部;
b)嵌合IL-4Rα基因序列与SEQ ID NO:43所示的核苷酸序列的部分或全部的同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)嵌合IL-4Rα基因的序列在严格条件下,与SEQ ID NO:43所示的核苷酸序列杂交;
d)嵌合IL-4Rα基因的序列与SEQ ID NO:43所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
e)嵌合IL-4Rα基因序列具有SEQ ID NO:43所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
f)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分为SEQ ID NO:47所示的序列的部分或全部;
g)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分为与SEQ ID NO:47所示的核苷酸序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
h)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分在严格条件下,与SEQ ID NO:47所示的核苷酸序列杂交;
i)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分为与SEQ ID NO:47所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
j)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分为具有SEQ ID NO:47所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
k)嵌合IL-4Rα基因中含有SEQ ID NO:48和/或SEQ ID NO:49所示序列的全部或部分;
l)嵌合IL-4Rα基因中含有与SEQ ID NO:48和/或SEQ ID NO:49所示的核苷酸序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
m)嵌合IL-4Rα基因序列在严格条件下,与SEQ ID NO:48和/或SEQ ID NO:49所示的核苷酸序列杂交;
n)嵌合IL-4Rα基因中含有与SEQ ID NO:48和/或SEQ ID NO:49所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
o)嵌合IL-4Rα基因中含有具有SEQ ID NO:48和/或SEQ ID NO:49所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
本发明所述的人源化非人动物基因组中包括嵌合IL-4基因,所述的嵌合IL-4基因编码人IL-4蛋白,所述的嵌合IL-4基因选自下列组中的一种:
a)嵌合IL-4基因的mRNA序列为SEQ ID NO:80或SEQ ID NO:3所示的序列的部分或全部;
b)嵌合IL-4基因的mRNA序列与SEQ ID NO:80或SEQ ID NO:3所示的核苷酸序列的部分或全部的同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)嵌合IL-4基因的mRNA序列在严格条件下,与SEQ ID NO:80或SEQ ID NO:3所示的核苷酸序列杂交;
d)嵌合IL-4基因的mRNA序列与SEQ ID NO:80或SEQ ID NO:3所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
e)嵌合IL-4基因的mRNA序列具有SEQ ID NO:80或SEQ ID NO:3所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
f)嵌合IL-4基因中来源于人IL-4基因的部分为SEQ ID NO:7或SEQ ID NO:22所示的序列的部分或全部;
g)嵌合IL-4基因中来源于人IL-4基因的部分为与SEQ ID NO:7或SEQ ID NO:22所示的核苷酸序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
h)嵌合IL-4基因中来源于人IL-4基因的部分在严格条件下,与SEQ ID NO:7或SEQID NO:22所示的核苷酸序列杂交;
i)嵌合IL-4基因中来源于人IL-4基因的部分为与SEQ ID NO:7或SEQ ID NO:22所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
j)嵌合IL-4基因中来源于人IL-4基因的部分为具有SEQ ID NO:7或SEQ ID NO:22所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
k)嵌合IL-4基因中含有SEQ ID NO:8或SEQ ID NO:23,和/或SEQ ID NO:9所示序列的全部或部分;
l)嵌合IL-4基因中含有与ID NO:8或SEQ ID NO:23,和/或SEQ ID NO:9所示的核苷酸序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
m)嵌合IL-4基因序列在严格条件下,与SEQ ID NO:8或SEQ ID NO:23,和/或SEQID NO:9所示的核苷酸序列杂交;
n)嵌合IL-4基因中含有与SEQ ID NO:8或SEQ ID NO:23,和/或SEQ ID NO:9所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
o)嵌合IL-4基因中含有具有SEQ ID NO:8或SEQ ID NO:23,和/或SEQ ID NO:9所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
本发明的第二方面,涉及采用上述包含IL-4Rα基因的人源化非人动物的构建方法构建的IL-4Rα基因的人源化非人动物或其后代。
本发明的第三方面,涉及一种IL-4Rα基因敲除非人动物的方法,具体为将非人动物IL-4Rα基因的外显子4至外显子7全部或部分敲除,使得内源IL-4Rα蛋白失活。
优选的,使用sgRNA序列靶向的5’端靶位点如SEQ ID NO:65-71任一项所示,3’端靶位点的序列如SEQ ID NO:72-78任一项所示;进一步优选的,使用的sgRNA靶位点序列为SEQ ID NO:65和/或SEQ ID NO:78。
本发明的第四方面,涉及一种包含IL-4Rα基因的人源化非人动物,所述的人源化非人动物的基因组中包括人IL-4Rα基因的外显子4、外显子5、外显子6和/或外显子7,所述的人IL-4Rα基因通过内源性调控元件调控;该人源化非人动物体内可表达人或人源化IL-4Rα蛋白,同时内源IL-4Rα蛋白表达降低或缺失。
优选的,所述的人源化IL-4Rα蛋白的组成胞外区、跨膜区及胞内参与信号传导的区域,其中,所述的胞外区为人IL-4Rα蛋白胞外区的全部或部分,所述的跨膜区及胞内参与信号传导的区域为非人动物IL-4Rα蛋白的跨膜区及胞内参与信号传导的区域。
在本发明的一个具体实施方式中,所述的人源化非人动物表达由内源IL-4基因编码的内源IL-4蛋白。
在本发明的另一个具体实施方式中,所述的人源化非人动物的基因组中包括人IL-4基因,该人源化非人动物表达人或人源化IL-4蛋白,同时内源IL-4蛋白表达降低或缺失。
优选的,所述的人源化非人动物的基因组中包括人IL-4基因的至少从外显子1的起始密码子至外显子4的终止密码子的连续序列,所述的人IL-4基因长度至少8.5kb,所述的人IL-4基因通过内源性调控元件调控或人源调控元件调控。
本发明所述非人动物为啮齿类动物;优选的,所述啮齿类动物为大鼠或小鼠。所述的人源化IL-4Rα蛋白为嵌合IL-4Rα蛋白,所述的嵌合IL-4Rα蛋白选自下列组中的一种:
a)嵌合IL-4Rα蛋白序列为SEQ ID NO:44所述氨基酸序列的部分或全部;
b)嵌合IL-4Rα蛋白序列与SEQ ID NO:44所示氨基酸的序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)编码嵌合IL-4Rα蛋白的核酸序列在严格条件下,与编码SEQ ID NO:44所示蛋白的核苷酸序列杂交;
d)嵌合IL-4Rα蛋白序列与SEQ ID NO:44所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
e)嵌合IL-4Rα蛋白序列具有SEQ ID NO:44所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化非人动物基因组中包括嵌合IL-4Rα基因,所述的嵌合IL-4Rα基因编码上述的嵌合IL-4Rα蛋白,或所述的嵌合IL-4Rα基因选自下列组中的一种:
a)嵌合IL-4Rα基因的mRNA序列为SEQ ID NO:43所示的序列的部分或全部;
b)嵌合IL-4Rα基因序列与SEQ ID NO:43所示的核苷酸序列的部分或全部的同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)嵌合IL-4Rα基因的序列在严格条件下,与SEQ ID NO:43所示的核苷酸序列杂交;
d)嵌合IL-4Rα基因的序列与SEQ ID NO:43所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
e)嵌合IL-4Rα基因序列具有SEQ ID NO:43所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
f)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分为SEQ ID NO:47所示的序列的部分或全部;
g)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分为与SEQ ID NO:47所示的核苷酸序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
h)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分在严格条件下,与SEQ ID NO:47所示的核苷酸序列杂交;
i)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分为与SEQ ID NO:47所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
j)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分为具有SEQ ID NO:47所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
k)嵌合IL-4Rα基因中含有SEQ ID NO:48和/或SEQ ID NO:49所示序列的全部或部分;
l)嵌合IL-4Rα基因中含有与SEQ ID NO:48和/或SEQ ID NO:49所示的核苷酸序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
m)嵌合IL-4Rα基因序列在严格条件下,与SEQ ID NO:48和/或SEQ ID NO:49所示的核苷酸序列杂交;
n)嵌合IL-4Rα基因中含有与SEQ ID NO:48和/或SEQ ID NO:49所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
o)嵌合IL-4Rα基因中含有具有SEQ ID NO:48和/或SEQ ID NO:49所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
本发明的第五方面,涉及一种包含IL-4基因的人源化非人动物的构建方法,所述的人源化非人动物的基因组中包括人IL-4基因的至少从外显子1的起始密码子至外显子4的终止密码子的连续序列;该人源化非人动物体内表达人或人源化IL-4蛋白,同时内源IL-4蛋白表达降低或缺失。
优选的,所述的人或人源化IL-4蛋白结合靶向人特定抗原的抗体。
所述的人源化非人动物的基因组中包括人IL-4基因长度至少8.5kb。
优选的,所述的人源化非人动物的基因组中包括人IL-4基因长度至少10.0kb。
优选的,所述的人源化非人动物的基因组中的IL-4基因是纯合的或杂合的。
在本发明的一个具体实施方式中,所述的人IL-4基因通过人源调控元件调控。
在本发明的另一个具体实施方式中,所述的人IL-4基因通过内源性调控元件调控。
在本发明的一个具体实施方式中,所述的人源化非人动物表达由内源IL-4Rα基因编码的内源IL-4Rα蛋白。
在本发明的另一个具体实施方式中,所述的人源化非人动物的基因组中包括人IL-4Rα基因,该人源化非人动物表达人或人源化IL-4Rα蛋白,所述的人或人源化IL-4Rα蛋白结合靶向人特定抗原的抗体,同时内源IL-4Rα蛋白表达降低或缺失。
优选的,所述的人源化非人动物的基因组中包括人IL-4Rα基因的外显子4、外显子5、外显子6和/或外显子7,所述的人IL-4Rα基因通过内源性调控元件调控。进一步优选的,所述的人源化非人动物的基因组中包括人IL-4Rα基因的外显子4的全部或部分序列、外显子5的全部序列、外显子6的全部序列和外显子7的全部或部分序列。
本发明使用基因编辑技术进行人源化非人动物的构建,所述基因编辑技术包括利用胚胎干细胞的基因打靶技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。
本发明所述非人动物为啮齿类动物;优选的,所述啮齿类动物为大鼠或小鼠。
在本发明的一个具体实施方式中,所述非人动物为小鼠,所述小鼠IL-4的mRNA序列的全部或部分片段如SEQ ID NO:1中的全部或部分片段所示,所述小鼠IL-4的蛋白序列的全部或部分片段如SEQ ID NO:2中的全部或部分片段所示。
在本发明的另一个具体实施方式中,所述人IL-4的mRNA序列的全部或部分片段如SEQ ID NO:3中的全部或部分片段所示,所述人IL-4的蛋白序列的全部或部分片段如SEQID NO:4中的全部或部分片段所示。
本发明所述的构建方法,用人IL-4基因的至少从外显子1的起始密码子至外显子4的终止密码子的连续序列替换非人动物的相应区域。
在本发明的一个具体实施方式中,利用胚胎干细胞的基因打靶技术,使用靶向载体将内源IL-4基因的至少从外显子1的起始密码子至外显子4的终止密码子的连续序列替换为人IL-4基因的至少从外显子1的起始密码子至外显子4的终止密码子的连续序列,其中所述的人IL-4基因长度至少为8.5kb;优选的,所述的靶向载体包含:a)与待改变的转换区5’端同源的DNA片段,即5’臂,其选自与NCBI登录号为NC_000077.6至少具有90%同源性的核苷酸;b)插入或替换的供体DNA序列,其编码供体转换区;c)与待改变的转换区3’端同源的第二个DNA片段,即3’臂,其选自NCBI登录号为NC_000077.6至少具有90%同源性的核苷酸。进一步优选的,所述的5’臂选自与NCBI登录号为NC_000077.6的第53622826-53618607位核苷酸,所述的3’臂选自与NCBI登录号为NC_000077.6的第53612065-53607981位核苷酸。
在本发明的另一个具体实施方式中,利用胚胎干细胞的基因打靶技术,使用靶向载体将内源IL-4基因的至少从外显子1的起始密码子至外显子4的终止密码子的连续序列替换为人IL-4基因的至少从外显子1的起始密码子至外显子4的终止密码子的连续序列,其中所述的人IL-4基因长度至少为10.0kb;优选的,所述的靶向载体包含:a)与待改变的转换区5’端同源的DNA片段,即5’臂,其选自与NCBI登录号为NC_000077.6至少具有90%同源性的核苷酸;b)插入或替换的供体DNA序列,其编码供体转换区;c)与待改变的转换区3’端同源的第二个DNA片段,即3’臂,其选自NCBI登录号为NC_000077.6至少具有90%同源性的核苷酸;进一步优选的,所述的5’臂选自与NCBI登录号为NC_000077.6的第53625623-53620071位核苷酸,所述的3’臂选自与NCBI登录号为NC_000077.6的第53612200-53607005位核苷酸。
优选的,所述的包含IL-4基因的人源化非人动物的基因组中包括嵌合IL-4基因,所述的嵌合IL-4基因编码人IL-4蛋白。
优选的,所述的包含IL-4基因的人源化非人动物的基因组中包括嵌合IL-4Rα基因。
本发明的第六方面,涉及采用上述包含IL-4基因的人源化非人动物的构建方法构建的IL-4基因的人源化非人动物或其后代。
本发明的第七方面,涉及一种包含IL-4基因的人源化非人动物,所述的人源化非人动物的基因组中包括人IL-4基因的至少从外显子1的起始密码子至外显子4的终止密码子的连续序列,所述的人IL-4基因长度至少8.5kb;该人源化非人动物体内可表达人或人源化IL-4蛋白,同时内源IL-4蛋白表达降低或缺失。优选的,所述的人源化非人动物的基因组中包括人IL-4基因长度至少10.0kb。
本发明的一个具体实施方式中,所述的人IL-4基因通过人源调控元件调控。
本发明的另一个具体实施方式中,所述的人IL-4基因通过内源性调控元件调控。
本发明的一个具体实施方式中,所述的人源化非人动物表达由内源IL-4Rα基因编码的内源IL-4Rα蛋白。
本发明的另一个具体实施方式中,所述的人源化非人动物的基因组中包括人IL-4Rα基因,该人源化非人动物表达人或人源化IL-4Rα蛋白,同时内源IL-4Rα蛋白表达降低或缺失。优选的,所述的人源化非人动物的基因组中包括人IL-4Rα基因的外显子4、外显子5、外显子6和/或外显子7,所述的人IL-4Rα基因通过内源性调控元件调控。进一步优选的,所述的人源化非人动物的基因组中包括人IL-4Rα基因的外显子4的全部或部分序列、外显子5的全部序列、外显子6的全部序列和外显子7的全部或部分序列。
本发明所述非人动物为啮齿类动物;优选的,所述啮齿类动物为大鼠或小鼠。
本发明的第八方面,涉及一种IL-4Rα基因的靶向载体,所述的靶向载体包含:a)与待改变的转换区5’端同源的DNA片段,即5’臂,其选自与NCBI登录号为NC_000073.6至少具有90%同源性的核苷酸;b)插入或替换的供体DNA序列,其编码供体转换区;c)与待改变的转换区3’端同源的第二个DNA片段,即3’臂,其选自NCBI登录号为NC_000073.6至少具有90%同源性的核苷酸。
优选的,所述的待改变的转换区位于IL-4Rα基因的外显子4至外显子7。
优选的,所述5’臂序列如SEQ ID NO:45所示;或者,所述3’臂序列如SEQ ID NO:46所示。
优选的,所述的插入或替换的供体DNA序列如SEQ ID NO:47所示。
本发明所述的IL-4基因或Il-4Rα基因的靶向载体还包括可选择的基因标记。
优选的,所述标记基因为负筛选标记的编码基因。进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。
优选的,所述靶向载体还包括阳性克隆筛选的抗性基因。进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。
优选的,所述靶向载体还包括特异性重组系统。进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统)。所述的特异性重组系统为2个,分别装在抗性基因的两侧。
本发明的第九方面,涉及一种特异的靶向IL-4Rα基因的sgRNA序列,所述的sgRNA序列在非人动物IL-4Rα基因的靶位点位于非人动物IL-4Rα基因的外显子4或外显子7上;所述的sgRNA序列的靶向的5’端靶位点序列如SEQ ID NO:65-71任一项所示,3’端靶位点序列如SEQ ID NO:72-79任一项所示;优选的,sgRNA序列的靶向的5’端靶位点序列为SEQ IDNO:65,sgRNA序列的靶向的3’端靶位点序列为SEQ ID NO:78。
本发明的第十方面,涉及一种编码上述所述的sgRNA序列的DNA分子。
本发明的第十一方面,涉及一种构建人源化非人动物的载体,所述的载体产生上述的sgRNA序列,用于敲除或替换IL-4Rα基因的外显子4至外显子7的部分或全部。
本发明的第十二方面,涉及所述构建人源化非人动物的载体的制备方法,包括如下步骤:
1)将序列如SEQ ID NO:65-71所示的任一项sgRNA靶序列和/或SEQ ID NO:72-79所示的任一项sgRNA靶序列,制备获得正向寡核苷酸序列和反向寡核苷酸序列;
2)合成含有T7启动子及sgRNA scaffold的片段DNA,将上述片段依次通过EcoRI和BamHI酶切连接至骨架载体pHSG299上,经测序验证,获得pT7-sgRNAG2载体;
3)分别合成步骤1)中所述的正向寡核苷酸和反向寡核苷酸,将合成的sgRNA寡聚核苷酸变性、退火,形成可以连入步骤2)所述的pT7-sgRNAG2载体的双链;
4)将步骤3)中退火的双链sgRNA寡聚核苷酸分别与pT7-sgRNAG2载体进行链接,筛选获得sgRNA载体。
本发明的第十三方面,涉及一种IL-4Rα基因敲除非人动物的制备方法,包括如下步骤:
a)按照上述制备sgRNA载体的方法步骤1)-4),获得sgRNA载体;
b)将sgRNA载体的体外转录产物和Cas9mRNA进行混合,获得混合液,将混合液注射至小鼠受精卵细胞质或细胞核中,将注射后的受精卵转移至培养液中进行培养,然后移植至受体母鼠的输卵管中发育,得到F0代小鼠;
c)将F0代小鼠利用PCR技术进行检验,验证细胞中的IL-4Rα基因被敲除,获得IL-4Rα基因敲除阳性小鼠;
d)将步骤c)筛选的阳性小鼠通过杂交和自交的方式,扩大种群数量,建立稳定的IL-4Rα基因敲除小鼠。
本发明的第十四方面,涉及一种IL-4Rα基因人源化非人动物的制备方法,包括如下步骤:
第一步:按照上述制备sgRNA载体的步骤1)-4),获得sgRNA载体;
第二步:将sgRNA载体的体外转录产物、上述的IL-4Rα基因的靶向载体和Cas9mRNA进行混合,将混合液注射至雌性动物受精卵细胞质或细胞核中,将注射后的受精卵转移至培养液中进行培养,然后移植至受体动物的输卵管中发育,得到F0代动物;
第三步:将F0代动物利用PCR技术进行检验,验证细胞中的IL-4Rα基因人源化非人动物。
本发明的第十五方面,涉及一种IL-4基因人源化非人动物的制备方法,包括如下步骤:
第一步:按照上述制备sgRNA载体的步骤1)-4),获得sgRNA载体;
第二步:将上述的IL-4基因的靶向载体和Cas9mRNA进行混合,将混合液注射至雌性动物受精卵细胞质或细胞核中,将注射后的受精卵转移至培养液中进行培养,然后移植至受体动物的输卵管中发育,得到F0代动物;
第三步:将F0代动物利用PCR技术进行检验,验证细胞中的IL-4Rα基因人源化非人动物。
本发明的第十六方面,涉及一种上述的靶向IL-4Rα的靶向载体、上述的sgRNA序列或上述的载体在敲除或替换IL-4Rα基因的外显子4至外显子7的部分或全部的应用。
本发明的第十七方面,涉及一种IL-4基因的靶向载体,所述的靶向载体包含:a)与待改变的转换区5’端同源的DNA片段,即5’臂,其选自与NCBI登录号为NC_000077.6至少具有90%同源性的核苷酸;b)插入或替换的供体DNA序列,其编码供体转换区;c)与待改变的转换区3’端同源的第二个DNA片段,即3’臂,其选自NCBI登录号为NC_000077.6至少具有90%同源性的核苷酸。
优选的,所述的待改变的转换区位于IL-4基因的包含外显子1至外显子4的至少8.5kb或至少10kb的区域。
优选的,所述5’臂序列如SEQ ID NO:5所示;或者,所述3’臂序列如SEQ ID NO:6所示。进一步优选的,所述的插入或替换的供体DNA序列如SEQ ID NO:7所示。
优选的,所述5’臂序列如SEQ ID NO:20所示;或者,所述3’臂序列如SEQ ID NO:21所示。进一步优选的,所述的插入或替换的供体DNA序列如SEQ ID NO:22所示。
本发明的第十八方面,涉及一种上述的靶向IL-4的靶向载体在敲除或替换IL-4基因的外显子1至外显子4的部分或全部中的应用。
本发明的第十九方面,涉及一种包含IL-4Rα基因的人源化细胞株,所述的人源化细胞株的基因组中包括人IL-4Rα基因的外显子4、外显子5、外显子6和/或外显子7,所述的人IL-4Rα基因通过内源性调控元件调控;该人源化细胞株表达人或人源化IL-4Rα蛋白,同时内源IL-4Rα蛋白表达降低或缺失。
本发明的第二十方面,涉及一种IL-4Rα基因缺失的细胞株,使用上述特异的靶向IL-4Rα基因的sgRNA序列或上述的DNA分子敲除外显子4至外显子7的部分或全部序列制备获得。
本发明的第二十一方面,涉及一种包含IL-4基因的人源化细胞株,所述的人源化细胞株的基因组中包括人IL-4基因的至少从外显子1的起始密码子至外显子4的终止密码子的连续序列;该人源化细胞株表达人或人源化IL-4蛋白,同时内源IL-4蛋白表达降低或缺失。
优选的,所述的人IL-4基因长度至少8.5kb。
优选的,所述的人IL-4基因长度至少10.0kb。
本发明所述的人源化细胞株或基因缺失的细胞株均不是动物品种,所述的人源化细胞株或基因缺失的细胞株不会发育为个体。
本发明的第二十二方面,涉及一种包含IL-4Rα基因人源化和IL-4基因人源化的非人动物,所述的非人动物的基因组中包括人IL-4Rα基因的外显子4、外显子5、外显子6和/或外显子7,所述的人IL-4Rα基因通过内源性调控元件调控,该人源化非人动物体内表达人或人源化IL-4Rα蛋白,同时内源IL-4Rα蛋白表达降低或缺失;和,所述的非人动物的基因组中包括人IL-4基因的至少从外显子1的起始密码子至外显子4的终止密码子的连续序列,所述的人IL-4基因长度至少8.5kb;该人源化非人动物体内可表达人或人源化IL-4蛋白,同时内源IL-4蛋白表达降低或缺失。
本发明的第二十三方面,涉及一种包含IL-4Rα基因人源化和IL-4基因人源化的非人动物的制备方法,所述的方法包括将上述构建方法构建的IL-4Rα基因人源化的非人动物与上述构建方法构建的IL-4基因人源化的非人动物交配、体外授精或直接进行基因编辑,并进行筛选,得到包含IL-4Rα基因人源化和IL-4基因人源化的非人动物。
本发明的第二十四方面,涉及一种制备多基因人源化非人动物的方法,包括如下步骤:
(a)采用上述的构建方法构建人源化非人动物或上述的制备方法制备包含IL-4Rα基因人源化和IL-4基因人源化的非人动物;
(b)将步骤(a)制备获得的非人动物与其他人源化动物交配、体外授精或直接进行基因编辑,并进行筛选,得到多基因人源化非人动物。
优选的,所述多基因人源化非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物、六基因人源化非人动物、七基因人源化非人动物、八基因人源化非人动物或九基因人源化非人动物。
优选的,所述的其他人源化动物选自基因PD-1(201710505554.0,PCT/CN2017/090320)、PD-L1(201710757022.6,PCT/CN2017/099574)、CTLA-4(201710757917.X,PCT/CN2017/099577)、LAG-3(201711103245.7,PCT/CN2017/110435)、BTLA(201710948551.4,PCT/CN2017/106024)、CD27(201711402264.X,PCT/CN2017/117984)、CD28(201710465217.3)、CD47(201810295709.7,PCT/CN2018/081628)、CD137(201711473251.1,PCT/CN2017/120388)、CD154(201710464564.4,201710872886.2)、OX40(201710757005.2,PCT/CN2017/099575)、SIRPα(201810296193.8,PCT/CN2018/081629)、TIGIT(201710757916.5,PCT/CN2017/099576)、TIM-3(201711103773.2,PCT/CN2017/110494)、CD40(201710464564.4,201710872886.2)或GITR(201710465493.X,201710872122.3)人源化动物中的一种或两种以上的组合。
本发明的第二十五方面,涉及一种上述的方法制备获得的多基因人源化非人动物或其后代。
本发明的第二十六方面,涉及一种荷瘤动物模型的制备方法,所述荷瘤动物模型的制备方法包括通过上述的构建方法构建人源化非人动物、上述的方法制备IL-4Rα基因敲除非人动物、上述的制备方法制备包含IL-4Rα基因人源化和IL-4基因人源化的非人动物或者上述的方法制备多基因人源化非人动物的步骤。
优选的,所述的荷瘤动物模型的制备方法还包括在上述方法制备的非人动物或其后代植入肿瘤细胞的步骤。
本发明的第二十七方面,涉及一种免疫系统疾病的动物模型的制备方法,所述的免疫系统疾病的动物模型的制备方法包括通过上述的构建方法构建人源化非人动物、上述的方法制备IL-4Rα基因敲除非人动物、上述的制备方法制备包含IL-4Rα基因人源化和IL-4基因人源化的非人动物或者上述的方法制备多基因人源化非人动物的步骤。
本发明所述的免疫系统疾病包括但不限于炎症、自身免疫疾病或者过敏。优选的,所述的免疫系统疾病包括但不限于哮喘、皮炎、特异性皮炎、慢性阻塞性肺疾病(COPD)、气道炎症、炎性肠病、多发性硬化、关节炎、过敏性鼻炎或者嗜酸细胞性食管炎。
进一步优选的,所述免疫系统疾病的动物模型为哮喘动物模型。
优选的,所述的免疫系统疾病的动物模型的制备方法还包括致敏和/或雾化激发的步骤。
本发明的第二十八方面,涉及一种非人动物在制备荷瘤或者免疫系统疾病的动物模型中的应用,所述非人动物选自上述的构建方法构建的人源化非人动物、上述的制备方法制备的包含IL-4Rα基因人源化和IL-4基因人源化的非人动物或者上述的方法制备的多基因人源化非人动物。
本发明的第二十九方面,涉及一种细胞或细胞系或原代细胞培养物,所述细胞或细胞系或原代细胞培养物来源于上述构建方法构建的人源化非人动物、上述方法制备的IL-4Rα基因敲除非人动物、上述的制备方法制备的包含IL-4Rα基因人源化和IL-4基因人源化的非人动物、上述方法制备的多基因人源化非人动物或其后代或上述制备方法制备的荷瘤或免疫系统疾病的动物模型。
本发明的第三十方面,涉及一种组织或器官或其培养物,所述组织或器官或其培养物来源于上述构建方法构建的人源化非人动物、上述方法制备的IL-4Rα基因敲除非人动物、上述的制备方法制备的包含IL-4Rα基因人源化和IL-4基因人源化的非人动物、上述方法制备的多基因人源化非人动物或其后代或上述制备方法制备的荷瘤或免疫系统疾病的动物模型。
本发明的第三十一方面,涉及一种嵌合IL-4Rα蛋白,所述嵌合IL-4Rα蛋白包括胞外区、跨膜区及胞内参与信号传导的区域,其中,所述的胞外区包括人IL-4Rα蛋白胞外区的全部或部分,所述的跨膜区及胞内参与信号传导的区域来源于非人动物IL-4Rα蛋白。
优选的,所述的嵌合IL-4Rα蛋白选自下列组中的一种:
a)嵌合IL-4Rα蛋白序列为SEQ ID NO:44所述氨基酸序列的部分或全部;
b)嵌合IL-4Rα蛋白序列与SEQ ID NO:44所示氨基酸的序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)编码嵌合IL-4Rα蛋白的核酸序列在严格条件下,与编码SEQ ID NO:44所示蛋白的核苷酸序列杂交;
d)嵌合IL-4Rα蛋白序列与SEQ ID NO:44所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
e)嵌合IL-4Rα蛋白序列具有SEQ ID NO:44所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
本发明的第三十二方面,涉及一种编码上述的嵌合IL-4Rα蛋白的嵌合IL-4Rα基因,所述的嵌合IL-4Rα基因选自下列组中的一种:
a)嵌合IL-4Rα基因的mRNA序列为SEQ ID NO:43所示的序列的部分或全部;
b)嵌合IL-4Rα基因序列与SEQ ID NO:43所示的核苷酸序列的部分或全部的同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)嵌合IL-4Rα基因的序列在严格条件下,与SEQ ID NO:43所示的核苷酸序列杂交;
d)嵌合IL-4Rα基因的序列与SEQ ID NO:43所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
e)嵌合IL-4Rα基因序列具有SEQ ID NO:43所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
f)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分为SEQ ID NO:47所示的序列的部分或全部;
g)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分为与SEQ ID NO:47所示的核苷酸序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
h)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分在严格条件下,与SEQ ID NO:47所示的核苷酸序列杂交;
i)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分为与SEQ ID NO:47所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
j)嵌合IL-4Rα基因中来源于人IL-4Rα基因的部分为具有SEQ ID NO:47所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
k)嵌合IL-4Rα基因中含有SEQ ID NO:48和/或SEQ ID NO:49所示序列的全部或部分;
l)嵌合IL-4Rα基因中含有与SEQ ID NO:48和/或SEQ ID NO:49所示的核苷酸序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
m)嵌合IL-4Rα基因序列在严格条件下,与SEQ ID NO:48和/或SEQ ID NO:49所示的核苷酸序列杂交;
n)嵌合IL-4Rα基因中含有与SEQ ID NO:48和/或SEQ ID NO:49所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
o)嵌合IL-4Rα基因中含有具有SEQ ID NO:48和/或SEQ ID NO:49所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
本发明的第三十三方面,涉及一种编码人IL-4蛋白的嵌合IL-4基因,所述的人源化非人动物基因组中包括嵌合IL-4基因,所述的嵌合IL-4基因编码人IL-4蛋白,所述的嵌合IL-4基因选自下列组中的一种:
a)嵌合IL-4基因的mRNA序列为SEQ ID NO:80或SEQ ID NO:3所示的序列的部分或全部;
b)嵌合IL-4基因序列的mRNA与SEQ ID NO:80或SEQ ID NO:3所示的核苷酸序列的部分或全部的同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)嵌合IL-4基因的mRNA序列在严格条件下,与SEQ ID NO:80或SEQ ID NO:3所示的核苷酸序列杂交;
d)嵌合IL-4基因的mRNA序列与SEQ ID NO:80或SEQ ID NO:3所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
e)嵌合IL-4基因的mRNA序列具有SEQ ID NO:80或SEQ ID NO:3所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
f)嵌合IL-4基因中来源于人IL-4基因的部分为SEQ ID NO:7或SEQ ID NO:22所示的序列的部分或全部;
g)嵌合IL-4基因中来源于人IL-4基因的部分为与SEQ ID NO:7或SEQ ID NO:22所示的核苷酸序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
h)嵌合IL-4基因中来源于人IL-4基因的部分在严格条件下,与SEQ ID NO:7或SEQID NO:22所示的核苷酸序列杂交;
i)嵌合IL-4基因中来源于人IL-4基因的部分为与SEQ ID NO:7或SEQ ID NO:22所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
j)嵌合IL-4基因中来源于人IL-4基因的部分为具有SEQ ID NO:7或SEQ ID NO:22所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
k)嵌合IL-4基因中含有SEQ ID NO:8或SEQ ID NO:23,和/或SEQ ID NO:9所示序列的全部或部分;
l)嵌合IL-4基因中含有与ID NO:8或SEQ ID NO:23,和/或SEQ ID NO:9所示的核苷酸序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
m)嵌合IL-4基因序列在严格条件下,与SEQ ID NO:8或SEQ ID NO:23,和/或SEQID NO:9所示的核苷酸序列杂交;
n)嵌合IL-4基因中含有与SEQ ID NO:8或SEQ ID NO:23,和/或SEQ ID NO:9所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
o)嵌合IL-4基因中含有具有SEQ ID NO:8或SEQ ID NO:23,和/或SEQ ID NO:9所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
本发明的第三十四方面,涉及一种表达上述的嵌合IL-4Rα蛋白的构建体。
本发明的第三十五方面,涉及一种包含上述构建体的细胞。
本发明的第三十六方面,涉及一种包含上述细胞的组织。
本发明的第三十七方面,涉及来源于上述构建方法构建的人源化非人动物、上述方法制备的IL-4Rα基因敲除非人动物、上述制备方法制备的包含IL-4Rα基因人源化和IL-4基因人源化的非人动物、上述方法制备的多基因人源化非人动物或上述制备方法制备的荷瘤或免疫系统疾病的动物模型在需要涉及人类细胞的免疫过程的产品开发,制造人类抗体,或者作为药理学、免疫学、微生物学和医学研究的模型系统中的应用。
或在生产和利用动物实验疾病模型,用于病原学研究和/或用于开发新的诊断策略和/或治疗策略中的应用。
或在筛选、验证、评价或研究IL-4和/或IL-4R基因功能、针对IL-4和/或IL-4R靶位点的药物、药效研究,免疫相关疾病药物以及抗肿瘤或抗免疫系统疾病的药物,筛选和评估人用药及药效研究方面的用途。
基于上述的技术方案,本申请产生了良好的技术效果,包括:采用本发明制备的人源化动物体内正常表达人或人源化IL-4蛋白和/或人或人源化IL-4Rα蛋白,并且该人或人源化蛋白结合靶向人特定抗原的抗体。本发明制备的人源化动物可以模拟疾病模型,在临床前研究中用于筛选、评估抗人IL4/IL4Ra抗体的体内药效,并可用于表征抗人IL4和/或IL4Ra抗体特性。
本发明所述“治疗(treating)”(或“治疗(treat)”或“治疗(treatment)”)表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除。术语“治疗(treating)”等是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。
本发明所述“同源性”,是指在使用蛋白序列或核苷酸序列的方面,本领域技术人员可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。
本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。
在一个方面,所述非人动物是哺乳动物。在一个方面,所述非人动物是小型哺乳动物,例如跳鼠科或鼠总科超家族。在一个实施方式中,所述基因修饰的动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。
在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠。
参考书籍:格林等.分子克隆实验指南:第4版.科学出版社,2013,《小鼠胚胎操作实验手册(第三版)。
本发明计划对非人动物(如小鼠)进行改造,使该动物体内包含编码人IL-4和/或IL-4Rα蛋白的基因序列,以使其体内表达人或人源化IL-4和/或IL-4Rα蛋白。可通过各种基因编辑系统和制备方法得到表达人IL-4和/或IL-4Rα蛋白的非人哺乳动物,包括但不限于利用胚胎干细胞(embryonic stem cell,ES)的基因打靶技术、锌指核酸酶(ZFN)技术、转录激活子样效应因子核酸酶(TALEN)技术、归巢核酸内切酶(兆碱基大范围核酶)、规律成簇间隔短回文重复(Clustered Regularly Interspaced Short Palindromic Repeats,CRISPR)技术或其他分子生物学技术。本发明实施例主要以ES细胞的基因同源重组技术为例,阐述如何通过构建特异靶向小鼠IL-4或IL-4Rα基因靶向载体实现序列替换得到所述人源化小鼠。鉴于人或小鼠IL-4和/或IL-4Rα具有多种亚型或转录本,本文所述的方法可应用于其它亚型或转录本。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:Molecular Cloning A Laboratory Manual,2ndEd.,ed.By Sambrook,Fritschand Maniatis(Cold Spring Harbor Laboratory Press:1989);DNA Cloning,Volumes I and II(D.N.Glovered.,1985);Oligonucleotide Synthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelsonand M.Simon,eds.in chief,Academic Press,Inc.,New York),specifically,Vols.154and 155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,ed.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods InCell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook Of Experimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);and Manipulating the Mouse Embryo,(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1986)。
以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:小鼠和人IL-4基因对比示意图(非按比例);
图2:人源化小鼠IL-4基因示意图(非按比例);
图3:人源化小鼠IL-4基因示意图(非按比例);
图4:IL-4人源化小鼠(短片段替换)打靶策略示意图(非按比例);
图5:(A)重组载体酶切结果图,图中1、2、3分别指3个载体质粒,ck代表未经酶切的质粒对照,M为Marker;(B)Marker分子量说明;
图6:细胞PCR鉴定结果,其中,+为阳性对照,WT为野生型对照,M为Marker,H2O为对照;图中标记克隆号的泳道的鉴定结果为阳性,其余未标明克隆号的泳道对应的细胞为阴性;
图7:细胞Southern blot结果,其中WT为野生型;
图8:IL-4人源化小鼠(长片段替换)打靶策略示意图(非按比例);
图9:(A)重组载体酶切结果图,其中ck代表未经酶切的质粒对照,M为Marker,左边三个泳道为1个质粒分别经过BamHI、EcoRI或ScaI 3组酶处理;(B)Marker分子量说明;
图10:细胞PCR鉴定结果,其中,M为Marker,+为阳性对照,WT为野生型对照,H2O为对照,图中标记克隆号1-G9的泳道的鉴定结果为阳性,其余未标明克隆号的泳道对应的细胞为阴性;
图11:细胞Southern blot结果,其中WT为野生型;
图12:FRT重组过程示意图(非按比例);
图13:F1代(短片段替换)鼠尾PCR鉴定结果,其中,图(A)使用引物对WT-F和WT-R用于扩增野生型小鼠IL-4基因4号外显子片段;图(B)使用引物对Mut-F和WT-R用于扩增改造后的小鼠IL-4基因4号外显子片段,用以验证重组载体是否存在并正确插入基因组位点;图(C)使用引物对Frt-F和Frt-R用以扩增neo片段以验证抗性片段是否去除;图(D)使用引物对Flp-F和Flp-R用以确认Flp片段的存在;其中,M为Marker,WT为野生型,H2O为对照,+为阳性对照;
图14:IL-4人源化小鼠ELISA检测结果,选择野生型C57BL/6小鼠和两种IL-4人源化杂合子各1只,其中,+/+代表野生型C57BL/6小鼠;B-hIL4(V1)H/+代表短片段替换得到的IL-4人源化小鼠杂合子,B-hIL4(V2)H/+代表长片段替换得到的IL-4人源化小鼠杂合子,其中图(A)为鼠IL-4蛋白的检测结果,图(B)为人IL-4蛋白的检测结果;
图15:小鼠和人IL-4Rα基因对比示意图(非按比例);
图16:人源化小鼠IL-4Rα基因示意图(非按比例);
图17:IL-4Rα人源化小鼠打靶策略示意图(非按比例);
图18:(A)重组载体酶切结果图,图中1、2、3、4分别指4个载体质粒,ck代表未经酶切的质粒对照,M为Marker;(B)Marker分子量说明;
图19:细胞PCR鉴定结果,其中,+为阳性对照,WT为野生型对照,M为Marker,H2O为水对照;图(A)使用引物对F1/R1引物检测结果,(B)使用引物对F2/R2引物检测结果;
图20:细胞Southern blot结果,其中WT为野生型;
图21:F1代鼠尾PCR鉴定结果,其中,图(A)使用引物对WT-F2和WT-R2用于扩增野生型小鼠IL-4Rα基因7号外显子片段;图(B)使用引物对Mut-F2和WT-R2用于扩增改造后的小鼠IL-4Rα基因7号外显子片段,用以验证重组载体是否存在并正确插入基因组位点;其中,WT为野生型,+为阳性对照,H2O为水对照,M为Marker;
图22:IL-4Rα小鼠人源化F1代鼠尾PCR鉴定结果,其中,图(A)使用引物对Flp-F2和Flp-R2用以确认Flp片段的存在;图(B)使用引物对Frt-F2和Frt-R2用以扩增neo片段以验证抗性片段是否去除;其中,M为Marker,WT为野生型,+为阳性对照,H2O为水对照;
图23:流式分析结果,其中,取野生型C57BL/6小鼠(图A、B、D、E)和IL-4Rα基因人源化杂合子小鼠(图C、F),将图B、C、E、F用抗鼠CD3抗体刺激,再用抗鼠IL-4Rα抗体mIL4RA PE和抗鼠CD19抗体mCD19FITC(图A、B、C)或抗人IL-4Rα抗体hIL4RA APC和抗鼠CD19抗体mCD19FITC(图D、E、F)进行细胞标记;
图24:sgRNA的活性检测结果,其中Con.为阴性对照,PC为阳性对照;(A)为sgRNA1-sgRNA7活性检测结果;(B)为sgRNA8-sgRNA15活性检测结果;
图25:双重人源化IL-4/IL-4Rα小鼠纯合子ELISA检测结果,选择野生型C57BL/6小鼠和双重人源化IL-4/IL-4Rα小鼠纯合子(B-hIL4/IL4R mice)各3只,其中图A为未经刺激的小鼠血清中鼠IL-4蛋白的检测结果,图B为未经刺激的小鼠血清中人IL-4蛋白的检测结果,图C为经刺激的小鼠血清中鼠IL-4蛋白的检测结果,图D为经刺激的小鼠血清中人IL-4蛋白的检测结果;
图26:双重人源化IL-4/IL-4Rα小鼠流式分析结果,其中,取野生型C57BL/6小鼠(图A、E、C、G)和双重人源化IL-4/IL-4Rα小鼠纯合子(图B、F、D、H)各3只,将图C、D、G、H用抗鼠CD3抗体刺激,再用抗鼠IL-4Rα抗体mIL4RA PE和抗鼠CD19抗体mCD19APC-Cy7或抗人IL-4Rα抗体hIL4RA PE和抗鼠CD19抗体mCD19 APC-Cy7进行细胞标记;
图27:双重人源化IL-4/IL-4Rα小鼠流式分析结果,其中,与对照组相比(图A、B),抗人IL-4RA抗体Dupilumab能很好的结合双重人源化纯合子体内表达的IL-4Rα(图C);
图28:LPS诱导脾淋巴细胞增殖试验结果,其中,G1只用LPS诱导,G2使用LPS和mIL4,G3使用LPS和hIL4,结果可见,双重人源化IL-4/IL-4Rα小鼠体内的IgE水平与野生型C57BL/6小鼠相当,且野生型小鼠的淋巴细胞只能被mIL4诱导产生IgE,双重人源化IL-4/IL-4Rα小鼠的淋巴细胞只能被hIL4诱导的IgE;
图29:双重人源化IL-4/IL-4Rα小鼠的淋巴细胞中hIL4诱导的IgE产生可被抗人IL-4RA抗体Dupilumab阻断;
图30:单基因或双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导哮喘模型的实验方案;
图31:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的血清IgE检测结果,其中,OVA诱导组小鼠体内血清IgE水平明显高于PBS对照组;
图32:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的肺组织切片染色结果,其中,OVA诱导组小鼠相比PBS对照组深染区免疫更大,反映其炎症细胞浸润程度更高,呈现明显的哮喘病理学特征;
图33a:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的支气管肺泡灌洗液(BALF)嗜酸性粒细胞(Eos)数量;其中OVA诱导后Eos高于PBS对照组,纵坐标为Eos细胞总数;
图33b:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的支气管肺泡灌洗液(BALF)分析结果,其中,图A为嗜酸性粒细胞占mCD45+细胞的百分比(Eos%),图B为中性粒细胞(Neutrophils,Neu)占mCD45+细胞的百分比(Neu%),结果表明OVA诱导组小鼠相比PBS对照组嗜酸性粒细胞和中性粒细胞明显增多,呈现过敏表型;
图34:在双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型中评估抗人IL-4RA抗体Dupilumab治疗功效的实验方案,其中,G3、G4分别为表2中G3组合G4组的给药方案,其中Ip代表腹腔注射,Q3D代表每3天一次,QD代表每1天一次,x2:共2次;
图35A:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的支气管肺泡灌洗液(BALF)中白细胞(CD45+)的数量;其中OVA诱导组(G2)中略高于对照组(G1)和给药组(G3、G4),纵坐标为mCD45+细胞总数;
图35B:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的支气管肺泡灌洗液(BALF)中嗜酸性粒细胞(Eos)的数量;其中OVA诱导组(G2)的数量最多,给药组(G3、G4)中略高于对照组(G1),纵坐标为Eos细胞总数;
图35C:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的支气管肺泡灌洗液(BALF)中嗜酸性粒细胞占白细胞的百分比(Eos%)结果;其中对照组(G2)OVA诱导组的比例最高,给药组(G3)最低,给药组(G4)略低于对照组(G1)组;
图36:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的血清IgE检测结果,其中,只能在OVA诱导组(G2)组中检测到较高的血清IgE水平;
图37:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的气道组织切片染色结果,其中,对照组(G1)小鼠的气道未显示炎症,而OVA诱导组(G2)小鼠的支气管周围和血管周围炎症显著增多,且粘液分泌水平增加,给药组(G3、G4)小鼠与G2组相比均可观察到炎性浸润和粘液分泌减少;
图38:在双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型中评估抗人IL-4RA抗体Dupilumab治疗功效的实验方案;
图39A:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的支气管肺泡灌洗液(BALF)中白细胞(CD45+)的数量;其中OVA诱导组(G2、G4)的数量明显高于对照组(G1)和给药组(G3);
图39B:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的支气管肺泡灌洗液(BALF)中嗜酸性粒细胞(Eosinophils)的数量;其中OVA诱导组(G2、G4)的数量明显高于对照组(G1)和给药组(G3);
图39C:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的支气管肺泡灌洗液(BALF)中中性粒细胞(Neu)的数量;其中OVA诱导组(G2、G4)的数量明显高于对照组(G1)和给药组(G3);
图40:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的血清IgE检测结果,其中OVA诱导组(G2、G4)的数量明显高于对照组(G1)和给药组(G3);
图41:双重人源化IL-4/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的气道组织切片染色结果,其中,对照组(G1)小鼠的气道未显示炎症,而OVA诱导组G2和G4小鼠的支气管周围和血管周围炎症显著增多,且粘液分泌水平增加,给药组(G3)小鼠与OVA诱导组相比可观察到炎性浸润和粘液分泌减少;
图42A:双重人源化IL-4(V2)/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的支气管肺泡灌洗液(BALF)中白细胞(CD45+)的数量;其中同型对照组(G2)的数量高于给药组(G3),且均明显高于对照组(G1);
图42B:双重人源化IL-4(V2)/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的支气管肺泡灌洗液(BALF)中嗜酸性粒细胞(Eos)的数量;其中同型对照组(G2)的数量高于给药组(G3),且均明显高于对照组(G1);
图43A:双重人源化IL-4(V2)/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的血清IgE检测结果,其中同型对照组(G2)的数量明显高于给药组(G3)和对照组(G1);
图43B:双重人源化IL-4(V2)/IL-4Rα小鼠经卵白蛋白联合氢氧化铝诱导的哮喘模型和对照组的支气管肺泡灌洗液(BALF)中IgE检测结果,其中同型对照组(G2)的数量明显高于给药组(G3)和对照组(G1)。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
鉴于人IL-4、IL-4R或小鼠IL-4、IL-4Rα具有多种亚型或转录本,本文所述的方法可应用于其它亚型或转录本。
在下述每一实施例中,设备和材料是从以下所指出的几家公司获得:
C57BL/6小鼠购自中国食品药品检定研究院国家啮齿类实验动物种子中心;
AIO试剂盒来源北京百奥赛图基因生物技术有限公司,货号BCG-DX-004;
鼠IL-4ELISA试剂盒来源RayBiotech,Inc,货号ELM-IL4-1;
人IL-4ELISA试剂盒来源RayBiotech,Inc,货号ELH-IL4-5;
BamHI、HindIII、XhoI、EcoRI、EcoRV、NotI、NdeI、SacI、BglII、AseI、MfeI、SmaI酶购自NEB,货号分别为:R3136M、R3104M、R0146S、R3101M、R0195S、R3189M、R3193M、R3156M、R0144M、R0526M、R3589S、R0141S;
含有鼠IL-4、IL-4R基因的细菌人工染色体(Bacterial Artificial Chromosome,BAC)、含有人IL-4、IL-4R基因的BAC菌均订购自invitrogen,货号分别为:RPCI23.C、RPCI11.C;
Purified NA/LE Hamster Anti-Mouse CD3e(mCD3)购自BD公司,货号为553057;
FITC anti-mouse CD19Antibody(mCD19FITC)购自Biolegend,货号为115506;
APC anti-human CD124(IL-4Rα)Antibody(hIL4RA APC)Biolegend,货号为355006;
PE anti-mouse CD124(IL-4Rα)Antibody(mIL4RA PE)购自Biolegend,货号为144804;
APC/Cy7anti-mouse CD19Antibody(mCD19 APC-Cy7)购自Biolegend,货号为115530;
PE anti-human CD124(IL-4Rα)Antibody(hIL4RA PE)购自Biolegend,货号为355003;
Alexa
647AffiniPure F(ab')
2Fragment Goat Anti-Human IgG,Fcγfragment specific(anti-hIgG-AF647)购自Jackson ImmunoResearch Inc.,货号为109-606-170;
In vivo Grade Human IgG4kappa Isotype Control–CrownVivoTMAntibody(anti-IgG4-kappa hIgG-APC)购自中美冠科生物技术有限公司,货号为C0004。
实施例1 IL-4基因人源化小鼠
小鼠IL-4基因(Gene ID:16189)(NCBI Gene ID:16189,Primary source:MGI:96556,UniProt ID:P07750,基于转录本NM_021283.2(SEQ ID NO:1)及其编码蛋白NP_067258.1(SEQ ID NO:2))和人IL-4基因(NCBI Gene ID:3565,Primary source:HGNC:6014,UniProt ID:P05112,基于转录本NM_000589.3(SEQ ID NO:3)及其编码蛋白NP_000580.1(SEQ ID NO:4))对比示意图如图1所示。
为了达到本发明的目的,可在内源小鼠IL-4基因座引入编码人IL-4蛋白的基因序列,使得该小鼠表达人IL-4蛋白。用基因编辑技术对小鼠细胞进行修饰,在内源小鼠IL-4基因座上用某些人IL-4基因序列替换特定小鼠IL-4基因序列,在小鼠或人IL-4调节元件的控制下,如将至少包含小鼠ATG至TGA的~8.5kb序列用对应的人DNA序列替换,得到人源化IL-4基因座,实现对小鼠IL-4基因不同程度的人源化改造(得到的人源化小鼠中嵌合IL-4基因的mRNA序列如SEQ ID NO:80所示)。其中一种人源化策略得到的人源化IL-4基因座示意图如图2所示,另一种IL-4小鼠人源化策略是在IL-4基因座附近进行更大范围的序列替换,得到的小鼠人源化IL-4基因座示意图如图3所示。
分别用细菌人工染色体(Bacterial Artificial Chromosome,BAC)RP23-464K4和RP11-17K19获得小鼠和人IL-4DNA。如图4所示的打靶策略示意图中,显示了重组载体上含有小鼠IL-4上游和下游的同源臂序列(内源IL-4基因ATG上游4220bp和TGA下游4085bp的小鼠DNA),以及8537bp人IL-4序列(从外显子1中的ATG延伸至外显子4中的终止密码子TGA)。其中,上述上游同源臂序列(5’同源臂,SEQ ID NO:5)与NCBI登录号为NC_000077.6的第53622826-53618607位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:6)与NCBI登录号为NC_000077.6的第53612065-53607981位核苷酸序列相同;人IL-4的DNA片段序列(SEQ ID NO:7)与NCBI登录号为NC_000005.10的第132674051-132682587位核苷酸序列相同。其中,含有人IL-4基因的序列和鼠基因座的上游连接设计为在5’-ACTTTAACTCTATATATAGAGAGACCTCTGCCAGCATTGCATTGTTAGCATCTCTTGATAAACTTAATTGTCTCTCGTCACTGACGGCACAGAGCTATTGATGGGTCTCACCTCCCAACTGCTTCCCCCTCTGTTCTTCCTGCTAGCATGTGCCGGCAACTTTGTCCACGGACACAAGTGCGATATCACCTTACAGGAGA-3’(SEQ ID NO:8)内,其中序列“TATTG”的“G”是小鼠的最后一个核苷酸,序列“ATGGG”的“A”是人序列的第一个核苷酸。含有人IL-4基因的序列和鼠基因座的下游连接设计为在5’-TGGAAAACTTCTTGGAAAGGCTAAAGACGATCATGAGAGAGAAATATTCAAAGTGTTCGAGCTGATACTGAGCCACCATGCTTTAACTTATGAATTTTTAATGGTTTTATTTTTAATATTTATATATTTATAATTCATAAAATAAAATA-3’(SEQ ID NO:9)内,其中序列“GCTGA”的“A”是人的最后一个核苷酸,序列“TACTG”的第一个“T”是鼠序列的第一个核苷酸。
打靶载体上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neocassette)。其中Neo盒5’端与小鼠IL-4基因座的连接设计为5’-ACATGCCTGTAGGCAAGACACCCACACACATAAAAACAAAATAAAATAAGGATAGAAAGGCCAGGGGGATGAATCCTCGAGGTCGACGGTATCGATAAGCTTGATATCGAATTCCGAAGTTCCTATTCTCTAGAAAGTATAGGAACTTCAGGTCT-3’(SEQ ID NO:10)内,其中序列“GAATC”的“C”是鼠的最后一个核苷酸,序列“CTCGA”的第一个“C”是Neo盒的第一个核苷酸。Neo盒3’端与小鼠IL-4基因座的接合设计为5’-AGAAAGTATAGGAACTTCATCAGTCAGGTACATAATGGTGGATCCATTAATCAGAGGTAGAAGAAAACTTATTCC-3’(SEQ ID NO:11)内,其中序列“TTAAT”的最后一个“T”是Neo盒的最后一个核苷酸,序列“CAGAG”的“C”是鼠的第一个核苷酸。此外,还在重组载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。
载体构建可采用常规方法进行,如酶切连接等。构建好的重组载体可通过酶切进行初步验证,验证结果见图5,使用3组酶进行酶切验证,其中,EcoRI+NotI应出现634bp+1678bp+5953bp+16413bp,EcoRV+NdeI应出现587bp+2637bp+8928bp+12526bp,BglII+XhoI应出现1183bp+5178bp+6292bp+12025bp,酶切结果均符合预期,其中质粒1、2经测序公司测序验证正确。将构建正确的重组载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况,筛选出正确的阳性克隆细胞,部分克隆PCR和Southern Blot(分别用EcoRI或AseI消化细胞DNA并使用3个探针进行杂交)的检测结果见图6、图7。如图7所示,检测结果表明12个经PCR验证为阳性的克隆,均确定为阳性杂合克隆且无随机插入。
PCR测定包括下述引物:
F:5’-GACAACTTTCAGGGAGGGAGTCAG-3’(SEQ ID NO:12),
R:5’-ATCGCACTTGTGTCCGTGGAC-3’(SEQ ID NO:13)。
Southern Blot检测包括如下探针引物:
5’探针(5’Probe):
F:5’-GCCTCTCTCAACCCAGTATAAC-3’(SEQ ID NO:14),
R:5’-CTTGGAGTCAACCACCTCTG-3’(SEQ ID NO:15);
3’探针(3’Probe):
F:5’-GATCTTTCACTGAAACTTGACTG-3’(SEQ ID NO:16),
R:5’-CTCCAACTACATCTACTTTCTG-3’(SEQ ID NO:17);
Neo探针(Neo Probe):
F:5’-GGATCGGCCATTGAACAAGATGG-3’(SEQ ID NO:18),
R:5’-CAGAAGAACTCGTCAAGAAGGCG-3’(SEQ ID NO:19)。
另一种IL-4小鼠人源化策略是在IL-4基因座附近进行更大范围的序列替换,得到的小鼠人源化IL-4基因座示意图如图3所示,打靶策略见图8所示。其中所示的重组载体上含有小鼠IL-4基因座上游5553bp和下游5196bp的同源臂序列(内源IL-4基因上游和下游的小鼠DNA),以及10573bp的包含人IL-4的序列。其中,上述上游同源臂序列(5’同源臂,SEQID NO:20)与NCBI登录号为NC_000077.6的第53625623-53620071位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:21)与NCBI登录号为NC_000077.6的第53612200-53607005位核苷酸序列相同;人IL-4序列(SEQ ID NO:22)与NCBI登录号为NC_000005.10的第132672342-132682914位核苷酸序列相同。其中,含有人IL-4基因的序列和鼠基因座的上游连接设计为在5’-TGGGGTATGGTGGCTTATATCTGTAACTTCAACACTTGAGAGGTGGAGGCAGGAGAGTGACCATGAATCTGAGGGCTTCCAGAATAAATTCATAGGGAGGCCCAGGCACAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGG-3’(SEQ ID NO:23)内,其中序列“GAGGG”的最后一个“G”是小鼠的最后一个核苷酸,序列“CTTCC”的第一个“C”是人序列的第一个核苷酸。含有人IL-4基因的序列下游与Neo盒连接,连接设计为在5’-GGGGTTCCCTCTCGAGTTAGGGACATAACACACAAGATAATTAAAGAACACAAGGCCATACAAGATGTAAATAAGACACCTTGGGTCCAAGAGTGCGTCGACGGTATCGATAAGCTTGATATCGAATTCCGAAGTTCCTATTCTCTAGAAAGTATAGGAACTTCAGGTCTGAAGAGGAGTTTACGTCCAGCCAAGC-3’(SEQID NO:24)内,其中序列“GAGTGC”的“C”是人的最后一个核苷酸,序列“GTCGA”的第一个“G”是Neo盒的第一个核苷酸。Neo盒下游与鼠连接,连接设计为在5’-TGCGGAACCCTTCGAAGTTCCTATTCTCTAGAAAGTATAGGAACTTCATCAGTCAGGTACATAATGGTGGATCCTAACTCAAGTTCTGGGGGAGCTGATGCTCTCCTCTGGCCTCCTGTGGAGGTACACAGACCACATGCCTGTAGGCAA-3’(SEQ ID NO:25)内,其中序列“GATCC”的最后一个“C”是Neo盒的最后一个核苷酸,序列“TAACT”的第一个“T”是鼠的第一个核苷酸。此外,重组载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。构建好的重组载体酶切验证结果见图9,其中,BamHI应出现9938bp+6990bp+5266bp+3577bp+2930bp,EcoRI应出现9606bp+6558bp+5432bp+4470bp+2178bp+457bp,ScaI应出现10389bp+7026bp+5739bp+2818bp+2074bp+655bp,酶切结果均符合预期。该质粒经测序公司测序验证正确。对转染、筛选后的C57BL/6小鼠的胚胎干细胞利用PCR和Southern Blot技术进行检测,部分克隆PCR和Southern Blot(分别用MfeI、BamHI或EcoRV消化细胞DNA并使用3个探针进行杂交)的检测结果见图10、图11。如图11所示,检测结果表明12个经PCR验证为阳性的克隆中除1-E11、2-F2外,其余10个克隆确定为阳性杂合克隆且无随机插入。
PCR测定包括下述引物:
F:5’-CTGTGATCATGGTTCCTTATCTGG-3’(SEQ ID NO:26),
R:5’-CCTCCCCGAGTAGCTGGGACTAC-3’(SEQ ID NO:27)。
Southern Blot检测包括如下探针引物:
5’探针(5’Probe):
F:5’-CCACTAGGGGTCCACAGCTAGTCAT-3’(SEQ ID NO:28),
R:5’-CTTCAGTGAAACCTCCTGAGCCTGG-3’(SEQ ID NO:29);
3’探针(3’Probe):
F:5’-AGTCAGAGCTACAGAAGTGGAGGGT-3’(SEQ ID NO:30),
R:5’-CTGCTCTGCAGGAAGTAAGGGTTCC-3’(SEQ ID NO:31);
Neo探针(Neo Probe):F:SEQ ID NO:18,R:SEQ ID NO:19。
将筛选出的正确阳性克隆按照本领域已知的技术将阳性克隆细胞(黑色鼠)导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因(该过程示意图见图12)后,再通过互相交配即可得到表达人IL-4蛋白的IL-4基因人源化纯合子小鼠。可通过PCR鉴定子代小鼠体细胞的基因型,示例性的F1代小鼠(已去Neo)的鉴定结果见图13,其中,编号为1、2的小鼠为阳性杂合小鼠;。PCR测定包括下述引物:
WT-F:5’-ccacatcactgaaagacttcctgg-3’(SEQ ID NO:32),
WT-R:5’-gatcaagtagacaggcaggcaagac-3’(SEQ ID NO:33);
Mut-F:5’-ctgtgatcatggttccttatctgg-3’(SEQ ID NO:34)
WT-R:(SEQ ID NO:33);
Frt-F:5’-agggacagatgcaggctggg-3’(SEQ ID NO:35);
Frt-R:5’-gagatgcgtgttagaggttttggga-3’(SEQ ID NO:36);
Flp-F:5’-tcagcgatattaagaacgttgatccg-3’(SEQ ID NO:37);
Flp-R:5’-tgaagaattgccggtcctatttactcg-3’(SEQ ID NO:38)。
可通过常规检测方法确认阳性小鼠体内人源化IL-4蛋白的表达情况,例如使用ELISA方法,先给小鼠腹腔注射7.5μg抗鼠CD3抗体(mCD3),1.5h后取血清,稀释5倍后检测鼠IL-4和人IL-4蛋白水平,鉴定结果见图14,图14A结果显示,在野生型C57BL/6小鼠和两种IL-4人源化杂合子体内均可检测到鼠IL-4蛋白的表达,图14B表明在野生型C57BL/6小鼠体内未检测人IL-4蛋白的表达,表明两种IL-4人源化小鼠体内均可检测到人IL-4蛋白的表达,而野生型C57BL/6小鼠体内未检测人IL-4蛋白的表达。
实施例2 IL-4Rα基因人源化小鼠
小鼠IL-4Rα基因(NCBI Gene ID:16190,Primary source:MGI:105367,UniProtID:P16382,基于转录本NM_001008700.3(SEQ ID NO:39)及其编码蛋白NP_001008700.1(SEQ ID NO:40))和人IL-4Rα基因(NCBI Gene ID:3566,Primary source:HGNC:6015,UniProt ID:P24394,基于转录本NM_000418.3(SEQ ID NO:41)及其编码蛋白NP_000409.1(SEQ ID NO:42))对比示意图如图15所示。
根据人IL-4Rα和小鼠IL-4Rα基因的特点,对内源性小鼠的IL-4Rα基因的胞外区序列用人IL-4Rα基因序列进行替换,其中一种替换方式是将小鼠IL-4Rα基因座胞外区的外显子4到外显子7的4.4kb的序列用人IL-4Rα基因座上从外显子4到外显子7的约10.5kb的序列替换,这种人源化策略得到的小鼠人源化IL-4Rα基因座示意图如图16所示。改造后的人源化小鼠IL-4Rα的mRNA序列及其编码的蛋白序列分别如SEQ ID NO:43和SEQ ID NO:44所示。
分别用细菌人工染色体RP23-261H16和RP11-16E24获得小鼠和人IL-4RαDNA。如图17所示的打靶策略示意图中,显示了重组载体上含有小鼠IL-4Rα上游和下游的同源臂序列(内源IL-4Rα基因外显子4上游4264bp和外显子7下游4525bp的小鼠DNA),以及10537bp人IL-4Rα序列(从部分4号外显子延伸至外显子7中的终止密码子TGA)。其中,上述上游同源臂序列(5’同源臂,SEQ ID NO:45)与NCBI登录号为NC_000073.6的第125562909-125567172位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:46)与NCBI登录号为NC_000073.6的第125572100-125576624位核苷酸序列相同;人IL-4Rα的DNA片段序列(SEQ ID NO:47)与NCBI登录号为NC_000016.10的第27342138-27352674位核苷酸序列相同。其中,含有人IL-4Rα基因的序列和鼠基因座的上游连接设计为在5’-CCTCCCTCTGACCTTAGTGGTGGGAGCCCCTGACCATGCCACCACTGATCTGGCCGTTCTGTCTCTGCAGGGAGCATCAAGGTCCTGCAGGAGCCCACCTGCGTCTCCGACTACATGAGCATCTCTACTTGCGAGTGGAAGATGAATGGTCCCACCAATTGCAGCACCGAGCTCCGCCTGTTG-3’(SEQ ID NO:48)内,其中序列“TCCTG”的“G”是小鼠的最后一个核苷酸,序列“CAGGA”的“C”是人序列的第一个核苷酸。含有人IL-4Rα基因的序列和鼠基因座的下游连接设计为在5’-CAGCACCCTGAAGTCTGGGATTTCCTACAGGGCACGGGTGAGGGCCTGGGCTCAGTGCTATAACACCACCTGGAGTGAGTGGAGCCCTAGCATCACGTGGTACAACCGTGAGTATCAGGGTCGTAGGCTGTGAGGATCTCTACAGCCGTGTATATTCTCTGTTCAGAAATTCCCTCTGGCTGA-3’(SEQ ID NO:49)内,其中序列“GGAGC”的“C”是人的最后一个核苷酸,序列“CCTAG”的第一个“C”是鼠序列的第一个核苷酸。
打靶载体上Neo盒5’端与小鼠IL-4Rα基因座的连接设计为5’-AGGCCCGGAGTTTAAATCCCCAGAGCCCACGTAAAAGCCTGATATCGAATTCCGAAGTTCCTATTCTCTAGAAAGTATAGGAACTTC-3’(SEQ ID NO:50)内,其中序列“AGCCT”的“T”是鼠的最后一个核苷酸,序列“GATAT”的第一个“G”是Neo盒的第一个核苷酸。Neo盒3’端与小鼠IL-4Rα基因座的接合设计为5’-GAAGTTCCTATTCTCTAGAAAGTATAGGAACTTCATCAGTCAGGTACATAATGGTGGATCCAAGCTTTGCGCAGTAGCACGCATGCGTAATCCTGATGGAGCAATTAGGAGAAGCCGGTGGCCGGCTAGCCTGTGCAGACTGTGAAAACAGAGCATCTGAAGCTGTGTGAAAGGCTAGCTCGC-3’(SEQ ID NO:51)内,其中序列“AGCTT”的最后一个“T”是Neo盒的最后一个核苷酸,序列“TGCGC”的“T”是鼠的第一个核苷酸。此外,还在重组载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。构建好的重组载体酶切初步验证结果见图18,使用3组酶进行酶切验证,其中,HindIII+EcoRV应出现1866bp+2513bp+10385bp+12455bp,XhoI+SmaI应出现481bp+1375bp+2818bp+3815bp+5670bp+13060bp,BglII应出现754bp+1610bp+1856bp+3705bp+19294bp,所有质粒酶切结果均符合预期,质粒3经测序公司测序验证正确。将构建正确的重组载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况,筛选出正确的阳性克隆细胞,经PCR鉴定为阳性的克隆(部分克隆的检测结果见图19(A)、19(B))再进行Southern Blot(分别用SacI、HindIII或BglII消化细胞DNA并使用3个探针进行杂交)检测,图20中检测结果表明4个克隆(1-A9、1-D10、1-F4、A-G5)均为阳性杂合克隆且无随机插入。
PCR测定包括下述引物:
F1:5’-GGGAGGGTGAGTGGAGTCCCA-3’(SEQ ID NO:81);
R1:5’-CAGCGCAGGCTTACTCGGAGAG-3’(SEQ ID NO:82);
F2:5’-CGCATTGTCTGAGTAGGTGTC-3’(SEQ ID NO:52);
R2:5’-GCTGTTCAATGAATGGCCTCTGTG-3’(SEQ ID NO:53);
Southern Blot检测包括如下探针引物:
5’探针(5’Probe):
F:5’-GTGGCCACCGTTTCTGGGAAC-3’(SEQ ID NO:54);
R:5’-TCAACAATCTAAGCACGGACCT-3’(SEQ ID NO:55);
3’探针(3’Probe):
F:5’-GTGCTGAGGCCAGGGTTCCTC-3’(SEQ ID NO:56);
R:5’-GCTGTTCAATGAATGGCCTCTGTG-3’(SEQ ID NO:57);
Neo探针(Neo Probe):
F:SEQ ID NO:18,R:SEQ ID NO:19。
将筛选出的正确阳性克隆按照本领域已知的技术(如,《小鼠胚胎操作实验手册(第三版)》中的方法)将阳性克隆细胞(黑色鼠)导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因(该过程示意图参考图12)后,再通过互相交配即可得到表达人IL-4Rα蛋白的IL-4Rα基因人源化纯合子小鼠。可通过PCR鉴定子代小鼠体细胞的基因型,示例性的F1代小鼠(已去Neo)的鉴定结果见图21、22;同时结合图20的结果可见,编号为F1-1至F1-7的小鼠均为阳性杂合小鼠。
PCR测定包括下述引物:
WT-F2:5’-gacacacgtgtctgccagctctgt-3’(SEQ ID NO:58),
WT-R2:5’-cacggtcagccagagggaatttctg-3’(SEQ ID NO:59);
Mut-F2:5’-gtggggtcagctaacgacagcaac-3’(SEQ ID NO:60);
Frt-F2:5’-cgtgtcaaaagcagaaacgcaggag-3’(SEQ ID NO:61),
Frt-R2:5’-gcgtatgtcaggatctgaggagcac-3’(SEQ ID NO:62);
Flp-F2:5’-gacaagcgttagtaggcacatatac-3’(SEQ ID NO:63);
Flp-R2:5’-gctccaatttcccacaacattagt-3’(SEQ ID NO:64)。
通过常规检测方法可确认小鼠体内人源化IL-4Rα蛋白的表达情况,例如可用抗鼠IL-4Rα抗体mIL4RA PE和抗鼠CD19抗体mCD19FITC或抗人IL-4Rα抗体hIL4RA APC和抗鼠CD19抗体mCD19FITC对小鼠的脾脏细胞识别染色后进行流式检测IL-4Rα蛋白表达。流式分析结果(见图23)显示,可在经过mCD3抗体刺激的IL-4Rα基因人源化杂合子小鼠脾脏内,检测到表达鼠IL-4Rα蛋白(图C)和人源化IL-4Rα蛋白(图F)的细胞;而在野生型C57BL/6小鼠的脾脏内,无论是否经过mCD3抗体刺激,都只能检测到表达鼠IL-4Rα蛋白(图A、B),未检测到表达人或人源化IL-4Rα蛋白的细胞(图D、E)。
此外,还可以引入CRISPR/Cas系统进行基因编辑,从而得到IL-4Rα基因人源化小鼠。该系统中靶序列决定了sgRNA的靶向特异性和诱导Cas9切割目的基因的效率,因此,高效特异的靶序列选择和设计是构建sgRNA表达载体的前提。设计并合成识别5’端靶位点(sgRNA1-sgRNA7)、3’端靶位点(sgRNA8-sgRNA15)的sgRNA序列。5’端靶位点和3’端靶位点分别位于IL-4Rα基因第4号外显子和第7号外显子上,各sgRNA在IL-4Rα上的靶位点序列如下:
sgRNA1靶位点序列(SEQ ID NO:65):5’-AACATAGACTGGCGTTCACCTGG-3’
sgRNA2靶位点序列(SEQ ID NO:66):5’-TCCGCACTTCCACGTGTGAGTGG-3’
sgRNA3靶位点序列(SEQ ID NO:67):5’-GTGGTTCCTGGATAGCGCTGTGG-3’
sgRNA4靶位点序列(SEQ ID NO:68):5’-ATCCAGGAACCACTCACACGTGG-3’
sgRNA5靶位点序列(SEQ ID NO:69):5’-TATGTTGTGCTGTATGCTTGTGG-3’
sgRNA6靶位点序列(SEQ ID NO:70):5’-CTCAGCTCTGCCTACACTACAGG-3’
sgRNA7靶位点序列(SEQ ID NO:71):5’-AGAACATCAGCCTGTAGTGTAGG-3’
sgRNA8靶位点序列(SEQ ID NO:72):5’-CTACTATACGGCGCGTGTGAGGG-3’
sgRNA9靶位点序列(SEQ ID NO:73):5’-GATGTCAGGGGTCTACTATACGG 3’
sgRNA10靶位点序列(SEQ ID NO:74):5’-TATAGTAGACCCCTGACATCAGG-3’
sgRNA11靶位点序列(SEQ ID NO:75):5’-ACGTGTGTCGGTTCCCAGCCTGG-3’
sgRNA12靶位点序列(SEQ ID NO:76):5’-CTGACATCAGGATGTTGATCGGG-3’
sgRNA13靶位点序列(SEQ ID NO:77):5’-GTTGATCGGGAAGCTCAGCCTGG-3’
sgRNA14靶位点序列(SEQ ID NO:78):5’-ATGTGACCTACAAGGAACCCAGG-3’
sgRNA15靶位点序列(SEQ ID NO:79):5’-AGTCTATAATGTGACCTACAAGG-3’
利用UCA试剂盒检测多个sgRNA的活性,从结果可见sgRNA具有不同活性,其中,sgRNA2、sgRNA6活性相对较低,这可能由于靶位点序列的特殊性导致,但根据我们的实验,sgRNA2、sgRNA6的数值仍显著高于对照组数值,仍可判断sgRNA2、sgRNA6是具有活性的,并且活性满足基因打靶实验要求,检测结果参见图24和表1。从中优先选择2个(分别是sgRNA1和sgRNA14)进行后续实验。在打靶载体转染C57BL/6小鼠的胚胎干细胞的同时转入sgRNA1、sgRNA14和Cas9mRNA,也筛选得到了正确的阳性克隆细胞。此外,由于Cas9的切割造成基因组DNA的双链断裂,通过染色体同源重组的修复方式会随机产生插入/缺失突变,本方法还可同时得到IL-4Rα蛋白功能丧失的基因敲除小鼠。
表1 sgRNA的活性检测结果
实施例3双重或多重人源化IL-4/IL-4Rα小鼠
利用前述制得的IL-4人源化小鼠和/或IL-4Rα人源化小鼠还可以制备IL-4/IL-4Rα双人源化或包含IL-4和/或IL-4Rα的多人源化小鼠模型。如,显微注射及胚胎移植过程使用的受精卵细胞选择来源于其它基因修饰小鼠的受精卵细胞,即,IL-4小鼠和/或IL-4Rα小鼠的受精卵细胞进行基因编辑,可以进一步得到IL-4小鼠和/或IL-4Rα小鼠人源化与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将IL-4小鼠和/或IL-4Rα小鼠纯合或杂合子与其它基因修饰纯合或杂合小鼠交配,对其后代进行筛选,根据孟德尔遗传规律,可有一定几率得到IL-4小鼠和/或IL-4Rα小鼠人源化与其它基因修饰的双基因或多基因修饰的杂合小鼠,再将杂合子相互交配可以得到双基因或多基因修饰的纯合子。
以双重人源化IL-4/IL-4Rα小鼠为例,由于小鼠IL-4与IL-4Rα基因分别位于11号和7号染色体上,选择IL-4人源化小鼠(V1)和IL-4Rα人源化小鼠交配,通过阳性子代小鼠的筛选,得到双重人源化IL-4/IL-4Rα小鼠。进一步的对双重人源化IL-4/IL-4Rα小鼠的表达情况进行检测。取本方法得到的双重人源化IL-4/IL-4Rα小鼠纯合子和野生型C57BL/6小鼠各3只,先内眦取血,然后给小鼠腹腔注射7.5μg鼠CD3(mCD3)抗体,刺激1.5小时后分别取血清和脾脏,选用ELISA和流式方法分别检测样品中IL-4和IL-4Rα的蛋白水平。ELISA结果表明在未经刺激的双重人源化IL-4/IL-4Rα小鼠纯合子和野生型C57BL/6小鼠体内均未检测到鼠或人或人源化IL-4蛋白的表达(图25A、B);但可在经mCD3刺激的双重人源化IL-4/IL-4Rα小鼠纯合子体内检测到人IL-4蛋白的表达,未检测到鼠IL-4蛋白的表达,可在经mCD3刺激的野生型C57BL/6小鼠体内检测到鼠IL-4蛋白的表达,未检测人或人源化IL-4蛋白的表达(图25C、D)。
选用抗鼠IL-4Rα抗体mIL4RA PE和抗鼠CD19抗体mCD19 APC-Cy7或抗人IL-4Rα抗体hIL4RA PE和抗鼠CD19抗体mCD19 APC-Cy7对小鼠的脾脏细胞识别染色后进行流式检测IL-4Rα蛋白表达,检测结果显示双重人源化IL-4/IL-4Rα小鼠体内可检测到人源化IL-4Rα蛋白的表达,未检测到鼠IL-4Rα蛋白的表达,野生型C57BL/6小鼠体内未检测到人或人源化IL-4Rα蛋白的细胞,检测结果见图26。
对双重人源化IL-4/IL-4Rα小鼠纯合子表达的人源化IL-4Rα与抗人IL-4Rα抗体的结合情况进行检测,选择经mCD3刺激的双重人源化IL-4/IL-4Rα小鼠纯合子的脾细胞,将样品分为3组,随机选择其中一组中加入抗人IL4RA抗体Dupilumab/anti-hIgG-AF647和抗鼠CD19抗体mCD19 APC-Cy7进行染色,对照组加入anti-IgG4-kappa hIgG-APC/anti-hIgG-AF647或只加入anti-hIgG-AF647和抗鼠CD19抗体mCD19 APC-Cy7进行染色,用PBS清洗细胞后,进行流式检测蛋白表达。结果表明,与对照组(图27A或27B)相比,抗人IL4RA抗体Dupilumab能很好的结合双重人源化纯合子体内表达的IL-4Rα(图27C)。
对来自未经刺激双重人源化IL-4/IL-4Rα小鼠的脾细胞进行进一步分析,对其中淋巴细胞分群并与野生型C57BL/6进行对比,并对双重人源化IL-4/IL-4Rα小鼠进行血常规、血生化等检测,均未发现明显异常。
此外,对双重人源化IL-4/IL-4Rα小鼠和野生型C57BL/6小鼠的脾脏淋巴细胞用LPS诱导增殖,其中G1组培养时只用LPS,G2组培养时加入mIL4,G3组加入hIL4(50ng/mL),于第6天测定各组的IgE水平,结果见图28,表明双重人源化IL-4/IL-4Rα小鼠的脾脏淋巴细胞体外诱导的IgE水平与野生型C57BL/6小鼠相当,验证了双重人源化IL-4/IL-4Rα小鼠分离的脾脏细胞具有IL-4/IL-4Rα信号通路传导途径。在另一个实验中,将双重人源化IL-4/IL-4Rα小鼠脾脏淋巴细胞与不同剂量的抗人IL4RA抗体Dupilumab(0.01ng/mL、0.1ng/mL、1ng/mL、10ng/mL)先孵育0.5小时后,再加入LPS和入hIL4(50ng/mL),第6天测定各组的IgE水平,结果见图29,表明在各个测试浓度下,hIL4对双重人源化IL-4/IL-4Rα小鼠的B细胞体外IgE产生的诱导均可被抗人IL4RA抗体Dupilumab有效阻断。
实施例4卵白蛋白(OVA)联合氢氧化铝诱导的哮喘模型
选择单基因或双重人源化IL-4/IL-4Rα小鼠(5-8周),其中人源化IL-4小鼠为短片段替换(V1),采用卵白蛋白(OVA)联合氢氧化铝腹腔注射致敏3次,首次注射3周后使用2%OVA连续雾化5天激发可诱导制作哮喘模型(建模方案见图30),对照组用PBS替换OVA,在第26天获得样品用于分析。在使用双重人源化IL-4/IL-4Rα小鼠建模时,与对照组(PBS)相比,该模型小鼠具有增高的血清IgE水平和肺组织学病理特征等典型症状(图31、32),支气管肺泡灌洗液(BALF)中的浸润细胞分析提示嗜酸性粒细胞(Eosinophils,Eos)总数(图33a)和占CD45+细胞的比例均有增加(图33b),表明双重人源化IL-4/IL-4Rα小鼠体内具有IL-4/IL-4Rα信号通路传导途径。使用抗人IL-4抗体或抗人IL-4Rα抗体进行治疗,实验结束时可以通过常规方法,如气道反应性检测、苏木素-伊红染色(hematoxylin and eosin,HE)或免疫组织化学(Immunohistochemistry,IHC)病理检测、炎症细胞和IgE检测评估抗人抗体的药效。
将多只双重人源化IL-4/IL-4Rα小鼠随机分为4组(见表2),按照上述方法诱导哮喘模型,其中G3和G4组为给药组,在注射致敏后按照不同给药方案腹腔注射抗人IL-4RA抗体Dupilumab(25mg/kg)(给药方案见图34)。检测结果显示,支气管肺泡灌洗液(BALF)中白细胞(CD45+细胞)和嗜酸性粒细胞(Eos)的数量在OVA诱导组(G2)中略高于对照组(G1)和给药组(G3、G4),嗜酸性粒细胞(Eos)占CD45+细胞的比例OVA诱导组(G2)组最高,给药组(G3)最低,给药组(G4)略低于对照组(G1)组(图35A、图35B、图35C);只能在OVA诱导组(G2)组中检测到较高的血清IgE水平(图36);H&E染色结果表明对照组(G1)(PBS)小鼠的气道未显示炎症,而(OVA诱导组(G2)小鼠的支气管周围和血管周围炎症显著增多,且粘液分泌水平增加,给药组(G3、G4)小鼠中均可观察到(与G2组相比)炎性浸润和粘液分泌减少,参见图37。
表2分组及给药情况
在另一组分开的实验中,选用了C57BL/6野生型小鼠和人源化IL-4/IL-4Rα小鼠按照类似方案,具体分组情况见表3,给药组(G3)给药方案见图38。在第26天进行检测,结果与之前一致,支气管肺泡灌洗液(BALF)中白细胞(CD45+细胞)、嗜酸性粒细胞(Eos)和中性粒细胞的数量在OVA诱导组(G2、G4)中较高,对照组(G1)和给药组(G3)中较低(见图39A、39B、39C);可在OVA诱导组(G2、G4)中检测到较高的血清IgE水平(图40);H&E染色结果表明对照组(G1)(PBS)小鼠的气道未显示炎症,而OVA诱导组G2和G4小鼠的支气管周围和血管周围炎症显著增多,且粘液分泌水平增加,给药组(G3)小鼠与OVA诱导组相比可观察到炎性浸润和粘液分泌减少,参见图41。
表3分组及给药情况
以上实验表明,抗人IL-4RA抗体Dupilumab在人源化IL-4/IL-4Rα小鼠体内可阻断IL-4/IL-4Rα信号通路,从而减少支气管肺泡灌洗液(BALF)中的嗜酸性粒细胞(Eos)数量,减少血清中致病性介质IgE水平,并可减轻炎性特征,且部分分析结果表明预防性给药策略的治疗效果优于治疗性给药策略的效果。
另一个实验中,将IL-4人源化小鼠(V2)和IL-4Rα人源化小鼠交配,通过阳性子代小鼠的筛选,可得到双重人源化IL-4(V2)/IL-4Rα小鼠。对该小鼠进行了类似的蛋白表达情况和表型分析,均未发现异常。选双重人源化IL-4(V2)/IL-4Rα小鼠随机分为三组,按照图34的G3组方案诱导哮喘模型和给药,具体分组、给药情况见表4。在第26天检测,结果显示支气管肺泡灌洗液(BALF)中白细胞(CD45+细胞)和嗜酸性粒细胞(Eos)的数量在建模组(G2、G3)较高,且同型对照组(G2)高于给药组(G3),对照组(G1)中明显较低(见图42);可在同型对照组(G2)中检测到较高的血清IgE水平,而对照组(G1)和给药组(G4)与之相比血清IgE水平明显降低(图43),此外H&E染色结果也与之前表现一致。
表4分组及给药情况
这表明本方法制备的人源化IL-4/IL-4Rα小鼠可以模拟疾病模型,在临床前研究中用于筛选、评估抗人IL-4/IL-4Rα抗体的体内药效,并可用于表征抗人IL-4和/或IL-4Rα抗体特性。以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
序列表
<110> 北京百奥赛图基因生物技术有限公司
百奥赛图江苏基因生物技术有限公司
<120> 人源化IL-4和/或IL-4Rα改造动物模型的制备方法及应用
<130> 1
<160> 82
<170> PatentIn version 3.5
<210> 1
<211> 605
<212> DNA/RNA
<213> 小鼠(Mouse)
<400> 1
ttgttagcat ctcttgataa acttaattgt ctctcgtcac tgacggcaca gagctattga 60
tgggtctcaa cccccagcta gttgtcatcc tgctcttctt tctcgaatgt accaggagcc 120
atatccacgg atgcgacaaa aatcacttga gagagatcat cggcattttg aacgaggtca 180
caggagaagg gacgccatgc acggagatgg atgtgccaaa cgtcctcaca gcaacgaaga 240
acaccacaga gagtgagctc gtctgtaggg cttccaaggt gcttcgcata ttttatttaa 300
aacatgggaa aactccatgc ttgaagaaga actctagtgt tctcatggag ctgcagagac 360
tctttcgggc ttttcgatgc ctggattcat cgataagctg caccatgaat gagtccaagt 420
ccacatcact gaaagacttc ctggaaagcc taaagagcat catgcaaatg gattactcgt 480
agtactgagc caccatgctt taacttatga atttttaatg gttttatttt taatatttat 540
atatttataa ttcataaaat aaaatatttg tataatgtaa cagaaaaaaa aaaaaaaaaa 600
aaaaa 605
<210> 2
<211> 140
<212> PRT
<213> 小鼠(Mouse)
<400> 2
Met Gly Leu Asn Pro Gln Leu Val Val Ile Leu Leu Phe Phe Leu Glu
1 5 10 15
Cys Thr Arg Ser His Ile His Gly Cys Asp Lys Asn His Leu Arg Glu
20 25 30
Ile Ile Gly Ile Leu Asn Glu Val Thr Gly Glu Gly Thr Pro Cys Thr
35 40 45
Glu Met Asp Val Pro Asn Val Leu Thr Ala Thr Lys Asn Thr Thr Glu
50 55 60
Ser Glu Leu Val Cys Arg Ala Ser Lys Val Leu Arg Ile Phe Tyr Leu
65 70 75 80
Lys His Gly Lys Thr Pro Cys Leu Lys Lys Asn Ser Ser Val Leu Met
85 90 95
Glu Leu Gln Arg Leu Phe Arg Ala Phe Arg Cys Leu Asp Ser Ser Ile
100 105 110
Ser Cys Thr Met Asn Glu Ser Lys Ser Thr Ser Leu Lys Asp Phe Leu
115 120 125
Glu Ser Leu Lys Ser Ile Met Gln Met Asp Tyr Ser
130 135 140
<210> 3
<211> 642
<212> DNA/RNA
<213> 人(human)
<400> 3
tgcatcgtta gcttctcctg ataaactaat tgcctcacat tgtcactgca aatcgacacc 60
tattaatggg tctcacctcc caactgcttc cccctctgtt cttcctgcta gcatgtgccg 120
gcaactttgt ccacggacac aagtgcgata tcaccttaca ggagatcatc aaaactttga 180
acagcctcac agagcagaag actctgtgca ccgagttgac cgtaacagac atctttgctg 240
cctccaagaa cacaactgag aaggaaacct tctgcagggc tgcgactgtg ctccggcagt 300
tctacagcca ccatgagaag gacactcgct gcctgggtgc gactgcacag cagttccaca 360
ggcacaagca gctgatccga ttcctgaaac ggctcgacag gaacctctgg ggcctggcgg 420
gcttgaattc ctgtcctgtg aaggaagcca accagagtac gttggaaaac ttcttggaaa 480
ggctaaagac gatcatgaga gagaaatatt caaagtgttc gagctgaata ttttaattta 540
tgagtttttg atagctttat tttttaagta tttatatatt tataactcat cataaaataa 600
agtatatata gaatctaaaa aaaaaaaaaa aaaaaaaaaa aa 642
<210> 4
<211> 153
<212> PRT
<213> 人(human)
<400> 4
Met Gly Leu Thr Ser Gln Leu Leu Pro Pro Leu Phe Phe Leu Leu Ala
1 5 10 15
Cys Ala Gly Asn Phe Val His Gly His Lys Cys Asp Ile Thr Leu Gln
20 25 30
Glu Ile Ile Lys Thr Leu Asn Ser Leu Thr Glu Gln Lys Thr Leu Cys
35 40 45
Thr Glu Leu Thr Val Thr Asp Ile Phe Ala Ala Ser Lys Asn Thr Thr
50 55 60
Glu Lys Glu Thr Phe Cys Arg Ala Ala Thr Val Leu Arg Gln Phe Tyr
65 70 75 80
Ser His His Glu Lys Asp Thr Arg Cys Leu Gly Ala Thr Ala Gln Gln
85 90 95
Phe His Arg His Lys Gln Leu Ile Arg Phe Leu Lys Arg Leu Asp Arg
100 105 110
Asn Leu Trp Gly Leu Ala Gly Leu Asn Ser Cys Pro Val Lys Glu Ala
115 120 125
Asn Gln Ser Thr Leu Glu Asn Phe Leu Glu Arg Leu Lys Thr Ile Met
130 135 140
Arg Glu Lys Tyr Ser Lys Cys Ser Ser
145 150
<210> 5
<211> 4220
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gtcatcagat tttgatctga gtcacctcac tggagtcctg actccaggtc ttaactctac 60
catgatactg ctaagccgct caaagccacg gggtaccttc ccactctcac actcgggcca 120
ctctcaagga aactgcagat tctaactgcc cctatccatc cgttctccct ttctgacacc 180
cttcacttcc tctagggctt cctcgacacc acactgggcc ttccacaggc ttcctcttgc 240
ctggttctgg cactgagccc cacagtgcca gtcccagctc ctagcctctg aggagctgga 300
aggggcgcct tcctcagctg caggagagaa gggaaggcaa gtctgggctg gggcaagcag 360
gctgtaggga cagacagcca ggcctaagga cacagcgggg ctgcttgttt ctgatccttt 420
ctccttaaat ggtgcatgtg acaccatggt ttgacatttc ctagtggcaa gtctgagcat 480
ctgctgaagt gactctgggt ggagatggtt tctccagaga gctaggcatg gcagaacaaa 540
ggtgacgctg tcttcctcgc ccagtgggct atgaggacac caagtttcct tctggaatga 600
ctcggcaggt tgaaaggtca tcacagctgc atctcagcat cgtgtcaccc aagctccagg 660
cccttctcag agtcctaggc acagtgtgcg cacacccact cccacagccc tctcaacact 720
ccacctgcat ccacctccct ttcctgaatg aagtgcccat ggtgtatcat ggtcagcttc 780
ctctgctatc caggttcata aatctaagga ctgaaaccca acactgaaac tcctcagaaa 840
caagtgtggg gaccaaagcg tgaatgtcca gacttgagta ttatagtcat tcagccaacc 900
aaaatgtgat gagtaatgaa gtacccactg cgtgcagggt gcttaactaa gtacctgaac 960
ttagtactta gaacaacctc acaagacaag tacaactgtc actcctcagt ttcgggactg 1020
aggttgagtg tatgcccaaa gtcacatgag aggacacaga acagctaggt ctgacaagca 1080
gcgggggtgg gggtggggtg gggtggggtg tagagtcttt ttccttagtc ttgtcgcaat 1140
ggtatatcag gtgactcagg ctaagtgctt tctccataga tctcagactt gtggtcacag 1200
gagccccagg ggagggggtg cacagctttc tcctcactgt gtagaaaccc ggccacaagc 1260
ccctgccttc tggactccac actctggtac acaaaactgc tcaatggctc tcggctcaca 1320
aagggctgga gagggtctat gacagtcact ttcctgccct gtccctccac tgaccaccac 1380
tggctggctg acactcttca tcccactttt ccagcctctg ccttatctgc tccattcaca 1440
gataatgtga atctgtcact tggggtggcc ttggacgtcc tttctagtct ttgggaagac 1500
ttggagtctg ggactattca gactcttttc tctgactcct tccaaccact gaaacaagca 1560
agacaaacgg aactttgctt ctgagcggag ttgccttact ctatcccttt ctgactatca 1620
tcttcccaca gagcccagca gttaaggtgc tgagaggaaa acctgaatgg tctattcttt 1680
gctccaggga cactgtggga tccagccctc cccttcccta ggtgtccttc tgtgcccctt 1740
cttagcagga ttcttccagc tatggatgac aagttcctgc tggatctcag ccactcgatg 1800
ccccaccctg gctctcgcgc aaggtcaacc ccagccaagc tcaactgagg cgggatagtt 1860
gcttctccta gaggcgaccg acctttcaaa tgcttctaga gaagcccacc ctcggttaag 1920
agcactggct gctcttccag aggacgctaa ttcagttctc agtacctaca agaaggctca 1980
caaccacctg taacttcagt gtcaggggtc tcaacactct cttccggacc ccagaggcat 2040
cgggtatatg tttggtacac acatgaaagc aaaataatca gatgtataaa attaataatt 2100
ctaaaaaaaa aaaaaagcca aattgaaaca aagaatactc ctctacctgt acagcgaagg 2160
atcagcttca gagccagaga gatgctcatc ggggagacgc tcgctcacca tgtggctgag 2220
tggatctgta ggacatcaca gaagtggaag agggaaacca agcccaagcc ataagtaaat 2280
aactcattta tctactaatt tattttaggt tttcgagaca gggtttctct gtactctgtg 2340
tagccctggc tgtcctgaaa ctcactctgt agaccaggct gctctgaact caagagatcc 2400
ccctgcctct gcctcccagt gctgggatta aaggtgtgcg ccaccactgc tcagcttaat 2460
cttttttttt tttcttgtaa tgaacccctt tcacccaaag agagctcagg cctttaccct 2520
ggctcgtcgc ccaggggaac agacttgaaa tttgcctcgt tgcttatcat cagtggctgg 2580
aaggtaacag tttcccaaga attgactgtg tccctaggcc tacagaacat gactgtgtcc 2640
aactttacaa cagtcacagt taatatatat atatttgtaa gtggggtatg gtggcttata 2700
tctgtaactt caacacttga gaggtggagg caggagagtg accatgaatc tgagggcagc 2760
cttacctata taagttccta ggtagctttg acttcagagt gagacccttc aaattttttt 2820
attttaaaag ttaaaaagaa agaaagaaaa aaagaaagaa agaaagaaag aaagaaagaa 2880
agaaagaaag aaagaaagaa agaaaggagg aaggaaggaa agaagaaggg aaggaaggct 2940
tatatattat aaacatcttc agtttttatt aattaaataa cagtaatgga aaaataattt 3000
aacacacaat gacaacctta gcaacaacta tttctagatg gtcttccaga aatgagaagt 3060
cagaattgga ggcagggact tgggggatat gaagaaccct ttctactctg taaaacagag 3120
cttcgcttcc aagcagatgg caggggtgcg gtgctcactg ctggtggggg gcaatgagta 3180
cctcgacagg gcctgcattc gttagattaa ggcagtgggc tgggggcagg gtgctgactg 3240
agagggtgag agagggctgt ttcctggtta gtgaaggata tgttttaagt tcattgaaaa 3300
ggcagccagc cattcttggg ccaatgagat ggctcaggag ggaaggtgct tgccgccaag 3360
cttgtgagtc tgagttcaag gatccacacg gtgcaaagag agacccggtc tcctgacctc 3420
cacactgatg ctgtagtgca catagataca cacatgctca catgaagtaa tttaaaaaaa 3480
ttttttttta aatcagccat ttctcaggct tctgtctaag gtaggaaaaa tcttcaacct 3540
agcccagaac ctccatatag gtaaagcctc attccatggt cctgcctgcc ccactccatg 3600
tcacctctct gtctccaaag accacaaact tgtaagatca gctggtctag gatgcgagaa 3660
ggtctgcctc catcatcctt ctatgaggta agaccccaga gtcagctttc ccaagatatc 3720
agagtttcca aggggccccc atagcaggaa gcagctaggc ccaggtgtgc tcaaggcaga 3780
ctttcttgat attactctgt ctttccccag ggcgacacca gcaccctcgg acacctgtga 3840
cctcttcctt ctctgcagga ggagagccag tggcaaccct acgctgataa gattagtctg 3900
aaaggccgat tatggtgtaa tttcctatgc tgaaactttg tagatttaaa aaaaaagggg 3960
ggggaggggt gtttcatttt ccaattggtc tgatttcaca ggaaaattta cctgtttctc 4020
ttttttctcc tggaagagag gtgctgattg gcccagaata actgacaatc tggtgtaata 4080
aaattttcca atgtaaactc attttccctt ggtttcagca actttaactc tatatataga 4140
gagacctctg ccagcattgc attgttagca tctcttgata aacttaattg tctctcgtca 4200
ctgacggcac agagctattg 4220
<210> 6
<211> 4085
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
cagaggtaga agaaaactta ttccctggaa ttgtcctctg actcccctcc caaaacctct 60
aacacgcatc tctctctctc tctctctctc tctctctctc tctctctctc acacacacat 120
acacacacac atacacacac acacacacaa atgaggggta tgcatatata cacatgtata 180
cacatacata cacacaaatg agatggtatg catactcaca catgtgcaca cacacagatg 240
aggagtatgt acacacacac acatgcacac acactaagta aataaaacag agaagaacag 300
aggcatggca ctacacccta ccttccatgg ggagggatta ctgagacaac agagcctgcg 360
gcttgtgaaa caagaaccag aaatcaaaaa ataatttttt gaaaggacaa ggaatcggta 420
gcacttacct acaatccagt ttgaagcagg ccagcatgca tccccagaat ccacataaaa 480
gtggaaagag aaaatcaact ctacaaagat gtgttctgac ctccacatac gcatcataca 540
tacacacagt catcatatat atatatatat atatatatat atatatatat atatatatat 600
atatattaga gaaaatcaag agatttaagt gtttaaaact gctaacacag tagaactaca 660
aaacttgact acaaaacatg tcatagggaa gccacacatg tgggtgtggc ctgagacctg 720
tgggggactg tggtggattg aacgaaaatg gccgccatag acccatatgc ttgaatactt 780
ggtccaccgt tggtggaact gtttgggaag gattaggagg tgtggccccg ttggaggagg 840
agtgtcactg gggcaggctt tgaggtttca aaagcccagg ctattcccag tgtgttctct 900
ctgcccccag ctttcagatc aagacatgag ctctgacaca gtgcctctgt tctgccatca 960
tgtactctaa acccagaaac ctatagtccc aaattaaaca cttcctttta taagttgctt 1020
tggtcatggt gtcttgtcca ttaagagcag taactaagac agggcaggga gactgtttaa 1080
agaacaggag taattggtta ggtgtggtgg agtacacttt taattccagc acttgggaag 1140
cacaggcagg ggtagctctg tgagtctgaa gccagcctgg tcggtatatt gagctccagg 1200
ccagccagag ctacataatg agaacctgtt tctaaagtgg gggggtgggg ggtgtgagtt 1260
gctgggcagg aatgatggct cagtggctaa gaccacctgc tgctcttggt tgtttccaag 1320
caaccacata ctggctcaca attatctgta gctccagggg atttgacacc tctggcttct 1380
gtgggcactg aactcacatg cacatatcca tgtgcagaca cacacatcta cacataactt 1440
acagaaaaaa aaattacata tatatatata tatatatata catatacata tatatatata 1500
tacacatata catatatata catatatata tatatatata tatatgtatg taaagttgat 1560
aattaaaaat atagctaagg atagtcacga attggggctg gagagacagc tcagtggtta 1620
tgagcaccaa ctgctcttcc agaggaccct ggttcaagtc ccagcaacca catggtggat 1680
cacaaccatc tgtaactcca gttcttgggc atctgacacc atttcctgac ctctgtgagt 1740
acttcgtgca gaacacagac atgcatgcag tcaatgccct cacacacaca aaagcaattt 1800
gaacaaatct caatcttaat taacgctgtt attaaaaggg aaggaatcga gaggagagaa 1860
cccaacggag ctccacactg tcaagcttgc ccgtcagaag atgctctatg cagtctcttc 1920
tactagaggg atctagtaac agtgacttgg cactcttctg accctcaatc acatgcatgt 1980
gacaaaaatt aacaccaaca ctgacatcac cccaaaaata cataccaact ttttaacccc 2040
ttcaaaataa ggggaaaaaa atcaaaagct taaaatctca ccctgaccac aggcagtttc 2100
accctgccca catgaaatac cagcatgcca agggcaatag cggcttctaa ggccaatcag 2160
ggaaggtatg cagtgaaaaa tttaatttcc tctcttttga ttgaaactca tttgcatgtc 2220
ctggctaatg tgagccctgt ctgccacagg atatgagttg tgggtttgca cttggtatat 2280
gaggctgaga tgataaagga acggctgtca aaaagaaaga cctaaaatag accacgggac 2340
ccaggcaggt tctaggtcag tcagtcacac ctacacttgg atggtcagaa cacactaact 2400
cttttgtttg cctccacata gggagcccta gactctggac ttaaacatcc aatgctcagc 2460
ctctgattcg atcaagggaa gaagaggtaa ggccagccat aaaacacgcg tggattaagg 2520
gaacttgagg attaagtaag tcgtgaggct tgtgactgga gcagttactg aggccaccag 2580
ccacagtcag tgctcagtgg agtgtgttcg ccacagatgg tgaaggtgga actgttaact 2640
ctctctccca tgatgcacat gggctctgct tttgccctca gccagtggat gggttatctc 2700
taactggcat ctggcaatgg gcaataagta cctcatggat aaatgcctaa caaaaccata 2760
tatagctgtg tcttgcattc ttggggagcc gggaagaaat gctggcctgg gctggagaga 2820
tggctcagtg gttaagagca ctgattgctc ttccagaggt cctgagttca attcccagca 2880
accacatggc tcacaacctt ctgtaatggg gtctggtgtg tctgaagaca gctacagtgc 2940
actcatacac ataaaataga gacaggtgga tctctgtaag tttgaggcca gcctggtcta 3000
cagagtgagt tctaggacat ccagggctat acagagaaac cctgtctcaa aaaaccaaaa 3060
gcaagtttaa agtagatttc cccctcctgc tgtactaggg cttgaaccca tggccttgtg 3120
cacagcaggg aagcactgta ctatgaggta tacctctaga cctcctggtc tcccatccta 3180
aagctatgat gttttcacct tagctctcta gactgccttt gtgtgtgtgc acaagcatgt 3240
atgtacatgt gccttgacac taccatgtga agcccagaga tctgggtctt tcttaatcac 3300
tatcttactt tttttttttt taataaatgt tagtgtgtgt gcatgtgtgc acataatgtg 3360
tgcacctgtg tggcatggtg cgcacgttga agtatgtgag tatctgagat ggaactcagg 3420
ccttgaggtt gtgcagcaag tgtcttttac ccgctgagcc atctccccgg catgcggtcc 3480
cctcccttct gattagctct tcctgccagt ttcttcccag tgcaagctgc ggaagggacc 3540
tgttccttct tggggagaac ctcctgtgta ctgtgaggaa gcatccgtca cctgtcaata 3600
aagctggcgg ttggtctatt aactgaggca ggaaatgggg tggaagttcc agtagggaga 3660
gaggaactct gggataggca ggtttaggaa gacattctcc cgggattctg agactcaaga 3720
aactgaggca aggtaactag ccgtgtagca ctcacagaat agaataaatg gttaattaag 3780
gtactgggta gtcaaggagt gggccaaagc ttgtggtcta ggtgtttatt cataaacagt 3840
aagtctcaga gtcactgttt tgggcactag ggtgtcagtg gaaaagcctg aggttaaacc 3900
ttcttgttct gtattggcca gtgttaaagc agacaaagtc tgctttcatg ctgtgggccc 3960
agtgcatgcc cagtgtccat ttgacactac atttgaaaga catgtttgtc cccttggtct 4020
aagagtggaa gctggcatat ctacctattg tctctccagc ccacgactgg cgtgtctgtt 4080
ctcag 4085
<210> 7
<211> 8537
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
atgggtctca cctcccaact gcttccccct ctgttcttcc tgctagcatg tgccggcaac 60
tttgtccacg gacacaagtg cgatatcacc ttacaggaga tcatcaaaac tttgaacagc 120
ctcacagagc agaaggtgag tacctatctg gcaccatctc tccagatgtt ctggtgatgc 180
tctcagtatt tctaggcatg aaaacgttaa cagctgctag agaagttgga actggtggtt 240
ggtggcagtc cagggcacac agcgaggctt ctcccctgcc actctttttt ctgagggttt 300
gtaggaagtt tcctcagttg gagggagtga gagctgctca tcaaggactt ctctgtccgg 360
ttggaggtta actctgtctc ttgctctctc atttctgcct ggaccaagac tctgtgcacc 420
gagttgaccg taacagacat ctttgctgcc tccaaggtaa gaagccgtcc cacggtctgt 480
tttagcaaat ggggagatcc atccccaaat gtctgaacaa gaaacttgtc taatggaaaa 540
cgagcgggcc caaattaact ctaaggtgtt agatgttttc aaagaacgag aagtctgatc 600
tttactctta agcatgtttt ggtctttctg gtttcacttg atttagaaga catgtaatag 660
aaagcttaca tgctgtagtc ctgactcaga tcctggtcaa agaaaagccc tcttgggttt 720
tacttagctt tggcatagtg cctggaacgt aggaggcact caataaatgc ctgttgaatg 780
agagaatttt tctggcccat acatttctga aaaaccaaat actctcacag aaacagatat 840
tgagatgaca ggttgaggga gctttcattt tgtctaagag acttcctatg gcaacagaaa 900
aggtatcgcc agagcccctc ctcttccaca gcctggccac ctaacagccc tctgggttcc 960
ggggctggcc gtccagagct cctcagcttg ctctggccgg ccgaactccc ctccagctcg 1020
gtctggaacc atcctgctgg gcagcgtcca gcacatccct gcttcgggct gcctgggcac 1080
ctcgcctctc tgcctcctgt gctgcctcac ccccacccct ctatctgtag tgggaggaga 1140
tagatttgac agctgatagt gcattttctc tgacaaacac atgactacag ccgtatcaat 1200
agttttgtgc atttcagttc ctgttttcat ggaaacacac ggctgagaat gaaagcccca 1260
aagcctcaat ttcacagtgg tctcctaact acctgctttc catgcaaact agggagatga 1320
tatggccagg agtgaagccc tgtgtgttgg gcagggtcac actccagcac ccagaccata 1380
gaacagggcc catcctgctt catgagggaa actgctcttc gggcctttag ctggactatc 1440
tcatttcatt agttatcccg ggagtccgat acaggatgag attctgaagg gcaaatacac 1500
actttttttt ttttttgaga tagggtcttg ttctgtcacc caggctggag tgcagtggtg 1560
cgatttcagc tcatagcagc ctccacctcc caggctcaag ctatcttcct acctcagcct 1620
cccaagtagc cgggacgaca ggtgtgcacc accacgcctg gctaattttt gtattttttt 1680
gtagagatgg agtcttgcca ttttgcccag gcttgtctcg aacttctggg ctcaagcaat 1740
ccgtccacct cggcctctca aagtgctggg attagccact gcacctgggc aacagtttat 1800
gtgtgtgtgt gtgtgtgtgt gtgtgtgtat atatgtgtgt gtgtatatat atgtgtgtat 1860
gtatatatgt gtatgtatat gtgtgtgtgt gtgtgtgtgt gtgtgtataa aatctccaag 1920
tccatccaac cgagatggct cctactagaa gccaagagtc caccgggttg agcactgggt 1980
ctctggaggc ctgtggcact gctgagaagg ctctaacaaa gccaagggaa gggccacctc 2040
actagaagcc aggcctggag gaagggtgag ggctgagggc ctggaggtaa gactgcctgt 2100
ggttttagac ccagctctgc cactgactag ctgtgtggct ggccttcagc acatcttcac 2160
acctctctgc acctcagttt ccacatgtga agatatgaaa gtgattctga aggtgattgc 2220
aaggttgatt ggaatccagc tcttgagtta gtgcaaagtg ttattgtgag atgatataac 2280
cacgattaaa agcaagaaca ggtgcagaga agcgatgatt ctaagaagga ggggaccggg 2340
ttggaaagga tcaaaccatc caggatgccg agtctggggc aatccatctg ggctgtttct 2400
ggaagacccc cgggtgcagg ccaggacact gctgccctcc cgtccttaac tcccctcttc 2460
actcagtcct cactcacctc cctctcacac acacaaacat ctcctagaat aatccccact 2520
gcctgccttc actcttaccc gtctcatttg cctcccctga acttcatcct cctggagttc 2580
acgatctcac tcttcactct tttcttcccc tcgaagattc agcactgctt acttacatgt 2640
taagatattt cagaacagtg aaatgttgct attttcaaaa acctacaaag gtggtatgca 2700
gaggaaaagg tacttctttg tgttcccaaa gaaaacatct ttccaaaatc cagcctattg 2760
attttatttc ttcgggggaa caagaatttt agtatctcta agttgggtag cattctactc 2820
ttggcagttg ctggaaagaa ggcactggtc taggtcctgg gcttcacagg taacacctgt 2880
cagggtgtct atgaagtcaa ggctgtctga ggaacagcaa agtgggaaga agcaagctgg 2940
ctggctgatg aagggtttct tgggtggaca agtagttgga gctatttcct atttaccaaa 3000
gagagctaaa gttcataatt ctacagagag ttccataatg aacctcaaat acctctgttt 3060
tttgaaggag tttctcatat acagcactag ctgactatcc tgggcaggat gggagataat 3120
gaatgcagtg ccaatcgggc tggatttata tggtcctcag tgaggctggt caagaaccga 3180
gttagaactc tcacagagtc actgccacag aagaaatctc ccaagtggct gtttcctgac 3240
attcccggga gggacaggcc tccttctgag tcactcccta agcagttctg aactgtgagg 3300
tcagccaggc tgtccaagtg cactccctga gccactggca gacacactca gcagccagag 3360
ctagacaggc aggtggtagg agtccagggc cacggcaggg atggagtgtc gccccctcgc 3420
tgcgatacca gagcaactaa aacgttaagg ccttgcacta aagctgccct taggatgcat 3480
tcttttaaag tttttccatt taatgcagac tcttttcaat tcttatttta tccttgtttc 3540
ctttagaaag tcctttcaaa aatatcttta gagggttttt tcctatacta tgtggccata 3600
tacgggtcaa aattaagttt aatttccagg ctccaagcca gcgtttcaga aaaatctcac 3660
caaggtttgt ggtaaaagaa gcaaagggct gactttttgg ttttcttgaa tctcactgtt 3720
ccctctgcag cagcatgcat gtctgcccac ctccagacac acaggcacca tctgccgccc 3780
cccatcagcc cgtgtccctt ccacctcgac tcgcctacaa agcccagaga ggtctgtttc 3840
ttggccccca gagcccaaag atactgacac actcttacat ttccaactag aatcaggaac 3900
gaggagtgac tctcagtcag ttcattaagt aaatgtcttt ctaaccgctc tgcccatggg 3960
acatcacgcc ccacagggga aaggggaagc ttctgtagcc tgggattctg gtgcctcagt 4020
ctgggtctag actttcctga aaaaacgtta aaatatgaac tgcattccta gaatttagcc 4080
tacataaata agagatgaac acaaagattt ctatagttta ctcactgccg cttatttaca 4140
gaagcaaaaa tctgccacga taggggcctg acaaatgaca gtaccactgt gcaatgcgtt 4200
tctacgcagc tctcaatccc atgttctcta ataccaccga agggcttagg aaatgcttat 4260
ggtatatgta aagagtaaag aagttacaaa acagtatcaa cagttgaccc ctattttaaa 4320
aagtattttt aaaagtgtga cgatatttac caaaatatta acagcaatag ttacctctgg 4380
ctggtgggat gagtgaatgt atttttgttg aatatatgtt acctttatag taaatatatg 4440
ttatcttgat catcagaaaa aaaaatatgt aagaacttga aagctgcttg gacagcgctg 4500
ctgatagaaa cccctgagca tcttgtcact gttcttctga ttcagagggt ctgggtgggg 4560
caggggtggt ctgagattct gtatttctaa gaagctccca gtgatgtcca tgctgctggt 4620
ccatggacca cactttgagt atcaagggac cagagcatgt cgggggagag gctggggata 4680
gctttcttta tctgaactgg ataaaggaac tgggctcaag ctaagaaccc tctccaggtt 4740
ctgcatcttt gttcttcagt gaaaaatgag aggacacacc aggccaggtt cagactgaga 4800
cacaatccct ctcctgggtt cccaatgact tgtctcttgt ccattccctt ctctaaggct 4860
aagggccccc aggaagagcc atgtggccag accctcacag ttgctggcat tccaaggaga 4920
ttctcactcc gcatcatttg gggccaaaag gccccttaca gaagctctgc ccaaggctca 4980
gatcaatggc acctgctccc agagcctcct ctgatctccc aggacacctt tccctgatct 5040
gtgcacttat ctcttgctgc ctggcaaaat gtcttagctc ctcacttggg ccatgtgctg 5100
ctctcctctc ccatggggag agccacacgg agagtgctgg ccaaagcagc agagttcagg 5160
ccaaaggatg tgcactcatt tattcaacag gcatgcagga tttccaggga aagctggatt 5220
ttaaaacctc tgggaacaag agcagaacct gactgagagc tcatgtgggc acttttcata 5280
gcagaatagc tcatgaggta tagagacacg gacgcagaac gtgggctgta gcgacagatg 5340
gtcctgcatt ctagtcccca ctgtgccttt tcctcatggg atgactttat tcaggtaccc 5400
tttcggcaaa atcctccaag agaaaggaaa ctgggaggtt ctggggagaa ggctgctgcg 5460
tttgcaattg ggagaggttg ttgacagagg tttatgtctg tggcaagcag ccttccttca 5520
gtggaatact tgaagacagg tctgtagttg agcaaactca cctccatttg tcctcctgga 5580
aagaagaaat caagaggaaa aatctctctc ccatcctcca aatggagctg gcacattgct 5640
atctgtggca tttgtctttc cagaacacaa ctgagaagga aaccttctgc agggctgcga 5700
ctgtgctccg gcagttctac agccaccatg agaaggacac tcgctgcctg ggtgcgactg 5760
cacagcagtt ccacaggcac aagcagctga tccgattcct gaaacggctc gacaggaacc 5820
tctggggcct ggcgggcttg gtaagctgca ctgtattcct ggcaagccgg ccgcgtggct 5880
cctggtggac agcagcctca cttctaaaca ctccttagga gctgcagcac ccttggtcaa 5940
cccattcatt cattcactca ttcaataagt atttgctgaa gttccacaag tgctgggtgt 6000
ggttctaggt gctgaggacg tgtcactaaa gacacgcagg ccgagtccct gttctcatgg 6060
aatgttctaa tgggagagtt agaaaaacaa acatgtaaaa tgatggccag cagtgatacg 6120
tgctacaaag aaaaacatag aaataaagaa cataagagtc atgggggagg gggctgactt 6180
aggagctggt gacattatct gagcagatat ttgaattgag ggagcaggcc acatgactaa 6240
ctagggagac cattccaggc agaaggagga ggtatgcaaa ggccttagga tggaaatgaa 6300
ctaacttcct gtatttaaag accagtagga aggccagtgt ggctggatca gagtgagtga 6360
ggggtagttt ccaggacagc agatcacaca aggcctttag attccaccac gagtatggca 6420
gggaacacct gcagagcttt gggcaggaca aagactgtac aatctgattt acgtgattta 6480
aaagggtcag tctggctact gtgtggtaaa taggctgaaa gggggaaagc atagaagcaa 6540
gatggcctgt tgggaggcta ccacagtaaa ccaggctaga gatgatggtg gcgtggacag 6600
aatgaagcaa gatggcctgt tgggaggcta ccacagtaaa ccaggctaga gacgatggtg 6660
gcgtggacag aatgaagcaa gatggcctgt tgggaggcta ccacagtaaa ccaggctaga 6720
gatgatggtg gcgtggacag aatgggagca gttgaggtga acagatttgg gatatgacta 6780
aaaataaaac cagaaggatt tgctgacaga tcggttgtag ggggtaagat acaggggagg 6840
aaaagatgac ctctttgttc ctgcccaaac ccctctggcg atggtcagta ctgtttacag 6900
agagatgaaa gactggcggc aaggcagggc tggaggttca gcagaagatc aagagttcaa 6960
ttttgtacat cgtacatgta aggtggctct tggatagcca agtgaaggtg ttgagaagat 7020
ggttagaaaa gtctggaact taggggagag gtcagaactt gcaatacaaa aaggagagtc 7080
cttagataga tactgctgaa aatctgaatg acagaaaggg agagatcaaa ggactgagcc 7140
tgagatcaac acatggaggt caggagagga ggatccagcc aaggggcctg aggaggagtg 7200
accagtgagg caggagaaca ctggagagtg ggcggtaccc caggaagccg ttgaggacac 7260
tcaaggaggg agggttgact gtgtcaaatg tactgaaagg acaggtcagg tgaggaccaa 7320
gaaaggcccc tgggtttggc tgatggaggc catgggtgag gctgatgtaa atggagaggc 7380
aggaaggaaa gcccagctgg agtgggctca ccgaggatag ggtggcgaga ggagacaaag 7440
aaggaacagt gagggcagaa cactctttga agatgtttag ctataaggct gcagagaaac 7500
tgacccacag ctgcagggtg gttatggagt gagggaagct cttttaaggt tgggggtata 7560
cccagcatgt taatgcacct gggggaatgg tccagtggag caggaagaac tgaagagagc 7620
agaaagagga agaatcatta gggggcagaa gtccttgtag cccagagtgg atgttatcta 7680
atatcgagtg gaggaattaa ttggctttag aggagaacaa ggacatgtat cccctctctg 7740
ggcctatcac cttgtagaca atgggatagg tcatgggata ggaacttggc acaacacatg 7800
ttctctcttt taattctctc cattatctta tgaagcaggc aagtaggcaa acaattgtcc 7860
caactttaca aaagaaactg aagcttttat aaattaagta gtacatccta agcaatacaa 7920
ttaataaatg gtagagctga gattcaaact gaagcagtgg cctgggggta gcatctggaa 7980
tccttcccac ctttagggct gctgtgctgc ggtgctgctg tttaatggca caggagggcc 8040
acatgactga atctctctca gcagtccagg cagtcatgca gaaggcccag tagagcaccg 8100
ggcaggtctg agccagcatc ttcaagttcc accctctgag caagcaccta gctgtgacac 8160
acctctccag agactgcact cccccccgcg ccacccaccc caaaagcaga taggtaatgg 8220
tatacagtaa ccatttctag aagtgtaagt agtatgcacc caaaataggc aaaacctgct 8280
ggcctagtga tagagacaac tcccagtcag gctagactgg aggccttggt tttataagtg 8340
ttcaggtgac aagtgccaca gtaggcttga tcaagtagac aggcaggcaa gacaaatgct 8400
taccaatgca agctaatgaa atgtttcttt tgcagaattc ctgtcctgtg aaggaagcca 8460
accagagtac gttggaaaac ttcttggaaa ggctaaagac gatcatgaga gagaaatatt 8520
caaagtgttc gagctga 8537
<210> 8
<211> 200
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
actttaactc tatatataga gagacctctg ccagcattgc attgttagca tctcttgata 60
aacttaattg tctctcgtca ctgacggcac agagctattg atgggtctca cctcccaact 120
gcttccccct ctgttcttcc tgctagcatg tgccggcaac tttgtccacg gacacaagtg 180
cgatatcacc ttacaggaga 200
<210> 9
<211> 149
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
tggaaaactt cttggaaagg ctaaagacga tcatgagaga gaaatattca aagtgttcga 60
gctgatactg agccaccatg ctttaactta tgaattttta atggttttat ttttaatatt 120
tatatattta taattcataa aataaaata 149
<210> 10
<211> 155
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
acatgcctgt aggcaagaca cccacacaca taaaaacaaa ataaaataag gatagaaagg 60
ccagggggat gaatcctcga ggtcgacggt atcgataagc ttgatatcga attccgaagt 120
tcctattctc tagaaagtat aggaacttca ggtct 155
<210> 11
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
agaaagtata ggaacttcat cagtcaggta cataatggtg gatccattaa tcagaggtag 60
aagaaaactt attcc 75
<210> 12
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gacaactttc agggagggag tcag 24
<210> 13
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
atcgcacttg tgtccgtgga c 21
<210> 14
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gcctctctca acccagtata ac 22
<210> 15
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
cttggagtca accacctctg 20
<210> 16
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gatctttcac tgaaacttga ctg 23
<210> 17
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ctccaactac atctactttc tg 22
<210> 18
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ggatcggcca ttgaacaaga tgg 23
<210> 19
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
cagaagaact cgtcaagaag gcg 23
<210> 20
<211> 5553
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
ctcagggatt cactgcagcc ttaccaggta ccacggatct ggttcctgag cacagcaagg 60
ttaggttaca tccagtgaga cagtgagaca acatagagca acagcacaga ggtgccaggc 120
acctcggaag ccacagagga gaagccactg gccagtggtt ggggcagagc acaggaagcc 180
aagtacacct cactcgtgag atgggtgaaa acagaggtct ggctggctgg agagagtctg 240
tgtgagagac gttctttgca ttagcaagac caaagcatca aacaagagta ctggagtgac 300
ccaagtcttg atcagacaga cgcacagcac atgaagccta actccggcac tcaggaggta 360
taggtaggag ggacaggagt ttgaggactg tgaaaaatgt ctaagacctt gaggccaagc 420
cgtatctgaa tcagatttta gcagagccat tctggcagtg agggctgcaa agggcagggt 480
cagggagact gcttatcagg ttcctgtaga gacccgggtg ggacaggatg gcagtagaga 540
ggggagagtc taattctgga gaggtgtgta tgcaaattac atgtttatac tttatataat 600
ataaagtaaa catgcatacg atatctactg cctcttaata tacacactca gtttctatga 660
attctatgtt tgtgtagagg atgaatgtct gtgtacaaca tgtagaggca gatgagaagg 720
tcaagtatct cccttcttct gaagacagtg tctctcacgg agcctggagc taggctggca 780
gccagcgatc ccagtcactc ttctgtcccc atctccacag tgagggggtt cccaggtgcc 840
tgtgggacca cgttggcttt tttatatggg tgctggggat ctgaacccag ccctcacgct 900
tgcttggcaa gctctcttag cctgaaacat cttcccagcc cagtacttaa atataaaccc 960
atgcacactt ttctgcagag ctgcacacat tacccatgtg cactaccact gagctatgcc 1020
tctgagccac atatcaactt ttttggtttg gttttatttg tttctagttt tgttttgttt 1080
ttgagacaac gtagccctgg ctgtcctgga gcttgctgtg tagaccaggc tggccttgaa 1140
ctcacagaga tcatcctacc tctgctgccc aaatactggt attaaaggca tgaaccatca 1200
tgccctggcc ccaaatcagt ttttgttttg ttttgttttt gttttttaaa agtgtgtgtg 1260
tgtgtgtgtg tgtgtgtgca atgcccccaa aggccaggag agggcatccg atccctggga 1320
gctggagtta caggtggtgg aaagtcaact gatgtgggtg ctgggaacct aactgggccc 1380
tctgcaagca cggtacaaac tcttgactgc tgagccacct ccccaccttc taagggattt 1440
attctaaaaa tgtcaaatat ttacaaaata cccctgagga acccattacc cagcctcaat 1500
ggttagcatg tgagggtcga tttgtctcat ctctaccttc cttattcccc tagtgacaat 1560
gactggatcc agagtctagg tgagagcaga agctgggtgg ggtggatgta gcctgtgagg 1620
tctggacaca ctacgtgtga gaaacctgag ctccagtatg ccatcaaagc tggattgtgg 1680
acgccatgtt ccttcctgga gcgtggcacg gcctggcctc ccaagtctca ggccacagca 1740
cagggtctcc atcttctccg tcctcccagc ttaccaccgt tccactgcac agagaagtca 1800
ctttgctgat gtcacagtgt tatcaatcca tcacccttat ctcctgtcac ctcccacggg 1860
cctcggtgac cctcacttct gcttcttgag actcccactc cctggggctc tgaccctgcc 1920
tgtgcccggc tcttggttag gcctcctacc cttcttccgg tattaccagt gggtagtggg 1980
tcatttctta tcccccttgc ctctctcaac ccagtataac tccatttatg ggaatgcctc 2040
catgttcagg gccacagagg ccgctcagct cagcattgct gatctctgac catatctcat 2100
acctgctaaa ctcccagaag ctcctgggtc acctgcagcc gacttctcac tcaatccaac 2160
gtgcattcgt tgtgagtggt gacccatggc cgccactgct gctggtgatg atcacagctg 2220
ggtttggggt tgttttatgt ttgtctttca aacattgtat acttacatat ttttttctaa 2280
tgtgccaaat gccacaccaa cactcgacac ttattaccac acatgatttt ctcacaccac 2340
ttttctactg ccagccggtt ttactggaat acccagacag aataactttc tcaaagccac 2400
tcagaaagat gtctagagct ggattcagag gtggttgact ccaagtcttt ctttgtgtgt 2460
gcatatgcat gtgtgtatag atatgtgtgt gcatacgcat gtgtgtatag atgtgtgtgc 2520
atatgcatgt atgtatagat atgtgtatag atgtttgtat atgcatgtgt atatagatgc 2580
atgtgtgtat agatatgtgt gcatatgcat gtgtgtatag atgcatgtgc atatgcatgt 2640
gtgtatagat gtgtgtgcat atgcatgtgt gtatagatgt gtgtatagat gtgtgtgcat 2700
atgtgcatgt ttagatgtgt gtggaagtca gaagacaact ttcagggagg gagtcagtta 2760
ccccttcctc tgtgtgggcc ctggggattg aacttgggtc atcagatttt gatctgagtc 2820
acctcactgg agtcctgact ccaggtctta actctaccat gatactgcta agccgctcaa 2880
agccacgggg taccttccca ctctcacact cgggccactc tcaaggaaac tgcagattct 2940
aactgcccct atccatccgt tctccctttc tgacaccctt cacttcctct agggcttcct 3000
cgacaccaca ctgggccttc cacaggcttc ctcttgcctg gttctggcac tgagccccac 3060
agtgccagtc ccagctccta gcctctgagg agctggaagg ggcgccttcc tcagctgcag 3120
gagagaaggg aaggcaagtc tgggctgggg caagcaggct gtagggacag acagccaggc 3180
ctaaggacac agcggggctg cttgtttctg atcctttctc cttaaatggt gcatgtgaca 3240
ccatggtttg acatttccta gtggcaagtc tgagcatctg ctgaagtgac tctgggtgga 3300
gatggtttct ccagagagct aggcatggca gaacaaaggt gacgctgtct tcctcgccca 3360
gtgggctatg aggacaccaa gtttccttct ggaatgactc ggcaggttga aaggtcatca 3420
cagctgcatc tcagcatcgt gtcacccaag ctccaggccc ttctcagagt cctaggcaca 3480
gtgtgcgcac acccactccc acagccctct caacactcca cctgcatcca cctccctttc 3540
ctgaatgaag tgcccatggt gtatcatggt cagcttcctc tgctatccag gttcataaat 3600
ctaaggactg aaacccaaca ctgaaactcc tcagaaacaa gtgtggggac caaagcgtga 3660
atgtccagac ttgagtatta tagtcattca gccaaccaaa atgtgatgag taatgaagta 3720
cccactgcgt gcagggtgct taactaagta cctgaactta gtacttagaa caacctcaca 3780
agacaagtac aactgtcact cctcagtttc gggactgagg ttgagtgtat gcccaaagtc 3840
acatgagagg acacagaaca gctaggtctg acaagcagcg ggggtggggg tggggtgggg 3900
tggggtgtag agtctttttc cttagtcttg tcgcaatggt atatcaggtg actcaggcta 3960
agtgctttct ccatagatct cagacttgtg gtcacaggag ccccagggga gggggtgcac 4020
agctttctcc tcactgtgta gaaacccggc cacaagcccc tgccttctgg actccacact 4080
ctggtacaca aaactgctca atggctctcg gctcacaaag ggctggagag ggtctatgac 4140
agtcactttc ctgccctgtc cctccactga ccaccactgg ctggctgaca ctcttcatcc 4200
cacttttcca gcctctgcct tatctgctcc attcacagat aatgtgaatc tgtcacttgg 4260
ggtggccttg gacgtccttt ctagtctttg ggaagacttg gagtctggga ctattcagac 4320
tcttttctct gactccttcc aaccactgaa acaagcaaga caaacggaac tttgcttctg 4380
agcggagttg ccttactcta tccctttctg actatcatct tcccacagag cccagcagtt 4440
aaggtgctga gaggaaaacc tgaatggtct attctttgct ccagggacac tgtgggatcc 4500
agccctcccc ttccctaggt gtccttctgt gccccttctt agcaggattc ttccagctat 4560
ggatgacaag ttcctgctgg atctcagcca ctcgatgccc caccctggct ctcgcgcaag 4620
gtcaacccca gccaagctca actgaggcgg gatagttgct tctcctagag gcgaccgacc 4680
tttcaaatgc ttctagagaa gcccaccctc ggttaagagc actggctgct cttccagagg 4740
acgctaattc agttctcagt acctacaaga aggctcacaa ccacctgtaa cttcagtgtc 4800
aggggtctca acactctctt ccggacccca gaggcatcgg gtatatgttt ggtacacaca 4860
tgaaagcaaa ataatcagat gtataaaatt aataattcta aaaaaaaaaa aaagccaaat 4920
tgaaacaaag aatactcctc tacctgtaca gcgaaggatc agcttcagag ccagagagat 4980
gctcatcggg gagacgctcg ctcaccatgt ggctgagtgg atctgtagga catcacagaa 5040
gtggaagagg gaaaccaagc ccaagccata agtaaataac tcatttatct actaatttat 5100
tttaggtttt cgagacaggg tttctctgta ctctgtgtag ccctggctgt cctgaaactc 5160
actctgtaga ccaggctgct ctgaactcaa gagatccccc tgcctctgcc tcccagtgct 5220
gggattaaag gtgtgcgcca ccactgctca gcttaatctt tttttttttt cttgtaatga 5280
acccctttca cccaaagaga gctcaggcct ttaccctggc tcgtcgccca ggggaacaga 5340
cttgaaattt gcctcgttgc ttatcatcag tggctggaag gtaacagttt cccaagaatt 5400
gactgtgtcc ctaggcctac agaacatgac tgtgtccaac tttacaacag tcacagttaa 5460
tatatatata tttgtaagtg gggtatggtg gcttatatct gtaacttcaa cacttgagag 5520
gtggaggcag gagagtgacc atgaatctga ggg 5553
<210> 21
<211> 5196
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
taactcaagt tctgggggag ctgatgctct cctctggcct cctgtggagg tacacagacc 60
acatgcctgt aggcaagaca cccacacaca taaaaacaaa ataaaataag gatagaaagg 120
ccagggggat gaatccagag gtagaagaaa acttattccc tggaattgtc ctctgactcc 180
cctcccaaaa cctctaacac gcatctctct ctctctctct ctctctctct ctctctctct 240
ctctcacaca cacatacaca cacacataca cacacacaca cacaaatgag gggtatgcat 300
atatacacat gtatacacat acatacacac aaatgagatg gtatgcatac tcacacatgt 360
gcacacacac agatgaggag tatgtacaca cacacacatg cacacacact aagtaaataa 420
aacagagaag aacagaggca tggcactaca ccctaccttc catggggagg gattactgag 480
acaacagagc ctgcggcttg tgaaacaaga accagaaatc aaaaaataat tttttgaaag 540
gacaaggaat cggtagcact tacctacaat ccagtttgaa gcaggccagc atgcatcccc 600
agaatccaca taaaagtgga aagagaaaat caactctaca aagatgtgtt ctgacctcca 660
catacgcatc atacatacac acagtcatca tatatatata tatatatata tatatatata 720
tatatatata tatatatata ttagagaaaa tcaagagatt taagtgttta aaactgctaa 780
cacagtagaa ctacaaaact tgactacaaa acatgtcata gggaagccac acatgtgggt 840
gtggcctgag acctgtgggg gactgtggtg gattgaacga aaatggccgc catagaccca 900
tatgcttgaa tacttggtcc accgttggtg gaactgtttg ggaaggatta ggaggtgtgg 960
ccccgttgga ggaggagtgt cactggggca ggctttgagg tttcaaaagc ccaggctatt 1020
cccagtgtgt tctctctgcc cccagctttc agatcaagac atgagctctg acacagtgcc 1080
tctgttctgc catcatgtac tctaaaccca gaaacctata gtcccaaatt aaacacttcc 1140
ttttataagt tgctttggtc atggtgtctt gtccattaag agcagtaact aagacagggc 1200
agggagactg tttaaagaac aggagtaatt ggttaggtgt ggtggagtac acttttaatt 1260
ccagcacttg ggaagcacag gcaggggtag ctctgtgagt ctgaagccag cctggtcggt 1320
atattgagct ccaggccagc cagagctaca taatgagaac ctgtttctaa agtggggggg 1380
tggggggtgt gagttgctgg gcaggaatga tggctcagtg gctaagacca cctgctgctc 1440
ttggttgttt ccaagcaacc acatactggc tcacaattat ctgtagctcc aggggatttg 1500
acacctctgg cttctgtggg cactgaactc acatgcacat atccatgtgc agacacacac 1560
atctacacat aacttacaga aaaaaaaatt acatatatat atatatatat atatacatat 1620
acatatatat atatatacac atatacatat atatacatat atatatatat atatatatat 1680
gtatgtaaag ttgataatta aaaatatagc taaggatagt cacgaattgg ggctggagag 1740
acagctcagt ggttatgagc accaactgct cttccagagg accctggttc aagtcccagc 1800
aaccacatgg tggatcacaa ccatctgtaa ctccagttct tgggcatctg acaccatttc 1860
ctgacctctg tgagtacttc gtgcagaaca cagacatgca tgcagtcaat gccctcacac 1920
acacaaaagc aatttgaaca aatctcaatc ttaattaacg ctgttattaa aagggaagga 1980
atcgagagga gagaacccaa cggagctcca cactgtcaag cttgcccgtc agaagatgct 2040
ctatgcagtc tcttctacta gagggatcta gtaacagtga cttggcactc ttctgaccct 2100
caatcacatg catgtgacaa aaattaacac caacactgac atcaccccaa aaatacatac 2160
caacttttta accccttcaa aataagggga aaaaaatcaa aagcttaaaa tctcaccctg 2220
accacaggca gtttcaccct gcccacatga aataccagca tgccaagggc aatagcggct 2280
tctaaggcca atcagggaag gtatgcagtg aaaaatttaa tttcctctct tttgattgaa 2340
actcatttgc atgtcctggc taatgtgagc cctgtctgcc acaggatatg agttgtgggt 2400
ttgcacttgg tatatgaggc tgagatgata aaggaacggc tgtcaaaaag aaagacctaa 2460
aatagaccac gggacccagg caggttctag gtcagtcagt cacacctaca cttggatggt 2520
cagaacacac taactctttt gtttgcctcc acatagggag ccctagactc tggacttaaa 2580
catccaatgc tcagcctctg attcgatcaa gggaagaaga ggtaaggcca gccataaaac 2640
acgcgtggat taagggaact tgaggattaa gtaagtcgtg aggcttgtga ctggagcagt 2700
tactgaggcc accagccaca gtcagtgctc agtggagtgt gttcgccaca gatggtgaag 2760
gtggaactgt taactctctc tcccatgatg cacatgggct ctgcttttgc cctcagccag 2820
tggatgggtt atctctaact ggcatctggc aatgggcaat aagtacctca tggataaatg 2880
cctaacaaaa ccatatatag ctgtgtcttg cattcttggg gagccgggaa gaaatgctgg 2940
cctgggctgg agagatggct cagtggttaa gagcactgat tgctcttcca gaggtcctga 3000
gttcaattcc cagcaaccac atggctcaca accttctgta atggggtctg gtgtgtctga 3060
agacagctac agtgcactca tacacataaa atagagacag gtggatctct gtaagtttga 3120
ggccagcctg gtctacagag tgagttctag gacatccagg gctatacaga gaaaccctgt 3180
ctcaaaaaac caaaagcaag tttaaagtag atttccccct cctgctgtac tagggcttga 3240
acccatggcc ttgtgcacag cagggaagca ctgtactatg aggtatacct ctagacctcc 3300
tggtctccca tcctaaagct atgatgtttt caccttagct ctctagactg cctttgtgtg 3360
tgtgcacaag catgtatgta catgtgcctt gacactacca tgtgaagccc agagatctgg 3420
gtctttctta atcactatct tacttttttt ttttttaata aatgttagtg tgtgtgcatg 3480
tgtgcacata atgtgtgcac ctgtgtggca tggtgcgcac gttgaagtat gtgagtatct 3540
gagatggaac tcaggccttg aggttgtgca gcaagtgtct tttacccgct gagccatctc 3600
cccggcatgc ggtcccctcc cttctgatta gctcttcctg ccagtttctt cccagtgcaa 3660
gctgcggaag ggacctgttc cttcttgggg agaacctcct gtgtactgtg aggaagcatc 3720
cgtcacctgt caataaagct ggcggttggt ctattaactg aggcaggaaa tggggtggaa 3780
gttccagtag ggagagagga actctgggat aggcaggttt aggaagacat tctcccggga 3840
ttctgagact caagaaactg aggcaaggta actagccgtg tagcactcac agaatagaat 3900
aaatggttaa ttaaggtact gggtagtcaa ggagtgggcc aaagcttgtg gtctaggtgt 3960
ttattcataa acagtaagtc tcagagtcac tgttttgggc actagggtgt cagtggaaaa 4020
gcctgaggtt aaaccttctt gttctgtatt ggccagtgtt aaagcagaca aagtctgctt 4080
tcatgctgtg ggcccagtgc atgcccagtg tccatttgac actacatttg aaagacatgt 4140
ttgtcccctt ggtctaagag tggaagctgg catatctacc tattgtctct ccagcccacg 4200
actggcgtgt ctgttctcag gggcacaata tacaccacaa gcgggaaggt ggtcagtaga 4260
gtcctgctgc agcgcaggag agacacattt taatttttat gatttttgtg tgtgcatgtg 4320
tgtggtgtgt gtgcaaatgt gtgcatttgc ttgtgtgggc ccacgtacac agtccagagg 4380
ataacattgg gtgtcctgtg ctatcattct gccttatgtc tttttttttt tttttttggt 4440
tttttgagac agggtttctc tgtgtagccc tggctgtcct ggaactcact ttgtagacca 4500
ggctggcctc gaactcagaa atccgcctgc ctctgcctcc tgagagctgg gattaaaggc 4560
gtgcgctacc acgcccggct gccttatgtc tttaagacag gatctttcac tgaaacttga 4620
ctgtgtctgc cccagcagtg ctggggtcac aggcaccctt gaccatgctc agcctttaga 4680
tgagtgctgg agatgtgaat tcaggtcctg atgccacctt agtaagtgtt cttgccccac 4740
tgagccatct ccccaacccc aagatatact caagagggca ccagggcact taaacattgc 4800
tagtggcaaa gaaagctggg gcagctactg caggaactgt atggagggtt ctgaagaatt 4860
aaatattata tctctgttgg actgagaacc caacagagat gcttgtacat tcacaatcat 4920
tgtggcactg cacagtcatg aatatatgga accaaggcat caacagataa ctagataaag 4980
aatatgttgt gcatagacac aatggaattg tgcttaggcg tgaagaatga agtcatgttt 5040
acagaaagta gatgtagttg gagattatgt taaataaagc cagattgaga aaaaaaacaa 5100
ttttttccat tctatgcaga atctggattt aaatctgtat atttagagca tgtgtgcatg 5160
gttaaagtga gagggaatta agagaggcag gagagg 5196
<210> 22
<211> 10573
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
cttccagaat aaattcatag ggaggcccag gcacagtggc tcacgcctgt aatcccagca 60
ctttgggagg ccgaggcagg cggatcacga ggtcaggaga tggagaccat cctggctaac 120
acggtgaaac cccgtctcta ctaaaaatac aaaaaattag ccgggcgtgg tggcaggtgc 180
ctgtagtccc agctactcgg ggaggctgag gcaggagaac ggcatgaacc caggaggcgg 240
agcttgcagt gaactaagat cacgccactg cactccagcc tgggtgacag agcaagattc 300
catctcaaaa aaaaaaaaaa aaaaaagaaa ttcataggga aaagaaggtc agagaccaag 360
ggaagggaag gttctgggag aaaagcaggg ggcaggcagg gcccaagaat cctgctgccc 420
atgagccctt actgggaggt ggggtggcct tgcacagggc ccaggcacct gagtgagtgg 480
tggggtcctt acgttcactg ctggggtgag gcaatgagca ccttattgtg tccacatgaa 540
ttcaataaaa aacaagcagg gcgggtggtg gggcactgac taggagggct gatttgtaag 600
ttggtaagac tgtagctctt tttcctaatt agctgaggat gtgtttaggt tccattcaaa 660
aagtgggcat tcctggccag gcatggtggc tcacacctgt aatctcagag ctttgggaga 720
ctgaggtagg aggatcactt gagcccagga atttgagatg agcctaggca acatagtgag 780
actcttatct ctatcaaaaa ataaaaataa aaatgagcca ggcatggtgc ggtggcacgc 840
acctactgct aggggggctg aggtgggagg atcacttgag cctgggaggt tgaggctgca 900
gtgatccctg atcacaacat tgcatttcag cctgggtgac agagtgagac cctgtctcag 960
aaaaaaaaaa aaaaaagtca ttcctgaaac ctcagaatag acctaccttg ccaagggctt 1020
ccttatgggt aaggacctta tggacctgct gggacccaaa ctaggcctca cctgatacga 1080
cctgtccttc tcaaaacacc taaacttggg agaacattgt cccccagtgc tggggtagga 1140
gagtctgcct gttattctgc ctctatgcag agaaggagcc ccagatcagc ttttccatga 1200
caggacagtt tccaagatgc cacctgtact tggaagaagc caggttaaaa tacttttcaa 1260
gtaaaacttt cttgatatta ctctatcttt ccccaggagg actgcattac aacaaattcg 1320
gacacctgtg gcctctccct tctatgcaaa gcaaaaagcc agcagcagcc ccaagctgat 1380
aagattaatc taaagagcaa attatggtgt aatttcctat gctgaaactt tgtagttaat 1440
tttttaaaaa ggtttcattt tcctattggt ctgatttcac aggaacattt tacctgtttg 1500
tgaggcattt tttctcctgg aagagaggtg ctgattggcc ccaagtgact gacaatctgg 1560
tgtaacgaaa atttccaatg taaactcatt ttccctcggt ttcagcaatt ttaaatctat 1620
atatagagat atctttgtca gcattgcatc gttagcttct cctgataaac taattgcctc 1680
acattgtcac tgcaaatcga cacctattaa tgggtctcac ctcccaactg cttccccctc 1740
tgttcttcct gctagcatgt gccggcaact ttgtccacgg acacaagtgc gatatcacct 1800
tacaggagat catcaaaact ttgaacagcc tcacagagca gaaggtgagt acctatctgg 1860
caccatctct ccagatgttc tggtgatgct ctcagtattt ctaggcatga aaacgttaac 1920
agctgctaga gaagttggaa ctggtggttg gtggcagtcc agggcacaca gcgaggcttc 1980
tcccctgcca ctcttttttc tgagggtttg taggaagttt cctcagttgg agggagtgag 2040
agctgctcat caaggacttc tctgtccggt tggaggttaa ctctgtctct tgctctctca 2100
tttctgcctg gaccaagact ctgtgcaccg agttgaccgt aacagacatc tttgctgcct 2160
ccaaggtaag aagccgtccc acggtctgtt ttagcaaatg gggagatcca tccccaaatg 2220
tctgaacaag aaacttgtct aatggaaaac gagcgggccc aaattaactc taaggtgtta 2280
gatgttttca aagaacgaga agtctgatct ttactcttaa gcatgttttg gtctttctgg 2340
tttcacttga tttagaagac atgtaataga aagcttacat gctgtagtcc tgactcagat 2400
cctggtcaaa gaaaagccct cttgggtttt acttagcttt ggcatagtgc ctggaacgta 2460
ggaggcactc aataaatgcc tgttgaatga gagaattttt ctggcccata catttctgaa 2520
aaaccaaata ctctcacaga aacagatatt gagatgacag gttgagggag ctttcatttt 2580
gtctaagaga cttcctatgg caacagaaaa ggtatcgcca gagcccctcc tcttccacag 2640
cctggccacc taacagccct ctgggttccg gggctggccg tccagagctc ctcagcttgc 2700
tctggccggc cgaactcccc tccagctcgg tctggaacca tcctgctggg cagcgtccag 2760
cacatccctg cttcgggctg cctgggcacc tcgcctctct gcctcctgtg ctgcctcacc 2820
cccacccctc tatctgtagt gggaggagat agatttgaca gctgatagtg cattttctct 2880
gacaaacaca tgactacagc cgtatcaata gttttgtgca tttcagttcc tgttttcatg 2940
gaaacacacg gctgagaatg aaagccccaa agcctcaatt tcacagtggt ctcctaacta 3000
cctgctttcc atgcaaacta gggagatgat atggccagga gtgaagccct gtgtgttggg 3060
cagggtcaca ctccagcacc cagaccatag aacagggccc atcctgcttc atgagggaaa 3120
ctgctcttcg ggcctttagc tggactatct catttcatta gttatcccgg gagtccgata 3180
caggatgaga ttctgaaggg caaatacaca cttttttttt tttttgagat agggtcttgt 3240
tctgtcaccc aggctggagt gcagtggtgc gatttcagct catagcagcc tccacctccc 3300
aggctcaagc tatcttccta cctcagcctc ccaagtagcc gggacgacag gtgtgcacca 3360
ccacgcctgg ctaatttttg tatttttttg tagagatgga gtcttgccat tttgcccagg 3420
cttgtctcga acttctgggc tcaagcaatc cgtccacctc ggcctctcaa agtgctggga 3480
ttagccactg cacctgggca acagtttatg tgtgtgtgtg tgtgtgtgtg tgtgtgtata 3540
tatgtgtgtg tgtatatata tgtgtgtatg tatatatgtg tatgtatatg tgtgtgtgtg 3600
tgtgtgtgtg tgtgtataaa atctccaagt ccatccaacc gagatggctc ctactagaag 3660
ccaagagtcc accgggttga gcactgggtc tctggaggcc tgtggcactg ctgagaaggc 3720
tctaacaaag ccaagggaag ggccacctca ctagaagcca ggcctggagg aagggtgagg 3780
gctgagggcc tggaggtaag actgcctgtg gttttagacc cagctctgcc actgactagc 3840
tgtgtggctg gccttcagca catcttcaca cctctctgca cctcagtttc cacatgtgaa 3900
gatatgaaag tgattctgaa ggtgattgca aggttgattg gaatccagct cttgagttag 3960
tgcaaagtgt tattgtgaga tgatataacc acgattaaaa gcaagaacag gtgcagagaa 4020
gcgatgattc taagaaggag gggaccgggt tggaaaggat caaaccatcc aggatgccga 4080
gtctggggca atccatctgg gctgtttctg gaagaccccc gggtgcaggc caggacactg 4140
ctgccctccc gtccttaact cccctcttca ctcagtcctc actcacctcc ctctcacaca 4200
cacaaacatc tcctagaata atccccactg cctgccttca ctcttacccg tctcatttgc 4260
ctcccctgaa cttcatcctc ctggagttca cgatctcact cttcactctt ttcttcccct 4320
cgaagattca gcactgctta cttacatgtt aagatatttc agaacagtga aatgttgcta 4380
ttttcaaaaa cctacaaagg tggtatgcag aggaaaaggt acttctttgt gttcccaaag 4440
aaaacatctt tccaaaatcc agcctattga ttttatttct tcgggggaac aagaatttta 4500
gtatctctaa gttgggtagc attctactct tggcagttgc tggaaagaag gcactggtct 4560
aggtcctggg cttcacaggt aacacctgtc agggtgtcta tgaagtcaag gctgtctgag 4620
gaacagcaaa gtgggaagaa gcaagctggc tggctgatga agggtttctt gggtggacaa 4680
gtagttggag ctatttccta tttaccaaag agagctaaag ttcataattc tacagagagt 4740
tccataatga acctcaaata cctctgtttt ttgaaggagt ttctcatata cagcactagc 4800
tgactatcct gggcaggatg ggagataatg aatgcagtgc caatcgggct ggatttatat 4860
ggtcctcagt gaggctggtc aagaaccgag ttagaactct cacagagtca ctgccacaga 4920
agaaatctcc caagtggctg tttcctgaca ttcccgggag ggacaggcct ccttctgagt 4980
cactccctaa gcagttctga actgtgaggt cagccaggct gtccaagtgc actccctgag 5040
ccactggcag acacactcag cagccagagc tagacaggca ggtggtagga gtccagggcc 5100
acggcaggga tggagtgtcg ccccctcgct gcgataccag agcaactaaa acgttaaggc 5160
cttgcactaa agctgccctt aggatgcatt cttttaaagt ttttccattt aatgcagact 5220
cttttcaatt cttattttat ccttgtttcc tttagaaagt cctttcaaaa atatctttag 5280
agggtttttt cctatactat gtggccatat acgggtcaaa attaagttta atttccaggc 5340
tccaagccag cgtttcagaa aaatctcacc aaggtttgtg gtaaaagaag caaagggctg 5400
actttttggt tttcttgaat ctcactgttc cctctgcagc agcatgcatg tctgcccacc 5460
tccagacaca caggcaccat ctgccgcccc ccatcagccc gtgtcccttc cacctcgact 5520
cgcctacaaa gcccagagag gtctgtttct tggcccccag agcccaaaga tactgacaca 5580
ctcttacatt tccaactaga atcaggaacg aggagtgact ctcagtcagt tcattaagta 5640
aatgtctttc taaccgctct gcccatggga catcacgccc cacaggggaa aggggaagct 5700
tctgtagcct gggattctgg tgcctcagtc tgggtctaga ctttcctgaa aaaacgttaa 5760
aatatgaact gcattcctag aatttagcct acataaataa gagatgaaca caaagatttc 5820
tatagtttac tcactgccgc ttatttacag aagcaaaaat ctgccacgat aggggcctga 5880
caaatgacag taccactgtg caatgcgttt ctacgcagct ctcaatccca tgttctctaa 5940
taccaccgaa gggcttagga aatgcttatg gtatatgtaa agagtaaaga agttacaaaa 6000
cagtatcaac agttgacccc tattttaaaa agtattttta aaagtgtgac gatatttacc 6060
aaaatattaa cagcaatagt tacctctggc tggtgggatg agtgaatgta tttttgttga 6120
atatatgtta cctttatagt aaatatatgt tatcttgatc atcagaaaaa aaaatatgta 6180
agaacttgaa agctgcttgg acagcgctgc tgatagaaac ccctgagcat cttgtcactg 6240
ttcttctgat tcagagggtc tgggtggggc aggggtggtc tgagattctg tatttctaag 6300
aagctcccag tgatgtccat gctgctggtc catggaccac actttgagta tcaagggacc 6360
agagcatgtc gggggagagg ctggggatag ctttctttat ctgaactgga taaaggaact 6420
gggctcaagc taagaaccct ctccaggttc tgcatctttg ttcttcagtg aaaaatgaga 6480
ggacacacca ggccaggttc agactgagac acaatccctc tcctgggttc ccaatgactt 6540
gtctcttgtc cattcccttc tctaaggcta agggccccca ggaagagcca tgtggccaga 6600
ccctcacagt tgctggcatt ccaaggagat tctcactccg catcatttgg ggccaaaagg 6660
ccccttacag aagctctgcc caaggctcag atcaatggca cctgctccca gagcctcctc 6720
tgatctccca ggacaccttt ccctgatctg tgcacttatc tcttgctgcc tggcaaaatg 6780
tcttagctcc tcacttgggc catgtgctgc tctcctctcc catggggaga gccacacgga 6840
gagtgctggc caaagcagca gagttcaggc caaaggatgt gcactcattt attcaacagg 6900
catgcaggat ttccagggaa agctggattt taaaacctct gggaacaaga gcagaacctg 6960
actgagagct catgtgggca cttttcatag cagaatagct catgaggtat agagacacgg 7020
acgcagaacg tgggctgtag cgacagatgg tcctgcattc tagtccccac tgtgcctttt 7080
cctcatggga tgactttatt caggtaccct ttcggcaaaa tcctccaaga gaaaggaaac 7140
tgggaggttc tggggagaag gctgctgcgt ttgcaattgg gagaggttgt tgacagaggt 7200
ttatgtctgt ggcaagcagc cttccttcag tggaatactt gaagacaggt ctgtagttga 7260
gcaaactcac ctccatttgt cctcctggaa agaagaaatc aagaggaaaa atctctctcc 7320
catcctccaa atggagctgg cacattgcta tctgtggcat ttgtctttcc agaacacaac 7380
tgagaaggaa accttctgca gggctgcgac tgtgctccgg cagttctaca gccaccatga 7440
gaaggacact cgctgcctgg gtgcgactgc acagcagttc cacaggcaca agcagctgat 7500
ccgattcctg aaacggctcg acaggaacct ctggggcctg gcgggcttgg taagctgcac 7560
tgtattcctg gcaagccggc cgcgtggctc ctggtggaca gcagcctcac ttctaaacac 7620
tccttaggag ctgcagcacc cttggtcaac ccattcattc attcactcat tcaataagta 7680
tttgctgaag ttccacaagt gctgggtgtg gttctaggtg ctgaggacgt gtcactaaag 7740
acacgcaggc cgagtccctg ttctcatgga atgttctaat gggagagtta gaaaaacaaa 7800
catgtaaaat gatggccagc agtgatacgt gctacaaaga aaaacataga aataaagaac 7860
ataagagtca tgggggaggg ggctgactta ggagctggtg acattatctg agcagatatt 7920
tgaattgagg gagcaggcca catgactaac tagggagacc attccaggca gaaggaggag 7980
gtatgcaaag gccttaggat ggaaatgaac taacttcctg tatttaaaga ccagtaggaa 8040
ggccagtgtg gctggatcag agtgagtgag gggtagtttc caggacagca gatcacacaa 8100
ggcctttaga ttccaccacg agtatggcag ggaacacctg cagagctttg ggcaggacaa 8160
agactgtaca atctgattta cgtgatttaa aagggtcagt ctggctactg tgtggtaaat 8220
aggctgaaag ggggaaagca tagaagcaag atggcctgtt gggaggctac cacagtaaac 8280
caggctagag atgatggtgg cgtggacaga atgaagcaag atggcctgtt gggaggctac 8340
cacagtaaac caggctagag acgatggtgg cgtggacaga atgaagcaag atggcctgtt 8400
gggaggctac cacagtaaac caggctagag atgatggtgg cgtggacaga atgggagcag 8460
ttgaggtgaa cagatttggg atatgactaa aaataaaacc agaaggattt gctgacagat 8520
cggttgtagg gggtaagata caggggagga aaagatgacc tctttgttcc tgcccaaacc 8580
cctctggcga tggtcagtac tgtttacaga gagatgaaag actggcggca aggcagggct 8640
ggaggttcag cagaagatca agagttcaat tttgtacatc gtacatgtaa ggtggctctt 8700
ggatagccaa gtgaaggtgt tgagaagatg gttagaaaag tctggaactt aggggagagg 8760
tcagaacttg caatacaaaa aggagagtcc ttagatagat actgctgaaa atctgaatga 8820
cagaaaggga gagatcaaag gactgagcct gagatcaaca catggaggtc aggagaggag 8880
gatccagcca aggggcctga ggaggagtga ccagtgaggc aggagaacac tggagagtgg 8940
gcggtacccc aggaagccgt tgaggacact caaggaggga gggttgactg tgtcaaatgt 9000
actgaaagga caggtcaggt gaggaccaag aaaggcccct gggtttggct gatggaggcc 9060
atgggtgagg ctgatgtaaa tggagaggca ggaaggaaag cccagctgga gtgggctcac 9120
cgaggatagg gtggcgagag gagacaaaga aggaacagtg agggcagaac actctttgaa 9180
gatgtttagc tataaggctg cagagaaact gacccacagc tgcagggtgg ttatggagtg 9240
agggaagctc ttttaaggtt gggggtatac ccagcatgtt aatgcacctg ggggaatggt 9300
ccagtggagc aggaagaact gaagagagca gaaagaggaa gaatcattag ggggcagaag 9360
tccttgtagc ccagagtgga tgttatctaa tatcgagtgg aggaattaat tggctttaga 9420
ggagaacaag gacatgtatc ccctctctgg gcctatcacc ttgtagacaa tgggataggt 9480
catgggatag gaacttggca caacacatgt tctctctttt aattctctcc attatcttat 9540
gaagcaggca agtaggcaaa caattgtccc aactttacaa aagaaactga agcttttata 9600
aattaagtag tacatcctaa gcaatacaat taataaatgg tagagctgag attcaaactg 9660
aagcagtggc ctgggggtag catctggaat ccttcccacc tttagggctg ctgtgctgcg 9720
gtgctgctgt ttaatggcac aggagggcca catgactgaa tctctctcag cagtccaggc 9780
agtcatgcag aaggcccagt agagcaccgg gcaggtctga gccagcatct tcaagttcca 9840
ccctctgagc aagcacctag ctgtgacaca cctctccaga gactgcactc ccccccgcgc 9900
cacccacccc aaaagcagat aggtaatggt atacagtaac catttctaga agtgtaagta 9960
gtatgcaccc aaaataggca aaacctgctg gcctagtgat agagacaact cccagtcagg 10020
ctagactgga ggccttggtt ttataagtgt tcaggtgaca agtgccacag taggcttgat 10080
caagtagaca ggcaggcaag acaaatgctt accaatgcaa gctaatgaaa tgtttctttt 10140
gcagaattcc tgtcctgtga aggaagccaa ccagagtacg ttggaaaact tcttggaaag 10200
gctaaagacg atcatgagag agaaatattc aaagtgttcg agctgaatat tttaatttat 10260
gagtttttga tagctttatt ttttaagtat ttatatattt ataactcatc ataaaataaa 10320
gtatatatag aatctaacag caatggcatt taatgtattg gctatgttta cttgacaaat 10380
gaaattatgg tttgcaactt ttagggaaat caatttagtt taccaagaga ctataaatgc 10440
tatgggagca aaacaggaaa gaccacttcc ccctcgaggg gttccctctc gagttaggga 10500
cataacacac aagataatta aagaacacaa ggccatacaa gatgtaaata agacaccttg 10560
ggtccaagag tgc 10573
<210> 23
<211> 145
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
tggggtatgg tggcttatat ctgtaacttc aacacttgag aggtggaggc aggagagtga 60
ccatgaatct gagggcttcc agaataaatt catagggagg cccaggcaca gtggctcacg 120
cctgtaatcc cagcactttg ggagg 145
<210> 24
<211> 196
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
ggggttccct ctcgagttag ggacataaca cacaagataa ttaaagaaca caaggccata 60
caagatgtaa ataagacacc ttgggtccaa gagtgcgtcg acggtatcga taagcttgat 120
atcgaattcc gaagttccta ttctctagaa agtataggaa cttcaggtct gaagaggagt 180
ttacgtccag ccaagc 196
<210> 25
<211> 150
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
tgcggaaccc ttcgaagttc ctattctcta gaaagtatag gaacttcatc agtcaggtac 60
ataatggtgg atcctaactc aagttctggg ggagctgatg ctctcctctg gcctcctgtg 120
gaggtacaca gaccacatgc ctgtaggcaa 150
<210> 26
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ctgtgatcat ggttccttat ctgg 24
<210> 27
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
cctccccgag tagctgggac tac 23
<210> 28
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
ccactagggg tccacagcta gtcat 25
<210> 29
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
cttcagtgaa acctcctgag cctgg 25
<210> 30
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
agtcagagct acagaagtgg agggt 25
<210> 31
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
ctgctctgca ggaagtaagg gttcc 25
<210> 32
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
ccacatcact gaaagacttc ctgg 24
<210> 33
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
gatcaagtag acaggcaggc aagac 25
<210> 34
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
ctgtgatcat ggttccttat ctgg 24
<210> 35
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
agggacagat gcaggctggg 20
<210> 36
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
gagatgcgtg ttagaggttt tggga 25
<210> 37
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
tcagcgatat taagaacgtt gatccg 26
<210> 38
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
tgaagaattg ccggtcctat ttactcg 27
<210> 39
<211> 5122
<212> DNA/RNA
<213> 小鼠(Mouse)
<400> 39
cttctcgcag gaaagccccg cgcggcgcgt ggagcctgaa ctcgcaggtt ctggctggac 60
ttctcgaagc tgaggagaag cagagggacc tggcttctga ttttggatct gcgtgcttgc 120
tggttctggc gcctgctggt cttgttcctg taacctagga ctcggggctt gcacatgctt 180
tttttttgaa gttgctggag agggagccca ggaccttgtg caggcacctt ttgtgtcccc 240
aatggggcgg ctttgcacca agttcctgac ctctgtgggc tgtctgattt tgctgttggt 300
gactggatct gggagcatca aggtcctggg tgagcccacc tgcttctctg actacatccg 360
cacttccacg tgtgagtggt tcctggatag cgctgtggac tgcagttctc agctctgcct 420
acactacagg ctgatgttct tcgagttctc tgaaaacctc acatgcatcc cgaggaacag 480
tgccagcact gtgtgtgtgt gccacatgga aatgaatagg ccggtccaat cagacagata 540
ccagatggaa ctgtgggctg agcacagaca gctgtggcag ggctccttca gccccagtgg 600
taatgtgaag cccctagctc cagacaacct cacactccac accaatgtgt ccgacgaatg 660
gctgctgacc tggaataacc tgtacccatc gaacaactta ctgtacaaag acctcatctc 720
catggtcaac atctccagag aggacaaccc tgcagaattc atagtctata atgtgaccta 780
caaggaaccc aggctgagct tcccgatcaa catcctgatg tcaggggtct actatacggc 840
gcgtgtgagg gtcagatccc agatactcac tggcacctgg agtgagtgga gtcctagcat 900
cacgtggtac aaccacttcc agctgcccct gatacagcgc cttccactgg gggtcaccat 960
ctcctgcctc tgcatcccgt tgttttgcct gttctgttac ttcagcatta ccaagattaa 1020
gaagatatgg tgggaccaga ttcccacccc agcacgcagt cccttggtgg ccatcatcat 1080
tcaggatgca caggtgcccc tctgggataa gcagacccga agccaggagt caaccaagta 1140
cccgcactgg aaaacttgtc tagacaagct gctgccttgc ttgctgaagc acagagtaaa 1200
gaagaagaca gacttcccga aggctgcccc aaccaagtct ctccagagtc ctggaaaggc 1260
aggctggtgt cccatggagg tcagcaggac cgtcctctgg ccagagaatg ttagtgtcag 1320
tgtggtgcgc tgtatggagc tgtttgaggc cccagtacag aatgtggagg aggaagaaga 1380
tgagatagtc aaagaggacc tgagcatgtc acctgagaac agcggaggct gcggcttcca 1440
ggagagccag gcagacatca tggctcggct cactgagaac ctgttttccg acttgttgga 1500
ggctgagaat gggggccttg gccagtcagc cttggcagag tcatgctccc ctctgccttc 1560
aggaagtggg caggcttctg tatcctgggc ctgcctcccc atggggccca gtgaggaggc 1620
cacatgccag gtcacagagc agccttcaca cccaggccct ctttcaggca gcccagccca 1680
gagtgcacct actctggctt gcacgcaggt cccacttgtc cttgcagaca atcctgccta 1740
ccggagtttt agtgactgct gtagcccggc cccaaatcct ggagagctgg ctccagagca 1800
gcagcaggct gatcatctgg aagaagagga gcctccaagc ccggctgacc cccattcttc 1860
agggccacca atgcagccag tggagagctg ggagcagatc cttcacatga gtgtcctgca 1920
gcatggggca gctgctggct ccaccccagc ccctgccggt ggctaccagg agtttgtgca 1980
ggcagtgaag cagggtgccg cccaggatcc tggggtgcct ggtgtcaggc cttctggaga 2040
ccccggttac aaggccttct cgagcctgct cagcagcaat ggcatccgcg gggacacagc 2100
agcagcgggg actgacgatg ggcatggagg ctacaagccc ttccagaatc ctgttcctaa 2160
ccagtcccct agctccgtgc ccttatttac tttcggacta gacacggagc tgtcacccag 2220
tcctctgaac tcagacccac ccaaaagccc cccagaatgc cttggtctgg agctggggct 2280
caaaggaggt gactgggtga aggcccctcc tcctgcagat caggtgccca agccctttgg 2340
ggatgacctg ggctttggta ttgtgtactc gtccctcact tgccacttgt gtggccacct 2400
gaagcaacac cacagccagg aggaaggtgg ccagagcccc atcgttgcta gccctggctg 2460
tggctgctgc tacgatgaca gatcaccatc cctggggagc ctctcggggg ccttggaaag 2520
ctgtcctgag ggaataccac cagaagccaa cctcatgtca gcacccaaga caccctcaaa 2580
cttgtcaggg gagggcaagg gccctggtca ctctcctgtt cccagccaga cgaccgaggt 2640
gcctgtgggc gccctgggca ttgctgtttc ttaggtgagt gagtgtgctg ttgttgctga 2700
ggtctgtgct gaggccaggg ttcctccaag ccagggaagt acttcctggg agacagccca 2760
gctggcaggt ttcccagaaa tccagagaat ggtgaattga agatgtaaac ttggcctgac 2820
cctggacgct cggagcctgg ctgtctcctc ttccactggc ctgggctctc ctccctccca 2880
agggatacag gggctcactg tgcttggtcc cacagcagtg ctgacgttcc taagtcctgg 2940
gctttcctag ctgatgttgt cctacctact cagtcccatt ttgtccaccg aatagacctg 3000
tcactcaagg ctctcagcgg tcctgccata gctgctggac gctcccagct ggaagctggg 3060
cctagaaact cacagatggc ctggcagtgg catgggaggc cctaaaaatt agtggaaatt 3120
ttgagagagg acaggtattg ccccacagag gccattcatt gaacagccag gactgggact 3180
agaggcagag cctgctgtcc tccgctcagt tgtagaaagc aacaaggaca caaacttgat 3240
tgcccaaagt cactgccagt tacccacata tgaccagaag ccagggctcc tgggatgtgg 3300
aagataaaca aacacagttg ccgggtggca gggcccagcg ggcacgataa ctggcagtca 3360
aggcgatacc tcgagggaac tgtggggctg gtcctggttg gtggtcaggt ggtagggata 3420
gcagatggca gactttggtg agtgagtgag tctgactgtg ttctggaaga tgggaccggg 3480
ctcagcactg tctgctcacg tccccactgt tgcaacacct agtctgtttg caaggaggac 3540
aggacaggtc acatggagct ttatgtcaat aaagtcttta tcttgtcagg tttcctttac 3600
tatacacacg ccgagcccac agtgcacgaa agctgaaatg tgcaggcagg gggttgggga 3660
agtggggaga caaggcccca gcagttggtt taagggaatg acttgggaat ggggcagagc 3720
tgtggctact ccatctctca tccttaccct cctgctacca cagcttgtgc ccatgtgtgc 3780
ctgctcaggg gaggggtcct cctctttccc tctcctttag gcagagtgct agaggtgttg 3840
gatgctcctt agcacgcaga gggcgtgaca ctggctgcta agtgttgttg aatgtgtcaa 3900
ggcattgaca tcagtaggcc ccacatctta ggcaggggat ttggggtgtg gcaacctgcc 3960
aggccagcag agaacttgaa tatgatgttc agaaggaaag acagagacag gtcacttagg 4020
gaggcttgaa ggaggccact tttgagatga gcccgtggta tctgcaaaaa agcctggaag 4080
aactcagaac atgcagcaga tggctcatgt ctgaagtttg aggcacaggg atctggtgtg 4140
gtcacagcat cagagagaag ggtcctggca tgatggggac tggtgtgcag ttggatactg 4200
gtattctgcc ttagttctgc ctcttgagag gtggtccagt agaagccagc ctcagacttt 4260
cacatctcag aacagtcttt tcaaagacaa ggtctcagtg tggctcagac gggcctctag 4320
catcactcgg tctcctgagt gctgggatca caggtgtgtg ctactacacc cagcttccca 4380
gagcagtctt accacagccc ctaagcaggg gaggagagga aacggagcca tccaagatct 4440
acctcctgtg ggcatccctc ctgcctggct gaaggagaag tctgggttta aaatccccat 4500
tgctcagatt tgtatcctgg agggaagtga ctcccacagg aatgaactga ctgtcccagg 4560
aaattcttcc cgctgtgcct ttagaacttc ctctgtaaag tacctccctt cagctggtgg 4620
tgcctgtctt taacagtggc tgacagccag ggagtttgag gctagcctag gctttgacag 4680
tgagatcctg ttcaataaac gcagcttccc agtccggcac ttgaccttca agctctgacc 4740
tctggattag cccaggattt cttcactggt cctccacctt ccaccccctt ccactgctta 4800
tacccgctcc catcatttcc aacccaggaa gctgctaaga tctatgtggt agccctggct 4860
ccattaccac cctctcccca tctcctgggt gactgaggga actaaggtac aagcccgagg 4920
aacttgggat tccctgccct gctgttacct tgcctcctgt ctgccatcat taacatagga 4980
ggtgccagcc tgtgccgtcc tggctcccat actcactacc taaggctacc tgttgggaat 5040
tccaaccctc accagtccca tctcttcatt ctattaaaat tacttatcaa gcaaaaaaaa 5100
aaaaaaaaaa aaaaaaaaaa aa 5122
<210> 40
<211> 810
<212> PRT
<213> 小鼠(Mouse)
<400> 40
Met Gly Arg Leu Cys Thr Lys Phe Leu Thr Ser Val Gly Cys Leu Ile
1 5 10 15
Leu Leu Leu Val Thr Gly Ser Gly Ser Ile Lys Val Leu Gly Glu Pro
20 25 30
Thr Cys Phe Ser Asp Tyr Ile Arg Thr Ser Thr Cys Glu Trp Phe Leu
35 40 45
Asp Ser Ala Val Asp Cys Ser Ser Gln Leu Cys Leu His Tyr Arg Leu
50 55 60
Met Phe Phe Glu Phe Ser Glu Asn Leu Thr Cys Ile Pro Arg Asn Ser
65 70 75 80
Ala Ser Thr Val Cys Val Cys His Met Glu Met Asn Arg Pro Val Gln
85 90 95
Ser Asp Arg Tyr Gln Met Glu Leu Trp Ala Glu His Arg Gln Leu Trp
100 105 110
Gln Gly Ser Phe Ser Pro Ser Gly Asn Val Lys Pro Leu Ala Pro Asp
115 120 125
Asn Leu Thr Leu His Thr Asn Val Ser Asp Glu Trp Leu Leu Thr Trp
130 135 140
Asn Asn Leu Tyr Pro Ser Asn Asn Leu Leu Tyr Lys Asp Leu Ile Ser
145 150 155 160
Met Val Asn Ile Ser Arg Glu Asp Asn Pro Ala Glu Phe Ile Val Tyr
165 170 175
Asn Val Thr Tyr Lys Glu Pro Arg Leu Ser Phe Pro Ile Asn Ile Leu
180 185 190
Met Ser Gly Val Tyr Tyr Thr Ala Arg Val Arg Val Arg Ser Gln Ile
195 200 205
Leu Thr Gly Thr Trp Ser Glu Trp Ser Pro Ser Ile Thr Trp Tyr Asn
210 215 220
His Phe Gln Leu Pro Leu Ile Gln Arg Leu Pro Leu Gly Val Thr Ile
225 230 235 240
Ser Cys Leu Cys Ile Pro Leu Phe Cys Leu Phe Cys Tyr Phe Ser Ile
245 250 255
Thr Lys Ile Lys Lys Ile Trp Trp Asp Gln Ile Pro Thr Pro Ala Arg
260 265 270
Ser Pro Leu Val Ala Ile Ile Ile Gln Asp Ala Gln Val Pro Leu Trp
275 280 285
Asp Lys Gln Thr Arg Ser Gln Glu Ser Thr Lys Tyr Pro His Trp Lys
290 295 300
Thr Cys Leu Asp Lys Leu Leu Pro Cys Leu Leu Lys His Arg Val Lys
305 310 315 320
Lys Lys Thr Asp Phe Pro Lys Ala Ala Pro Thr Lys Ser Leu Gln Ser
325 330 335
Pro Gly Lys Ala Gly Trp Cys Pro Met Glu Val Ser Arg Thr Val Leu
340 345 350
Trp Pro Glu Asn Val Ser Val Ser Val Val Arg Cys Met Glu Leu Phe
355 360 365
Glu Ala Pro Val Gln Asn Val Glu Glu Glu Glu Asp Glu Ile Val Lys
370 375 380
Glu Asp Leu Ser Met Ser Pro Glu Asn Ser Gly Gly Cys Gly Phe Gln
385 390 395 400
Glu Ser Gln Ala Asp Ile Met Ala Arg Leu Thr Glu Asn Leu Phe Ser
405 410 415
Asp Leu Leu Glu Ala Glu Asn Gly Gly Leu Gly Gln Ser Ala Leu Ala
420 425 430
Glu Ser Cys Ser Pro Leu Pro Ser Gly Ser Gly Gln Ala Ser Val Ser
435 440 445
Trp Ala Cys Leu Pro Met Gly Pro Ser Glu Glu Ala Thr Cys Gln Val
450 455 460
Thr Glu Gln Pro Ser His Pro Gly Pro Leu Ser Gly Ser Pro Ala Gln
465 470 475 480
Ser Ala Pro Thr Leu Ala Cys Thr Gln Val Pro Leu Val Leu Ala Asp
485 490 495
Asn Pro Ala Tyr Arg Ser Phe Ser Asp Cys Cys Ser Pro Ala Pro Asn
500 505 510
Pro Gly Glu Leu Ala Pro Glu Gln Gln Gln Ala Asp His Leu Glu Glu
515 520 525
Glu Glu Pro Pro Ser Pro Ala Asp Pro His Ser Ser Gly Pro Pro Met
530 535 540
Gln Pro Val Glu Ser Trp Glu Gln Ile Leu His Met Ser Val Leu Gln
545 550 555 560
His Gly Ala Ala Ala Gly Ser Thr Pro Ala Pro Ala Gly Gly Tyr Gln
565 570 575
Glu Phe Val Gln Ala Val Lys Gln Gly Ala Ala Gln Asp Pro Gly Val
580 585 590
Pro Gly Val Arg Pro Ser Gly Asp Pro Gly Tyr Lys Ala Phe Ser Ser
595 600 605
Leu Leu Ser Ser Asn Gly Ile Arg Gly Asp Thr Ala Ala Ala Gly Thr
610 615 620
Asp Asp Gly His Gly Gly Tyr Lys Pro Phe Gln Asn Pro Val Pro Asn
625 630 635 640
Gln Ser Pro Ser Ser Val Pro Leu Phe Thr Phe Gly Leu Asp Thr Glu
645 650 655
Leu Ser Pro Ser Pro Leu Asn Ser Asp Pro Pro Lys Ser Pro Pro Glu
660 665 670
Cys Leu Gly Leu Glu Leu Gly Leu Lys Gly Gly Asp Trp Val Lys Ala
675 680 685
Pro Pro Pro Ala Asp Gln Val Pro Lys Pro Phe Gly Asp Asp Leu Gly
690 695 700
Phe Gly Ile Val Tyr Ser Ser Leu Thr Cys His Leu Cys Gly His Leu
705 710 715 720
Lys Gln His His Ser Gln Glu Glu Gly Gly Gln Ser Pro Ile Val Ala
725 730 735
Ser Pro Gly Cys Gly Cys Cys Tyr Asp Asp Arg Ser Pro Ser Leu Gly
740 745 750
Ser Leu Ser Gly Ala Leu Glu Ser Cys Pro Glu Gly Ile Pro Pro Glu
755 760 765
Ala Asn Leu Met Ser Ala Pro Lys Thr Pro Ser Asn Leu Ser Gly Glu
770 775 780
Gly Lys Gly Pro Gly His Ser Pro Val Pro Ser Gln Thr Thr Glu Val
785 790 795 800
Pro Val Gly Ala Leu Gly Ile Ala Val Ser
805 810
<210> 41
<211> 3710
<212> DNA/RNA
<213> 人(human)
<400> 41
gggtctccgc gcccaggaaa gccccgcgcg gcgcgggcca gggaagggcc acccaggggt 60
cccccacttc ccgcttgggc gcccggacgg cgaatggagc aggggcgcgc agataattaa 120
agatttacac acagctggaa gaaatcatag agaagccggg cgtggtggct catgcctata 180
atcccagcac ttttggaggc tgaggcgggc agatcacttg agatcaggag ttcgagacca 240
gcctggtgcc ttggcatctc ccaatggggt ggctttgctc tgggctcctg ttccctgtga 300
gctgcctggt cctgctgcag gtggcaagct ctgggaacat gaaggtcttg caggagccca 360
cctgcgtctc cgactacatg agcatctcta cttgcgagtg gaagatgaat ggtcccacca 420
attgcagcac cgagctccgc ctgttgtacc agctggtttt tctgctctcc gaagcccaca 480
cgtgtatccc tgagaacaac ggaggcgcgg ggtgcgtgtg ccacctgctc atggatgacg 540
tggtcagtgc ggataactat acactggacc tgtgggctgg gcagcagctg ctgtggaagg 600
gctccttcaa gcccagcgag catgtgaaac ccagggcccc aggaaacctg acagttcaca 660
ccaatgtctc cgacactctg ctgctgacct ggagcaaccc gtatccccct gacaattacc 720
tgtataatca tctcacctat gcagtcaaca tttggagtga aaacgacccg gcagatttca 780
gaatctataa cgtgacctac ctagaaccct ccctccgcat cgcagccagc accctgaagt 840
ctgggatttc ctacagggca cgggtgaggg cctgggctca gtgctataac accacctgga 900
gtgagtggag ccccagcacc aagtggcaca actcctacag ggagcccttc gagcagcacc 960
tcctgctggg cgtcagcgtt tcctgcattg tcatcctggc cgtctgcctg ttgtgctatg 1020
tcagcatcac caagattaag aaagaatggt gggatcagat tcccaaccca gcccgcagcc 1080
gcctcgtggc tataataatc caggatgctc aggggtcaca gtgggagaag cggtcccgag 1140
gccaggaacc agccaagtgc ccacactgga agaattgtct taccaagctc ttgccctgtt 1200
ttctggagca caacatgaaa agggatgaag atcctcacaa ggctgccaaa gagatgcctt 1260
tccagggctc tggaaaatca gcatggtgcc cagtggagat cagcaagaca gtcctctggc 1320
cagagagcat cagcgtggtg cgatgtgtgg agttgtttga ggccccggtg gagtgtgagg 1380
aggaggagga ggtagaggaa gaaaaaggga gcttctgtgc atcgcctgag agcagcaggg 1440
atgacttcca ggagggaagg gagggcattg tggcccggct aacagagagc ctgttcctgg 1500
acctgctcgg agaggagaat gggggctttt gccagcagga catgggggag tcatgccttc 1560
ttccaccttc gggaagtacg agtgctcaca tgccctggga tgagttccca agtgcagggc 1620
ccaaggaggc acctccctgg ggcaaggagc agcctctcca cctggagcca agtcctcctg 1680
ccagcccgac ccagagtcca gacaacctga cttgcacaga gacgcccctc gtcatcgcag 1740
gcaaccctgc ttaccgcagc ttcagcaact ccctgagcca gtcaccgtgt cccagagagc 1800
tgggtccaga cccactgctg gccagacacc tggaggaagt agaacccgag atgccctgtg 1860
tcccccagct ctctgagcca accactgtgc cccaacctga gccagaaacc tgggagcaga 1920
tcctccgccg aaatgtcctc cagcatgggg cagctgcagc ccccgtctcg gcccccacca 1980
gtggctatca ggagtttgta catgcggtgg agcagggtgg cacccaggcc agtgcggtgg 2040
tgggcttggg tcccccagga gaggctggtt acaaggcctt ctcaagcctg cttgccagca 2100
gtgctgtgtc cccagagaaa tgtgggtttg gggctagcag tggggaagag gggtataagc 2160
ctttccaaga cctcattcct ggctgccctg gggaccctgc cccagtccct gtccccttgt 2220
tcacctttgg actggacagg gagccacctc gcagtccgca gagctcacat ctcccaagca 2280
gctccccaga gcacctgggt ctggagccgg gggaaaaggt agaggacatg ccaaagcccc 2340
cacttcccca ggagcaggcc acagaccccc ttgtggacag cctgggcagt ggcattgtct 2400
actcagccct tacctgccac ctgtgcggcc acctgaaaca gtgtcatggc caggaggatg 2460
gtggccagac ccctgtcatg gccagtcctt gctgtggctg ctgctgtgga gacaggtcct 2520
cgccccctac aacccccctg agggccccag acccctctcc aggtggggtt ccactggagg 2580
ccagtctgtg tccggcctcc ctggcaccct cgggcatctc agagaagagt aaatcctcat 2640
catccttcca tcctgcccct ggcaatgctc agagctcaag ccagaccccc aaaatcgtga 2700
actttgtctc cgtgggaccc acatacatga gggtctctta ggtgcatgtc ctcttgttgc 2760
tgagtctgca gatgaggact agggcttatc catgcctggg aaatgccacc tcctggaagg 2820
cagccaggct ggcagatttc caaaagactt gaagaaccat ggtatgaagg tgattggccc 2880
cactgacgtt ggcctaacac tgggctgcag agactggacc ccgcccagca ttgggctggg 2940
ctcgccacat cccatgagag tagagggcac tgggtcgccg tgccccacgg caggcccctg 3000
caggaaaact gaggcccttg ggcacctcga cttgtgaacg agttgttggc tgctccctcc 3060
acagcttctg cagcagactg tccctgttgt aactgcccaa ggcatgtttt gcccaccaga 3120
tcatggccca cgtggaggcc cacctgcctc tgtctcactg aactagaagc cgagcctaga 3180
aactaacaca gccatcaagg gaatgacttg ggcggccttg ggaaatcgat gagaaattga 3240
acttcaggga gggtggtcat tgcctagagg tgctcattca tttaacagag cttccttagg 3300
ttgatgctgg aggcagaatc ccggctgtca aggggtgttc agttaagggg agcaacagag 3360
gacatgaaaa attgctatga ctaaagcagg gacaatttgc tgccaaacac ccatgcccag 3420
ctgtatggct gggggctcct cgtatgcatg gaacccccag aataaatatg ctcagccacc 3480
ctgtgggccg ggcaatccag acagcaggca taaggcacca gttaccctgc atgttggccc 3540
agacctcagg tgctagggaa ggcgggaacc ttgggttgag taatgctcgt ctgtgtgttt 3600
tagtttcatc acctgttatc tgtgtttgct gaggagagtg gaacagaagg ggtggagttt 3660
tgtataaata aagtttcttt gtctctttaa aaaaaaaaaa aaaaaaaaaa 3710
<210> 42
<211> 825
<212> PRT
<213> 人(human)
<400> 42
Met Gly Trp Leu Cys Ser Gly Leu Leu Phe Pro Val Ser Cys Leu Val
1 5 10 15
Leu Leu Gln Val Ala Ser Ser Gly Asn Met Lys Val Leu Gln Glu Pro
20 25 30
Thr Cys Val Ser Asp Tyr Met Ser Ile Ser Thr Cys Glu Trp Lys Met
35 40 45
Asn Gly Pro Thr Asn Cys Ser Thr Glu Leu Arg Leu Leu Tyr Gln Leu
50 55 60
Val Phe Leu Leu Ser Glu Ala His Thr Cys Ile Pro Glu Asn Asn Gly
65 70 75 80
Gly Ala Gly Cys Val Cys His Leu Leu Met Asp Asp Val Val Ser Ala
85 90 95
Asp Asn Tyr Thr Leu Asp Leu Trp Ala Gly Gln Gln Leu Leu Trp Lys
100 105 110
Gly Ser Phe Lys Pro Ser Glu His Val Lys Pro Arg Ala Pro Gly Asn
115 120 125
Leu Thr Val His Thr Asn Val Ser Asp Thr Leu Leu Leu Thr Trp Ser
130 135 140
Asn Pro Tyr Pro Pro Asp Asn Tyr Leu Tyr Asn His Leu Thr Tyr Ala
145 150 155 160
Val Asn Ile Trp Ser Glu Asn Asp Pro Ala Asp Phe Arg Ile Tyr Asn
165 170 175
Val Thr Tyr Leu Glu Pro Ser Leu Arg Ile Ala Ala Ser Thr Leu Lys
180 185 190
Ser Gly Ile Ser Tyr Arg Ala Arg Val Arg Ala Trp Ala Gln Cys Tyr
195 200 205
Asn Thr Thr Trp Ser Glu Trp Ser Pro Ser Thr Lys Trp His Asn Ser
210 215 220
Tyr Arg Glu Pro Phe Glu Gln His Leu Leu Leu Gly Val Ser Val Ser
225 230 235 240
Cys Ile Val Ile Leu Ala Val Cys Leu Leu Cys Tyr Val Ser Ile Thr
245 250 255
Lys Ile Lys Lys Glu Trp Trp Asp Gln Ile Pro Asn Pro Ala Arg Ser
260 265 270
Arg Leu Val Ala Ile Ile Ile Gln Asp Ala Gln Gly Ser Gln Trp Glu
275 280 285
Lys Arg Ser Arg Gly Gln Glu Pro Ala Lys Cys Pro His Trp Lys Asn
290 295 300
Cys Leu Thr Lys Leu Leu Pro Cys Phe Leu Glu His Asn Met Lys Arg
305 310 315 320
Asp Glu Asp Pro His Lys Ala Ala Lys Glu Met Pro Phe Gln Gly Ser
325 330 335
Gly Lys Ser Ala Trp Cys Pro Val Glu Ile Ser Lys Thr Val Leu Trp
340 345 350
Pro Glu Ser Ile Ser Val Val Arg Cys Val Glu Leu Phe Glu Ala Pro
355 360 365
Val Glu Cys Glu Glu Glu Glu Glu Val Glu Glu Glu Lys Gly Ser Phe
370 375 380
Cys Ala Ser Pro Glu Ser Ser Arg Asp Asp Phe Gln Glu Gly Arg Glu
385 390 395 400
Gly Ile Val Ala Arg Leu Thr Glu Ser Leu Phe Leu Asp Leu Leu Gly
405 410 415
Glu Glu Asn Gly Gly Phe Cys Gln Gln Asp Met Gly Glu Ser Cys Leu
420 425 430
Leu Pro Pro Ser Gly Ser Thr Ser Ala His Met Pro Trp Asp Glu Phe
435 440 445
Pro Ser Ala Gly Pro Lys Glu Ala Pro Pro Trp Gly Lys Glu Gln Pro
450 455 460
Leu His Leu Glu Pro Ser Pro Pro Ala Ser Pro Thr Gln Ser Pro Asp
465 470 475 480
Asn Leu Thr Cys Thr Glu Thr Pro Leu Val Ile Ala Gly Asn Pro Ala
485 490 495
Tyr Arg Ser Phe Ser Asn Ser Leu Ser Gln Ser Pro Cys Pro Arg Glu
500 505 510
Leu Gly Pro Asp Pro Leu Leu Ala Arg His Leu Glu Glu Val Glu Pro
515 520 525
Glu Met Pro Cys Val Pro Gln Leu Ser Glu Pro Thr Thr Val Pro Gln
530 535 540
Pro Glu Pro Glu Thr Trp Glu Gln Ile Leu Arg Arg Asn Val Leu Gln
545 550 555 560
His Gly Ala Ala Ala Ala Pro Val Ser Ala Pro Thr Ser Gly Tyr Gln
565 570 575
Glu Phe Val His Ala Val Glu Gln Gly Gly Thr Gln Ala Ser Ala Val
580 585 590
Val Gly Leu Gly Pro Pro Gly Glu Ala Gly Tyr Lys Ala Phe Ser Ser
595 600 605
Leu Leu Ala Ser Ser Ala Val Ser Pro Glu Lys Cys Gly Phe Gly Ala
610 615 620
Ser Ser Gly Glu Glu Gly Tyr Lys Pro Phe Gln Asp Leu Ile Pro Gly
625 630 635 640
Cys Pro Gly Asp Pro Ala Pro Val Pro Val Pro Leu Phe Thr Phe Gly
645 650 655
Leu Asp Arg Glu Pro Pro Arg Ser Pro Gln Ser Ser His Leu Pro Ser
660 665 670
Ser Ser Pro Glu His Leu Gly Leu Glu Pro Gly Glu Lys Val Glu Asp
675 680 685
Met Pro Lys Pro Pro Leu Pro Gln Glu Gln Ala Thr Asp Pro Leu Val
690 695 700
Asp Ser Leu Gly Ser Gly Ile Val Tyr Ser Ala Leu Thr Cys His Leu
705 710 715 720
Cys Gly His Leu Lys Gln Cys His Gly Gln Glu Asp Gly Gly Gln Thr
725 730 735
Pro Val Met Ala Ser Pro Cys Cys Gly Cys Cys Cys Gly Asp Arg Ser
740 745 750
Ser Pro Pro Thr Thr Pro Leu Arg Ala Pro Asp Pro Ser Pro Gly Gly
755 760 765
Val Pro Leu Glu Ala Ser Leu Cys Pro Ala Ser Leu Ala Pro Ser Gly
770 775 780
Ile Ser Glu Lys Ser Lys Ser Ser Ser Ser Phe His Pro Ala Pro Gly
785 790 795 800
Asn Ala Gln Ser Ser Ser Gln Thr Pro Lys Ile Val Asn Phe Val Ser
805 810 815
Val Gly Pro Thr Tyr Met Arg Val Ser
820 825
<210> 43
<211> 5119
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 43
cttctcgcag gaaagccccg cgcggcgcgt ggagcctgaa ctcgcaggtt ctggctggac 60
ttctcgaagc tgaggagaag cagagggacc tggcttctga ttttggatct gcgtgcttgc 120
tggttctggc gcctgctggt cttgttcctg taacctagga ctcggggctt gcacatgctt 180
tttttttgaa gttgctggag agggagccca ggaccttgtg caggcacctt ttgtgtcccc 240
aatggggcgg ctttgcacca agttcctgac ctctgtgggc tgtctgattt tgctgttggt 300
gactggatct gggagcatca aggtcctgca ggagcccacc tgcgtctccg actacatgag 360
catctctact tgcgagtgga agatgaatgg tcccaccaat tgcagcaccg agctccgcct 420
gttgtaccag ctggtttttc tgctctccga agcccacacg tgtatccctg agaacaacgg 480
aggcgcgggg tgcgtgtgcc acctgctcat ggatgacgtg gtcagtgcgg ataactatac 540
actggacctg tgggctgggc agcagctgct gtggaagggc tccttcaagc ccagcgagca 600
tgtgaaaccc agggccccag gaaacctgac agttcacacc aatgtctccg acactctgct 660
gctgacctgg agcaacccgt atccccctga caattacctg tataatcatc tcacctatgc 720
agtcaacatt tggagtgaaa acgacccggc agatttcaga atctataacg tgacctacct 780
agaaccctcc ctccgcatcg cagccagcac cctgaagtct gggatttcct acagggcacg 840
ggtgagggcc tgggctcagt gctataacac cacctggagt gagtggagcc ctagcatcac 900
gtggtacaac cacttccagc tgcccctgat acagcgcctt ccactggggg tcaccatctc 960
ctgcctctgc atcccgttgt tttgcctgtt ctgttacttc agcattacca agattaagaa 1020
gatatggtgg gaccagattc ccaccccagc acgcagtccc ttggtggcca tcatcattca 1080
ggatgcacag gtgcccctct gggataagca gacccgaagc caggagtcaa ccaagtaccc 1140
gcactggaaa acttgtctag acaagctgct gccttgcttg ctgaagcaca gagtaaagaa 1200
gaagacagac ttcccgaagg ctgccccaac caagtctctc cagagtcctg gaaaggcagg 1260
ctggtgtccc atggaggtca gcaggaccgt cctctggcca gagaatgtta gtgtcagtgt 1320
ggtgcgctgt atggagctgt ttgaggcccc agtacagaat gtggaggagg aagaagatga 1380
gatagtcaaa gaggacctga gcatgtcacc tgagaacagc ggaggctgcg gcttccagga 1440
gagccaggca gacatcatgg ctcggctcac tgagaacctg ttttccgact tgttggaggc 1500
tgagaatggg ggccttggcc agtcagcctt ggcagagtca tgctcccctc tgccttcagg 1560
aagtgggcag gcttctgtat cctgggcctg cctccccatg gggcccagtg aggaggccac 1620
atgccaggtc acagagcagc cttcacaccc aggccctctt tcaggcagcc cagcccagag 1680
tgcacctact ctggcttgca cgcaggtccc acttgtcctt gcagacaatc ctgcctaccg 1740
gagttttagt gactgctgta gcccggcccc aaatcctgga gagctggctc cagagcagca 1800
gcaggctgat catctggaag aagaggagcc tccaagcccg gctgaccccc attcttcagg 1860
gccaccaatg cagccagtgg agagctggga gcagatcctt cacatgagtg tcctgcagca 1920
tggggcagct gctggctcca ccccagcccc tgccggtggc taccaggagt ttgtgcaggc 1980
agtgaagcag ggtgccgccc aggatcctgg ggtgcctggt gtcaggcctt ctggagaccc 2040
cggttacaag gccttctcga gcctgctcag cagcaatggc atccgcgggg acacagcagc 2100
agcggggact gacgatgggc atggaggcta caagcccttc cagaatcctg ttcctaacca 2160
gtcccctagc tccgtgccct tatttacttt cggactagac acggagctgt cacccagtcc 2220
tctgaactca gacccaccca aaagcccccc agaatgcctt ggtctggagc tggggctcaa 2280
aggaggtgac tgggtgaagg cccctcctcc tgcagatcag gtgcccaagc cctttgggga 2340
tgacctgggc tttggtattg tgtactcgtc cctcacttgc cacttgtgtg gccacctgaa 2400
gcaacaccac agccaggagg aaggtggcca gagccccatc gttgctagcc ctggctgtgg 2460
ctgctgctac gatgacagat caccatccct ggggagcctc tcgggggcct tggaaagctg 2520
tcctgaggga ataccaccag aagccaacct catgtcagca cccaagacac cctcaaactt 2580
gtcaggggag ggcaagggcc ctggtcactc tcctgttccc agccagacga ccgaggtgcc 2640
tgtgggcgcc ctgggcattg ctgtttctta ggtgagtgag tgtgctgttg ttgctgaggt 2700
ctgtgctgag gccagggttc ctccaagcca gggaagtact tcctgggaga cagcccagct 2760
ggcaggtttc ccagaaatcc agagaatggt gaattgaaga tgtaaacttg gcctgaccct 2820
ggacgctcgg agcctggctg tctcctcttc cactggcctg ggctctcctc cctcccaagg 2880
gatacagggg ctcactgtgc ttggtcccac agcagtgctg acgttcctaa gtcctgggct 2940
ttcctagctg atgttgtcct acctactcag tcccattttg tccaccgaat agacctgtca 3000
ctcaaggctc tcagcggtcc tgccatagct gctggacgct cccagctgga agctgggcct 3060
agaaactcac agatggcctg gcagtggcat gggaggccct aaaaattagt ggaaattttg 3120
agagaggaca ggtattgccc cacagaggcc attcattgaa cagccaggac tgggactaga 3180
ggcagagcct gctgtcctcc gctcagttgt agaaagcaac aaggacacaa acttgattgc 3240
ccaaagtcac tgccagttac ccacatatga ccagaagcca gggctcctgg gatgtggaag 3300
ataaacaaac acagttgccg ggtggcaggg cccagcgggc acgataactg gcagtcaagg 3360
cgatacctcg agggaactgt ggggctggtc ctggttggtg gtcaggtggt agggatagca 3420
gatggcagac tttggtgagt gagtgagtct gactgtgttc tggaagatgg gaccgggctc 3480
agcactgtct gctcacgtcc ccactgttgc aacacctagt ctgtttgcaa ggaggacagg 3540
acaggtcaca tggagcttta tgtcaataaa gtctttatct tgtcaggttt cctttactat 3600
acacacgccg agcccacagt gcacgaaagc tgaaatgtgc aggcaggggg ttggggaagt 3660
ggggagacaa ggccccagca gttggtttaa gggaatgact tgggaatggg gcagagctgt 3720
ggctactcca tctctcatcc ttaccctcct gctaccacag cttgtgccca tgtgtgcctg 3780
ctcaggggag gggtcctcct ctttccctct cctttaggca gagtgctaga ggtgttggat 3840
gctccttagc acgcagaggg cgtgacactg gctgctaagt gttgttgaat gtgtcaaggc 3900
attgacatca gtaggcccca catcttaggc aggggatttg gggtgtggca acctgccagg 3960
ccagcagaga acttgaatat gatgttcaga aggaaagaca gagacaggtc acttagggag 4020
gcttgaagga ggccactttt gagatgagcc cgtggtatct gcaaaaaagc ctggaagaac 4080
tcagaacatg cagcagatgg ctcatgtctg aagtttgagg cacagggatc tggtgtggtc 4140
acagcatcag agagaagggt cctggcatga tggggactgg tgtgcagttg gatactggta 4200
ttctgcctta gttctgcctc ttgagaggtg gtccagtaga agccagcctc agactttcac 4260
atctcagaac agtcttttca aagacaaggt ctcagtgtgg ctcagacggg cctctagcat 4320
cactcggtct cctgagtgct gggatcacag gtgtgtgcta ctacacccag cttcccagag 4380
cagtcttacc acagccccta agcaggggag gagaggaaac ggagccatcc aagatctacc 4440
tcctgtgggc atccctcctg cctggctgaa ggagaagtct gggtttaaaa tccccattgc 4500
tcagatttgt atcctggagg gaagtgactc ccacaggaat gaactgactg tcccaggaaa 4560
ttcttcccgc tgtgccttta gaacttcctc tgtaaagtac ctcccttcag ctggtggtgc 4620
ctgtctttaa cagtggctga cagccaggga gtttgaggct agcctaggct ttgacagtga 4680
gatcctgttc aataaacgca gcttcccagt ccggcacttg accttcaagc tctgacctct 4740
ggattagccc aggatttctt cactggtcct ccaccttcca cccccttcca ctgcttatac 4800
ccgctcccat catttccaac ccaggaagct gctaagatct atgtggtagc cctggctcca 4860
ttaccaccct ctccccatct cctgggtgac tgagggaact aaggtacaag cccgaggaac 4920
ttgggattcc ctgccctgct gttaccttgc ctcctgtctg ccatcattaa cataggaggt 4980
gccagcctgt gccgtcctgg ctcccatact cactacctaa ggctacctgt tgggaattcc 5040
aaccctcacc agtcccatct cttcattcta ttaaaattac ttatcaagca aaaaaaaaaa 5100
aaaaaaaaaa aaaaaaaaa 5119
<210> 44
<211> 809
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 44
Met Gly Arg Leu Cys Thr Lys Phe Leu Thr Ser Val Gly Cys Leu Ile
1 5 10 15
Leu Leu Leu Val Thr Gly Ser Gly Ser Ile Lys Val Leu Gln Glu Pro
20 25 30
Thr Cys Val Ser Asp Tyr Met Ser Ile Ser Thr Cys Glu Trp Lys Met
35 40 45
Asn Gly Pro Thr Asn Cys Ser Thr Glu Leu Arg Leu Leu Tyr Gln Leu
50 55 60
Val Phe Leu Leu Ser Glu Ala His Thr Cys Ile Pro Glu Asn Asn Gly
65 70 75 80
Gly Ala Gly Cys Val Cys His Leu Leu Met Asp Asp Val Val Ser Ala
85 90 95
Asp Asn Tyr Thr Leu Asp Leu Trp Ala Gly Gln Gln Leu Leu Trp Lys
100 105 110
Gly Ser Phe Lys Pro Ser Glu His Val Lys Pro Arg Ala Pro Gly Asn
115 120 125
Leu Thr Val His Thr Asn Val Ser Asp Thr Leu Leu Leu Thr Trp Ser
130 135 140
Asn Pro Tyr Pro Pro Asp Asn Tyr Leu Tyr Asn His Leu Thr Tyr Ala
145 150 155 160
Val Asn Ile Trp Ser Glu Asn Asp Pro Ala Asp Phe Arg Ile Tyr Asn
165 170 175
Val Thr Tyr Leu Glu Pro Ser Leu Arg Ile Ala Ala Ser Thr Leu Lys
180 185 190
Ser Gly Ile Ser Tyr Arg Ala Arg Val Arg Ala Trp Ala Gln Cys Tyr
195 200 205
Asn Thr Thr Trp Ser Glu Trp Ser Pro Ser Ile Thr Trp Tyr Asn His
210 215 220
Phe Gln Leu Pro Leu Ile Gln Arg Leu Pro Leu Gly Val Thr Ile Ser
225 230 235 240
Cys Leu Cys Ile Pro Leu Phe Cys Leu Phe Cys Tyr Phe Ser Ile Thr
245 250 255
Lys Ile Lys Lys Ile Trp Trp Asp Gln Ile Pro Thr Pro Ala Arg Ser
260 265 270
Pro Leu Val Ala Ile Ile Ile Gln Asp Ala Gln Val Pro Leu Trp Asp
275 280 285
Lys Gln Thr Arg Ser Gln Glu Ser Thr Lys Tyr Pro His Trp Lys Thr
290 295 300
Cys Leu Asp Lys Leu Leu Pro Cys Leu Leu Lys His Arg Val Lys Lys
305 310 315 320
Lys Thr Asp Phe Pro Lys Ala Ala Pro Thr Lys Ser Leu Gln Ser Pro
325 330 335
Gly Lys Ala Gly Trp Cys Pro Met Glu Val Ser Arg Thr Val Leu Trp
340 345 350
Pro Glu Asn Val Ser Val Ser Val Val Arg Cys Met Glu Leu Phe Glu
355 360 365
Ala Pro Val Gln Asn Val Glu Glu Glu Glu Asp Glu Ile Val Lys Glu
370 375 380
Asp Leu Ser Met Ser Pro Glu Asn Ser Gly Gly Cys Gly Phe Gln Glu
385 390 395 400
Ser Gln Ala Asp Ile Met Ala Arg Leu Thr Glu Asn Leu Phe Ser Asp
405 410 415
Leu Leu Glu Ala Glu Asn Gly Gly Leu Gly Gln Ser Ala Leu Ala Glu
420 425 430
Ser Cys Ser Pro Leu Pro Ser Gly Ser Gly Gln Ala Ser Val Ser Trp
435 440 445
Ala Cys Leu Pro Met Gly Pro Ser Glu Glu Ala Thr Cys Gln Val Thr
450 455 460
Glu Gln Pro Ser His Pro Gly Pro Leu Ser Gly Ser Pro Ala Gln Ser
465 470 475 480
Ala Pro Thr Leu Ala Cys Thr Gln Val Pro Leu Val Leu Ala Asp Asn
485 490 495
Pro Ala Tyr Arg Ser Phe Ser Asp Cys Cys Ser Pro Ala Pro Asn Pro
500 505 510
Gly Glu Leu Ala Pro Glu Gln Gln Gln Ala Asp His Leu Glu Glu Glu
515 520 525
Glu Pro Pro Ser Pro Ala Asp Pro His Ser Ser Gly Pro Pro Met Gln
530 535 540
Pro Val Glu Ser Trp Glu Gln Ile Leu His Met Ser Val Leu Gln His
545 550 555 560
Gly Ala Ala Ala Gly Ser Thr Pro Ala Pro Ala Gly Gly Tyr Gln Glu
565 570 575
Phe Val Gln Ala Val Lys Gln Gly Ala Ala Gln Asp Pro Gly Val Pro
580 585 590
Gly Val Arg Pro Ser Gly Asp Pro Gly Tyr Lys Ala Phe Ser Ser Leu
595 600 605
Leu Ser Ser Asn Gly Ile Arg Gly Asp Thr Ala Ala Ala Gly Thr Asp
610 615 620
Asp Gly His Gly Gly Tyr Lys Pro Phe Gln Asn Pro Val Pro Asn Gln
625 630 635 640
Ser Pro Ser Ser Val Pro Leu Phe Thr Phe Gly Leu Asp Thr Glu Leu
645 650 655
Ser Pro Ser Pro Leu Asn Ser Asp Pro Pro Lys Ser Pro Pro Glu Cys
660 665 670
Leu Gly Leu Glu Leu Gly Leu Lys Gly Gly Asp Trp Val Lys Ala Pro
675 680 685
Pro Pro Ala Asp Gln Val Pro Lys Pro Phe Gly Asp Asp Leu Gly Phe
690 695 700
Gly Ile Val Tyr Ser Ser Leu Thr Cys His Leu Cys Gly His Leu Lys
705 710 715 720
Gln His His Ser Gln Glu Glu Gly Gly Gln Ser Pro Ile Val Ala Ser
725 730 735
Pro Gly Cys Gly Cys Cys Tyr Asp Asp Arg Ser Pro Ser Leu Gly Ser
740 745 750
Leu Ser Gly Ala Leu Glu Ser Cys Pro Glu Gly Ile Pro Pro Glu Ala
755 760 765
Asn Leu Met Ser Ala Pro Lys Thr Pro Ser Asn Leu Ser Gly Glu Gly
770 775 780
Lys Gly Pro Gly His Ser Pro Val Pro Ser Gln Thr Thr Glu Val Pro
785 790 795 800
Val Gly Ala Leu Gly Ile Ala Val Ser
805
<210> 45
<211> 4264
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
gaggagattt ccacccagct ttcccccacc acactgctgc ccccacctcc ctgtaccaga 60
catggattga gtccttataa ctatgtagca agtgcttttc ccactgagca tctcctcagc 120
tcctccctgt gttgctttct tacacatttg tagagagtta caggcagggt actggccctg 180
gtactggttc tcaggtcact cctggcatct ccatttcctt agagacttgc tcatatctag 240
gcttcaggca tgtgggacac aatagagacc aaggacatcc ctcagcacgg gaccccttgt 300
gactccttca ccagcagtct tgggcctcct gcctaccctc atggcccaag cacccaattc 360
taacatatga ttttaagagc agtgtgtaca gagtctttta acattcccct gttgcaggtg 420
cctggacatg attctgttag ctaggctgct ctgaggagct ggaggtacgt ggccccgggt 480
ggagctggtg tggtctgggc tgttgaggga agtgatggta cctggcctca ttcctcttgt 540
aggaatgact ccagccacag agtgtggagg gtggcccagt ccacatcagc agcccaagac 600
atcttgcagc tccagaatga gttttcaaaa ctgagcctat taaagaccct tgatggatgt 660
cattccctat aggagggggt ctttactact gtgtccacac ctgggggtca gaggacccct 720
aaaatggaat ggaaaacaaa gtgtctgcct tgctcacgag ggcttggctt gtacccatgc 780
tcacatgagt ctgtgaccct tctgacagta aggatttggg cttctggaag tcaggggctc 840
caccatgaga acaaattcaa atcccagggc cacctataca gctgtgcaac ctccggcaag 900
tcactcaacc tccctgtgcc tttgtccctt catctgaaaa tgagggaact gactgtacct 960
ccatgataaa gctgggttaa gtggtgggaa gggacagagg gagagatgat cagaagaaaa 1020
cttagcatgg cgttaatagc agtgctagtg aggattgcca gagggcagag gtcctccggg 1080
acatcaggcc accagagtgt tctccaagag atgcacaggt tccacttggg cgatgtcacc 1140
ccctggtcct ggggctcgga ttctgttaat aggaccatga agaccactgt tcctaaacaa 1200
ttgctctgcc atcagccacc tcttcctccc tccctccctc cctcccccct ccctcccttc 1260
ttcttctctc tctctctctc tctctctctc tctctctctc tctctttctt agtctagaat 1320
agagtttatt aagggcatgg ggaaggaagc taagaaggta gtagaggcag agagagagag 1380
aagagagaag tagaggggta gaggcaggcc atgagcacat gaagagagag ggggaaggga 1440
atggggagag gggaaggggt gaggggacag agtgggagca agaaggcaag aaaccaagag 1500
agaaacaaga gggcaagagg ctcgaagccc tttcttggcc ttcccacagc ttagccaggc 1560
ttcagtgcgt cacacaggct gttgacattt gaagttgaca ggtacaaggg ttattttcat 1620
ggctcatttt atttcattgt taggttctgg ctggacttct cgaagctgag gagaagcaga 1680
gggacctggc ttctgatttt ggatctgcgt gcttgctggt tctggcgcct gctggtcttg 1740
ttcctgtaac ctaggactcg gggcttgcac atgctttttt tttgaagttg ctggagaggg 1800
agcccaggac cttgtgcagg tgagccaggt atcctgacac tgcaggattg ttcatggcat 1860
gagacactgg tggctggaac tggatgcgtg tatgactggg tgtccacctt gggcattact 1920
tcctctctgc agctctgccg ggcccagcct gacagacagg tccacgaagc agaaggaggc 1980
agaactccag aggctgaaga acccagctgt agactcacag ctgctcggag gcaaaatggg 2040
tctgggactg acccatttag atacagcctc cagataatga ggggagcggg ggactgagga 2100
ctgacccatt gcaggggggt cactgaggac tgacccattg ctgcaggggg ggggtactgg 2160
ggtctgaccc attgctgcag gggtcactgg ggattgtccc actgctgcgg gtggggcact 2220
ggggactgac ccattgcttt gggaaggcac ttgggactga cccactgctg ttcatagagt 2280
agcacacagc tccccatttg cagggcttct ctctctccca tcctccctcc caatttcttt 2340
tctttgcttt gatcctcttc ctcccgaatg ctgggggttg gaacccagga cctggaacat 2400
accaggcaag cctactgaat ttgtgtgttc atttaagctt ccagaacctc taagatgggg 2460
ctgtcagtgg atggccactt agcagacagg gaaactgagg ccctgggtac agcttgctca 2520
ggttcacagc tggtatggga gggagccagg atttgaactt gagaaagtta tgaatgtatg 2580
ccacagctct cctgggacag gcgaatagag gtatgctcgc gtgctctgtg tgcagagggc 2640
acagagacat gggggaggga ggccatgaca caaatgaaat ggaccccgct gacccaggat 2700
cagcatctgc ccactcttct ttctgcaggc accttttgtg tccccaatgg ggcggctttg 2760
caccaagttc ctgacctctg tgggctgtct gattttgctg ttggtgactg gatctggtaa 2820
gtcactcatt cattcatcaa ccactaatga catgtcaagg tcctgcagtc ctcacggaat 2880
agaacaaagc tcttgtgggg attggggggg aggggggagg aagcagccga tgacaaatca 2940
ccatgactaa gttattttca ttgacactaa ttcaaattgg aaattggggc tgtccgggaa 3000
ttgagtagaa aataatttga gttatatgcc aaaggttatc aaaagatggt gggaaaacgc 3060
agctcaggac tgagtaaggg aggcttgggg gaggggtgga gagggagagg gcattgcact 3120
ttaaagcagg gtgcacaggg acactggtgt caacttagag gaaggcaggg gagggcacac 3180
agtgtctgtg gtgtgtcttt ggtgaggccc ccagggaggg cctgcctggc atgggttggg 3240
aggacgtgtc gcagggtcat tgagtcagaa gaccttgcag agtctgatca gaggaattga 3300
gtgaaggcca gggtcgctca gtgatctgga aagagagttt ctagatcaat ctagaaggtc 3360
agcatgaaga cacgtgggaa ttgacctgaa ggtttctcat ccatgtggcc aggtgtggct 3420
tacacctgtc agcctagcac ttgggagact gaggcaggag gattgtgagt ttgagcccag 3480
cctgggctac aagttactgt aaaaaaacaa aacaaaagaa aaaaacaaaa aaaaaaaaaa 3540
ccaaatggac acacaaattc taccccaagc ccagacaagg gtggattatt ctgtatgacg 3600
ggaaaaccca gggtagctgt tgaaggagag ggttcaggag gttagaattt tgtttgctgt 3660
atgaaaactt cctgcatggt ggaccacacc cgctggcatg tgtattgtga ctttgtctgg 3720
acagtggcca tgtagggctt gggtcaaaaa gctcttgagg gtcccacact cactggctgt 3780
tacacacaca cacacacaca cacacacaca cacacatact cacacacaca ccacatctga 3840
attcctggca gggagctgat gggtaagtgt ctgtcccctc ctccttccct tccctctttc 3900
ctgctcttcc attggctaag cctcttgggt accaaagggt cagagcctga gcctgagccg 3960
tacagattgc agagtcaatc tcttgcctca gtggagaagg gaggtaggga aggagatgtg 4020
ggagtggggg gcgggatggg gggtggggcg cggtggacaa cactgtagga cactgcccct 4080
tcctccctgt gctttaacgt ggtgcttctg agggagagtg gcacctaggt aggtgtgtgc 4140
gtgtgcaggc atgtgtgtca tgatcctgat gcactagcct ccctctgacc ttagtggtgg 4200
gagcccctga ccatgccacc actgatctgg ccgttctgtc tctgcaggga gcatcaaggt 4260
cctg 4264
<210> 46
<211> 4525
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
tgcgcagtag cacgcatgcg taatcctgat ggagcaatta ggagaagccg gtggccggct 60
agcctgtgca gactgtgaaa acagagcatc tgaagctgtg tgaaaggcta gctcgcctgt 120
gctcctcaga tcctgacata cgccatctcg agcaaaagat taacaatcga ttaaaaccca 180
cacatgaaaa caaagaaacc agttagctcc agataaaagc aaatgccagg aaggaaagga 240
ggcagagggc aggggtggag gagcaggtgg gagaggatga cgtcagagaa atctcagtgg 300
ccgtgaacaa ggaagatatt ccagggcttg ttctgaatgt gtgatctttt aaaccatgtg 360
gccctcttag cctgtgagaa aagtccattt ctagccctgc tgaacagaga agcccagggg 420
agcaaccaac tggccttcgg tcactcagca aggacctagt agaggctggc tttgaacttg 480
agccctccag ggcacttgac ctctgagctt tgggaaaaca agcgaggcag cttcacgctg 540
ttgtgatctg gacttggatc agggccagtg aggacaggga cagggatggg tgtgataagg 600
acttggtgtg taagagggag agttggggag acaggtggga gggctatctg tagccaggta 660
accaagggtc ccaggggaac ccccagtgtg gacgcggact gcacatgaca cagggcggcc 720
tccccattca tgactgtttt tctccttgca gacttccagc tgcccctgat acagcgcctt 780
ccactggggg tcaccatctc ctgcctctgc atcccgttgt tttgcctgtt ctgttacttc 840
agcattacca agtgagttcc tgctttggct ggtgtctctg gctggccctt cagcagtgct 900
ctcagaggtc acagtcattg tgctggctga gaaaaggctg gaagtctgcc tcgaagggca 960
gggcagggca gcctgtggct ggaggcttct ccacagtggc tgtgctctgg aataaagaga 1020
gctaggttgg gggacagtaa tggtggctgc tctggagaga aggagctggc ttggggctag 1080
ggaggggttg tttggggcat agagaagatg ggagctctgt ccctctcaat gcccatggta 1140
tggtcccggc actgggcatg tggtaggagc agaggaattt gagcagatgc tgtgaatata 1200
gtagggtttg agtgagaccc ggaagtggcg cttgctggca ggtagctggt cagctacctg 1260
ggctcctctg tgggctcaga gtgaccatga gaacaagacc tccagaggag tctgggcaga 1320
gccggtagag ggggaagatt cacttctggt gagttctacc ttggagtctc agacccagag 1380
ccatgttctt ttagaagtga gattagaagt cacttcgaat tagggctgtg caggtacccg 1440
gtacccgccg cctggctaag tgcagggagt gccagagcct ctcctctccg tggcttgcca 1500
ctcataacct cgtcagtcac ccggggctag gcactgctgt tctgatgcag agtttctctg 1560
tgtcctgttg cccttccctt ctcccacgtg atgcccctgc accccgcagc ccgcagttct 1620
caaaggcaca tggcacgttc ttccatagag tcttagccat gcccccaccc taaacgttct 1680
gccccttcac ttttctgggc tgttccctgc aacccccaac tctgcttctc tctcctacct 1740
tcctctctta tacattgtgg tcttcttgtt tgtcttttta attgttttga aacccagggt 1800
cttacacatg ccaccctatc tctgagctcc actctagcct cctgcttact tttgcttgga 1860
gacagggtct tgccaagtta cctaggctgg tctccaactc tcctcagctc aggaaggtct 1920
ggcactttga ctcttcctgc cctgtctcct gagtggcagg gatgatttcc ggtcaccatc 1980
cctggctgtg gtttttgctc atcagcactt atggtggtga atgagtgtca tgtgatcatg 2040
cctgcatttg cttcttgttt ctcttgaagg cgacccacag gggcttctcc actggctgtt 2100
tttctggctt agtccctgtg gccctagtac cttgatgctc agaaaatact atgggaagac 2160
ggaagagtga aagtcatagg ggccagttag cccaggaaga aaggaaatgc ccgcttccac 2220
acggcccctg acctctcaag cctgttaaag ccagcatggt caaaagggac ttttgaggga 2280
gcgggatcct tgctgtatag cttgaggctt tggtagtgtg gataggtcaa gcagccctgc 2340
cagcatcagg ctctccctgg gcacctctcc caattcagaa tggtagtggt gatggacagt 2400
taggaccaag attgttccat atccaaaatg ggatcagtgt ggccttcgtg ccctgggagg 2460
agtgacggcc aggacacttg gaagagcacc ttggccactg tacattcgga gaccaaccta 2520
cttcctttcc accctcagga ttaagaagat atggtgggac cagattccca ccccagcacg 2580
cagtcccttg gtggccatca tcattcagga tgcacaggta agagggtaca ggcgttgcat 2640
agtgtgactc ccagccatgg gtagggtggg tgggtgcgag gagcaaacgg ccaggggtaa 2700
gcagggtggt gcacgggtgg taacaaagcc catgcccaca tctgtgtggg cttggtatta 2760
ttcctgccat gttctgctag tcacagtgaa gtcctgtgtc cagatcagag agtccaagat 2820
ggcaccggca agctggagca tctgagggca tttgctatct ctgatgccct ttcactggtg 2880
tggggggcag ggagggcaga ggctgagact cccagagctc tgtggggcct gtgtggatct 2940
cagctctcta ggcatggttg ctgtctgtga aaacactgag ccttctgtga ctgggttgtg 3000
ctggcacccc ccacccccac tgattggctg tctattttag gtgcccctct gggataagca 3060
gacccgaagc caggagtcaa ccaagtaccc gtatgtatct gaacttgaac ttgggtcata 3120
gtttttgtgg gtttgtgtga gaatgtgata gttactcggc tggtggcaat caattcccct 3180
tccttgcccc ccccccccac acacaattgc cttctctctt cctggcccca aggggggaga 3240
agggggcaat catgggtggc tgagtctcca ttctgcagca agaacaggct aagtgttgat 3300
tttaagagtc agaaccacat ctataacacc ccaatatcaa tacagggtga ttccgtgtgg 3360
gattctaaag gatgaatagt tttttaaatg tggcaaaact taaccctcag ctttacctct 3420
gcaggcactg gaaaacttgt ctagacaagc tgctgccttg cttgctgaag cacagagtaa 3480
agaagaagac agacttcccg aaggctgccc caaccaagtc tctccagagt cctggaaagg 3540
caggctggtg tcccatggag gtcagcagga ccgtcctctg gccagagaat gttagtgtca 3600
gtgtggtgcg ctgtatggag ctgtttgagg ccccagtaca gaatgtggag gaggaagaag 3660
atgagatagt caaagaggac ctgagcatgt cacctgagaa cagcggaggc tgcggcttcc 3720
aggagagcca ggcagacatc atggctcggc tcactgagaa cctgttttcc gacttgttgg 3780
aggctgagaa tgggggcctt ggccagtcag ccttggcaga gtcatgctcc cctctgcctt 3840
caggaagtgg gcaggcttct gtatcctggg cctgcctccc catggggccc agtgaggagg 3900
ccacatgcca ggtcacagag cagccttcac acccaggccc tctttcaggc agcccagccc 3960
agagtgcacc tactctggct tgcacgcagg tcccacttgt ccttgcagac aatcctgcct 4020
accggagttt tagtgactgc tgtagcccgg ccccaaatcc tggagagctg gctccagagc 4080
agcagcaggc tgatcatctg gaagaagagg agcctccaag cccggctgac ccccattctt 4140
cagggccacc aatgcagcca gtggagagct gggagcagat ccttcacatg agtgtcctgc 4200
agcatggggc agctgctggc tccaccccag cccctgccgg tggctaccag gagtttgtgc 4260
aggcagtgaa gcagggtgcc gcccaggatc ctggggtgcc tggtgtcagg ccttctggag 4320
accccggtta caaggccttc tcgagcctgc tcagcagcaa tggcatccgc ggggacacag 4380
cagcagcggg gactgacgat gggcatggag gctacaagcc cttccagaat cctgttccta 4440
accagtcccc tagctccgtg cccttattta ctttcggact agacacggag ctgtcaccca 4500
gtcctctgaa ctcagaccca cccaa 4525
<210> 47
<211> 10537
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
caggagccca cctgcgtctc cgactacatg agcatctcta cttgcgagtg gaagatgaat 60
ggtcccacca attgcagcac cgagctccgc ctgttgtacc agctggtttt tctgctctcc 120
gagtaagcct gcgctggagc tggaggtttg gggaggttgt gcccaaaggg tttgccccaa 180
gagtgagctg ggtccaggtg gtgcgctgga gtgcaggatg ctgagtatgg tttgctgctg 240
tttatatggt gttagagggg aggtcccatc tccagggaca tgttatgtaa gatacagtgg 300
agcgcatggt gggagtgttg gtccacgtgg cacatggata cggctggaat actggactag 360
accagcagtt ctcacacttt ttggtctcag gacccttttt cacacttaaa aatgagtgag 420
gacccaaagg gctttggtgt aggtaacaca tcattctatg tttacctaat tagaacttgc 480
aatgaagaaa tggtgtaatt tttaaaaaat taaaacaatt aaaaattttt tttcttactg 540
aaatggaggt ctcactgtgt tgcccaggct gctctcaaac tcctgggctc cagtgatcct 600
cctgcctccg cctcccaaag tgctgggatt acaagcgtga gccgctgtat ccggcccaaa 660
atggagaaat tttaagtccc aacaacatgc aagcccgcat tcaacaaatc ttcagatcaa 720
ttacatgatc acaggtcatg tagcctctag aaaattccac tgtacgccag tgagagagag 780
tgaaaaggca aataacgtcc ctgtattatg atgaaaagag ttttacctgg tgggcccaga 840
ccacactttg agaaccactg gactagaccc ttgattgagg agtacggtgt tgagagtgga 900
gtcctctgtg atggtggatg gaccaggaca catggcatag gagtcaggtg gttccctggg 960
ctactccatg gtgcacagga tgcttcgtta cactggtgcc caggacataa tcacgtacac 1020
aagacacaca gttacggggc agactgggga tatacggcac accagcatgc agcgttcacc 1080
agtaaaggtg gtattccatg attattctaa ggtagatggg ctgtgctttg tttccattgg 1140
cttagtccag ggattggcaa actatggccc gtgagccaaa tccggcccac tgcttgtttt 1200
tgtaaataaa gttttattgg aacacactgg ctgctgtagt tgtaacagaa actgcatggc 1260
cctcctttat gttttttgtt tgtttgtttg tttgtttgtt ttctttgaga cagagtttcg 1320
ctcttgttgc ccaggctgga gtgcagtggc acaatctcgg ctcactgcaa cctctgcctc 1380
ccgggttcaa gcgattctcc tgtctcagcc tcccgagtag ttgggattaa tggtgcctgc 1440
caccacaccc ggctaatttt tcgtattttt agtagagacc ggttttcatc atgttggcca 1500
agctggtctc gaactcctga actcaggtga tccacccgcc tcagcgtccc aaagtgctgg 1560
gattacaggc atgagccact gagcccggcc tcctccttta tcttaattga aataattcag 1620
aaatggaaag tcaaatactg catgttctca cttataagta agagttaaat aatgtgtaca 1680
catgggcatt attccatgta ccatggaata acagacattg aagacttggg agggtgggag 1740
aggggtgaag gaagagaagt tacttaatgg gcatagtgta caccatttgg gtgacggacc 1800
caccagaacc ccagacttca ccactaggca gcatatccag tgagaacaga tctgaggctt 1860
gccatcaaaa ttgcacttgt aaggccgggc actgtggtgg ctcgcggctg taatcccagc 1920
cctttgggag gccgaggtgg gcagatcact tgaggtcagg agttcgagac cggcctggcc 1980
aacatggtga agctccatct ctactaaaaa tacaacaatt aactgggtgt agtggcgcac 2040
acctgtaatc ccagctacta gggaggctga ggcgggagaa ttgcttgagc ccaggaggtg 2100
gaggttgcag tgagccgaga tcacatcact gtactctagc ctgggtgaca gtgagacttt 2160
gtctcaggaa aaaaaaacaa aaacaaaaaa caaaaaactc gtacccccta aatttataca 2220
aataaccaaa aaaaaaaaaa aaaaaggaaa ttgtgtggcc tttgaagtcc aaaatattaa 2280
ctatctggcc tgttacagaa aaagtttgca gacccctggc ctagcccgtg agatgtgggt 2340
tggctgttaa ggtggaacat tggaattatc ttacgatggc caaactgtgc gatgcagagc 2400
ttatgttgtt ctaaattaat tagtgccacc ggttcttccc tttcatgggc tttcaggaac 2460
aagctaagtc ccaggaccag ggccggcagc taggcaggtg tgaggagcat ccttggtgca 2520
tgtggtaaga ggctgtggcc agcaagagag gcaaccctag tcggctgccc cagcacaccc 2580
tggccgctcc caagccccca gatctgtcct cacatccgtg atcgggaagc tggaagagtc 2640
tgatgcggtt cctggaggca tgtcccggac acagctgtgg ggcccagcca gcctacaggt 2700
gaccagccta acccagcccc tgtgtctgca gagcccacac gtgtatccct gagaacaacg 2760
gaggcgcggg gtgcgtgtgc cacctgctca tggatgacgt ggtcagtgcg gataactata 2820
cactggacct gtgggctggg cagcagctgc tgtggaaggg ctccttcaag cccagcgagc 2880
atggtgagca gggcggagtg cggcaggggt ggctgggtgt gttcccacag ctgcctgggc 2940
tgagggtggg gtgggcaggg gaggaggtgg ggtcatagca acagcaggag gaagccgcct 3000
gtattttccc aaatctgatg ggattcctgc ccctgcctgg gcctcagtcc tcccaccttt 3060
gaaacggagc tggtcgcagt agaccaccaa gcccccttca gcccagctgt ttccacccct 3120
gaacttaagt gcccaggaag gcgtattgag atgaggtgtg cttgctggaa ggcatgcctg 3180
ctgctgattg aaaaccgaac tgggaacatt ccttccattc tgtgtccact ggtcagctgc 3240
tgcggctttg gatggtcttg accgtggaag gctgaccttc ttctggtacc cggagtccct 3300
gcaggaatcc cccttgagct tgctgggctg tggtgacagg agtttaaaac atgcgttgta 3360
ttccagtgat gcatgatatg acatgcatca caggaataaa aacctgaggt ctcatggata 3420
tgattgcttc aaaggagacc aagttttaaa acagatgaat caaaataaag aaaaatactc 3480
agtaaatcat cataaagtac agagatgtgg ccaaaggtgt gaaggatgca gctgtaaaag 3540
ctgaagtttg aggccgggtg tggtggttca tgcctataat cccagcactt tgggaggccg 3600
agcccagcgg atcaccggag gtcaggagtt cgagaccagc ctggacaaca tggtaaaacc 3660
ccgtctctac taaaaataca aaaaattagt ctggcatggt ggcaggcgcc tgtaatccca 3720
gctacttggg aggctgaggt aggagaatgg cttgaaccca ggagaaggag gttgcagtga 3780
gcttagatca tgctactgcc ctccagcctg ggcgacagag tgagattacg tctcaaaaaa 3840
ataaaaataa ataaaaataa aaagattttt taaaaggctg aagtttgggt tactttggct 3900
catacacttt gccttcactg tagaaaggtg gttagtaaag accaggcgcg gtggctcatg 3960
cctggaatcc cagcactttg ggagcccagc gcaggcagat cacttgagcc ctgggctatt 4020
gaggctgcag tgagctggga ttgtgccact gcactccagc ctgggcaaca gagtgggacc 4080
ctgtctcaaa aaagaagaaa aaaagggtaa ttaataaaca ctaaagttct atgtagaatt 4140
ttagcaacat tattgttatt ataatcttct ttgctatggc tctgaatctg tgtggtgctc 4200
cagaagtatg ctatggaggt tttgtcgacc aaaaatctgg gtggtggctg tggtttgtag 4260
gccggggctg ggctgggtga tgggggagtc actgcataga tcctcacata gaggccgctt 4320
ctcccgcagt gaaacccagg gccccaggaa acctgacagt tcacaccaat gtctccgaca 4380
ctctgctgct gacctggagc aacccgtatc cccctgacaa ttacctgtat aatcatctca 4440
cctatgcagt caacatttgg agtgaaaacg acccggcaga tgtgagtggg catgctttga 4500
cgtttttctg tgacctctgg ggaacagggt gggtgaccag cagaggccca gtccctggag 4560
ccaggagcct gggaggcaag ccctggggct ggatagcaaa tcccaggagc tagagacctg 4620
gcttctcacc tggctctgca ctaggcaagt ccctttgctt cctggccccc cacccctcac 4680
atcagagaag gggagttatc tctgcatgcc gctcctcctc tgtaaaggta gggctgtggg 4740
ccacatctgt gtttcccagt ttgggggaca caagtgatcg taggtggcac attgacagct 4800
cacttgaata accctattat tgaagagaat aatactgact caagagacag tgacccgtgt 4860
cagttccctt ttgaggccaa cgggttaagg aggaagtccc catacagctg actcgtttac 4920
taattcctct taatgaagag agcagaggcc acaccccagg cttagacttt cccaagaaaa 4980
caagatcagt ttgttggttg ttccccatgg aagctggtcc tgacattccc ttcacagtag 5040
tgttggtgga gtttttgttg ttgtttgttt tgagacagag tctcactctg tcacccaggg 5100
tggaacacag tggcgtgatc ttggctcact gcaacctccg cctcctgggt tctagcgatt 5160
ctcctgcctc agcctcctga gcagccggga ctacaggcac ctgccaccgt gcccagctaa 5220
tttttgtata tttagtagag atggggtttc actgcgttgg ccaggctggt ctcaaactcc 5280
tgacctcaga tgatccactc gccttggcct cccaaagtgc tgggattaca ggtgtgagcc 5340
accgcacctg gccagtggag ttccttctta agtacatgta ttgacatctt taaaaagggc 5400
gagaggattt acaggaaact atcaggtcag taatggcagg ggccgtccac agtgggtggc 5460
tgagtccccc tatttttctg ctggtgtgca gggaggtcat ttcctgccac ccatgtttcc 5520
ccaccctgaa tccaccttcc tcacattccc attggaggga caatctctgg acatatggga 5580
cctggggtcc cacagggctg caatccaatg cctgctgtgc cactcgccag ctgtgtgatg 5640
ttgggcatat cccataacct ctttgtgcct cagtttcctc atctgtaaca caggagtgac 5700
aagagcaccc gcccacaggg ctatgacagt acaaggtgtg tgatacagat gagctcccct 5760
gtttggccca catgtgtcct aaaagccatg tgccctttct cttgagtgcc ccaggccaca 5820
gagatcccca tctgcccgct gtcccacaca ctggtctgtc atttgttcct tgaggtttgt 5880
gagggccggc tctgtgcatc ccaggggccc aggctgggcc tggttggctc tcagggagca 5940
ggcacccgcc accttaagct cccatgctgg tgtctgtcac tgcttcctct caatctggcc 6000
aagccagggg tgtcgattta tatctctcag gtctggtttc ccctttggca ctgggccagg 6060
tatggggaaa gagcaggaat ggggcagttg gctcacacag cagaggctca gaaagcgggg 6120
ggcatggggg gaaggagtgc acagatgcta gagagtgggg caagttttgt ttggtcaata 6180
aatctccttc tcatgcccca ggcctgtgca agacctacag agagtcccaa ggatgggctg 6240
gggggaagag aaaggtacca ccttcagagt ccaaagatat gttatttaat attttcatat 6300
ttctagatct gccttcaggc atggctggat ccagcttcta ggaacctgtc cagctctgcg 6360
ccctgcttta ttctgtactg gcttcgtttt taggcaggct cttccctcat gtagtggcag 6420
atatgcctac tagttgctcc aggcctacat cccaaagcca cagtgggaaa agggtttttt 6480
ttcttgacgg ttctaataag agtcctaagg ctgctgctca gtggcctggc ttcgatgctg 6540
tgccagcctc tgaaccaatc actggctgtg ggtggagaga gggtgctggt ggagggccct 6600
gcttgtccag ggaggagtca catacctgcc tctagggctg caggtgggct cagctccatc 6660
caaaccagat gaactgaaaa taaggcagga gtggcttccc caggggaaac tggggaagag 6720
gaagcaggac tgtgctggct aaaatgccag ccaggtttaa gacgtggcac cagatgccag 6780
tcatgggatt ggattggtca gcatgcctgg gctatggctt aggggtatgt tggtgctcag 6840
ggatgccaca ggcctccaga taccaggtct gaggcagaag aatgaagtcc agcttctctt 6900
gtgggtggaa cagtggcaac tgagataccc catctctccc ttcccaagaa cagagctgaa 6960
cataaagaat ttagtgattg gccagagctt ggccacatgc tcccctctga tgaatgatag 7020
gccaggtgat gggattggca caattggctt agactaatga gggttggccc tggagttgca 7080
ggcagtggag ttctgtccta agcagtgggc acctaaaccc gatggcataa aagctgggcg 7140
ggtgtccacc tgcatctgcc acagcactat aggcaccaac tgtggctcat actgagtggg 7200
ataaattcca gaaagaaaca ttaggaactt actatagaat tttggggcta gagctactca 7260
ttcattcccc tagataattt ctaggcaagg ttccatagtg gagggggagt tttggcttgg 7320
gcattgaagg atgcatagga gttttctaga tggggaaaga agggaacggt agaccaggca 7380
gagggaactg catgataaaa ggtttatggg tgtgaaaatt catggaatgt ttgaggatta 7440
tggggttggg ggatgtggga atatgtgtag cgataaagca ccaaacaaag ccaaaagttt 7500
agttagagcc ctgaatgcct gcctcataat ggtttccata ttttatatgc ctactatgtg 7560
ccaggcacat tgctcagggt cacacagctg gaaatggcag ggctgagttt ttgttgttgt 7620
tgttgttgtt gagacagagt ctcactctat cacccaggct ggaatgcagg ggcgtgatca 7680
tggctcactg catccttgac ttcctgggat caggtgattc tcccacctct gcctcccagg 7740
tagctgggac tacaggcaca ggccaccacg ccaggctaat tttttgtatt tttagtagcg 7800
acagggtctc gccatgttgt ccgggctggt ctggatctcc tggcttcaag tgatccccct 7860
ggctcagcct cccaaggtgc tgggattaca ggcttgagcc accgcatcca gcccagatct 7920
gagatttgca cccagtattt gaactcccaa gcctgtgctc tttttcctcc catggacatt 7980
tctctcagag atggtctccc aaacacctgt ccttcttgtt aaaaaacaga caaaccgcaa 8040
gtagttcttt ggaagctcag atttctcttt tgtttcttag taaaacattt cccagttccc 8100
agctcccttc cagggtgtaa gatttcttcg gtaacttaca tctagctgtt gcttcttgtt 8160
tgctcatgtt tagaaagaaa gacaaaagag agtgagaatt ttctctccct tccccagtct 8220
ccccacaact cacaccccac cctcagctcc ctctgtaata ggaaaatctc tgaactctct 8280
gtagttgctc cagcaatctt ttggaacttt gcttctttct tgtgaaaaaa cctccccttg 8340
gctcactttg caccaggttt ccccaaatgt gcttccaacc acaagcagaa atggagctgc 8400
cagtaaccag gaagaaactg ccgggggctg aggaagagga gagggaggtg catagccctg 8460
gatctcgcag ggagaggggt gacaggatga gaactcaggt tgctcacttg ccatcagggt 8520
cagtcatgaa tatagcgttc atgtatcact ttttaaagct tttttggagg gtaaaagtaa 8580
tagttacaca aaataaaaat acaaatggta caaaaggact tagaatggaa acatgtttct 8640
ctcccgactc cagcctcctg tttttcttcc cagagactga ccactgctgt ctgtctcttg 8700
ccagaaggga aagggaggca aggttagggc aggcagaggg catgtgcatc ctttagagag 8760
agcttatgtc tatacaagca aatgtgtgtg ttcagtcatc gctgtcttag ttttctattg 8820
ctgcataata atggtactac cagcttcaca gctttaaaca acacccattt attatctcat 8880
agtttctgtg gttgggagtc tggacatagc ttagccaggt tctctgcttt agagtctcgt 8940
gaggctataa tcaaggtgtg ggatggggct gcagtttcat ctgaggctca attggggaag 9000
ggtcacttct aagctcatac aatattggtg acattcagtc cctggcaggc tgttgaactg 9060
agagcctcag tttcgtgctg gctgttggtt gtagttaacc ctgaattcct tcccatgtgc 9120
cctttgcaaa gccatcaagg cagagagact tgcctagcaa gtaggatatt acagtcttct 9180
gtaatataat cacatccatg aaatcctcta tatatcccat cacctttacc atattctgtg 9240
ggttagaaac aagtagcagg tcctgcccac actcgagaag accagatgac acaaagatgt 9300
gattcaaagt ggggatcatc ggggccatct taggtttgtc tgcagtgatc actgtgccat 9360
ctctctctct ctcttttttt tttttttttt ttccgagacg aagtcgtcac tctgtcaccc 9420
aggctggagt gcagtggcat gatctcagct taccacaatc tctgcctccc aggttcaaat 9480
gattcttctg cctcagcctc ctgagtagct gggattacag gtgcccgcca ccacacccag 9540
ctaatttttg tatttttagt agagacagag tttcaccatg ttggccaggc tggtcttgaa 9600
ctcctcacct caagtgatcc acccacttcg gcctcccaaa gtgctgggat tacaggcatg 9660
agccaccatg cccagcccca tctctcttta aaaaacaaac aaacaaacaa aaaacataaa 9720
aagaagcaga gaacacatac acatctgcat cttcccttgt ttacttaaca atagatcttg 9780
gaagtcactt ctcagtagag gctaggttgg gcagagcatt ggattctagg ccagtgagtt 9840
tggacttgac catggagaca ctaggaagcc catgaaggac agagagagat gcctcgaccc 9900
tgccagtcct ttagaaagat cacccagtgc tttttgtata ccaaacccta tttgaaatac 9960
ttacgtatat taacccattt ccttatcacc acaaccctgc gggaagggag ataggcactt 10020
ttattatctt cattttgcag atgaggacat tgaggtccag agaggttatg tcacttactt 10080
aaggtcacac agccaggaag tggtagtagg gactcttacc cttgttttac agatgagatt 10140
gaattatctc acgaaaactc agaaaggtta aacaacttgc ctaagtaaca tacagctaat 10200
tagtcgagga gcctgacgca tgttgctgta gcctggtcac agttacagag gtggcaagca 10260
atggcctgaa caggacgaac aaccaaatac ccaggctggt ggctcttaaa catggtgggg 10320
tcagctaacg acagcaacca gggtgggcac tggtgcccct cgcccccggc tggtgcccta 10380
acatctccct tttctctacc agttcagaat ctataacgtg acctacctag aaccctccct 10440
ccgcatcgca gccagcaccc tgaagtctgg gatttcctac agggcacggg tgagggcctg 10500
ggctcagtgc tataacacca cctggagtga gtggagc 10537
<210> 48
<211> 183
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
cctccctctg accttagtgg tgggagcccc tgaccatgcc accactgatc tggccgttct 60
gtctctgcag ggagcatcaa ggtcctgcag gagcccacct gcgtctccga ctacatgagc 120
atctctactt gcgagtggaa gatgaatggt cccaccaatt gcagcaccga gctccgcctg 180
ttg 183
<210> 49
<211> 183
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
cagcaccctg aagtctggga tttcctacag ggcacgggtg agggcctggg ctcagtgcta 60
taacaccacc tggagtgagt ggagccctag catcacgtgg tacaaccgtg agtatcaggg 120
tcgtaggctg tgaggatctc tacagccgtg tatattctct gttcagaaat tccctctggc 180
tga 183
<210> 50
<211> 87
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
aggcccggag tttaaatccc cagagcccac gtaaaagcct gatatcgaat tccgaagttc 60
ctattctcta gaaagtatag gaacttc 87
<210> 51
<211> 183
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
gaagttccta ttctctagaa agtataggaa cttcatcagt caggtacata atggtggatc 60
caagctttgc gcagtagcac gcatgcgtaa tcctgatgga gcaattagga gaagccggtg 120
gccggctagc ctgtgcagac tgtgaaaaca gagcatctga agctgtgtga aaggctagct 180
cgc 183
<210> 52
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
cgcattgtct gagtaggtgt c 21
<210> 53
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
gctgttcaat gaatggcctc tgtg 24
<210> 54
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
gtggccaccg tttctgggaa c 21
<210> 55
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
tcaacaatct aagcacggac ct 22
<210> 56
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
gtgctgaggc cagggttcct c 21
<210> 57
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
gctgttcaat gaatggcctc tgtg 24
<210> 58
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
gacacacgtg tctgccagct ctgt 24
<210> 59
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
cacggtcagc cagagggaat ttctg 25
<210> 60
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
gtggggtcag ctaacgacag caac 24
<210> 61
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
cgtgtcaaaa gcagaaacgc aggag 25
<210> 62
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
gcgtatgtca ggatctgagg agcac 25
<210> 63
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
gacaagcgtt agtaggcaca tatac 25
<210> 64
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
gctccaattt cccacaacat tagt 24
<210> 65
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
aacatagact ggcgttcacc tgg 23
<210> 66
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
tccgcacttc cacgtgtgag tgg 23
<210> 67
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
gtggttcctg gatagcgctg tgg 23
<210> 68
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
atccaggaac cactcacacg tgg 23
<210> 69
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
tatgttgtgc tgtatgcttg tgg 23
<210> 70
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
ctcagctctg cctacactac agg 23
<210> 71
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
agaacatcag cctgtagtgt agg 23
<210> 72
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
ctactatacg gcgcgtgtga ggg 23
<210> 73
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
gatgtcaggg gtctactata cgg 23
<210> 74
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
tatagtagac ccctgacatc agg 23
<210> 75
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
acgtgtgtcg gttcccagcc tgg 23
<210> 76
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
ctgacatcag gatgttgatc ggg 23
<210> 77
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
gttgatcggg aagctcagcc tgg 23
<210> 78
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
atgtgaccta caaggaaccc agg 23
<210> 79
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
agtctataat gtgacctaca agg 23
<210> 80
<211> 644
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 80
ttgttagcat ctcttgataa acttaattgt ctctcgtcac tgacggcaca gagctattga 60
tgggtctcac ctcccaactg cttccccctc tgttcttcct gctagcatgt gccggcaact 120
ttgtccacgg acacaagtgc gatatcacct tacaggagat catcaaaact ttgaacagcc 180
tcacagagca gaagactctg tgcaccgagt tgaccgtaac agacatcttt gctgcctcca 240
agaacacaac tgagaaggaa accttctgca gggctgcgac tgtgctccgg cagttctaca 300
gccaccatga gaaggacact cgctgcctgg gtgcgactgc acagcagttc cacaggcaca 360
agcagctgat ccgattcctg aaacggctcg acaggaacct ctggggcctg gcgggcttga 420
attcctgtcc tgtgaaggaa gccaaccaga gtacgttgga aaacttcttg gaaaggctaa 480
agacgatcat gagagagaaa tattcaaagt gttcgagctg atactgagcc accatgcttt 540
aacttatgaa tttttaatgg ttttattttt aatatttata tatttataat tcataaaata 600
aaatatttgt ataatgtaac agaaaaaaaa aaaaaaaaaa aaaa 644
<210> 81
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
gggagggtga gtggagtccc a 21
<210> 82
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
cagcgcaggc ttactcggag ag 22