CN113046390B

CN113046390B - Csf1r基因人源化的非人动物及其构建方法和应用

Info

Publication number: CN113046390B
Application number: CN202110255279.8A
Authority: CN
Inventors: 沈月雷; 郭朝设; 张美玲; 黄蕤; 白阳; 周小飞
Original assignee: Baccetus Beijing Pharmaceutical Technology Co ltd; Biocytogen Jiangsu Gene Biotechnology Co ltd
Current assignee: Baccetus Beijing Pharmaceutical Technology Co ltd; Biocytogen Jiangsu Gene Biotechnology Co ltd
Priority date: 2020-03-09
Filing date: 2021-03-09
Publication date: 2024-01-09
Anticipated expiration: 2041-03-09
Also published as: CN113046390A

Abstract

本发明提供了一种CSF1R基因人源化的非人动物，及其构建方法和在生物医药领域的应用，所述的构建方法包括利用同源重组的方式将人CSF1R基因的全部或部分核苷酸序列导入非人动物基因组中，使得该动物体内能正常表达人或人源化CSF1R蛋白，可以作为人CSF1R信号机理研究、肿瘤及免疫性疾病药物筛选的动物模型，对免疫靶点的新药研发具有重要的应用价值。本发明还提供了一种人源化CSF1R蛋白、人源化CSF1R基因、CSF1R基因的靶向载体。

Description

CSF1R基因人源化的非人动物及其构建方法和应用

技术领域

本发明属于动物基因工程和基因遗传修饰领域，具体地说，涉及一种CSF1R基因人源化的非人动物及其构建方法和在生物医药领域的应用。

背景技术

实验动物疾病模型对于研究人类疾病发生的病因、发病机制、开发防治技术和开发药物是不可缺少的研究工具。但由于动物与人类的生理结构和代谢系统本身的差异，传统的动物模型并不能很好的反映人体的真实状况，在动物体内建立更接近人类的生理特征的疾病模型是生物医药行业的迫切需求。

随着基因工程技术的不断发展和成熟，用人类基因替代或置换动物的同源性基因已经实现，通过这种方式开发人源化实验动物模型(humanized animal model)是动物模型未来的发展方向。其中基因人源化动物模型，即利用基因编辑技术，用人正常或突变基因替换动物基因组的同源基因，可建立更接近人类生理或疾病特征的正常或突变基因动物模型。基因人源化动物不但本身具有重要应用价值，如通过基因人源化可改进和提升细胞或组织移植人源化动物模型。更重要的是，由于人类基因片段的插入，动物体内可表达或部分表达人源化蛋白，可作为仅能识别人蛋白序列的药物的靶点，为在动物水平进行抗人抗体及其它药物的筛选提供了可能。但是，并不是任何基因或者替换任何基因的任何区域，都可以成功实现人源化动物模型的制备。在该领域，最重要的也是最具挑战性的是根据实际需求，对特定非人动物基因的特定序列，选择相应人源基因的特定区域进行插入或替换，从而获得可以表达人源化蛋白且具有抗体药效评价等功能的人源化动物模型。因此，由于动物与人类在生理学及病理学方面存在差异，加上基因(即遗传因子)的复杂性，如何能构建出“有效”的人源化动物模型用于新药研发仍是最大的挑战(Scheer N.et al.Drug DiscovToday；18(23-24):1200-11，2013)。

CSF1R(Colony Stimulating Factor 1Receptor)，又称CD115、C-FMS、FIM2，是一种单链酪氨酸激酶跨膜受体，属于Ⅲ型蛋白酪氨酸激酶受体家族(RTKⅢ)，由巨噬细胞、成纤维细胞、上皮细胞和肿瘤细胞产生，能调节巨噬细胞的形态和运动、促进单核吞噬细胞的增殖和分化，而且还是炎症病灶的趋化因子，在免疫应答中发挥重要作用。CSF1R主要被两种细胞因子CSF1或IL34激活，形成同源二聚体，导致其激酶活性的活化，进而激活包括MAPK/ERK在内的许多细胞内信号通路。当ERK磷酸化时，Elk1(ETS转录因子家族成员)与血清应答元件(SRF)形成复合物，导致大量有丝分裂诱导基因的表达。这种相互作用可以被许多癌症类型所利用以逃避免疫系统监控，例如弥漫型腱鞘膜巨细胞瘤(dt-GCT)，通过过度表达细胞因子CSF1，驱动肿瘤相关巨噬细胞(TAMs)的发育和存活，进而抑制肿瘤的局部免疫反应。目前已在乳腺癌、卵巢癌、鼻咽癌等多种恶性肿瘤中检测到CSF1R的异常表达。此外，CSF1R信号通路激活的巨噬细胞群还与炎症和骨病等多种疾病的病理学相关。Xu-MingDai等人研究发现CSF1R基因敲除可导致小鼠发生骨质疏松(Xu-Ming Dai etal.Blood.2002,99(1):111-120.)；X.Hu等人报道CSF1R在类风湿性关节炎的组织和细胞中高表达，可促进类风湿关节炎滑膜细胞(RA-FLS)增殖，抑制细胞凋亡并加速细胞周期(X.Hu.etal.Clinical&Experimental Immunology.2019,195(2):237-250.)。

鉴于CSF1R信号通路在免疫治疗领域具有巨大应用价值，为进一步的研究相关的生物学特性，提高临床前期的药效试验的有效性，提高研发成功率，使临床前期的试验更有效并使研发失败最小化，本领域急需开发涉及CSF1R信号通路的非人动物模型。此外，本方法得到的非人动物还可与其它基因人源化非人动物交配得到多基因人源化动物模型，用于筛选和评估针对该信号通路的人用药及联合用药的药效研究。本发明在学术和临床研究中具有广阔的应用前景。

发明内容

本发明的第一方面，提供了一种人源化CSF1R蛋白，所述的人源化CSF1R蛋白包含人CSF1R蛋白的全部或部分。

优选的，所述的人源化CSF1R蛋白的氨基酸序列中包括连续5-972个氨基酸序列与人CSF1R蛋白的氨基酸序列一致。

优选的，所述的人源化CSF1R蛋白的氨基酸序列中包括连续10-498个氨基酸序列与人CSF1R蛋白的氨基酸序列一致。

在本发明的一个具体实施方式中，所述的人源化CSF1R蛋白的氨基酸序列中包括连续至少20、至少50、至少80、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少450、至少498、至少500、至少550、至少600、至少650、至少700、至少750、至少800、至少850、至少900、至少950或至少972个氨基酸与人CSF1R蛋白的氨基酸序列一致。

优选的，所述的人CSF1R蛋白的全部或部分包含信号肽、跨膜区、胞质区和/或胞外区的全部或部分。进一步优选的，所述的人CSF1R蛋白的部分包含胞外区的全部或部分。

进一步优选的，所述的胞外区的部分氨基酸序列中包括连续5-498个氨基酸序列与人CSF1R蛋白胞外区的氨基酸序列一致。

在本发明的一个具体实施方式中，所述的胞外区的部分氨基酸序列中包括连续至少20、至少50、至少80、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少450或至少498个氨基酸与人CSF1R蛋白胞外区的氨基酸序列一致。

优选的，所述的人源化CSF1R蛋白还包含非人动物CSF1R蛋白的部分。所述非人动物CSF1R蛋白的部分包含非人动物CSF1R蛋白信号肽、跨膜区和/或胞质区。

在本发明的一个具体实施方式中，所述的人源化CSF1R蛋白包含胞外区、信号肽、跨膜区和胞质区，其中，所述的胞外区来源于人，所述的信号肽、跨膜区和胞质区来源于非人动物。

优选的，所述的人CSF1R蛋白的部分氨基酸序列或人源化CSF1R蛋白包含人CSF1R基因的1号外显子至22号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子编码的氨基酸序列的全部或部分。进一步优选包含人CSF1R基因的3号至11号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子编码的氨基酸序列的全部或部分。再进一步优选包含人CSF1R基因的3号外显子的部分、4号至10号外显子的全部和11号外显子的部分编码的氨基酸序列。

在本发明的一个具体实施方式中，所述的人CSF1R基因3号外显子的部分至少包括从编码胞外区的第一个核苷酸序列开始至3号外显子的最后一个核苷酸序列为止。

在本发明的一个具体实施方式中，所述的人CSF1R基因11号外显子的部分至少包括从11号外显子的第一个核苷酸序列开始至编码胞外区的最后一个核苷酸序列为止。

在本发明的一个具体实施方式中，所述的人源化CSF1R蛋白包含人CSF1R基因的3号外显子的部分、4号至10号外显子的全部和11号外显子的部分，以及非人动物CSF1R基因的1至2号外显子的全部、3号外显子的部分、11号外显子的部分和12至22号外显子的全部编码的氨基酸序列，优选还包括3-4号内含子和/或10-11号内含子的全部或部分。

在本发明的一个具体实施方式中，所述的人CSF1R蛋白的部分或者人源化CSF1R蛋白包含下列组中的一种：

A)SEQ ID NO：4或SEQ ID NO：4的第20-517位氨基酸序列的全部或部分；

B)与SEQ ID NO：4或SEQ ID NO：4的第20-517位氨基酸序列同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

C)与SEQ ID NO：4或SEQ ID NO：4的第20-517位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸；或

D)与SEQ ID NO：4或SEQ ID NO：4的第20-517位所示的，包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

在本发明的一个具体实施方式中，所述的人源化CSF1R蛋白的氨基酸序列包含下列组中的一种：

a)为SEQ ID NO：12氨基酸序列的全部或部分；

b)与SEQ ID NO：12氨基酸序列同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

c)与SEQ ID NO：12所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸；

d)与SEQ ID NO：12所示的，包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列；

e)所述人源化CSF1R蛋白中来源于人CSF1R蛋白的氨基酸序列为SEQ ID NO：4所示氨基酸序列的全部或部分；

f)所述人源化CSF1R蛋白中来源于人CSF1R蛋白的氨基酸序列与SEQ ID NO：4所示氨基酸序列同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

g)所述人源化CSF1R蛋白中来源于人CSF1R蛋白的氨基酸序列与SEQ ID NO：4所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸；

h)所述人源化CSF1R蛋白中来源于人CSF1R蛋白的氨基酸序列与SEQ ID NO：4所示的，包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列；

i)所述人源化CSF1R蛋白中来源于非人动物CSF1R蛋白的氨基酸序列为SEQ IDNO：2所示氨基酸序列的部分；

j)所述人源化CSF1R蛋白中来源于非人动物CSF1R蛋白的氨基酸序列与SEQ IDNO：2所示氨基酸序列同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

k)所述人源化CSF1R蛋白中来源于非人动物CSF1R蛋白的氨基酸序列与SEQ IDNO：2所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸；或

1)所述人源化CSF1R蛋白中来源于非人动物CSF1R蛋白的氨基酸序列与SEQ IDNO：2所示的，包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

本发明的第二方面，提供了一种人源化CSF1R基因，所述的人源化CSF1R基因包含人CSF1R基因的全部或部分。

优选的，所述的人源化CSF1R基因的核苷酸序列中包括至少连续20bp-60kb个核苷酸序列与人CSF1R基因的核苷酸序列一致。

优选的，所述的人源化CSF1R基因的核苷酸序列中包括至少连续50-12727bp个核苷酸序列与人CSF1R基因的核苷酸序列一致。

优选的，所述的人源化CSF1R基因的核苷酸序列中包括至少连续50-1494bp个核苷酸序列与人CSF1R基因的核苷酸序列一致。

在本发明的一个具体实施方式中，所述的人源化CSF1R基因的核苷酸序列中包括至少连续20、50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1494、1500、1600、1700、1800、1900、2000、2500、3000、4000、5000、6000、7000、8000、9000、10000、12727、20000、30000、40000、50000或60000bp个或其期间的任一数字个核苷酸序列与人CSF1R基因的核苷酸序列一致。

优选的，所述的人CSF1R基因的部分核苷酸序列包含信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列。进一步优选的，所述的人CSF1R基因的部分或人源化CSF1R基因包含编码胞外区的全部或部分核苷酸序列。

优选的，所述的编码胞外区的部分核苷酸序列中包含连续5-12727bp个核苷酸序列与编码人CSF1R胞外区的核苷酸序列一致。

优选的，所述的编码胞外区的部分核苷酸序列中包含连续50-1494bp个核苷酸序列与编码人CSF1R胞外区的核苷酸序列一致。

在本发明的一个具体实施方式中，所述的编码胞外区的部分核苷酸序列中包括连续20、50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1494、1500、1600、1700、1800、1900、2000、2500、3000、4000、5000、6000、7000、8000、9000、10000或12727个或其期间的任一数字个核苷酸序列与编码人CSF1R胞外区的核苷酸序列一致。

优选的，所述的人源化CSF1R基因还包含非人动物CSF1R基因的部分。

在本发明的一个具体实施方式中，所述的人源化CSF1R基因包含编码人胞外区和非人动物信号肽、跨膜区和胞质区的核苷酸序列。

优选的，所述的人CSF1R基因的部分或人源化CSF1R基因包含1号外显子至22号外显子中的一种、两种、三种以上、连续两种或连续三种以上的组合的核苷酸序列的全部或部分。进一步优选包含3号至11号外显子中的一种、两种、三种以上、连续两种或连续三种以上的组合的核苷酸序列的全部或部分。再进一步优选人CSF1R基因的3号至11号外显子的核苷酸序列，更进一步优选包含3号外显子的部分、4号至10号外显子的全部和11号外显子的部分，优选还包括3-4号内含子和/或10-11号内含子的全部或部分。

在本发明的一个具体实施方式中，所述的人源化CSF1R基因的核苷酸序列包含人CSF1R基因的3号外显子的部分、4号至10号外显子的全部和11号外显子的部分，以及非人动物CSF1R基因的1至2号外显子的全部、3号外显子的部分、11号外显子的部分和12至22号外显子的全部的核苷酸序列。优选的还包括人CSF1R基因的3-4号内含子、10-11号内含子及非人动物CSF1R基因的2-3号内含子和11-12号内含子的全部。

在本发明的一个具体实施方式中，所述的人CSF1R基因的部分或人源化CSF1R基因包含下列组中的一种：

(A)为SEQ ID NO：7所示核苷酸序列的全部或部分；

(B)与SEQ ID NO：7所示核苷酸序列的同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

(C)与SEQ ID NO：7所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸；

(D)具有SEQ ID NO：7所示核苷酸序列的，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列；

(E)转录的mRNA序列为SEQ ID NO：30所示核苷酸序列的全部或部分；

(F)转录的mRNA序列与SEQ ID NO：30所示的核苷酸序列的同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

(G)转录的mRNA序列与SEQ ID NO：30所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸；或

(H)转录的mRNA序列与SEQ ID NO：30所示的核苷酸序列所示的，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

优选的，所述的人源化CSF1R基因编码上述的人源化CSF1R蛋白。

在本发明的一个具体实施方式中，所述的人源化CSF1R基因的核苷酸序列包含下列组中的一种：

(a)转录的mRNA序列为SEQ ID NO：11所示核苷酸序列的全部或部分；

(b)转录的mRNA序列与SEQ ID NO：11所示的核苷酸序列的同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

(c)转录的mRNA序列与SEQ ID NO：11所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸；

(d)转录的mRNA序列与SEQ ID NO：11所示的核苷酸序列所示的，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列；

(e)人源化CSF1R基因中来源于人CSF1R基因的核苷酸序列为SEQ ID NO：3所示核苷酸序列的全部或部分；

(f)人源化CSF1R基因中来源于人CSF1R基因的核苷酸序列与SEQ ID NO：3所示的核苷酸序列的同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

(g)人源化CSF1R基因中来源于人CSF1R基因的核苷酸序列与SEQ ID NO：3所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸；

(h)人源化CSF1R基因中来源于人CSF1R基因的核苷酸序列具有SEQ ID NO：3所示的核苷酸序列所示的，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列；

(i)人源化CSF1R基因中来源于非人动物CSF1R基因的核苷酸序列为SEQ ID NO：1所示核苷酸序列的全部或部分；

(j)人源化CSF1R基因中来源于非人动物CSF1R基因的核苷酸序列与SEQ ID NO：1所示的核苷酸序列的同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

(k)人源化CSF1R基因中来源于非人动物CSF1R基因的核苷酸序列与SEQ ID NO：1所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸；

(l)人源化CSF1R基因中来源于非人动物CSF1R基因的核苷酸序列具有SEQ ID NO：1所示的核苷酸序列所示的，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列；

(m)包含SEQ ID NO：8和/或31所示核苷酸序列的全部或部分；

(n)包含与SEQ ID NO：8和/或31所示核苷酸序列的同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

(o)包含与SEQ ID NO：8和/或31所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸；或

(p)包含与SEQ ID NO：8和/或31所示核苷酸序列所示的，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

优选的，所述的人源化CSF1R基因还包括特异性诱导物或阻遏物。进一步优选的，所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。

在本发明的一个具体实施方式中，所述的特异性诱导物选自四环素系统(Tet-OffSystem/Tet-On System)或他莫昔芬系统(Tamoxifen System)。

本发明的第三方面，提供了一种靶向载体，所述的靶向载体包含人源核苷酸序列，所述的人源核苷酸序列包含下列组中的一种：

a)编码人或人源化CSF1R蛋白的核苷酸序列；

b)编码人CSF1R蛋白胞外区的核苷酸序列；

c)人源化CSF1R基因的核苷酸序列；或，

d)人CSF1R基因的3号至11号外显子，优选包含3号外显子的部分、4号至10号外显子的全部和11号外显子的部分，进一步优选包含SEQ ID NO：7或30所示核苷酸序列。

优选的，所述的靶向载体还包含5’臂(即5’同源臂)和/或3’臂(即3’同源臂)。

所述的5’臂为与待改变的转换区5’端同源的DNA片段，其选自非人动物CSF1R基因基因组DNA的100-10000个长度的核苷酸。进一步优选的，所述的5’臂与NCBI登录号为NC_000084.6至少具有90％同源性的核苷酸。再进一步优选的，所述5’臂序列如SEQ ID NO：5所示。

所述的3’臂为与待改变的转换区3’端同源的DNA片段，其选自非人动物CSF1R基因基因组DNA的100-10000个长度的核苷酸。进一步优选的，所述的3’臂与NCBI登录号为NC_000084.6至少具有90％同源性的核苷酸。再进一步优选的，所述3’臂序列如SEQ ID NO：6所示。

优选的，所述的待改变的转换区位于非人动物CSF1R基因座。进一步优选的，所述的待改变的转换区位于非人动物CSF1R基因1号外显子至22号外显子上。

在本发明的一个具体实施方式中，所述的待改变的转换区位于非人动物CSF1R基因3号外显子至11号外显子上。

优选的，所述的靶向载体还包含标记基因。进一步优选的，所述标记基因为负筛选标记的编码基因。更进一步优选的，所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。

在本发明的一个具体实施方式中，所述的靶向载体中还包括阳性克隆筛选的抗性基因。进一步优选的，所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。

在本发明的一个具体实施方式中，所述的靶向载体中还包括特异性重组系统。进一步优选的，所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统)。所述的特异性重组系统为2个，分别装在抗性基因的两侧。

本发明的第四方面，提供了一种包含上述靶向载体的细胞。

本发明的第五方面，提供了上述靶向载体或上述的细胞在CSF1R基因修饰中的应用。优选的，所述的应用包括但不限于敲除、插入或替换非人动物CSF1R基因的全部或部分核苷酸序列。

本发明的第六方面，提供了一种CSF1R基因人源化的非人动物的构建方法，所述的非人动物体内表达人或人源化CSF1R蛋白。

优选的，所述的非人动物内源CSF1R蛋白的表达降低或缺失。

所述的人源化CSF1R蛋白包含人CSF1R蛋白的全部或部分。优选的，所述的人CSF1R蛋白的全部或部分还包含信号肽、跨膜区、胞外区和/或胞质区的全部或部分。进一步优选的，所述的人CSF1R蛋白的部分包含胞外区的全部或部分。再进一步优选的，所述的非人动物体内表达上述的人源化CSF1R蛋白。

优选的，所述的胞外区的部分氨基酸序列中包括连续5-498个氨基酸序列与人CSF1R蛋白胞外区的氨基酸序列一致。

在本发明的一个具体实施方式中，所述的胞外区的部分氨基酸序列中包括连续20、50、80、100、150、200、250、300、350、400、450、498个或其期间的任一数字个氨基酸与人CSF1R蛋白胞外区的氨基酸序列一致。

优选的，所述的非人动物的基因组中包含人CSF1R基因的全部或部分。进一步优选包含1号外显子至22号外显子中的一种、两种、三种以上、连续两种或连续三种以上的组合的核苷酸序列的全部或部分。更进一步优选包含3号至11号外显子中的一种、两种、三种以上、连续两种或连续三种以上的组合的核苷酸序列的全部或部分。再进一步优选包含人CSF1R基因的3号至11号外显子。最为优选包含3号外显子的部分、4号至10号外显子的全部和11号外显子的部分，优选还包括3-4号内含子和/或10-11号内含子的全部或部分。在本发明的一个具体实施方式中，包含SEQ ID NO：7或30所示核苷酸序列

在本发明的一个具体实施方式中，所述的非人动物的基因组中包含上述的人源化CSF1R基因。

优选的，所述的构建方法包括将人源核苷酸序列可操作的连接在非人动物CSF1R基因座上，获得CSF1R基因人源化的非人动物，所述的人源核苷酸序列包含下列组中的一种：

a)编码人或人源化CSF1R蛋白的核苷酸序列；

b)编码人CSF1R蛋白胞外区的核苷酸序列；

c)人源化CSF1R基因的核苷酸序列；或，

所述的可操作的连接为将人源核苷酸序列替换非人动物相应区域，优选为替换非人动物基因组中编码内源CSF1R蛋白胞外区的核苷酸序列，进一步优选为替换非人动物与NCBI登录号为NC_000084.6的第61109624至61118992位所示序列相同的核苷酸序列。

优选的，所述的人或人源化CSF1R基因在非人动物体内通过内源或外源调控元件进行调控。进一步优选的，所述的调控元件为启动子。

优选的，所述的非人动物包括将人CSF1R基因的全部或部分核苷酸序列插入或替换非人动物CSF1R基因的全部或部分核苷酸序列获得。进一步优选的，将人CSF1R基因的1号外显子至22号外显子中的一种、两种、三种以上、连续两种或连续三种以上的组合的核苷酸序列的全部或部分插入或替换非人动物CSF1R基因的全部或部分核苷酸序列获得。更进一步优选的，将人CSF1R基因的3号外显子至11号外显子中的一种、两种、三种以上、连续两种或连续三种以上的组合的核苷酸序列的全部或部分替换非人动物CSF1R基因的全部或部分核苷酸序列获得。最为优选的，将人CSF1R基因的3号外显子的部分、4号至10号外显子的全部和11号外显子的部分核苷酸序列替换非人动物CSF1R基因的全部或部分核苷酸序列获得。

在本发明的一个具体实施方式中，将人CSF1R基因的3号外显子的部分、3-4号内含子的全部、4号至10号外显子的全部、10-11号内含子的全部和11号外显子的部分核苷酸序列替换非人动物CSF1R基因的全部或部分核苷酸序列获得。

优选的，所述的非人动物包括将上述人源化CSF1R基因的全部或部分核苷酸序列插入或替换非人动物CSF1R基因的全部或部分核苷酸序列获得。

优选的，所述的非人动物包括将编码上述人源化CSF1R蛋白的全部或部分核苷酸序列插入或替换非人动物CSF1R基因的全部或部分核苷酸序列获得。

优选的，所述的非人动物包括将编码人CSF1R蛋白的全部或部分核苷酸序列插入或替换非人动物CSF1R基因的全部或部分核苷酸序列获得。进一步优选的，将编码人CSF1R蛋白胞外区的核苷酸序列替换非人动物CSF1R基因的全部或部分核苷酸序列获得。

优选的，所述的插入位点为CSF1R基因的内源调控元件之后。

优选的，所述的插入为首先破坏非人动物内源CSF1R基因的编码框，随后进行插入操作。或者所述的插入步骤即可给内源CSF1R基因造成移码突变又可以实现插入人源序列的步骤。

优选的，所述的非人动物基因组中CSF1R基因是纯合或者杂合的。

优选的，所述非人动物的基因组中至少一个染色体上包含人CSF1R基因的全部或部分。进一步优选的，所述的非人动物的基因组中至少一个染色体上包含上述人源化CSF1R基因。

优选的，所述的非人动物中至少一个细胞表达人或人源化CSF1R蛋白。进一步优选的，所述的非人动物中至少一个细胞表达上述人源化CSF1R蛋白。

优选的，使用基因编辑技术进行非人动物的构建，所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。

优选的，使用靶向载体进行非人动物的构建。进一步优选的，所述的靶向载体选自上述的靶向载体。

本发明的第七方面，提供了一种多基因修饰的非人动物的构建方法，包括如下步骤：

i)提供上述CSF1R基因人源化的非人动物，或者采用上述CSF1R基因人源化的非人动物的构建方法获得的非人动物；

ii)将步骤i)获得的非人动物与其他基因修饰的非人动物交配、体外授精或直接进行基因编辑，并进行筛选，得到多基因修饰的非人动物。

优选的，所述的其他基因修饰的非人动物包括基因PD-1、PD-L1、CSF1、IL34、CCR2、CD40、CXCR4、VEGF或PDGF等人源化的非人动物。

优选的，所述的多基因修饰的非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物、六基因人源化非人动物、七基因人源化非人动物、八基因人源化非人动物或九基因人源化非人动物。

优选的，所述的多基因修饰的非人动物的基因组中人源化的多个基因中的每一个基因均可以是纯合或杂合的。

本发明的第八方面，提供了一种上述的构建方法获得的非人动物或子代。

优选的，所述的非人动物或子代包括CSF1R基因人源化的非人动物或者多基因修饰的非人动物。

本发明的第九方面，提供了一种动物荷瘤或炎症模型，所述的动物荷瘤或炎症模型来源于上述CSF1R基因人源化的非人动物或者多基因修饰的非人动物、上述的构建方法获得的CSF1R基因人源化的非人动物或者多基因修饰的非人动物或者上述的非人动物或其子代。

本发明的第十方面，提供了一种动物荷瘤或炎症模型的制备方法，包括上述CSF1R基因人源化的非人动物或者多基因修饰的非人动物的构建方法的步骤。

优选的，所述的制备方法还包括植入肿瘤细胞的步骤。

本发明的第十一方面，提供了来源于上述CSF1R基因人源化的非人动物或者多基因修饰的非人动物、上述的构建方法获得的CSF1R基因人源化的非人动物或者多基因修饰的非人动物或者上述的非人动物或其子代在构建动物荷瘤或炎症模型中的应用。

本发明的第十二方面，提供了一种细胞、组织或器官，所述的细胞、组织或器官来源于上述CSF1R基因人源化的非人动物或者多基因修饰的非人动物、上述的构建方法获得的CSF1R基因人源化的非人动物或者多基因修饰的非人动物、上述的非人动物或其子代或者上述的动物荷瘤或炎症模型，或者，所述的细胞、组织或器官表达人或人源化CSF1R蛋白。

优选的，所述的细胞、组织或器官中内源CSF1R蛋白表达降低或缺失。

优选的，所述的细胞的基因组中包含人CSF1R基因的全部或部分或者人源化CSF1R基因。

所述的细胞可以为任何来源于动物或人的细胞，包括但不限于淋巴细胞、单核细胞、巨噬细胞、内皮细胞、成纤维细胞、上皮细胞、CD34+胸腺细胞、神经元或者肿瘤细胞。

优选的，所述的组织为荷瘤后的瘤组织。

本发明的第十三方面，提供了来源于上述的人源化CSF1R蛋白、上述的人源化CSF1R基因、上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的动物荷瘤或炎症模型、上述的细胞、组织或器官的应用，所述的应用包括：

a)涉及人类细胞的免疫过程的产品开发中的应用。优选可以为制造或筛选人类抗体。

b)作为药理学、免疫学、微生物学和医学研究的模型系统中的应用；

c)涉及生产和利用动物实验疾病模型用于开发新的诊断策略和/或治疗策略中的应用；或，

d)在筛选、验证、评价或研究CSF1R功能、人CSF1R信号机理、靶向人的药物、药效，免疫相关疾病药物以及抗肿瘤或抗炎症药物，筛选和评估人用药及药效研究方面的应用。

本发明的第十四方面，提供了来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的动物荷瘤或炎症模型用作人CSF1R特异性调节剂的筛选。

本发明的第十五方面，提供了一种人CSF1R特异性调节剂的筛选方法，所述的筛选方法包括向植入肿瘤细胞的个体施加调节剂，检测肿瘤抑制性；其中，所述的个体选自上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的动物荷瘤或炎症模型。

优选的，所述的调节剂选自CAR-T、药物。进一步优选的，所述的药物为抗体。

优选的，所述的调节剂为单抗或双特异性抗体或两种及两种以上药物的联合使用。

优选的，所述检测包括测定肿瘤细胞的大小和/或增殖速率。

优选的，所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。

优选的，所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化，所述的代谢变化包括食物消耗或水消耗的变化。

优选的，所述的肿瘤细胞来源于人或非人动物。

优选的，所述人CSF1R特异性调节剂的筛选方法不是治疗方法。该方法用来筛选或评价药物，对候选药物的药效进行检测和比较，以确定哪些候选药物可以作为药物，哪些不能作为药物，或者，比较不同药物的药效敏感程度，即治疗效果不是必然的，只是一种可能性。

本发明的第十六方面，提供了一种干预方案的评价方法，所述的评价方法包括向个体植入肿瘤细胞，向植入肿瘤细胞的个体施加干预方案，对施加干预方案后的个体进行肿瘤抑制效果检测和评价；其中，所述的个体选自上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的动物荷瘤或炎症模型。

优选的，所述的干预方案选自CAR-T、药物治疗。进一步优选的，所述的药物为抗原结合蛋白。所述的抗体结合蛋白为抗体。

优选的，所述的肿瘤细胞来源于人或非人动物。

优选的，所述干预方案的评价方法不是治疗方法。该评价方法对干预方案的效果进行检测和评价，以确定该干预方案是否有治疗效果，即治疗效果不是必然的，只是一种可能性。

本发明的第十七方面，提供了一种来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的动物荷瘤或炎症模型在制备人CSF1R特异性调节剂中的用途。

本发明的第十八方面，提供了一种来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的动物荷瘤或炎症模型在制备治疗肿瘤、炎症或自身免疫疾病的药物中的用途。

本发明所述的肿瘤包括但不限于淋巴瘤、非小细胞肺癌、白血病、卵巢癌、鼻咽癌、乳腺癌、子宫内膜癌、结肠癌、直肠癌、胃癌、膀胱癌、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺癌、头颈部癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中，所述的白血病选自急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病；所述淋巴瘤选自霍奇金淋巴瘤和非霍奇金淋巴瘤，包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症；所述肉瘤选自骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、以及软骨肉瘤。在本发明的一个具体实施方式中，所述的肿瘤包括但不限于乳腺癌、卵巢癌、鼻咽癌。

本发明所述的“免疫相关疾病”包括但不限于过敏、哮喘、皮炎、心肌炎、肾炎、肝炎、系统性红斑狼疮、类风湿性关节炎、硬皮病、甲状腺功能亢进、原发性血小板减少性紫癜、自身免疫性溶血性贫血、溃疡性结肠炎、自身免疫性肝病、糖尿病、疼痛或神经障碍等。

本发明所述的“炎症”包括急性炎症，也包括慢性炎症。具体的，包括但不限于变质性炎症、渗出性炎症(浆液性炎、纤维素性炎、化脓性炎、出血性炎、坏死性炎、卡他性炎)、增生性炎症、特异性炎症(结核、梅毒、麻疯、淋巴肉芽肿等)。

本发明所述的非人动物或者采用本发明所述的方法构建的非人动物，其体内可以正常表达人或人源化CSF1R蛋白，可用于针对人CSF1R靶位点的药物筛选、药效评估、免疫疾病和肿瘤治疗，可以加快新药研发过程、节约时间和成本。对于研究CSF1R蛋白功能及相关疾病药物筛选提供了有效的保障。

本发明所述的“核苷酸序列”包含天然的或经过修饰的核糖核苷酸序列、脱氧核糖核苷酸序列。优选为DNA、cDNA、pre-mRNA、mRNA、rRNA、hnRNA、miRNAs、scRNA、snRNA、siRNA、sgRNA、tRNA。

本发明所述的“人源化CSF1R蛋白”，包含来源于人CSF1R蛋白的部分和非人CSF1R蛋白的部分。其中，所述的“人CSF1R蛋白”同“人CSF1R蛋白的全部”，即其氨基酸序列与人CSF1R蛋白的全长氨基酸序列一致。所述的“人CSF1R蛋白的部分”为连续5-972个氨基酸序列与人CSF1R蛋白的氨基酸序列一致；优选的，连续10-498个氨基酸序列；在本发明的一个具体实施方式中，为连续20、50、80、100、150、200、250、300、350、400、450、498、500、550、600、650、700、750、800、850、900、950、972个或其期间的任一数字个氨基酸与人CSF1R蛋白的氨基酸序列一致。

本发明所述的“人源化CSF1R基因”，包含来源于人CSF1R基因的部分和非人CSF1R基因的部分。其中，所述的“人CSF1R基因”同“人CSF1R基因的全部”，即其核苷酸序列与人CSF1R基因的全长核苷酸序列一致。所述的“人CSF1R基因的部分”为连续20bp-60kb个核苷酸序列与人CSF1R基因的核苷酸序列一致，优选为50-12727bp或50-1494bp。在本发明的一个具体实施方式中，为包括至少连续20、50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1494、1500、1600、1700、1800、1900、2000、2500、3000、4000、5000、6000、7000、8000、9000、10000、12727、20000、30000、40000、50000或60000bp个或其期间的任一数字个核苷酸序列与人CSF1R基因的核苷酸序列一致。当然，本领域普通技术人员应当知晓，所述的“人CSF1R基因”包括人正常基因也包括其突变的基因。

本发明所述的“包含”或“包括”为开放式写法，当在本申请中用于描述蛋白质或核酸的序列时，所述蛋白质或核酸可以是由所述序列组成，或者在所述蛋白质或核酸的一端或两端可以具有额外的氨基酸或核苷酸，但仍然具有本发明所述的活性。

本发明所述的“全部或部分”，“全部”为整体，“部分”为整体中的局部，或者组成整体的个体。例如“人CSF1R蛋白的全部”为整体，即包含全部的人CSF1R蛋白的氨基酸序列。“人CSF1R蛋白的部分”为整体的局部或组成整体的个体，即包含人CSF1R蛋白的氨基酸序列中的几个、几十个、几百个或者几千个。也就是说，人CSF1R蛋白的部分氨基酸序列中连续5-972个氨基酸序列与人CSF1R蛋白的氨基酸序列一致；优选的，连续10-498个氨基酸序列；在本发明的一个具体实施方式中，为连续20、50、80、100、150、200、250、300、350、400、450、498、500、550、600、650、700、750、800、850、900、950、972个或其期间的任一数字个氨基酸与人CSF1R蛋白的氨基酸序列一致。

本发明所述的“信号肽的部分”、“跨膜区的部分”、或“胞质区的部分”分别代表与信号肽的全部氨基酸序列、跨膜区的全部氨基酸序列或者胞质区的全部氨基酸序列具有包括但不限于40％，41％，42％，43％，44％，45％，46％，47％，48％，49％，50％，51％，52％，53％，54％，55％，56％，57％，58％，59％，60％，70％，80％，81％，82％，83％，84％，85％，86％，87％，88％，89％，90％，91％，92％，93％，94％，95％，96％，97％，98％，99％，99.1％，99.2％，99.3％，99.4％，99.5％，99.6％，99.7％，99.8％，99.9％的同一性的氨基酸序列。

本发明所述的“xx号外显子至xx号外显子”或“xx号外显子至xx号外显子的全部”包含外显子及其期间的内含子的核苷酸序列，例如所述的“3号外显子至11号外显子”代表3号外显子、3-4号内含子、4号外显子、4-5号内含子、5号外显子、5-6号内含子、6号外显子、6-7号内含子、7号外显子、7-8号内含子、8号外显子、8-9号内含子、9号外显子、9-10号内含子、10号外显子、10-11号内含子、11号外显子的核苷酸序列。

本发明所述的“x-xx号内含子”表示x号外显子至xx号外显子之间的内含子。例如“3-4号内含子”表示3号外显子至4号外显子之间的内含子。

本发明所述的“三种以上”包括但不限于三种、四种、五种、六种、七种、八种、九种、十种、十一种、十二种、十三种、十四种、十五种、十六种、十七种、十八种、十九种、二十种、二十一种或二十二种等。

本发明所述的“连续三种以上”包括但不限于连续三种、连续四种、连续五种、连续六种、连续七种、连续八种、连续九种、连续十种、连续十一种、连续十二种、连续十三种、连续十四种、连续十五种、连续十六种、连续十七种、连续十八种、连续十九种、连续二十种、连续二十一种或连续二十二种等。

本发明所述的“治疗”表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性，但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除，且是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。

本发明所述“同源性”，是指在使用蛋白序列或核苷酸序列的方面，本领域技术人员可以根据实际工作需要对序列进行调整，使使用序列与现有技术获得的序列相比，具有(包括但不限于)1％，2％，3％，4％，5％，6％，7％，8％，9％，10％，11％，12％，13％，14％，15％，16％，17％，18％，19％，20％，21％，22％，23％，24％，25％，26％，27％，28％，29％，30％，31％，32％，33％，34％，35％，36％，37％，38％，39％，40％，41％，42％，43％，44％，45％，46％，47％，48％，49％，50％，51％，52％，53％，54％，55％，56％，57％，58％，59％，60％，70％，80％，81％，82％，83％，84％，85％，86％，87％，88％，89％，90％，91％，92％，93％，94％，95％，96％，97％，98％，99％，99.1％，99.2％，99.3％，99.4％，99.5％，99.6％，99.7％，99.8％，99.9％的同一性。

本领域的技术人员能够确定并比较序列元件或同一性程度，以区分另外的小鼠和人序列。

除非特别说明，本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如：Molecular Cloning A Laboratory Manual，2ndEd.，ed.By Sambrook，FritschandManiatis(Cold Spring Harbor Laboratory Press：1989)；DNA Cloning，Volumes I and II(D.N.Glovered.，1985)；Oligonucleotide Synthesis(M.J.Gaited.，1984)；Mullisetal.U.S.Pat.No.4，683，195；Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984)；Transcription And Translation(B.D.Hames&S.J.Higginseds.1984)；Culture Of Animal Cells(R.I.Freshney，AlanR.Liss，Inc.，1987)；Immobilized Cells And Enzymes(IRL Press，1986)；B.Perbal，A PracticalGuide To Molecular Cloning(1984)；the series，Methods In ENZYMOLOGY(J.Abelsonand M.Simon，eds.inchief，Academic Press，Inc.，New York)，specifically，Vols.154and 155(Wuetal.eds.)and Vol.185，″Gene Expression Technology″(D.Goeddel，ed.)；Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.，1987，Cold Spring Harbor Laboratory)；Immunochemical Methods InCell And Molecular Biology(Mayer and Walker，eds.，Academic Press，London，1987)；Handbook Of Experimental Immunology，Volumes V(D.M.Weir and C.C.Blackwell，eds.，1986)；and Manipulating the Mouse Embryo，(Cold Spring Harbor LaboratoryPress，Cold Spring Harbor，N.Y.，1986)。

在一个方面，所述非人动物是非人哺乳动物。优选的，所述非人动物是小型哺乳动物，例如跳鼠科。在一个实施方式中，所述非人动物是啮齿动物、猪、兔子、猴子等任何可以进行基因编辑制备CSF1R人源化的非人动物。在一个实施方式中，所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中，所述啮齿动物选自鼠家族。在一个实施方式中，所述基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中，所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中，所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中，所述动物是啮齿动物。在一个特定实施方式中，所述啮齿动物选自小鼠和大鼠。在一个实施方式中，所述非人动物是小鼠。

在一个特定实施方式中，所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的，所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的，所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的，所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnul小鼠、NOD-Rag1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。

在一个特定实施方式中，所述非人动物是啮齿动物，其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠及NOD、NOD/SCID、NOD-Prkdcscid IL-2rgnull背景的小鼠。

以上只是概括了本发明的一些方面，不是也不应该认为是在任何方面限制本发明。

本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到，对本发明可作某些改变并不偏离本发明的构思或范围。

下面的实施例进一步详细说明本发明，不能认为是限制本发明或本发明所说明的具体方法的范围。

附图说明

以下，结合附图来详细说明本发明的实施例，其中：

图1：小鼠CSF1R基因和人CSF1R基因座对比示意图(非按比例)；

图2：小鼠CSF1R基因人源化改造示意图(非按比例)；

图3：CSF1R基因打靶策略及靶向载体设计示意图(非按比例)；

图4：CSF1R重组后细胞Southern blot结果，其中WT为野生型对照，1-A03、2-E03、2-E05、2-G06、2-H10、3-D03、3-E02、3-G01、4-D03、4-D05为细胞编号；

图5：人源化CSF1R小鼠FRT重组过程示意图(非按比例)；

图6：CSF1R人源化F1代小鼠鼠尾PCR鉴定体细胞基因型，其中，WT为野生型对照，H₂O为水对照，PC为阳性对照，图(A)为引物WT-F和WT-R扩增结果，图(B)为引物Mut-F和WT-R扩增结果，图(C)为引物Frt-F和Frt-R扩增结果，图(D)为引物Flp-F和Flp-R扩增结果；

图7：CSF1R人源化F1代小鼠流式分析结果，其中，图(A)、(C)为C57BL6(+/+)野生型对照，图(B)、(D)为CSF1R人源化杂合子小鼠检测结果图(B-hCSF1R(H/+))。

具体实施方式

下面结合具体实施例来进一步描述本发明，本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的，并不对本发明的范围构成任何限制。本领域技术人员应该理解的是，在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换，但这些修改和替换均落入本发明的保护范围内。

在下述每一实施例中，设备和材料是从以下所指出的几家公司获得：

APC anti-mouse CD115(CSF-1R)Antibody(mCSF1R-APC-A)购自Biolegend，货号135509；

PE anti-human CD115(CSF-1R)Antibody(hCSF1R-PE-A)购自Biolegend，货号347303；

V450 Rat Anti-CD11b(mCD11b-V450-A)购自BD Horizon，货号560455；

ScaI、SspI、EcoRV酶购自NEB，货号分别为R3122、R0132、R0195；

Attune Nxt Acoustic Focusing Cytometer购自Thermo Fisher，型号AttuneNxt；

PrimeScript 1st Strand cDNA Synthesis Kit购自TAKARA，型号6110A；

Heraeus^TM Fresco^TM 21Microcentrifuge购自Thermo Fisher，型号Fresco 21。

实施例1CSF1R基因人源化小鼠

本实施例对非人动物(如小鼠)进行改造，使该非人动物体内包含编码人CSF1R蛋白的全部或部分核苷酸序列，得到经遗传修饰的非人动物，其体内可表达人或人源化CSF1R蛋白。小鼠CSF1R基因(NCBI Gene ID：12978，Primary source：MGI：1339758，UniProt ID：P09581，位于18号染色体NC_000084.6的第61105572至61131139位，基于转录本NM_001037859.2(SEQ ID NO：1)及其编码蛋白NP_001032948.2(SEQ ID NO：2))和人CSF1R基因(NCBI Gene ID：1436，Primary source：HGNC:2433，UniProt ID：P07333，位于5号染色体NC_000005.10的第150053291至150113372位，基于转录本NM_001288705.3(SEQ ID NO：3)及其编码蛋白NP_001275634.1(SEQ ID NO：4))对比示意图如图1所示。

为了达到本发明的目的，可在小鼠内源CSF1R基因座引入编码人CSF1R蛋白的全部或部分核苷酸序列，使得该小鼠表达人或人源化CSF1R蛋白。具体来说，可以通过基因编辑技术在小鼠内源CSF1R基因座上用人CSF1R基因核苷酸序列替换小鼠CSF1R基因，如将小鼠CSF1R基因的3号外显子部分序列至11号外显子部分序列的9369bp长度的序列用对应的人DNA序列替换，得到人源化CSF1R基因序列(示意图如图2所示)，实现对小鼠CSF1R基因的人源化改造。

如图3所示的打靶策略示意图中，显示了靶向载体上含有小鼠CSF1R基因上游和下游的同源臂序列，以及包含人CSF1R序列的A片段。其中，上游同源臂序列(5’同源臂，SEQ IDNO：5)与NCBI登录号为NC_000084.6的第61104995至61109623位核苷酸序列相同，下游同源臂序列(3’同源臂，SEQ ID NO：6)与NCBI登录号为NC_000084.6的第61119606至61124121位核苷酸序列相同；A片段上包含人CSF1R基因的3号外显子部分序列至11号外显子部分序列的基因组DNA序列(SEQ ID NO：7)，该DNA序列与NCBI登录号为NC_000005.10的第150068290至150081016位核苷酸序列相同；A片段中人CSF1R5’端与小鼠CSF1R基因的连接设计为

/>(SEQ ID NO：31)，其中序列“AGGGG”的最后一个“G”是小鼠的最后一个核苷酸，序列/>中的“A”是人的第一个核苷酸；人CSF1R3’端与小鼠CSF1R基因的连接设计为/> (SEQ ID NO：8)，其中序列“CACCA”的最后一个“A”是人的最后一个核苷酸，序列/>的第一个“G”是小鼠的第一个核苷酸。

靶向载体上还包括用于阳性克隆筛选的抗性基因，即新霉素磷酸转移酶编码序列Neo，并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点，组成Neo盒(Neo cassette)。其中Neo盒5’端与小鼠基因的连接设计为

(SEQ ID NO：9)，其中序列“ACTAC”的最后一个“C”是小鼠的最后一个核苷酸，序列/>的“G”是Neo盒的第一个核苷酸；Neo盒3’端与小鼠基因的连接设计为

(SEQ ID NO：10)，其中序列“ATATT”的最后一个“T”是Neo盒的最后一个核苷酸，序列/>的第一个“C”是小鼠的第一个核苷酸。此外，还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。改造后的人源化小鼠CSF1R的mRNA序列如SEQ ID NO：11(其中包括人mRNA序列如SEQ ID NO：30所示)所示，表达的蛋白序列如SEQ ID NO：12所示。

靶向载体构建可采用常规方法进行，如酶切连接等。构建好的靶向载体通过酶切进行初步验证后，再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中，利用阳性克隆筛选标记基因对得到的细胞进行筛选，并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况，筛选出正确的阳性克隆细胞，经PCR鉴定为阳性的克隆再进行Southern Blot(分别用ScaI或SspI或EcoRV消化细胞DNA并使用3个探针进行杂交，探针及目的片段长度如表1所示)检测，结果见如图4所示，检测结果表明10个经PCR验证为阳性的克隆，经测序发现除1-A03和4-D03外，其余8个均为阳性克隆且无随机插入，具体编号为2-E03、2-E05、2-G06、2-H10、3-D03、3-E02、3-G01、4-D05。

表1：具体探针及目的片段长度

其中，PCR测定包括下述引物：

F1：5’-GGTTGTGTCTCAGCAAACACATGC-3’(SEQ ID NO：13)，

R1：5’-GAGGATGCTGCTGGAGCCATC-3’(SEQ ID NO：14)；

F2：5’-GCTCGACTAGAGCTTGCGGA-3’(SEQ ID NO：15)，

R2：5’-CCAGCGCACCTGGTACTTCG-3’(SEQ ID NO：16)；

Southern Blot检测包括如下探针引物：

5’探针(5’Probe)：

5’Probe-F：5’-AAATGGGAATGAAATCAGAGCT-3’(SEQ ID NO：17)，

5’Probe-R：5’-AACCCTAGGGCATCCAACAG-3’(SEQ ID NO：18)；

3’探针(3’Probe)：

3’Probe-F：5’-GCCGAGGCTATGCTAGGACC-3’(SEQ ID NO：19)，

3’Probe-R：5’-GACACATCAGCCACTCCTCAC-3’(SEQ ID NO：20)；

Neo探针(Neo Probe)：

Neo Probe-F：5’-GGATCGGCCATTGAACAAGATGG-3’(SEQ ID NO：21)，

Neo Probe-R：5’-CAGAAGAACTCGTCAAGAAGGCG-3’(SEQ ID NO：22)。

将筛选出的正确阳性克隆细胞(黑色鼠)按照本领域已知的技术导入已分离好的囊胚中(白色鼠)，得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管，可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠，再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因(该过程示意图见图5)后，再通过互相交配即可得到人源化CSF1R基因纯合子小鼠。可通过PCR鉴定子代小鼠体细胞的基因型(引物如表2所示)，示例性的F1代小鼠(已去除Neo标记基因)的鉴定结果见图6，其中，编号为F1-1、F1-2、F1-3、F1-4、F1-5的5只小鼠均为阳性杂合小鼠。

表2：引物名称及具体序列

这表明使用本方法能构建出可稳定传代且无随机插入的人源化CSF1R基因工程小鼠。可通过常规检测方法确认阳性小鼠体内人源化CSF1R蛋白的表达情况，例如使用流式细胞术等。具体来说，分别采取6周龄C57BL/6野生型小鼠和CSF1R人源化小鼠的血液，用抗鼠CSF1R抗体mCSF1R-APC-A或抗人CSF1R抗体hCSF1R-PE-A和mCD11b-V450识别染色后进行流式检测，检测结果见图7。如图7所示，可在CSF1R人源化杂合子小鼠体内检测到鼠CSF1R蛋白(图B)和人源化CSF1R蛋白(图D)；而在野生型C57BL/6小鼠体内只能检测到鼠CSF1R蛋白(图A)，未检测到人源化CSF1R蛋白(图C)。

实施例2双重人源化或多重人源化小鼠的制备

利用本方法或制得的CSF1R小鼠还可以制备双人源化或多人源化小鼠模型。如，前述实施例1中，囊胚显微注射使用的胚胎干细胞可选择来源于含有PD-1、PD-L1、CSF1、IL34、CCR2、CD40、CXCR4、VEGF、PDGF等其它基因修饰的小鼠，或者，也可在人源化CSF1R小鼠的基础上，利用分离小鼠ES胚胎干细胞和基因重组打靶技术，获得CSF1R与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将本方法得到的CSF1R小鼠纯合子或杂合子与其它基因修饰的纯合或杂合小鼠交配，对其后代进行筛选，根据孟德尔遗传规律，可有一定机率得到人源化CSF1R与其它基因修饰的双基因或多基因修饰的杂合小鼠，再将杂合子相互交配可以得到双基因或多基因修饰的纯合子，利用这些双基因或多基因修饰的小鼠可以进行靶向人CSF1R和其它基因调节剂的体内药效验证等。

以上详细描述了本发明的优选实施方式，但是，本发明并不限于上述实施方式中的具体细节，在本发明的技术构思范围内，可以对本发明的技术方案进行多种简单变型，这些简单变型均属于本发明的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本发明对各种可能的组合方式不再另行说明。

此外，本发明的各种不同的实施方式之间也可以进行任意组合，只要其不违背本发明的思想，其同样应当视为本发明所公开的内容。

序列表

<110> 百奥赛图江苏基因生物技术有限公司、百奥赛图（北京）医药科技股份有限公司

<120> CSF1R基因人源化的非人动物及其构建方法和应用

<130> 1

<160> 31

<170> SIPOSequenceListing 1.0

<210> 1

<211> 3875

<212> DNA/RNA

<213> 小鼠(Mouse)

<400> 1

gggtatgact cctctcctaa gtgtccttag aggtggtttc ctaagtctct caaactccat 60

catctccctt caggatcagt tgagcctggc cccagattct gcctcttcct ctgttccctt 120

tcaggcaacc taaaaaaaaa aaaaaaaaaa aaggggaaga ggagccagtg caacagacag 180

gaacgtgttc atctgttccc gtcctcacag aactagcagc tgggagcccc gtgcccagcc 240

gactctccaa cctgcatcgg ctcacgctat cccctggagg ctatggagtt ggggcctcct 300

ctggtcctgc tgctggccac agtttggcat ggtcaggggg cccctgtcat cgagcctagt 360

ggcccagaac tggttgtaga gccgggtgaa acggtgaccc tgcgatgtgt gagcaatggc 420

agtgtggaat gggatggccc catctctccc tactggacct tggaccctga atctcccgga 480

agcaccctga ccacaagaaa cgcgaccttc aaaaacactg ggacctaccg ttgtaccgag 540

cttgaagacc ccatggcagg cagtaccacc atccacttgt atgtcaaaga tccggcccac 600

tcttggaatt tgctggcaca ggaggtgaca gtggttgagg gccaggaagc tgtgctgccc 660

tgtctgatca ctgaccctgc actgaaggac agtgtctcac tgatgcgtga ggggggcagg 720

caggtcttac gcaaaacggt ctacttcttc tcgccatggc gagggttcat tatccgcaag 780

gctaaagtcc ttgacagcaa tacctacgtg tgcaagacca tggtgaatgg tagggaatcc 840

acctccactg gcatctggct taaggtgaat cgagtccacc cagagccccc acagataaaa 900

ttggagccta gcaagctggt gcggattcga ggggaggctg cgcagatcgt gtgctcggcc 960

actaacgccg aagtgggatt caacgttatc ctcaaacgtg gagacaccaa gctggaaatc 1020

cccctaaaca gtgacttcca agataactat tataaaaaag tccgggctct cagtctcaac 1080

gctgtggact tccaagacgc tggcatatat tcttgtgtgg ccagcaatga tgttggcaca 1140

cgcacggcca ccatgaactt ccaggtggtg gagagtgcct acttaaactt gacctctgag 1200

cagagcctct tgcaggaggt gtctgtgggt gacagcctca tcctcacggt ccatgcagat 1260

gcctacccta gcatacagca ttacaactgg acctacctag gtccattctt tgaagaccag 1320

cgcaagcttg agtttatcac ccaaagggcc atatacaggt acacattcaa gctctttctg 1380

aaccgtgtaa aggcctcaga ggcgggccag tacttcttaa tggcacaaaa caaggcaggc 1440

tggaataatc tgacctttga gctcaccctg cgatatcccc cagaggtcag tgttacatgg 1500

atgcctgtga atggctctga tgtcctgttc tgtgacgtct ctgggtaccc tcagcccagc 1560

gtgacatgga tggagtgcag gggccacacc gataggtgtg atgaagccca ggctttgcag 1620

gtttggaatg acacccaccc tgaagtcctg agtcagaagc ccttcgacaa agtgatcatt 1680

cagagccagc tgcccattgg gaccttaaaa cacaacatga cttatttttg caaaacccac 1740

aacagtgtgg gtaacagctc tcagtacttc agggccgtct ccctaggaca aagcaagcag 1800

ctccccgatg agtccctctt cactccggtg gtggtggcct gtatgtctgt catgtctctg 1860

ctggtgctac tgctgttgct gctcttgtac aagtacaagc agaagccgaa gtaccaggtg 1920

cgctggaaga tcatcgagag atacgaaggc aatagctaca ccttcattga ccctactcag 1980

ttgccctaca atgagaagtg ggagttccct cggaacaacc tgcagtttgg taagactcta 2040

ggagccggtg cctttgggaa ggtggtggag gctacagcct ttggtctggg caaagaagat 2100

gcagtgctga aggtggctgt gaagatgcta aagtccacgg ctcatgctga tgagaaggag 2160

gccctgatgt cagagctgaa gatcatgagt cacctgggac agcacgagaa tatagtcaac 2220

ctcttgggag cctgtactca cggaggacct gtcctggtca tcactgaata ctgctgctat 2280

ggagacctac tcaactttct ccgaaggaag gccgaggcta tgctaggacc cagcctgagt 2340

cctggtcagg actccgaggg agactccagc tacaagaaca tccacctgga gaagaaatat 2400

gtgcgcaggg acagtggctt ctccagtcag ggtgtagaca cctacgtgga gatgaggcct 2460

gtctcgactt cttcaagtga ctccttcttt aagcaagatc tggacaaaga ggccagccgg 2520

cccctggagc tctgggacct gctccacttc tccagccaag tggctcaggg catggccttc 2580

cttgcttcta aaaactgcat ccaccgggac gtagcagctc gaaacgtgct gttgaccagc 2640

ggacatgtgg ccaagattgg ggactttgga ctggctaggg acatcatgaa tgactccaac 2700

tatgttgtca agggcaatgc ccgcctgcct gtaaagtgga tggccccaga gagcatcttt 2760

gactgcgtct acacagttca gagtgatgtg tggtcctacg gcatcctcct ctgggagatc 2820

ttctcgcttg gtctgaaccc ctaccccggc atcctagtga acaacaagtt ctacaaactg 2880

gtgaaggatg gataccaaat ggcccagcct gtatttgcac cgaagaacat atacagcatc 2940

atgcagtcct gctgggacct ggagcctacc agaagaccca ccttccaaca gatctgcttc 3000

ctcctccagg agcaggcccg actggagagg agagaccagg actatgctaa cctgccaagc 3060

agcggtggca gcagcggcag tgacagtggt ggtggcagca gcggtggcag cagcagtgag 3120

ccagaagagg agagctccag tgaacacctg gcctgctgtg agccagggga catcgcccag 3180

cccctgctgc agcctaacaa ctaccagttc tgctgaagtg ggagggagag ccgagtcctg 3240

ccgctctcta cgtcccagct tggcctcctc catggcacgg gcgacatggg gagaacatat 3300

ggacttcgcc ctcagcttgg cccagctctg acacttcaga acatgagggg tctggggagg 3360

tcagaggccc cgtttgttcc cagagcctgg gccatcactg ccagtggggt tctcacagtg 3420

ctagcctcta tatttactat gccaactggt gcacccctag ttctctttct ccatcctatt 3480

cccattttaa aaaacccgtc ccaaactctc gtgtttcaat ggaaagactg atttatgtct 3540

caaaagacaa gagtctcaaa ggctgtgggt aagctgaagg cttgcctccc tgacagatgc 3600

ttagactaca ggcttcttgg gacaggtggc cccttcctaa gctcacagga gtggccacca 3660

ctcttgacct tcactctgtc tatagtcccg cctcatcctg gatcttgtac tgagcggcag 3720

ctaaaagtgt tctacccagt gccctgtcac tctagactgg aaggtatggg gcctgatgca 3780

aggctgacca caccaacaaa caccgtgtgc tcctctccaa gctgactcgt cctcattaac 3840

tgtcaacatt aaactaacag cattaacaca gccag 3875

<210> 2

<211> 977

<212> PRT

<213> 小鼠(Mouse)

<400> 2

Met Glu Leu Gly Pro Pro Leu Val Leu Leu Leu Ala Thr Val Trp His

1 5 10 15

Gly Gln Gly Ala Pro Val Ile Glu Pro Ser Gly Pro Glu Leu Val Val

20 25 30

Glu Pro Gly Glu Thr Val Thr Leu Arg Cys Val Ser Asn Gly Ser Val

35 40 45

Glu Trp Asp Gly Pro Ile Ser Pro Tyr Trp Thr Leu Asp Pro Glu Ser

50 55 60

Pro Gly Ser Thr Leu Thr Thr Arg Asn Ala Thr Phe Lys Asn Thr Gly

65 70 75 80

Thr Tyr Arg Cys Thr Glu Leu Glu Asp Pro Met Ala Gly Ser Thr Thr

85 90 95

Ile His Leu Tyr Val Lys Asp Pro Ala His Ser Trp Asn Leu Leu Ala

100 105 110

Gln Glu Val Thr Val Val Glu Gly Gln Glu Ala Val Leu Pro Cys Leu

115 120 125

Ile Thr Asp Pro Ala Leu Lys Asp Ser Val Ser Leu Met Arg Glu Gly

130 135 140

Gly Arg Gln Val Leu Arg Lys Thr Val Tyr Phe Phe Ser Pro Trp Arg

145 150 155 160

Gly Phe Ile Ile Arg Lys Ala Lys Val Leu Asp Ser Asn Thr Tyr Val

165 170 175

Cys Lys Thr Met Val Asn Gly Arg Glu Ser Thr Ser Thr Gly Ile Trp

180 185 190

Leu Lys Val Asn Arg Val His Pro Glu Pro Pro Gln Ile Lys Leu Glu

195 200 205

Pro Ser Lys Leu Val Arg Ile Arg Gly Glu Ala Ala Gln Ile Val Cys

210 215 220

Ser Ala Thr Asn Ala Glu Val Gly Phe Asn Val Ile Leu Lys Arg Gly

225 230 235 240

Asp Thr Lys Leu Glu Ile Pro Leu Asn Ser Asp Phe Gln Asp Asn Tyr

245 250 255

Tyr Lys Lys Val Arg Ala Leu Ser Leu Asn Ala Val Asp Phe Gln Asp

260 265 270

Ala Gly Ile Tyr Ser Cys Val Ala Ser Asn Asp Val Gly Thr Arg Thr

275 280 285

Ala Thr Met Asn Phe Gln Val Val Glu Ser Ala Tyr Leu Asn Leu Thr

290 295 300

Ser Glu Gln Ser Leu Leu Gln Glu Val Ser Val Gly Asp Ser Leu Ile

305 310 315 320

Leu Thr Val His Ala Asp Ala Tyr Pro Ser Ile Gln His Tyr Asn Trp

325 330 335

Thr Tyr Leu Gly Pro Phe Phe Glu Asp Gln Arg Lys Leu Glu Phe Ile

340 345 350

Thr Gln Arg Ala Ile Tyr Arg Tyr Thr Phe Lys Leu Phe Leu Asn Arg

355 360 365

Val Lys Ala Ser Glu Ala Gly Gln Tyr Phe Leu Met Ala Gln Asn Lys

370 375 380

Ala Gly Trp Asn Asn Leu Thr Phe Glu Leu Thr Leu Arg Tyr Pro Pro

385 390 395 400

Glu Val Ser Val Thr Trp Met Pro Val Asn Gly Ser Asp Val Leu Phe

405 410 415

Cys Asp Val Ser Gly Tyr Pro Gln Pro Ser Val Thr Trp Met Glu Cys

420 425 430

Arg Gly His Thr Asp Arg Cys Asp Glu Ala Gln Ala Leu Gln Val Trp

435 440 445

Asn Asp Thr His Pro Glu Val Leu Ser Gln Lys Pro Phe Asp Lys Val

450 455 460

Ile Ile Gln Ser Gln Leu Pro Ile Gly Thr Leu Lys His Asn Met Thr

465 470 475 480

Tyr Phe Cys Lys Thr His Asn Ser Val Gly Asn Ser Ser Gln Tyr Phe

485 490 495

Arg Ala Val Ser Leu Gly Gln Ser Lys Gln Leu Pro Asp Glu Ser Leu

500 505 510

Phe Thr Pro Val Val Val Ala Cys Met Ser Val Met Ser Leu Leu Val

515 520 525

Leu Leu Leu Leu Leu Leu Leu Tyr Lys Tyr Lys Gln Lys Pro Lys Tyr

530 535 540

Gln Val Arg Trp Lys Ile Ile Glu Arg Tyr Glu Gly Asn Ser Tyr Thr

545 550 555 560

Phe Ile Asp Pro Thr Gln Leu Pro Tyr Asn Glu Lys Trp Glu Phe Pro

565 570 575

Arg Asn Asn Leu Gln Phe Gly Lys Thr Leu Gly Ala Gly Ala Phe Gly

580 585 590

Lys Val Val Glu Ala Thr Ala Phe Gly Leu Gly Lys Glu Asp Ala Val

595 600 605

Leu Lys Val Ala Val Lys Met Leu Lys Ser Thr Ala His Ala Asp Glu

610 615 620

Lys Glu Ala Leu Met Ser Glu Leu Lys Ile Met Ser His Leu Gly Gln

625 630 635 640

His Glu Asn Ile Val Asn Leu Leu Gly Ala Cys Thr His Gly Gly Pro

645 650 655

Val Leu Val Ile Thr Glu Tyr Cys Cys Tyr Gly Asp Leu Leu Asn Phe

660 665 670

Leu Arg Arg Lys Ala Glu Ala Met Leu Gly Pro Ser Leu Ser Pro Gly

675 680 685

Gln Asp Ser Glu Gly Asp Ser Ser Tyr Lys Asn Ile His Leu Glu Lys

690 695 700

Lys Tyr Val Arg Arg Asp Ser Gly Phe Ser Ser Gln Gly Val Asp Thr

705 710 715 720

Tyr Val Glu Met Arg Pro Val Ser Thr Ser Ser Ser Asp Ser Phe Phe

725 730 735

Lys Gln Asp Leu Asp Lys Glu Ala Ser Arg Pro Leu Glu Leu Trp Asp

740 745 750

Leu Leu His Phe Ser Ser Gln Val Ala Gln Gly Met Ala Phe Leu Ala

755 760 765

Ser Lys Asn Cys Ile His Arg Asp Val Ala Ala Arg Asn Val Leu Leu

770 775 780

Thr Ser Gly His Val Ala Lys Ile Gly Asp Phe Gly Leu Ala Arg Asp

785 790 795 800

Ile Met Asn Asp Ser Asn Tyr Val Val Lys Gly Asn Ala Arg Leu Pro

805 810 815

Val Lys Trp Met Ala Pro Glu Ser Ile Phe Asp Cys Val Tyr Thr Val

820 825 830

Gln Ser Asp Val Trp Ser Tyr Gly Ile Leu Leu Trp Glu Ile Phe Ser

835 840 845

Leu Gly Leu Asn Pro Tyr Pro Gly Ile Leu Val Asn Asn Lys Phe Tyr

850 855 860

Lys Leu Val Lys Asp Gly Tyr Gln Met Ala Gln Pro Val Phe Ala Pro

865 870 875 880

Lys Asn Ile Tyr Ser Ile Met Gln Ser Cys Trp Asp Leu Glu Pro Thr

885 890 895

Arg Arg Pro Thr Phe Gln Gln Ile Cys Phe Leu Leu Gln Glu Gln Ala

900 905 910

Arg Leu Glu Arg Arg Asp Gln Asp Tyr Ala Asn Leu Pro Ser Ser Gly

915 920 925

Gly Ser Ser Gly Ser Asp Ser Gly Gly Gly Ser Ser Gly Gly Ser Ser

930 935 940

Ser Glu Pro Glu Glu Glu Ser Ser Ser Glu His Leu Ala Cys Cys Glu

945 950 955 960

Pro Gly Asp Ile Ala Gln Pro Leu Leu Gln Pro Asn Asn Tyr Gln Phe

965 970 975

Cys

<210> 3

<211> 4006

<212> DNA/RNA

<213> 人(human)

<400> 3

gaagggcaga cagagtgtcc aaaagcgtga gagcacgaag tgaggagaag gtggagaaga 60

gagaagagga agaggaagag gaagagagga agcggaggga actgcggcca ggctaaaagg 120

ggaagaagag gatcagccca aggaggagga agaggaaaac aagacaaaca gccagtgcag 180

aggagaggaa cgtgtgtcca gtgtcccgat ccctgcggag ctagtagctg agagctctgt 240

gccctgggca ccttgcagcc ctgcacctgc ctgccacttc cccaccgagg ccatgggccc 300

aggagttctg ctgctcctgc tggtggccac agcttggcat ggtcagggaa tcccagtgat 360

agagcccagt gtccctgagc tggtcgtgaa gccaggagca acggtgacct tgcgatgtgt 420

gggcaatggc agcgtggaat gggatggccc cccatcacct cactggaccc tgtactctga 480

tggctccagc agcatcctca gcaccaacaa cgctaccttc caaaacacgg ggacctatcg 540

ctgcactgag cctggagacc ccctgggagg cagcgccgcc atccacctct atgtcaaaga 600

ccctgcccgg ccctggaacg tgctagcaca ggaggtggtc gtgttcgagg accaggacgc 660

actactgccc tgtctgctca cagacccggt gctggaagca ggcgtctcgc tggtgcgtgt 720

gcgtggccgg cccctcatgc gccacaccaa ctactccttc tcgccctggc atggcttcac 780

catccacagg gccaagttca ttcagagcca ggactatcaa tgcagtgccc tgatgggtgg 840

caggaaggtg atgtccatca gcatccggct gaaagtgcag aaagtcatcc cagggccccc 900

agccttgaca ctggtgcctg cagagctggt gcggattcga ggggaggctg cccagatcgt 960

gtgctcagcc agcagcgttg atgttaactt tgatgtcttc ctccaacaca acaacaccaa 1020

gctcgcaatc cctcaacaat ctgactttca taataaccgt taccaaaaag tcctgaccct 1080

caacctcgat caagtagatt tccaacatgc cggcaactac tcctgcgtgg ccagcaacgt 1140

gcagggcaag cactccacct ccatgttctt ccgggtggta gagagtgcct acttgaactt 1200

gagctctgag cagaacctca tccaggaggt gaccgtgggg gaggggctca acctcaaagt 1260

catggtggag gcctacccag gcctgcaagg ttttaactgg acctacctgg gacccttttc 1320

tgaccaccag cctgagccca agcttgctaa tgctaccacc aaggacacat acaggcacac 1380

cttcaccctc tctctgcccc gcctgaagcc ctctgaggct ggccgctact ccttcctggc 1440

cagaaaccca ggaggctgga gagctctgac gtttgagctc acccttcgat accccccaga 1500

ggtaagcgtc atatggacat tcatcaacgg ctctggcacc cttttgtgtg ctgcctctgg 1560

gtacccccag cccaacgtga catggctgca gtgcagtggc cacactgata ggtgtgatga 1620

ggcccaagtg ctgcaggtct gggatgaccc ataccctgag gtcctgagcc aggagccctt 1680

ccacaaggtg acggtgcaga gcctgctgac tgttgagacc ttagagcaca accaaaccta 1740

cgagtgcagg gcccacaaca gcgtggggag tggctcctgg gccttcatac ccatctctgc 1800

aggagcccac acgcatcccc cggatgagtt cctcttcaca ccagtggtgg tcgcctgcat 1860

gtccatcatg gccttgctgc tgctgctgct cctgctgcta ttgtacaagt ataagcagaa 1920

gcccaagtac caggtccgct ggaagatcat cgagagctat gagggcaaca gttatacttt 1980

catcgacccc acgcagctgc cttacaacga gaagtgggag ttcccccgga acaacctgca 2040

gtttggtaag accctcggag ctggagcctt tgggaaggtg gtggaggcca cggcctttgg 2100

tctgggcaag gaggatgctg tcctgaaggt ggctgtgaag atgctgaagt ccacggccca 2160

tgctgatgag aaggaggccc tcatgtccga gctgaagatc atgagccacc tgggccagca 2220

cgagaacatc gtcaaccttc tgggagcctg tacccatgga ggccctgtac tggtcatcac 2280

ggagtactgt tgctatggcg acctgctcaa ctttctgcga aggaaggctg aggccatgct 2340

gggacccagc ctgagccccg gccaggaccc cgagggaggc gtcgactata agaacatcca 2400

cctcgagaag aaatatgtcc gcagggacag tggcttctcc agccagggtg tggacaccta 2460

tgtggagatg aggcctgtct ccacttcttc aaatgactcc ttctctgagc aagacctgga 2520

caaggaggat ggacggcccc tggagctccg ggacctgctt cacttctcca gccaagtagc 2580

ccagggcatg gccttcctcg cttccaagaa ttgcatccac cgggacgtgg cagcgcgtaa 2640

cgtgctgttg accaatggtc atgtggccaa gattggggac ttcgggctgg ctagggacat 2700

catgaatgac tccaactaca ttgtcaaggg caatgcccgc ctgcctgtga agtggatggc 2760

cccagagagc atctttgact gtgtctacac ggttcagagc gacgtctggt cctatggcat 2820

cctcctctgg gagatcttct cacttgggct gaatccctac cctggcatcc tggtgaacag 2880

caagttctat aaactggtga aggatggata ccaaatggcc cagcctgcat ttgccccaaa 2940

gaatatatac agcatcatgc aggcctgctg ggccttggag cccacccaca gacccacctt 3000

ccagcagatc tgctccttcc ttcaggagca ggcccaagag gacaggagag agcgggacta 3060

taccaatctg ccgagcagca gcagaagcgg tggcagcggc agcagcagca gtgagctgga 3120

ggaggagagc tctagtgagc acctgacctg ctgcgagcaa ggggatatcg cccagccctt 3180

gctgcagccc aacaactatc agttctgctg aggagttgac gacagggagt accactctcc 3240

cctcccacaa acttcaactc ctccatggat ggggcgacac ggggagaaca tacaaactct 3300

gccttcggtc atttcactca acagctcggc ccagctctga aacttgggaa ggtgagggat 3360

tcaggggagg tcagaggatc ccacttcctg agcatgggcc atcactgcca gtcaggggct 3420

gggggctgag ccctcacccc cccctcccct actgttctca tggtgttggc ctcgtgtttg 3480

ctatgccaac tagtagaacc ttctttccta atccccttat cttcatggaa atggactgac 3540

tttatgccta tgaagtcccc aggagctaca ctgatactga gaaaaccagg ctctttgggg 3600

ctagacagac tggcagagag tgagatctcc ctctctgaga ggagcagcag atgctcacag 3660

accacactca gctcaggccc cttggagcag gatggctcct ctaagaatct cacaggacct 3720

cttagtctct gccctatacg ccgccttcac tccacagcct cacccctccc acccccatac 3780

tggtactgct gtaatgagcc aagtggcagc taaaagttgg gggtgttctg cccagtcccg 3840

tcattctggg ctagaaggca ggggaccttg gcatgtggct ggccacacca agcaggaagc 3900

acaaactccc ccaagctgac tcatcctaac taacagtcac gccgtgggat gtctctgtcc 3960

acattaaact aacagcatta atgcagtcaa aaaaaaaaaa aaaaaa 4006

<210> 4

<211> 972

<212> PRT

<213> 人(human)

<400> 4

Met Gly Pro Gly Val Leu Leu Leu Leu Leu Val Ala Thr Ala Trp His

1 5 10 15

Gly Gln Gly Ile Pro Val Ile Glu Pro Ser Val Pro Glu Leu Val Val

20 25 30

Lys Pro Gly Ala Thr Val Thr Leu Arg Cys Val Gly Asn Gly Ser Val

35 40 45

Glu Trp Asp Gly Pro Pro Ser Pro His Trp Thr Leu Tyr Ser Asp Gly

50 55 60

Ser Ser Ser Ile Leu Ser Thr Asn Asn Ala Thr Phe Gln Asn Thr Gly

65 70 75 80

Thr Tyr Arg Cys Thr Glu Pro Gly Asp Pro Leu Gly Gly Ser Ala Ala

85 90 95

Ile His Leu Tyr Val Lys Asp Pro Ala Arg Pro Trp Asn Val Leu Ala

100 105 110

Gln Glu Val Val Val Phe Glu Asp Gln Asp Ala Leu Leu Pro Cys Leu

115 120 125

Leu Thr Asp Pro Val Leu Glu Ala Gly Val Ser Leu Val Arg Val Arg

130 135 140

Gly Arg Pro Leu Met Arg His Thr Asn Tyr Ser Phe Ser Pro Trp His

145 150 155 160

Gly Phe Thr Ile His Arg Ala Lys Phe Ile Gln Ser Gln Asp Tyr Gln

165 170 175

Cys Ser Ala Leu Met Gly Gly Arg Lys Val Met Ser Ile Ser Ile Arg

180 185 190

Leu Lys Val Gln Lys Val Ile Pro Gly Pro Pro Ala Leu Thr Leu Val

195 200 205

Pro Ala Glu Leu Val Arg Ile Arg Gly Glu Ala Ala Gln Ile Val Cys

210 215 220

Ser Ala Ser Ser Val Asp Val Asn Phe Asp Val Phe Leu Gln His Asn

225 230 235 240

Asn Thr Lys Leu Ala Ile Pro Gln Gln Ser Asp Phe His Asn Asn Arg

245 250 255

Tyr Gln Lys Val Leu Thr Leu Asn Leu Asp Gln Val Asp Phe Gln His

260 265 270

Ala Gly Asn Tyr Ser Cys Val Ala Ser Asn Val Gln Gly Lys His Ser

275 280 285

Thr Ser Met Phe Phe Arg Val Val Glu Ser Ala Tyr Leu Asn Leu Ser

290 295 300

Ser Glu Gln Asn Leu Ile Gln Glu Val Thr Val Gly Glu Gly Leu Asn

305 310 315 320

Leu Lys Val Met Val Glu Ala Tyr Pro Gly Leu Gln Gly Phe Asn Trp

325 330 335

Thr Tyr Leu Gly Pro Phe Ser Asp His Gln Pro Glu Pro Lys Leu Ala

340 345 350

Asn Ala Thr Thr Lys Asp Thr Tyr Arg His Thr Phe Thr Leu Ser Leu

355 360 365

Pro Arg Leu Lys Pro Ser Glu Ala Gly Arg Tyr Ser Phe Leu Ala Arg

370 375 380

Asn Pro Gly Gly Trp Arg Ala Leu Thr Phe Glu Leu Thr Leu Arg Tyr

385 390 395 400

Pro Pro Glu Val Ser Val Ile Trp Thr Phe Ile Asn Gly Ser Gly Thr

405 410 415

Leu Leu Cys Ala Ala Ser Gly Tyr Pro Gln Pro Asn Val Thr Trp Leu

420 425 430

Gln Cys Ser Gly His Thr Asp Arg Cys Asp Glu Ala Gln Val Leu Gln

435 440 445

Val Trp Asp Asp Pro Tyr Pro Glu Val Leu Ser Gln Glu Pro Phe His

450 455 460

Lys Val Thr Val Gln Ser Leu Leu Thr Val Glu Thr Leu Glu His Asn

465 470 475 480

Gln Thr Tyr Glu Cys Arg Ala His Asn Ser Val Gly Ser Gly Ser Trp

485 490 495

Ala Phe Ile Pro Ile Ser Ala Gly Ala His Thr His Pro Pro Asp Glu

500 505 510

Phe Leu Phe Thr Pro Val Val Val Ala Cys Met Ser Ile Met Ala Leu

515 520 525

Leu Leu Leu Leu Leu Leu Leu Leu Leu Tyr Lys Tyr Lys Gln Lys Pro

530 535 540

Lys Tyr Gln Val Arg Trp Lys Ile Ile Glu Ser Tyr Glu Gly Asn Ser

545 550 555 560

Tyr Thr Phe Ile Asp Pro Thr Gln Leu Pro Tyr Asn Glu Lys Trp Glu

565 570 575

Phe Pro Arg Asn Asn Leu Gln Phe Gly Lys Thr Leu Gly Ala Gly Ala

580 585 590

Phe Gly Lys Val Val Glu Ala Thr Ala Phe Gly Leu Gly Lys Glu Asp

595 600 605

Ala Val Leu Lys Val Ala Val Lys Met Leu Lys Ser Thr Ala His Ala

610 615 620

Asp Glu Lys Glu Ala Leu Met Ser Glu Leu Lys Ile Met Ser His Leu

625 630 635 640

Gly Gln His Glu Asn Ile Val Asn Leu Leu Gly Ala Cys Thr His Gly

645 650 655

Gly Pro Val Leu Val Ile Thr Glu Tyr Cys Cys Tyr Gly Asp Leu Leu

660 665 670

Asn Phe Leu Arg Arg Lys Ala Glu Ala Met Leu Gly Pro Ser Leu Ser

675 680 685

Pro Gly Gln Asp Pro Glu Gly Gly Val Asp Tyr Lys Asn Ile His Leu

690 695 700

Glu Lys Lys Tyr Val Arg Arg Asp Ser Gly Phe Ser Ser Gln Gly Val

705 710 715 720

Asp Thr Tyr Val Glu Met Arg Pro Val Ser Thr Ser Ser Asn Asp Ser

725 730 735

Phe Ser Glu Gln Asp Leu Asp Lys Glu Asp Gly Arg Pro Leu Glu Leu

740 745 750

Arg Asp Leu Leu His Phe Ser Ser Gln Val Ala Gln Gly Met Ala Phe

755 760 765

Leu Ala Ser Lys Asn Cys Ile His Arg Asp Val Ala Ala Arg Asn Val

770 775 780

Leu Leu Thr Asn Gly His Val Ala Lys Ile Gly Asp Phe Gly Leu Ala

785 790 795 800

Arg Asp Ile Met Asn Asp Ser Asn Tyr Ile Val Lys Gly Asn Ala Arg

805 810 815

Leu Pro Val Lys Trp Met Ala Pro Glu Ser Ile Phe Asp Cys Val Tyr

820 825 830

Thr Val Gln Ser Asp Val Trp Ser Tyr Gly Ile Leu Leu Trp Glu Ile

835 840 845

Phe Ser Leu Gly Leu Asn Pro Tyr Pro Gly Ile Leu Val Asn Ser Lys

850 855 860

Phe Tyr Lys Leu Val Lys Asp Gly Tyr Gln Met Ala Gln Pro Ala Phe

865 870 875 880

Ala Pro Lys Asn Ile Tyr Ser Ile Met Gln Ala Cys Trp Ala Leu Glu

885 890 895

Pro Thr His Arg Pro Thr Phe Gln Gln Ile Cys Ser Phe Leu Gln Glu

900 905 910

Gln Ala Gln Glu Asp Arg Arg Glu Arg Asp Tyr Thr Asn Leu Pro Ser

915 920 925

Ser Ser Arg Ser Gly Gly Ser Gly Ser Ser Ser Ser Glu Leu Glu Glu

930 935 940

Glu Ser Ser Ser Glu His Leu Thr Cys Cys Glu Gln Gly Asp Ile Ala

945 950 955 960

Gln Pro Leu Leu Gln Pro Asn Asn Tyr Gln Phe Cys

965 970

<210> 5

<211> 4629

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

cagcaagtca gggtctgacc acttgcccta gaaatcaact atgaaaagtg attgctagag 60

gcaggaacag acttgaagcg tccaaggccc tgtctctggg gaagagttca ggtttaacta 120

taagaagacc tggttcagcg gggcaagagt cctgctcaca gtgggtgctg ttggatttta 180

ccagttggtc ccagaggagt tattcctggc tttcatggct tgaggaaaca gtttggtccc 240

catggctcat atttaggggt aacttcattt cttctcatgg ggtgaccgct ctcacctagg 300

gggataatgt catcatggag tgatttgtct acaggacttg ttatttttgg aacctagaat 360

aagtttggtt taggacaatt agtggagact tccagttgct gctataggag gctcattact 420

gtcaaagtcc aaatctccag ttaccttgag gccttctgcc ttaagggcag atgagaaagg 480

tatgaagaat gtaggataac ctgacctctc tcagccaggc tcactgctca tctgggagac 540

tcttatttat gctcctgact cagaggctgc tgctcttggg tatgactcct ctcctaagtg 600

tccttagagg tggtttccta agtctctcaa actccatcat ctcccttcag gatcagttga 660

gcctggcccc agattctgcc tcttcctctg gtgtgtggtg tgtgtgtgtg tgtgtgtgtg 720

tgtgtgtgtg tgtatgtgtg tgtgctttgt tttcttctag agacccaata tttccaaatt 780

ctgtagttcc ctttcaggca acctaaaaaa aaaaaaaaaa aaaaagggga agaggagcca 840

gtgcaacaga caggaacgtg ttcatctgtt cccgtcctca cagaactagc agctgggagc 900

cccgtgccca gccgactctc caacctgcat cggctcacgc tatcccctgg aggctatgga 960

gttggggcct cctctggtcc tgctgctggc cacagtttgg catggtaagg ggagaaaagg 1020

ggagtcctgc tgggggagtg ttgcaaagag ggcatcgctg tcctgcagta gatgcctcat 1080

tctctgcttc acttctctgg cataagagtg cagatttgtg tttatctgtc gagaagagta 1140

ggtgagagtg ggtggaacca cccggggcca gtgctgtgga tgtgtctgag cctaggcttt 1200

gactcacggt gtgctctgag tgtgaccctg gtattttcag gaccaccatc cacatctact 1260

cgtctgcagg tgggagggag ggcggtagtg ggctaacctt gagtgcagcg ctttggggtg 1320

ttacctggga gtctccttta aggcagattc ccataggtct tggtcaggac tgagattcgc 1380

atttctgagg aaatcttatg cgtcagggct gctcaatagc ttttgctgtt cttctttgag 1440

tggtcccacc agctggacag cccagcaggc tgtggttaat taggacctgg cccattcttg 1500

gaaggcttgg gtgaaaaggg tcagggtaga ggaaagaaga ggcctttttg gcccaggact 1560

caagggtgaa aagtttggac aggggtcgga ggagaacacc cgtgagtgag agatcctatg 1620

aataagcaag gaaggatgct agagaggggc ctggggaagg ccagagaggg tctccctaga 1680

cactgtcttc ctaggtctct ccccccaact tctcgggcag cagaagctgc ttcggaactc 1740

ccattcttgg aggaggtctg gctgagggtg agaacgaaca taaatggccc agtgcagcgc 1800

aaggatccca tctaggctcc agctggccta gcacacacat gttctatacc acaccactgc 1860

ttatttggaa agaccttgag ggaagatgct ggggaaggac aggctcattc tggtccctgg 1920

ggaattggtg agatgacagt ccgtggaagg ctctttgctg gctcagccga tctcactggc 1980

tcgtgcactg gcacattcct agtagaatgg gattggtatg tatgcatgag aaagcacaca 2040

ttcttaagaa tactgttaaa gggcatgtga cagatgtgtg tgtgtcaatg cagccctgac 2100

tcagctaaga aagagacaat tattattcct ctcatgccag aaaatcctgt gatttttggt 2160

tcactgcttt tcagtcttta tctcgagggc tgcttgtggg gcagagtgtg tgagtggctg 2220

catgcctgcg tgtgtgtgtg tgtgtgtgtg tgtgtctgtc tgtctgtatc cagctccaaa 2280

aggaagagaa gttgggagat atcagtggaa agcctggggt tttaacctgg aaaattattg 2340

gtgtgtgggt gggaccatgg gggcttctgt aggagctgga atagtgttga agcatttagt 2400

ggcagagaga gagaaagaga gagagagaaa gagagagaga gagagagaga gagagagaga 2460

gagagagaga gagagagaga gagagactgg cctcttctct ttgagtggta gtcatgagtg 2520

caagaggttg gggagcctcc tggagctgat ggtggaagag tccattttgc aagtacaaag 2580

aggagaaagt ttgggtcatg gggagaattc cagaagggag atgcgagatg aagaatggcc 2640

aggatcaggg catcagtggc catcaagtgc tcatccaagg gaaggtagtg atcagcgtgc 2700

ttccctcccg ccaaccctgc cagcgggaag tgagaccatc atgcggctta cgtggaattc 2760

gtcagccctg ttctgtgtaa atatccaggg caacaggcta ggcagaaata agaaggaagc 2820

ttctctcgga gcacatttcc tggaggccaa gacaggagac aaagataagc agagcagagt 2880

agcccgggag aagggagaag tgtctggaac ccaaagatgt gtcctgtgac ctttagggtt 2940

aaggtcctta gctaccacat agcaggccca agagggacat tagcagtacg gcctgagaac 3000

agcaggtggg tcaggaggac tccactgccc tctaggtggc cgctgggatt gttctcacag 3060

gacagaagaa tatctgatgc tcagagggtc aatggctatc agggtcccta gccatagtca 3120

atgtgagccc agggtgaaat agctcgtccc tcttcctgct gatcactgcc caggagagcc 3180

agagccctac atcagcagca gcacactgct ctcctctgtt ccacatctgg ctggttggag 3240

gcttgggcag acaggccaca tgtttccaaa gagtttgaat cagagtgagc agacattaaa 3300

ccaggctgaa atcatctgtg agatgagact ttccatttct gggctcgtgt gtgtgtgtgt 3360

gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgacccact gagagcggtt gtaggaaacc 3420

ctgaagtcct ctaagggctt gatgccctta gggctgccct gtcactgtgt aggaagggtt 3480

gacttgcggg gtcagcaaac aggacagtgg cacagcacag acagactgtg cccagtgtgc 3540

tctgaaaccc agcactcctt gccaagagtc cctcagtgtg tgagaaggac aatggccagg 3600

aggccaggga agcagaagtg agagcccaag tgtcgaaggg ccacaggctg ggcggaaacc 3660

agggccagcc gggtgccagc aatgtgtttc cgcccacaca ggccgggggc gcctgccagg 3720

ccctcagagg ctgtgaatca gttctcactt ccccccttcc cccctatttc aagcctggga 3780

aaaatgctga caccacacag gcaacgagcc tccttcccta agacctgaca gggggtttga 3840

gttctccttt cgccttcaag caaattttcc ttaaaagaga ttggctgcca agaaacccag 3900

caggctcaga gaagcgaggg cagactgggt acctcagcag actgggtacc tctctccttc 3960

atgagcatgg cattctgagc ccccaatgag tctgtactgg agcaggggat gacacaacgg 4020

tttcctggca tctgaacagc ttagcatggc ggggcaatgt gctcactgtc tgcacttgtg 4080

ggtgaaaaga caaaagggag gaggaggatg gatggtctca ggccacccca cagcgcacag 4140

acccgatgcc cagtggtagg agtgggggca gcaggagaca cttggaagat ctctttctac 4200

tgggctaaga actcatgtgt cttttttttt ttttttttct ttcccaagtg aaggaagatg 4260

gcccaggact tggccatctg tttctccatt ggcttatttg aaacatgtct tacttaaaca 4320

ggcttggcct gcttagtaca cgagattgat ggtgccctct cctgggatgg gaaacgatgc 4380

caaaggctgg gcctccgtgg ctttgtggag aagcctacat gtgtggctaa ggaggcgccc 4440

acgtaggtct cagggatgag cctcctgaga gtggcagatg tcaatagagt tggaagctga 4500

ttgaagggtc cagactcatt ccagaaccag agccagagct atcccttcca aagcatggtc 4560

cagtgttggg ggacatctgg ggtgcacccc aggcctcact tgtgtctgcc acctccttca 4620

ggtcagggg 4629

<210> 6

<211> 4516

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

ctgtccttgg agaaacacaa aacccttcct catacggaac taaaagctgt ctctggtgcc 60

ccataagcac caggatctca gagctctttc tgccttgact gacaggcctc acctcatggt 120

ggtctaaggc acctcagctc tctctacaac accattttct gaatatatca ccctgggtac 180

cgtctcattt cccatccagg aaacttacct gcttcttatg tagcccaaag ccaggggacc 240

tgcagcctca ggctggcctt ttctccttca cccttggatg tccattgact gagttgctcc 300

tgaaagaaag acctgaaaga ggcagtctag ttagcagctc tcttctggcc aacctctttg 360

taggtagggg acttggcccc acctgtcttt atccccaggt ctgagtgaga catggcctgt 420

ctatggaagg gttgtttctg ctaagggctg agttgagtca tccccttctg tcccccagag 480

aaaccacaac agtggggaag gcacagggga agaggaaagg acccgagtca gctggcccca 540

gggataggga aaaggtaggg aggatgatgg gtagagagaa gggaagggta gactcagaaa 600

gaaaccactg aacagatttt gggcccaggc ctaaattgaa ggaggagggt ctggagagct 660

tccaggagaa atgcccaggt ctttaccatc cccaggctca atacctaccc cacagaccaa 720

gggcctgatg gggagggtgg ccaaggtctg atgttcccaa gccctcttca atctctgtca 780

aggaatcagt ggagagcctc aacttagagc tagcatgagc aaccagtgaa ttgatctgca 840

gtgaggattt agctaggccc agctcccaag aaagcaaagc attccagtca tccctccttc 900

taggaaggga cctcacaggc cactctacct tcacaaggac aggaccccag agtcaccggg 960

gacggaaaga attcttgagg ttggcagggc ctccgtgctc aaatcatgga ttcggccatg 1020

ggagcttcca gctgaacctc ccttccccct cagaccatcc cttccaacat tgtcctagca 1080

gaggtgggag ggctgagtca gcccagctgc agaggaacaa gggaagcaga agtggctaga 1140

aggaaaacag ttgcagccac agagactcct ggagatggaa gatggaagtg acgggagggg 1200

tcacccagcc ggagggagtt cctctccaga gctcacttca gccactttgc ccaagccata 1260

acatacactt actttattgt tgctgttact agaagtggtg ttttgtgttt gtttgtttgg 1320

ttggttggtt ggttggtttt gttttgtttt gttttgggga ctgggtctcc tatagctttg 1380

aggatggcct caaactccct ctgtagctaa ggctggccat agacacccga tcttcctgct 1440

tccatctccc aaggatgcca gtgtgtgtct tcatgcccac tgggtgtcct tccttatgtc 1500

taactacagt cttctctctt aaagctccag ctggaaggtc ttccttgtag ctacataaac 1560

tctcctctgc ctgtaagact tcagcaatag gctacctcct ccccaacact aactcatgca 1620

tcctttagct cttcttgcta agcacccttg aaggaaggac cttggttgct ggacacagcc 1680

cagtccctgt ccccaaggcc tgactgaaca caagttggtc aggggactga aagtcttggt 1740

gtcctccacc accccagcct agctttcact gtcccatata tgtggccttc cctcagttct 1800

tctcagggca gctcttggca tgatgccctc atgcagttgc ccctggggca gggaaaggtg 1860

aagtactcac tccctctgct actgagaacc tgagagggaa ctggagacag cagaatgtgt 1920

gatatgcagg gcaccccctt tgtgggaggg cacttcctca gcacctttcc ttcttcctag 1980

agttaggaga cagcccctgt cttagaggct tcctgacctt cctgcctgga ggctcccctc 2040

tatttactaa gtcacatggt cacctaccta tttcccgagt ttgtcaggat cgtacccatc 2100

tcaaggctgc ccagcatctg tgggctctat gcctggaaca cttacttctg cctcctcagg 2160

gactctctta taccattctc tgccctgtca ccctgcttcg taggcttcat gaccttattt 2220

tttttttcaa atgttttaaa acatttgttt ctggggctgg gaatatgact cagaggttaa 2280

gagcactgac tgctcttcta gaggacccag gctcaatttc cagcaaccac aggttgattc 2340

aaaatgatct gtaagcccag ttctagggga tccaaccttc tcttctgacc ccgttggata 2400

acaggcatgc atgtggtgcg acagttatac atgcaggaaa aacacccata tacataaaat 2460

aataaaaaat taaaatagca tttgttagta tgtattgatt atatactata ctataatata 2520

taatgatgaa tttcttgtga catcttcaaa catgtaccta atgtatattg atgatattgt 2580

tcacattcac ctcccattac cctcgtcccc cgctcatatc tgctgttccc ctttctgtcc 2640

ccaaactcct ctttcacttt aatttgtgta tgtgtgtgtg aatatgtgtg tgcttgctcg 2700

caggtgtatg tatgtatgta tgtatgtatg tatgtatgta tgtgtatata tttgtgtgtt 2760

tgtgtgcttg tatgtatgca tgcatatgtt ctaatatcta tcattagggt tgcttgcaga 2820

agtgtaggtg agttatttat agagattaag ctatacaatt gaagaaaaca tctctcccac 2880

caccagtaat cactaactgc ctgcagatat tcagggtggg gagcacttgt gagcctctcc 2940

ctcctccacg acgggatgtt gataagactg atcctgtcag gatcttaggc aggtacccac 3000

agctgctgtg agttcagcgc agcaggcaca tcacgcccgg ctgacagtag tgcctaaccc 3060

tccagacgat gccagctctt gtattctttt ctatggtgtc ccctgagccc cagagcgatg 3120

cagctggctg tctcctttat ggcccagtgt tcactggtcg ctcactctca gcactttgtc 3180

agtcatgagt ctctgcagtt actgctgaca gttgcaaaca gcagcttctc caaggaaagc 3240

cgagaacagc actatctatg gggacaggca gacttattta gaaagttagt tgacaggcac 3300

tactgtatcc atttagcaaa acagcagctg gacagtcccc actaaggcta gtaccctccc 3360

tagccaggag cttttgacca aaattacagt accagatgtg gcttcaacct gtagcctcaa 3420

tgtcaatcag aaagcataca gacactccaa tagcagaccc gactttattt gcacgtcttt 3480

tgaggcatta tctgactgtt ccctatttat ttatttaagt tgaatgtctc ttttagccat 3540

tcaaatgcca gccccacagg gccaatcaag gagttgatca tgcatgatga tagaaataca 3600

tgctcaagag gcaggcagat ttctgagttc gaggtcagcc tggtctacag agtaagttcc 3660

aggacagcca aggctacaca gagaaaaacc ctgtctcgaa aaaacaaaaa caaacaaaca 3720

aaaaaaaaaa aagaaagaaa gaaatacgtg ctcagtaaaa tgtctgggag gctgtattgt 3780

tcagcctgga gaagagagca aagtttgact tcagtgtagt tgagatgatg agatgatgct 3840

cagcgaaagg aggcggtccc aaaagatgtc acgtgactgt tgatacgaaa tactcagaac 3900

agtaaaataa attcatgcct tccagtggct agaaagagcg gggggagggg ggagtagggg 3960

agtgctctcc actggccaca gcagagcttg tttctacaag gtcagaagag ttctagatat 4020

tggtttccta tcattactaa taaactcaat accaccgagg tatatgcttg aaatgtttgg 4080

gatggtacat tatctgtttt gtatacttca ctagaattga aaaagaaagc agggctggag 4140

aatagcttag ttgtatagta tgttcttaca catatataag atcctggccc aatccctagc 4200

acccaaaaca gaaatgggaa cataaactct ttgggtgagc aagtggacag gtccatgaat 4260

aatgagtgga tagttctcaa cttctaccct cctccacctt ggcccaggaa atgtcaaata 4320

cagagtcatc aagggagaac tttgggaatc atctgagtct ttgagtgaac agttttaaat 4380

gagtctgagc cttgacgaag gagggaaggt cacatagtaa aggcagaatc aagcacagac 4440

tagttttgga tgctctgtcc acaagatgcc atggtccctc tcagcacata gtaggctgac 4500

aagcttctgg attgtc 4516

<210> 7

<211> 12727

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

atcccagtga tagagcccag tgtccctgag ctggtcgtga agccaggagc aacggtgacc 60

ttgcgatgtg tgggcaatgg cagcgtggaa tgggatggcc ccccatcacc tcactggacc 120

ctgtactctg atggctccag cagcatcctc agcaccaaca acgctacctt ccaaaacacg 180

gggacctatc gctgcactga gcctggagac cccctgggag gcagcgccgc catccacctc 240

tatgtcaaag gtgaggagtc tgagcctcct cccaagaggc ctgacccggc aggccccact 300

acaatgggcc ctaaaattaa caatcgtaac aattcagctc tgcatttact gagtgctggc 360

tatgagcaag gacctggaag agctgctaat gtaatgcagt cctcacaaca accctgcaag 420

tcgggtctat gatgatgcat tttctagaag tgcagggagg ttatccaagg tcacacagcc 480

tcacatagtg ggactagact ggagcccagg tgcgcctgac tctggagcca ccacgctgaa 540

gcatccgctg aactgtcctg gcgtggtgtg acctcagatg aatgatcagc ctctctgagc 600

ttccttgtca cctatgtcca ggtactcctt ggcccagtgg agggagggca gttgtaaccc 660

tgtgccctcc tctactctag accctgcccg gccctggaac gtgctagcac aggaggtggt 720

cgtgttcgag gaccaggacg cactactgcc ctgtctgctc acagacccgg tgctggaagc 780

aggcgtctcg ctggtgcgtg tgcgtggccg gcccctcatg cgccacacca actactcctt 840

ctcgccctgg catggcttca ccatccacag ggccaagttc attcagagcc aggactatca 900

atgcagtgcc ctgatgggtg gcaggaaggt gatgtccatc agcatccggc tgaaagtgca 960

gaaaggtgcg tggggcatgg ggaccggcag ccaggcctga agagtgggga cagagagccg 1020

gcggccacat gggtggtgac tggggactgg gtgtgatggg gggcagtggg atgtcctctt 1080

tctttcactt cttcccctca atggttccac gatcatctat ggggcaggac tgacaaggtg 1140

tcggggcagg gagacaaacc acatgtgagc aaataactca gtgggcaagg tcatctcaag 1200

tcattggaca tgctacaaaa ataaacattc aacatggtag ctgaataagg agtgtgtagg 1260

gcggggagcc tcactgagaa ggaaacactt tattagagcg gaaatctgaa tgacatgaag 1320

aaggtggctg tgcaaagatc tgcttcagca gggggacagt gagtaccaag tggtgaggtg 1380

gggacaggct ctgaatgttc taggtatgga aagaggacgg aagctcagcc tcagacatgg 1440

atttcccact gggggcctgc ctaaggccaa gtgctgggca tgtgtaggag ggatgctgag 1500

ccaagaggca gggaggagat ggtgggtgcg tgtgatggct ctcgcggtgg ccaggtaaca 1560

gtggaggtgg agtctcaccc tgctgggatg gcaggcagga ttctggtttc tgggaggact 1620

ggtgagagca agcaggaccc cagcctgagg acctgggctt gagacagcaa tcagtccctg 1680

taacaagggc cagggtcaga gtgaagcagc tagcccaatg ccactgggat ctgaagccac 1740

taaacctgcc cagggggtca aaggacccca gctgtgtggg cagaggaggc cattagggct 1800

ctttcctggc atttcatcct gcagagccct gggctggcca agagccaaag gtcctgggcc 1860

ctagttctgc cttgacaccc cctcagggac cttgggtgag tcctttcatg tccctgggcc 1920

ttaggaatct ggattagatt atctttcaac agcagcaatg ggcataaata tgaattcaag 1980

gcctactgtg catcaggcat cttgctggct gctggaatat tcctgtcacg gatttgacat 2040

tcgactagag tctaactatt aaatagaaag taaatacaaa tgtgatgagc aagaaaccaa 2100

gctggggagt ggcgggcatg gaggtgctgg ggaggctaat tcatatcagc tggtcacaga 2160

agccttgctg aggaattttt gagctaaaga tctgaaggat gagaacagcc tcccatttga 2220

agtgtgggag gaaaggcatt ccaggaggga aaggtgggtg caaaggccct gtggtaggaa 2280

agaggtccag cgggctgcag tgcagtgaac aaggggtggg gttatcaggg cggtcagaaa 2340

caggttgggc tgtggaagga ctttgacttc ttttctgaga gtaatgggaa gccccaaatg 2400

tttacagagg agagaggcat ggtcccattt atatttgtaa gaggtcactt tagtgaagaa 2460

tctaggtgtg gggggcttgg agggaggcag ggaggtctct gaggaggctg gtgcagaagt 2520

ccagagtgga gaatggtgac gggactgggg aggggtagag gtgatggaga aagtagactt 2580

tccaaggtct ctttaggaca ggccttgcag tggggggact gggagcatca aggctgcctc 2640

ccaggatttg ggatggggca gtgatgggga ccctggcctg tgtgtcctgg cccatggcag 2700

ggaggagagc aatatctcta tcatgttcag ggagcctggg tgttcagggg tctctccccc 2760

ggtctcagtc atcccagggc ccccagcctt gacactggtg cctgcagagc tggtgcggat 2820

tcgaggggag gctgcccaga tcgtgtgctc agccagcagc gttgatgtta actttgatgt 2880

cttcctccaa cacaacaaca ccaaggtcag tccctgcaga tcacaaggtg aagtctggcc 2940

atcctcccag cacaccaggt ttcccatggt ggagtcctgg gcccccaact ccaaactggc 3000

tgtcttagct gaaggcacag ctcagactcc agagaggggt gcagactcac ccgagatctc 3060

actcccagtc agtagctgac acagaatcag gactcatgct tgtgccgctg aactttgtgg 3120

gggtgggtgg ggggaggtgg ttctctgtca ccttgacaca tggcctttgc cccagccttt 3180

agacaaaagc cagaggtgag ctcacttctg atttagcaag ggtttcctag gccaccattg 3240

aagcccagga atataacagc tatttcagaa agacattggg agagagggag gaggagggag 3300

gattccagga gggactcacg ttgggctgcc tctaagagcc ccctcccttc ccactgcacc 3360

tgccgtgttc cagacacagc cctaagccac ttgcatgcat atctcattta ctcctcacta 3420

cagtcttggg gcagggagcc agtattagcc ccattttaca agtgaagcaa caggctcaga 3480

ggaaaggcag atagtaatcc ttaaaggctg aggattggaa cccagatctt tctaatccct 3540

aaactacctt ggtataacat ctccattcct tctggctgca gctcgcaatc cctcaacaat 3600

ctgactttca taataaccgt taccaaaaag tcctgaccct caacctcgat caagtagatt 3660

tccaacatgc cggcaactac tcctgcgtgg ccagcaacgt gcagggcaag cactccacct 3720

ccatgttctt ccgggtggta ggtaagcatc agggtggtgg tggacagtcg gtagggatcc 3780

tgcaggagtg tgagcagaag ggttttgagg aggaagctga tgtcagggaa ggagacctgc 3840

tgaggatatc tctgctggag tttgtttatc caaggcctgg ctaaggagcc actctccagg 3900

agctttccct taccctctcc tgggatctct ctcccatctt ggagctctta cagtgcatgg 3960

ctgcattggg tgcaccttag tgccattttt tgtttatttg gggattgggg tccagtagct 4020

ccctactgga cttcatttgt tcattctttc atgcattcct ttatggaaac atgaaaagac 4080

aatgatcacc cagtgattat gggggaagca caaggtgtcc tgggaacact gaagagtccc 4140

cccaacccag gcttcgagaa ggtggcctct aaactgggat gggaagaatg aaggtgagtt 4200

ggccgggcag aagggtggga aaggaagggg aacagcgctt ctggcagagg gaggaacata 4260

tgcaaggctc aaaggcaaag agaacataga tcatttggaa cactgaaaga acttgacaac 4320

agctgggatg tggagtggtg tgaggagtgg ccacagggga gcagaggagg tggcagaagc 4380

cggaggtaaa ggtgtcttaa agtgagaaag aataactgca tcttaaccta ttgggaggtc 4440

attgtaaaga ggagagtgat ggggtcagat tgtacagagg aggcacttcg tggtggtcag 4500

gagcacacac tccagggcag tgttccaacc tgagtctgcc aaggactagc aggttgctaa 4560

ccaccctgtg tctcagtttt cctacctgta aaatgaagat attaacagta actgccttca 4620

tagatagaag atagatagat tagatagata gatagataga tagatagata gatagataga 4680

tagatagata gataggaagt acttagaaca gggtctgaca caggaaatgc tgtccaagtg 4740

tgcaccagga gatagtatct gagaaggctc agtctggcac catgtgggtt gggtgggaac 4800

ctggaggctg gagaatgggc tgaagatggc cagtggtgtg tggaagagtc tgagatgcag 4860

ggatgaggaa gagaaaggag ataaggatga cctccaggtc tctggctatg gtgattgggt 4920

gcaggcagtg gcagtcactg gactcagacc ctgaagcaag gcagcagctc atcggagtgg 4980

gagcaggctc tgagacattt aggtctggcc gtgcctcatg tgttgaatgt tatgggagat 5040

ggaggtggcg aggagcatga gaatcatgag catcactgcc cctagagtat gtgcaaggca 5100

ctggacttgc agcagattgt gagctctgct gtggacccca atctgcactg ggagctttgg 5160

cagggtaaag gggaagaaga gcaaaagcac aagaattcag ttacggcttc taatcctgtc 5220

tgctttctag tacaggcata cagtcatcac tcaagaaatg tttatgttca ttcacacttt 5280

gggccagaca ctgttctaga catcgaggat acagctgcaa gtgaaacaga tacaacaacc 5340

cccgactcat gaagtgtgtg ctctagctgg gagtgggcaa gcaatgagcc aagtaaatta 5400

ttaaaaaaac aaattatata gcatttgcag cttcagatag ggtgttcacc aaggaagatc 5460

tcactagaaa gctgatattt gagcaaaggc ttaaattgct gaaggagcaa gccatgcggc 5520

cattttggag aagggagctc catcctgcag cgggactgtg cttgccatgt tcaggggaca 5580

agtgggccag tgtggctgcg gggagagagt gagaaaaaaa gtggtctcag atgaggtcag 5640

agagctaaag tgggaaggtg agatgaaagg aggctaccgc agtggtccag gctggagctg 5700

atggtgggtg gactagagtg gtaatggtga aggcagcagg aagttgttgg tgtttggatg 5760

gatgaatgga ctaatggatg gatgaataat agatagatgg attgttgaga gagacagaga 5820

agagaaaagc cttgccccca aaagctcaca gactacttgg agagagaaga aagctacctg 5880

gagggagaac cagatgcatg aagcagtgca gatgtggtgc ctaatgagtg tgtagtctgg 5940

aagggcagca aaagtcgagt ggagtgagag gttcctgtgt cctggagcac tgagtagaga 6000

ctccctcatg ggggtgaatc ttaaaggata aaggggcctc tataatgaaa aggaggagga 6060

tgggatttct ggtagaggaa attgcttgag caaaacctcc aaggttggaa tgactatggt 6120

gtgttcaggg atgttaggag acccagatgg gtggagcgtt gagtgtgtgt gtgtaggaag 6180

gaagagggga ggtggctgga tgagcacagt gagacctgat ttgattgaga gccttgaacg 6240

ccacgctgaa taatggaggc aatgggactc catagagggc ttttgagtag acatatatca 6300

gtgtagaagg gtgaatttca gatttttaga cagaatagag taaggagagg agctcttaga 6360

aatcatctag tccagggctt gtggcagagc cctgaggttt taagaaggca tgtcaggggc 6420

taccatgaca ggcacggaga ggctgagtga attggggttc ttgccacaat tcccttgcct 6480

gagattcaac aagagcagct gtattacaat ctgtgcaaaa tgtcattagg agaaactagt 6540

tagtagctgg gcgtggtggc atgcaactgt tgtcccagct actcgggagg ctgaggccgg 6600

agaatcgctt gaacctggga ggcggaggtt gcagtgagca gagactgtgc cactgcactc 6660

cagcctggat gacagagcaa gactctgttt caaaaaaaaa aaaaaaaaaa actagtcagg 6720

actctttcag atacaagtaa tagaaaccaa ctcaaactgg cctaattaaa aggatttttt 6780

tccttatagc taaaaagctc atggatatca gcttcaggaa cacttggatc caggtgttca 6840

gctgatgctg gaaagaatct atgactcccc aactctcagc cctgccagga aggctttccc 6900

cttgtaggac tccgactatc cgccttgtag tatctgatcc agcaacacca gtaaaatgag 6960

ggcttctctt ttcccagagt cttaacaaaa atcatggaat tgagtgttat ggactcatgg 7020

attcatggta acccaaacca atcaccgggc cagaggggac agagtaccct cactggttgg 7080

cctgggttac acacctactc cagagctata tttggaagcc gcattgacta atttatgacc 7140

agaagaaagg gaaatggatg aggacacgtg aaattgtgtg tgtatgtgtg tgtgtgtttt 7200

cttgctgcca aaaatttttc aaaaacttgg aaaatcacag atatattcaa tctcttcatt 7260

acacaaataa ggagatggag gcacaaatgg ggatagggat ttgcccaggt tctcctaggg 7320

cttcagtgag aaaagttttg atccagggat tctgaagggg gtggtgagaa gaggggtgtc 7380

agaggacctg tcttgggtgg tggggactat gtacctgtga catagctgct cagggactgg 7440

atcaatgggt ggatgacaaa atggacaaat aaacaaggac atcttcccac taatgccaga 7500

tgcttgtgtg ttctgctttc cagagagtgc ctacttgaac ttgagctctg agcagaacct 7560

catccaggag gtgaccgtgg gggaggggct caacctcaaa gtcatggtgg aggcctaccc 7620

aggcctgcaa ggttttaact ggacctacct gggacccttt tctgaccacc agcctgagcc 7680

caagcttgct aatgctacca ccaaggacac atacaggtac cacttatcag ctcccgtcta 7740

cacagcccga caaccagatg gggtatgctt cagcaagcat caggacgctt ggctcatgtc 7800

ccaaccttgg tgtatgacct tgagcaagtc cctgcccctt tctgggcttc gctttccctg 7860

acttcatgga atcccaatat tggtcatctg tgtttgagat ctagatgaaa ttgacctacc 7920

tctccatccc acatccttgg gatagtcaat gccccaccca aggattctac catttcttgg 7980

gagtgtgcat tctcattggt ccctcaagaa ccctcagcct cattcatttt cctctcttgg 8040

ggccaatcca aatgcagaaa acagccccac tcatagacac actcctgata atgactgcac 8100

aagttatctg ctacatacaa aagcttggag ggaggggaag agggaattaa gatcacacaa 8160

tcacagatac atgaaatgtt ctttaaagga ttgtgatcac ccagccccaa gaatttctca 8220

ctggctgctc ttctctgtaa gctcaaaact cttcccatga agtgcaatct ataataactc 8280

cacacccctc ttcttccgtc tctccactcc cacaatcctg tgtattccac acacatttta 8340

gaaatctttt tcctgtctgc ttgtgaactg tgttcttggg gtcttgcttt ctcatccaaa 8400

gtggcttaag caggtaggtt ctaaataaga aagctttgtg cctaagagga acactcatac 8460

caggtatatc aggtattaac tcaggtatta aaatagttcc ttcttttctt tctttttatt 8520

atttttttta gatggagttt tgctcttgtt gctggagtgc aatggcacaa tctcggctca 8580

ctgcaaactc ggcctcccgg gttcaagtga ttctcctgcc tcagcctccc gagtagctgg 8640

gattacagat gcccaccacc acacccagct aatttttgta tttttagtag agacagagtt 8700

tcaccatgtt ggccaggctg gtctcgaact cctgacctca ggtgatctgc ctgcctcggc 8760

ctcccaaggt gctaggatta caggtgtgag ccatcgtgcc tggcctgaaa taatcattca 8820

taccctgccc tttcagaggg agacagtaca gcttaagggc agcgaatacg tggtgtgcat 8880

gccacactca ctctcattct tgtttctgca actctgttct gcagagtgta gatgcggcct 8940

cagagtcctc ctcaacacag gtcccaggca gtatttccag catagttggc tcatgagaga 9000

tctgtttgtc atccctgtgt ggatccctta gacaacttca aaactctttg ggattctcgt 9060

tctagctctg gaagcccaaa cctcattgat tcccacaatc ttgcttgtca attgtcagaa 9120

gcaacaagga tgttttcttg tcctcatctt cctcctctca gttcccttct ggtcctttct 9180

ggccaggtct ctgtcttcct ctcatttaaa gcagaagttc tgaatctgga atgtgtaggc 9240

cctttggagg gggctggtcc atggatcggt ttaatgggtc cataagccac agagacattg 9300

aggaaaggaa cacgagatcc cctaaaacac agtagtctgg gcccattcag cacaaggcag 9360

acaagcctgg acaccaaaca gccacagaat tttagttcat gtgatgggtt gttcataatg 9420

gtgactttca attatccaaa aaagtcaaat tatttttagt taaaggggtt agttatctca 9480

agaagtgacc tgggcagagg ccttgtatat gcccagggtc tggctggatg agactgctct 9540

ctgaatacca tagattttag tctagtagta gctgcagaca tttcccaagc aagaactggc 9600

catttgctat aatttttaaa attttattta ttttgacagt gaactggggg actttttaaa 9660

aaatgtattt attacctaaa caacacatgt tcattatgga caaattgtaa aatagagatt 9720

aaagaaagaa taaaacaaaa aatttcccag aatcagccaa agatgatttt tattgttagt 9780

ttttgctcca gggccttttc tgtaataaag ggtaccattg aattgagtgc ccacaaagat 9840

tcaacttctg tgtcaagcac cctaaaaagg tcctttaatc ctcaagccaa gcctgtgaat 9900

taataaccat cgatatcact ctcacagcaa aggaagtgag ggatcagaga ggttaagtac 9960

ttgtctaaga tcacacagcc aagaaacagc agcaccagga cttgaacccc agtctctgca 10020

gcaacatggc tcagaaccca gggccctaca tcctgcctct tgtctctttc tcagtccctc 10080

ttggcaaggt tggcacttca gggatttgta gcagggattg cagctttcat gaaagcttag 10140

tccagtgaca gtggtcaacg taggcgacct gtgataggcc tcccagcacc ttgaagacat 10200

cacctctatt aaacctcggg aaaaaaacac tttcagataa gaaaaccaac taaggaaatg 10260

ggattggtgg tttttgcatg tctcaatggc accctgtctg agtatctggc ttacccaagg 10320

ccgttgggcc ctgaatattt taccaaaaat aaaataaacc cctttaaggc tgttatctga 10380

ctgcaatcct ggcaggggcc atactaggct ggggctcacc aacaccacct gattctctcc 10440

tgcaggcaca ccttcaccct ctctctgccc cgcctgaagc cctctgaggc tggccgctac 10500

tccttcctgg ccagaaaccc aggaggctgg agagctctga cgtttgagct cacccttcga 10560

tgtgagtgct ggggccgagc gccacctggg gcggaggccc tgggactgcc tggagggatg 10620

gggttgactg gggcagggca cagggaagta ggtactggga gattgggagg tggcggggaa 10680

agtgtgactt ggggcctcct cctttcttcc tcagaccccc cagaggtaag cgtcatatgg 10740

acattcatca acggctctgg cacccttttg tgtgctgcct ctgggtaccc ccagcccaac 10800

gtgacatggc tgcagtgcag tggccacact gataggtaag tgggctccac tcacctccct 10860

cacctgggct caggggctgg gcaccctgtg agtgggaggg acatgctggc gctgggaacc 10920

ctgaagctct gagccacatt ctgcttttgc caggtgtgat gaggcccaag tgctgcaggt 10980

ctgggatgac ccataccctg aggtcctgag ccaggagccc ttccacaagg tgacggtgca 11040

gagcctgctg actgttgaga ccttagagca caaccaaacc tacgagtgca gggcccacaa 11100

cagcgtgggg agtggctcct gggccttcat acccatctct gcaggtgaga gggagccttc 11160

gcacccgcac cgcccccccg cccgcccccc gcccctgctc ctttaggcgg ctcctccccc 11220

accccccacc gagggagctg gggttggctc cacctttgga gcagatccta gcagtaccaa 11280

ggtccacctc tctgggccag tccaagcccc tcctgcctgg caggtccccc gaagcagtag 11340

gacggggtag tctctgagaa agcagagaga aagcagcctg aagaaactgg cccccactct 11400

tgtccctgca ctctaactca tgcatctatt cacaagtatg tgcaggcatt atgcaccgtg 11460

tgccagggac gtgccctatg cagggaagca gtgcctcccc agagctcaga ggctgatgag 11520

ggaggcaggc aatgagcaag gaaacagtcc atctccagct cggggccagc taaggacggc 11580

cttctccaac tctcccctct tgctccagac acagtctatc catttgaggt tgctgtgcaa 11640

gaggctgccc cgggggatga tgcccggccc tgtgcacaac acaggctgcc tctctgcttt 11700

acacaaaggc tccttaccag ctagttctgt gattctcaga ggcccacagc atcctcaggc 11760

ttttgacaac caggctctgg cacccactgt gtgccagacc ctggcatctg cctggctcag 11820

gggtggtcac tcacgtcccc agctgctggc cttggagcaa ctgctaccag ggtccagctg 11880

caagcaggag cctgcggccg cgctgggcct cactgctgga ggttgtatat tataataaag 11940

ccaacatttt gttgaaggct tctgctgcgc caggcactgt gttaagctct ttgtggggat 12000

tatctcgatt aactcctaca aacctaggaa ataaatagaa ttttccctag gctcaatgtc 12060

acacagctcc caagtggcac aggtgaaact tgactgcaga tctaagttac tgatctgagc 12120

aaggaagtgg aaattatgtt ctccaaaaca tcactagaac tagtagtata gattctggga 12180

agaggagact caggggccac aagcctggct tgctagaccc tcagaagggc tgtatgattc 12240

caaaggcatg tggagaagct gcaggggaaa tgcaggagag gaaggttgca gtgtgacctc 12300

cagaaggcct ttctgaacga gcttcctgga ggtgtagtgc atgcaagcca tggctgggca 12360

ccaggccagg ccgctgcaga gaggtttctt gcactggcag agggtgagac tgcatgaccc 12420

cagaggctcc ctacccccag ccacaggagg ctgtgactct ggacagggtt tggggctggg 12480

catgagcaga gctgaagagg ccgtcctctc tgcctttctc ggggagggtg tgcaggagag 12540

gctccagagg cttccagtgg aggatgcttc attcagtcaa caagcattta ttgagcaccc 12600

actgtgttcc aggcagtgtg caggcctgac ctcagggggc tcggaggcac ccctgcctgc 12660

tcactgcttt gcttcatgcc ttccaggagc ccacacgcat cccccggatg agttcctctt 12720

cacacca 12727

<210> 8

<211> 80

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

agcccacacg catcccccgg atgagttcct cttcacacca gtggtggtgg cctgtatgtc 60

tgtcatgtct ctgctggtgc 80

<210> 9

<211> 100

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

ctggttgcta cttaaccact cagacatagc ttagtcacta ccgtgactac gaattccgaa 60

gttcctattc tctagaaagt ataggaactt caggtctgaa 100

<210> 10

<211> 100

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

gaaagtatag gaacttcatc agtcaggtac ataatggtgg atccaatatt ctgtccttgg 60

agaaacacaa aacccttcct catacggaac taaaagctgt 100

<210> 11

<211> 3881

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 11

gggtatgact cctctcctaa gtgtccttag aggtggtttc ctaagtctct caaactccat 60

catctccctt caggatcagt tgagcctggc cccagattct gcctcttcct ctgttccctt 120

tcaggcaacc taaaaaaaaa aaaaaaaaaa aaggggaaga ggagccagtg caacagacag 180

gaacgtgttc atctgttccc gtcctcacag aactagcagc tgggagcccc gtgcccagcc 240

gactctccaa cctgcatcgg ctcacgctat cccctggagg ctatggagtt ggggcctcct 300

ctggtcctgc tgctggccac agtttggcat ggtcagggga tcccagtgat agagcccagt 360

gtccctgagc tggtcgtgaa gccaggagca acggtgacct tgcgatgtgt gggcaatggc 420

agcgtggaat gggatggccc cccatcacct cactggaccc tgtactctga tggctccagc 480

agcatcctca gcaccaacaa cgctaccttc caaaacacgg ggacctatcg ctgcactgag 540

cctggagacc ccctgggagg cagcgccgcc atccacctct atgtcaaaga ccctgcccgg 600

ccctggaacg tgctagcaca ggaggtggtc gtgttcgagg accaggacgc actactgccc 660

tgtctgctca cagacccggt gctggaagca ggcgtctcgc tggtgcgtgt gcgtggccgg 720

cccctcatgc gccacaccaa ctactccttc tcgccctggc atggcttcac catccacagg 780

gccaagttca ttcagagcca ggactatcaa tgcagtgccc tgatgggtgg caggaaggtg 840

atgtccatca gcatccggct gaaagtgcag aaagtcatcc cagggccccc agccttgaca 900

ctggtgcctg cagagctggt gcggattcga ggggaggctg cccagatcgt gtgctcagcc 960

agcagcgttg atgttaactt tgatgtcttc ctccaacaca acaacaccaa gctcgcaatc 1020

cctcaacaat ctgactttca taataaccgt taccaaaaag tcctgaccct caacctcgat 1080

caagtagatt tccaacatgc cggcaactac tcctgcgtgg ccagcaacgt gcagggcaag 1140

cactccacct ccatgttctt ccgggtggta gagagtgcct acttgaactt gagctctgag 1200

cagaacctca tccaggaggt gaccgtgggg gaggggctca acctcaaagt catggtggag 1260

gcctacccag gcctgcaagg ttttaactgg acctacctgg gacccttttc tgaccaccag 1320

cctgagccca agcttgctaa tgctaccacc aaggacacat acaggcacac cttcaccctc 1380

tctctgcccc gcctgaagcc ctctgaggct ggccgctact ccttcctggc cagaaaccca 1440

ggaggctgga gagctctgac gtttgagctc acccttcgat accccccaga ggtaagcgtc 1500

atatggacat tcatcaacgg ctctggcacc cttttgtgtg ctgcctctgg gtacccccag 1560

cccaacgtga catggctgca gtgcagtggc cacactgata ggtgtgatga ggcccaagtg 1620

ctgcaggtct gggatgaccc ataccctgag gtcctgagcc aggagccctt ccacaaggtg 1680

acggtgcaga gcctgctgac tgttgagacc ttagagcaca accaaaccta cgagtgcagg 1740

gcccacaaca gcgtggggag tggctcctgg gccttcatac ccatctctgc aggagcccac 1800

acgcatcccc cggatgagtt cctcttcaca ccagtggtgg tggcctgtat gtctgtcatg 1860

tctctgctgg tgctactgct gttgctgctc ttgtacaagt acaagcagaa gccgaagtac 1920

caggtgcgct ggaagatcat cgagagatac gaaggcaata gctacacctt cattgaccct 1980

actcagttgc cctacaatga gaagtgggag ttccctcgga acaacctgca gtttggtaag 2040

actctaggag ccggtgcctt tgggaaggtg gtggaggcta cagcctttgg tctgggcaaa 2100

gaagatgcag tgctgaaggt ggctgtgaag atgctaaagt ccacggctca tgctgatgag 2160

aaggaggccc tgatgtcaga gctgaagatc atgagtcacc tgggacagca cgagaatata 2220

gtcaacctct tgggagcctg tactcacgga ggacctgtcc tggtcatcac tgaatactgc 2280

tgctatggag acctactcaa ctttctccga aggaaggccg aggctatgct aggacccagc 2340

ctgagtcctg gtcaggactc cgagggagac tccagctaca agaacatcca cctggagaag 2400

aaatatgtgc gcagggacag tggcttctcc agtcagggtg tagacaccta cgtggagatg 2460

aggcctgtct cgacttcttc aagtgactcc ttctttaagc aagatctgga caaagaggcc 2520

agccggcccc tggagctctg ggacctgctc cacttctcca gccaagtggc tcagggcatg 2580

gccttccttg cttctaaaaa ctgcatccac cgggacgtag cagctcgaaa cgtgctgttg 2640

accagcggac atgtggccaa gattggggac tttggactgg ctagggacat catgaatgac 2700

tccaactatg ttgtcaaggg caatgcccgc ctgcctgtaa agtggatggc cccagagagc 2760

atctttgact gcgtctacac agttcagagt gatgtgtggt cctacggcat cctcctctgg 2820

gagatcttct cgcttggtct gaacccctac cccggcatcc tagtgaacaa caagttctac 2880

aaactggtga aggatggata ccaaatggcc cagcctgtat ttgcaccgaa gaacatatac 2940

agcatcatgc agtcctgctg ggacctggag cctaccagaa gacccacctt ccaacagatc 3000

tgcttcctcc tccaggagca ggcccgactg gagaggagag accaggacta tgctaacctg 3060

ccaagcagcg gtggcagcag cggcagtgac agtggtggtg gcagcagcgg tggcagcagc 3120

agtgagccag aagaggagag ctccagtgaa cacctggcct gctgtgagcc aggggacatc 3180

gcccagcccc tgctgcagcc taacaactac cagttctgct gaagtgggag ggagagccga 3240

gtcctgccgc tctctacgtc ccagcttggc ctcctccatg gcacgggcga catggggaga 3300

acatatggac ttcgccctca gcttggccca gctctgacac ttcagaacat gaggggtctg 3360

gggaggtcag aggccccgtt tgttcccaga gcctgggcca tcactgccag tggggttctc 3420

acagtgctag cctctatatt tactatgcca actggtgcac ccctagttct ctttctccat 3480

cctattccca ttttaaaaaa cccgtcccaa actctcgtgt ttcaatggaa agactgattt 3540

atgtctcaaa agacaagagt ctcaaaggct gtgggtaagc tgaaggcttg cctccctgac 3600

agatgcttag actacaggct tcttgggaca ggtggcccct tcctaagctc acaggagtgg 3660

ccaccactct tgaccttcac tctgtctata gtcccgcctc atcctggatc ttgtactgag 3720

cggcagctaa aagtgttcta cccagtgccc tgtcactcta gactggaagg tatggggcct 3780

gatgcaaggc tgaccacacc aacaaacacc gtgtgctcct ctccaagctg actcgtcctc 3840

attaactgtc aacattaaac taacagcatt aacacagcca g 3881

<210> 12

<211> 979

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 12

Met Glu Leu Gly Pro Pro Leu Val Leu Leu Leu Ala Thr Val Trp His

1 5 10 15

Gly Gln Gly Ile Pro Val Ile Glu Pro Ser Val Pro Glu Leu Val Val

20 25 30

Lys Pro Gly Ala Thr Val Thr Leu Arg Cys Val Gly Asn Gly Ser Val

35 40 45

Glu Trp Asp Gly Pro Pro Ser Pro His Trp Thr Leu Tyr Ser Asp Gly

50 55 60

Ser Ser Ser Ile Leu Ser Thr Asn Asn Ala Thr Phe Gln Asn Thr Gly

65 70 75 80

Thr Tyr Arg Cys Thr Glu Pro Gly Asp Pro Leu Gly Gly Ser Ala Ala

85 90 95

Ile His Leu Tyr Val Lys Asp Pro Ala Arg Pro Trp Asn Val Leu Ala

100 105 110

Gln Glu Val Val Val Phe Glu Asp Gln Asp Ala Leu Leu Pro Cys Leu

115 120 125

Leu Thr Asp Pro Val Leu Glu Ala Gly Val Ser Leu Val Arg Val Arg

130 135 140

Gly Arg Pro Leu Met Arg His Thr Asn Tyr Ser Phe Ser Pro Trp His

145 150 155 160

Gly Phe Thr Ile His Arg Ala Lys Phe Ile Gln Ser Gln Asp Tyr Gln

165 170 175

Cys Ser Ala Leu Met Gly Gly Arg Lys Val Met Ser Ile Ser Ile Arg

180 185 190

Leu Lys Val Gln Lys Val Ile Pro Gly Pro Pro Ala Leu Thr Leu Val

195 200 205

Pro Ala Glu Leu Val Arg Ile Arg Gly Glu Ala Ala Gln Ile Val Cys

210 215 220

Ser Ala Ser Ser Val Asp Val Asn Phe Asp Val Phe Leu Gln His Asn

225 230 235 240

Asn Thr Lys Leu Ala Ile Pro Gln Gln Ser Asp Phe His Asn Asn Arg

245 250 255

Tyr Gln Lys Val Leu Thr Leu Asn Leu Asp Gln Val Asp Phe Gln His

260 265 270

Ala Gly Asn Tyr Ser Cys Val Ala Ser Asn Val Gln Gly Lys His Ser

275 280 285

Thr Ser Met Phe Phe Arg Val Val Glu Ser Ala Tyr Leu Asn Leu Ser

290 295 300

Ser Glu Gln Asn Leu Ile Gln Glu Val Thr Val Gly Glu Gly Leu Asn

305 310 315 320

Leu Lys Val Met Val Glu Ala Tyr Pro Gly Leu Gln Gly Phe Asn Trp

325 330 335

Thr Tyr Leu Gly Pro Phe Ser Asp His Gln Pro Glu Pro Lys Leu Ala

340 345 350

Asn Ala Thr Thr Lys Asp Thr Tyr Arg His Thr Phe Thr Leu Ser Leu

355 360 365

Pro Arg Leu Lys Pro Ser Glu Ala Gly Arg Tyr Ser Phe Leu Ala Arg

370 375 380

Asn Pro Gly Gly Trp Arg Ala Leu Thr Phe Glu Leu Thr Leu Arg Tyr

385 390 395 400

Pro Pro Glu Val Ser Val Ile Trp Thr Phe Ile Asn Gly Ser Gly Thr

405 410 415

Leu Leu Cys Ala Ala Ser Gly Tyr Pro Gln Pro Asn Val Thr Trp Leu

420 425 430

Gln Cys Ser Gly His Thr Asp Arg Cys Asp Glu Ala Gln Val Leu Gln

435 440 445

Val Trp Asp Asp Pro Tyr Pro Glu Val Leu Ser Gln Glu Pro Phe His

450 455 460

Lys Val Thr Val Gln Ser Leu Leu Thr Val Glu Thr Leu Glu His Asn

465 470 475 480

Gln Thr Tyr Glu Cys Arg Ala His Asn Ser Val Gly Ser Gly Ser Trp

485 490 495

Ala Phe Ile Pro Ile Ser Ala Gly Ala His Thr His Pro Pro Asp Glu

500 505 510

Phe Leu Phe Thr Pro Val Val Val Ala Cys Met Ser Val Met Ser Leu

515 520 525

Leu Val Leu Leu Leu Leu Leu Leu Leu Tyr Lys Tyr Lys Gln Lys Pro

530 535 540

Lys Tyr Gln Val Arg Trp Lys Ile Ile Glu Arg Tyr Glu Gly Asn Ser

545 550 555 560

Tyr Thr Phe Ile Asp Pro Thr Gln Leu Pro Tyr Asn Glu Lys Trp Glu

565 570 575

Phe Pro Arg Asn Asn Leu Gln Phe Gly Lys Thr Leu Gly Ala Gly Ala

580 585 590

Phe Gly Lys Val Val Glu Ala Thr Ala Phe Gly Leu Gly Lys Glu Asp

595 600 605

Ala Val Leu Lys Val Ala Val Lys Met Leu Lys Ser Thr Ala His Ala

610 615 620

Asp Glu Lys Glu Ala Leu Met Ser Glu Leu Lys Ile Met Ser His Leu

625 630 635 640

Gly Gln His Glu Asn Ile Val Asn Leu Leu Gly Ala Cys Thr His Gly

645 650 655

Gly Pro Val Leu Val Ile Thr Glu Tyr Cys Cys Tyr Gly Asp Leu Leu

660 665 670

Asn Phe Leu Arg Arg Lys Ala Glu Ala Met Leu Gly Pro Ser Leu Ser

675 680 685

Pro Gly Gln Asp Ser Glu Gly Asp Ser Ser Tyr Lys Asn Ile His Leu

690 695 700

Glu Lys Lys Tyr Val Arg Arg Asp Ser Gly Phe Ser Ser Gln Gly Val

705 710 715 720

Asp Thr Tyr Val Glu Met Arg Pro Val Ser Thr Ser Ser Ser Asp Ser

725 730 735

Phe Phe Lys Gln Asp Leu Asp Lys Glu Ala Ser Arg Pro Leu Glu Leu

740 745 750

Trp Asp Leu Leu His Phe Ser Ser Gln Val Ala Gln Gly Met Ala Phe

755 760 765

Leu Ala Ser Lys Asn Cys Ile His Arg Asp Val Ala Ala Arg Asn Val

770 775 780

Leu Leu Thr Ser Gly His Val Ala Lys Ile Gly Asp Phe Gly Leu Ala

785 790 795 800

Arg Asp Ile Met Asn Asp Ser Asn Tyr Val Val Lys Gly Asn Ala Arg

805 810 815

Leu Pro Val Lys Trp Met Ala Pro Glu Ser Ile Phe Asp Cys Val Tyr

820 825 830

Thr Val Gln Ser Asp Val Trp Ser Tyr Gly Ile Leu Leu Trp Glu Ile

835 840 845

Phe Ser Leu Gly Leu Asn Pro Tyr Pro Gly Ile Leu Val Asn Asn Lys

850 855 860

Phe Tyr Lys Leu Val Lys Asp Gly Tyr Gln Met Ala Gln Pro Val Phe

865 870 875 880

Ala Pro Lys Asn Ile Tyr Ser Ile Met Gln Ser Cys Trp Asp Leu Glu

885 890 895

Pro Thr Arg Arg Pro Thr Phe Gln Gln Ile Cys Phe Leu Leu Gln Glu

900 905 910

Gln Ala Arg Leu Glu Arg Arg Asp Gln Asp Tyr Ala Asn Leu Pro Ser

915 920 925

Ser Gly Gly Ser Ser Gly Ser Asp Ser Gly Gly Gly Ser Ser Gly Gly

930 935 940

Ser Ser Ser Glu Pro Glu Glu Glu Ser Ser Ser Glu His Leu Ala Cys

945 950 955 960

Cys Glu Pro Gly Asp Ile Ala Gln Pro Leu Leu Gln Pro Asn Asn Tyr

965 970 975

Gln Phe Cys

<210> 13

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

ggttgtgtct cagcaaacac atgc 24

<210> 14

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

gaggatgctg ctggagccat c 21

<210> 15

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

gctcgactag agcttgcgga 20

<210> 16

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

ccagcgcacc tggtacttcg 20

<210> 17

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

aaatgggaat gaaatcagag ct 22

<210> 18

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

aaccctaggg catccaacag 20

<210> 19

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

gccgaggcta tgctaggacc 20

<210> 20

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

gacacatcag ccactcctca c 21

<210> 21

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

ggatcggcca ttgaacaaga tgg 23

<210> 22

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

cagaagaact cgtcaagaag gcg 23

<210> 23

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

gggagtgata acgccctctc 20

<210> 24

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

tgtcagccca tgttgacaca 20

<210> 25

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

tgactctgga cagggtttgg g 21

<210> 26

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

gctccaattt cccacaacat tagt 24

<210> 27

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

gcagatccag ttggcgcaca c 21

<210> 28

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

gttgtagaga gagctgaggt gcc 23

<210> 29

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

gacaagcgtt agtaggcaca tatac 25

<210> 30

<211> 1494

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 30

atcccagtga tagagcccag tgtccctgag ctggtcgtga agccaggagc aacggtgacc 60

ttgcgatgtg tgggcaatgg cagcgtggaa tgggatggcc ccccatcacc tcactggacc 120

ctgtactctg atggctccag cagcatcctc agcaccaaca acgctacctt ccaaaacacg 180

gggacctatc gctgcactga gcctggagac cccctgggag gcagcgccgc catccacctc 240

tatgtcaaag accctgcccg gccctggaac gtgctagcac aggaggtggt cgtgttcgag 300

gaccaggacg cactactgcc ctgtctgctc acagacccgg tgctggaagc aggcgtctcg 360

ctggtgcgtg tgcgtggccg gcccctcatg cgccacacca actactcctt ctcgccctgg 420

catggcttca ccatccacag ggccaagttc attcagagcc aggactatca atgcagtgcc 480

ctgatgggtg gcaggaaggt gatgtccatc agcatccggc tgaaagtgca gaaagtcatc 540

ccagggcccc cagccttgac actggtgcct gcagagctgg tgcggattcg aggggaggct 600

gcccagatcg tgtgctcagc cagcagcgtt gatgttaact ttgatgtctt cctccaacac 660

aacaacacca agctcgcaat ccctcaacaa tctgactttc ataataaccg ttaccaaaaa 720

gtcctgaccc tcaacctcga tcaagtagat ttccaacatg ccggcaacta ctcctgcgtg 780

gccagcaacg tgcagggcaa gcactccacc tccatgttct tccgggtggt agagagtgcc 840

tacttgaact tgagctctga gcagaacctc atccaggagg tgaccgtggg ggaggggctc 900

aacctcaaag tcatggtgga ggcctaccca ggcctgcaag gttttaactg gacctacctg 960

ggaccctttt ctgaccacca gcctgagccc aagcttgcta atgctaccac caaggacaca 1020

tacaggcaca ccttcaccct ctctctgccc cgcctgaagc cctctgaggc tggccgctac 1080

tccttcctgg ccagaaaccc aggaggctgg agagctctga cgtttgagct cacccttcga 1140

taccccccag aggtaagcgt catatggaca ttcatcaacg gctctggcac ccttttgtgt 1200

gctgcctctg ggtaccccca gcccaacgtg acatggctgc agtgcagtgg ccacactgat 1260

aggtgtgatg aggcccaagt gctgcaggtc tgggatgacc cataccctga ggtcctgagc 1320

caggagccct tccacaaggt gacggtgcag agcctgctga ctgttgagac cttagagcac 1380

aaccaaacct acgagtgcag ggcccacaac agcgtgggga gtggctcctg ggccttcata 1440

cccatctctg caggagccca cacgcatccc ccggatgagt tcctcttcac acca 1494

<210> 31

<211> 80

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

caggcctcac ttgtgtctgc cacctccttc aggtcagggg atcccagtga tagagcccag 60

tgtccctgag ctggtcgtga 80

Claims

1.一种CSF1R基因人源化的非人动物的构建方法，其特征在于，所述的非人动物体内表达人源化CSF1R蛋白；

所述的非人动物的内源CSF1R蛋白表达降低或缺失；

所述的人源化CSF1R蛋白包含人CSF1R蛋白的胞外区；

所述的构建方法包括将编码SEQ ID NO：4的第20-517位的核苷酸序列替换非人动物基因组中编码内源CSF1R蛋白胞外区的核苷酸序列；

所述的非人动物为小鼠。

2.根据权利要求1所述的构建方法，其特征在于，所述的非人动物的基因组中包含人CSF1R基因的3号外显子的部分、4号至10号外显子的全部和11号外显子的部分。

3.根据权利要求1所述的构建方法，其特征在于，所述的非人动物的基因组中包含SEQID NO：7或30所示核苷酸序列。

4.根据权利要求1所述的构建方法，其特征在于，所述的非人动物的基因组中包含人源化CSF1R基因，所述的人源化CSF1R基因编码人源化CSF1R蛋白，所述的人源化CSF1R基因包含下列组中的一种：

a）转录的mRNA序列为SEQ ID NO：11所示核苷酸序列；

b）包含SEQ ID NO：8和/或31所示核苷酸序列。

5.根据权利要求1所述的构建方法，其特征在于，所述的人源化CSF1R蛋白的氨基酸序列如SEQ ID NO：12所示。

6.根据权利要求1所述的构建方法，其特征在于，使用靶向载体进行非人动物的构建，所述的靶向载体包含SEQ ID NO：7所示核苷酸序列。

7.根据权利要求6所述的构建方法，其特征在于，所述的靶向载体还包含5’臂和/或3’臂，

所述的5’臂如SEQ ID NO：5所示；

所述的3’臂如SEQ ID NO：6所示。

8.一种靶向载体，其特征在于，所述的靶向载体包含SEQ ID NO：7所示核苷酸序列；所述的靶向载体还包含5’臂和/或3’臂，

所述的5’臂如SEQ ID NO：5所示；

所述的3’臂如SEQ ID NO：6所示。

9.一种多基因修饰的非人动物的构建方法，其特征在于，包括如下步骤：

i）提供权利要求1-7任一所述构建方法获得的非人动物；

ii）将步骤i）获得的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑，并进行筛选，得到多基因修饰的非人动物。

10.根据权利要求9所述的构建方法，其特征在于，所述的其他基因修饰的非人动物包括基因PD-1、PD-L1、CSF1、IL34、CCR2、CD40、CXCR4、VEGF或PDGF人源化的非人动物。

11.一种CSF1R基因人源化的细胞、组织或器官，其特征在于，所述的细胞、组织或器官来源于权利要求1-7任一所述的构建方法获得的非人动物或权利要求9-10任一所述的构建方法获得的非人动物或其子代，所述细胞、组织或器官不能发育为动物个体。

12.来源于权利要求1-7任一所述的构建方法获得的非人动物、权利要求9-10任一所述的构建方法获得的非人动物或其子代或者权利要求11所述的细胞、组织或器官的应用，其特征在于，所述的应用包括：

a）涉及人类细胞的免疫过程的产品开发中的应用；

b）作为药理学、免疫学、微生物学和医学研究的模型系统中的应用；

c）涉及生产和利用动物实验疾病模型中的应用；或，

d）在筛选、验证、评价或研究CSF1R功能、人CSF1R信号机理中的应用；

e）在筛选、验证、评价或研究靶向人的药物、药效中的应用；或，

f）在筛选和评估人用药及药效研究方面的应用。

13.根据权利要求12所述的应用，其特征在于，e）中所述的靶向人的药物包括靶向人的抗体。

14.根据权利要求12所述的应用，其特征在于，e）中所述的靶向人的药物包括免疫相关疾病药物、抗肿瘤或抗炎症药物。