CN114134153A

CN114134153A - Garp基因人源化非人动物及其构建方法和应用

Info

Publication number: CN114134153A
Application number: CN202111488968.XA
Authority: CN
Inventors: 吕锐利; 李惠琳
Original assignee: Baccetus Beijing Pharmaceutical Technology Co ltd
Current assignee: Baccetus Beijing Pharmaceutical Technology Co ltd
Priority date: 2020-12-07
Filing date: 2021-12-07
Publication date: 2022-03-04
Anticipated expiration: 2041-12-07
Also published as: CN114134153B

Abstract

本发明提供了一种人源化GARP基因、一种人源化GARP蛋白、一种GARP基因的靶向载体、一种GARP基因人源化的非人动物的构建方法和其在生物医药领域的应用，利用同源重组的方式将编码人GARP蛋白的核苷酸序列导入非人动物基因组中，该动物体内能正常表达人或人源化GARP蛋白，可以作为人GARP信号机理研究、心脑血管疾病、神经精神类疾病、肿瘤及自身免疫性疾病药物筛选的动物模型，对免疫靶点、神经靶点以及防治心脑血管疾病靶点的新药研发具有重要的应用价值。

Description

GARP基因人源化非人动物及其构建方法和应用

技术领域

本发明属于动物基因工程和基因遗传修饰领域，具体地说，涉及一种GARP基因人源化的非人动物及其构建方法和在生物医药领域的应用。

背景技术

调节性T细胞(Treg)是诱导免疫耐受性的主要细胞，所述免疫耐受性在癌症患者的肿瘤区域中观察到。即，在癌症患者中，使本质上作用于杀死肿瘤的免疫细胞群通过肿瘤中的活化Treg而成为免疫抑制状态，并且这导致肿瘤的恶性进展。

糖蛋白A重复主导序列(Glycoprotein-A Repetitions Predominant，GARP)是I型跨膜蛋白，胞外区与latent TGF-β(全长TGF-β，由潜伏期相关肽LAP和成熟的TGF-β组成)结合。免疫细胞和其他细胞表面的整合素αVβ8能够识别LAP中的RGD肽，从而介导成熟TGF-β从TGF-β/GARP复合物中的释放，因此GARP能够介导TGF-β活化。由于Treg与Treg对其诱导免疫抑制的靶细胞之间的细胞间相互作用，TGF-β通过在Treg的细胞表面上的GARP由潜伏TGF-β成熟且从Treg分泌，并且TGF-β的免疫抑制信号直接传送到靶细胞。

随着基因工程技术的不断发展和成熟，用人类基因替代或置换动物的同源性基因已经实现，通过这种方式开发人源化实验动物模型是动物模型未来的发展方向。其中基因人源化动物模型，即，利用基因编辑技术，用人源正常或突变基因替换动物基因组的同源基因，可建立更接近人类生理或疾病特征的正常或突变基因动物模型。基因人源化动物不但本身具有重要应用价值，如通过基因人源化可改进和提升细胞或组织移植人源化动物模型，更重要的是，由于人类基因片段的插入，动物体内可表达或部分表达人源蛋白，可作为仅能识别人蛋白氨基酸序列的药物的靶点，为在动物水平进行抗人抗体及其它药物的筛选提供了可能。然而，由于动物与人类在生理学及病理学方面存在差异，加上基因(即遗传因子)的复杂性，如何能构建出“有效”的人源化动物模型用于新药研发仍是最大的挑战(Scheer N,Snaith M,Wolf CR,Seibler J.Generation and utility of geneticallyhumanized mouse models,Drug Discov Today；18(23-24):1200-11,2013)。

目前关于GARP基因的动物模型主要为基因敲除鼠，而且主要用于肿瘤相关疾病机制研究。鉴于GARP在肿瘤、自身免疫性疾病、心脑血管疾病、神经精神类疾病等多种疾病发生过程中的广泛参与性以及靶向该信号通路的巨大应用价值，为了使临床前期的试验更有效并使研发失败最小化，本领域仍急需开发人源化GARP信号通路相关的非人动物模型。

发明内容

本发明的第一方面，提供了一种人源化GARP基因，所述的人源化GARP基因包含人GARP基因的部分。

优选的，所述的人源化GARP基因包含编码人GARP蛋白的全部或部分核苷酸序列；优选的，包含编码人GARP信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列；更优选的，所述的人源化GARP基因包含编码人GARP蛋白的胞外区的全部或部分核苷酸序列，进一步优选的，包含与编码SEQ ID NO：2第20-627位的核苷酸序列具有至少70％、75％、80％、85％、90％、95％或至少99％同一性的核苷酸序列或者包含编码SEQ ID NO：2第20-627位的核苷酸序列，更进一步优选的，包含与编码SEQ ID NO：2的核苷酸序列具有至少70％、75％、80％、85％、90％、95％或至少99％同一性的核苷酸序列或者包含编码SEQ IDNO：2的核苷酸序列。

优选的，所述的人源化GARP基因包含人GARP基因的1号外显子至3号外显子的全部或部分，进一步优选的，所述的人源化GARP基因包含人GARP基因的2号至3号外显子的全部或部分，更优选的，所述的人源化GARP基因包含人GARP基因的2号和/或3号外显子的全部或部分，优选还包含2-3号内含子，其中，2号外显子的部分至少包含50bp的核苷酸序列，例如至少包含50、60、70、80、81、82、83、84、85、86、87、88bp的核苷酸序列；优选的，所述人GARP基因的2号外显子的部分至少包含从起始密码子开始至2号外显子最后一个核苷酸为止，3号外显子的部分至少包含1000bp的核苷酸序列，例如至少包含1000、1500、1700、1900、1901、1902、1903、1904、1905、1910、2000、2500、3000、3500、3900、3985bp的核苷酸序列；优选的，3号外显子的部分至少包含从3号外显子第一个核苷酸开始至终止密码子为止。

在本发明的一个具体实施方式中，所述的人源化GARP基因中至少包含SEQ ID NO：6或SEQ ID NO：7所示核苷酸序列，或包含与SEQ ID NO：6或SEQ ID NO：7具有至少70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％同一性的核苷酸序列。

在本发明的一个具体实施方式中，所述的人源化GARP基因中包含的人GARP基因的部分选自下列组中的一种：

(A)包含SEQ ID NO：5所示核苷酸序列的全部或部分；

(B)包含与SEQ ID NO：5所示核苷酸序列的同一性至少为70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％的核苷酸序列；

(C)包含与SEQ ID NO：5所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列；

(D)具有SEQ ID NO：5所示核苷酸序列的，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

在本发明的一个具体实施方式中，所述的人源化GARP基因还包括非人动物GARP基因的1号外显子的全部、2号外显子的部分和/或3号外显子的部分；优选的，所述的非人动物GARP基因的1号外显子的全部、2号外显子的部分和/或3号外显子的部分与NC_000073.7相应的1号外显子、2号外显子、3号外显子至少具有70％、80％、90％或至少95％的同一性；进一步优选的，所述的非人动物GARP基因的1号外显子的全部、2号外显子的部分和/或3号外显子的部分与NM_001113379.2相应的1号外显子、2号外显子、3号外显子一致。

在本发明的一个具体实施方式中，所述的人源化GARP基因转录的mRNA选自下列组中的一种：

(a)包含SEQ ID NO：8所示核苷酸序列的全部或部分；

(b)包含与SEQ ID NO：8所示核苷酸序列的同一性至少为70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％的核苷酸序列；

(c)包含与SEQ ID NO：8所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列；或

(d)包含SEQ ID NO：8所示的核苷酸序列，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

优选的，所述的人源化GARP基因还包括特异性诱导物或阻遏物，进一步优选的，所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。

在本发明的一个具体实施方式中，所述的特异性诱导物选自四环素系统(Tet-OffSystem/Tet-On System)或他莫昔芬系统(Tamoxifen System)。

优选的，所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。

优选的，所述的非人动物为非人哺乳动物，进一步优选的，所述的非人哺乳动物为啮齿类动物，更进一步优选的，所述的啮齿类动物为大鼠或小鼠。

优选的，所述的非人动物是免疫缺陷的非人哺乳动物，进一步优选的，所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子，更优选的，所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠，更进一步优选的，所述免疫缺陷鼠是NOD-Prkdc^scid IL-2rγ^null小鼠、NOD-Rag 1^-/--IL2rg^-/-(NRG)小鼠、Rag 2^-/--IL2rg^-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。

本发明的第二方面，提供了一种人源化GARP蛋白，所述的人源化GARP蛋白包含人GARP蛋白的全部或部分。

优选的，所述的人源化GARP蛋白是由上述的人源化GARP基因编码的。

优选的，所述的人源化GARP蛋白包含人GARP蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分，进一步优选的，所述的人源化GARP蛋白包含人GARP蛋白的胞外区的全部或部分，更优选的，包含与SEQ ID NO：2第20-627位具有至少70％、75％、80％、85％、90％、95％或至少99％同一性的氨基酸序列或者包含编码SEQ ID NO：2第20-627位所示的氨基酸序列，更进一步优选的，所述的人源化GARP蛋白包含与SEQ ID NO：2具有至少70％、75％、80％、85％、90％、95％或至少99％同一性的氨基酸序列或者包含SEQ ID NO：2所示氨基酸序列。

优选的，所述的人源化GARP蛋白包含人GARP基因的2号和/或3号外显子编码的氨基酸序列，进一步优选的，所述的人源化GARP蛋白包含人GARP基因的2号至3号外显子编码的氨基酸序列，更优选的，包含从人GARP基因的起始密码子开始至终止密码子为止编码的氨基酸序列。

优选的，所述的人源化GARP蛋白至少包含SEQ ID NO：5或SEQ ID NO：8编码的氨基酸序列，或包含与SEQ ID NO：5或SEQ ID NO：8具有至少70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％同一性的核苷酸编码的氨基酸序列。

在本发明的一个具体实施方式中，所述的人源化GARP蛋白中包含的人GARP蛋白的部分氨基酸序列包含下列组中的一种：

A)包含SEQ ID NO：2所示氨基酸序列的全部或部分；

B)包含SEQ ID NO：2所示氨基酸序列同一性至少为70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％的氨基酸序列；

C)包含SEQ ID NO：2所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸的氨基酸序列；或

D)包含SEQ ID NO：2所示的，包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

本发明的第三方面，提供了一种载体，所述载体包含上述的人源化GARP基因。

优选的，所述载体为靶向载体。

优选的，所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段，即5’臂(5’同源臂)，其选自非人动物GARP基因基因组DNA的100-10000个长度的核苷酸；优选的，所述的5’臂与NCBI登录号为NC_000073.7至少具有90％同源性的核苷酸；进一步优选的，所述5’臂序列与SEQ ID NO：3至少具有90％同源性，或者如SEQ ID NO：3所示。

优选的，所述的靶向载体还包含与待改变的转换区3’端同源的DNA片段，即3’臂(3’同源臂)，其选自非人动物GARP基因基因组DNA的100-10000个长度的核苷酸；优选的，所述的3’臂与NCBI登录号为NC_000073.7至少具有90％同源性的核苷酸；进一步优选的，所述的3’臂序列与SEQ ID NO：4至少具有90％同源性，或者如SEQ ID NO：4所示。

更优选的，所述靶向载体还包含SEQ ID NO：6或SEQ ID NO：7所示核苷酸序列，或包含与SEQ ID NO：6或SEQ ID NO：7具有至少70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％同一性的核苷酸序列。

优选的，所述的待改变的转换区位于非人动物GARP基因座上，进一步优选的，所述的待改变的转换区位于非人动物GARP基因2号至3号外显子上。

优选的，所述的靶向载体还包含标记基因，进一步优选的，所述标记基因为负筛选标记的编码基因，更进一步优选的，所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。

在本发明的一个具体实施方式中，所述的靶向载体中还包括阳性克隆筛选的抗性基因，进一步优选的，所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。

在本发明的一个具体实施方式中，所述的靶向载体中还包括特异性重组系统，进一步优选的，所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统)，所述的特异性重组系统为具有两个Frt重组位点，分别连接在抗性基因的两侧。

本发明的第四方面，提供了一种包含上述靶向载体的细胞。

本发明的第五方面，提供了上述靶向载体，或者上述的细胞在GARP基因修饰中的应用，优选的，所述的应用包括但不限于插入、翻转、敲除或替换。

本发明的第六方面，提供了一种GARP基因人源化的非人动物，所述的非人动物体内表达人或人源化GARP蛋白。

优选的，所述的非人动物的内源GARP蛋白表达降低或缺失。

优选的，所述的非人动物体内表达上述的人源化GARP蛋白。

优选的，所述的非人动物体内包含人或人源化GARP基因，更优选包含上述的人源化GARP基因。

优选的，所述人或人源化GARP基因的核苷酸序列可操作地连接到至少一条染色体中内源性GARP基因座处的内源调控元件。

根据本发明的一些实施例，所述的非人动物进一步包含其他基因修饰，所述其他基因选自PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3和CD73中的至少一种。

根据本发明的一些实施例，所述人或人源化GARP基因和/或所述其他基因对于内源被替换基因座为纯合或杂合。

本发明的第七方面，提供了一种GARP基因人源化的非人动物的构建方法，所述的非人动物体内表达人或人源化GARP蛋白。

优选的，所述的非人动物体内表达上述的人源化GARP蛋白。

优选的，所述的非人动物至少一个细胞的基因组中包含人或人源化GARP基因，更优选包含上述的人源化GARP基因。

优选的，所述的非人动物为上述的GARP基因人源化的非人动物。

优选的，所述的人或人源化GARP基因可操作连接到至少一条染色体上内源GARP内源调控元件。

优选的，所述的人源化GARP基因在非人动物体内通过内源或外源调控元件进行调控,进一步优选的，所述的调控元件为启动子。

在本发明的一个具体实施方式中，所述的内源调控元件来自非人动物GARP基因。所述的外源性调控元件来自人GARP基因。

优选的，所述的构建方法包括将人GARP基因的全部或部分导入非人动物GARP基因座上。

优选的，所述的人GARP基因的部分包含人GARP基因的1号至3号外显子的全部或部分，进一步优选的，包含人GARP基因的2号至3号外显子的全部或部分，更优选的，包含人GARP基因的2号和/或3号外显子的全部或部分，更进一步优选的，包含人GARP的基因的2号外显子的部分、3号外显子的部分，进一步优选的，包含2-3号内含子；其中，2号外显子的部分至少包含50bp的核苷酸序列，例如至少包含50、60、70、80、81、82、83、84、85、86、87、88bp的核苷酸序列；优选的，所述人GARP基因的2号外显子的部分至少包含从起始密码子开始至2号外显子最后一个核苷酸为止，3号外显子的部分至少包含1000bp的核苷酸序列，例如至少包含1000、1500、1700、1900、1901、1902、1903、1904、1905、1910、2000、2500、3000、3500、3900、3985bp的核苷酸序列；优选的，3号外显子的部分至少包含从3号外显子第一个核苷酸开始至终止密码子为止，优选的，包含SEQ ID NO：5的核苷酸序列，或用包含与SEQ ID NO：5具有至少70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％同一性的核苷酸序列。

优选的，所述的构建方法包括用包含编码人GARP蛋白的全部或部分核苷酸序列导入非人动物GARP基因座上，进一步优选的，包括用包含编码人GARP蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列导入非人动物GARP基因座上，更优选的，用包含与编码SEQ ID NO：2的核苷酸序列具有至少70％、75％、80％、85％、90％、95％或至少99％同一性的核苷酸序列或者包含编码SEQ ID NO：2的核苷酸序列导入非人动物GARP基因座上。

优选的，所述的构建方法包括用包含上述人或人源化GARP基因的核苷酸序列导入非人动物GARP基因座上。

优选的，所述的构建方法包括用包含编码上述人源化GARP蛋白的核苷酸序列导入非人动物GARP基因座上。

优选的，所述的构建方法包括用包含编码上述人源化GARP蛋白的cDNA序列导入非人动物GARP基因座上。

优选的，本申请中所述的导入包括但不限于插入、替换或转基因，所述的替换优选为原位替换或插入。

优选的，所述的导入的位置位于GARP基因的内源调控元件之后。

优选的，所述的导入为替换或插入，任选地，所述的导入非人动物GARP基因座为替换非人动物相应区域，进一步优选的，非人动物GARP基因的1号至3号外显子的全部或部分被替换，更优选地，非人动物的2号外显子的部分和3号外显子的部分被替换。

优选的，编码SEQ ID NO:1所示氨基酸的核苷酸序列被替换。

优选的，所述的插入为首先破坏非人动物内源GARP基因的编码框，随后进行插入操作，或者所述的插入步骤既可给内源GARP基因造成移码突变又可以实现插入人源序列的步骤。

优选的，所述的非人动物是纯合或者杂合的。

优选的，所述非人动物的基因组中至少一个染色体上包含人源化GARP基因。

优选的，所述的非人动物中至少一个细胞表达人GARP蛋白或人源化GARP蛋白。

优选的，使用基因编辑技术进行非人动物的构建，所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。

优选的，所述的构建方法包括使用上述的靶向载体进行非人动物的构建。

在本发明的一个具体实施方式中，所述的构建方法包括将上述靶向载体导入非人动物细胞中(优选为胚胎干细胞)，筛选出正确的阳性克隆细胞导入已分离好的囊胚中，培养该囊胚，然后将培养后的囊胚移植至雌性非人动物输卵管内，允许其发育，鉴定筛选获得GARP基因人源化的非人动物。

根据本发明的一些实施例，该构建方法进一步包括：将GARP基因人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑，并进行筛选，得到多基因修饰的非人动物。

优选的，所述的其他基因为PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3和CD73中的至少一种。

优选的，所述的非人动物还表达人或人源化的PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3和CD73蛋白中的至少一种。

优选的，所述的多基因修饰的非人动物的基因组中修饰的多个基因中的每一个基因均对于内源被替换基因座为纯合或杂合的。

优选的，所述的非人动物为非人哺乳动物。进一步优选的，所述的非人哺乳动物为啮齿类动物。更进一步优选的，所述的啮齿类动物为大鼠或小鼠。

优选的，所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的，所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的，所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的，所述免疫缺陷鼠是NOD-Prkdc^scid IL-2rγ^null小鼠、NOD-Rag 1^-/--IL2rg^-/-(NRG)小鼠、Rag 2^-/--IL2rg^-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。

本发明的第八方面，提供了一种多基因修饰的非人动物的构建方法，包括如下步骤：

I)提供上述的GARP基因人源化的非人动物或GARP基因敲除的非人动物，或者采用上述的构建方法获得的GARP基因人源化的非人动物；

II)将步骤I)提供的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑，并进行筛选，得到多基因修饰的非人动物。

优选的，所述的其他基因修饰的非人动物包括但不限于基因PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3或CD73修饰的非人动物。

优选的，所述的多基因修饰的非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物、六基因人源化非人动物、七基因人源化非人动物、八基因人源化非人动物或九基因人源化非人动物。

优选的，所述的多基因修饰的非人动物的基因组中人源化的多个基因中的每一个基因均可以是纯合或杂合的。

本发明的第九方面，提供了一种上述构建方法获得的非人动物或其子代，所述的非人动物或其子代选自GARP基因人源化的非人动物、GARP基因敲除的非人动物或者多基因修饰的非人动物。

本发明的第十方面，提供了一种动物的疾病模型，所述的疾病模型来源于上述的非人动物、上述的构建方法获得的非人动物，或者，上述的非人动物或其子代，优选的，所述的疾病包括心脑血管疾病、神经精神类疾病、自身免疫性疾病、肿瘤或炎症。

本发明的第十一方面，提供了一种动物的疾病模型的制备方法，所述的制备方法包括上述GARP基因人源化的非人动物、GARP基因敲除的非人动物或多基因修饰的非人动物的步骤；优选的，所述的疾病包括心脑血管疾病、神经精神类疾病、自身免疫性疾病、肿瘤或炎症，进一步优选的，还包括植入肿瘤细胞的步骤。

本发明的第十二方面，提供了上述GARP基因人源化的非人动物、上述GARP基因敲除的非人动物、上述构建方法获得的GARP基因人源化的非人动物、上述GARP基因敲除的非人动物或多基因修饰的非人动物或其子代在制备动物的疾病模型中的应用，优选的，所述的疾病包括心脑血管疾病、神经精神类疾病、自身免疫性疾病、肿瘤或炎症。

本发明的第十三方面，提供了上述的非人动物、上述的非人动物或其子代、上述的构建方法获得的非人动物或上述的疾病模型在制备治疗心脑血管疾病、神经精神类疾病、自身免疫性疾病、肿瘤和/或炎症的药物中的应用。

本发明的第十四方面，提供了一种细胞或细胞系或原代细胞培养物，所述细胞或细胞系或原代细胞培养物来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的疾病模型。优选的，所述的细胞或细胞系或原代细胞培养物不能发育为动物个体。

本发明的第十五方面，提供了一种组织或器官或其培养物，所述组织或器官或其培养物来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的疾病模型。优选的，所述的组织或器官或其培养物不能发育为动物个体。

本发明的第十六方面，提供了一种荷瘤后的瘤组织，所述的瘤组织来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代，或者上述的疾病模型。优选的，所述的荷瘤后的瘤组织不能发育为动物个体。

本发明的第十七方面，提供了一种GARP基因人源化的细胞，所述的细胞表达人GARP蛋白或人源化GARP蛋白。

优选的，所述的人源化GARP蛋白选自上述的人源化GARP蛋白。

优选的，所述的细胞中内源GARP蛋白的表达降低或缺失。

优选的，所述的细胞的基因组中包含人GARP基因的部分，进一步优选的，所述的细胞包含上述的人源化GARP基因。优选的，所述的细胞不能发育为动物个体。

本发明的第十八方面，提供了一种GARP基因敲除的细胞，所述的细胞中缺失GARP基因的全部或部分核苷酸序列。

优选的，所述的细胞缺失GARP基因的2号至3号外显子的全部或部分核苷酸序列。优选的，所述的细胞不能发育为动物个体。

本发明的第十九方面，提供了一种表达上述的人源化GARP蛋白的构建体，优选的，所述的构建体中包含上述人源化GARP基因。

本发明的第二十方面，提供了一种包含上述构建体的细胞。优选的，所述的细胞不能发育为动物个体。

本发明的第二十一方面，提供了一种包含上述细胞的组织。优选的，所述的组织不能发育为动物个体。

本发明的第二十二方面，提供了来源于上述的人源化GARP蛋白、上述的人源化GARP基因、上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的疾病模型、上述的细胞或细胞系或原代细胞培养物、上述的组织或器官或其培养物、上述的荷瘤后的瘤组织、上述的细胞、上述的构建体、上述的细胞或上述的组织的应用，所述的应用包括：

在需要涉及人类细胞的免疫过程的产品开发，制造抗体，或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用；

在生产和利用动物实验疾病模型，用于开发新的诊断策略和/或治疗策略中的应用；

或者，

在筛选、验证、评价或研究GARP功能、人GARP信号机理、靶向人的抗体、靶向人的药物、药效，心脑血管疾病、神经精神类疾病、免疫相关疾病药物以及抗肿瘤或抗炎症药物，筛选和评估人用药及药效研究方面的应用。

本发明的第二十三方面，提供了上述GARP基因人源化的非人动物、上述GARP基因敲除的非人动物、上述构建方法获得的GARP基因人源化的非人动物、上述GARP基因敲除的非人动物或多基因修饰的非人动物或其子代在制备人GARP特异性调节剂或者筛选人GARP特异性调节剂的产品中的应用。

优选的，所述应用不是疾病的治疗和/或诊断方法。

本发明的第二十四方面，提供了一种人GARP特异性调节剂的筛选方法，所述的筛选方法包括向个体施加调节剂，检测调节效果；其中，所述的个体选自上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代，或者上述的疾病模型。

优选的，所述的调节剂选自CAR-T、药物，进一步优选的，所述的药物为抗体。

优选的，所述的调节剂为单抗或双特异性抗体或两种及两种以上药物的联合使用。

优选的，所述的筛选方法还包括向个体植入肿瘤的步骤。

优选的，所述检测包括测定肿瘤细胞的大小和/或增殖速率。

优选的，所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。

优选的，所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化，所述的代谢变化包括食物消耗或水消耗的变化。

优选的，所述的肿瘤细胞来源于人或非人动物。

优选的，所述人GARP特异性调节剂的筛选方法不是治疗方法。该方法用来筛选或评价药物，对候选药物的药效进行检测和比较，以确定哪些候选药物可以作为药物，哪些不能作为药物，或者，比较不同药物的药效敏感程度，即治疗效果不是必然的，只是一种可能性。

本发明的第二十五方面，提供了一种干预方案的评价方法，所述的评价方法包括向个体施加干预方案，对施加干预方案后的个体进行调节效果检测和评价；其中，所述的个体选自上述的非人动物，上述的构建方法获得的非人动物，上述的非人动物或其子代，或者上述的疾病模型。

优选的，所述的评价方法还包括向个体植入肿瘤细胞。

优选的，所述的干预方案选自CAR-T、药物治疗，进一步优选的，所述的药物为抗原结合蛋白，所述的抗体结合蛋白为抗体。

优选的，所述的肿瘤细胞来源于人或非人动物。

优选的，所述干预方案的评价方法不是治疗方法，该评价方法对干预方案的效果进行检测和评价，以确定该干预方案是否有治疗效果，即治疗效果不是必然的，只是一种可能性。

本发明的第二十六方面，提供了一种来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或疾病模型在制备治疗心脑血管疾病、神经精神类疾病、肿瘤、炎症或自身免疫性疾病的药物中的用途。

优选的，所述应用不是疾病的治疗和/或诊断方法。

本发明所述的“肿瘤”包括但不限于淋巴瘤、B细胞肿瘤、T细胞肿瘤、骨髓/单核细胞肿瘤、非小细胞肺癌、白血病、卵巢癌、鼻咽癌、乳腺癌、子宫内膜癌、结肠癌、直肠癌、胃癌、膀胱癌、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺癌、头颈部癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中，所述的白血病选自急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病；所述淋巴瘤选自霍奇金淋巴瘤和非霍奇金淋巴瘤，包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症；所述肉瘤选自骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、及软骨肉瘤。在本发明的一个具体实施方式中，所述的肿瘤选自B细胞肿瘤、T细胞肿瘤、骨髓/单核细胞肿瘤。优选包括B或T细胞急性淋巴细胞白血病(ALL)、急性髓细胞白血病(AML)、非霍奇金淋巴瘤(NHL)和多发性骨髓瘤(MM)、鼻咽癌、肺癌。

本发明所述的“自身免疫性疾病”包括但不限于过敏、哮喘、心肌炎、肾炎、肝炎、系统性红斑狼疮、类风湿性关节炎、硬皮病、甲状腺功能亢进、原发性血小板减少性紫癜、自身免疫性溶血性贫血、溃疡性结肠炎、自身免疫性肝病、糖尿病、疼痛或神经障碍等。

本发明所述的“炎症”包括急性炎症，也包括慢性炎症。具体的，包括但不限于变质性炎症、渗出性炎症(浆液性炎、纤维素性炎、化脓性炎、出血性炎、坏死性炎、卡他性炎)、增生性炎症、特异性炎症(结核、梅毒、麻疯、淋巴肉芽肿等)。

本发明所述的“心脑血管疾病”包括但不限于冠心病(心脏病发作)、脑血管疾病(中风)、高血压(血压升高)、周围血管疾病、风湿性心脏病、先天性心脏病、深静脉血栓和肺栓塞、心力衰竭以及心肌病。

本发明所述的“神经精神类疾病”包括但不限于脑血管疾病、周期性麻痹、进行性肌营养不良、强直性肌营养不良、共济失调。

优选的，本发明保护的主题“细胞”、“细胞或细胞系或原代细胞培养物”、“组织”、“组织或器官或其培养物”均不能发育为动物，其中，所述的细胞不是干细胞或受精卵细胞，所述的细胞可以是体细胞、淋巴细胞(优选为T细胞或B细胞)或肿瘤细胞等等，所述的组织可以是脾脏、淋巴结、骨髓、肿瘤或其培养物等等。

本发明所述的GARP基因人源化的非人动物体内可以正常表达人GARP蛋白或人源化GARP蛋白。可用于针对人GARP靶位点的药物筛选、药效评估、心脑血管疾病、神经性疾病、自身免疫性疾病和肿瘤治疗，可以加快新药研发过程、节约时间和成本。对于研究GARP蛋白功能及相关疾病药物筛选提供了有效的保障。

本发明所述的“全部或部分”，“全部”为整体，“部分”为整体中的局部，或者组成整体的个体。

本发明所述的“人源化GARP蛋白”，包含来源于人GARP蛋白的部分。其中，所述的“人GARP蛋白”同“人GARP蛋白的全部”，即其氨基酸序列与人GARP蛋白的全长氨基酸序列一致。所述的“人GARP蛋白的部分”，为连续或间隔的5-662个(优选为10-662个)氨基酸序列与人GARP蛋白的氨基酸序列一致或与人GARP蛋白的氨基酸序列具有70％以上同源性。

本发明所述的“人源化GARP基因”，包含来源于人GARP基因的部分和非人GARP基因的部分。其中，所述的“人GARP基因”同“人GARP基因的全部”，即其核苷酸序列与人GARP基因的全长核苷酸序列一致。所述的“人GARP基因的部分”为连续或间隔的20-13224bp(优选为20-6351bp、20-4207bp或20-1989bp)个核苷酸序列与人GARP核苷酸序列一致或与人GARP核苷酸序列具有70％以上同源性。

本发明所述的“xx号至xxx号外显子”或“xx号至xxx号外显子的全部”包含外显子及其期间的内含子的核苷酸序列，例如所述的“2号至3号外显子”包含2号外显子、2-3号内含子、3号外显子的全部核苷酸序列。

本发明所述的“x-xx号内含子”表示x号外显子与xx号外显子之间的内含子。例如“2-3号内含子”表示2号外显子与3号外显子之间的内含子。

本发明所述的“外显子的部分”表示连续或间隔几个、几十个或几百个核苷酸序列与全部的外显子核苷酸序列一致。例如人GARP基因的2号外显子的部分，包含连续或间隔的5-88bp个，优选10-84bp个核苷酸序列与人GARP基因的2号外显子核苷酸序列一致。在本发明的一个具体实施方式中，所述的“人源化GARP基因”中包含的“2号外显子的部分”至少包括从2号外显子编码氨基酸序列的起始密码子至终止密码子。

本发明所述的“基因座”广义上讲代表基因在染色体上所占的位置，狭义上讲代表某一基因上的一段DNA片段，即可以是一个基因也可以是一个基因的一部分。例如所述的“GARP基因座”表示GARP基因1号至3号外显子上的任选一段的DNA片段。优选为1号外显子、2号外显子、3号外显子或其期间的内含子中的任一个或两个或多个的组合，或一个或两个或多个的全部或部分，更优选为GARP基因的2号至3号外显子上。

本发明所述的“核苷酸序列”包含天然的或经过修饰的核糖核苷酸序列、脱氧核糖核苷酸序列。优选为DNA、cDNA、pre-mRNA、mRNA、rRNA、hnRNA、miRNAs、scRNA、snRNA、siRNA、sgRNA、tRNA。

本发明所述的“治疗”表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性，但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除，且是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。

本发明所述的“同源性”，是指在使用氨基酸序列或核苷酸序列的方面，本领域技术人员在保证与已知序列相似结构或功能的前提下，可以根据实际工作需要对序列进行调整，使使用序列与现有技术获得的序列相比，具有(包括但不限于)1％，2％，3％，4％，5％，6％，7％，8％，9％，10％，11％，12％，13％，14％，15％，16％，17％，18％，19％，20％，21％，22％，23％，24％，25％，26％，27％，28％，29％，30％，31％，32％，33％，34％，35％，36％，37％，38％，39％，40％，41％，42％，43％，44％，45％，46％，47％，48％，49％，50％，51％，52％，53％，54％，55％，56％，57％，58％，59％，60％，70％，80％，81％，82％，83％，84％，85％，86％，87％，88％，89％，90％，91％，92％，93％，94％，95％，96％，97％，98％，99％，99.1％，99.2％，99.3％，99.4％，99.5％，99.6％，99.7％，99.8％，99.9％的同一性。

在一个方面，所述非人动物是哺乳动物。优选的，所述非人动物是小型哺乳动物，例如跳鼠科。在一个实施方式中，所述非人动物是啮齿动物。在一个实施方式中，所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中，所述啮齿动物选自鼠家族。在一个实施方式中，所述基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中，所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中，所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中，所述动物是啮齿动物。在一个特定实施方式中，所述啮齿动物选自小鼠和大鼠。在一个实施方式中，所述非人动物是小鼠。

在一个特定实施方式中，所述非人动物是啮齿动物，其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠及NOD、NOD/SCID、NOD-Prkdcscid IL-2rgnull背景的小鼠。

本领域的技术人员能够确定并比较序列元件或同一性程度，以区分另外的小鼠和人序列。

除非特别说明，本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如：Molecular Cloning A Laboratory Manual，2ndEd.，ed.By Sambrook，FritschandManiatis(Cold Spring Harbor Laboratory Press：1989)；DNA Cloning，Volumes Iand II(D.N.Glovered.，1985)；Oligonucleotide Synthesis(M.J.Gaited.，1984)；Mullisetal.U.S.Pat.No.4，683，195；Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984)；Transcription And Translation(B.D.Hames&S.J.Higginseds.1984)；Culture Of Animal Cells(R.I.Freshney，AlanR.Liss，Inc.，1987)；Immobilized Cells And Enzymes(IRL Press，1986)；B.Perbal，A PracticalGuide To Molecular Cloning(1984)；the series，Methods In ENZYMOLOGY(J.Abelsonand M.Simon，eds.inchief，Academic Press，Inc.，New York)，specifically，Vols.154and 155(Wuetal.eds.)and Vol.185，″Gene Expression Technology″(D.Goeddel，ed.)；Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.，1987，Cold Spring Harbor Laboratory)；Immunochemical Methods InCell And Molecular Biology(Mayer and Walker，eds.，Academic Press，London，1987)；Handbook Of Experimental Immunology，Volumes V(D.M.Weir and C.C.Blackwell，eds.，1986)；and Manipulating the Mouse Embryo，(Cold Spring Harbor LaboratoryPress，Cold Spring Harbor，N.Y.，1986)。

本发明的有益技术效果在于：

利用基因编辑技术，用人源正常或突变基因替换动物基因组的同源基因，建立更接近人类生理或疾病特征的基因人源化动物模型，使其体内表达人源蛋白，作为仅能识别人蛋白序列的药物的靶点，为在动物水平进行抗人抗体及其它药物的筛选提供了可能。

利用基因人源化动物模型建立各种疾病模型，可以进行抗人抗体药物的药理药效评价。

进一步的，本发明设计的GARP基因人源化的技术方案，使得包含上述人源化GARP基因的非人动物能表达出人源化或人的相应蛋白，可以更好的模拟人体内信号通路，为筛选适合人的试剂提供更为人源化的微环境，从而筛选出的试剂效力更好。

进一步的，为便于人源化GARP基因的表达，本发明优化了导入的人的GARP基因的片段选择，以及导入位置的选择，人的GARP基因可以非随机插入的导入，并正确表达人源化或人的相应蛋白，可以稳定传代，同时不影响非人动物的其他功能。

以上只是概括了本发明的一些方面，不是也不应该认为是在任何方面限制本发明。

本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到，对本发明可作某些改变并不偏离本发明的构思或范围。

下面的实施例进一步详细说明本发明，不能认为是限制本发明或本发明所说明的具体方法的范围。

附图说明

以下，结合附图来详细说明本发明的实施例，其中：

图1：人和小鼠GARP基因座结构对比示意图(非按比例)；

图2：人源化GARP基因座示意图(非按比例)；

图3：GARP基因打靶策略示意图(非按比例)；

图4：重组后ES细胞Southern blot结果，其中WT为野生型对照；

图5：人源化GARP小鼠FRT重组过程示意图(非按比例)；

图6：人源化GARP F1代小鼠PCR结果，其中，M为Marker，WT为野生型对照，H₂O为水对照，PC为阳性对照；

图7：脾脏RT-PCR结果示意图，+/+为野生型小鼠，H/H为人源化纯合子小鼠；

图8：人GARP和鼠GARP的流式检测结果，其中WT为野生型C57BL/6小鼠，H/+为GARP人源化杂合子小鼠；

图9：人GARP和鼠GARP的流式检测结果，其中WT为野生型C57BL/6小鼠，H/H为GARP人源化纯合子小鼠；

图10：野生型C57BL/6小鼠和GARP人源化纯合子小鼠脾脏中白细胞亚型检测结果；

图11：野生型C57BL/6小鼠和GARP人源化纯合子小鼠脾脏中T细胞亚型检测结果；

图12：野生型C57BL/6小鼠和GARP人源化纯合子小鼠外周血中白细胞亚型检测结果；

图13：野生型C57BL/6小鼠和GARP人源化纯合子小鼠外周血中T细胞亚型检测结果

图14：血常规检测结果；

图15：血生化检测结果；

图16：将小鼠结肠癌细胞MC38植入人源化GARP小鼠体内，进行抗肿瘤药效试验后小鼠的体重结果示意图；

图17：将小鼠结肠癌细胞MC38植入人源化GARP小鼠体内，进行抗肿瘤药效试验后小鼠的体重变化结果示意图；

图18：将小鼠结肠癌细胞MC38植入人源化GARP小鼠体内，进行抗肿瘤药效试验后小鼠体内肿瘤体积结果示意图。

具体实施方式

下面结合具体实施例来进一步描述本发明，本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的，并不对本发明的范围构成任何限制。本领域技术人员应该理解的是，在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换，但这些修改和替换均落入本发明的保护范围内。

在下述每一实施例中，设备和材料是从以下所指出的几家公司获得：

Brilliant Violet 421^TM anti-mouse CD45购自Biolegend，货号：103134；

PerCP/Cy5.5 anti-mouse TCRβchain购自Biolegend，货号：109228；

GARP Monoclonal Antibody(YGIC86),PE购自eBioscience^TM，货号：12-9891-80；

PE anti-human GARP(LRRC32)Antibody购自Biolegend，货号：352504；

APC anti-mouse/rat Foxp3购自eBioscience，货号：17-5773-82；

PE Rat IgG2a K Iso Control购自eBioscience，货号：12-4321-42；

PE Rat IgG2b,k isotype Ctrl购自eBioscience，货号：400608。

实施例1 GARP基因人源化小鼠的制备

本实施例对非人动物(如小鼠)进行改造，使该非人动物体内包含编码人源化GARP蛋白的核苷酸序列，得到经遗传修饰的非人动物体内可表达人源化GARP蛋白。小鼠GARP基因(NCBI Gene ID：434215，Primary source：MGI:93882，UniProt ID：G3XA59，位于7号染色体NC_000073.7的第98138515至98151038位，基于转录本NM_001113379.2及其编码蛋白NP_001106850.1(SEQ ID NO：1))和人GARP基因(NCBI Gene ID：2615，Primary source：HGNC：4161，UniProt ID：Q14392，位于11号染色体NC_000011.10的第76657524至76670747位，基于转录本NM_001128922.2及其编码蛋白NP_001122394.1(SEQ ID NO：2))。对比示意图如图1所示。

为了达到本发明的目的，可在小鼠内源GARP基因座引入编码人GARP蛋白的基因序列，使得该小鼠表达人或人源化GARP蛋白。具体来说，可以通过基因编辑技术在小鼠内源GARP基因座上用人GARP基因的核苷酸序列(例如DNA序列、cDNA序列等)替换小鼠相应序列，如将至少包含小鼠GARP基因的起始密码子ATG至终止密码子TAA的序列用对应的人DNA序列替换，得到人源化GARP基因座(示意图如图2所示)，实现对小鼠GARP基因的人源化改造。

进一步设计如图3所示的打靶策略示意图，图中显示了靶向载体上含有小鼠GARP基因上游和下游的同源臂序列，以及包含人GARP DNA序列的A片段。其中，上游同源臂序列(5’同源臂，SEQ ID NO：3)与NCBI登录号为NC_000073.7第98137914至98143428位核苷酸序列相同，下游同源臂序列(3’同源臂，SEQ ID NO：4)与NCBI登录号为NC_000073.7第98149214至98152364位核苷酸序列相同；人GARP DNA序列(SEQ ID NO：5)与NCBI登录号为NC_000011.10的第76659604至76665954位核苷酸序列相同。

靶向载体上还包括用于阳性克隆筛选的抗性基因，即新霉素磷酸转移酶编码序列Neo，并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点，组成Neo盒(Neo cassette)。其中，Neo盒5’端与人的连接设计为

其中，序列“CTGGCC”的最后一个“C”是人的最后一个核苷酸，序列

的第一个“T”是Neo盒的第一个核苷酸；Neo盒3’端与人的连接设计为

其中序列“GGATCC”的最后一个“C”是Neo盒的最后一个核苷酸，序列

的第一个“C”是人的第一个核苷酸。此外，还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。改造后的人源化小鼠GARP的mRNA序列如SEQ ID NO：8所示，表达的蛋白序列如SEQ ID NO：2所示。

靶向载体构建可采用常规方法进行，如酶切连接等。构建好的靶向载体通过酶切进行初步验证后，再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中，利用阳性克隆筛选标记基因对得到的细胞进行筛选，并利用PCR(PCR引物详见表1)和Southern Blot技术进行检测确认外源基因的整合情况，筛选出正确的阳性克隆细胞，经PCR鉴定为阳性的克隆再进行Southern Blot(分别用BclI或XmnI或AseI消化细胞DNA并使用3个探针进行杂交，酶、探针及目的片段长度如表2所示)检测，Southern Blot检测结果如图4所示，表明4个经PCR验证为阳性的胚胎干细胞(ES-01、ES-02、ES-03和ES-04)均为阳性的克隆，且无随机插入。

表1 PCR检测引物序列及目的片段长度

PCR条件如下：

Enzyme:2x Taq Plus Master Mix II(Dye Plus)

Program:2x Taq Plus Master Mix II(Dye Plus)progress

表2 Southern Blot酶和探针表

限制性内切酶	探针	野生型片段大小	重组序列片段大小
				BclI	5’Probe	15.4kb	9.7kb
XmnI	3’Probe	11.4kb	9.3kb
				AseI	Neo Probe	--	7.6kb

Southern Blot检测包括如下探针引物：

5’探针(5’Probe)：

5’Probe-F：5’-GGCTTTCCCAGAGGAAGATGACACC-3’(SEQ ID NO：13)，

5’Probe-R：5’-AGCAGTGAGCACTTTGACTGATCCC-3’(SEQ ID NO：14)；

3’探针(3’Probe)：

3’Probe-F：5’-CCAACTAGGCCATCAGAGCATCAGG-3’(SEQ ID NO：15)，

3’Probe-R：5’-CTTCAGAGTGGGAGTATCCTGGGGT-3’(SEQ ID NO：16)；

Neo探针(Neo Probe)：

Neo Probe-F：5’-GGATCGGCCATTGAACAAGAT-3’(SEQ ID NO：17)，

Neo Probe-R：5’-CAGAAGAACTCGTCAAGAAGGC-3’(SEQ ID NO：18)。

将筛选出的正确阳性克隆细胞(黑色鼠)按照本领域已知的技术导入已分离好的囊胚中(白色鼠)，得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管，可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠，再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因(该过程示意图见图5)后，再通过互相交配即可得到人源化GARP基因纯合子小鼠。

可通过常规检测方法确认阳性小鼠体内人GARP的基因或蛋白表达是否正确，例如，可以利用PCR(PCR引物详见表1)进行检测确认人源化杂合子和纯合子小鼠人源化基因是否正确。具体地，可以分别选取野生型C57BL/6小鼠和本方法制备的GARP基因人源化F1代杂合子小鼠，剪尾，设计如表3所示引物序列对C57BL/6小鼠和GARP基因人源化杂合子小鼠基因是否正确进行检测。PCR检测结果(图6)表明在C57BL/6小鼠和人源化杂合子小鼠的体细胞中检测到鼠GARP DNA的表达；仅在GARP基因人源化杂合子小鼠细胞中检测到人源化GARP DNA的表达，表明使用本方法能构建出人源化GARP基因工程小鼠。

其中，PCR的条件和参数如下，引物序列及目的片段长度见表3，PCR的反应条件如下：

Enzyme:KOD-FX

Program:Touchdown PCR

表3 PCR检测引物序列及目的片段长度

提取野生型C57BL/6小鼠和GARP基因人源化纯合小鼠脾脏组织RNA，利用逆转录试剂盒逆转录成cDNA，扩增鼠GARP片段和人GARP片段。实验结果显示(见图7)，仅在野生型C57BL/6小鼠脾脏组织中检测到鼠GARP mRNA，仅在GARP基因人源化纯合子小鼠脾脏中检测到人源化GARP的mRNA。

进一步采用流式细胞术检测GARP基因人源化小鼠体内GARP蛋白的表达情况。选取9周龄野生型C57BL/6小鼠和GARP基因人源化杂合子小鼠各1只，取脾脏细胞，用抗鼠CD45抗体Brilliant Violet 510^TM anti-mouse CD45、鼠源T细胞表面抗体PerCP/Cy5.5anti-mouse TCRβchain、GARP单克隆抗体GARP Monoclonal Antibody(YGIC86),PE,eBioscience^TM(mGARP)(以PE大鼠抗体IgG2a K同型对照抗体Rat IgG2a kap pa IsotypeControl(eBR2a),PE,eBioscience^TM(IgG 2a)抗体作参照)，抗人GARP抗体PE anti-humanGARP(LRRC32)Antibody(hGARP)(以大鼠抗体Purified Mouse IgG2b,κIsotype CtrlAntibody(IgG 2b)抗体作参照)进行表染，再将表染后的细胞固定和穿膜后，用APC抗鼠抗体APC anti-mouse/rat Foxp3抗体再次进行染色标记Treg细胞，最后，将穿膜染色后的细胞进行流式检测，检测结果如图8所示，C57BL/6小鼠和GARP基因人源化杂合子小鼠体内均表达鼠GARP蛋白，而GARP基因人源化杂合子小鼠体内还同时表达人GARP蛋白。

进一步采用上述方法检测野生型C57BL/6小鼠和GARP基因人源化纯合子小鼠体内GARP蛋白的表达情况。检测结果如图9所示，C57BL/6小鼠体内仅检测到鼠GARP蛋白，不能检测到人GARP蛋白，人GARP蛋白只能在GARP人源化纯合子小鼠体内检测到。

进一步地，使用流式细胞术检测对C57BL/6野生型小鼠和GARP基因人源化纯合子小鼠的脾脏和外周血组织进行免疫分型检测，脾脏中白细胞亚型和T细胞亚型检测结果分别如图10和图11所示，外周血中白细胞亚型和T细胞亚型检测结果分别如图12和图13所示，从图中可以看出，GARP基因人源化纯合子小鼠脾脏和外周血中B细胞(B Cells)、T细胞(Tcells)、NK细胞(NK cells)、CD4⁺T细胞(CD4)、CD8+T细胞(CD8)、粒细胞(Granulocyte)、DC细胞(DC cell)、巨噬细胞(Macrophage)和单核细胞(Monocyte)等白细胞亚型与C57BL/6野生型小鼠一致(图10和图12)，CD4+T细胞(CD4)、CD8+T(CD8)细胞和Tregs细胞(Treg cells)等T细胞亚型百分比与C57BL/6野生型小鼠一致(图11和图13)，表明GARP基因的人源化改造没有影响小鼠体内白细胞和T细胞的分化、发育和分布。

更进一步分别对野生型C57BL/6小鼠和GARP人源化纯合子小鼠采血，进行血常规和血生化检测，血常规结果如图14所示，GARP基因人源化纯合子小鼠外周血样本中白细胞计数(WBC)、红细胞计数(RBC)、血红蛋白浓度(HGB)、红细胞压积(HCT)、平均红细胞体积(MCV)、平均红细胞血红蛋白含量(MCH)、平均红细胞血红蛋白浓度(MCHC)、血小板计数(PLT)、红细胞分布宽度(RDW-SD、RDW-CV)、平均血小板体积(MPV)、淋巴细胞计数(LYMPH#)、单核细胞计数(MONO#)和中性粒细胞计数(NEUT#)结果与C57BL/6野生型小鼠基本一致；血生化检测结果如图15所示，GARP基因人源化纯合子小鼠外周血样本中谷丙转氨酶(ALT)、谷草转氨酶(AST)、血清白蛋白(ALB)、血糖(GLU)、尿素(UREA)、肌酐(CREA)血清总胆固醇(TC)和甘油三脂(TG)结果与C57BL/6野生型小鼠基本一致。上述结果表明GARP基因的人源化改造没有影响血细胞的组成和形态，也没有改变AST和ALT水平及肝脏健康状态。

以上表明本实施例成功构建出可表达人GARP蛋白的GARP基因人源化小鼠。

实施例2体内药效验证

本实施例中使用的ABBV151是一种靶向人GAPR的人源化单克隆抗体，2018年由Argenx公司授权给Abbvie，目前在临床I期，主要用于治疗实体瘤。

利用本发明制备的GARP基因人源化小鼠构建肿瘤模型，可用于测试靶向人GARP的药物的药效。具体来说，选取实施例1制备的GARP基因人源化纯合子小鼠(7周龄、雌性)，皮下接种小鼠结肠癌细胞MC38(5×10⁵个)，待肿瘤体积约50-70mm³后，按瘤体积分为对照组或治疗组(n＝6/组)。对照组注射PBS，治疗组使用ABBV151(药物信息参见专利文本(公开号US20180327487A1))和/或Anti-mPD-1抗体(InVivoMabanti-mouse PD-1(CD279)，购自BioX cell，货号：BE0146)。给药方式：腹腔注射(i.p.)，分组当天开始给药，Anti-mPD-1每周给药2次，共给药6次，ABBV151每周给药3次，共给药9次，其中，ABBV151抗体为每周一、三、五给药；PBS、Anti-mPD-1抗体第一周是周三、周五给药，第二周、第三周是周二、周五给药；这三种药物均是从第一周的周三开始第一次给药，后面依次递推。每周测量肿瘤体积2次，接种后单只小鼠肿瘤体积达到3000mm³时执行安乐死。具体分组和给药情况见表4。实验周期内小鼠体重情况和肿瘤体积测量结果分别如图16-18所示。

表4：分组及给药情况

表5中列出了各个实验的主要数据和分析结果，具体包括分组时、分组后13天、分组后第27天时的肿瘤体积、小鼠存活情况、无肿瘤小鼠情况、肿瘤(体积)抑制率(TumorGrowth Inhibition value，TGI_TV)以及治疗组与对照组小鼠肿瘤体积的统计学差异(P值)。

表5：肿瘤体积、存活情况及肿瘤抑制率

如图16、17和表5所示，整体来看，各组实验过程中，动物健康状态良好，在第27天时，所有治疗组(G2、G3、G4、G5、G6)与对照组(G1)相比，动物体重呈增长趋势(图16和17)，均无明显差异(P>0.05)，表明动物对抗人GARP抗体ABBV151和抗鼠PD-1抗体Anti-mPD-1的耐受性良好，未对动物产生明显毒性作用，安全性较好。如图18和表5所示，从肿瘤体积结果上看，在各个时期，治疗组肿瘤体积均小于对照组，且在第27天，G2、G3、G4、G5和G6组小鼠肿瘤体积分别为1348±283mm³、1329±321mm³、420±103mm³、490±143mm³和285±119mm³，均小于对照组2022±440mm³，尤其是G4、G5和G6组与对照组相比具有显著差异(P<0.01)。G6组与G2、G4相比，抗人GARP抗体ABBV151和抗鼠PD-1抗体Anti-mPD-1联用的结果中有1只小鼠出现了无瘤情况。在实验结果表明本发明实施例的方法制备的GARP人源化小鼠可用于靶向人GARP的药物(如，抗体药物)的体内药效检测，也可用于GARP的药物与其它药物联合用药时体内药效检测。

实施例3双基因或多基因人源化小鼠

利用本方法或制得的GARP基因人源化小鼠还可以制备双基因修饰或多基因修饰的小鼠模型。如前述实施例1中，囊胚显微注射使用的胚胎干细胞可选择来源于含有PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3、CD73等其它基因修饰的小鼠，或者，也可在人源化GARP小鼠的基础上，利用分离小鼠ES胚胎干细胞和基因重组打靶技术，获得GARP与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将本方法得到的GARP小鼠纯合子或杂合子与其它基因修饰的纯合或杂合小鼠交配，对其后代进行筛选，根据孟德尔遗传规律，可有一定机率得到GARP基因与其它基因修饰的双基因或多基因修饰的杂合小鼠，再将杂合子相互交配可以得到双基因或多基因修饰的纯合子，利用这些双基因或多基因修饰的小鼠可以进行靶向人GARP和其它基因调节剂的体内药效验证等。

以上详细描述了本发明的优选实施方式，但是，本发明并不限于上述实施方式中的具体细节，在本发明的技术构思范围内，可以对本发明的技术方案进行多种简单变型，这些简单变型均属于本发明的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本发明对各种可能的组合方式不再另行说明。

此外，本发明的各种不同的实施方式之间也可以进行任意组合，只要其不违背本发明的思想，其同样应当视为本发明所公开的内容。

序列表

<110> 百奥赛图（北京）医药科技股份有限公司

<120> GARP基因人源化非人动物及其构建方法和应用

<130> 1

<150> CN202011419558.5

<151> 2020-12-07

<150> CN202110601632.3

<151> 2021-05-31

<160> 25

<170> SIPOSequenceListing 1.0

<210> 1

<211> 663

<212> PRT

<213> 小鼠(Mouse)

<400> 1

Met Ser His Gln Ile Leu Leu Leu Leu Ala Met Leu Thr Leu Gly Leu

1 5 10 15

Ala Ile Ser Gln Arg Arg Glu Gln Val Pro Cys Arg Thr Val Asn Lys

20 25 30

Glu Ala Leu Cys His Gly Leu Gly Leu Leu Gln Val Pro Ser Val Leu

35 40 45

Ser Leu Asp Ile Gln Ala Leu Tyr Leu Ser Gly Asn Gln Leu Gln Ser

50 55 60

Ile Leu Val Ser Pro Leu Gly Phe Tyr Thr Ala Leu Arg His Leu Asp

65 70 75 80

Leu Ser Asp Asn Gln Ile Ser Phe Leu Gln Ala Gly Val Phe Gln Ala

85 90 95

Leu Pro Tyr Leu Glu His Leu Asn Leu Ala His Asn Arg Leu Ala Thr

100 105 110

Gly Met Ala Leu Asn Ser Gly Gly Leu Gly Arg Leu Pro Leu Leu Val

115 120 125

Ser Leu Asp Leu Ser Gly Asn Ser Leu His Gly Asn Leu Val Glu Arg

130 135 140

Leu Leu Gly Glu Thr Pro Arg Leu Arg Thr Leu Ser Leu Ala Glu Asn

145 150 155 160

Ser Leu Thr Arg Leu Ala Arg His Thr Phe Trp Gly Met Pro Ala Val

165 170 175

Glu Gln Leu Asp Leu His Ser Asn Val Leu Met Asp Ile Glu Asp Gly

180 185 190

Ala Phe Glu Ala Leu Pro His Leu Thr His Leu Asn Leu Ser Arg Asn

195 200 205

Ser Leu Thr Cys Ile Ser Asp Phe Ser Leu Gln Gln Leu Gln Val Leu

210 215 220

Asp Leu Ser Cys Asn Ser Ile Glu Ala Phe Gln Thr Ala Pro Glu Pro

225 230 235 240

Gln Ala Gln Phe Gln Leu Ala Trp Leu Asp Leu Arg Glu Asn Lys Leu

245 250 255

Leu His Phe Pro Asp Leu Ala Val Phe Pro Arg Leu Ile Tyr Leu Asn

260 265 270

Val Ser Asn Asn Leu Ile Gln Leu Pro Ala Gly Leu Pro Arg Gly Ser

275 280 285

Glu Asp Leu His Ala Pro Ser Glu Gly Trp Ser Ala Ser Pro Leu Ser

290 295 300

Asn Pro Ser Arg Asn Ala Ser Thr His Pro Leu Ser Gln Leu Leu Asn

305 310 315 320

Leu Asp Leu Ser Tyr Asn Glu Ile Glu Leu Val Pro Ala Ser Phe Leu

325 330 335

Glu His Leu Thr Ser Leu Arg Phe Leu Asn Leu Ser Arg Asn Cys Leu

340 345 350

Arg Ser Phe Glu Ala Arg Gln Val Asp Ser Leu Pro Cys Leu Val Leu

355 360 365

Leu Asp Leu Ser His Asn Val Leu Glu Ala Leu Glu Leu Gly Thr Lys

370 375 380

Val Leu Gly Ser Leu Gln Thr Leu Leu Leu Gln Asp Asn Ala Leu Gln

385 390 395 400

Glu Leu Pro Pro Tyr Thr Phe Ala Ser Leu Ala Ser Leu Gln Arg Leu

405 410 415

Asn Leu Gln Gly Asn Gln Val Ser Pro Cys Gly Gly Pro Ala Glu Pro

420 425 430

Gly Pro Pro Gly Cys Val Asp Phe Ser Gly Ile Pro Thr Leu His Val

435 440 445

Leu Asn Met Ala Gly Asn Ser Met Gly Met Leu Arg Ala Gly Ser Phe

450 455 460

Leu His Thr Pro Leu Thr Glu Leu Asp Leu Ser Thr Asn Pro Gly Leu

465 470 475 480

Asp Val Ala Thr Gly Ala Leu Val Gly Leu Glu Ala Ser Leu Glu Val

485 490 495

Leu Glu Leu Gln Gly Asn Gly Leu Thr Val Leu Arg Val Asp Leu Pro

500 505 510

Cys Phe Leu Arg Leu Lys Arg Leu Asn Leu Ala Glu Asn Gln Leu Ser

515 520 525

His Leu Pro Ala Trp Thr Arg Ala Val Ser Leu Glu Val Leu Asp Leu

530 535 540

Arg Asn Asn Ser Phe Ser Leu Leu Pro Gly Asn Ala Met Gly Gly Leu

545 550 555 560

Glu Thr Ser Leu Arg Arg Leu Tyr Leu Gln Gly Asn Pro Leu Ser Cys

565 570 575

Cys Gly Asn Gly Trp Leu Ala Ala Gln Leu His Gln Gly Arg Val Asp

580 585 590

Val Asp Ala Thr Gln Asp Leu Ile Cys Arg Phe Gly Ser Gln Glu Glu

595 600 605

Leu Ser Leu Ser Leu Val Arg Pro Glu Asp Cys Glu Lys Gly Gly Leu

610 615 620

Lys Asn Val Asn Leu Ile Leu Leu Leu Ser Phe Thr Leu Val Ser Ala

625 630 635 640

Ile Val Leu Thr Thr Leu Ala Thr Ile Cys Phe Leu Arg Arg Gln Lys

645 650 655

Leu Ser Gln Gln Tyr Lys Ala

660

<210> 2

<211> 662

<212> PRT

<213> 人(human)

<400> 2

Met Arg Pro Gln Ile Leu Leu Leu Leu Ala Leu Leu Thr Leu Gly Leu

1 5 10 15

Ala Ala Gln His Gln Asp Lys Val Pro Cys Lys Met Val Asp Lys Lys

20 25 30

Val Ser Cys Gln Val Leu Gly Leu Leu Gln Val Pro Ser Val Leu Pro

35 40 45

Pro Asp Thr Glu Thr Leu Asp Leu Ser Gly Asn Gln Leu Arg Ser Ile

50 55 60

Leu Ala Ser Pro Leu Gly Phe Tyr Thr Ala Leu Arg His Leu Asp Leu

65 70 75 80

Ser Thr Asn Glu Ile Ser Phe Leu Gln Pro Gly Ala Phe Gln Ala Leu

85 90 95

Thr His Leu Glu His Leu Ser Leu Ala His Asn Arg Leu Ala Met Ala

100 105 110

Thr Ala Leu Ser Ala Gly Gly Leu Gly Pro Leu Pro Arg Val Thr Ser

115 120 125

Leu Asp Leu Ser Gly Asn Ser Leu Tyr Ser Gly Leu Leu Glu Arg Leu

130 135 140

Leu Gly Glu Ala Pro Ser Leu His Thr Leu Ser Leu Ala Glu Asn Ser

145 150 155 160

Leu Thr Arg Leu Thr Arg His Thr Phe Arg Asp Met Pro Ala Leu Glu

165 170 175

Gln Leu Asp Leu His Ser Asn Val Leu Met Asp Ile Glu Asp Gly Ala

180 185 190

Phe Glu Gly Leu Pro Arg Leu Thr His Leu Asn Leu Ser Arg Asn Ser

195 200 205

Leu Thr Cys Ile Ser Asp Phe Ser Leu Gln Gln Leu Arg Val Leu Asp

210 215 220

Leu Ser Cys Asn Ser Ile Glu Ala Phe Gln Thr Ala Ser Gln Pro Gln

225 230 235 240

Ala Glu Phe Gln Leu Thr Trp Leu Asp Leu Arg Glu Asn Lys Leu Leu

245 250 255

His Phe Pro Asp Leu Ala Ala Leu Pro Arg Leu Ile Tyr Leu Asn Leu

260 265 270

Ser Asn Asn Leu Ile Arg Leu Pro Thr Gly Pro Pro Gln Asp Ser Lys

275 280 285

Gly Ile His Ala Pro Ser Glu Gly Trp Ser Ala Leu Pro Leu Ser Ala

290 295 300

Pro Ser Gly Asn Ala Ser Gly Arg Pro Leu Ser Gln Leu Leu Asn Leu

305 310 315 320

Asp Leu Ser Tyr Asn Glu Ile Glu Leu Ile Pro Asp Ser Phe Leu Glu

325 330 335

His Leu Thr Ser Leu Cys Phe Leu Asn Leu Ser Arg Asn Cys Leu Arg

340 345 350

Thr Phe Glu Ala Arg Arg Leu Gly Ser Leu Pro Cys Leu Met Leu Leu

355 360 365

Asp Leu Ser His Asn Ala Leu Glu Thr Leu Glu Leu Gly Ala Arg Ala

370 375 380

Leu Gly Ser Leu Arg Thr Leu Leu Leu Gln Gly Asn Ala Leu Arg Asp

385 390 395 400

Leu Pro Pro Tyr Thr Phe Ala Asn Leu Ala Ser Leu Gln Arg Leu Asn

405 410 415

Leu Gln Gly Asn Arg Val Ser Pro Cys Gly Gly Pro Asp Glu Pro Gly

420 425 430

Pro Ser Gly Cys Val Ala Phe Ser Gly Ile Thr Ser Leu Arg Ser Leu

435 440 445

Ser Leu Val Asp Asn Glu Ile Glu Leu Leu Arg Ala Gly Ala Phe Leu

450 455 460

His Thr Pro Leu Thr Glu Leu Asp Leu Ser Ser Asn Pro Gly Leu Glu

465 470 475 480

Val Ala Thr Gly Ala Leu Gly Gly Leu Glu Ala Ser Leu Glu Val Leu

485 490 495

Ala Leu Gln Gly Asn Gly Leu Met Val Leu Gln Val Asp Leu Pro Cys

500 505 510

Phe Ile Cys Leu Lys Arg Leu Asn Leu Ala Glu Asn Arg Leu Ser His

515 520 525

Leu Pro Ala Trp Thr Gln Ala Val Ser Leu Glu Val Leu Asp Leu Arg

530 535 540

Asn Asn Ser Phe Ser Leu Leu Pro Gly Ser Ala Met Gly Gly Leu Glu

545 550 555 560

Thr Ser Leu Arg Arg Leu Tyr Leu Gln Gly Asn Pro Leu Ser Cys Cys

565 570 575

Gly Asn Gly Trp Leu Ala Ala Gln Leu His Gln Gly Arg Val Asp Val

580 585 590

Asp Ala Thr Gln Asp Leu Ile Cys Arg Phe Ser Ser Gln Glu Glu Val

595 600 605

Ser Leu Ser His Val Arg Pro Glu Asp Cys Glu Lys Gly Gly Leu Lys

610 615 620

Asn Ile Asn Leu Ile Ile Ile Leu Thr Phe Ile Leu Val Ser Ala Ile

625 630 635 640

Leu Leu Thr Thr Leu Ala Ala Cys Cys Cys Val Arg Arg Gln Lys Phe

645 650 655

Asn Gln Gln Tyr Lys Ala

660

<210> 3

<211> 5515

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

cgctacagag tagtcacaaa gccccttcct cgattgatac atgaccccat ggactccaac 60

ctggaaaagg tgtcctccta aagcagcaga tgaggaacgg tctctaacac ccatcgggtg 120

caggcccagg cctacatcga cttcatccaa aagagcggct cttgccattc tacacttggc 180

agagagggga actgaagttc agtctgacta gatagtacac acaagggctg aggtgggaga 240

gccacaaccc tgagagctcc cgagggtggg tgggggcagg aagctgggct actctgctgc 300

tctgactcct tatagcatca gaggatgcct ccttggtgaa cctttccctg accttaggtt 360

aggtcagggc tctagactgg agttgtcagg gactgtcctc tctgggttgt tcgcaccgca 420

tgggtccatc caaccactgt ggactagatg ggaggaaagg cccagctcag agcccagccc 480

tactctggct caccccgctt ggtgctgtta agatagggtg gatggccctc ctctaggcgc 540

tgtgaccacc agggagaaca ttatgaatac agaactagag actggaggac ggcagcaaca 600

ctcttcaccc atctttcagt ctagacccag cagggcacgg tgccagtgtc tgaggaggct 660

aagtaccttg taaaggcagc ggctttgggt aagttatgag actgtcatta tgcagtttaa 720

cctatcagag cctcaggtcc cccaaatgtc cgtggggacc tgacaagtct caaccagctg 780

gcttttccct catcccactc ctagcctcag cttctctatc agtaagcagg ggacactgac 840

aggcttggag atgacttaaa ggcaggatag ctgggggggg gggggggtgg atgggacccc 900

ctcagggcca tcccagggcc aaagaagggt cacttccttc cgtgccggtg gttgccagtc 960

acctctgggt ggccccctgc cttggtgcgg tggcgccagg atttcctccg cggacctgcg 1020

gctccctgca cccaagacct cgcgggccca cggctgcacg tgcggctgcc tcggcctagc 1080

ttcttttgtg atccttctcc ctccagtcgt ttttcggttt caagcgccgc cctagctggg 1140

tccgggcgat tccagagcag aggcgatgct cggttcctag gtccgcacgg ctggcagggc 1200

ggtgttagga ccccgcggct cagagtccca gggggcgtgg ccgggcggcc ggtgctattt 1260

aaaaggcggg cgccgccccc tcccggccgg ctggagcggc gctgcagcgg tccggcctcg 1320

gcgggccaga cccccggggt tgcgcgaacg atgcgcggag gagtcaggcg gcggcggcgg 1380

cgctgagcca ggtaggggcg gcggtcggcg gcggtgccta gagagctagg gccggaccct 1440

ccctcggcac ccgggtgtta gcagatctac ctaaggaagg gctcagatag gcgttcccat 1500

ttgacagctg ggaaaatcga ggcaggaagc tctgggtgtg cctaggagca cacagccaag 1560

caagcagatt aggatttgaa ttcaggtctg ccccaggcag acatgggctt tccacactac 1620

cactattatc tggaggggat acccagaact ctttggggag acttctttat gtgtgataga 1680

taggagggac ccccctaccc cacctccacc ctgacatttc acatcacaag cacattcctt 1740

tgggttaagg tctgattccc ctgagatgta ggatgtctct agaacgggct gcccctagtg 1800

agtgattcac tgcactgtga gccttgaagc tgctctccca ggcccccttt gacagtagtc 1860

ataacagact gagagcccta ccgctcagta tactcctggg cctggggctg taggctcctg 1920

agtaacttag gaaggaagtc ttggcagttg ctttggaggc acaggggctg gattctgata 1980

ccgactcttc gatttactgt acaagtgcct tagggtaagt catttctctg aatctcgtgg 2040

tctgggagag agatccacag ggtgcccgtg gggtctgcac tagtggagac cacccagcac 2100

taagggacta tagatctggc tgagtcccag ttgcagcaca cctaggggct aaggatcagg 2160

cactttgcct tcccaagcct cggtcctcca gtctgtaaat gggaattata gtaatcacct 2220

cacttggtgg ttgtgagagt taaaagacct gcagtcaacc tagggcttag aaaaattgta 2280

acctccttgc atagtagggg cagtcttatt tttattatag gtttgactcc actatctgtc 2340

tgtccccctc tgtcatgcac gcgcgagcac gcgtgcatgt gcacacacac atacaagcac 2400

atacagagat attctttgac acctctccaa tcagaatcca gctacctgcc tgcagagcca 2460

ggacctctat cctcagcatc gttggtatct gaaccatcag ggaaggacat ggaagggtcc 2520

cagtactttc ctggtcatgc tccacctgat ccatgctaag caaggatagc cagtgttgga 2580

atgggaactg gtgtgtcctg cagatgaatc acctaggcaa ggagagataa agaatttgcc 2640

ctgaggacca cactagccag tggtggggct tgacagtgag ccctgggttt gaatgcctct 2700

ggttgtccct ggggggctga gttctcactg ctgcagatgg ggcacagcag ggtgcttctt 2760

tccaccataa ttctgtgggg actgtctctt ctggatgtgc agaggaagga gagacagggt 2820

ccctttgggc atccctacct taaccccagg tcctaacttg tccttattgc agctgaattt 2880

gtgacatcat tcagccactt gttccctggg agaaatttag tgagcatata cttaaggaat 2940

gaagcaaatg agaaatgaga gcgggagggg ggatagaaca cccaggagcc tgagcaggaa 3000

cattctggac caggagggag cagccaagca gagtccttcc ccatccccca tccccctccc 3060

ccccacacac acccaccacc aggcagcagg gaaggtactg aggtgactga ggagtttgct 3120

gaggggaaga aggtggtagg tggagctgat gggagagagg gtgacgtctg aacgctactg 3180

gagatttcaa agtgatttgt aagatctggc atgtgatttt gaaacgtcac tgggtgccat 3240

gtatggggca gattgtcccg tcctagaggg aagcaagaag gcaaacagtg gagttggctg 3300

ttgcagtgaa ggtgggcggc tttgaacctg ctggactagg gcggggaggg gccaggggga 3360

cctctcctca cctgtatccc atagtggaga cttgcctgct gctgcgccat ctgacttccc 3420

tgtgtcataa ggtgggtccc cacgggtact tccttttcaa gaggtaggga atcacagtgg 3480

ggtgtgctgt gtgccccaca ctgagctgtc cgatgctcag caactgtgag agccctgaga 3540

acacagggta accgtgagaa ccagaggaag cttcctagag gacagggcat ctaagctcca 3600

cgggtgaaga gacattgagc tgcaggggag gcagaggaag ccaggggtcc agaggtccaa 3660

aggaagcaca ggtccgtaca tgtgctcagg gctcagagac agagcgagga caatgacaag 3720

tcaggtggga gacaagagct ggccgaggga gggatggttg cccagggcct ggacatgaag 3780

gctggcccag gaagggatag ctgctcagag cctggagatg aaggccaggg gctttcattt 3840

agctctgagg atgctgatgt taagcaggta gggactgcat ttgaaccaaa agaacaaaat 3900

ttcctgtgaa ttcatagcct gcagtgaaag cggagcactg tggggcaggg ctgggctctg 3960

ggggagccag gaaggagagt tgaaagggcc acactagccc ctgcgtgttt cagcaagata 4020

agcagccacg gcattgagag tcatccccag tgggttctga cagtcaaaag agccggcaca 4080

ggcctgcaga gctctcccaa ggccatcttt agagtggcaa ctctcattcc cttacccact 4140

gttggagacc ttcaagtgca gaggcgaagg gcacagagtc taccatgtag ctgtgttgtc 4200

ttagctgtat tttataacct ctctgagcct cggtgttgtt ttggtttggc tgtttgtctt 4260

ttcccttcta taaactaaga tgtgtaagga aacagagctg agtccttgag cgtcaggttt 4320

gatggtgagg tatgatatgc tgtaacacct tcatagaatg tctgttgtcc tcaacaaaac 4380

ctgacattta cccctggaaa caacgtcaga gagataacac ctgtgtaagg tcacacagca 4440

gatgcctagc agagatgaga gggagcgagt gctatggtct ctcctcgcaa gcacgctgcc 4500

gccgccatat ccacgcttcc gccgccatgt ccaggctgta atctccctgt ttcccagcat 4560

agaactagat gtgaggtgac attcagtatg ggaggaagtg aatgcattaa ttaattaatt 4620

aattaattaa ctaacaggtt gatctgtgtt tccccagcac atggctcaag tccacaggga 4680

ttcacccctg ctaagagcct ctgaggtccc catgggtccc tgtgctggct gcttacactg 4740

caatggagct ctggacctgg gcagctgtag ccttcagtga aagtagctgc ctggcagcct 4800

gctggggtgg ggcttcctgt cagcacccgg ccagcccctg acaatgacaa ggtctaagaa 4860

ttccaaccaa aagtaaaagg tcaaaaggaa ggatttgtgg agaatgaaac attccatttg 4920

gggctaagga cctgggatgg gggcctgcct ggggcctgga gggaaattga gtcagaggtt 4980

cactccccca cccaatccgg ccctgcccta gggtccctct gtcacctgag caccccttcc 5040

taactgtctt ctgccaggtg accctcttta gtttttttat tgcattttat ttattggaag 5100

ggaggtgtgc atgtgtagcg ggaagttgaa gtccaggagc cagctttctc cttccaccat 5160

gtgggtccca gagtcaaact caggcctaat ggcaagagcc tttacccctg ggccttttca 5220

atggcctgag gtgggcctta ggtaaacgca aagcagacgg tcatacattg ctttaaaagt 5280

cttgcttcct ctgagcaatg actcagctcg ccttcaaact tgcaatccct ggcctcctac 5340

ctcagcctct tgagttccag aataccacta ctctcagctc ccctgaggcc cgcgcacggc 5400

ccacgtggct cccgatttct gtcaggatcc ccgagggagg gcaagtgggt gctgctgtcg 5460

gtggggggag ccgtggtctc aacattgctc tcttctctcc accctaggca gagcc 5515

<210> 4

<211> 3151

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

caggctcggg aagccagagg ggcagagaag ttggggtcca actcaggtta ctcagtgacc 60

agggacttgg tgtcctgcac actgccgcgt gggcaggttc cttcccaggc tgcatctgtg 120

ggccagctgt gcagctcgaa gtggggcagt ttactgcaca gaggatgcca accgacagct 180

cgacgctgag tatctgtttc aggccacacc cgtctccggg tactagtaaa tgaaacacat 240

gcctatcctc aggcaagaga ggccgtcact gaaccacaca gtgaccacat aggcttgagg 300

tggggaagca gtaggctgga catggagaac ccaccctgac ttagagcagg agagccagcc 360

cgtgagagga tttgtctgag tcctttccac cccgagctct gtcgcatctg ctgataatga 420

ctttcagcct ctctggaaat gaagaacttg tgacctgaag agagagccag aacctctccc 480

cagaggtctt aagtctaggc tcctaggcta ggggctgcac cagcttaaag tgtgatcacc 540

taggcttcca cgcaggcctg ggccgtcctg tgtcctgctt tggacaggcc ttctctccag 600

tgcactcttg tatcacacac acactgaccc tggtgctgcc tgttccccaa ccccctgctc 660

aggcctcctt ctatcccagc cccaccctga cttttgagcc aagagggaga gcctcagcta 720

tctggttcag cttagcagct gcagaggcaa agtcaagcca actctcagag gtttctgtgt 780

tatctgggtt atacacaaga agaaaacaaa tttccttatg cattctcctt tgagagcctc 840

atggctcaga gagctgacga agccaaaatg aatcaagtcc atgtcctccc atctctgggg 900

ccaaagcttt gccagtgcgg tacctgcagg ctgtcaagtg gacaggaagt ggccctgccc 960

taaccaggat ccaagcacac ttgctacata taccccctcc ctctcagaca ggcgcccaca 1020

gaccctctgc ctctctgcct cagtgtccct tctttgcaga agagtatgaa ttcttccttt 1080

ctctttctgc tccccaaaat ctcattgagt gtaatctccc cactgaacag atagggaaag 1140

ttaggtgcag gccttgctca gaatcacgca agtcaatgga agaaaactgg gaacaaaagt 1200

agctgggcgg ttgcgccaag gcagagggtt tgctttgtgt gctcaaggcc ctgagctgga 1260

tgccagcggc tgtacccgtg tttccctacg ctcagcagtc acagcacgag acaaggccag 1320

ctaccatgcc agtcctcacc aggcatggaa aaataatagg gacacacaca cacacacaca 1380

cacacacaca cacacactgt ctccactcat tctccaggct tgtgggctgc agggaggaag 1440

gggagtcctg gacccagtca cagagcctgc tgcatcagat ccctgtgctc ggcccacagt 1500

cagccagagc ttccgtaatg tacaagaaga cgaaaacgcc attctctcta ccccactcta 1560

caggtgaggg gactgaggcc cagagaaggt taaaggctcc gaggaccaat aggcagatcc 1620

agacctagaa ccttccctca ctggtgctgc tgcgcacaca gctcttctcc tcggcctgga 1680

ggccaaggcg tggtggcccc tgggcctgaa ctctgaaaac actaatcaat gctgctctca 1740

cctcccagga ctggcctcta ccgggccctg ggacccgctc tttgtataac tcacatgaat 1800

gtattaaagt ataattttgg agaaactgtg gcctgccagc ctgcttactt cgggtatccc 1860

ataacctcat actggaatcc tgaccctgtt tccctcctca ggggctttta ttccttgtga 1920

ggtattgggg gggagggggg aaggacactg aagctcttag cctggcccac ccctggccag 1980

cctctactgt ggccacttca tacggaacat cacctatgcc ctaccccagc tctagaaaac 2040

agcggctgcg gctctttccc acctgtctgc ggccatgtgc ccactgcctt tctctgtatc 2100

cactcctcat cttaaaaccg gtgaaagacc cctgttgcca tctcaccatc cctcactctc 2160

actctcagag gcaggtccct tcccccaccc ccaaccctcc ccccatctcc ccagcccacc 2220

ctaccctgcc ttagctgaga tctcccaagg cctccttaca agatctccat acctttagac 2280

ctttgtccct ggactccacg gcccctcacc tcaccctcaa cctccctaac tccatccagg 2340

aagctgcctc ctccctctca agctactgtt ccccagccac tccgcctgct cctctttctc 2400

cagccacctc caagtgatgg atgcctcatc tgtccctcca gactgcttct gtggagacat 2460

ccaggcaccc tgcaccccag ccagagagtt acattgtctc ctaggggcta gagagtccag 2520

gcagaattta gtctgcaagc agtcaactta gggggggggg gggagaggga agagagaggg 2580

aggaggagag ggagagagag agagttaaga gttgaggaag ggagaggagc tgcctcacag 2640

gcggacatgg ggaaggttgt caagagggtc tcagtgaagg cgacatcagc tcagcacacc 2700

aacacctaga cccttgccct ctgcagctgc tagtcctcca cccagcctgc ttttccagca 2760

ggcttccccg aactctaagc accctggtca catctccata gctggagtgg cccctgggcc 2820

ctcctccctc cctggatgga cacccttgtc ttctcctaaa ggtccctttg aattgttttt 2880

ttctgcctcc agcctcttgc ccagcccctg ctcccagctc tctttctcca gaggaggacc 2940

tgagctatca ctagggatgg gaaagcacac agcgggggct cagggaaggc agagttagac 3000

tcggccatcg aatgggctgg gcttagccca gggtctggga gtctctcatc ccacaggaac 3060

ccagcaggcc cctgaccttc cttcctggca aacagcagag cctattcacc tggcctagac 3120

cctcagtgag acagaaattc ctgttttcag g 3151

<210> 5

<211> 6351

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

atgagacccc agatcctgct gctcctggcc ctgctgaccc taggcctggc tgcacaacac 60

caagacaaag tgccctgtaa gatggtaaga tgctctgccc agacagggtg aggaccaccc 120

ccacctccct gccctagggt gtgctagtgc cccagcccca gaagccagaa gttagaagag 180

tcaggagagg aaagggaatg taccttgcat ttaatgagca cctactagaa tgtttaaaca 240

ccttatttac ccacagtcct gccaggtaag caccattatt ctcattttgc aaaggaggag 300

actgaggctt ggagagattg ggccttgtcc aaggtcattc agctgggaac agtgaggctg 360

atattacact gtattccccc aagctgtccc cacagagcag taggcccagc taggggatct 420

agaatatata tatatgtgtg gggaatttgg ggtaggccag ctgggagggg ctcctctgtg 480

ctcatccctc ttggagacaa atccccttcc aagctgggct ccttgacttg ggactgcccg 540

ctggagtgcc tctcacttct tagtgcccag atcaaatgct gccatctcca ggaagcctcc 600

ccagcccctc ccaggctggc ctagtctgat cacaccttcc tctgggttcc tgcggtcccc 660

aggcttcccc ctatctcaat actgagaaga ctgaacatgt ggggtggttg gtgaaagggt 720

ccaagcctgt ctcacctgcc agaccatgaa cttccctagg gcaaggacca agtttgattt 780

gcttctattc ctttttcctg tcccaagcca gggaaactag ccctaaagtt cttgtgactc 840

tatgagatac agggcaaaga gaacacctag atccacttgt aaggccgggc agtcactgag 900

gccagagcct ggctggggaa agggcagggc ctccggaagc ccctcttgga cctgagactc 960

gaagaagctt atgacacaga accggcagct gcttcaggag gcaggaagtg caggcagctg 1020

cctgcccgca gcccttccct gggggtgcaa tgtctcctgt tgccaccacc tttcttgctc 1080

ttcagagccc ttctaagatt cccggagccc agaattgcgg gcagagaagg cctcagatgt 1140

caccaaatac aaacgcacat tctacctcag ggagacgagg ctcagagggg aaagtccttg 1200

actacccaac aggcagaggg gaagcgggtg aattttggag tctggggaaa tgagataaga 1260

gataggaaag cactttctga accagcatgg gaataataca cacgggaagt aaggagaaga 1320

tgtgtgaccc accagggacc tacaggattc gaacccagct gcctttgcca ctgttcactg 1380

cctggtgcct ctccctactc tgctttcctc ccatgatcag gtggtgaaat ggagttggat 1440

ggcaagtctt tgcttctgaa aaggaagctg ggcagtgggt gtcctgatag cccaggacag 1500

tgggtgggag ctctaaactc tggtcaaggg ccaattcctc caattccctc cgacggtaag 1560

tcaggcaatg ctgggagctc agagctgaag gaggcatgaa gaccctggaa gtggagctct 1620

gagcaccgcc ctggacttca agcttcttcc tggactggac tggagatctg ggcatcccag 1680

tgcagccctg cccaccatca ggcccccagg cttctagagc aggggtcttg ggcccctgaa 1740

tggaaagcca gtcttgggct gtgggcttgg caaactttgt gtcctggatc aagtctcagg 1800

ggctggtgcc ccagggagcc tttgcctatc cagaggcagt atgcctctgc acttgcccgg 1860

gggtaacacg cggggcacag cacggtgccc cccacactgt aacagtcagt aagtgggtcc 1920

atgatgctct ttgctgtgct gaccagctga gggcccagtg gtcagaactt ggctggcacc 1980

aataggaaaa ggaatttgca aatgggagtt ttgagcccct gactgtctga tcttgggcag 2040

cccactcccc ttagcctcag tttcgttagg ggtacaatag gaacagggtg aacaatgcct 2100

gggaagattt aatggggtag ggggtctctg cactcagcac gcagcctgac acagctgggg 2160

ctccatcaca ggtcattttg ttgtttctgc tttaagtaag gaatgcccca gggggtaagg 2220

gctgtgagga ggaggctatg tttagtggcc cctgcagaca gagaggttgt gagggaggaa 2280

gggcaaggat gggcaaggca gctgggcagg tttcaggttc acacaggtgc ccaactgacg 2340

gggcatccct gggcctcctg aggcccctgt gaagctgcct cccttggagg ctacatggag 2400

tcactgtgct gcatggagta agaagagcca cacggaggcc tgaggctggg caggtctctt 2460

cctcccccta ctcaccttgg ggctctcagg aggaagcgca gagctggacc aggggaggaa 2520

cacaccggct tgtgttccct ccctaccagc tcagccactg gctcactgtg aattcacgca 2580

agtcactgcc atcttcaggc ctcagtgttc acatctggga agtgggtcag ctgaactctt 2640

cttgctctac ccgtctttga ctatattttg aaaatatcaa ttatgcattt tctttcctcc 2700

tagagaagtg attgattcag tgcctcagac ctttactaaa ctgatgatgt ctgggactca 2760

ttcattagga aaaattgact tgctagtcag gtccaaggca tgcacatcca ccaaaccagt 2820

ccctgtttgc tctgagctcg ctgtctagca ggtcctcaca cacacagcca caattcagcg 2880

gggcaaagct ctgagaggaa gcacagtcag ggagggctcc ctggtggagg aggccctgaa 2940

gctcagtgtg aagagttcat gtgtggatct ggttggggat ggcataacca gctcagggag 3000

caggccccag cagtgggtgt gggagcgcat gatgggcagt ggtcagctgt ggtcactgca 3060

tgtgggctgg ggtgggaggt gggggacagg ttggcagggg ctacaaacag cctcgaaggc 3120

cctgctgggg atcctggact tcaccgtgga gaagtttaag ccaagctgcc tcattgtcag 3180

agtagagctt ttgagcagtt gtcaggcatt tagcagtgag tgggtcagaa cgggttggcg 3240

gagacagaag ctgggggcgg tgagcctgag cccggtgatt gtggaagtca gacctttttc 3300

tgggaaaggc tggggttcct ggaggcctgg aagagaagag ggagacctgc atttgcacag 3360

gaagaatttt ggtcccagaa ggcacatctg tggaagaaca agagttcggc cttttgttgt 3420

taaaaaacct gggttcaaat cccagctctg ctcctcacca gctgggcaat cctggcacct 3480

cccttcccct ccctgagcct agatttctgt aaataggggt gatcgtatca gatgggcagg 3540

ctgtggtaaa gaccaatggg accatgggcc tgaaagtatt aaccaagatg tcaaatgctg 3600

agtggctgct ggggaagaac gtaagaaaac agagtggtta tgtgacttcc tggaggtcgc 3660

acagcacaaa cacagtctca tcaccaaaga ctgtggattt ggctctggcc atcttttccc 3720

tggcccttcc cacctccagg ggcccggtcc cctgacccag cctgggaaga aagccacctc 3780

ctaggaggta acagcaacag agaggaagcc acatctcgga agcatccaca aggaaggcag 3840

gccccaggac ccaggctctg cccatgacac gagagcctga atgaggtctg aggcagggag 3900

gccaagataa aaactgatga cagagcacaa attacagttt tcccttttgg aaacatttct 3960

cccaaagtgg agaaattccc atctaccacc agaaatttaa ctatctgtgc ccatagaagg 4020

gacctaggac atagaatcag gagccctggg tcccagctct gccctgctgc tcactggctt 4080

ggggtcactc tgtgggatat atggctgttt cctgtaagag gggtaataat aagtacaggg 4140

tttctctttg ttagtttatt tgtccttcta tctgtctatc atctctccat ctgtccaccc 4200

atggaacctt catcgagttc cttccttaat gcccattact gcgctgggtg cccgagatgg 4260

ggcagggagc cggatgggtc atccaggcat ggggtgatca ggctgcggtg ggggaaagtt 4320

gagcattctg ggagtccatg ggagaagggt tccccagcca ggcagggttc ctggataaac 4380

atgtctggtt tcatccccta ccgtgcccac ttatgccagc tgtctcccca ccctacccct 4440

ccccaggtgg acaagaaggt ctcgtgccag gttctgggcc tgctccaggt cccctcggtg 4500

ctcccgccag acactgagac ccttgatcta tctgggaacc agctgcggag tatcctggcc 4560

tcacccctgg gcttctacac agcacttcgt cacctggacc tgagcaccaa tgagatcagc 4620

ttcctccagc caggagcctt ccaggccctg acccacctgg agcacctcag cctggctcac 4680

aaccggctgg cgatggccac tgcgctgagt gctggtggcc tgggccccct gccacgcgtg 4740

acctccctgg acctgtctgg gaacagcctg tacagcggcc tgctggagcg gctgctgggg 4800

gaggcaccca gcctgcatac cctctcactg gcggagaaca gtctgactcg cctcacccgc 4860

cacaccttcc gggacatgcc tgcgctggag cagcttgacc tgcatagcaa cgtgctgatg 4920

gacatcgagg atggcgcctt cgagggtctg ccccgcctga cccatctcaa cctctccagg 4980

aattccctca cctgcatctc cgacttcagc ctccagcagc tgcgggtgct agacctgagc 5040

tgcaacagca tcgaggcctt tcagacggcc tcccagcccc aggctgagtt ccagctcacc 5100

tggcttgacc tgcgggagaa caaactgctc catttccccg acctggccgc gctcccgaga 5160

ctcatctacc tgaacttgtc caacaacctc atccggctcc ccacagggcc accccaggac 5220

agcaagggca tccacgcacc ttccgagggc tggtcagccc tgcccctctc agcccccagc 5280

gggaatgcca gcggccgccc cctttcccag ctcttgaatc tggatttgag ctacaatgag 5340

attgagctca tccccgacag ctttcttgag cacctgacct ccctgtgctt cctgaacctc 5400

agcagaaact gcttgcggac ctttgaggcc cggcgcttag gctccctgcc ctgcctgatg 5460

ctccttgact taagccacaa tgccctggag acactggaac tgggcgccag agccctgggg 5520

tctctgcgga cgctgctcct acagggcaat gccctgcggg acctgccccc atacaccttt 5580

gccaatctgg ccagcctgca gcggctcaac ctgcagggga accgagtcag cccctgtggg 5640

gggccagatg agcctggccc ctccggctgt gtggccttct ccggcatcac ctccctccgc 5700

agcctgagcc tggtggataa tgagatagag ctgctcaggg caggggcctt cctccacacc 5760

ccactgactg agctggacct ttcttccaat cctgggctgg aggtggccac gggggccttg 5820

ggaggcctgg aggcctcctt ggaggtcctg gcactgcagg gcaacgggct gatggtcctg 5880

caggtggacc tgccctgctt catctgcctc aagcggctca atcttgccga gaaccgcctg 5940

agccaccttc ccgcctggac acaggctgtg tcactggagg tgctggacct gcgaaacaac 6000

agcttcagcc tcctgccagg cagtgccatg ggtggcctgg agaccagcct ccggcgcctc 6060

tacctgcagg ggaatccact cagctgctgc ggcaatggct ggctggcagc ccagctgcac 6120

cagggccgtg tggacgtgga cgccacccag gacctgatct gccgcttcag ctcccaggag 6180

gaggtgtccc tgagccacgt gcgtcccgag gactgtgaga aggggggact gaagaacatc 6240

aacctcatca tcatcctcac cttcatactg gtctctgcca tcctcctcac cacgctggcc 6300

gcctgctgct gcgtccgccg gcagaagttt aaccaacagt ataaagccta a 6351

<210> 6

<211> 128

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

gcacagcaca aacacagtct catcaccaaa gactgtggat ttggctctgg ccatcttttc 60

cctggcctca tgactcgagg tcgacggtat cgataagctt gatatcgaat tccgaagttc 120

ctattctc 128

<210> 7

<211> 134

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

actagagctt gcggaaccct tcgaagttcc tattctctag aaagtatagg aacttcatca 60

gtcaggtaca taatggtgga tcccttccca cctccagggg cccggtcccc tgacccagcc 120

tgggaagaaa gcca 134

<210> 8

<211> 3929

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 8

ggccggctgg agcggcgctg cagcggtccg gcctcggcgg gccagacccc cggggttgcg 60

cgaacgatgc gcggaggagt caggcggcgg cggcggcgct gagccaggca gagccatgag 120

accccagatc ctgctgctcc tggccctgct gaccctaggc ctggctgcac aacaccaaga 180

caaagtgccc tgtaagatgg tggacaagaa ggtctcgtgc caggttctgg gcctgctcca 240

ggtcccctcg gtgctcccgc cagacactga gacccttgat ctatctggga accagctgcg 300

gagtatcctg gcctcacccc tgggcttcta cacagcactt cgtcacctgg acctgagcac 360

caatgagatc agcttcctcc agccaggagc cttccaggcc ctgacccacc tggagcacct 420

cagcctggct cacaaccggc tggcgatggc cactgcgctg agtgctggtg gcctgggccc 480

cctgccacgc gtgacctccc tggacctgtc tgggaacagc ctgtacagcg gcctgctgga 540

gcggctgctg ggggaggcac ccagcctgca taccctctca ctggcggaga acagtctgac 600

tcgcctcacc cgccacacct tccgggacat gcctgcgctg gagcagcttg acctgcatag 660

caacgtgctg atggacatcg aggatggcgc cttcgagggt ctgccccgcc tgacccatct 720

caacctctcc aggaattccc tcacctgcat ctccgacttc agcctccagc agctgcgggt 780

gctagacctg agctgcaaca gcatcgaggc ctttcagacg gcctcccagc cccaggctga 840

gttccagctc acctggcttg acctgcggga gaacaaactg ctccatttcc ccgacctggc 900

cgcgctcccg agactcatct acctgaactt gtccaacaac ctcatccggc tccccacagg 960

gccaccccag gacagcaagg gcatccacgc accttccgag ggctggtcag ccctgcccct 1020

ctcagccccc agcgggaatg ccagcggccg ccccctttcc cagctcttga atctggattt 1080

gagctacaat gagattgagc tcatccccga cagctttctt gagcacctga cctccctgtg 1140

cttcctgaac ctcagcagaa actgcttgcg gacctttgag gcccggcgct taggctccct 1200

gccctgcctg atgctccttg acttaagcca caatgccctg gagacactgg aactgggcgc 1260

cagagccctg gggtctctgc ggacgctgct cctacagggc aatgccctgc gggacctgcc 1320

cccatacacc tttgccaatc tggccagcct gcagcggctc aacctgcagg ggaaccgagt 1380

cagcccctgt ggggggccag atgagcctgg cccctccggc tgtgtggcct tctccggcat 1440

cacctccctc cgcagcctga gcctggtgga taatgagata gagctgctca gggcaggggc 1500

cttcctccac accccactga ctgagctgga cctttcttcc aatcctgggc tggaggtggc 1560

cacgggggcc ttgggaggcc tggaggcctc cttggaggtc ctggcactgc agggcaacgg 1620

gctgatggtc ctgcaggtgg acctgccctg cttcatctgc ctcaagcggc tcaatcttgc 1680

cgagaaccgc ctgagccacc ttcccgcctg gacacaggct gtgtcactgg aggtgctgga 1740

cctgcgaaac aacagcttca gcctcctgcc aggcagtgcc atgggtggcc tggagaccag 1800

cctccggcgc ctctacctgc aggggaatcc actcagctgc tgcggcaatg gctggctggc 1860

agcccagctg caccagggcc gtgtggacgt ggacgccacc caggacctga tctgccgctt 1920

cagctcccag gaggaggtgt ccctgagcca cgtgcgtccc gaggactgtg agaagggggg 1980

actgaagaac atcaacctca tcatcatcct caccttcata ctggtctctg ccatcctcct 2040

caccacgctg gccgcctgct gctgcgtccg ccggcagaag tttaaccaac agtataaagc 2100

ctaacaggct cgggaagcca gaggggcaga gaagttgggg tccaactcag gttactcagt 2160

gaccagggac ttggtgtcct gcacactgcc gcgtgggcag gttccttccc aggctgcatc 2220

tgtgggccag ctgtgcagct cgaagtgggg cagtttactg cacagaggat gccaaccgac 2280

agctcgacgc tgagtatctg tttcaggcca cacccgtctc cgggtactag taaatgaaac 2340

acatgcctat cctcaggcaa gagaggccgt cactgaacca cacagtgacc acataggctt 2400

gaggtgggga agcagtaggc tggacatgga gaacccaccc tgacttagag caggagagcc 2460

agcccgtgag aggatttgtc tgagtccttt ccaccccgag ctctgtcgca tctgctgata 2520

atgactttca gcctctctgg aaatgaagaa cttgtgacct gaagagagag ccagaacctc 2580

tccccagagg tcttaagtct aggctcctag gctaggggct gcaccagctt aaagtgtgat 2640

cacctaggct tccacgcagg cctgggccgt cctgtgtcct gctttggaca ggccttctct 2700

ccagtgcact cttgtatcac acacacactg accctggtgc tgcctgttcc ccaaccccct 2760

gctcaggcct ccttctatcc cagccccacc ctgacttttg agccaagagg gagagcctca 2820

gctatctggt tcagcttagc agctgcagag gcaaagtcaa gccaactctc agaggtttct 2880

gtgttatctg ggttatacac aagaagaaaa caaatttcct tatgcattct cctttgagag 2940

cctcatggct cagagagctg acgaagccaa aatgaatcaa gtccatgtcc tcccatctct 3000

ggggccaaag ctttgccagt gcggtacctg caggctgtca agtggacagg aagtggccct 3060

gccctaacca ggatccaagc acacttgcta catatacccc ctccctctca gacaggcgcc 3120

cacagaccct ctgcctctct gcctcagtgt cccttctttg cagaagagta tgaattcttc 3180

ctttctcttt ctgctcccca aaatctcatt gagtgtaatc tccccactga acagataggg 3240

aaagttaggt gcaggccttg ctcagaatca cgcaagtcaa tggaagaaaa ctgggaacaa 3300

aagtagctgg gcggttgcgc caaggcagag ggtttgcttt gtgtgctcaa ggccctgagc 3360

tggatgccag cggctgtacc cgtgtttccc tacgctcagc agtcacagca cgagacaagg 3420

ccagctacca tgccagtcct caccaggcat ggaaaaataa tagggacaca cacacacaca 3480

cacacacaca cacacacaca ctgtctccac tcattctcca ggcttgtggg ctgcagggag 3540

gaaggggagt cctggaccca gtcacagagc ctgctgcatc agatccctgt gctcggccca 3600

cagtcagcca gagcttccgt aatgtacaag aagacgaaaa cgccattctc tctaccccac 3660

tctacaggtg aggggactga ggcccagaga aggttaaagg ctccgaggac caataggcag 3720

atccagacct agaaccttcc ctcactggtg ctgctgcgca cacagctctt ctcctcggcc 3780

tggaggccaa ggcgtggtgg cccctgggcc tgaactctga aaacactaat caatgctgct 3840

ctcacctccc aggactggcc tctaccgggc cctgggaccc gctctttgta taactcacat 3900

gaatgtatta aagtataatt ttggagaaa 3929

<210> 9

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

tcccaagaga cctctgtagt tgggg 25

<210> 10

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

cagggcactt tgtcttggtg ttgtg 25

<210> 11

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

ccggcagaag tttaaccaac agtat 25

<210> 12

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

cgggtggtct gagatggtga gacag 25

<210> 13

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

ggctttccca gaggaagatg acacc 25

<210> 14

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

agcagtgagc actttgactg atccc 25

<210> 15

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

ccaactaggc catcagagca tcagg 25

<210> 16

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

cttcagagtg ggagtatcct ggggt 25

<210> 17

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

ggatcggcca ttgaacaaga t 21

<210> 18

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

cagaagaact cgtcaagaag gc 22

<210> 19

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

gcaatgactc agctcgcctt caaac 25

<210> 20

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

gccccacggt ccctaactga ataac 25

<210> 21

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

gctccaattt cccacaacat tagt 24

<210> 22

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

ttctaacttc tggcttctgg ggctg 25

<210> 23

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

tcccctccct gagcctagat ttctg 25

<210> 24

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

ccgagatgtg gcttcctctc tgttg 25

<210> 25

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

gacaagcgtt agtaggcaca tatac 25

Claims

1.一种人源化GARP基因，其特征在于，所述的人源化GARP基因包含人GARP基因的部分。

2.根据权利要求1所述的人源化GARP基因，其特征在于，所述的人源化GARP基因包含编码人GARP蛋白的全部或部分核苷酸序列；优选的，包含编码人GARP信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列；更优选的，所述的人源化GARP基因包含编码人GARP蛋白的胞外区的全部或部分核苷酸序列，进一步优选的，包含与编码SEQ ID NO：2第20-627位的核苷酸序列具有至少70％、75％、80％、85％、90％、95％或至少99％同一性的核苷酸序列或者包含编码SEQ ID NO：2第20-627位的核苷酸序列，更进一步优选的，包含与编码SEQID NO：2的核苷酸序列具有至少70％、75％、80％、85％、90％、95％或至少99％同一性的核苷酸序列或者包含编码SEQ ID NO：2的核苷酸序列。

3.根据权利要求1或2所述的人源化GARP基因，其特征在于，所述的人源化GARP基因包含人GARP基因的1号外显子至3号外显子的全部或部分，优选的，所述的人源化GARP基因包含人GARP基因的2号至3号外显子的全部或部分，更优选的，所述的人源化GARP基因包含人GARP基因的2号和/或3号外显子的全部或部分，其中，2号外显子的部分至少包含50bp的核苷酸序列，3号外显子的部分至少包含1000bp的核苷酸序列。

4.根据权利要求1-3任一所述的人源化GARP基因，其特征在于，所述的人源化GARP基因中包含的人GARP基因的部分选自下列组中的一种：

(A)包含SEQ ID NO：5所示核苷酸序列的全部或部分；

5.根据权利要求1-4任一所述的人源化GARP基因，其特征在于，所述的人源化GARP基因转录的mRNA选自下列组中的一种：

(a)包含SEQ ID NO：8所示核苷酸序列的全部或部分；

6.一种人源化GARP蛋白，其特征在于，所述人源化GARP蛋白由权利要求1-5任一所述的人源化GARP基因编码。

7.一种载体，其特征在于，所述载体为靶向载体，所述载体包含权利要求1-5任一所述的人源化GARP基因。

8.根据权利要求7所述的载体，其特征在于，所述载体还包含5’臂；优选的，所述的5’臂与NCBI登录号为NC_000073.7至少具有90％同源性的核苷酸；进一步优选的，所述5’臂序列与SEQ ID NO：3至少具有90％同源性，或者如SEQ ID NO：3所示；和/或，所述的靶向载体还包含3’臂；优选的，所述的3’臂与NCBI登录号为NC_000073.7至少具有90％同源性的核苷酸；进一步优选的，所述的3’臂序列与SEQ ID NO：4至少具有90％同源性，或者如SEQ IDNO：4所示。

9.一种GARP基因人源化的非人动物的构建方法，其特征在于，所述的非人动物体内表达人或人源化GARP蛋白，或者，所述的非人动物至少一个细胞的基因组中包含人或人源化GARP基因。

10.根据权利要求9所述的构建方法，其特征在于，所述的人源化GARP蛋白为权利要求6所述的人源化GARP蛋白。

11.根据权利要求9或10所述的构建方法，其特征在于，所述的人源化GARP基因为权利要求1-5任一所述的人源化GARP基因。

12.根据权利要求9-11任一所述的构建方法，其特征在于，所述的构建方法包括用包含人GARP基因的全部或部分导入非人动物GARP基因座上；优选的，所述的人GARP基因的部分包含人GARP基因的1号至3号外显子的全部或部分，进一步优选的，包含人GARP基因的2号至3号外显子的全部或部分，更优选的，包含人GARP基因的2号和/或3号外显子的全部或部分，更进一步优选的，包含人GARP的基因的2号外显子的部分、3号外显子的部分；其中，2号外显子的部分至少包含50bp的核苷酸序列，3号外显子的部分至少包含1000bp的核苷酸序列，优选的，用包含SEQ ID NO：5的核苷酸序列，或用包含与SEQ ID NO：5具有至少70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％同一性的核苷酸序列导入非人动物基因座上。

13.根据权利要求12所述的构建方法，其特征在于，所述的导入为替换或插入，优选的，所述的导入非人动物GARP基因座为替换非人动物相应区域，进一步优选的，非人动物GARP基因的1号至3号外显子的全部或部分被替换，更优选的，非人动物的2号外显子的部分和3号外显子的部分被替换。

14.根据权利要求9-13任一所述的构建方法，其特征在于，人或人源化GARP基因在非人动物体内通过内源调控元件进行调控。

15.根据权利要求9-14任一所述的构建方法，其特征在于，使用权利要求7-8任一所述的载体进行非人动物的构建。

16.根据权利要求9-15任一所述的构建方法，其特征在于，所述的构建方法还包括将GARP基因人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑，并进行筛选，得到多基因修饰的非人动物，

优选的，所述的其他基因选自PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3和CD73中的至少一种。

17.一种细胞、组织或器官，其特征在于，所述的细胞、组织或者器官包含权利要求1-5任一所述的人源化GARP基因，所述的细胞、组织或者器官表达权利要求6所述的人源化GARP蛋白，或者所述细胞、组织或者器官来源于权利要求9-16任一所述的构建方法获得的非人动物。

18.权利要求1-5任一所述的人源化GARP基因、权利要求6所述的人源化GARP蛋白、权利要求9-16任一所述的构建方法获得的非人动物或权利要求16所述的细胞、组织或器官的应用，所述应用包括：

或者，

19.根据权利要求9-16任一所述的构建方法获得的非人动物或权利要求17所述的细胞、组织或器官，其特征在于，所述的非人动物为非人哺乳动物；优选的，所述的非人哺乳动物为啮齿类动物；进一步优选的，所述的啮齿类动物为小鼠或大鼠。