CN113105555A

CN113105555A - Mhc分子人源化的非人动物的构建方法及应用

Info

Publication number: CN113105555A
Application number: CN202110026238.1A
Authority: CN
Inventors: 沈月雷; 郭朝设; 张美玲; 黄蕤; 郭雅南; 白阳; 姚佳维; 尚诚彰
Original assignee: Baccetus Beijing Pharmaceutical Technology Co ltd
Current assignee: Baccetus Beijing Pharmaceutical Technology Co ltd
Priority date: 2020-01-10
Filing date: 2021-01-08
Publication date: 2021-07-13
Anticipated expiration: 2041-01-08
Also published as: IL294356A; US20230072216A1; KR20220125797A; JP2023509082A; WO2021139799A1; EP4087392A1; CN113105555B; EP4087392A4

Abstract

本发明提供了一种MHC分子人源化的非人动物的构建方法，利用基因编辑的方式将编码人MHC I类分子的核苷酸序列导入非人动物基因组中，从而构建出MHC分子人源化改造非人动物。本发明还提供了一种MHC嵌合蛋白、嵌合基因及制备MHC分子人源化改造非人动物使用的靶向载体、sgRNA等。本发明制备的MHC分子人源化改造非人动物体内能正常表达人源化MHC I类分子，可以作为人MHC I类分子信号机理研究、以及人类免疫系统多个方面研究，对免疫相关的新药研发具有重要的应用价值。

Description

MHC分子人源化的非人动物的构建方法及应用

技术领域

本发明属于动物基因工程和基因遗传修饰技术领域，具体地说，涉及一种基因修饰的非人动物，其表达一种人或人源化的主要组织相容性复合物分子(MHC)，特别是人或人源化MHC I类分子改造非人动物的构建方法及其在生物医药领域的应用。

背景技术

主要组织相容性复合体(major histocompatibility complex，MHC)是一组编码哺乳动物主要组织相容性抗原的基因群的统称。由于MHC的多基因特性，依据其编码分子的结构、组织分布与功能差异，可分为MHC I类、MHC II类、MHC III类基因，分别编码MHC I类分子、MHC II类分子、MHC III类分子。人类的MHC也称HLA(human leukocyte antigen)复合体；小鼠的MHC则被称为H2复合体，其中H2-D1属于小鼠MHC I类分子。人类MHC I类分子是由α、β两条链组成的异二聚体(如图1所示)，根据其在细胞上的分布，可以分为胞外区、跨膜区和胞内区，氨基端游离于细胞膜外，羧基端位于胞质内。其α链的膜外区肽段根据不同的空间构象折叠成三个功能区，即α1区、α2区、α3区。其中，α1区、α2区的氨基酸顺序变化较大，是多态性部位，α3区较为保守，其结构与免疫球蛋白超家族分子相似，具有种属特异性，是与CD8分子结合的部位；轻链β2m(B2M)则以非共价形式与α3区结合，附着于保守的免疫球蛋白样区域，虽然不直接参与MHC I类分子的抗原呈递，但它能促进内质网中新合成的MHC I类分子向细胞表面运输，并对MHC I类分子的结构稳定和在细胞表面的表达具有辅助作用。MHC I类分子具有参与免疫应答、免疫调节和T淋巴细胞发育等生物学功能，在抗原递呈和T细胞识别抗原过程中起着关键作用，可与抗原分子结合形成抗原MHC复合物，经由DC细胞(Dendritic Cells，树突状细胞)递呈给CTL细胞(cytotoxic lymphocyte，细胞毒性T淋巴细胞)，被CTL细胞表面TCR受体识别和结合，激活特异性CTL的杀伤性。此外，还可以作为KIR(Killer Ig-like receptor，NK细胞受体)的配体，参与自身耐受的维持，在器官移植、抗感染免疫及自身免疫疾病防治方面发挥着重要的作用。

HLA-A2是发现最早、在人群中携带频率最高的MHC I类分子，分布于几乎所有有核细胞表面，包括一组结构功能相似的高度多态的等位基因产物。其中，HLA-A2.1是中国人群中最为常见，阳性率高达50％。基于HLA-A2在肿瘤抗原递呈和T细胞抗原识别中的重要作用，目前已经报道了许多种肿瘤抗原肽-HLA-A2疫苗相关研究，例如用于治疗胃癌的MAGE3-HLA-A2肽疫苗(邵莹等，中国肿瘤生物治疗杂志，2000(4).)、用于结核病治疗的药物外排抗原-HLA-A2多表位疫苗(陈飞，郑州大学，2012)、用于疟疾治疗的TR26-HLA-A2.1疫苗(唐玉阳等，基础医学与临床，2000,20(3))等。此外，轻链β2m可能还与一些淀粉样蛋白疾病相关，如阿尔兹海默症(Alzheimer disease)、血液透析相关淀粉样变性(HRA)和威尔逊氏病(Wilsonsdisease,WD)，还有研究表明β2m基因缺陷与肿瘤及治疗性抗体如PD-1抗体的耐药性相关(Zaretsky JM et al.N Engl J Med.2016.Sep 1；375(9):819-29)。

实验动物疾病模型对于研究人类疾病发生的病因、发病机制、开发防治技术和开发药物是不可缺少的研究工具。其中，免疫缺陷动物由于缺乏免疫力，容易接受异种细胞或组织，在组织或细胞人源化动物研究、肿瘤药物及其他疾病的治疗机理方面已经得到广泛应用。已有研究表明作为受体鼠，目前普遍使用的免疫缺陷动物排序如下：NOD-Prkdc^scidIL-2rγ^nul小鼠〉NOD-Rag 1^-/--IL2rg^-/-(NRG)〉Rag 2^-/--IL2rg^-/-(RG)〉NOD/SCID〉裸鼠，表明NOD-Prkdc^scid IL-2rγ^nul小鼠是目前最佳的移植受体鼠(Ito R et al.Cell MolImmunol.2012May；9(3):208-14)。其中，NOD-Prkdc^scid IL-2rγ^null小鼠机体免疫功能严重缺陷，对人源细胞和组织几乎没有排斥反应，少量细胞即可成瘤(依赖于细胞系或细胞类型)，同时也没有B淋巴细胞泄漏，是最适合人源细胞或组织移植的工具小鼠，并已广泛用于新的人源化小鼠模型的研发。然而，上述免疫缺陷小鼠仍存在一定的缺陷和局限性，由于免疫缺陷小鼠的MHC仍然是H2分子，在移植人类细胞或组织后，人源细胞在小鼠胸腺中无法获得人HLA分子限制性，在进行免疫治疗或特定病原体感染后无法体现人类MHC限制性免疫反应的特征；同时，移植的人T、B淋巴细胞在免疫缺陷小鼠体内无法获得功能上完全的成熟，这也是现有的免疫缺陷小鼠模型需要完善的方面之一。

百奥赛图已成功制备NOD-Prkdc^scidIL-2rγ^null小鼠(命名为B-NDG小鼠)，为进一步优化已有模型，完善当前免疫缺陷小鼠存在的不足，解决临床转化方面的需求，本发明旨在提供一种B2M和HLA人源化小鼠模型，为肿瘤、移植排斥、病原感染等发病机理、预防及治疗药物筛选等提供稳定、高效的临床前实验动物模型。

发明内容

本发明的第一方面，提供了一种MHC分子人源化的非人动物的构建方法，所述的非人动物体内表达1)人或人源化B2M蛋白；和/或，2)MHC嵌合α链。

优选的，所述的非人动物体内内源B2M蛋白表达降低或缺失。

优选的，所述的非人动物体内表达MHC嵌合蛋白，所述的MHC嵌合蛋白包含人B2M蛋白的全部或部分，和/或人HLA蛋白的全部或部分。

优选的，所述的MHC嵌合α链或者所述的人HLA蛋白的部分包含HLA-A2.1蛋白的胞外区的全部或部分。

优选的，所述的MHC嵌合α链或者所述的人HLA蛋白的部分包含HLA-A2.1蛋白的Alpha-1、Alpha-2区域。进一步优选还包含信号肽。更进一步优选的，还包含Alpha-3、连接肽、胞内区和/或跨膜区。

在本发明的一个具体实施方式中，所述的MHC嵌合α链或人HLA蛋白的部分的氨基酸序列包含下列组中的一种：

A)SEQ ID NO：59、SEQ ID NO：8、SEQ ID NO：59第1-203位或SEQ ID NO：59第22-203位所示的氨基酸序列；

B)与SEQ ID NO：59、SEQ ID NO：8、SEQ ID NO：59第1-203位或SEQ ID NO：59第22-203位所示氨基酸的序列同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

C)与SEQ ID NO：59、SEQ ID NO：8、SEQ ID NO：59第1-203位或SEQ ID NO：59第22-203位所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸；或，

D)与SEQ ID NO：59、SEQ ID NO：8、SEQ ID NO：59第1-203位或SEQ ID NO：59第22-203位所示的，包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

优选的，所述的人或人源化B2M蛋白或所述的人B2M蛋白的部分的氨基酸序列包含下列组中的一种：

a)SEQ ID NO：4或SEQ ID NO：4第21-119位所示的氨基酸序列；

b)与SEQ ID NO：4或SEQ ID NO：4第21-119位所示氨基酸的序列同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

c)与SEQ ID NO：4或SEQ ID NO：4第21-119位所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸；或，

d)与SEQ ID NO：4或SEQ ID NO：4第21-119位所示的，包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

优选的，所述的MHC嵌合蛋白还包含非人动物H2-D1蛋白的跨膜区和/或胞内区。进一步优选还包含Alpha-3和/或连接肽。更进一步优选的，包含下列组中的一种：

1)SEQ ID NO：6第207-362位所示氨基酸序列的全部或部分；

2)与SEQ ID NO：6第207-362位所示氨基酸的序列同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

3)与SEQ ID NO：6第207-362位所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸；或，

4)与SEQ ID NO：6第207-362位所示的，包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

优选的，所述的MHC嵌合蛋白包含人B2M蛋白的全部或部分，和人HLA蛋白的全部或部分。其中所述的人B2M蛋白的全部或部分的氨基酸序列与人HLA蛋白的全部或部分的氨基酸序列直接连接或通过具有连接功能的接头蛋白连接。

优选的，所述的MHC嵌合蛋白含有从N末端侧依次连接有HLA-A2.1蛋白的信号肽、人B2M蛋白、HLA-A2.1蛋白的Alpha-1、Alpha-2区域以及非人动物H2-D1蛋白的Alpha-3、连接肽、跨膜区和胞内区。其中，所述的人B2M蛋白不含信号肽区域。

优选的，所述的MHC嵌合蛋白的氨基酸序列包含下列组中的一种：

I)SEQ ID NO：61、SEQ ID NO：62、SEQ ID NO：63或SEQ ID NO：64所示的氨基酸序列；

II)与SEQ ID NO：61、SEQ ID NO：62、SEQ ID NO：63或SEQ ID NO：64所示氨基酸的序列同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

III)与SEQ ID NO：61、SEQ ID NO：62、SEQ ID NO：63或SEQ ID NO：64所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸；或，

IV)与SEQ ID NO：61、SEQ ID NO：62、SEQ ID NO：63或SEQ ID NO：64所示的，包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

优选的，所述的非人动物的基因组中包含MHC嵌合基因，所述的MHC嵌合基因包含人或人源化B2M基因，和/或，MHC嵌合α链基因。进一步优选的，所述的非人动物的基因组中包含MHC嵌合基因，所述的MHC嵌合基因包含人B2M基因的部分和/或人HLA基因的部分。

优选的，所述的MHC嵌合α链基因或人HLA基因的部分包含编码胞外区的全部或部分核苷酸序列。

优选的，所述的MHC嵌合α链基因或人HLA基因的部分包含编码HLA-A2.1蛋白Alpha-1、Alpha-2区域的核苷酸序列，优选还包含编码信号肽的核苷酸序列，进一步优选还包含编码Alpha-3、连接肽、胞内区和/或跨膜区的核苷酸序列；或者，所述的MHC嵌合α链基因或人HLA基因的部分包含人HLA基因的外显子2至外显子3的编码序列，优选的，还包含外显子1的编码序列，进一步优选还包含外显子4至外显子8的编码序列。

优选的，所述的MHC嵌合α链基因或人HLA基因的部分的核苷酸序列包含下列组中的一种：

(A)SEQ ID NO：15、SEQ ID NO：13或SEQ ID NO：54所示核苷酸序列的全部或部分；

(B)与SEQ ID NO：15、SEQ ID NO：13或SEQ ID NO：54所示的核苷酸序列的同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

(C)与SEQ ID NO：15、SEQ ID NO：13或SEQ ID NO：54所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸；

(D)具有SEQ ID NO：15、SEQ ID NO：13或SEQ ID NO：54所示的核苷酸序列所示的，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

优选的，所述的人源化B2M基因或人B2M基因的部分包含编码人B2M蛋白的核苷酸序列或者人B2M基因的外显子1至外显子3的编码序列。进一步优选的，所述的人源化B2M基因或人B2M基因的部分包含下列组中的一种：

(a)SEQ ID NO：3或14所示核苷酸序列的全部或部分；

(b)与SEQ ID NO：3或14所示的核苷酸序列的同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

(c)与SEQ ID NO：3或14所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸；

(d)具有SEQ ID NO：3或14所示的核苷酸序列所示的，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

优选的，所述的MHC嵌合基因还包含非人动物H2-D1基因的外显子4至外显子8的编码序列或者编码非人动物H2-D1蛋白的Alpha-3、连接肽、胞内区和/或跨膜区的核苷酸序列。进一步优选包含下列组中的一种：

(1)SEQ ID NO：16所示核苷酸序列的全部或部分；

(2)与SEQ ID NO：16所示的核苷酸序列的同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

(3)与SEQ ID NO：16所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸；

(4)具有SEQ ID NO：16所示的核苷酸序列所示的，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

优选的，所述MHC嵌合基因包含人B2M基因的或部分，和人HLA基因的部分。进一步优选的，所述的人B2M基因的部分的核苷酸序列与人HLA基因的部分的核苷酸序列直接连接或通过编码具有连接功能的接头蛋白的核苷酸序列连接。更优选的，所述的MHC嵌合基因编码所述的MHC嵌合蛋白。

优选的，所述的MHC嵌合基因含有从5’至3’依次为编码HLA-A2.1蛋白的信号肽、人B2M蛋白、HLA-A2.1蛋白的Alpha-1、Alpha-2区域以及非人动物H2-D1蛋白的Alpha-3、连接肽、跨膜区和胞内区的核苷酸序列。其中，所述的人B2M蛋白不含信号肽区域。

更进一步优选的，所述的MHC嵌合基因的核苷酸序列包含下列组中的一种：

(I)SEQ ID NO：10或SEQ ID NO：65所示序列；

(II)转录的mRNA序列为SEQ ID NO：9或SEQ ID NO：52所示序列；

(III)与SEQ ID NO：10、SEQ ID NO：65、SEQ ID NO：9或SEQ ID NO：52所示的核苷酸序列的同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

(IV)与SEQ ID NO：10、SEQ ID NO：65、SEQ ID NO：9或SEQ ID NO：52所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸；或，

(V)具有SEQ ID NO：10、SEQ ID NO：65、SEQ ID NO：9或SEQ ID NO：52所示的核苷酸序列所示的，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

优选的，所述的构建方法包括将MHC嵌合基因可操作的连接在非人动物B2M或H2-D1基因座上。

进一步优选的，将MHC嵌合基因插入非人动物B2M基因外显子1上或者替换非人动物B2M基因外显子1至外显子4的核苷酸序列；优选为替换非人动物B2M基因外显子1至外显子3的核苷酸序列。

进一步优选的，将MHC嵌合基因插入非人动物H2-D1基因座上、替换非人动物H2-D1基因外显子1至外显子3的核苷酸序列或者替换非人动物H2-D1基因外显子1至外显子8的核苷酸序列。

优选的，将体内表达人或人源化B2M蛋白的非人动物与体内表达MHC嵌合α链的非人动物交配或者体外授精。

或者，提供体内表达人或人源化B2M蛋白的非人动物，将包含MHC嵌合α链基因的核苷酸序列导入非人动物B2M或H2-D1基因座。

或者，提供体内表达MHC嵌合α链的非人动物，将包含人或人源化B2M基因的核苷酸序列导入非人动物B2M或H2-D1基因座。

优选的，使用B2M基因的靶向载体或H2-D1基因的靶向载体，和/或sgRNA进行非人动物的构建。

所述的B2M基因的靶向载体包含MHC嵌合基因或人源化B2M基因或人B2M基因的部分，优选还包含5’臂和/或3’臂，所述的5’臂或3’臂与NCBI登录号为NC_000068.7至少具有90％同源性的核苷酸，优选自B2M基因基因组DNA的100-10000个长度的核苷酸，进一步优选的，所述5’臂如SEQ ID NO：11或SEQ ID NO：60所示，所述的3’臂如SEQ ID NO：12或SEQ IDNO：53所示。

所述的H2-D1基因的靶向载体包含MHC嵌合基因、人HLA基因的部分或人HLA基因的外显子1至外显子3与非人动物H2-D1基因的外显子4至外显子8的编码序列，优选还包含5’臂和/或3’臂，所述的5’臂或3’臂与NCBI登录号为NC_000083.6至少具有90％同源性的核苷酸，优选自H2-D1基因基因组DNA的100-10000个长度的核苷酸。

所述的sgRNA在非人动物B2M基因的靶位点位于非人动物B2M基因的外显子1、外显子1-2的内含子、外显子3或外显子3-4的内含子上，优选的，所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO：17-23任一项所示，3’端靶位点序列如SEQ ID NO：24-31任一项所示。

本发明的第二方面，提供了一种MHC嵌合蛋白，所述的MHC嵌合蛋白包含人MHC I蛋白的全部或部分。所述的MHC嵌合蛋白包含人B2M蛋白的全部或部分，和/或人HLA蛋白的全部或部分。所述的MHC嵌合蛋白包含人或人源化B2M蛋白，和/或MHC嵌合α链。

优选的，所述的HLA为HLA I类。进一步优选的，所述的HLA I类为HLA-A。再进一步优选的，所述的HLA选自HLA-A2、HLA-A24、HLA-A3、HLA-A31。

在本发明的一个具体实施方式中，所述的HLA选自HLA-A2.1、HLA-A24.2、HLA-A3.1、HLA-A31.1。

优选的，所述的MHC嵌合蛋白还包括非人动物H2-D1蛋白的全部或部分。

优选的，所述的MHC嵌合蛋白的氨基酸序列连续5-119个氨基酸与人B2M蛋白的氨基酸序列一致。进一步优选的，所述的MHC嵌合蛋白的氨基酸序列连续10-100个氨基酸与人B2M蛋白的氨基酸序列一致。

在本发明的一个具体实施方式中，所述的MHC嵌合蛋白的氨基酸序列连续20、50、80、99、100、119个氨基酸与人B2M蛋白的氨基酸序列一致。

优选的，所述的MHC嵌合蛋白的氨基酸序列连续5-362个氨基酸与人HLA蛋白的氨基酸序列一致。进一步优选的，所述的MHC嵌合蛋白的氨基酸序列连续10-203个氨基酸与人HLA蛋白的氨基酸序列一致。更进一步优选的，所述的MHC嵌合蛋白的氨基酸序列连续10-100个氨基酸与人HLA蛋白的氨基酸序列一致。

在本发明的一个具体实施方式中，所述的MHC嵌合蛋白的氨基酸序列连续20、50、80、100、150、183、200、203、250、300、342、362个氨基酸与人HLA蛋白的氨基酸序列一致。

优选的，所述的MHC嵌合α链或人HLA蛋白的部分包含HLA-A2.1蛋白的胞外区的全部或部分。进一步优选的，所述的MHC嵌合α链或人HLA蛋白的部分包含HLA-A2.1蛋白的Alpha-1、Alpha-2区域；更进一步优选的，还包含信号肽。更进一步优选还包含Alpha-3、连接肽、胞内区和/或跨膜区。

在本发明的一个具体实施方式中，所述的MHC嵌合α链或人HLA蛋白的全部或部分氨基酸序列包含下列组中的一种：

A)SEQ ID NO：59、SEQ ID NO：8、SEQ ID NO：59第1-203位或SEQ ID NO：59第22-203位所示氨基酸序列的全部或部分；

在本发明的一个具体实施方式中，所述的人源化B2M蛋白或人B2M蛋白的全部或部分氨基酸序列包含下列组中的一种：

a)SEQ ID NO：4或SEQ ID NO：4第21-119位所示氨基酸序列的全部或部分；

优选的，所述的非人动物H2-D1蛋白的部分包含非人动物H2-D1的跨膜区和/或胞内区。进一步优选的，所述的非人动物H2-D1蛋白的部分还包含Alpha-3和/或连接肽。

在本发明的一个具体实施方式中，所述的非人动物H2-D1蛋白的部分氨基酸序列包含下列组中的一种：

1)SEQ ID NO：6第207-362位所示氨基酸序列的全部或部分；

优选的，所述的人或人源化B2M蛋白的氨基酸序列与MHC嵌合α链的氨基酸序列直接连接或通过具有连接功能的接头蛋白连接。

优选的，所述的MHC嵌合蛋白包含人B2M蛋白和人HLA蛋白的全部或部分的连接。进一步优选的，所述的MHC嵌合蛋白包含人B2M蛋白和人HLA蛋白。再进一步优选的，所述的MHC嵌合蛋白包含人B2M蛋白和人HLA-A2.1的Alpha-1、Alpha-2区域。最为优选的，所述的MHC嵌合蛋白包含人HLA-A2.1的信号肽、人B2M蛋白和人HLA-A2.1的Alpha-1、Alpha-2区域。

优选的，所述的MHC嵌合蛋白包含人HLA蛋白的部分和非人动物H2-D1蛋白的部分。进一步优选的，所述的MHC嵌合蛋白包含人HLA-A2.1的Alpha-1、Alpha-2区域。再进一步优选的，所述的MHC嵌合蛋白包含人HLA-A2.1的信号肽。

优选的，所述的MHC嵌合蛋白包含人HLA-A2.1的Alpha-1、Alpha-2区域和非人动物H2-D1的Alpha-3、连接肽、跨膜区、胞内区。进一步优选的，所述的MHC嵌合蛋白包含人HLA-A2.1的信号肽、Alpha-1、Alpha-2区域和非人动物H2-D1的Alpha-3、连接肽、跨膜区、胞内区。

优选的，所述的MHC嵌合蛋白包含人B2M蛋白、人HLA蛋白的部分和非人动物H2-D1蛋白的部分。进一步优选的，所述的MHC嵌合蛋白包含人B2M蛋白、人HLA-A2.1的Alpha-1、Alpha-2区域和非人动物H2-D1的Alpha-3、连接肽、跨膜区、胞内区。再进一步优选的，所述的MHC嵌合蛋白包含人HLA-A2.1的信号肽、人B2M蛋白、人HLA-A2.1的Alpha-1、Alpha-2区域和非人动物H2-D1的Alpha-3、连接肽、跨膜区、胞内区。

在本发明的一个具体实施方式中，所述MHC嵌合蛋白包含人B2M蛋白的全部或部分，和人HLA蛋白的全部或部分。其中，所述的人B2M蛋白的全部或部分氨基酸序列与人HLA蛋白的全部或部分氨基酸序列直接连接或通过具有连接功能的接头蛋白连接。

进一步优选的，所述的接头蛋白为肽接头，其氨基酸数目和种类没有限定，只要可以连接人B2M蛋白的全部或部分氨基酸序列与人HLA蛋白的全部或部分氨基酸序列即可。最为优选的，所述的接头蛋白为柔性接头。

在本发明的一个具体实施方式中，所述的接头蛋白的氨基酸序列如SEQ ID NO：61第121-135位所示。

在本发明的一个具体实施方式中，所述的MHC嵌合蛋白的氨基酸序列包含下列组中的一种：

I)SEQ ID NO：61、SEQ ID NO：62、SEQ ID NO：63或SEQ ID NO：64所示氨基酸序列的全部或部分；

本发明的第三方面，提供了一种嵌合基因，所述的嵌合基因包含人B2M基因的部分，和/或人HLA基因的部分。所述的嵌合基因包含人或人源化B2M基因，和/或，MHC嵌合α链基因。

优选的，所述的嵌合基因还包含非人动物H2-D1基因的部分。

优选的，所述的嵌合基因编码的氨基酸序列连续5-119个氨基酸与人B2M蛋白的氨基酸序列一致。进一步优选的，所述的嵌合基因编码的氨基酸序列连续10-100个氨基酸与人B2M蛋白的氨基酸序列一致。

在本发明的一个具体实施方式中，所述的嵌合基因编码的氨基酸序列连续20、50、80、99、100、119个氨基酸与人B2M蛋白的氨基酸序列一致。

优选的，所述的嵌合基因编码的氨基酸序列连续5-362个氨基酸与人HLA蛋白的氨基酸序列一致。进一步优选的，所述的嵌合基因编码的氨基酸序列连续10-203个氨基酸与人HLA蛋白的氨基酸序列一致。更进一步优选的，所述的嵌合基因编码的氨基酸序列连续10-100个氨基酸与人HLA蛋白的氨基酸序列一致。

在本发明的一个具体实施方式中，所述的嵌合基因编码的氨基酸序列连续20、50、80、100、150、183、200、203、250、300、342、362个氨基酸与人HLA蛋白的氨基酸序列一致。

优选的，所述的MHC嵌合α链基因或人HLA基因的部分包含编码HLA-A2.1蛋白的胞外区的全部或部分核苷酸序列。进一步优选的，所述的编码HLA-A2.1蛋白的胞外区的部分核苷酸序列包含编码Alpha-1、Alpha-2区域的核苷酸序列。更进一步优选的，所述的编码HLA-A2.1蛋白的胞外区的部分核苷酸序列还包含编码信号肽的核苷酸序列。

优选的，所述的MHC嵌合α链基因或人HLA基因的部分包含人HLA基因的外显子2至外显子3的编码序列。进一步优选的，还包含外显子1的编码序列。更进一步优选还包含外显子4至外显子8的编码序列。

在本发明的一个具体实施方式中，所述的人HLA基因的部分包含外显子1至外显子3的编码序列或者外显子1至外显子8的编码序列。

进一步优选的，所述的人HLA基因的部分包含人HLA基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8中的一种、两种或三种以上的组合。其中，所述的三种以上包含三种、四种、五种、六种、七种或八种。

进一步优选的，所述的人HLA基因的部分包含人HLA基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8中的两种或三种以上连续外显子的核苷酸序列。其中，所述的三种以上包含三种、四种、五种、六种、七种或八种。

在本发明的一个具体实施方式中，所述的人HLA基因的部分包含人HLA基因的外显子1的部分核苷酸序列、外显子1-2的内含子的全部核苷酸序列、外显子2的全部核苷酸序列、外显子2-3的内含子的全部核苷酸序列和外显子3的部分核苷酸序列。其中，所述的外显子1的部分核苷酸序列从外显子1的ATG编码序列开始，所述的外显子3的部分核苷酸序列至编码完整Alpha-2区域为止。

在本发明的一个具体实施方式中，所述的人HLA基因的部分核苷酸序列包含下列组中的一种：

优选的，所述的人B2M基因的部分包含人B2M基因的外显子1至外显子4的全部或部分核苷酸序列。进一步优选的，所述的人B2M基因的部分包含人B2M基因的外显子1至外显子3的编码序列。

进一步优选的，所述的人B2M基因的部分包含人B2M基因的外显子1、外显子2、外显子3、外显子4中的一种、两种或三种以上的组合。其中，所述的三种以上包含三种或四种。

再进一步优选的，所述的人B2M基因的部分包含人B2M基因的外显子1、外显子2、外显子3、外显子4中的两种或三种以上连续外显子的核苷酸序列。其中，所述的三种以上包含三种或四种。

在本发明的一个具体实施方式中，所述的人B2M基因的部分为编码人B2M蛋白的核苷酸序列的全部或部分。

在本发明的一个具体实施方式中，所述的人B2M基因的部分核苷酸序列包含下列组中的一种：

(a)SEQ ID NO：3或14所示核苷酸序列的全部或部分；

优选的，所述的非人动物H2-D1基因的部分包含非人动物H2-D1基因的外显子1至外显子8的全部或部分核苷酸序列。

进一步优选的，所述的非人动物H2-D1基因的部分包含非人动物H2-D1基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8中的一种、两种或三种以上的组合。其中，所述的三种以上包含三种、四种、五种、六种、七种或八种。

进一步优选的，所述的非人动物H2-D1基因的部分包含非人动物H2-D1基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8中的两种或三种以上连续外显子的核苷酸序列。其中，所述的三种以上包含三种、四种、五种、六种、七种或八种。

最为优选的，所述的非人动物H2-D1基因的部分包含非人动物H2-D1基因的外显子4至外显子8的编码序列。

在本发明的一个具体实施方式中，所述的非人动物H2-D1基因的部分包含下列组中的一种：

(1)SEQ ID NO：16所示核苷酸序列的全部或部分；

优选的，所述嵌合基因包含人B2M基因的部分，和人HLA基因的部分。其中，所述的人B2M基因的部分核苷酸序列与人HLA基因的部分核苷酸序列直接连接或通过编码具有连接功能的接头蛋白的核苷酸序列连接。

进一步优选的，所述的编码具有连接功能的接头蛋白的核苷酸序列，其核苷酸数目和种类没有限定，只要可以连接人B2M基因的全部或部分核苷酸序列与人HLA基因的全部或部分核苷酸序列即可。最为优选的，所述的编码具有连接功能的接头蛋白的核苷酸序列为柔性接头。在本发明的一个具体实施方式中，具有连接功能的接头蛋白的氨基酸序列可以为SEQ ID NO：67或68。

优选的，编码具有连接功能的接头蛋白的核苷酸序列是核苷酸linker。

在本发明的一个具体实施方式中，所述的编码具有连接功能的接头蛋白的核苷酸序列如SEQ ID NO：51所示。

优选的，所述的嵌合基因编码上述的MHC嵌合蛋白。

在本发明的一个具体实施方式中，所述的嵌合基因的核苷酸序列包含下列组中的一种：

(I)SEQ ID NO：10或SEQ ID NO：65所示序列的全部或部分；

(II)转录的mRNA序列为SEQ ID NO：9或SEQ ID NO：52所示序列的全部或部分；

(IV)与SEQ ID NO：10、SEQ ID NO：65、SEQ ID NO：9或SEQ ID NO：52所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸；

优选的，所述的嵌合基因还包括特异性诱导物或阻遏物。进一步优选的，所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。在本发明的一个具体实施方式中，所述的特异性诱导物选自四环素系统(Tet-Off System/Tet-On System)或他莫昔芬系统(Tamoxifen System)。

优选的，SEQ ID NO：9或SEQ ID NO：52所示序列由MHC分子人源化改造小鼠的MHCDNA转录获得。

本发明的第四方面，提供了一种B2M基因的靶向载体，所述的靶向载体包含供体DNA序列，所述的供体DNA序列包含人B2M基因的全部或部分，和/或人HLA基因的全部或部分。优选的，所述的靶向载体包含上述嵌合基因。

本发明的第五方面，提供了一种H2-D1基因的靶向载体，所述的靶向载体包含供体DNA序列，所述的供体DNA序列包含人B2M基因的全部或部分，和/或人HLA基因的全部或部分。

优选的，所述的供体DNA序列还包含非人动物H2-D1基因的全部或部分。进一步优选的，所述的供体DNA序列包含上述的嵌合基因。

优选的，所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段，即5’臂，其选自B2M基因基因组DNA的100-10000个长度的核苷酸。进一步优选的，所述的5’臂与NCBI登录号为NC_000068.7至少具有90％同源性的核苷酸。更进一步优选的，所述5’臂序列如SEQ ID NO：11或SEQ ID NO：60所示。

优选的，所述的靶向载体还包含与待改变的转换区3’端同源的第二个DNA片段，即3’臂，其选自B2M基因基因组DNA的100-10000个长度的核苷酸。进一步优选的，所述的3’臂与NCBI登录号为NC_000068.7至少具有90％同源性的核苷酸。更进一步优选的，所述3’臂序列如SEQ ID NO：12或SEQ ID NO：53所示。

优选的，所述的B2M基因的靶向载体中待改变的转换区位于外显子1至外显子4。

优选的，所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段，即5’臂，其选自H2-D1基因基因组DNA的100-10000个长度的核苷酸。进一步优选的，所述的5’臂与NCBI登录号为NC_000083.6至少具有90％同源性的核苷酸。

优选的，所述的靶向载体还包含与待改变的转换区3’端同源的第二个DNA片段，即3’臂，其选自H2-D1基因基因组DNA的100-10000个长度的核苷酸。进一步优选的，所述的3’臂与NCBI登录号为NC_000083.6至少具有90％同源性的核苷酸。

优选的，所述的H2-D1基因的靶向载体中待改变的转换区位于外显子1至外显子3。

进一步优选的，所述的H2-D1基因的靶向载体中待改变的转换区位于外显子1至外显子8。

优选的，所述的靶向载体还包括编码具有连接功能的接头蛋白的核苷酸序列。

本发明的第六方面，提供了一种靶向B2M基因的sgRNA，所述的sgRNA靶向非人动物B2M基因，同时所述sgRNA在待改变的非人动物B2M基因上的靶序列上是唯一的，且符合5’-NNN(20)-NGG3’或5’-CCN-N(20)-3’的序列排列规则；优选的，所述sgRNA在非人动物B2M基因的靶位点位于非人动物B2M基因的外显子1、外显子1-2的内含子、外显子3或外显子3-4的内含子上。

优选的，所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO：17-23任一项所示，3’端靶位点序列如SEQ ID NO：24-31任一项所示。

进一步优选的，所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO：19所示，3’端靶位点序列如SEQ ID NO：30所示。

本发明的第七方面，提供了一种编码上述sgRNA的DNA分子。

优选的，所述DNA分子的双链选自SEQ ID NO：32和SEQ ID NO：34，SEQ ID NO：33和SEQ ID NO：35，SEQ ID NO：36和SEQ ID NO：38，或SEQ ID NO：37和SEQ ID NO：39。

本发明的第八方面，提供了一种包含上述sgRNA，和/或上述DNA分子的载体。

本发明的第九方面，提供了一种sgRNA载体的制备方法，包括以下步骤：

(i)提供一种sgRNA，制备获得正向寡核苷酸序列和反向寡核苷酸序列，所述sgRNA靶向非人动物B2M基因，同时所述sgRNA在待改变的非人动物B2M基因上的靶序列上是唯一的，且符合5’-NNN(20)-NGG3’或5’-CCN-N(20)-3’的序列排列规则，所述的sgRNA在非人动物B2M基因的靶位点位于非人动物B2M基因的外显子1、外显子1-2的内含子、外显子3或外显子3-4的内含子上；

(ii)合成含有T7启动子及sgRNA scaffold的片段DNA，并将所述片段DNA通过EcoRI和BamHI酶切连接至骨架载体上，经测序验证，获得pT7-sgRNA载体；

(iii)将步骤(i)获得的正向寡核苷酸和反向寡核苷酸变性、退火，形成可以连入步骤(2)所述的pT7-sgRNA载体的双链；

(iv)将步骤(iii)中退火的双链sgRNA寡聚核苷酸分别与pT7-sgRNA载体进行链接，筛选获得sgRNA载体。

优选的，所述步骤(i)中sgRNA靶向的5’端靶位点序列如SEQ ID NO：17-23任一项所示，3’端靶位点序列如SEQ ID NO：24-31任一项所示。进一步优选的，所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO：19所示，3’端靶位点序列如SEQ ID NO：30所示。更进一步优选的，所述的正向寡核苷酸序列如SEQ ID NO：33或SEQ ID NO：37所示；反向寡核苷酸序列如SEQ ID NO：35或SEQ ID NO：39所示。

优选的，所述的步骤(ii)中所述T7启动子及sgRNA scaffold的片段DNA如SEQ IDNO：40所示。

在本发明的一个具体实施方式中，所述的制备方法包括如下步骤：

(i)将序列如SEQ ID NO：17-23所示的任一项sgRNA靶序列和/或SEQ ID NO：24-31所示的任一项sgRNA靶序列，制备获得正向寡核苷酸序列如SEQ ID NO：33或SEQ ID NO：37所示和反向寡核苷酸序列如SEQ ID NO：35或SEQ ID NO：39所示；

(ii)合成含有T7启动子及sgRNA scaffold的片段DNA如SEQ ID NO：40所示，将其通过EcoRI和BamHI酶切连接至骨架载体上，经测序验证，获得pT7-sgRNA载体；

(iii)分别合成步骤(i)中所述的正向寡核苷酸和反向寡核苷酸，将合成的sgRNA寡聚核苷酸变性、退火，形成可以连入步骤(ii)所述的pT7-sgRNA载体的双链；

本发明的第十方面，提供了一种细胞，所述的细胞包含上述的靶向载体、上述的sgRNA、上述的DNA分子、上述的载体和/或上述的制备方法获得的sgRNA载体。

在本发明的一个具体实施方式中，所述的细胞包含上述任一靶向载体和上述任一sgRNA。

本发明的第十一方面，提供了上述的靶向载体、上述的sgRNA、上述的DNA分子、上述的载体、上述的制备方法获得的sgRNA载体和/或上述的细胞在基因修饰中的应用。

优选的，所述的应用包括但不限于敲除、插入或替换B2M基因的外显子1至外显子4的全部或部分核苷酸序列。

优选的，所述的应用包括但不限于敲除、插入或替换H2-D1基因的外显子1至外显子3的全部或部分核苷酸序列。

优选的，所述的应用包括但不限于敲除、插入或替换H2-D1基因的外显子1至外显子8的全部或部分核苷酸序列。

本发明的第十二方面，提供了一种MHC分子人源化改造非人动物的构建方法，所述的MHC分子人源化改造非人动物体内表达MHC嵌合蛋白，所述的MHC嵌合蛋白包括人B2M蛋白的全部或部分和/或人HLA蛋白的全部或部分。

优选的，所述的MHC分子人源化改造非人动物体内表达人源化B2M蛋白和/或MHC嵌合α链。

本发明的第十三方面，提供了一种MHC分子人源化改造非人动物，所述的MHC分子人源化改造非人动物体内表达MHC嵌合蛋白，所述MHC嵌合蛋白包括人B2M蛋白的全部或部分和/或人HLA蛋白的全部或部分。

优选的，所述的MHC分子人源化改造非人动物体内内源B2M蛋白正常表达，更优选的，所述的MHC分子人源化改造非人动物体内内源B2M蛋白表达降低或缺失。优选的，所述的MHC分子人源化改造非人动物体内表达上述的MHC嵌合蛋白。

优选的，所述的MHC分子人源化改造非人动物的基因组中包含人B2M基因的全部或部分，和/或人HLA基因的全部或部分。进一步优选的，所述的MHC分子人源化改造非人动物的基因组中还包含非人动物H2-D1基因的全部或部分。

最为优选的，所述的MHC分子人源化改造非人动物的基因组中包含上述的嵌合基因。

优选的，所述的嵌合基因在MHC分子人源化改造非人动物中通过调控元件进行调控。进一步优选的，所述的调控元件可以是内源的或者外源的。

在本发明的一个具体实施方式中，所述的调控元件包括启动子。

在本发明的一个具体实施方式中，所述内源调控元件可以来自非人动物B2M或H2-D1基因。

在本发明的一个具体实施方式中，所述的外源调控元件可以来自人B2M或HLA基因。

优选的，所述的MHC分子人源化改造非人动物为纯合或杂合的。

优选的，所述的MHC分子人源化改造非人动物的基因组中至少一个染色体上包含人B2M和/或HLA基因。进一步优选的，所述的MHC分子人源化改造非人动物的基因组中至少一个染色体上包含嵌合基因。

优选的，所述的MHC分子人源化改造非人动物中至少一个细胞表达MHC嵌合蛋白。

优选的，使用基因编辑技术进行MHC分子人源化改造非人动物的构建，所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。

优选的，所述的构建方法包括破坏非人动物内源B2M基因的编码框，将上述嵌合基因插入内源B2M基因座。

优选的，所述的构建方法包括将上述嵌合基因替换非人动物内源B2M基因座的外显子1至外显子4的全部或部分核苷酸序列。

优选的，所述的构建方法包括破坏非人动物内源B2M基因的编码框，将上述嵌合基因插入内源H2-D1基因座上。

优选的，所述的构建方法包括破坏非人动物内源B2M基因的编码框，将上述嵌合基因替换非人动物内源H2-D1基因的外显子1至外显子3。

优选的，所述的构建方法包括破坏非人动物内源B2M基因的编码框，将上述嵌合基因替换非人动物内源H2-D1基因的外显子1至外显子8。

优选的，将上述的嵌合基因可操作的连接在非人动物B2M或H2-D1基因座上，获得MHC分子人源化改造非人动物。

优选的，使用上述的靶向载体和/或上述的sgRNA将上述的嵌合基因插入非人动物B2M基因外显子1上或者替换非人动物B2M基因外显子1至外显子4的全部或部分核苷酸序列。进一步优选的，使用上述的靶向载体和/或上述的sgRNA用上述的嵌合基因替换非人动物B2M基因外显子1至外显子3的全部或部分核苷酸序列。

优选的，使用上述的靶向载体将上述的嵌合基因插入非人动物H2-D1基因座上、替换非人动物H2-D1基因外显子1至外显子3的全部或部分核苷酸序列或者替换非人动物H2-D1基因外显子1至外显子8的全部或部分核苷酸序列。

优选的，将体内表达人B2M蛋白的全部或部分的MHC分子人源化改造非人动物与体内表达人HLA蛋白的MHC分子人源化改造非人动物交配或者体外授精，获得MHC分子人源化改造非人动物。或者将体内表达人源化B2M蛋白的MHC分子人源化改造非人动物与体内表达MHC嵌合α链的MHC分子人源化改造非人动物交配或者体外授精，获得MHC分子人源化改造非人动物。

优选的，提供体内表达人B2M蛋白的全部或部分的MHC分子人源化改造非人动物，将包含人HLA基因的全部或部分核苷酸序列导入非人动物B2M或H2-D1基因座，或者将包含人HLA基因的部分和非人动物H2-D1基因的部分导入非人动物B2M或H2-D1基因座。或者，提供体内表达人源化B2M蛋白的MHC分子人源化改造非人动物，将包含人HLA基因的全部或部分核苷酸序列导入非人动物B2M或H2-D1基因座，或者将包含人HLA基因的部分和非人动物H2-D1基因的部分导入非人动物B2M或H2-D1基因座。

优选的，提供体内表达人HLA蛋白的全部或部分的MHC分子人源化改造非人动物，将包含人B2M基因的全部或部分核苷酸序列导入非人动物B2M或H2-D1基因座。或者，提供体内表达MHC嵌合α链的MHC分子人源化改造非人动物，将包含人B2M基因的全部或部分核苷酸序列导入非人动物B2M或H2-D1基因座。

本发明的第十四方面，提供了一种多基因修饰的非人动物的构建方法，包括如下步骤：

i)提供上述的MHC分子人源化改造非人动物，或者采用上述的构建方法获得的MHC分子人源化改造非人动物；

ii)将步骤i)获得的MHC分子人源化改造非人动物与其他基因修饰的非人动物交配、体外授精或直接进行基因编辑，并进行筛选，得到多基因修饰的非人动物。

优选的，所述的其他基因修饰的非人动物包括但不限于基因HLA-B、HLA-C、H-2K、H2-L等人源化的非人动物。

优选的，所述的多基因修饰的非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物、六基因人源化非人动物、七基因人源化非人动物、八基因人源化非人动物或九基因人源化非人动物。

优选的，所述的多基因修饰的非人动物的基因组中人源化的多个基因中的每一个基因均可以是纯合或杂合的。

本发明的第十五方面，提供了一种上述的构建方法获得的多基因修饰的非人动物或其子代。

本发明的第十六方面，提供了一种B2M基因缺失的动物模型，所述的动物模型中的B2M基因被敲除，该动物模型不表达B2M蛋白。

本发明的第十七方面，提供了一种B2M基因缺失的细胞，所述的B2M基因缺失的细胞基因组中的B2M基因被敲除，该B2M基因缺失的细胞不表达B2M蛋白。

优选的，所述的B2M基因缺失为缺失B2M基因的外显子1至外显子4的全部或部分核苷酸序列。

优选的，所述的B2M基因缺失的动物模型或B2M基因缺失的细胞的制备方法包括使用sgRNA敲除B2M基因的外显子1至外显子4的全部或部分核苷酸序列。进一步优选的，所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO：17-23任一项所示，3’端靶位点序列如SEQ IDNO：24-31任一项所示。更进一步优选的，所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO：19所示，3’端靶位点序列如SEQ ID NO：30所示；

本发明的第十八方面，提供了一种荷瘤或炎症的动物模型，所述的动物模型来源于上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物或者上述的多基因修饰的非人动物或其子代。

本发明的第十九方面，提供了一种荷瘤或炎症的动物模型的制备方法，所述的制备方法包括上述的构建方法获得的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物。优选的，所述的制备方法还包括植入肿瘤细胞的步骤。

本发明的第二十方面，提供了上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物或者上述的多基因修饰的非人动物或其子代在构建荷瘤或炎症的动物模型中的应用。

本发明的第二十一方面，提供了一种细胞或细胞系或原代细胞培养物，所述细胞或细胞系或原代细胞培养物来源于上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代或者上述的荷瘤或炎症的动物模型。

本发明的第二十二方面，提供了一种组织或器官或其培养物，所述组织或器官或其培养物来源于上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代或者上述的荷瘤或炎症的动物模型。

优选的，所述组织或器官为脾脏、肿瘤或其培养物。

本发明的第二十三方面，提供了一种荷瘤后的瘤组织，所述的瘤组织来源于上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代或者上述的荷瘤或炎症的动物模型。

本发明的第二十四方面，提供了一种MHC分子人源化的细胞、组织、器官或荷瘤后的瘤组织，所述的细胞、组织、器官或荷瘤后的瘤组织表达上述的MHC嵌合蛋白。优选的，所述的细胞中内源B2M蛋白表达降低或缺失。进一步优选的，所述的细胞的基因组中包含上述的嵌合基因。

本发明的第二十五方面，提供了一种MHC分子人源化改造的细胞，所述的细胞表达MHC嵌合蛋白，所述的MHC嵌合蛋白包含人B2M蛋白的全部或部分和/或人HLA蛋白的全部或部分。

优选的，所述的细胞表达人源化B2M蛋白和/或MHC嵌合α链。

优选的，所述的细胞中内源B2M蛋白表达降低或缺失。进一步优选的，所述的细胞表达上述的MHC嵌合蛋白。

优选的，所述的细胞的基因组中包含人B2M基因的全部或部分，和/或人HLA基因的全部或部分。进一步优选的，所述的细胞的基因组中还包含非人动物H2-D1基因的全部或部分。最为优选的，所述的细胞的基因组中包含上述的嵌合基因。

优选的，所述的非人动物为非人哺乳动物。进一步优选的，所述的非人哺乳动物为啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备MHC分子人源化改造非人动物的非人哺乳动物。更进一步优选的，所述的啮齿类动物为小鼠或大鼠。其中小鼠B2M基因对应的蛋白序列如SEQ ID NO：2所示，大鼠B2M基因对应的蛋白序列如SEQ ID NO：66所示。

优选的，所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的，所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的，所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的，所述免疫缺陷鼠是NOD-Prkdc^scid IL-2rγ^nul小鼠、NOD-Rag 1^-/--IL2rg^-/-(NRG)小鼠、Rag 2^-/--IL2rg^-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。

本发明的第二十六方面，提供了一种包含上述嵌合基因的构建体。

本发明的第二十七方面，提供了一种包含上述构建体的细胞。

本发明的第二十八方面，提供了一种包含上述细胞的组织。

本发明的第二十九方面，提供了一种构建人免疫系统重建动物模型的方法，所述的方法包括向个体移植人免疫细胞，获得人免疫系统重建动物模型；其中，所述的个体选自上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代或者上述的荷瘤或炎症的动物模型。

优选的，所述的植入为尾静脉注射。

优选的，所述的人免疫细胞包括但不限于CD34+或外周血单个核细胞(PBMC)。

优选的，所述注射人造血干细胞的量为1.5×10⁵人造血干细胞(HSC)。

优选的，所述的免疫系统重建的标注为hCD45占总活细胞的比例≥25％。

优选的，所述的方法还包括注射人造血干细胞后每间隔一段时间取PBMC进行检测验证是否成功以及观察非人动物存活情况。其中，在本发明的一个具体实施方式中，所述的一段时间为4周。

优选的，所述取PBMC进行检测验证包括检测表达人白细胞表面分子标记(CD45⁺)的细胞、T细胞(CD3+)、B细胞(CD19+)、NK细胞(CD56+)、单核细胞(CD14+)、粒细胞(CD66b+)和髓系细胞(CD33+)的发育情况。

本发明的第三十方面，提供了一种构建自身免疫疾病动物模型的方法，所述的方法包括用免疫诱导剂免疫个体，获得自身免疫疾病动物模型；其中，所述的个体选自上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代或者上述的荷瘤或炎症的动物模型。

本发明的第三十一方面，提供了一种上述的方法制备获得的动物模型或其子代。

本发明的第三十二方面，提供了来源于上述的MHC嵌合蛋白、上述的嵌合基因、上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代、上述的荷瘤或炎症的动物模型、上述的细胞或细胞系或原代细胞培养物、上述的组织或器官或其培养物、上述的荷瘤后的瘤组织、上述的细胞、上述的构建体、上述的细胞、上述的组织、上述的动物模型或其子代在需要涉及人类细胞的免疫过程的产品开发，制造人类抗体、疫苗，或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用；或者在生产和利用动物实验疾病模型，用于人源细胞移植、免疫系统重建、病原学研究，用于开发新的诊断策略和/或治疗策略中的应用；优选的，所述的应用为人造血干细胞的形成、功能研究和/或构建疾病模型；或者在筛选、验证、评价或研究MHC功能、人MHC信号机理、靶向人的抗体、疫苗、靶向人的药物、药效，免疫相关疾病药物以及抗肿瘤或抗炎症药物，筛选和评估人用药及药效研究方面的应用。

优选的，所述的用途为人造血干细胞的形成、功能研究和/或构建疾病模型。

本发明的第三十三方面，提供了一种干预方案的评价方法，所述的评价方法包括向个体植入肿瘤细胞，向植入肿瘤细胞的个体施加干预方案，对施加干预方案后的个体进行肿瘤抑制效果检测和评价；其中，所述的个体选自上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代、上述的荷瘤或炎症的动物模型或者上述的动物模型或其子代。

优选的，所述的干预方案选自CAR-T、药物治疗。进一步优选的，所述的药物为抗体或疫苗。

优选的，所述的肿瘤细胞可以来源于人或非人动物。其中，所述的非人动物为非人哺乳动物。优选的，所述的非人哺乳动物为啮齿类动物。进一步优选的，所述的非人动物为小鼠。

优选的，当所述个体背景为免疫缺陷的，则肿瘤细胞可以来源于人或非人动物。

优选的，当所述个体背景为野生型的，则肿瘤细胞来源于非人动物。

在本发明的一个具体实施方式中，所述的肿瘤细胞为人或鼠的肿瘤细胞。

优选的，所述干预方案的评价方法不是治疗方法。该评价方法对干预方案的效果进行检测和评价，以确定该干预方案是否有治疗效果，即治疗效果不是必然的，只是一种可能性。

本发明的第三十四方面，提供了一种抗体筛选的方法，所述的方法包括向个体体内移植肿瘤细胞后，给予待筛选的抗体，对给予抗体的非人动物或子代进行检测、效果评价，其中，所述的个体选自上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代、上述的荷瘤或炎症的动物模型或者上述的动物模型或其子代。

优选的，所述的肿瘤细胞可以来自人或非人动物。其中，所述的非人动物为非人哺乳动物。优选的，所述的非人哺乳动物为啮齿类动物。进一步优选的，所述的非人动物为小鼠。

优选的，所述的抗体筛选的方法不是治疗方法。该方法用来筛选抗体，对不同抗体的药效进行检测和比较，以确定哪些抗体可以作为药物，哪些不能作为药物，或者，比较不同抗体的药效敏感程度，即治疗效果不是必然的，只是一种可能性。

本发明的第三十五方面，提供了一种人用药物筛选或评价的方法，所述的方法包括向个体体内移植肿瘤细胞，向移入肿瘤细胞的动物给予候选药物，对给予候选药物的个体进行药效检测和/或比较。其中，所述的个体选自上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代、上述的荷瘤或炎症的动物模型或者上述的动物模型或其子代。

优选的，所述药物筛选或评价的方法不是治疗方法。该方法用来筛选或评价药物，对候选药物的药效进行检测和比较，以确定哪些候选药物可以作为药物，哪些不能作为药物，或者，比较不同药物的药效敏感程度，即治疗效果不是必然的，只是一种可能性。

优选的，所述候选药物包括靶向药物。进一步优选的，所述的靶向药物为抗原结合蛋白。在本发明的一个具体实施方式中，所述的抗原结合蛋白为抗体。

优选的，所述候选药物为单抗或双特异性抗体或两种及两种以上药物的联合使用。

优选的，所述检测包括测定肿瘤细胞的大小和/或增殖速率；优选的，所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。

优选的，所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化，所述的代谢变化包括食物消耗或水消耗的变化。

通过上述的技术方案，本发明取得了良好的技术效果，包括：在MHC分子人源化改造非人动物体内正常表达MHC嵌合蛋白，以及构建的包含B2M和/或HLA基因的嵌合基因。更重要的是，构建了免疫缺陷程度更高的MHC分子人源化改造非人动物。

本发明所述的“连接”为直接连接或者通过接头连接，例如，人B2M蛋白的部分氨基酸与人HLA蛋白的部分氨基酸之间可以直接连接也可以通过接头连接。

本发明所述的“人源化B2M蛋白”，包含来源于人B2M蛋白的部分和非人B2M蛋白部分，其中，所述“人B2M蛋白”为人B2M蛋白的全长氨基酸序列。优选的，所述的人B2M蛋白的部分为连续5-119个氨基酸与人B2M蛋白的氨基酸序列一致。进一步优选的，所述的人B2M蛋白的部分为连续10-100个氨基酸与人B2M蛋白的氨基酸序列一致。在本发明的一个具体实施方式中，所述的MHC嵌合蛋白的氨基酸序列连续20、50、80、99、100、119个氨基酸与人B2M蛋白的氨基酸序列一致。换句话说，所述的人B2M蛋白的部分包含人B2M基因的外显子1至外显子4的全部或部分编码的氨基酸序列。优选的，所述的人B2M蛋白的部分包含人B2M基因的外显子1、外显子2、外显子3、外显子4中的一种、两种、三种或四个的组合编码的氨基酸序列。进一步优选的，所述的人B2M蛋白的部分包含人B2M基因的外显子1、外显子2、外显子3、外显子4中的两种、三种或四种连续外显子编码的氨基酸序列。再进一步优选的，所述的人B2M蛋白的部分包含人B2M基因的外显子1至外显子3的全部或部分编码的氨基酸序列。

本发明所述的“MHC嵌合α链”，包含来源于人HLA蛋白的部分和非人H2-D1蛋白部分，其中，所述“人HLA蛋白”为人HLA蛋白的α链全长氨基酸序列。优选的，所述的人HLA蛋白的部分为连续5-362个氨基酸与人HLA蛋白的氨基酸序列一致。进一步优选的，所述的人HLA蛋白的部分为连续10-203个氨基酸与人HLA蛋白的氨基酸序列一致。更进一步优选的，所述的人HLA蛋白的部分为连续10-100个氨基酸与人HLA蛋白的氨基酸序列一致。在本发明的一个具体实施方式中，所述的人HLA蛋白的部分为连续20、50、80、100、150、183、200、203、250、300、342、362个氨基酸与人HLA蛋白的氨基酸序列一致。更为具体的，所述的人HLA蛋白的部分包含HLA-A2.1蛋白的胞外区的全部或部分。进一步优选的，所述的HLA-A2.1蛋白的胞外区的部分包含Alpha-1、Alpha-2区域；更进一步优选的，所述的HLA-A2.1蛋白的胞外区的部分还包含信号肽。在本发明的一个具体实施方式中，所述的MHC嵌合α链包括人信号肽、人Alpha-1、人Alpha-2和非人动物Alpha-3、非人动物连接肽、非人动物跨膜区以及非人动物胞内区。换句话说，所述的人HLA蛋白的部分为包含人HLA基因的外显子1至外显子8的全部或部分编码的氨基酸序列。优选的，所述的人HLA蛋白的部分为包含人HLA基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8中的一种、两种或三种以上的组合编码的氨基酸序列。其中，所述的三种以上包含三种、四种、五种、六种、七种或八种。进一步优选的，所述的人HLA蛋白的部分包含人HLA基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8中的两种或三种以上连续外显子编码的氨基酸序列。其中，所述的三种以上包含三种、四种、五种、六种、七种或八种。更进一步优选的，所述的人HLA蛋白的部分包含人HLA基因的外显子1至外显子3的全部或部分编码的氨基酸序列。其中，HLA选自HLA-A2.1、HLA-A24.2、HLA-A3.1或HLA-A31.1，H-2优选为H2-D1。本发明所述的“Alpha”同“α”。

本发明所述的“MHC嵌合α链基因”编码所述的MHC嵌合α链，其包含人HLA的α链和非人动物H-2的α链。

本发明所述的“人源化B2M基因”包含人B2M基因的全部或部分，优选不含编码信号肽的核苷酸序列。

本发明所述的“MHC嵌合蛋白”，包含来源相同或不同的同种或不同种蛋白的嵌合。例如可以为来源相同(例如均来源人或均来源于非人)的B2M蛋白的全部或部分与HLA蛋白的全部或部分之间的嵌合，或者来源不同(例如分别来源于人和非人)的B2M蛋白的全部或部分与HLA蛋白的全部或部分之间的嵌合，或者来源相同(例如均来源人或均来源于非人)的HLA蛋白部分与HLA蛋白部分之间的嵌合，或者来源不同(例如分别来源于人和非人)的HLA蛋白部分与HLA蛋白部分之间的嵌合，以及来源相同或不同的B2M蛋白的全部或部分、HLA蛋白部分与HLA蛋白部分之间的嵌合。

本发明所述的“嵌合基因”，包含来源相同或不同的同种或不同种基因的嵌合。例如可以为来源相同(例如均来源人或均来源于非人)的B2M基因的全部或部分与HLA基因的全部或部分之间的嵌合，或者来源不同(例如分别来源于人和非人)的B2M基因的全部或部分与HLA基因的全部或部分之间的嵌合，或者来源相同(例如均来源人或均来源于非人)的HLA基因部分与HLA基因部分之间的嵌合，或者来源不同(例如分别来源于人和非人)的HLA基因部分与HLA基因部分之间的嵌合，以及来源相同或不同的B2M基因的全部或部分、HLA基因部分与HLA基因部分之间的嵌合。

本发明所述的“全部或部分”，“全部”为整体；“部分”为整体中的局部，或者整体中的个体。例如，“外显子1至外显子8的全部”为整体，即外显子1至外显子8的全部核苷酸序列；“外显子1至外显子8的部分”为整体的局部或整体的个体，即外显子1至外显子8中的一个或两个以上连续或间隔的核苷酸序列。

本发明所述的“两种或三种以上连续外显子”是指例如外显子1、2，外显子2、3，外显子1、2、3，外显子2、3、4，以及连续4个、5个、6个、7个或8个连续外显子。

本发明所述的“编码序列”为Coding sequence，即CDS，是编码一段蛋白产物的序列，其可能是一个ORF，也可能包括多个ORF。

本发明所述“同源性”，是指在使用蛋白序列或核苷酸序列的方面，本领域技术人员可以根据实际工作需要对序列进行调整，使使用序列与现有技术获得的序列相比，具有(包括但不限于)1％，2％，3％，4％，5％，6％，7％，8％，9％，10％，11％，12％，13％，14％，15％，16％，17％，18％，19％，20％，21％，22％，23％，24％，25％，26％，27％，28％，29％，30％，31％，32％，33％，34％，35％，36％，37％，38％，39％，40％，41％，42％，43％，44％，45％，46％，47％，48％，49％，50％，51％，52％，53％，54％，55％，56％，57％，58％，59％，60％，70％，80％，81％，82％，83％，84％，85％，86％，87％，88％，89％，90％，91％，92％，93％，94％，95％，96％，97％，98％，99％，99.1％，99.2％，99.3％，99.4％，99.5％，99.6％，99.7％，99.8％，99.9％的同一性。

本领域的技术人员能够确定并比较序列元件或同一性程度，以区分另外的小鼠和人序列。

除非特别说明，本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如：Molecular Cloning A Laboratory Manual，2ndEd.，ed.By Sambrook，FritschandManiatis(Cold Spring Harbor Laboratory Press：1989)；DNA Cloning，Volumes I and II(D.N.Glovered.，1985)；Oligonucleotide Synthesis(M.J.Gaited.，1984)；Mullisetal.U.S.Pat.No.4，683，195；Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984)；Transcription And Translation(B.D.Hames&S.J.Higginseds.1984)；Culture Of Animal Cells(R.I.Freshney，AlanR.Liss，Inc.，1987)；Immobilized Cells And Enzymes(IRL Press，1986)；B.Perbal，A PracticalGuide To Molecular Cloning(1984)；the series，Methods In ENZYMOLOGY(J.Abelsonand M.Simon，eds.inchief，Academic Press，Inc.，New York)，specifically，Vols.154and 155(Wuetal.eds.)and Vol.185，″Gene Expression Technology″(D.Goeddel，ed.)；Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.，1987，Cold Spring Harbor Laboratory)；Immunochemical Methods InCell And Molecular Biology(Mayer and Walker，eds.，Academic Press，London，1987)；Handbook Of Experimental Immunology，Volumes V(D.M.Weir and C.C.Blackwell，eds.，1986)；and Manipulating the Mouse Embryo，(Cold Spring Harbor LaboratoryPress，Cold Spring Harbor，N.Y.，1986)。

在一个方面，所述非人动物是哺乳动物。优选的，所述非人动物是小型哺乳动物，例如跳鼠科。在一个实施方式中，所述非人动物是啮齿动物。在一个实施方式中，所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中，所述啮齿动物选自鼠家族。在一个实施方式中，所述

基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中，所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中，所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中，所述动物是啮齿动物。在一个特定实施方式中，所述啮齿动物选自小鼠和大鼠。在一个实施方式中，所述非人动物是小鼠。

在一个特定实施方式中，所述非人动物是啮齿动物，其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠及NOD、NOD/SCID、NOD-Prkdc^scid IL-2rg^null背景的小鼠。

以上只是概括了本发明的一些方面，不是也不应该认为是在任何方面限制本发明。

本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到，对本发明可作某些改变并不偏离本发明的构思或范围。下面的实施例进一步详细说明本发明，不能认为是限制本发明或本发明所说明的具体方法的范围。

附图说明

以下，结合附图来详细说明本发明的实施例，其中：

图1：HLA-A2立体结构示意图；

图2：小鼠B2M基因和人B2M基因座对比示意图(非按比例)；

图3：小鼠H2-D1与人HLA-A基因座对比示意图(非按比例)；

图4：小鼠B2M基因座上B2M和HLA-A基因人源化改造示意图(非按比例)；

图5：小鼠B2M基因人源化改造示意图(非按比例)；

图6：小鼠H2-D1基因人源化改造示意图(非按比例)；

图7：小鼠H2-D1基因座上B2M和HLA-A基因人源化改造示意图(非按比例)；

图8：小鼠B2M基因座上B2M和HLA-A基因人源化改造示意图(非按比例)；

图9：B2M基因座打靶策略及靶向载体设计示意图(非按比例)；

图10：sgRNA1-sgRNA15活性检测结果，其中，Con.为阴性对照，PC为阳性对照，blank为空白对照；

图11：MHC人源化小鼠鼠尾PCR鉴定结果(F0)，其中，M为Marker，WT为野生型，PC为阳性对照，H₂O为水对照，其中图A为5’端引物检测结果，图B为3’端引物检测结果；

图12：F1代MHC人源化小鼠示例性PCR检测结果，其中，M为Marker，H₂O为水对照，WT为野生型对照，PC为阳性对照，F1-01、F1-02、F1-03、F1-04、F1-05、F1-06和F1-07为阳性小鼠编号；

图13：F1代MHC人源化小鼠示例性Southern检测结果，其中，M为Marker，WT为野生型对照，F1-01、F1-02、F1-03、F1-04、F1-05、F1-06和F1-07为小鼠编号；

图14：MHC人源化小鼠体内B2M蛋白(A-H)和HLA-A2.1蛋白(I-P)表达流式检测结果，其中MHC(H/H)为MHC人源化纯合子小鼠；

图15：MHC人源化纯合子小鼠淋巴细胞亚群分析，其中MHC(H/H)为MHC人源化纯合子小鼠；

图16：基因敲除小鼠鼠尾PCR鉴定结果，其中，M为Marker，WT为野生型，H₂O为水对照；

图17：B-NDG背景小鼠B2M基因座上B2M和HLA-A2.1基因人源化改造示意图(非按比例)；

图18：B-NDG背景小鼠B2M基因座打靶策略及靶向载体设计示意图(非按比例)；

图19：F0代B-NDG背景MHC人源化小鼠示例性PCR检测结果，其中，M为Marker，H₂O为水对照，WT为野生型对照，PC为阳性对照，BNDG-F0-01至BNDG-F0-06为小鼠编号；

图20：F1代B-NDG背景MHC人源化小鼠示例性PCR检测结果，其中，M为Marker，PC为阳性对照，H₂O为水对照，WT为野生型对照，BNDG-F1-01和BNDG-F1-02为小鼠编号；

图21：F1代B-NDG背景MHC人源化小鼠示例性Southern检测结果，其中，M为Marker，WT为野生型对照，BNDG-F1-01和BNDG-F1-02为小鼠编号；

图22：B-NDG背景MHC人源化小鼠中B2M蛋白(A-D)和HLA-A2.1蛋白(E-H)表达流式检测结果，其中MHC B-NDG(H/+)为B-NDG背景MHC人源化杂合子小鼠；

图23：小鼠B2M蛋白与人B2M蛋白氨基酸序列比对表；

图24：大鼠B2M蛋白与人B2M蛋白氨基酸序列比对表；

图25：小鼠H2-D1蛋白与人HLA-A2.1蛋白氨基酸序列比对表；

图26：小鼠H2-D1蛋白与人HLA-A*0101氨基酸系列比对表。

具体实施方式

下面结合具体实施例来进一步描述本发明，本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的，并不对本发明的范围构成任何限制。本领域技术人员应该理解的是，在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换，但这些修改和替换均落入本发明的保护范围内。

在下述每一实施例中，设备和材料是从以下所指出的几家公司获得：

NOD-Prkdc^scid IL-2rg^null(B-NDG)小鼠来源北京百奥赛图基因生物技术有限公司，货号B-CM-001或B-CM-002；

UCA试剂盒来源北京百奥赛图基因生物技术有限公司，货号BCG-DX-001；

Ambion体外转录试剂盒购自Ambion，货号AM1354；

Cas9mRNA来源SIGMA，货号CAS9MRNA-1EA；

PE anti-humanβ2-microglobulin Antibody(hβ2M PE)购自Biolegend，货号316305；

PE anti-mouseβ2-microglobulin Antibody(mβ2M PE)购自Biolegend，货号154503；

PE anti-human HLA-A2 Antibody(hHLA-A2 PE)购自Biolegend，货号343305；

PE anti-mouse H-2K^b/H-2D^b Antibody(H-2Kb/H-2Db PE)购自Biolegend，货号114607；

FITC anti-mouse CD19 Antibody(mCD19FITC)购自Biolegend，货号115506；

Purified anti-mouse CD16/32 Antibody购自Biolegend，货号101302；

APC anti-mCD45(mCD45APC)购自Biolegend，货号559864；

APC/Cy7 anti-mouse TCRβchain Antibody(mTCRβAPC/Cy7)购自Biolegend，货号109220；

Alexa

488anti-mouse CD3 Antibody(mCD3 Alexa Flour 488)购自Biolegend，货号100210；

PE anti-mouse CD19 Antibody(mCD19 PE)购自Biolegend，货号115508；

Brilliant Violet 421^TM anti-mouse CD4 Antibody(mCD4 BV421)购自Biolegend，货号100438；

Brilliant Violet 711^TM anti-mouse CD8a Antibody(mCD8a BV711)购自Biolegend，货号100747；

BamHI、BglII、EcoNI、SspI酶购自NEB，货号分别为R3136、R0144、R0521、R3132；

实施例1 MHC分子人源化小鼠

本实施例对非人动物(如小鼠)进行改造，使该非人动物体内包含编码人B2M和HLA-A2.1蛋白的核苷酸序列，得到经遗传修饰的非人动物体内可表达人或人源化B2M和HLA-A2.1蛋白或MHC嵌合α链。小鼠B2M基因(NCBI Gene ID：12010，Primary source：MGI:88127，UniProt ID：P01887，基于NM_009735.3→NP_033865.2的转录本，其mRNA序列如SEQID NO：1所示，对应的蛋白序列如SEQ ID NO：2所示)和人B2M基因(NCBI Gene ID：567，Primary source：HGNC:914，UniProt ID：P61769，基于NM_004048.3→NP_004039.1的转录本，其mRNA序列如SEQ ID NO：3所示，对应的蛋白序列如SEQ ID NO：4所示)对比示意图如图2所示。

小鼠H2-D1基因(NCBI Gene ID：14964，Primary source：MGI:95896，UniProt ID：P01899)(基于NM_010380.3→NP_034510.3的转录本，其mRNA序列如SEQ ID NO：5所示，对应的蛋白序列如SEQ ID NO：6所示)与人HLA-A基因(NCBI Gene ID：3105，Primary source：HGNC:4931，UniProt ID：P04439)(基于NM_001242758.1→NP_001229687.1的转录本，其mRNA序列如SEQ ID NO：7所示，对应的蛋白序列如SEQ ID NO：8所示)对比示意图如图3所示。

本发明的目的是得到一种人源化MHC分子，可通过多种策略实现本发明的目的。例如，可以将小鼠内源B2M基因和内源H2-D1基因失活后，转入编码人B2M和人HLA-A2.1信号肽和胞外区的1-203aa的核苷酸序列及小鼠H2-D1部分胞外区(Alpha-3和连接肽)及跨膜区和胞内区(207-362aa)编码的核苷酸序列；还可以采用在小鼠B2M和/或小鼠H2-D1基因座上进行不同的改造和组合，例如，(1)在小鼠内源B2M基因座进行人源化改造，在内源B2M基因1号外显子上插入一段含有编码人B2M、编码人HLA-A2.1的信号肽、Alpha-1、Alpha-2区域的序列(例如，AAC24825.1的第1-203aa，位于人HLA-A2.1的第1、2、3外显子区域)和编码小鼠H2-D1的Alpha-3、连接肽(Connecting peptide)、跨膜区和胞内区(例如，NP_034510.3的第207-362aa，位于鼠H2-D1的第4、5、6、7、8外显子区域)序列，或用上述序列直接替换小鼠内源B2M基因的第1、2、3外显子序列(见图4)；(2)将小鼠内源B2M基因直接进行人源化改造，将编码区替换为人B2M编码区序列(见图5)，同时将人HLA-A2.1蛋白的信号肽、Alpha-1、Alpha-2区域和小鼠H2-D1的Alpha-3、连接肽、跨膜区和胞内区(SEQ ID NO：64)的编码序列通过转基因等方式转入小鼠体内，或在小鼠H2-D1基因座用编码人HLA-A2.1的信号肽、Alpha-1、Alpha-2区域的序列替换小鼠H2-D1的信号肽、Alpha-1、Alpha-2区域(见图6)，当对小鼠B2M基因和H2-D1基因分别进行人源化改造时，可以采用一步或分步打靶的方式制备双基因人源化小鼠，也可以分别制备单基因人源化小鼠后通过交配等常规方式获得双基因人源化小鼠，其体内同时表达人B2M蛋白和MHC嵌合α链；(3)敲除小鼠内源B2M基因，并将人B2M和HLA-A2.1蛋白信号肽、Alpha-1、Alpha-2区域(SEQ ID NO：63)的编码序列替换小鼠H2-D1基因的信号肽、Alpha-1、Alpha-2区域(见图7)。

本实施例以图4所示改造方式为例进行小鼠MHC分子人源化改造，可用基因编辑技术对小鼠细胞进行修饰，在内源小鼠B2M基因座敲进一段含有编码人B2M蛋白、人HLA-A2.1蛋白的部分和小鼠H2-D1蛋白的部分的序列，同时破坏小鼠B2M基因的编码框，期望得到的人源化小鼠体内可表达人源化MHC分子，该MHC分子中含有人B2M蛋白、人HLA-A2.1蛋白(选用NCBI登录号为AAC24825.1的序列，SEQ ID NO:59)的Alpha-1、Alpha-2区域和小鼠H2-D1蛋白的Alpha-3、连接肽、跨膜区和胞内区，人HLA-A2.1蛋白部分与小鼠H2-D1蛋白部分直接连接，且该小鼠体内不表达内源B2M蛋白。进一步的，为确保人HLA-A2.1蛋白的正确表达，还可将包含人HLA-A2.1的信号肽序列插入到人B2M编码区之前。最终得到的改造后的人源化小鼠B2M基因座的示意图如图8所示，人源化小鼠B2M、HLA-A2.1和H2-D1基因转录的mRNA序列如SEQ ID NO：9所示，得到的人源化B2M基因座的DNA序列(仅涉及改造部分)如SEQ IDNO：10所示。

鉴于人B2M具有多种亚型或转录本，本文所述的方法可应用于其它亚型或转录本。

引入CRISPR/Cas系统进行基因编辑，进一步的设计如图9所示的打靶策略示意图，图中显示了靶向载体上含有小鼠B2M上游和下游的同源臂序列，以及包含编码人B2M蛋白、人HLA-A2.1蛋白的部分和小鼠H2-D1蛋白的部分的序列片段(简称A片段)。其中，上述上游同源臂序列(5’同源臂，SEQ ID NO:11)与NCBI登录号为NC_000068.7的第122146329-122147737位核苷酸序列相同，下游同源臂序列(3’同源臂，SEQ ID NO:12)与NCBI登录号为NC_000068.7的第122152171-122153513位核苷酸序列相同；A片段的5’-3’端依次为人HLA-A2.1信号肽序列、人B2M序列、柔性接头(Linker)的核苷酸序列、人HLA-A2.1序列、小鼠H2-D1序列，其中，人HLA-A2.1信号肽序列(SEQ ID NO:13)与GenBank序列号为AF055066.1的第99567-99638位核苷酸序列相同，人B2M序列(SEQ ID NO:14)与NCBI登录号为NM_004048.3的第91-387位核苷酸序列相同，柔性接头为45bp的常用融合蛋白柔性(GGGGS)3linker(如SEQ ID NO：67)，其序列为：5’-GGAGGTGGCGGATCCGGCGGAGGCGGCTCGGGTGGCGGCGGCTCT-3’(SEQ ID NO：51)，人HLA-A2.1序列(SEQ ID NO:15)与GenBank序列号为AF055066.1的第98606-99435位核苷酸序列相同，小鼠H2-D1序列(SEQ ID NO:16)与NCBI登录号为NC_000083.6的第35266871-35267765位核苷酸序列相同。该小鼠体内表达的蛋白如SEQ IDNO：61所示，但由于柔性接头的存在，该蛋白将会具有人B2M蛋白和人HLA-A2.1蛋白功能域。

靶向载体构建可采用常规方法进行，如酶切连接、直接合成等。构建好的靶向载体通过酶切进行初步验证后，再送测序公司进行测序验证。将测序验证正确的靶向载体用于后续实验。

靶序列决定了sgRNA的靶向特异性和诱导Cas9切割目的基因的效率。因此，高效特异的靶序列选择和设计是构建sgRNA表达载体的前提。设计并合成识别5’端靶位点(sgRNA1-sgRNA7)、3’端靶位点(sgRNA8-sgRNA15)的sgRNA。5’端靶位点和3’端靶位点分别位于B2M基因外显子1、外显子1-2的内含子、外显子3或外显子3-4的内含子，各sgRNA在B2M上的靶位点序列如下：

sgRNA1靶位点序列(SEQ ID NO：17)：5’-CCTGGCCAATCCCGTCGGGAAGG-3’

sgRNA2靶位点序列(SEQ ID NO：18)：5’-CCGTCAGCACACTCGCAAACAGG-3’

sgRNA3靶位点序列(SEQ ID NO：19)：5’-GTTCTCCTTCCCGACGGGATTGG-3’

sgRNA4靶位点序列(SEQ ID NO：20)：5’-ACTCTGGATAGCATACAGGCCGG-3’

sgRNA5靶位点序列(SEQ ID NO：21)：5’-CTGGTGCTTGTCTCACTGACCGG-3’

sgRNA6靶位点序列(SEQ ID NO：22)：5’-GGGGAAAGAGGCACTCACTCTGG-3’

sgRNA7靶位点序列(SEQ ID NO：23)：5’-GACAAGCACCAGAAAGACCAGGG-3’

sgRNA8靶位点序列(SEQ ID NO：24)：5’-CTGGAGGCTTCCGGACACTCAGG-3’

sgRNA9靶位点序列(SEQ ID NO：25)：5’-TGATCAAGCATCATGATGGTAGG-3’

sgRNA10靶位点序列(SEQ ID NO：26)：5’-AGGAGCGTGAGAGGGAACGTGGG-3’

sgRNA11靶位点序列(SEQ ID NO：27)：5’-GAGGAACGTAGCCATGTCACTGG-3’

sgRNA12靶位点序列(SEQ ID NO：28)：5’-CATGTCACTGGCCCTCTAAAGGG-3’

sgRNA13靶位点序列(SEQ ID NO：29)：5’-CATGTGATCAAGCATCATGATGG-3’

sgRNA14靶位点序列(SEQ ID NO：30)：5’-ACCCGCAGAGCTCTGTCACTCGG-3’

sgRNA15靶位点序列(SEQ ID NO：31)：5’-CTCTGTCACTCGGCTCCTCTGGG-3’

利用UCA试剂盒检测多个sgRNA的活性，从结果可见sgRNA具有不同活性，其中，sgRNA2和sgRNA15相对活性较低，这可能是由于靶位点序列的特殊性导致，但根据我们的实验及其具体活性值，sgRNA2和sgRNA15的相对活性值仍显著高于阴性对照组值，仍可判断sgRNA2和sgRNA15是具有活性的，并且活性满足基因打靶实验要求，除SEQ ID NO：17-31以外，其他不具备活性的sgRNA结果未显示，检测结果见表1和图10。从中选择sgRNA3和sgRNA14进行后续实验。在其5’端及互补链上分别加上酶切位点得到正向寡核苷酸和反向寡核苷酸序列见表2)，退火后将退火产物分别连接至pT7-sgRNA质粒(质粒先用BbsI线性化)，获得表达载体pT7-B2M-HLA-A2.1-3和pT7-B2M-HLA-A2.1-14。

表1 UCA检测sgRNA相对活性的结果

表2 sgRNA3和sgRNA14序列列表

pT7-sgRNA载体由质粒合成公司合成含有T7启动子及sgRNA scaffold的片段DNA(SEQ ID NO：40)并依次通过酶切(EcoRI及BamHI)连接至骨架载体(来源Takara，货号3299)上，经专业测序公司测序验证，结果表明获得了目的质粒。

取小鼠的原核期受精卵，例如C57BL/6小鼠，利用显微注射仪将pT7-B2M-HLA-A2.1-3、pT7-B2M-HLA-A2.1-14质粒的体外转录产物(使用Ambion体外转录试剂盒，按照说明书方法进行转录)、靶向载体与Cas9 mRNA预混好后注射至小鼠受精卵细胞质或细胞核中。按照《小鼠胚胎操作实验手册(第三版)》(安德拉斯·纳吉，化学工业出版社，2006)中的方法进行受精卵的显微注射，注射后的受精卵转移至培养液中短暂培养，然后移植至受体母鼠的输卵管中发育，将获得的小鼠(F0代)通过杂交和自交，扩大种群数量，建立稳定的B2M与HLA-A2.1基因突变小鼠品系。

可通过常规检测方法(如PCR分析)鉴定F0代小鼠体细胞的基因型，部分F0代小鼠的鉴定结果见图11。结合5’端引物检测结果和3’端引物检测结果可知，图11中编号为F0-1到F0-10的10只小鼠为阳性小鼠。PCR分析包括下述引物：

5’端引物：

L-GT-F(SEQ ID NO：41)：5’-GAATGTGTGCCTCCTCTCAGTTTCC-3’

L-GT-R(SEQ ID NO：42)：5’-TCCTTCCCGTTCTCCAGGTATCTGC-3’

3’端引物：

R-GT-F(SEQ ID NO：43)：5’-GCGGCTACTACAACCAGAGCGAG-3’

R-GT-R(SEQ ID NO：44)：5’-TCCAGCAATAAGAACCAGTCCCTAGCT-3’

其中，引物L-GT-F位置位于5’同源臂左侧，R-GT-R位于3’同源臂右侧，L-GT-R和R-GT-F均位于人源序列上。

将F0鉴定为阳性的MHC人源化小鼠与野生型小鼠交配得到F1代小鼠。可使用同样的PCR方法对F1代小鼠进行基因型鉴定，结果见图12，显示有7只F1代小鼠为阳性小鼠，编号分别为：F1-01、F1-02、F1-03、F1-04、F1-05、F1-06、F1-07。对这7只F1代PCR鉴定为阳性的小鼠进行Southern blot检测，确认是否存在随机插入。剪取鼠尾提取基因组DNA，选用BamHI酶或BglII酶消化基因组，转膜，杂交。探针P1、P2分别位于5’同源臂外侧及3’同源臂上，具体探针及目的片段的长度见表3。

表3具体探针及目的片段的长度

探针合成引物如下：

P1-F(SEQ ID NO：45)：5’-ATGAGGTCTTTTTGTGGGCAGAGCA-3’

P1-R(SEQ ID NO：46)：5’-CTCCCTACGGCCACATCACCATTAC-3’

P2-F(SEQ ID NO：47)：5’-TAACTTCATGTAAGGCACCGTCAC-3’

P2-R(SEQ ID NO：48)：5’-TCCAGACCTCACCATCAAATGAG-3’

Southern blot检测结果见图13。综合P1、P2探针的结果表明，7只小鼠均无随机插入，证实这7只小鼠为阳性杂合小鼠且不存在随机插入。这表明使用本方法能构建出可稳定传代，且无随机插入的MHC人源化基因工程小鼠。

将F1代鉴定为阳性的杂合小鼠相互交配，获得F2代MHC人源化纯合子小鼠(H/H)。

可通过常规检测方法确认阳性小鼠体内人源化B2M蛋白和MHC嵌合α链的表达情况，例如使用ELISA方法等。具体来说，分别选取野生型C57BL/6雌性小鼠(6周龄)和本实施例制备的MHC人源化雌性纯合子小鼠(6周龄)各1只，给每只小鼠腹腔注射7.5μg/200μl的mCD3抗体，24h后脱颈安乐死后取脾脏细胞，用抗鼠B2M抗体mβ2M PE或抗鼠H-2Kb/H-2Db抗体或抗人B2M抗体hβ2M PE或抗人HLA-A2抗体hHLA-A2 PE和抗鼠CD45抗体mCD45 APC识别染色后进行流式检测，检测结果见图14。如图所示，无论是否经过mCD3刺激，只能在C57BL/6小鼠体内检测到表达鼠B2M的细胞(图14A、14C)，不能检测到表达人或人源化B2M的细胞(图14E、14G)，只能在MHC人源化纯合子小鼠体内检测到表达人B2M的细胞(图14F、14H)或表达MHC嵌合α链的细胞(图14N、14P)，不能检测到表达鼠B2M的细胞(14B、14D)；由于本实施例并没有敲除小鼠H2-D1编码序列，因此在MHC人源化纯合子小鼠体内检测到少量表达鼠H2-D1的细胞(图14G、14L)。

为确认F2代MHC人源化纯合子小鼠体内B细胞和T细胞的分化与野生型小鼠是否一致，可通过流式细胞术等常规方法分析小鼠的淋巴细胞亚群。具体来说，分别选取野生型C57BL/6雄性小鼠(16周龄)、MHC人源化纯合子雄性小鼠(13周龄)各1只，分离脾脏细胞后用抗鼠CD45抗体mCD45 APC进行流式检测，检测结果如图15(A、B)所示，野生型C57BL/6小鼠、MHC人源化纯合子小鼠体内白细胞含量分别为88.6％和96.5％；再用鼠源T细胞表面抗体mTCRB-APC-Cy7、抗鼠CD19抗体mCD19-PE标记T细胞、B细胞进行流式检测，结果显示，野生型C57BL/6小鼠体内T细胞、B细胞分别为23.8％、61.4％(图15C)，MHC人源化纯合子小鼠体内T细胞、B细胞分别为27.7％、61.8％(图15D)；进一步用抗鼠CD4抗体mCD4-BV421、抗鼠mCD8a抗体mCD8a-BV711识别染色后进行流式检测，结果如图15E、15F所示，野生型C57BL/6小鼠和MHC人源化纯合子小鼠体内CD4+T细胞和CD8+T细胞含量基本一致。可见，MHC人源化小鼠体内淋巴细胞亚群的表达谱与野生型C57BL/6小鼠体内淋巴细胞亚群表达谱相似，表明MHC人源化小鼠体内T细胞和B细胞的分化不受B2M与HLA-A2.1基因人源化改造的影响。

此外，由于Cas9的切割造成基因组DNA的双链断裂，通过染色体同源重组的修复方式会随机产生插入/缺失突变，可能得到B2M蛋白功能丧失的基因敲除小鼠。为此设计一对引物用于检测基因敲除小鼠，野生型小鼠应没有PCR条带，基因敲除小鼠应有1条PCR条带，产物长度应为约682bp，结果见图16，其中编号1到10为B2M基因敲除小鼠。引物分别位于5’端靶位点左侧和3’端靶位点右侧，序列如下：

SEQ ID NO：49：5’-GAATAAATGAAGGCGGTCCCAGGCT-3’

SEQ ID NO：50：5’-AGGTGAGTTCTGGCTCCACCATTTG-3’

实施例2具有重度免疫缺陷的MHC多肽人源化小鼠

除实施例1所述改造策略，还可以设计MHC分子人源化程度更高的小鼠。进一步的，可设计MHC分子人源化免疫缺陷小鼠，为糖尿病、移植排斥等免疫系统疾病发病机制研究、防治药物开发等提供高效的实验动物模型。本实施例以B-NDG小鼠为背景，对MHC分子进行更高程度的人源化改造，采用基因编辑技术对B-NDG小鼠进行修饰，在内源B2M基因座敲进一段含有编码人B2M蛋白和HLA-A2.1蛋白的编码序列，同时破坏小鼠B2M基因的编码框，期望得到的B-NDG背景人源化小鼠体内可表达人源化MHC分子，该MHC分子中含有人B2M蛋白和人HLA-A2.1蛋白，且该小鼠体内不表达内源B2M蛋白。进一步的，为确保人HLA-A2.1蛋白的正确表达，可将包含人HLA-A2.1的信号肽序列插入到人B2M编码区之前。最终得到的改造后的B-NDG背景人源化小鼠B2M基因座的示意图如图17所示，B-NDG背景人源化小鼠B2M、HLA-A2.1基因转录的mRNA序列如SEQ ID NO：52所示。该小鼠体内表达的蛋白如SEQ ID NO：62所示，但由于柔性接头的存在，该蛋白将会具有人B2M蛋白和人HLA-A2.1蛋白功能域。

进一步的，设计如图18所示的打靶策略示意图，靶向载体与实施例1的靶向载体相似，不同之处仅在于：5’同源臂(SEQ ID NO:60)与NCBI登录号为NC_000068.7的第122146329-122147737位核苷酸序列有99％的同源性，区别在于第122147015位G替换为T，122147108位和122147591位C替换为T；3’同源臂(SEQ ID NO:53)与NCBI登录号为NC_000068.7的第122152171-122153513位核苷酸序列有99％的同源性，区别在于第122152258位与122152391位G替换为A，122152771位A替换为G，122152788位1个A缺失，122153104位T替换为C，122153148位A替换为C；BNDG-A片段(SEQ ID NO：65)与A片段相似，区别在于其中包含编码全人HLA-A2.1蛋白的序列，该序列(SEQ ID NO：54)与GenBank序列号为AF055066.1的第95493-99436位核苷酸序列相同，且不包含小鼠H2-D1蛋白的编码序列部分。

靶向载体构建可采用常规方法进行，如酶切连接、直接合成等。构建好的靶向载体通过酶切进行初步验证后，再送测序公司进行测序验证。将测序验证正确的靶向载体用于后续显微注射实验。sgRNA与实施例1使用的sgRNA一致。

具体来说，利用显微注射仪将pT7-B2M-HLA-A2.1-3、pT7-B2M-HLA-A2.1-14质粒的体外转录产物(使用Ambion体外转录试剂盒，按照说明书方法进行转录)、靶向载体与Cas9mRNA预混好后注射至B-NDG小鼠受精卵细胞质或细胞核中。按照《小鼠胚胎操作实验手册(第三版)》(安德拉斯·纳吉，化学工业出版社，2006)中的方法进行受精卵的显微注射，注射后的受精卵转移至培养液中短暂培养，然后移植至受体母鼠的输卵管中发育，将获得的F0代小鼠与B-NDG小鼠交配，通过对阳性子代的筛选、杂交和自交，扩大种群数量，建立稳定的B2M与HLA-A2.1基因突变B-NDG小鼠品系。

可通过常规检测方法(如PCR分析)鉴定F0代B-NDG背景人源化小鼠体细胞的基因型，部分F0代小鼠的鉴定结果见图19。结合5’端引物检测结果和3’端引物检测结果可知，图19中编号为BNDG-F0-01至BNDG-F0-06的6只小鼠均为阳性小鼠。PCR分析包括下述引物：

5’端引物：

L-GT-F(SEQ ID NO：41)：5’-GAATGTGTGCCTCCTCTCAGTTTCC-3’

BNDG-L-GT-R(SEQ ID NO：55)：5’-CAGCTCCAAAGAGAACCAGGCCAG-3’

3’端引物：

BNDG-R-GT-F(SEQ ID NO：56)：5’-TACCCTGCGGAGATCACACTGACC-3’

R-GT-R(SEQ ID NO：44)：5’-TCCAGCAATAAGAACCAGTCCCTAGCT-3’

将F0鉴定为阳性的人源化小鼠与B-NDG小鼠交配得到F1代小鼠。可使用同样的PCR方法对F1代小鼠进行基因型鉴定，鉴定结果见图20。进一步的，将PCR鉴定为阳性的2只F1小鼠进行Southern blot检测，确认是否存在随机插入。剪取鼠尾提取基因组DNA，选用EcoNI或SspI酶消化基因组，转膜，杂交。探针BNDG-P1、BNDG-P2(见表4)分别位于5’同源臂外侧和3’同源臂上。探针合成引物如下：

BNDG-P1-F(SEQ ID NO：57)：5’-TTCTGATGCTCCTTCCTTCCGTGC-3’

BNDG-P1-R(SEQ ID NO：58)：5’-TTCTCTGTGCTCAGTGTTCCCTGC-3’

BNDG-P2-F(SEQ ID NO：47)：5’-TAACTTCATGTAAGGCACCGTCAC-3’

BNDG-P2-R(SEQ ID NO：48)：5’-TCCAGACCTCACCATCAAATGAG-3’

表4具体探针及目的片段的长度

限制性内切酶	探针	野生型片段大小	重组序列片段大小
				EcoNI	BNDG-P1探针	8.8kb	5.3kb
SspI	BNDG-P2探针	12.1 kb	7.6kb

Southern blot检测结果见图21。综合BNDG-P1、BNDG-P2探针的结果表明，2只小鼠均无随机插入，证实2只小鼠为阳性杂合小鼠且不存在随机插入，编号分别为BNDG-F1-01、BNDG-F1-02。这表明使用本方法能构建出可稳定传代且无随机插入的MHC人源化基因工程小鼠。

可通过常规检测方法确认B-NDG背景阳性小鼠体内人B2M蛋白和HLA-A2.1蛋白的表达情况，例如使用流式细胞术等。具体来说，分别选取6周龄雌性B-NDG小鼠和本实施例制备的B-NDG背景MHC人源化小鼠杂合子各1只，脱颈安乐死后取脾脏细胞，用抗鼠B2M抗体mβ2M PE或抗鼠H-2Kb/H-2Db抗体或抗人B2M抗体hβ2M PE或抗人HLA-A2抗体hHLA-A2 PE和抗鼠CD45抗体mCD45 APC识别染色后进行流式检测，检测结果见图22。如图所示，在B-NDG小鼠和B-NDG背景MHC人源化杂合子小鼠体内均可检测到表达鼠B2M的细胞(图22A、22B)或鼠H-2D细胞(图22E、22F)，但只能在B-NDG背景MHC人源化小鼠体内检测到表达人B2M蛋白(图22D)或人HLA-A2蛋白的细胞(图22H)，不能在B-NDG小鼠体内检测到表达人B2M蛋白的细胞(图22C)或人HLA-A2蛋白的细胞(图22G)。

实施例3基于胚胎干细胞的制备方法

采用其它基因编辑系统和制备方法也可以得到本发明的非人哺乳动物，包括但不限于利用胚胎干细胞(embryonic stem cell，ES)的基因打靶技术、锌指核酸酶(ZFN)技术、转录激活子样效应因子核酸酶(TALEN)技术、归巢核酸内切酶(兆碱基大范围核酶)或其他分子生物学技术。本实施例以传统的ES细胞基因同源重组技术为例，阐述如何采用其它方法制备获得MHC人源化小鼠。

根据本发明的基因编辑策略和MHC人源化小鼠基因示意图(图8、9)，发明人设计了新的打靶策略并设计了新的靶向载体。鉴于本发明的目的之一是破坏小鼠B2M基因编码框，并在鼠B2M基因座插入编码人B2M和HLA-A2.1蛋白、小鼠H2-D1蛋白的核酸序列，为此，发明人设计了包含5’同源臂、3’同源臂人源化基因片段的靶向载体，在靶向载体上构建了用于阳性克隆筛选的抗性基因，如新霉素磷酸转移酶编码序列Neo，并在抗性基因的两侧装上两个同向排列的位点特异性重组系统，如Frt或LoxP重组位点。进一步的，还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因，如白喉毒素A亚基的编码基因(DTA)。靶向载体构建可采用常规方法进行，如酶切连接等。将构建正确的靶向载体转染小鼠胚胎干细胞，利用阳性克隆筛选标记基因对得到的靶向载体转染细胞进行筛选，并利用Southern Blot技术进行DNA重组鉴定。将筛选出的正确阳性克隆按照《小鼠胚胎操作实验手册(第三版)》中的方法将阳性克隆细胞(黑色鼠)通过显微注射进入已分离好的囊胚中(白色鼠)，注射后的嵌合囊胚转移至培养液中短暂培养，然后移植至受体母鼠(白色鼠)的输卵管，可生产F0代嵌合体鼠(黑白相间)。通过提取鼠尾基因组和PCR检测，挑选基因正确重组的F0代嵌合鼠用于后续繁殖和鉴定。将F0代嵌合鼠与野生型鼠交配获得F1代鼠，通过提取鼠尾基因组和PCR检测，挑选可以稳定遗传的基因重组阳性F1代杂合子小鼠。再将F1代杂合小鼠互相交配即可获得基因重组阳性F2代纯合子鼠。此外，可将F1代杂合鼠与Flp或Cre工具鼠交配去除阳性克隆筛选标记基因(neo等)后，再通过互相交配即可得到基因人源化纯合子小鼠。对获得的F1代杂合或F2代纯合鼠进行基因型和表型检测的方法与前述实施例1一致。

以上详细描述了本发明的优选实施方式，但是，本发明并不限于上述实施方式中的具体细节，在本发明的技术构思范围内，可以对本发明的技术方案进行多种简单变型，这些简单变型均属于本发明的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本发明对各种可能的组合方式不再另行说明。

序列表

<110> 北京百奥赛图基因生物技术有限公司

<120> MHC分子人源化的非人动物的构建方法及应用

<130> 1

<160> 68

<170> SIPOSequenceListing 1.0

<210> 1

<211> 858

<212> DNA/RNA

<213> 小鼠(Mouse)

<400> 1

tttcagtggc tgctactcgg cgcttcagtc gcggtcgctt cagtcgtcag catggctcgc 60

tcggtgaccc tggtctttct ggtgcttgtc tcactgaccg gcctgtatgc tatccagaaa 120

acccctcaaa ttcaagtata ctcacgccac ccaccggaga atgggaagcc gaacatactg 180

aactgctacg taacacagtt ccacccgcct cacattgaaa tccaaatgct gaagaacggg 240

aaaaaaattc ctaaagtaga gatgtcagat atgtccttca gcaaggactg gtctttctat 300

atcctggctc acactgaatt cacccccact gagactgata catacgcctg cagagttaag 360

catgccagta tggccgagcc caagaccgtc tactgggatc gagacatgtg atcaagcatc 420

atgatgctct gaagattcat ttgaacctgc ttaattacaa atccagtttc taatatgcta 480

tacaatttat gcacgcagaa agaaatagca atgtacacat caccttcttt atatcttact 540

ttaaatattt tatgcatgtt ttcaaaaaat tggaaatatc ctagatagct gagcaataaa 600

tcttcaataa gtattttgat cagaataata aatataattt taagaacaat agttgatcat 660

atgccaaacc ctctgtactt ctcattactt ggatgcagtt actcatcttt ggtctatcac 720

aacataagtg acatactttc cttttggtaa agcaaagagg cctaattgaa gtctgtcact 780

gtgcccaatg cttagcaatt ctcaccccca accctgtggc tacttctgct tttgttactt 840

ttactaaaaa taaaaaac 858

<210> 2

<211> 119

<212> PRT

<213> 小鼠(Mouse)

<400> 2

Met Ala Arg Ser Val Thr Leu Val Phe Leu Val Leu Val Ser Leu Thr

1 5 10 15

Gly Leu Tyr Ala Ile Gln Lys Thr Pro Gln Ile Gln Val Tyr Ser Arg

20 25 30

His Pro Pro Glu Asn Gly Lys Pro Asn Ile Leu Asn Cys Tyr Val Thr

35 40 45

Gln Phe His Pro Pro His Ile Glu Ile Gln Met Leu Lys Asn Gly Lys

50 55 60

Lys Ile Pro Lys Val Glu Met Ser Asp Met Ser Phe Ser Lys Asp Trp

65 70 75 80

Ser Phe Tyr Ile Leu Ala His Thr Glu Phe Thr Pro Thr Glu Thr Asp

85 90 95

Thr Tyr Ala Cys Arg Val Lys His Ala Ser Met Ala Glu Pro Lys Thr

100 105 110

Val Tyr Trp Asp Arg Asp Met

115

<210> 3

<211> 1675

<212> DNA/RNA

<213> 人(human)

<400> 3

attcctgaag ctgacagcat tcgggccgag atgtctcgct ccgtggcctt agctgtgctc 60

gcgctactct ctctttctgg cctggaggct atccagcgta ctccaaagat tcaggtttac 120

tcacgtcatc cagcagagaa tggaaagtca aatttcctga attgctatgt gtctgggttt 180

catccatccg acattgaagt tgacttactg aagaatggag agagaattga aaaagtggag 240

cattcagact tgtctttcag caaggactgg tctttctatc tcttgtacta cactgaattc 300

acccccactg aaaaagatga gtatgcctgc cgtgtgaacc atgtgacttt gtcacagccc 360

aagatagtta agtgggatcg agacatgtaa gcagcatcat ggaggtttga agatgccgca 420

tttggattgg atgaattcca aattctgctt gcttgctttt taatattgat atgcttatac 480

acttacactt tatgcacaaa atgtagggtt ataataatgt taacatggac atgatcttct 540

ttataattct actttgagtg ctgtctccat gtttgatgta tctgagcagg ttgctccaca 600

ggtagctcta ggagggctgg caacttagag gtggggagca gagaattctc ttatccaaca 660

tcaacatctt ggtcagattt gaactcttca atctcttgca ctcaaagctt gttaagatag 720

ttaagcgtgc ataagttaac ttccaattta catactctgc ttagaatttg ggggaaaatt 780

tagaaatata attgacagga ttattggaaa tttgttataa tgaatgaaac attttgtcat 840

ataagattca tatttacttc ttatacattt gataaagtaa ggcatggttg tggttaatct 900

ggtttatttt tgttccacaa gttaaataaa tcataaaact tgatgtgtta tctcttatat 960

ctcactccca ctattacccc tttattttca aacagggaaa cagtcttcaa gttccacttg 1020

gtaaaaaatg tgaacccctt gtatatagag tttggctcac agtgtaaagg gcctcagtga 1080

ttcacatttt ccagattagg aatctgatgc tcaaagaagt taaatggcat agttggggtg 1140

acacagctgt ctagtgggag gccagccttc tatattttag ccagcgttct ttcctgcggg 1200

ccaggtcatg aggagtatgc agactctaag agggagcaaa agtatctgaa ggatttaata 1260

ttttagcaag gaatagatat acaatcatcc cttggtctcc ctgggggatt ggtttcagga 1320

ccccttcttg gacaccaaat ctatggatat ttaagtccct tctataaaat ggtatagtat 1380

ttgcatataa cctatccaca tcctcctgta tactttaaat catttctaga ttacttgtaa 1440

tacctaatac aatgtaaatg ctatgcaaat agttgttatt gtttaaggaa taatgacaag 1500

aaaaaaaagt ctgtacatgc tcagtaaaga cacaaccatc cctttttttc cccagtgttt 1560

ttgatccatg gtttgctgaa tccacagatg tggagcccct ggatacggaa ggcccgctgt 1620

actttgaatg acaaataaca gatttaaaat tttcaaggca tagttttata cctga 1675

<210> 4

<211> 119

<212> PRT

<213> 人(human)

<400> 4

Met Ser Arg Ser Val Ala Leu Ala Val Leu Ala Leu Leu Ser Leu Ser

1 5 10 15

Gly Leu Glu Ala Ile Gln Arg Thr Pro Lys Ile Gln Val Tyr Ser Arg

20 25 30

His Pro Ala Glu Asn Gly Lys Ser Asn Phe Leu Asn Cys Tyr Val Ser

35 40 45

Gly Phe His Pro Ser Asp Ile Glu Val Asp Leu Leu Lys Asn Gly Glu

50 55 60

Arg Ile Glu Lys Val Glu His Ser Asp Leu Ser Phe Ser Lys Asp Trp

65 70 75 80

Ser Phe Tyr Leu Leu Tyr Tyr Thr Glu Phe Thr Pro Thr Glu Lys Asp

85 90 95

Glu Tyr Ala Cys Arg Val Asn His Val Thr Leu Ser Gln Pro Lys Ile

100 105 110

Val Lys Trp Asp Arg Asp Met

115

<210> 5

<211> 1736

<212> DNA/RNA

<213> 小鼠(Mouse)

<400> 5

tcagacaccc gggatcccag atgggggcga tggctccgcg cacgctgctc ctgctgctgg 60

cggccgccct ggccccgact cagacccgcg cgggcccaca ctcgatgcgg tatttcgaga 120

ccgccgtgtc ccggcccggc ctcgaggagc cccggtacat ctctgtcggc tatgtggaca 180

acaaggagtt cgtgcgcttc gacagcgacg cggagaatcc gagatatgag ccgcgggcgc 240

cgtggatgga gcaggagggg ccggagtatt gggagcggga aacacagaaa gccaagggcc 300

aagagcagtg gttccgagtg agcctgagga acctgctcgg ctactacaac cagagcgcgg 360

gcggctctca cacactccag cagatgtctg gctgtgactt ggggtcggac tggcgcctcc 420

tccgcgggta cctgcagttc gcctatgaag gccgcgatta catcgccctg aacgaagacc 480

tgaaaacgtg gacggcggcg gacatggcgg cgcagatcac ccgacgcaag tgggagcaga 540

gtggtgctgc agagcattac aaggcctacc tggagggcga gtgcgtggag tggctccaca 600

gatacctgaa gaacgggaac gcgacgctgc tgcgcacaga ttccccaaag gcacatgtga 660

cccatcaccc cagatctaaa ggtgaagtca ccctgaggtg ctgggccctg ggcttctacc 720

ctgctgacat caccctgacc tggcagttga atggggagga gctgacccag gacatggagc 780

ttgtggagac caggcctgca ggggatggaa ccttccagaa gtgggcatct gtggtggtgc 840

ctcttgggaa ggagcagaat tacacatgcc gtgtgtacca tgaggggctg cctgagcccc 900

tcaccctgag atgggagcct cctccgtcca ctgactctta catggtgatc gttgctgttc 960

tgggtgtcct tggagctatg gccatcattg gagctgtggt ggcttttgtg atgaagagaa 1020

ggagaaacac aggtggaaaa ggaggggact atgctctggc tccaggctcc cagagctctg 1080

aaatgtctct ccgagattgt aaagcgtgaa gacagctgcc tggactgtac tgagtgacag 1140

acgatgtgtt caggtctctc ctgtgacatc cagagccctc agttctcttt acacaacatt 1200

gtctgatgtt ccctgtgagc ttgggttcag tgtgaagaac tgtggagccc agcctgccct 1260

gcacaccagg accctatccc tgcactgccc tgtgttccct tccatagcca accttgctgc 1320

tccagccaaa cactggggga catctgcatc ctgtaagctc catgctaccc tgagctgcag 1380

ctcctcactt ccacactgag aataataatt tgaatgtggg tggctggaga gatggctcag 1440

cgctgactgc tcttccaaag gtcctgagtt caaatcccag caaccacatg gtggctcaca 1500

accatctgta atgggatcta acaccctctt ctgcagtgtc tgaagacagc tacagtgtac 1560

ttacatataa taataaataa gtctttaaaa aataatttga aagtgacctt gattgttaac 1620

atcttgatct agggctgatt tcttgttaat ttcatggatt gagaatgctt agaggttttt 1680

ttgtttgttt gattgatttt tttgaagaaa taaatggcag atgaaggaac ttccag 1736

<210> 6

<211> 362

<212> PRT

<213> 小鼠(Mouse)

<400> 6

Met Gly Ala Met Ala Pro Arg Thr Leu Leu Leu Leu Leu Ala Ala Ala

1 5 10 15

Leu Ala Pro Thr Gln Thr Arg Ala Gly Pro His Ser Met Arg Tyr Phe

20 25 30

Glu Thr Ala Val Ser Arg Pro Gly Leu Glu Glu Pro Arg Tyr Ile Ser

35 40 45

Val Gly Tyr Val Asp Asn Lys Glu Phe Val Arg Phe Asp Ser Asp Ala

50 55 60

Glu Asn Pro Arg Tyr Glu Pro Arg Ala Pro Trp Met Glu Gln Glu Gly

65 70 75 80

Pro Glu Tyr Trp Glu Arg Glu Thr Gln Lys Ala Lys Gly Gln Glu Gln

85 90 95

Trp Phe Arg Val Ser Leu Arg Asn Leu Leu Gly Tyr Tyr Asn Gln Ser

100 105 110

Ala Gly Gly Ser His Thr Leu Gln Gln Met Ser Gly Cys Asp Leu Gly

115 120 125

Ser Asp Trp Arg Leu Leu Arg Gly Tyr Leu Gln Phe Ala Tyr Glu Gly

130 135 140

Arg Asp Tyr Ile Ala Leu Asn Glu Asp Leu Lys Thr Trp Thr Ala Ala

145 150 155 160

Asp Met Ala Ala Gln Ile Thr Arg Arg Lys Trp Glu Gln Ser Gly Ala

165 170 175

Ala Glu His Tyr Lys Ala Tyr Leu Glu Gly Glu Cys Val Glu Trp Leu

180 185 190

His Arg Tyr Leu Lys Asn Gly Asn Ala Thr Leu Leu Arg Thr Asp Ser

195 200 205

Pro Lys Ala His Val Thr His His Pro Arg Ser Lys Gly Glu Val Thr

210 215 220

Leu Arg Cys Trp Ala Leu Gly Phe Tyr Pro Ala Asp Ile Thr Leu Thr

225 230 235 240

Trp Gln Leu Asn Gly Glu Glu Leu Thr Gln Asp Met Glu Leu Val Glu

245 250 255

Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ser Val Val

260 265 270

Val Pro Leu Gly Lys Glu Gln Asn Tyr Thr Cys Arg Val Tyr His Glu

275 280 285

Gly Leu Pro Glu Pro Leu Thr Leu Arg Trp Glu Pro Pro Pro Ser Thr

290 295 300

Asp Ser Tyr Met Val Ile Val Ala Val Leu Gly Val Leu Gly Ala Met

305 310 315 320

Ala Ile Ile Gly Ala Val Val Ala Phe Val Met Lys Arg Arg Arg Asn

325 330 335

Thr Gly Gly Lys Gly Gly Asp Tyr Ala Leu Ala Pro Gly Ser Gln Ser

340 345 350

Ser Glu Met Ser Leu Arg Asp Cys Lys Ala

355 360

<210> 7

<211> 1611

<212> DNA/RNA

<213> 人(human)

<400> 7

gagaagccaa tcagtgtcgt cgcggtcgct gttctaaagt ccgcacgcac ccaccgggac 60

tcagattctc cccagacgcc gaggatggcc gtcatggcgc cccgaaccct cctcctgcta 120

ctctcggggg ccctggccct gacccagacc tgggcgggct cccactccat gaggtatttc 180

ttcacatccg tgtcccggcc cggccgcggg gagccccgct tcatcgccgt gggctacgtg 240

gacgacacgc agttcgtgcg gttcgacagc gacgccgcga gccagaagat ggagccgcgg 300

gcgccgtgga tagagcagga ggggccggag tattgggacc aggagacacg gaatatgaag 360

gcccactcac agactgaccg agcgaacctg gggaccctgc gcggctacta caaccagagc 420

gaggacggtt ctcacaccat ccagataatg tatggctgcg acgtggggcc ggacgggcgc 480

ttcctccgcg ggtaccggca ggacgcctac gacggcaagg attacatcgc cctgaacgag 540

gacctgcgct cttggaccgc ggcggacatg gcagctcaga tcaccaagcg caagtgggag 600

gcggtccatg cggcggagca gcggagagtc tacctggagg gccggtgcgt ggacgggctc 660

cgcagatacc tggagaacgg gaaggagacg ctgcagcgca cggacccccc caagacacat 720

atgacccacc accccatctc tgaccatgag gccaccctga ggtgctgggc cctgggcttc 780

taccctgcgg agatcacact gacctggcag cgggatgggg aggaccagac ccaggacacg 840

gagctcgtgg agaccaggcc tgcaggggat ggaaccttcc agaagtgggc ggctgtggtg 900

gtgccttctg gagaggagca gagatacacc tgccatgtgc agcatgaggg tctgcccaag 960

cccctcaccc tgagatggga gctgtcttcc cagcccacca tccccatcgt gggcatcatt 1020

gctggcctgg ttctccttgg agctgtgatc actggagctg tggtcgctgc cgtgatgtgg 1080

aggaggaaga gctcagatag aaaaggaggg agttacactc aggctgcaag cagtgacagt 1140

gcccagggct ctgatgtgtc tctcacagct tgtaaagtgt gagacagctg ccttgtgtgg 1200

gactgagagg caagagttgt tcctgccctt ccctttgtga cttgaagaac cctgactttg 1260

tttctgcaaa ggcacctgca tgtgtctgtg ttcgtgtagg cataatgtga ggaggtgggg 1320

agagcacccc acccccatgt ccaccatgac cctcttccca cgctgacctg tgctccctct 1380

ccaatcatct ttcctgttcc agagaggtgg ggctgaggtg tctccatctc tgtctcaact 1440

tcatggtgca ctgagctgta acttcttcct tccctattaa aattagaacc tgagtataaa 1500

tttactttct caaattcttg ccatgagagg ttgatgagtt aattaaagga gaagattcct 1560

aaaatttgag agacaaaatt aatggaacgc atgagaacct tccagagtcc a 1611

<210> 8

<211> 365

<212> PRT

<213> 人(human)

<400> 8

Met Ala Val Met Ala Pro Arg Thr Leu Leu Leu Leu Leu Ser Gly Ala

1 5 10 15

Leu Ala Leu Thr Gln Thr Trp Ala Gly Ser His Ser Met Arg Tyr Phe

20 25 30

Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe Ile Ala

35 40 45

Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser Asp Ala

50 55 60

Ala Ser Gln Lys Met Glu Pro Arg Ala Pro Trp Ile Glu Gln Glu Gly

65 70 75 80

Pro Glu Tyr Trp Asp Gln Glu Thr Arg Asn Met Lys Ala His Ser Gln

85 90 95

Thr Asp Arg Ala Asn Leu Gly Thr Leu Arg Gly Tyr Tyr Asn Gln Ser

100 105 110

Glu Asp Gly Ser His Thr Ile Gln Ile Met Tyr Gly Cys Asp Val Gly

115 120 125

Pro Asp Gly Arg Phe Leu Arg Gly Tyr Arg Gln Asp Ala Tyr Asp Gly

130 135 140

Lys Asp Tyr Ile Ala Leu Asn Glu Asp Leu Arg Ser Trp Thr Ala Ala

145 150 155 160

Asp Met Ala Ala Gln Ile Thr Lys Arg Lys Trp Glu Ala Val His Ala

165 170 175

Ala Glu Gln Arg Arg Val Tyr Leu Glu Gly Arg Cys Val Asp Gly Leu

180 185 190

Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr Asp Pro

195 200 205

Pro Lys Thr His Met Thr His His Pro Ile Ser Asp His Glu Ala Thr

210 215 220

Leu Arg Cys Trp Ala Leu Gly Phe Tyr Pro Ala Glu Ile Thr Leu Thr

225 230 235 240

Trp Gln Arg Asp Gly Glu Asp Gln Thr Gln Asp Thr Glu Leu Val Glu

245 250 255

Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ala Val Val

260 265 270

Val Pro Ser Gly Glu Glu Gln Arg Tyr Thr Cys His Val Gln His Glu

275 280 285

Gly Leu Pro Lys Pro Leu Thr Leu Arg Trp Glu Leu Ser Ser Gln Pro

290 295 300

Thr Ile Pro Ile Val Gly Ile Ile Ala Gly Leu Val Leu Leu Gly Ala

305 310 315 320

Val Ile Thr Gly Ala Val Val Ala Ala Val Met Trp Arg Arg Lys Ser

325 330 335

Ser Asp Arg Lys Gly Gly Ser Tyr Thr Gln Ala Ala Ser Ser Asp Ser

340 345 350

Ala Gln Gly Ser Asp Val Ser Leu Thr Ala Cys Lys Val

355 360 365

<210> 9

<211> 2109

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 9

tttcagtggc tgctactcgg cgcttcagtc gcggtcgctt cagtcgtcag catggccgtc 60

atggcgcccc gaaccctcgt cctgctactc tcgggggctc tggccctgac ccagacctgg 120

gcgatccagc gtactccaaa gattcaggtt tactcacgtc atccagcaga gaatggaaag 180

tcaaatttcc tgaattgcta tgtgtctggg tttcatccat ccgacattga agttgactta 240

ctgaagaatg gagagagaat tgaaaaagtg gagcattcag acttgtcttt cagcaaggac 300

tggtctttct atctcttgta ctacactgaa ttcaccccca ctgaaaaaga tgagtatgcc 360

tgccgtgtga accatgtgac tttgtcacag cccaagatag ttaagtggga tcgagacatg 420

ggaggtggcg gatccggcgg aggcggctcg ggtggcggcg gctctggctc tcactccatg 480

aggtatttct tcacatccgt gtcccggccc ggccgcgggg agccccgctt catcgcagtg 540

ggctacgtgg acgacacgca gttcgtgcgg ttcgacagcg acgccgcgag ccagaggatg 600

gagccgcggg cgccgtggat agagcaggag ggtccggagt attgggacgg ggagacacgg 660

aaagtgaagg cccactcaca gactcaccga gtggacctgg ggaccctgcg cggctactac 720

aaccagagcg aggccggttc tcacaccgtc cagaggatgt atggctgcga cgtggggtcg 780

gactggcgct tcctccgcgg gtaccaccag tacgcctacg acggcaagga ttacatcgcc 840

ctgaaagagg acctgcgctc ttggaccgcg gcggacatgg cagctcagac caccaagcac 900

aagtgggagg cggcccatgt ggcggagcag ttgagagcct acctggaggg cacgtgcgtg 960

gagtggctcc gcagatacct ggagaacggg aaggagacgc tgcagcgcac ggattcccca 1020

aaggcacatg tgacccatca ccccagatct aaaggtgaag tcaccctgag gtgctgggcc 1080

ctgggcttct accctgctga catcaccctg acctggcagt tgaatgggga ggagctgacc 1140

caggacatgg agcttgtgga gaccaggcct gcaggggatg gaaccttcca gaagtgggca 1200

tctgtggtgg tgcctcttgg gaaggagcag aattacacat gccgtgtgta ccatgagggg 1260

ctgcctgagc ccctcaccct gagatgggag cctcctccgt ccactgactc ttacatggtg 1320

atcgttgctg ttctgggtgt ccttggagct atggccatca ttggagctgt ggtggctttt 1380

gtgatgaaga gaaggagaaa cacaggtgga aaaggagggg actatgctct ggctccaggc 1440

tcccagagct ctgaaatgtc tctccgagat tgtaaagcgt gaagacagct gcctggactg 1500

tactgagtga cagacgatgt gttcaggtct ctcctgtgac atccagagcc ctcagttctc 1560

tttacacaac attgtctgat gttccctgtg agcttgggtt cagtgtgaag aactgtggag 1620

cccagcctgc cctgcacacc aggaccctat ccctgcactg ccctgtgttc ccttccatag 1680

ccaaccttgc tgctccagcc aaacactggg ggacatctgc atcctgtaag ctccatgcta 1740

ccctgagctg cagctcctca cttccacact gagaataata atttgaatgt gggtggctgg 1800

agagatggct cagcgctgac tgctcttcca aaggtcctga gttcaaatcc cagcaaccac 1860

atggtggctc acaaccatct gtaatgggat ctaacaccct cttctgcagt gtctgaagac 1920

agctacagtg tacttacata taataataaa taagtcttta aaaaataatt tgaaagtgac 1980

cttgattgtt aacatcttga tctagggctg atttcttgtt aatttcatgg attgagaatg 2040

cttagaggtt tttttgtttg tttgattgat ttttttgaag aaataaatgg cagatgaagg 2100

aacttccag 2109

<210> 10

<211> 4694

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

tttcagtggc tgctactcgg cgcttcagtc gcggtcgctt cagtcgtcag catggccgtc 60

atggcgcccc gaaccctcgt cctgctactc tcgggggctc tggccctgac ccagacctgg 120

gcgatccagc gtactccaaa gattcaggtt tactcacgtc atccagcaga gaatggaaag 180

tcaaatttcc tgaattgcta tgtgtctggg tttcatccat ccgacattga agttgactta 240

ctgaagaatg gagagagaat tgaaaaagtg gagcattcag acttgtcttt cagcaaggac 300

tggtctttct atctcttgta ctacactgaa ttcaccccca ctgaaaaaga tgagtatgcc 360

tgccgtgtga accatgtgac tttgtcacag cccaagatag ttaagtggga tcgagacatg 420

ggaggtggcg gatccggcgg aggcggctcg ggtggcggcg gctctggctc tcactccatg 480

aggtatttct tcacatccgt gtcccggccc ggccgcgggg agccccgctt catcgcagtg 540

ggctacgtgg acgacacgca gttcgtgcgg ttcgacagcg acgccgcgag ccagaggatg 600

gagccgcggg cgccgtggat agagcaggag ggtccggagt attgggacgg ggagacacgg 660

aaagtgaagg cccactcaca gactcaccga gtggacctgg ggaccctgcg cggctactac 720

aaccagagcg aggccggtga gtgaccccgg cccggggcgc aggtcacgac ctctcatccc 780

ccacggacgg gccaggtcgc ccacagtctc cgggtccgag atccgccccg aagccgcggg 840

accccgagac ccttgccccg ggagaggccc aggcgccttt acccggtttc attttcagtt 900

taggccaaaa atccccccag gttggtcggg gcggggcggg gctcggggga ccgggctgac 960

cgcggggtcc gggccaggtt ctcacaccgt ccagaggatg tatggctgcg acgtggggtc 1020

ggactggcgc ttcctccgcg ggtaccacca gtacgcctac gacggcaagg attacatcgc 1080

cctgaaagag gacctgcgct cttggaccgc ggcggacatg gcagctcaga ccaccaagca 1140

caagtgggag gcggcccatg tggcggagca gttgagagcc tacctggagg gcacgtgcgt 1200

ggagtggctc cgcagatacc tggagaacgg gaaggagacg ctgcagcgca cgggtaccag 1260

gggccacggg gcgcctccct gatcgcctgt agatctggat cctgtgtgac atacctgtac 1320

cttgtcctcc agagtcaggg gctgggagtc attttctctg gctacagact ttgtgatggc 1380

tgttcactcg gactgacagt taacgttggt cagcaagatg accacagtgg ttgagtctca 1440

gtggtgggac ccttccagta gcatatgccc ctaattttga tatgaactca aacagatatt 1500

aaattactta ttttccattc cctattccat tctgtgacta tctctctcat gctattgaac 1560

atcacataag gatggccatg ttcacccact ggctcatgtg gattccctct tagcttcttt 1620

gtcccaaaag aaaatgtgca gtcctgtgct gaggggacca gctctgcttt tggtcactag 1680

tgcaatgaca gtgtagtgtc aaatagacac atagttcact ctcatcattg atttaactga 1740

gtcttgtgta gatttcagtt tgtcttgtta attgtggaat ttcttaaatc ttccacacag 1800

attccccaaa ggcacatgtg acccatcacc ccagatctaa aggtgaagtc accctgaggt 1860

gctgggccct gggcttctac cctgctgaca tcaccctgac ctggcagttg aatggggagg 1920

agctgaccca ggacatggag cttgtggaga ccaggcctgc aggggatgga accttccaga 1980

agtgggcatc tgtggtggtg cctcttggga aggagcagaa ttacacatgc cgtgtgtacc 2040

atgaggggct gcctgagccc ctcaccctga gatggggtaa ggagggtgtg ggtgcagagc 2100

tggggtcagg gaaagctgga gccttctgca gaccctgagc tggtcaggga tgagagctgg 2160

ggtcataacc ctcaccttca tttcctgtac ctgtccttcc cagagcctcc tccgtccact 2220

gactcttaca tggtgatcgt tgctgttctg ggtgtccttg gagctatggc catcattgga 2280

gctgtggtgg cttttgtgat gaagagaagg agaaacacag gtaagaaagg gcagggtctg 2340

agttttctct cagcctcctt tagaagtgtg ctctgctcat taatggggaa cacagccaca 2400

ccccacattg ctactgtctc taactgggtc tgctgtcagt tctgggaatt tccagtgtca 2460

agatcttcct tgaactctca cagcttttct tttcacaggt ggaaaaggag gggactatgc 2520

tctggctcca ggttagtgtg gggacaggat tgttctgggg gacattggag tgaagttgga 2580

gatgatggga gctctgggaa tccataatag ctcctccaga gaaatcttct aggggcctga 2640

gttgtgccat gaagtgaata cattcatgta catatgcata tacatttgtt ttgttttacc 2700

ctaggctccc agagctctga aatgtctctc cgagattgta aaggtgacac tctagggtct 2760

gattggggag gggcaatgtg gacatgattg ggtttcaggg actcccagaa tctcctgaga 2820

gtgagtggtg ggttgctgga atgttgtctt cacagtgatg gttcatgact ctcattctct 2880

agcgtgaaga cagctgcctg gactgtactg agtgacagac gatgtgttca ggtctctcct 2940

gtgacatcca gagccctcag ttctctttac acaacattgt ctgatgttcc ctgtgagctt 3000

gggttcagtg tgaagaactg tggagcccag cctgccctgc acaccaggac cctatccctg 3060

cactgccctg tgttcccttc catagccaac cttgctgctc cagccaaaca ctgggggaca 3120

tctgcatcct gtaagctcca tgctaccctg agctgcagct cctcacttcc acactgagaa 3180

taataatttg aatgtgggtg gctggagaga tggctcagcg ctgactgctc ttccaaaggt 3240

cctgagttca aatcccagca accacatggt ggctcacaac catctgtaat gggatctaac 3300

accctcttct gcagtgtctg aagacagcta cagtgtactt acatataata ataaataagt 3360

ctttaaaaaa taatttgaaa gtgaccttga ttgttaacat cttgatctag ggctgatttc 3420

ttgttaattt catggattga gaatgcttag aggttttttt gtttgtttga ttgatttttt 3480

tgaagaaata aatggcagat gaaggaactt ccagaatctg ggtcactatg ctgtgtgtat 3540

ctgttgggac aggatgaggc tgtggcagct gagtgtgaac agggctgtgc ccaggtgggc 3600

tcagtccatt ttgatctgtg atggggccac acctcggctg tgtcacctct gggctctgtt 3660

ctctccatca ctctgaggca catcctgaga gtttgtgatc acaaagacac agggagggcc 3720

tgagccttgc cctgtcccca ggattatgag cccctagggc taaagatcag agactcaact 3780

aggacagagc tctgcgggta catcttagcc ctttcagtct ctagttggta ggcactagat 3840

ttaccttctg gaggcttccg gacactcagg gaaagaaatg gacagggttg taacttcatg 3900

taaggcaccg tcactgatgt gtcagaagga agttgaggag cgtgagaggg aacgtgggtg 3960

tctctgtcag gtggagtcta gtggtagaaa atccagcttt tcggtgaaat ccagggccct 4020

tgaggccaaa agctcactca aatcttgtat tatatttatt tctaggaaag gggaattgat 4080

gaagggggtg gggatgggtg atctgcccag acaagcagtt accaaatggt ggagccagaa 4140

ctcacctcct ttaagaaggt gattgtccta caaactcatt tgatggtgag gtctggaatg 4200

taaataatgt aatgttcggc taaccttctc cttctctccc tcccttcccc ttttcttttc 4260

agctctgaag attcatttga acctgcttaa ttacaaatcc agtttctaat atgctataca 4320

atttatgcac gcagaaagaa atagcaatgt acacatcacc ttctttatat cttactttaa 4380

atattttatg catgttttca aaaaattgga aatatcctag atagctgagc aataaatctt 4440

caataagtat tttgatcaga ataataaata taattttaag aacaatagtt gatcatatgc 4500

caaaccctct gtacttctca ttacttggat gcagttactc atctttggtc tatcacaaca 4560

taagtgacat actttccttt tggtaaagca aagaggccta attgaagtct gtcactgtgc 4620

ccaatgctta gcaattctca cccccaaccc tgtggctact tctgcttttg ttacttttac 4680

taaaaataaa aaac 4694

<210> 11

<211> 1409

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

gcatttccta gtacagttca acacagtgtt tagtataatt taatattaac atttcaggtc 60

tttaatgtat taaatgagtt tttcttttta attagatgaa gtatcttaac tcacaccttt 120

atacataaaa attattctta tatttcagtt acaaaaaggg atagcaaaat aacataaatg 180

attatgattc ttaaacatta ctggatcaaa atactatatg ctgggtagac actgtaggat 240

tgggtctctg tttattatct cattaatgtc cgtggagact attttatttt tttctagttt 300

agacacagcc tccacactag agattgttaa aggtttttaa aaatatgttc aagaaatcca 360

gaagttatgt tgttctcctt ggggaagcca aggccaaagc cacttcaact gcaagcatgg 420

ccatttctcc atgtcctgat gccccatgcc ctcttcctac ccttcctcac tcgagctgct 480

tgcggtggtg tctccctgtg ctcacagcct gcctctgtcc tggcttttgg ccaggggttt 540

aacttctcta ctgggtccac cgctgatgta atatacattc tgagtaaaac tatggcagcc 600

tttgtcttcc gagccgataa gcagaaaccc caagggaatg catctcaagg tttatctcct 660

catccagaaa aaataattta ttcggggatt cacttcactt ggtcacttag tttaccaatg 720

gccctgttct aagaaagtac tactaagaga atggacagga aacccagcta agccattgtc 780

cttccccaaa acccatggac agaacaaaga aaattaccta aatttttcaa gggtacccga 840

ttaagttctc catccaaagc tctaaaagga gaaacctgct agaagcaagg tcagaaatcc 900

tctcagttgc ctttaggaca ggagggtctt tttacacacg gaatcctgaa actgcctttg 960

tatttctggg ctgagattat aaactaaggg ttgagttctg ccagttaatg ctcttaattg 1020

tcctggcttt agttttcaag aatgcaaact tcaggtccta agtccttttc tgagtgggat 1080

attgtcagca attgaataaa tgaaggcggt cccaggctga acgaccagat acaccaaact 1140

caagagcaca ccctagatag tagggcacca agggtccagc ccaggctgtt tgaaatatca 1200

cgggacttta taagaacatg aaactgaaaa tgggaaagtc cctttgtaac ctagttcagc 1260

atcaacagct aggagactgg tgacgacctc cggatctgag tccggattgg ctgtgagttc 1320

aggaactata taagagcgcg cgccctggct ggctctcatt tcagtggctg ctactcggcg 1380

cttcagtcgc ggtcgcttca gtcgtcagc 1409

<210> 12

<211> 1343

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

gacagagctc tgcgggtaca tcttagccct ttcagtctct agttggtagg cactagattt 60

accttctgga ggcttccgga cactcaggga aagaaatgga cagggttgta acttcatgta 120

aggcaccgtc actgatgtgt cagaaggaag ttgaggagcg tgagagggaa cgtgggtgtc 180

tctgtcaggt ggagtctagt ggtagaaaat ccagcttttc ggtgaaatcc agggcccttg 240

aggccaaaag ctcactcaaa tcttgtatta tatttatttc taggaaaggg gaattgatga 300

agggggtggg gatgggtgat ctgcccagac aagcagttac caaatggtgg agccagaact 360

cacctccttt aagaaggtga ttgtcctaca aactcatttg atggtgaggt ctggaatgta 420

aataatgtaa tgttcggcta accttctcct tctctccctc ccttcccctt ttcttttcag 480

ctctgaagat tcatttgaac ctgcttaatt acaaatccag tttctaatat gctatacaat 540

ttatgcacgc agaaagaaat agcaatgtac acatcacctt ctttatatct tactttaaat 600

attttatgca tgttttcaaa aaattggaaa tatcctagat agctgagcaa taaatcttca 660

ataagtattt tgatcagaat aataaatata attttaagaa caatagttga tcatatgcca 720

aaccctctgt acttctcatt acttggatgc agttactcat ctttggtcta tcacaacata 780

agtgacatac tttccttttg gtaaagcaaa gaggcctaat tgaagtctgt cactgtgccc 840

aatgcttagc aattctcacc cccaaccctg tggctacttc tgcttttgtt acttttacta 900

aaaataaaaa actaaaaaaa aaaaaaaaaa ttgttgccag acattgccag tgttacatga 960

agtggtttct aggtagcata aatgcctgca agcacgtgcg tatttttcat catctaaaga 1020

ggcagtgggt atcttagaag gttcttgcag aagcaggctc ctcaactaag ggtcgagagg 1080

aaagtgacta ggaaaggcct ccaaagcaga gcagtaggag gtggtgatga aggtcaggga 1140

ataataggaa gaaactgaga ggggagtgag gatctcagac gtgctggtcc cacagggagc 1200

tctagagcag agatcacatc ttacagtttg tcttggtgat gtgcacagct tgttgctggc 1260

tccacaggac tgtatgctag gatgaaagcc cagatacttt ggggtgcagg ttatggttat 1320

ggggtgcaag ttatggttat tgg 1343

<210> 13

<211> 72

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

atggccgtca tggcgccccg aaccctcgtc ctgctactct cgggggctct ggccctgacc 60

cagacctggg cg 72

<210> 14

<211> 297

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

atccagcgta ctccaaagat tcaggtttac tcacgtcatc cagcagagaa tggaaagtca 60

aatttcctga attgctatgt gtctgggttt catccatccg acattgaagt tgacttactg 120

aagaatggag agagaattga aaaagtggag cattcagact tgtctttcag caaggactgg 180

tctttctatc tcttgtacta cactgaattc acccccactg aaaaagatga gtatgcctgc 240

cgtgtgaacc atgtgacttt gtcacagccc aagatagtta agtgggatcg agacatg 297

<210> 15

<211> 831

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

ggctctcact ccatgaggta tttcttcaca tccgtgtccc ggcccggccg cggggagccc 60

cgcttcatcg cagtgggcta cgtggacgac acgcagttcg tgcggttcga cagcgacgcc 120

gcgagccaga ggatggagcc gcgggcgccg tggatagagc aggagggtcc ggagtattgg 180

gacggggaga cacggaaagt gaaggcccac tcacagactc accgagtgga cctggggacc 240

ctgcgcggct actacaacca gagcgaggcc ggtgagtgac cccggcccgg ggcgcaggtc 300

acgacctctc atcccccacg gacgggccag gtcgcccaca gtctccgggt ccgagatccg 360

ccccgaagcc gcgggacccc gagacccttg ccccgggaga ggcccaggcg cctttacccg 420

gtttcatttt cagtttaggc caaaaatccc cccaggttgg tcggggcggg gcggggctcg 480

ggggaccggg ctgaccgcgg ggtccgggcc aggttctcac accgtccaga ggatgtatgg 540

ctgcgacgtg gggtcggact ggcgcttcct ccgcgggtac caccagtacg cctacgacgg 600

caaggattac atcgccctga aagaggacct gcgctcttgg accgcggcgg acatggcagc 660

tcagaccacc aagcacaagt gggaggcggc ccatgtggcg gagcagttga gagcctacct 720

ggagggcacg tgcgtggagt ggctccgcag atacctggag aacgggaagg agacgctgca 780

gcgcacgggt accaggggcc acggggcgcc tccctgatcg cctgtagatc t 831

<210> 16

<211> 2486

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

ggatcctgtg tgacatacct gtaccttgtc ctccagagtc aggggctggg agtcattttc 60

tctggctaca gactttgtga tggctgttca ctcggactga cagttaacgt tggtcagcaa 120

gatgaccaca gtggttgagt ctcagtggtg ggacccttcc agtagcatat gcccctaatt 180

ttgatatgaa ctcaaacaga tattaaatta cttattttcc attccctatt ccattctgtg 240

actatctctc tcatgctatt gaacatcaca taaggatggc catgttcacc cactggctca 300

tgtggattcc ctcttagctt ctttgtccca aaagaaaatg tgcagtcctg tgctgagggg 360

accagctctg cttttggtca ctagtgcaat gacagtgtag tgtcaaatag acacatagtt 420

cactctcatc attgatttaa ctgagtcttg tgtagatttc agtttgtctt gttaattgtg 480

gaatttctta aatcttccac acagattccc caaaggcaca tgtgacccat caccccagat 540

ctaaaggtga agtcaccctg aggtgctggg ccctgggctt ctaccctgct gacatcaccc 600

tgacctggca gttgaatggg gaggagctga cccaggacat ggagcttgtg gagaccaggc 660

ctgcagggga tggaaccttc cagaagtggg catctgtggt ggtgcctctt gggaaggagc 720

agaattacac atgccgtgtg taccatgagg ggctgcctga gcccctcacc ctgagatggg 780

gtaaggaggg tgtgggtgca gagctggggt cagggaaagc tggagccttc tgcagaccct 840

gagctggtca gggatgagag ctggggtcat aaccctcacc ttcatttcct gtacctgtcc 900

ttcccagagc ctcctccgtc cactgactct tacatggtga tcgttgctgt tctgggtgtc 960

cttggagcta tggccatcat tggagctgtg gtggcttttg tgatgaagag aaggagaaac 1020

acaggtaaga aagggcaggg tctgagtttt ctctcagcct cctttagaag tgtgctctgc 1080

tcattaatgg ggaacacagc cacaccccac attgctactg tctctaactg ggtctgctgt 1140

cagttctggg aatttccagt gtcaagatct tccttgaact ctcacagctt ttcttttcac 1200

aggtggaaaa ggaggggact atgctctggc tccaggttag tgtggggaca ggattgttct 1260

gggggacatt ggagtgaagt tggagatgat gggagctctg ggaatccata atagctcctc 1320

cagagaaatc ttctaggggc ctgagttgtg ccatgaagtg aatacattca tgtacatatg 1380

catatacatt tgttttgttt taccctaggc tcccagagct ctgaaatgtc tctccgagat 1440

tgtaaaggtg acactctagg gtctgattgg ggaggggcaa tgtggacatg attgggtttc 1500

agggactccc agaatctcct gagagtgagt ggtgggttgc tggaatgttg tcttcacagt 1560

gatggttcat gactctcatt ctctagcgtg aagacagctg cctggactgt actgagtgac 1620

agacgatgtg ttcaggtctc tcctgtgaca tccagagccc tcagttctct ttacacaaca 1680

ttgtctgatg ttccctgtga gcttgggttc agtgtgaaga actgtggagc ccagcctgcc 1740

ctgcacacca ggaccctatc cctgcactgc cctgtgttcc cttccatagc caaccttgct 1800

gctccagcca aacactgggg gacatctgca tcctgtaagc tccatgctac cctgagctgc 1860

agctcctcac ttccacactg agaataataa tttgaatgtg ggtggctgga gagatggctc 1920

agcgctgact gctcttccaa aggtcctgag ttcaaatccc agcaaccaca tggtggctca 1980

caaccatctg taatgggatc taacaccctc ttctgcagtg tctgaagaca gctacagtgt 2040

acttacatat aataataaat aagtctttaa aaaataattt gaaagtgacc ttgattgtta 2100

acatcttgat ctagggctga tttcttgtta atttcatgga ttgagaatgc ttagaggttt 2160

ttttgtttgt ttgattgatt tttttgaaga aataaatggc agatgaagga acttccagaa 2220

tctgggtcac tatgctgtgt gtatctgttg ggacaggatg aggctgtggc agctgagtgt 2280

gaacagggct gtgcccaggt gggctcagtc cattttgatc tgtgatgggg ccacacctcg 2340

gctgtgtcac ctctgggctc tgttctctcc atcactctga ggcacatcct gagagtttgt 2400

gatcacaaag acacagggag ggcctgagcc ttgccctgtc cccaggatta tgagccccta 2460

gggctaaaga tcagagactc aactag 2486

<210> 17

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

cctggccaat cccgtcggga agg 23

<210> 18

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

ccgtcagcac actcgcaaac agg 23

<210> 19

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

gttctccttc ccgacgggat tgg 23

<210> 20

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

actctggata gcatacaggc cgg 23

<210> 21

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

ctggtgcttg tctcactgac cgg 23

<210> 22

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

ggggaaagag gcactcactc tgg 23

<210> 23

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

gacaagcacc agaaagacca ggg 23

<210> 24

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

ctggaggctt ccggacactc agg 23

<210> 25

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

tgatcaagca tcatgatggt agg 23

<210> 26

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

aggagcgtga gagggaacgt ggg 23

<210> 27

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

gaggaacgta gccatgtcac tgg 23

<210> 28

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

catgtcactg gccctctaaa ggg 23

<210> 29

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

catgtgatca agcatcatga tgg 23

<210> 30

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

acccgcagag ctctgtcact cgg 23

<210> 31

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

ctctgtcact cggctcctct ggg 23

<210> 32

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

gttctccttc ccgacgggat 20

<210> 33

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

taggttctcc ttcccgacgg gat 23

<210> 34

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

atcccgtcgg gaaggagaa 19

<210> 35

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

aaacatcccg tcgggaagga gaa 23

<210> 36

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

acccgcagag ctctgtcact 20

<210> 37

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

taggacccgc agagctctgt cact 24

<210> 38

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

agtgacagac tctgcgggt 19

<210> 39

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

aaacagtgac agactctgcg ggt 23

<210> 40

<211> 132

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

gaattctaat acgactcact atagggggtc ttcgagaaga cctgttttag agctagaaat 60

agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120

tttaaaggat cc 132

<210> 41

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

gaatgtgtgc ctcctctcag tttcc 25

<210> 42

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

tccttcccgt tctccaggta tctgc 25

<210> 43

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

gcggctacta caaccagagc gag 23

<210> 44

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

tccagcaata agaaccagtc cctagct 27

<210> 45

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

atgaggtctt tttgtgggca gagca 25

<210> 46

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

ctccctacgg ccacatcacc attac 25

<210> 47

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

taacttcatg taaggcaccg tcac 24

<210> 48

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 48

tccagacctc accatcaaat gag 23

<210> 49

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 49

gaataaatga aggcggtccc aggct 25

<210> 50

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

aggtgagttc tggctccacc atttg 25

<210> 51

<211> 45

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

ggaggtggcg gatccggcgg aggcggctcg ggtggcggcg gctct 45

<210> 52

<211> 1891

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 52

tttcagtggc tgctactcgg cgcttcagtc gcggtcgctt cagtcgtcag catggccgtc 60

atggcgcccc gaaccctcgt cctgctactc tcgggggctc tggccctgac ccagacctgg 120

gcgatccagc gtactccaaa gattcaggtt tactcacgtc atccagcaga gaatggaaag 180

tcaaatttcc tgaattgcta tgtgtctggg tttcatccat ccgacattga agttgactta 240

ctgaagaatg gagagagaat tgaaaaagtg gagcattcag acttgtcttt cagcaaggac 300

tggtctttct atctcttgta ctacactgaa ttcaccccca ctgaaaaaga tgagtatgcc 360

tgccgtgtga accatgtgac tttgtcacag cccaagatag ttaagtggga tcgagacatg 420

ggaggtggcg gatccggcgg aggcggctcg ggtggcggcg gctctggctc tcactccatg 480

aggtatttct tcacatccgt gtcccggccc ggccgcgggg agccccgctt catcgcagtg 540

ggctacgtgg acgacacgca gttcgtgcgg ttcgacagcg acgccgcgag ccagaggatg 600

gagccgcggg cgccgtggat agagcaggag ggtccggagt attgggacgg ggagacacgg 660

aaagtgaagg cccactcaca gactcaccga gtggacctgg ggaccctgcg cggctactac 720

aaccagagcg aggccggttc tcacaccgtc cagaggatgt atggctgcga cgtggggtcg 780

gactggcgct tcctccgcgg gtaccaccag tacgcctacg acggcaagga ttacatcgcc 840

ctgaaagagg acctgcgctc ttggaccgcg gcggacatgg cagctcagac caccaagcac 900

aagtgggagg cggcccatgt ggcggagcag ttgagagcct acctggaggg cacgtgcgtg 960

gagtggctcc gcagatacct ggagaacggg aaggagacgc tgcagcgcac ggacgccccc 1020

aaaacgcata tgactcacca cgctgtctct gaccatgaag ccaccctgag gtgctgggcc 1080

ctgagcttct accctgcgga gatcacactg acctggcagc gggatgggga ggaccagacc 1140

caggacacgg agctcgtgga gaccaggcct gcaggggatg gaaccttcca gaagtgggcg 1200

gctgtggtgg tgccttctgg acaggagcag agatacacct gccatgtgca gcatgagggt 1260

ttgcccaagc ccctcaccct gagatgggag ccgtcttccc agcccaccat ccccatcgtg 1320

ggcatcattg ctggcctggt tctctttgga gctgtgatca ctggagctgt ggtcgctgct 1380

gtgatgtgga ggaggaagag ctcagataga aaaggaggga gctactctca ggctgcaagc 1440

agtgacagtg cccagggctc tgatgtgtct ctcacagctt gtaaagtgtg agacagctgc 1500

cttgtgtggg actgagaggc aagagttgtt cctgcccttc cctttgtgac ttgaagaacc 1560

ctgactttgt ttctgcaaag gcacctgcat gtgtctgtgt tcgtgtaggc ataatgtgag 1620

gaggtgggga gaccacccca cccccatgtc caccatgacc ctcttcccac gctgacctgt 1680

gctccctccc caatcatctt tcctgttcca gagaggtggg gctgaggtgt ctccatctct 1740

gtctcaactt catggtgcac tgagctgtaa cttcttcctt ccctattaaa attagaacct 1800

gagtataaat ttactttctc aaattcttgc catgagaggt tgatgagtta attaaaggag 1860

aagattccta aaatttgaga gacaaaataa a 1891

<210> 53

<211> 1342

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 53

gacagagctc tgcgggtaca tcttagccct ttcagtctct agttggtagg cactagattt 60

accttctgga ggcttccgga cactcagaga aagaaatgga cagggttgta acttcatgta 120

aggcaccgtc actgatgtgt cagaaggaag ttgaggagcg tgagagggaa cgtgggtgtc 180

tctgtcaggt ggagtctagt ggtagaaaat ccagcttttc agtgaaatcc agggcccttg 240

aggccaaaag ctcactcaaa tcttgtatta tatttatttc taggaaaggg gaattgatga 300

agggggtggg gatgggtgat ctgcccagac aagcagttac caaatggtgg agccagaact 360

cacctccttt aagaaggtga ttgtcctaca aactcatttg atggtgaggt ctggaatgta 420

aataatgtaa tgttcggcta accttctcct tctctccctc ccttcccctt ttcttttcag 480

ctctgaagat tcatttgaac ctgcttaatt acaaatccag tttctaatat gctatacaat 540

ttatgcacgc agaaagaaat agcaatgtac acatcacctt ctttatatct tactttaaat 600

gttttatgca tgttttcaaa aattggaaat atcctagata gctgagcaat aaatcttcaa 660

taagtatttt gatcagaata ataaatataa ttttaagaac aatagttgat catatgccaa 720

accctctgta cttctcatta cttggatgca gttactcatc tttggtctat cacaacataa 780

gtgacatact ttccttttgg taaagcaaag aggcctaatt gaagtctgtc actgtgccca 840

atgcttagca attctcaccc ccaaccctgt ggctacttct gcttttgtta cttttactaa 900

aaataaaaaa ctaaaaaaaa aaaaaaaaat tgctgccaga cattgccagt gttacatgaa 960

gtggtttcta ggtagcctaa atgcctgcaa gcacgtgcgt atttttcatc atctaaagag 1020

gcagtgggta tcttagaagg ttcttgcaga agcaggctcc tcaactaagg gtcgagagga 1080

aagtgactag gaaaggcctc caaagcagag cagtaggagg tggtgatgaa ggtcagggaa 1140

taataggaag aaactgagag gggagtgagg atctcagacg tgctggtccc acagggagct 1200

ctagagcaga gatcacatct tacagtttgt cttggtgatg tgcacagctt gttgctggct 1260

ccacaggact gtatgctagg atgaaagccc agatactttg gggtgcaggt tatggttatg 1320

gggtgcaagt tatggttatt gg 1342

<210> 54

<211> 3944

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 54

ggctctcact ccatgaggta tttcttcaca tccgtgtccc ggcccggccg cggggagccc 60

cgcttcatcg cagtgggcta cgtggacgac acgcagttcg tgcggttcga cagcgacgcc 120

gcgagccaga ggatggagcc gcgggcgccg tggatagagc aggagggtcc ggagtattgg 180

gacggggaga cacggaaagt gaaggcccac tcacagactc accgagtgga cctggggacc 240

ctgcgcggct actacaacca gagcgaggcc ggtgagtgac cccggcccgg ggcgcaggtc 300

acgacctctc atcccccacg gacgggccag gtcgcccaca gtctccgggt ccgagatccg 360

ccccgaagcc gcgggacccc gagacccttg ccccgggaga ggcccaggcg cctttacccg 420

gtttcatttt cagtttaggc caaaaatccc cccaggttgg tcggggcggg gcggggctcg 480

ggggaccggg ctgaccgcgg ggtccgggcc aggttctcac accgtccaga ggatgtatgg 540

ctgcgacgtg gggtcggact ggcgcttcct ccgcgggtac caccagtacg cctacgacgg 600

caaggattac atcgccctga aagaggacct gcgctcttgg accgcggcgg acatggcagc 660

tcagaccacc aagcacaagt gggaggcggc ccatgtggcg gagcagttga gagcctacct 720

ggagggcacg tgcgtggagt ggctccgcag atacctggag aacgggaagg agacgctgca 780

gcgcacgggt accaggggcc acggggcgcc tccctgatcg cctgtagatc tcccgggctg 840

gcctcccaca aggaggggag acaattggga ccaacactag aatatcgccc tccctctggt 900

cctgagggag aggaatcctc ctgggtttcc agatcctgta ccagagagtg actctgaggt 960

tccgccctgc tctctgacac aattaaggga taaaatctct gaaggaatga cgggaagacg 1020

atccctcgaa tactgatgag tggttccctt tgacacacac aggcagcagc cttgggcccg 1080

tgacttttcc tctcaggcct tgttctctgc ttcacactca atgtgtgtgg gggtctgagt 1140

ccagcacttc tgagtccttc agcctccact caggtcagga ccagaagtcg ctgttccctc 1200

ttcagggact agaattttcc acggaatagg agattatccc aggtgcctgt gtccaggctg 1260

gtgtctgggt tctgtgctcc cttccccatc ccaggtgtcc tgtccattct caagatagcc 1320

acatgtgtgc tggaggagtg tcccatgaca gatgcaaaat gcctgaatga tctgactctt 1380

cctgacagac gcccccaaaa cgcatatgac tcaccacgct gtctctgacc atgaagccac 1440

cctgaggtgc tgggccctga gcttctaccc tgcggagatc acactgacct ggcagcggga 1500

tggggaggac cagacccagg acacggagct cgtggagacc aggcctgcag gggatggaac 1560

cttccagaag tgggcggctg tggtggtgcc ttctggacag gagcagagat acacctgcca 1620

tgtgcagcat gagggtttgc ccaagcccct caccctgaga tggggtaagg agggagacgg 1680

gggtgtcatg tcttttaggg aaagcaggag cctctctgac ctttagcagg gtcagggccc 1740

ctcaccttcc cctcttttcc cagagccgtc ttcccagccc accatcccca tcgtgggcat 1800

cattgctggc ctggttctct ttggagctgt gatcactgga gctgtggtcg ctgctgtgat 1860

gtggaggagg aagagctcag gtggggaagg ggtgaagggt gggtctgaga tttcttgtct 1920

cactgagggt tccaagaccc aggtagaagt gtgccctgcc tcgttactgg gaagcaccac 1980

ccacaattat gggcctaccc agcctgggcc ctgtgtgcca gcacttactc ttttgtaaag 2040

cacctgttaa aatgaaggac agatttatca ccttgattac agcggtgatg ggacctgatc 2100

ccagcagtca caagtcacag gggaaggtcc ctgaggacct tcaggagggc ggttggtcca 2160

ggacccacac ctgctttctt catgtttcct gatcccgccc tgggtctgca gtcacacatt 2220

tctggaaact tctctgaggt ccaagacttg gaggttcctc taggacctta aggccctgac 2280

tcctttctgg tatctcacag gacattttct tcccacagat agaaaaggag ggagctactc 2340

tcaggctgca agtaagtatg aaggaggctg atgcctgagg tccttgggat attgtgtttg 2400

ggagcccatg ggggagctca cccaccccac aattcctcct ctagccacat cttctgtggg 2460

atctgaccag gttctgtttt tgttctaccc caggcagtga cagtgcccag ggctctgatg 2520

tgtctctcac agcttgtaaa ggtgagagcc tggagggcct gatgtgtgtt gggtgttggg 2580

cggaacagtg gacacagctg tgctatgggg tttctttcca ttggatgtat tgagcatgcg 2640

atgggctgtt taaagtgtga cccctcactg tgacagatac gaatttgttc atgaatattt 2700

ttttctatag tgtgagacag ctgccttgtg tgggactgag aggcaagagt tgttcctgcc 2760

cttccctttg tgacttgaag aaccctgact ttgtttctgc aaaggcacct gcatgtgtct 2820

gtgttcgtgt aggcataatg tgaggaggtg gggagaccac cccaccccca tgtccaccat 2880

gaccctcttc ccacgctgac ctgtgctccc tccccaatca tctttcctgt tccagagagg 2940

tggggctgag gtgtctccat ctctgtctca acttcatggt gcactgagct gtaacttctt 3000

ccttccctat taaaattaga acctgagtat aaatttactt tctcaaattc ttgccatgag 3060

aggttgatga gttaattaaa ggagaagatt cctaaaattt gagagacaaa ataaatggaa 3120

cacatgagaa ccttccagag tccacgtgtt gcttatgctg atttgttgca ggggaggaga 3180

gtagatgggg ctgtgcccag tttctgttcc ggccactatg ggctttatgt ggtcactgct 3240

tggctgggtc atctttgctg ctccattgtc cttggccctt cagtagaacc ttgtcccact 3300

aagacctgtg atcacaggga gttggatgtc acctagggtg gtccctgcat acaaatctcc 3360

ttgcggtatc aagagacaaa ttttcagacc tgtctaggtc ttgccttcct cccagggctt 3420

tttcctcaat tgtattttca atttttctcc aatcttttta aaggaaccag attgtgacat 3480

ttgcagagag gagtggtccc atagtttctc atcatgatta actttctgtt ggaactcctg 3540

ttctgccctc ctactcttct tcctgctctg aattgtagta atcctagtgc tggctccaat 3600

ccaaactcat agatttataa agcagagtct aatttagatt catatgtggt tggaaaattg 3660

tacccataag gctagggtta ttgttcctga agagaaatat atggttttgt gctgaagtgt 3720

gcaggagggt tggtgtggga ggagggagga cacacaagca gccctggtga gaaaagcact 3780

ggcggcgtgg atgtccatgt gaacttatgt tctttagctg ccacaaaaca gcatttgccc 3840

tgtggctaca ttaataaagg tatgggcttt agaataggga gatgctctac agtggtcatt 3900

cattcaactg acatttgttg tctgctaggg atatgactgc tttt 3944

<210> 55

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 55

cagctccaaa gagaaccagg ccag 24

<210> 56

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 56

taccctgcgg agatcacact gacc 24

<210> 57

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 57

ttctgatgct ccttccttcc gtgc 24

<210> 58

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 58

ttctctgtgc tcagtgttcc ctgc 24

<210> 59

<211> 362

<212> PRT

<213> 人(human)

<400> 59

Met Ala Pro Arg Thr Leu Val Leu Leu Leu Ser Gly Ala Leu Ala Leu

1 5 10 15

Thr Gln Thr Trp Ala Gly Ser His Ser Met Arg Tyr Phe Phe Thr Ser

20 25 30

Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe Ile Ala Val Gly Tyr

35 40 45

Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser Asp Ala Ala Ser Gln

50 55 60

Arg Met Glu Pro Arg Ala Pro Trp Ile Glu Gln Glu Gly Pro Glu Tyr

65 70 75 80

Trp Asp Gly Glu Thr Arg Lys Val Lys Ala His Ser Gln Thr His Arg

85 90 95

Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr Asn Gln Ser Glu Ala Gly

100 105 110

Ser His Thr Val Gln Arg Met Tyr Gly Cys Asp Val Gly Ser Asp Trp

115 120 125

Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala Tyr Asp Gly Lys Asp Tyr

130 135 140

Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp Thr Ala Ala Asp Met Ala

145 150 155 160

Ala Gln Thr Thr Lys His Lys Trp Glu Ala Ala His Val Ala Glu Gln

165 170 175

Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val Glu Trp Leu Arg Arg Tyr

180 185 190

Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr Asp Ala Pro Lys Thr

195 200 205

His Met Thr His His Ala Val Ser Asp His Glu Ala Thr Leu Arg Cys

210 215 220

Trp Ala Leu Ser Phe Tyr Pro Ala Glu Ile Thr Leu Thr Trp Gln Arg

225 230 235 240

Asp Gly Glu Asp Gln Thr Gln Asp Thr Glu Leu Val Glu Thr Arg Pro

245 250 255

Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ala Val Val Val Pro Ser

260 265 270

Gly Gln Glu Gln Arg Tyr Thr Cys His Val Gln His Glu Gly Leu Pro

275 280 285

Lys Pro Leu Thr Leu Arg Trp Glu Pro Ser Ser Gln Pro Thr Ile Pro

290 295 300

Ile Val Gly Ile Ile Ala Gly Leu Val Leu Phe Gly Ala Val Ile Thr

305 310 315 320

Gly Ala Val Val Ala Ala Val Met Trp Arg Arg Lys Ser Ser Asp Arg

325 330 335

Lys Gly Gly Ser Tyr Ser Gln Ala Ala Ser Ser Asp Ser Ala Gln Gly

340 345 350

Ser Asp Val Ser Leu Thr Ala Cys Lys Val

355 360

<210> 60

<211> 1409

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 60

gcatttccta gtacagttca acacagtgtt tagtataatt taatattaac atttcaggtc 60

tttaatgtat taaatgagtt tttcttttta attagatgaa gtatcttaac tcacaccttt 120

atacataaaa attattctta tatttcagtt acaaaaaggg atagcaaaat aacataaatg 180

attatgattc ttaaacatta ctggatcaaa atactatatg ctgggtagac actgtaggat 240

tgggtctctg tttattatct cattaatgtc cgtggagact attttatttt tttctagttt 300

agacacagcc tccacactag agattgttaa aggtttttaa aaatatgttc aagaaatcca 360

gaagttatgt tgttctcctt ggggaagcca aggccaaagc cacttcaact gcaagcatgg 420

ccatttctcc atgtcctgat gccccatgcc ctcttcctac ccttcctcac tcgagctgct 480

tgcggtggtg tctccctgtg ctcacagcct gcctctgtcc tggcttttgg ccaggggttt 540

aacttctcta ctgggtccac cgctgatgta atatacattc tgagtaaaac tatggcagcc 600

tttgtcttcc gagccgataa gcagaaaccc caagggaatg catctcaagg tttatctcct 660

catccagaaa aaataattta ttcgggtatt cacttcactt ggtcacttag tttaccaatg 720

gccctgttct aagaaagtac tactaagaga atggacagga aacccagcta agccattgtt 780

cttccccaaa acccatggac agaacaaaga aaattaccta aatttttcaa gggtacccga 840

ttaagttctc catccaaagc tctaaaagga gaaacctgct agaagcaagg tcagaaatcc 900

tctcagttgc ctttaggaca ggagggtctt tttacacacg gaatcctgaa actgcctttg 960

tatttctggg ctgagattat aaactaaggg ttgagttctg ccagttaatg ctcttaattg 1020

tcctggcttt agttttcaag aatgcaaact tcaggtccta agtccttttc tgagtgggat 1080

attgtcagca attgaataaa tgaaggcggt cccaggctga acgaccagat acaccaaact 1140

caagagcaca ccctagatag tagggcacca agggtccagc ccaggctgtt tgaaatatca 1200

cgggacttta taagaacatg aaactgaaaa tgggaaagtc cctttgtaac ctagttcagc 1260

attaacagct aggagactgg tgacgacctc cggatctgag tccggattgg ctgtgagttc 1320

aggaactata taagagcgcg cgccctggct ggctctcatt tcagtggctg ctactcggcg 1380

cttcagtcgc ggtcgcttca gtcgtcagc 1409

<210> 61

<211> 476

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 61

Met Ala Val Met Ala Pro Arg Thr Leu Val Leu Leu Leu Ser Gly Ala

1 5 10 15

Leu Ala Leu Thr Gln Thr Trp Ala Ile Gln Arg Thr Pro Lys Ile Gln

20 25 30

Val Tyr Ser Arg His Pro Ala Glu Asn Gly Lys Ser Asn Phe Leu Asn

35 40 45

Cys Tyr Val Ser Gly Phe His Pro Ser Asp Ile Glu Val Asp Leu Leu

50 55 60

Lys Asn Gly Glu Arg Ile Glu Lys Val Glu His Ser Asp Leu Ser Phe

65 70 75 80

Ser Lys Asp Trp Ser Phe Tyr Leu Leu Tyr Tyr Thr Glu Phe Thr Pro

85 90 95

Thr Glu Lys Asp Glu Tyr Ala Cys Arg Val Asn His Val Thr Leu Ser

100 105 110

Gln Pro Lys Ile Val Lys Trp Asp Arg Asp Met Gly Gly Gly Gly Ser

115 120 125

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ser His Ser Met Arg

130 135 140

Tyr Phe Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe

145 150 155 160

Ile Ala Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser

165 170 175

Asp Ala Ala Ser Gln Arg Met Glu Pro Arg Ala Pro Trp Ile Glu Gln

180 185 190

Glu Gly Pro Glu Tyr Trp Asp Gly Glu Thr Arg Lys Val Lys Ala His

195 200 205

Ser Gln Thr His Arg Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr Asn

210 215 220

Gln Ser Glu Ala Gly Ser His Thr Val Gln Arg Met Tyr Gly Cys Asp

225 230 235 240

Val Gly Ser Asp Trp Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala Tyr

245 250 255

Asp Gly Lys Asp Tyr Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp Thr

260 265 270

Ala Ala Asp Met Ala Ala Gln Thr Thr Lys His Lys Trp Glu Ala Ala

275 280 285

His Val Ala Glu Gln Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val Glu

290 295 300

Trp Leu Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr

305 310 315 320

Asp Ser Pro Lys Ala His Val Thr His His Pro Arg Ser Lys Gly Glu

325 330 335

Val Thr Leu Arg Cys Trp Ala Leu Gly Phe Tyr Pro Ala Asp Ile Thr

340 345 350

Leu Thr Trp Gln Leu Asn Gly Glu Glu Leu Thr Gln Asp Met Glu Leu

355 360 365

Val Glu Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ser

370 375 380

Val Val Val Pro Leu Gly Lys Glu Gln Asn Tyr Thr Cys Arg Val Tyr

385 390 395 400

His Glu Gly Leu Pro Glu Pro Leu Thr Leu Arg Trp Glu Pro Pro Pro

405 410 415

Ser Thr Asp Ser Tyr Met Val Ile Val Ala Val Leu Gly Val Leu Gly

420 425 430

Ala Met Ala Ile Ile Gly Ala Val Val Ala Phe Val Met Lys Arg Arg

435 440 445

Arg Asn Thr Gly Gly Lys Gly Gly Asp Tyr Ala Leu Ala Pro Gly Ser

450 455 460

Gln Ser Ser Glu Met Ser Leu Arg Asp Cys Lys Ala

465 470 475

<210> 62

<211> 479

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 62

Met Ala Val Met Ala Pro Arg Thr Leu Val Leu Leu Leu Ser Gly Ala

1 5 10 15

Leu Ala Leu Thr Gln Thr Trp Ala Ile Gln Arg Thr Pro Lys Ile Gln

20 25 30

Val Tyr Ser Arg His Pro Ala Glu Asn Gly Lys Ser Asn Phe Leu Asn

35 40 45

Cys Tyr Val Ser Gly Phe His Pro Ser Asp Ile Glu Val Asp Leu Leu

50 55 60

Lys Asn Gly Glu Arg Ile Glu Lys Val Glu His Ser Asp Leu Ser Phe

65 70 75 80

Ser Lys Asp Trp Ser Phe Tyr Leu Leu Tyr Tyr Thr Glu Phe Thr Pro

85 90 95

Thr Glu Lys Asp Glu Tyr Ala Cys Arg Val Asn His Val Thr Leu Ser

100 105 110

Gln Pro Lys Ile Val Lys Trp Asp Arg Asp Met Gly Gly Gly Gly Ser

115 120 125

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ser His Ser Met Arg

130 135 140

Tyr Phe Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe

145 150 155 160

Ile Ala Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser

165 170 175

Asp Ala Ala Ser Gln Arg Met Glu Pro Arg Ala Pro Trp Ile Glu Gln

180 185 190

Glu Gly Pro Glu Tyr Trp Asp Gly Glu Thr Arg Lys Val Lys Ala His

195 200 205

Ser Gln Thr His Arg Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr Asn

210 215 220

Gln Ser Glu Ala Gly Ser His Thr Val Gln Arg Met Tyr Gly Cys Asp

225 230 235 240

Val Gly Ser Asp Trp Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala Tyr

245 250 255

Asp Gly Lys Asp Tyr Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp Thr

260 265 270

Ala Ala Asp Met Ala Ala Gln Thr Thr Lys His Lys Trp Glu Ala Ala

275 280 285

His Val Ala Glu Gln Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val Glu

290 295 300

Trp Leu Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr

305 310 315 320

Asp Ala Pro Lys Thr His Met Thr His His Ala Val Ser Asp His Glu

325 330 335

Ala Thr Leu Arg Cys Trp Ala Leu Ser Phe Tyr Pro Ala Glu Ile Thr

340 345 350

Leu Thr Trp Gln Arg Asp Gly Glu Asp Gln Thr Gln Asp Thr Glu Leu

355 360 365

Val Glu Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ala

370 375 380

Val Val Val Pro Ser Gly Gln Glu Gln Arg Tyr Thr Cys His Val Gln

385 390 395 400

His Glu Gly Leu Pro Lys Pro Leu Thr Leu Arg Trp Glu Pro Ser Ser

405 410 415

Gln Pro Thr Ile Pro Ile Val Gly Ile Ile Ala Gly Leu Val Leu Phe

420 425 430

Gly Ala Val Ile Thr Gly Ala Val Val Ala Ala Val Met Trp Arg Arg

435 440 445

Lys Ser Ser Asp Arg Lys Gly Gly Ser Tyr Ser Gln Ala Ala Ser Ser

450 455 460

Asp Ser Ala Gln Gly Ser Asp Val Ser Leu Thr Ala Cys Lys Val

465 470 475

<210> 63

<211> 337

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 63

Met Ser Arg Ser Val Ala Leu Ala Val Leu Ala Leu Leu Ser Leu Ser

1 5 10 15

Gly Leu Glu Ala Ile Gln Arg Thr Pro Lys Ile Gln Val Tyr Ser Arg

20 25 30

His Pro Ala Glu Asn Gly Lys Ser Asn Phe Leu Asn Cys Tyr Val Ser

35 40 45

Gly Phe His Pro Ser Asp Ile Glu Val Asp Leu Leu Lys Asn Gly Glu

50 55 60

Arg Ile Glu Lys Val Glu His Ser Asp Leu Ser Phe Ser Lys Asp Trp

65 70 75 80

Ser Phe Tyr Leu Leu Tyr Tyr Thr Glu Phe Thr Pro Thr Glu Lys Asp

85 90 95

Glu Tyr Ala Cys Arg Val Asn His Val Thr Leu Ser Gln Pro Lys Ile

100 105 110

Val Lys Trp Asp Arg Asp Met Gly Gly Gly Gly Ser Gly Gly Gly Gly

115 120 125

Ser Gly Gly Gly Gly Ser Met Ala Pro Arg Thr Leu Val Leu Leu Leu

130 135 140

Ser Gly Ala Leu Ala Leu Thr Gln Thr Trp Ala Gly Ser His Ser Met

145 150 155 160

Arg Tyr Phe Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg

165 170 175

Phe Ile Ala Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp

180 185 190

Ser Asp Ala Ala Ser Gln Arg Met Glu Pro Arg Ala Pro Trp Ile Glu

195 200 205

Gln Glu Gly Pro Glu Tyr Trp Asp Gly Glu Thr Arg Lys Val Lys Ala

210 215 220

His Ser Gln Thr His Arg Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr

225 230 235 240

Asn Gln Ser Glu Ala Gly Ser His Thr Val Gln Arg Met Tyr Gly Cys

245 250 255

Asp Val Gly Ser Asp Trp Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala

260 265 270

Tyr Asp Gly Lys Asp Tyr Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp

275 280 285

Thr Ala Ala Asp Met Ala Ala Gln Thr Thr Lys His Lys Trp Glu Ala

290 295 300

Ala His Val Ala Glu Gln Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val

305 310 315 320

Glu Trp Leu Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg

325 330 335

Thr

<210> 64

<211> 358

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 64

Met Ala Pro Arg Thr Leu Val Leu Leu Leu Ser Gly Ala Leu Ala Leu

1 5 10 15

Thr Gln Thr Trp Ala Gly Ser His Ser Met Arg Tyr Phe Phe Thr Ser

20 25 30

Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe Ile Ala Val Gly Tyr

35 40 45

Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser Asp Ala Ala Ser Gln

50 55 60

Arg Met Glu Pro Arg Ala Pro Trp Ile Glu Gln Glu Gly Pro Glu Tyr

65 70 75 80

Trp Asp Gly Glu Thr Arg Lys Val Lys Ala His Ser Gln Thr His Arg

85 90 95

Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr Asn Gln Ser Glu Ala Gly

100 105 110

Ser His Thr Val Gln Arg Met Tyr Gly Cys Asp Val Gly Ser Asp Trp

115 120 125

Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala Tyr Asp Gly Lys Asp Tyr

130 135 140

Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp Thr Ala Ala Asp Met Ala

145 150 155 160

Ala Gln Thr Thr Lys His Lys Trp Glu Ala Ala His Val Ala Glu Gln

165 170 175

Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val Glu Trp Leu Arg Arg Tyr

180 185 190

Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr Ser Pro Lys Ala His

195 200 205

Val Thr His His Pro Arg Ser Lys Gly Glu Val Thr Leu Arg Cys Trp

210 215 220

Ala Leu Gly Phe Tyr Pro Ala Asp Ile Thr Leu Thr Trp Gln Leu Asn

225 230 235 240

Gly Glu Glu Leu Thr Gln Asp Met Glu Leu Val Glu Thr Arg Pro Ala

245 250 255

Gly Asp Gly Thr Phe Gln Lys Trp Ala Ser Val Val Val Pro Leu Gly

260 265 270

Lys Glu Gln Asn Tyr Thr Cys Arg Val Tyr His Glu Gly Leu Pro Glu

275 280 285

Pro Leu Thr Leu Arg Trp Glu Pro Pro Pro Ser Thr Asp Ser Tyr Met

290 295 300

Val Ile Val Ala Val Leu Gly Val Leu Gly Ala Met Ala Ile Ile Gly

305 310 315 320

Ala Val Val Ala Phe Val Met Lys Arg Arg Arg Asn Thr Gly Gly Lys

325 330 335

Gly Gly Asp Tyr Ala Leu Ala Pro Gly Ser Gln Ser Ser Glu Met Ser

340 345 350

Leu Arg Asp Cys Lys Ala

355

<210> 65

<211> 3690

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 65

atggccgtca tggcgccccg aaccctcgtc ctgctactct cgggggctct ggccctgacc 60

cagacctggg cgatccagcg tactccaaag attcaggttt actcacgtca tccagcagag 120

aatggaaagt caaatttcct gaattgctat gtgtctgggt ttcatccatc cgacattgaa 180

gttgacttac tgaagaatgg agagagaatt gaaaaagtgg agcattcaga cttgtctttc 240

agcaaggact ggtctttcta tctcttgtac tacactgaat tcacccccac tgaaaaagat 300

gagtatgcct gccgtgtgaa ccatgtgact ttgtcacagc ccaagatagt taagtgggat 360

cgagacatgg gaggtggcgg atccggcgga ggcggctcgg gtggcggcgg ctctggctct 420

cactccatga ggtatttctt cacatccgtg tcccggcccg gccgcgggga gccccgcttc 480

atcgcagtgg gctacgtgga cgacacgcag ttcgtgcggt tcgacagcga cgccgcgagc 540

cagaggatgg agccgcgggc gccgtggata gagcaggagg gtccggagta ttgggacggg 600

gagacacgga aagtgaaggc ccactcacag actcaccgag tggacctggg gaccctgcgc 660

ggctactaca accagagcga ggccggtgag tgaccccggc ccggggcgca ggtcacgacc 720

tctcatcccc cacggacggg ccaggtcgcc cacagtctcc gggtccgaga tccgccccga 780

agccgcggga ccccgagacc cttgccccgg gagaggccca ggcgccttta cccggtttca 840

ttttcagttt aggccaaaaa tccccccagg ttggtcgggg cggggcgggg ctcgggggac 900

cgggctgacc gcggggtccg ggccaggttc tcacaccgtc cagaggatgt atggctgcga 960

cgtggggtcg gactggcgct tcctccgcgg gtaccaccag tacgcctacg acggcaagga 1020

ttacatcgcc ctgaaagagg acctgcgctc ttggaccgcg gcggacatgg cagctcagac 1080

caccaagcac aagtgggagg cggcccatgt ggcggagcag ttgagagcct acctggaggg 1140

cacgtgcgtg gagtggctcc gcagatacct ggagaacggg aaggagacgc tgcagcgcac 1200

gggtaccagg ggccacgggg cgcctccctg atcgcctgta gatctcccgg gctggcctcc 1260

cacaaggagg ggagacaatt gggaccaaca ctagaatatc gccctccctc tggtcctgag 1320

ggagaggaat cctcctgggt ttccagatcc tgtaccagag agtgactctg aggttccgcc 1380

ctgctctctg acacaattaa gggataaaat ctctgaagga atgacgggaa gacgatccct 1440

cgaatactga tgagtggttc cctttgacac acacaggcag cagccttggg cccgtgactt 1500

ttcctctcag gccttgttct ctgcttcaca ctcaatgtgt gtgggggtct gagtccagca 1560

cttctgagtc cttcagcctc cactcaggtc aggaccagaa gtcgctgttc cctcttcagg 1620

gactagaatt ttccacggaa taggagatta tcccaggtgc ctgtgtccag gctggtgtct 1680

gggttctgtg ctcccttccc catcccaggt gtcctgtcca ttctcaagat agccacatgt 1740

gtgctggagg agtgtcccat gacagatgca aaatgcctga atgatctgac tcttcctgac 1800

agacgccccc aaaacgcata tgactcacca cgctgtctct gaccatgaag ccaccctgag 1860

gtgctgggcc ctgagcttct accctgcgga gatcacactg acctggcagc gggatgggga 1920

ggaccagacc caggacacgg agctcgtgga gaccaggcct gcaggggatg gaaccttcca 1980

gaagtgggcg gctgtggtgg tgccttctgg acaggagcag agatacacct gccatgtgca 2040

gcatgagggt ttgcccaagc ccctcaccct gagatggggt aaggagggag acgggggtgt 2100

catgtctttt agggaaagca ggagcctctc tgacctttag cagggtcagg gcccctcacc 2160

ttcccctctt ttcccagagc cgtcttccca gcccaccatc cccatcgtgg gcatcattgc 2220

tggcctggtt ctctttggag ctgtgatcac tggagctgtg gtcgctgctg tgatgtggag 2280

gaggaagagc tcaggtgggg aaggggtgaa gggtgggtct gagatttctt gtctcactga 2340

gggttccaag acccaggtag aagtgtgccc tgcctcgtta ctgggaagca ccacccacaa 2400

ttatgggcct acccagcctg ggccctgtgt gccagcactt actcttttgt aaagcacctg 2460

ttaaaatgaa ggacagattt atcaccttga ttacagcggt gatgggacct gatcccagca 2520

gtcacaagtc acaggggaag gtccctgagg accttcagga gggcggttgg tccaggaccc 2580

acacctgctt tcttcatgtt tcctgatccc gccctgggtc tgcagtcaca catttctgga 2640

aacttctctg aggtccaaga cttggaggtt cctctaggac cttaaggccc tgactccttt 2700

ctggtatctc acaggacatt ttcttcccac agatagaaaa ggagggagct actctcaggc 2760

tgcaagtaag tatgaaggag gctgatgcct gaggtccttg ggatattgtg tttgggagcc 2820

catgggggag ctcacccacc ccacaattcc tcctctagcc acatcttctg tgggatctga 2880

ccaggttctg tttttgttct accccaggca gtgacagtgc ccagggctct gatgtgtctc 2940

tcacagcttg taaaggtgag agcctggagg gcctgatgtg tgttgggtgt tgggcggaac 3000

agtggacaca gctgtgctat ggggtttctt tccattggat gtattgagca tgcgatgggc 3060

tgtttaaagt gtgacccctc actgtgacag atacgaattt gttcatgaat atttttttct 3120

atagtgtgag acagctgcct tgtgtgggac tgagaggcaa gagttgttcc tgcccttccc 3180

tttgtgactt gaagaaccct gactttgttt ctgcaaaggc acctgcatgt gtctgtgttc 3240

gtgtaggcat aatgtgagga ggtggggaga ccaccccacc cccatgtcca ccatgaccct 3300

cttcccacgc tgacctgtgc tccctcccca atcatctttc ctgttccaga gaggtggggc 3360

tgaggtgtct ccatctctgt ctcaacttca tggtgcactg agctgtaact tcttccttcc 3420

ctattaaaat tagaacctga gtataaattt actttctcaa attcttgcca tgagaggttg 3480

atgagttaat taaaggagaa gattcctaaa atttgagaga caaaataaat ggaacacatg 3540

agaaccttcc agagtccacg tgttgcttat gctgatttgt tgcaggggag gagagtagat 3600

ggggctgtgc ccagtttctg ttccggccac tatgggcttt atgtggtcac tgcttggctg 3660

ggtcatcttt gctgctccat tgtccttggc 3690

<210> 66

<211> 119

<212> PRT

<213> 大鼠(Rat)

<400> 66

Met Ala Arg Ser Val Thr Val Ile Phe Leu Val Leu Val Ser Leu Ala

1 5 10 15

Val Val Leu Ala Ile Gln Lys Thr Pro Gln Ile Gln Val Tyr Ser Arg

20 25 30

His Pro Pro Glu Asn Gly Lys Pro Asn Phe Leu Asn Cys Tyr Val Ser

35 40 45

Gln Phe His Pro Pro Gln Ile Glu Ile Glu Leu Leu Lys Asn Gly Lys

50 55 60

Lys Ile Pro Asn Ile Glu Met Ser Asp Leu Ser Phe Ser Lys Asp Trp

65 70 75 80

Ser Phe Tyr Ile Leu Ala His Thr Glu Phe Thr Pro Thr Glu Thr Asp

85 90 95

Val Tyr Ala Cys Arg Val Lys His Val Thr Leu Lys Glu Pro Lys Thr

100 105 110

Val Thr Trp Asp Arg Asp Met

115

<210> 67

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 67

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

<210> 68

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 68

Gly Gly Gly Gly Ser

1 5

Claims

1.一种MHC分子人源化的非人动物的构建方法，其特征在于，所述的非人动物体内表达MHC嵌合蛋白，所述的MHC嵌合蛋白包含1)人或人源化B2M蛋白；和/或，2)MHC嵌合α链。

2.根据权利要求1所述的构建方法，其特征在于，所述的非人动物体内内源B2M蛋白表达降低或缺失。

3.根据权利要求1或2所述的构建方法，其特征在于，所述的MHC嵌合α链包含HLA-A2.1蛋白的Alpha-1、Alpha-2区域；优选还包含信号肽；进一步优选的，还包含Alpha-3、连接肽、胞内区和/或跨膜区；更进一步优选的，所述的MHC嵌合α链的氨基酸序列包含下列组中的一种：

4.根据权利要求1-3任一所述的构建方法，其特征在于，所述的人或人源化B2M蛋白的氨基酸序列包含下列组中的一种：

a)SEQ ID NO：4或SEQ ID NO：4第21-119位所示的氨基酸序列；

5.根据权利要求1-4任一所述的构建方法，其特征在于，所述的MHC嵌合蛋白还包含非人动物H2-D1蛋白的跨膜区和/或胞内区；优选还包含Alpha-3和/或连接肽；进一步优选的，包含下列组中的一种：

1)SEQ ID NO：6第207-362位所示氨基酸序列；

6.根据权利要求1-5任一所述的构建方法，其特征在于，所述的MHC嵌合蛋白包含人B2M蛋白的全部或部分，和人HLA蛋白的全部或部分；优选的，所述的人B2M蛋白的全部或部分的氨基酸序列与人HLA蛋白的全部或部分的氨基酸序列直接连接或通过具有连接功能的接头蛋白连接；进一步优选的，所述的MHC嵌合蛋白的氨基酸序列包含下列组中的一种：

7.根据权利要求1-6任一所述的构建方法，其特征在于，所述的非人动物的基因组中包含MHC嵌合基因，所述的MHC嵌合基因包含人或人源化B2M基因，和/或，MHC嵌合α链基因。

8.根据权利要求7所述的构建方法，其特征在于，所述的MHC嵌合α链基因包含编码HLA-A2.1蛋白Alpha-1、Alpha-2区域的核苷酸序列，优选还包含编码信号肽的核苷酸序列，进一步优选还包含编码Alpha-3、连接肽、胞内区和/或跨膜区的核苷酸序列；或者，所述的MHC嵌合α链基因包含人HLA基因的外显子2至外显子3的编码序列，优选的，还包含外显子1的编码序列，进一步优选还包含外显子4至外显子8的编码序列；

优选的，所述MHC嵌合α链基因的核苷酸序列包含下列组中的一种：

(A)SEQ ID NO：15、SEQ ID NO：13或SEQ ID NO：54所示核苷酸序列；

9.根据权利要求7或8所述的构建方法，其特征在于，所述的人源化B2M基因包含编码人B2M蛋白的核苷酸序列或者人B2M基因的外显子1至外显子3的编码序列；优选的，所述的人源化B2M基因包含下列组中的一种：

(a)SEQ ID NO：14所示核苷酸序列；

(b)与SEQ ID NO：14所示的核苷酸序列的同一性至少为90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％；

(c)与SEQ ID NO：14所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸；

(d)具有SEQ ID NO：14所示的核苷酸序列所示的，包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

10.根据权利要求7-9任一所述的构建方法，其特征在于，所述的MHC嵌合基因还包含非人动物H2-D1基因的外显子4至外显子8的编码序列或者编码非人动物H2-D1蛋白的Alpha-3、连接肽、胞内区和/或跨膜区的核苷酸序列，优选包含下列组中的一种：

(1)SEQ ID NO：16所示核苷酸序列；

11.根据权利要求7-10任一所述的构建方法，其特征在于，所述MHC嵌合基因包含人B2M基因的部分，和人HLA基因的部分；优选的，所述的人B2M基因的部分的核苷酸序列与人HLA基因的部分的核苷酸序列直接连接或通过编码具有连接功能的接头蛋白的核苷酸序列连接，优选的，所述的MHC嵌合基因编码所述的MHC嵌合蛋白，进一步优选的，所述的MHC嵌合基因的核苷酸序列包含下列组中的一种：

(I)SEQ ID NO：10或SEQ ID NO：65所示序列；

(II)转录的mRNA序列为SEQ ID NO：9或SEQ ID NO：52所示序列；

12.根据权利要求1-11任一所述的构建方法，其特征在于，将MHC嵌合基因可操作的连接在非人动物B2M或H2-D1基因座上；

优选的，将MHC嵌合基因插入非人动物B2M基因外显子1上或者替换非人动物B2M基因外显子1至外显子4的核苷酸序列的全部或部分；优选为替换非人动物B2M基因外显子1至外显子3的核苷酸序列；

优选的，将MHC嵌合基因插入非人动物H2-D1基因座上或替换非人动物H2-D1基因外显子1至外显子3的核苷酸序列或者替换非人动物H2-D1基因外显子1至外显子8的核苷酸序列。

13.根据权利要求1-12任一所述的构建方法，其特征在于，将体内表达人或人源化B2M蛋白的非人动物与体内表达MHC嵌合α链的非人动物交配或者体外授精；

或者，提供体内表达人或人源化B2M蛋白的非人动物，将包含MHC嵌合α链基因的核苷酸序列导入非人动物B2M或H2-D1基因座；

14.根据权利要求1-13任一所述的构建方法，其特征在于，使用B2M基因的靶向载体或H2-D1基因的靶向载体，和/或sgRNA进行非人动物的构建，

所述的B2M基因的靶向载体包含MHC嵌合基因或人源化B2M基因，优选还包含5’臂和/或3’臂，所述的5’臂或3’臂与NCBI登录号为NC_000068.7至少具有90％同源性的核苷酸，优选自B2M基因基因组DNA的100-10000个长度的核苷酸，进一步优选的，所述5’臂如SEQ ID NO：11或SEQ ID NO：60所示，所述的3’臂如SEQ ID NO：12或SEQ ID NO：53所示；

所述的H2-D1基因的靶向载体包含MHC嵌合基因或人HLA基因的外显子1至外显子3与非人动物H2-D1基因的外显子4至外显子8的编码序列，优选还包含5’臂和/或3’臂，所述的5’臂或3’臂与NCBI登录号为NC_000083.6至少具有90％同源性的核苷酸，优选自H2-D1基因基因组DNA的100-10000个长度的核苷酸；

15.一种MHC嵌合蛋白，其特征在于，所述的MHC嵌合蛋白包含人或人源化B2M蛋白，和/或MHC嵌合α链；

优选的，所述的MHC嵌合α链包含人HLA蛋白Alpha-1、Alpha-2区域，进一步优选还包含信号肽，更进一步优选还包含Alpha-3、连接肽、胞内区和/或跨膜区，再进一步优选的，包含SEQ ID NO：59、SEQ ID NO：8、SEQ ID NO：59第1-203位或SEQ ID NO：59第22-203位所示的氨基酸序列；

优选的，所述的人或人源化B2M蛋白包含SEQ ID NO：4或SEQ ID NO：4第21-119位所示的氨基酸序列。

16.根据权利要求15所述的MHC嵌合蛋白，其特征在于，所述的MHC嵌合蛋白还包括非人动物H2-D1蛋白的的跨膜区和/或胞内区；优选还包含Alpha-3和/或连接肽，进一步优选包含SEQ ID NO：6第207-362位所示氨基酸序列。

17.根据权利要求15或16所述的MHC嵌合蛋白，其特征在于，所述的人或人源化B2M蛋白的氨基酸序列与MHC嵌合α链的氨基酸序列直接连接或通过具有连接功能的接头蛋白连接；进一步优选的，所述的MHC嵌合蛋白的氨基酸序列包含下列组中的一种：

I)SEQ ID NO：61、SEQ ID NO：62、SEQ ID NO：63或SEQ ID NO：64所示氨基酸序列；

18.一种嵌合基因，其特征在于，所述的嵌合基因包含人或人源化B2M基因，和/或，MHC嵌合α链基因；

优选的，所述的MHC嵌合α链基因包含人HLA基因的外显子2至外显子3的编码序列，进一步优选的，还包含外显子1的编码序列，更进一步优选还包含外显子4至外显子8的编码序列；再进一步优选的，包含SEQ ID NO：15、SEQ ID NO：13或SEQ ID NO：54所示核苷酸序列；

优选的，所述的人或人源化B2M基因包含人B2M基因的外显子1至外显子3的编码序列；进一步优选的，包含SEQ ID NO：14所示核苷酸序列。

19.根据权利要求18所述的嵌合基因，其特征在于，所述的嵌合基因还包含非人动物H2-D1基因的外显子4至外显子8的编码序列，优选包含SEQ ID NO：16所示核苷酸序列。

20.根据权利要求18-19任一所述的嵌合基因，其特征在于，所述嵌合基因包含人B2M基因的部分，和人HLA基因的部分；优选的，所述的人B2M基因的部分的核苷酸序列与人HLA基因的部分的核苷酸序列直接连接或通过编码具有连接功能的接头蛋白的核苷酸序列连接；进一步优选的，所述的嵌合基因编码权利要求15-17任一所述的MHC嵌合蛋白，更进一步优选的，所述的嵌合基因的核苷酸序列包含下列组中的一种：

(I)SEQ ID NO：10或SEQ ID NO：65所示序列；

(II)转录的mRNA序列为SEQ ID NO：9或SEQ ID NO：52所示序列；

21.一种B2M基因的靶向载体，其特征在于，所述的靶向载体包含权利要求18-20任一所述的嵌合基因。

22.根据权利要求21所述的靶向载体，其特征在于，所述的靶向载体还包含5’臂和/或3’臂，所述的5’臂或3’臂选自B2M基因基因组DNA的100-10000个长度的核苷酸；优选的，与NCBI登录号为NC_000068.7至少具有90％同源性的核苷酸；进一步优选的，所述5’臂序列如SEQ ID NO：11或SEQ ID NO：60所示，所述3’臂序列如SEQ ID NO：12或SEQ ID NO：53所示。

23.一种靶向B2M基因的sgRNA，其特征在于，所述的sgRNA靶向非人动物B2M基因，优选的，所述sgRNA在非人动物B2M基因的靶位点位于非人动物B2M基因的外显子1、外显子1-2的内含子、外显子3或外显子3-4的内含子上，进一步优选的，所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO：17-23任一项所示，3’端靶位点序列如SEQ ID NO：24-31任一项所示。

24.一种多基因修饰的非人动物的构建方法，其特征在于，包括如下步骤：

i)采用权利要求1-14任一所述的构建方法获得的非人动物；

ii)将步骤i)获得的非人动物与其他基因修饰的非人动物交配、体外授精或直接进行基因编辑，并进行筛选，得到多基因修饰的非人动物。

25.根据权利要求24所述的构建方法，其特征在于，所述的其他基因修饰的非人动物包括基因HLA-B、HLA-C、H-2K、H-2L等人源化的非人动物。

26.一种MHC分子人源化的细胞、组织、器官或荷瘤后的瘤组织，其特征在于，所述的细胞、组织、器官或荷瘤后的瘤组织表达权利要求15-17任一所述的MHC嵌合蛋白，优选的，所述的细胞中内源B2M蛋白表达降低或缺失；进一步优选的，所述的细胞的基因组中包含权利要求18-20任一所述的嵌合基因。

27.根据权利要求1-14、16-17、19-20和23任一所述的构建方法、MHC嵌合蛋白、嵌合基因或sgRNA，其特征在于，所述的非人动物为非人哺乳动物，优选的，所述的非人哺乳动物为啮齿类动物，更优选的，所述的啮齿类动物为小鼠或大鼠或免疫缺陷鼠。

28.来源于权利要求1-14任一所述构建方法获得的非人动物、权利要求15-17任一所述的MHC嵌合蛋白、权利要求18-20任一所述的嵌合基因、权利要求24-25任一所述的构建方法获得的多基因修饰的非人动物、权利要求26所述的细胞、组织、器官或荷瘤后的瘤组织在需要涉及人类细胞的免疫过程的产品开发，制造人类抗体、疫苗，或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用；或者在生产和利用动物实验疾病模型，用于人源细胞移植、免疫系统重建、病原学研究；优选的，所述的应用为人造血干细胞的形成、功能研究和/或构建疾病模型；或者在筛选、验证、评价或研究MHC功能、人MHC信号机理、靶向人的抗体、疫苗、靶向人的药物、药效，免疫相关疾病药物以及抗肿瘤或抗炎症药物，筛选和评估人用药及药效研究方面的应用。