CN113105555A - Mhc分子人源化的非人动物的构建方法及应用 - Google Patents

Mhc分子人源化的非人动物的构建方法及应用 Download PDF

Info

Publication number
CN113105555A
CN113105555A CN202110026238.1A CN202110026238A CN113105555A CN 113105555 A CN113105555 A CN 113105555A CN 202110026238 A CN202110026238 A CN 202110026238A CN 113105555 A CN113105555 A CN 113105555A
Authority
CN
China
Prior art keywords
seq
human
gene
protein
mhc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110026238.1A
Other languages
English (en)
Other versions
CN113105555B (zh
Inventor
沈月雷
郭朝设
张美玲
黄蕤
郭雅南
白阳
姚佳维
尚诚彰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baccetus Beijing Pharmaceutical Technology Co ltd
Original Assignee
Baccetus Beijing Pharmaceutical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baccetus Beijing Pharmaceutical Technology Co ltd filed Critical Baccetus Beijing Pharmaceutical Technology Co ltd
Publication of CN113105555A publication Critical patent/CN113105555A/zh
Application granted granted Critical
Publication of CN113105555B publication Critical patent/CN113105555B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/027New breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/027New breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Humanized animals, e.g. knockin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/70539MHC-molecules, e.g. HLA-molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0331Animal model for proliferative diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/035Animal model for multifactorial diseases
    • A01K2267/0368Animal model for inflammation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • C12N2015/8518Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic expressing industrially exogenous proteins, e.g. for pharmaceutical use, human insulin, blood factors, immunoglobulins, pseudoparticles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

本发明提供了一种MHC分子人源化的非人动物的构建方法,利用基因编辑的方式将编码人MHC I类分子的核苷酸序列导入非人动物基因组中,从而构建出MHC分子人源化改造非人动物。本发明还提供了一种MHC嵌合蛋白、嵌合基因及制备MHC分子人源化改造非人动物使用的靶向载体、sgRNA等。本发明制备的MHC分子人源化改造非人动物体内能正常表达人源化MHC I类分子,可以作为人MHC I类分子信号机理研究、以及人类免疫系统多个方面研究,对免疫相关的新药研发具有重要的应用价值。

Description

MHC分子人源化的非人动物的构建方法及应用
技术领域
本发明属于动物基因工程和基因遗传修饰技术领域,具体地说,涉及一种基因修饰的非人动物,其表达一种人或人源化的主要组织相容性复合物分子(MHC),特别是人或人源化MHC I类分子改造非人动物的构建方法及其在生物医药领域的应用。
背景技术
主要组织相容性复合体(major histocompatibility complex,MHC)是一组编码哺乳动物主要组织相容性抗原的基因群的统称。由于MHC的多基因特性,依据其编码分子的结构、组织分布与功能差异,可分为MHC I类、MHC II类、MHC III类基因,分别编码MHC I类分子、MHC II类分子、MHC III类分子。人类的MHC也称HLA(human leukocyte antigen)复合体;小鼠的MHC则被称为H2复合体,其中H2-D1属于小鼠MHC I类分子。人类MHC I类分子是由α、β两条链组成的异二聚体(如图1所示),根据其在细胞上的分布,可以分为胞外区、跨膜区和胞内区,氨基端游离于细胞膜外,羧基端位于胞质内。其α链的膜外区肽段根据不同的空间构象折叠成三个功能区,即α1区、α2区、α3区。其中,α1区、α2区的氨基酸顺序变化较大,是多态性部位,α3区较为保守,其结构与免疫球蛋白超家族分子相似,具有种属特异性,是与CD8分子结合的部位;轻链β2m(B2M)则以非共价形式与α3区结合,附着于保守的免疫球蛋白样区域,虽然不直接参与MHC I类分子的抗原呈递,但它能促进内质网中新合成的MHC I类分子向细胞表面运输,并对MHC I类分子的结构稳定和在细胞表面的表达具有辅助作用。MHC I类分子具有参与免疫应答、免疫调节和T淋巴细胞发育等生物学功能,在抗原递呈和T细胞识别抗原过程中起着关键作用,可与抗原分子结合形成抗原MHC复合物,经由DC细胞(Dendritic Cells,树突状细胞)递呈给CTL细胞(cytotoxic lymphocyte,细胞毒性T淋巴细胞),被CTL细胞表面TCR受体识别和结合,激活特异性CTL的杀伤性。此外,还可以作为KIR(Killer Ig-like receptor,NK细胞受体)的配体,参与自身耐受的维持,在器官移植、抗感染免疫及自身免疫疾病防治方面发挥着重要的作用。
HLA-A2是发现最早、在人群中携带频率最高的MHC I类分子,分布于几乎所有有核细胞表面,包括一组结构功能相似的高度多态的等位基因产物。其中,HLA-A2.1是中国人群中最为常见,阳性率高达50%。基于HLA-A2在肿瘤抗原递呈和T细胞抗原识别中的重要作用,目前已经报道了许多种肿瘤抗原肽-HLA-A2疫苗相关研究,例如用于治疗胃癌的MAGE3-HLA-A2肽疫苗(邵莹等,中国肿瘤生物治疗杂志,2000(4).)、用于结核病治疗的药物外排抗原-HLA-A2多表位疫苗(陈飞,郑州大学,2012)、用于疟疾治疗的TR26-HLA-A2.1疫苗(唐玉阳等,基础医学与临床,2000,20(3))等。此外,轻链β2m可能还与一些淀粉样蛋白疾病相关,如阿尔兹海默症(Alzheimer disease)、血液透析相关淀粉样变性(HRA)和威尔逊氏病(Wilsonsdisease,WD),还有研究表明β2m基因缺陷与肿瘤及治疗性抗体如PD-1抗体的耐药性相关(Zaretsky JM et al.N Engl J Med.2016.Sep 1;375(9):819-29)。
实验动物疾病模型对于研究人类疾病发生的病因、发病机制、开发防治技术和开发药物是不可缺少的研究工具。其中,免疫缺陷动物由于缺乏免疫力,容易接受异种细胞或组织,在组织或细胞人源化动物研究、肿瘤药物及其他疾病的治疗机理方面已经得到广泛应用。已有研究表明作为受体鼠,目前普遍使用的免疫缺陷动物排序如下:NOD-PrkdcscidIL-2rγnul小鼠〉NOD-Rag 1-/--IL2rg-/-(NRG)〉Rag 2-/--IL2rg-/-(RG)〉NOD/SCID〉裸鼠,表明NOD-Prkdcscid IL-2rγnul小鼠是目前最佳的移植受体鼠(Ito R et al.Cell MolImmunol.2012May;9(3):208-14)。其中,NOD-Prkdcscid IL-2rγnull小鼠机体免疫功能严重缺陷,对人源细胞和组织几乎没有排斥反应,少量细胞即可成瘤(依赖于细胞系或细胞类型),同时也没有B淋巴细胞泄漏,是最适合人源细胞或组织移植的工具小鼠,并已广泛用于新的人源化小鼠模型的研发。然而,上述免疫缺陷小鼠仍存在一定的缺陷和局限性,由于免疫缺陷小鼠的MHC仍然是H2分子,在移植人类细胞或组织后,人源细胞在小鼠胸腺中无法获得人HLA分子限制性,在进行免疫治疗或特定病原体感染后无法体现人类MHC限制性免疫反应的特征;同时,移植的人T、B淋巴细胞在免疫缺陷小鼠体内无法获得功能上完全的成熟,这也是现有的免疫缺陷小鼠模型需要完善的方面之一。
百奥赛图已成功制备NOD-PrkdcscidIL-2rγnull小鼠(命名为B-NDG小鼠),为进一步优化已有模型,完善当前免疫缺陷小鼠存在的不足,解决临床转化方面的需求,本发明旨在提供一种B2M和HLA人源化小鼠模型,为肿瘤、移植排斥、病原感染等发病机理、预防及治疗药物筛选等提供稳定、高效的临床前实验动物模型。
发明内容
本发明的第一方面,提供了一种MHC分子人源化的非人动物的构建方法,所述的非人动物体内表达1)人或人源化B2M蛋白;和/或,2)MHC嵌合α链。
优选的,所述的非人动物体内内源B2M蛋白表达降低或缺失。
优选的,所述的非人动物体内表达MHC嵌合蛋白,所述的MHC嵌合蛋白包含人B2M蛋白的全部或部分,和/或人HLA蛋白的全部或部分。
优选的,所述的MHC嵌合α链或者所述的人HLA蛋白的部分包含HLA-A2.1蛋白的胞外区的全部或部分。
优选的,所述的MHC嵌合α链或者所述的人HLA蛋白的部分包含HLA-A2.1蛋白的Alpha-1、Alpha-2区域。进一步优选还包含信号肽。更进一步优选的,还包含Alpha-3、连接肽、胞内区和/或跨膜区。
在本发明的一个具体实施方式中,所述的MHC嵌合α链或人HLA蛋白的部分的氨基酸序列包含下列组中的一种:
A)SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示的氨基酸序列;
B)与SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
D)与SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人或人源化B2M蛋白或所述的人B2M蛋白的部分的氨基酸序列包含下列组中的一种:
a)SEQ ID NO:4或SEQ ID NO:4第21-119位所示的氨基酸序列;
b)与SEQ ID NO:4或SEQ ID NO:4第21-119位所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)与SEQ ID NO:4或SEQ ID NO:4第21-119位所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
d)与SEQ ID NO:4或SEQ ID NO:4第21-119位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的MHC嵌合蛋白还包含非人动物H2-D1蛋白的跨膜区和/或胞内区。进一步优选还包含Alpha-3和/或连接肽。更进一步优选的,包含下列组中的一种:
1)SEQ ID NO:6第207-362位所示氨基酸序列的全部或部分;
2)与SEQ ID NO:6第207-362位所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
3)与SEQ ID NO:6第207-362位所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
4)与SEQ ID NO:6第207-362位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的MHC嵌合蛋白包含人B2M蛋白的全部或部分,和人HLA蛋白的全部或部分。其中所述的人B2M蛋白的全部或部分的氨基酸序列与人HLA蛋白的全部或部分的氨基酸序列直接连接或通过具有连接功能的接头蛋白连接。
优选的,所述的MHC嵌合蛋白含有从N末端侧依次连接有HLA-A2.1蛋白的信号肽、人B2M蛋白、HLA-A2.1蛋白的Alpha-1、Alpha-2区域以及非人动物H2-D1蛋白的Alpha-3、连接肽、跨膜区和胞内区。其中,所述的人B2M蛋白不含信号肽区域。
优选的,所述的MHC嵌合蛋白的氨基酸序列包含下列组中的一种:
I)SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示的氨基酸序列;
II)与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
III)与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
IV)与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的非人动物的基因组中包含MHC嵌合基因,所述的MHC嵌合基因包含人或人源化B2M基因,和/或,MHC嵌合α链基因。进一步优选的,所述的非人动物的基因组中包含MHC嵌合基因,所述的MHC嵌合基因包含人B2M基因的部分和/或人HLA基因的部分。
优选的,所述的MHC嵌合α链基因或人HLA基因的部分包含编码胞外区的全部或部分核苷酸序列。
优选的,所述的MHC嵌合α链基因或人HLA基因的部分包含编码HLA-A2.1蛋白Alpha-1、Alpha-2区域的核苷酸序列,优选还包含编码信号肽的核苷酸序列,进一步优选还包含编码Alpha-3、连接肽、胞内区和/或跨膜区的核苷酸序列;或者,所述的MHC嵌合α链基因或人HLA基因的部分包含人HLA基因的外显子2至外显子3的编码序列,优选的,还包含外显子1的编码序列,进一步优选还包含外显子4至外显子8的编码序列。
优选的,所述的MHC嵌合α链基因或人HLA基因的部分的核苷酸序列包含下列组中的一种:
(A)SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示核苷酸序列的全部或部分;
(B)与SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(C)与SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
(D)具有SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化B2M基因或人B2M基因的部分包含编码人B2M蛋白的核苷酸序列或者人B2M基因的外显子1至外显子3的编码序列。进一步优选的,所述的人源化B2M基因或人B2M基因的部分包含下列组中的一种:
(a)SEQ ID NO:3或14所示核苷酸序列的全部或部分;
(b)与SEQ ID NO:3或14所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(c)与SEQ ID NO:3或14所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
(d)具有SEQ ID NO:3或14所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的MHC嵌合基因还包含非人动物H2-D1基因的外显子4至外显子8的编码序列或者编码非人动物H2-D1蛋白的Alpha-3、连接肽、胞内区和/或跨膜区的核苷酸序列。进一步优选包含下列组中的一种:
(1)SEQ ID NO:16所示核苷酸序列的全部或部分;
(2)与SEQ ID NO:16所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(3)与SEQ ID NO:16所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
(4)具有SEQ ID NO:16所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述MHC嵌合基因包含人B2M基因的或部分,和人HLA基因的部分。进一步优选的,所述的人B2M基因的部分的核苷酸序列与人HLA基因的部分的核苷酸序列直接连接或通过编码具有连接功能的接头蛋白的核苷酸序列连接。更优选的,所述的MHC嵌合基因编码所述的MHC嵌合蛋白。
优选的,所述的MHC嵌合基因含有从5’至3’依次为编码HLA-A2.1蛋白的信号肽、人B2M蛋白、HLA-A2.1蛋白的Alpha-1、Alpha-2区域以及非人动物H2-D1蛋白的Alpha-3、连接肽、跨膜区和胞内区的核苷酸序列。其中,所述的人B2M蛋白不含信号肽区域。
更进一步优选的,所述的MHC嵌合基因的核苷酸序列包含下列组中的一种:
(I)SEQ ID NO:10或SEQ ID NO:65所示序列;
(II)转录的mRNA序列为SEQ ID NO:9或SEQ ID NO:52所示序列;
(III)与SEQ ID NO:10、SEQ ID NO:65、SEQ ID NO:9或SEQ ID NO:52所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(IV)与SEQ ID NO:10、SEQ ID NO:65、SEQ ID NO:9或SEQ ID NO:52所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或,
(V)具有SEQ ID NO:10、SEQ ID NO:65、SEQ ID NO:9或SEQ ID NO:52所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的构建方法包括将MHC嵌合基因可操作的连接在非人动物B2M或H2-D1基因座上。
进一步优选的,将MHC嵌合基因插入非人动物B2M基因外显子1上或者替换非人动物B2M基因外显子1至外显子4的核苷酸序列;优选为替换非人动物B2M基因外显子1至外显子3的核苷酸序列。
进一步优选的,将MHC嵌合基因插入非人动物H2-D1基因座上、替换非人动物H2-D1基因外显子1至外显子3的核苷酸序列或者替换非人动物H2-D1基因外显子1至外显子8的核苷酸序列。
优选的,将体内表达人或人源化B2M蛋白的非人动物与体内表达MHC嵌合α链的非人动物交配或者体外授精。
或者,提供体内表达人或人源化B2M蛋白的非人动物,将包含MHC嵌合α链基因的核苷酸序列导入非人动物B2M或H2-D1基因座。
或者,提供体内表达MHC嵌合α链的非人动物,将包含人或人源化B2M基因的核苷酸序列导入非人动物B2M或H2-D1基因座。
优选的,使用B2M基因的靶向载体或H2-D1基因的靶向载体,和/或sgRNA进行非人动物的构建。
所述的B2M基因的靶向载体包含MHC嵌合基因或人源化B2M基因或人B2M基因的部分,优选还包含5’臂和/或3’臂,所述的5’臂或3’臂与NCBI登录号为NC_000068.7至少具有90%同源性的核苷酸,优选自B2M基因基因组DNA的100-10000个长度的核苷酸,进一步优选的,所述5’臂如SEQ ID NO:11或SEQ ID NO:60所示,所述的3’臂如SEQ ID NO:12或SEQ IDNO:53所示。
所述的H2-D1基因的靶向载体包含MHC嵌合基因、人HLA基因的部分或人HLA基因的外显子1至外显子3与非人动物H2-D1基因的外显子4至外显子8的编码序列,优选还包含5’臂和/或3’臂,所述的5’臂或3’臂与NCBI登录号为NC_000083.6至少具有90%同源性的核苷酸,优选自H2-D1基因基因组DNA的100-10000个长度的核苷酸。
所述的sgRNA在非人动物B2M基因的靶位点位于非人动物B2M基因的外显子1、外显子1-2的内含子、外显子3或外显子3-4的内含子上,优选的,所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO:17-23任一项所示,3’端靶位点序列如SEQ ID NO:24-31任一项所示。
本发明的第二方面,提供了一种MHC嵌合蛋白,所述的MHC嵌合蛋白包含人MHC I蛋白的全部或部分。所述的MHC嵌合蛋白包含人B2M蛋白的全部或部分,和/或人HLA蛋白的全部或部分。所述的MHC嵌合蛋白包含人或人源化B2M蛋白,和/或MHC嵌合α链。
优选的,所述的HLA为HLA I类。进一步优选的,所述的HLA I类为HLA-A。再进一步优选的,所述的HLA选自HLA-A2、HLA-A24、HLA-A3、HLA-A31。
在本发明的一个具体实施方式中,所述的HLA选自HLA-A2.1、HLA-A24.2、HLA-A3.1、HLA-A31.1。
优选的,所述的MHC嵌合蛋白还包括非人动物H2-D1蛋白的全部或部分。
优选的,所述的MHC嵌合蛋白的氨基酸序列连续5-119个氨基酸与人B2M蛋白的氨基酸序列一致。进一步优选的,所述的MHC嵌合蛋白的氨基酸序列连续10-100个氨基酸与人B2M蛋白的氨基酸序列一致。
在本发明的一个具体实施方式中,所述的MHC嵌合蛋白的氨基酸序列连续20、50、80、99、100、119个氨基酸与人B2M蛋白的氨基酸序列一致。
优选的,所述的MHC嵌合蛋白的氨基酸序列连续5-362个氨基酸与人HLA蛋白的氨基酸序列一致。进一步优选的,所述的MHC嵌合蛋白的氨基酸序列连续10-203个氨基酸与人HLA蛋白的氨基酸序列一致。更进一步优选的,所述的MHC嵌合蛋白的氨基酸序列连续10-100个氨基酸与人HLA蛋白的氨基酸序列一致。
在本发明的一个具体实施方式中,所述的MHC嵌合蛋白的氨基酸序列连续20、50、80、100、150、183、200、203、250、300、342、362个氨基酸与人HLA蛋白的氨基酸序列一致。
优选的,所述的MHC嵌合α链或人HLA蛋白的部分包含HLA-A2.1蛋白的胞外区的全部或部分。进一步优选的,所述的MHC嵌合α链或人HLA蛋白的部分包含HLA-A2.1蛋白的Alpha-1、Alpha-2区域;更进一步优选的,还包含信号肽。更进一步优选还包含Alpha-3、连接肽、胞内区和/或跨膜区。
在本发明的一个具体实施方式中,所述的MHC嵌合α链或人HLA蛋白的全部或部分氨基酸序列包含下列组中的一种:
A)SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示氨基酸序列的全部或部分;
B)与SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
D)与SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化B2M蛋白或人B2M蛋白的全部或部分氨基酸序列包含下列组中的一种:
a)SEQ ID NO:4或SEQ ID NO:4第21-119位所示氨基酸序列的全部或部分;
b)与SEQ ID NO:4或SEQ ID NO:4第21-119位所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)与SEQ ID NO:4或SEQ ID NO:4第21-119位所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
d)与SEQ ID NO:4或SEQ ID NO:4第21-119位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的非人动物H2-D1蛋白的部分包含非人动物H2-D1的跨膜区和/或胞内区。进一步优选的,所述的非人动物H2-D1蛋白的部分还包含Alpha-3和/或连接肽。
在本发明的一个具体实施方式中,所述的非人动物H2-D1蛋白的部分氨基酸序列包含下列组中的一种:
1)SEQ ID NO:6第207-362位所示氨基酸序列的全部或部分;
2)与SEQ ID NO:6第207-362位所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
3)与SEQ ID NO:6第207-362位所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
4)与SEQ ID NO:6第207-362位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人或人源化B2M蛋白的氨基酸序列与MHC嵌合α链的氨基酸序列直接连接或通过具有连接功能的接头蛋白连接。
优选的,所述的MHC嵌合蛋白包含人B2M蛋白和人HLA蛋白的全部或部分的连接。进一步优选的,所述的MHC嵌合蛋白包含人B2M蛋白和人HLA蛋白。再进一步优选的,所述的MHC嵌合蛋白包含人B2M蛋白和人HLA-A2.1的Alpha-1、Alpha-2区域。最为优选的,所述的MHC嵌合蛋白包含人HLA-A2.1的信号肽、人B2M蛋白和人HLA-A2.1的Alpha-1、Alpha-2区域。
优选的,所述的MHC嵌合蛋白包含人HLA蛋白的部分和非人动物H2-D1蛋白的部分。进一步优选的,所述的MHC嵌合蛋白包含人HLA-A2.1的Alpha-1、Alpha-2区域。再进一步优选的,所述的MHC嵌合蛋白包含人HLA-A2.1的信号肽。
优选的,所述的MHC嵌合蛋白包含人HLA-A2.1的Alpha-1、Alpha-2区域和非人动物H2-D1的Alpha-3、连接肽、跨膜区、胞内区。进一步优选的,所述的MHC嵌合蛋白包含人HLA-A2.1的信号肽、Alpha-1、Alpha-2区域和非人动物H2-D1的Alpha-3、连接肽、跨膜区、胞内区。
优选的,所述的MHC嵌合蛋白包含人B2M蛋白、人HLA蛋白的部分和非人动物H2-D1蛋白的部分。进一步优选的,所述的MHC嵌合蛋白包含人B2M蛋白、人HLA-A2.1的Alpha-1、Alpha-2区域和非人动物H2-D1的Alpha-3、连接肽、跨膜区、胞内区。再进一步优选的,所述的MHC嵌合蛋白包含人HLA-A2.1的信号肽、人B2M蛋白、人HLA-A2.1的Alpha-1、Alpha-2区域和非人动物H2-D1的Alpha-3、连接肽、跨膜区、胞内区。
在本发明的一个具体实施方式中,所述MHC嵌合蛋白包含人B2M蛋白的全部或部分,和人HLA蛋白的全部或部分。其中,所述的人B2M蛋白的全部或部分氨基酸序列与人HLA蛋白的全部或部分氨基酸序列直接连接或通过具有连接功能的接头蛋白连接。
进一步优选的,所述的接头蛋白为肽接头,其氨基酸数目和种类没有限定,只要可以连接人B2M蛋白的全部或部分氨基酸序列与人HLA蛋白的全部或部分氨基酸序列即可。最为优选的,所述的接头蛋白为柔性接头。
在本发明的一个具体实施方式中,所述的接头蛋白的氨基酸序列如SEQ ID NO:61第121-135位所示。
在本发明的一个具体实施方式中,所述的MHC嵌合蛋白的氨基酸序列包含下列组中的一种:
I)SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示氨基酸序列的全部或部分;
II)与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
III)与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
IV)与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
本发明的第三方面,提供了一种嵌合基因,所述的嵌合基因包含人B2M基因的部分,和/或人HLA基因的部分。所述的嵌合基因包含人或人源化B2M基因,和/或,MHC嵌合α链基因。
优选的,所述的HLA为HLA I类。进一步优选的,所述的HLA I类为HLA-A。再进一步优选的,所述的HLA选自HLA-A2、HLA-A24、HLA-A3、HLA-A31。
在本发明的一个具体实施方式中,所述的HLA选自HLA-A2.1、HLA-A24.2、HLA-A3.1、HLA-A31.1。
优选的,所述的嵌合基因还包含非人动物H2-D1基因的部分。
优选的,所述的嵌合基因编码的氨基酸序列连续5-119个氨基酸与人B2M蛋白的氨基酸序列一致。进一步优选的,所述的嵌合基因编码的氨基酸序列连续10-100个氨基酸与人B2M蛋白的氨基酸序列一致。
在本发明的一个具体实施方式中,所述的嵌合基因编码的氨基酸序列连续20、50、80、99、100、119个氨基酸与人B2M蛋白的氨基酸序列一致。
优选的,所述的嵌合基因编码的氨基酸序列连续5-362个氨基酸与人HLA蛋白的氨基酸序列一致。进一步优选的,所述的嵌合基因编码的氨基酸序列连续10-203个氨基酸与人HLA蛋白的氨基酸序列一致。更进一步优选的,所述的嵌合基因编码的氨基酸序列连续10-100个氨基酸与人HLA蛋白的氨基酸序列一致。
在本发明的一个具体实施方式中,所述的嵌合基因编码的氨基酸序列连续20、50、80、100、150、183、200、203、250、300、342、362个氨基酸与人HLA蛋白的氨基酸序列一致。
优选的,所述的MHC嵌合α链基因或人HLA基因的部分包含编码HLA-A2.1蛋白的胞外区的全部或部分核苷酸序列。进一步优选的,所述的编码HLA-A2.1蛋白的胞外区的部分核苷酸序列包含编码Alpha-1、Alpha-2区域的核苷酸序列。更进一步优选的,所述的编码HLA-A2.1蛋白的胞外区的部分核苷酸序列还包含编码信号肽的核苷酸序列。
优选的,所述的MHC嵌合α链基因或人HLA基因的部分包含人HLA基因的外显子2至外显子3的编码序列。进一步优选的,还包含外显子1的编码序列。更进一步优选还包含外显子4至外显子8的编码序列。
在本发明的一个具体实施方式中,所述的人HLA基因的部分包含外显子1至外显子3的编码序列或者外显子1至外显子8的编码序列。
进一步优选的,所述的人HLA基因的部分包含人HLA基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8中的一种、两种或三种以上的组合。其中,所述的三种以上包含三种、四种、五种、六种、七种或八种。
进一步优选的,所述的人HLA基因的部分包含人HLA基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8中的两种或三种以上连续外显子的核苷酸序列。其中,所述的三种以上包含三种、四种、五种、六种、七种或八种。
在本发明的一个具体实施方式中,所述的人HLA基因的部分包含人HLA基因的外显子1的部分核苷酸序列、外显子1-2的内含子的全部核苷酸序列、外显子2的全部核苷酸序列、外显子2-3的内含子的全部核苷酸序列和外显子3的部分核苷酸序列。其中,所述的外显子1的部分核苷酸序列从外显子1的ATG编码序列开始,所述的外显子3的部分核苷酸序列至编码完整Alpha-2区域为止。
在本发明的一个具体实施方式中,所述的人HLA基因的部分核苷酸序列包含下列组中的一种:
(A)SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示核苷酸序列的全部或部分;
(B)与SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(C)与SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
(D)具有SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人B2M基因的部分包含人B2M基因的外显子1至外显子4的全部或部分核苷酸序列。进一步优选的,所述的人B2M基因的部分包含人B2M基因的外显子1至外显子3的编码序列。
进一步优选的,所述的人B2M基因的部分包含人B2M基因的外显子1、外显子2、外显子3、外显子4中的一种、两种或三种以上的组合。其中,所述的三种以上包含三种或四种。
再进一步优选的,所述的人B2M基因的部分包含人B2M基因的外显子1、外显子2、外显子3、外显子4中的两种或三种以上连续外显子的核苷酸序列。其中,所述的三种以上包含三种或四种。
在本发明的一个具体实施方式中,所述的人B2M基因的部分为编码人B2M蛋白的核苷酸序列的全部或部分。
在本发明的一个具体实施方式中,所述的人B2M基因的部分核苷酸序列包含下列组中的一种:
(a)SEQ ID NO:3或14所示核苷酸序列的全部或部分;
(b)与SEQ ID NO:3或14所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(c)与SEQ ID NO:3或14所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
(d)具有SEQ ID NO:3或14所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的非人动物H2-D1基因的部分包含非人动物H2-D1基因的外显子1至外显子8的全部或部分核苷酸序列。
进一步优选的,所述的非人动物H2-D1基因的部分包含非人动物H2-D1基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8中的一种、两种或三种以上的组合。其中,所述的三种以上包含三种、四种、五种、六种、七种或八种。
进一步优选的,所述的非人动物H2-D1基因的部分包含非人动物H2-D1基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8中的两种或三种以上连续外显子的核苷酸序列。其中,所述的三种以上包含三种、四种、五种、六种、七种或八种。
最为优选的,所述的非人动物H2-D1基因的部分包含非人动物H2-D1基因的外显子4至外显子8的编码序列。
在本发明的一个具体实施方式中,所述的非人动物H2-D1基因的部分包含下列组中的一种:
(1)SEQ ID NO:16所示核苷酸序列的全部或部分;
(2)与SEQ ID NO:16所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(3)与SEQ ID NO:16所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
(4)具有SEQ ID NO:16所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述嵌合基因包含人B2M基因的部分,和人HLA基因的部分。其中,所述的人B2M基因的部分核苷酸序列与人HLA基因的部分核苷酸序列直接连接或通过编码具有连接功能的接头蛋白的核苷酸序列连接。
进一步优选的,所述的编码具有连接功能的接头蛋白的核苷酸序列,其核苷酸数目和种类没有限定,只要可以连接人B2M基因的全部或部分核苷酸序列与人HLA基因的全部或部分核苷酸序列即可。最为优选的,所述的编码具有连接功能的接头蛋白的核苷酸序列为柔性接头。在本发明的一个具体实施方式中,具有连接功能的接头蛋白的氨基酸序列可以为SEQ ID NO:67或68。
优选的,编码具有连接功能的接头蛋白的核苷酸序列是核苷酸linker。
在本发明的一个具体实施方式中,所述的编码具有连接功能的接头蛋白的核苷酸序列如SEQ ID NO:51所示。
优选的,所述的嵌合基因编码上述的MHC嵌合蛋白。
在本发明的一个具体实施方式中,所述的嵌合基因的核苷酸序列包含下列组中的一种:
(I)SEQ ID NO:10或SEQ ID NO:65所示序列的全部或部分;
(II)转录的mRNA序列为SEQ ID NO:9或SEQ ID NO:52所示序列的全部或部分;
(III)与SEQ ID NO:10、SEQ ID NO:65、SEQ ID NO:9或SEQ ID NO:52所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(IV)与SEQ ID NO:10、SEQ ID NO:65、SEQ ID NO:9或SEQ ID NO:52所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
(V)具有SEQ ID NO:10、SEQ ID NO:65、SEQ ID NO:9或SEQ ID NO:52所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的嵌合基因还包括特异性诱导物或阻遏物。进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-Off System/Tet-On System)或他莫昔芬系统(Tamoxifen System)。
优选的,SEQ ID NO:9或SEQ ID NO:52所示序列由MHC分子人源化改造小鼠的MHCDNA转录获得。
本发明的第四方面,提供了一种B2M基因的靶向载体,所述的靶向载体包含供体DNA序列,所述的供体DNA序列包含人B2M基因的全部或部分,和/或人HLA基因的全部或部分。优选的,所述的靶向载体包含上述嵌合基因。
本发明的第五方面,提供了一种H2-D1基因的靶向载体,所述的靶向载体包含供体DNA序列,所述的供体DNA序列包含人B2M基因的全部或部分,和/或人HLA基因的全部或部分。
优选的,所述的供体DNA序列还包含非人动物H2-D1基因的全部或部分。进一步优选的,所述的供体DNA序列包含上述的嵌合基因。
优选的,所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段,即5’臂,其选自B2M基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的5’臂与NCBI登录号为NC_000068.7至少具有90%同源性的核苷酸。更进一步优选的,所述5’臂序列如SEQ ID NO:11或SEQ ID NO:60所示。
优选的,所述的靶向载体还包含与待改变的转换区3’端同源的第二个DNA片段,即3’臂,其选自B2M基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的3’臂与NCBI登录号为NC_000068.7至少具有90%同源性的核苷酸。更进一步优选的,所述3’臂序列如SEQ ID NO:12或SEQ ID NO:53所示。
优选的,所述的B2M基因的靶向载体中待改变的转换区位于外显子1至外显子4。
优选的,所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段,即5’臂,其选自H2-D1基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的5’臂与NCBI登录号为NC_000083.6至少具有90%同源性的核苷酸。
优选的,所述的靶向载体还包含与待改变的转换区3’端同源的第二个DNA片段,即3’臂,其选自H2-D1基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的3’臂与NCBI登录号为NC_000083.6至少具有90%同源性的核苷酸。
优选的,所述的H2-D1基因的靶向载体中待改变的转换区位于外显子1至外显子3。
进一步优选的,所述的H2-D1基因的靶向载体中待改变的转换区位于外显子1至外显子8。
优选的,所述的靶向载体还包括编码具有连接功能的接头蛋白的核苷酸序列。
在本发明的一个具体实施方式中,所述的编码具有连接功能的接头蛋白的核苷酸序列如SEQ ID NO:51所示。
本发明的第六方面,提供了一种靶向B2M基因的sgRNA,所述的sgRNA靶向非人动物B2M基因,同时所述sgRNA在待改变的非人动物B2M基因上的靶序列上是唯一的,且符合5’-NNN(20)-NGG3’或5’-CCN-N(20)-3’的序列排列规则;优选的,所述sgRNA在非人动物B2M基因的靶位点位于非人动物B2M基因的外显子1、外显子1-2的内含子、外显子3或外显子3-4的内含子上。
优选的,所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO:17-23任一项所示,3’端靶位点序列如SEQ ID NO:24-31任一项所示。
进一步优选的,所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO:19所示,3’端靶位点序列如SEQ ID NO:30所示。
本发明的第七方面,提供了一种编码上述sgRNA的DNA分子。
优选的,所述DNA分子的双链选自SEQ ID NO:32和SEQ ID NO:34,SEQ ID NO:33和SEQ ID NO:35,SEQ ID NO:36和SEQ ID NO:38,或SEQ ID NO:37和SEQ ID NO:39。
本发明的第八方面,提供了一种包含上述sgRNA,和/或上述DNA分子的载体。
本发明的第九方面,提供了一种sgRNA载体的制备方法,包括以下步骤:
(i)提供一种sgRNA,制备获得正向寡核苷酸序列和反向寡核苷酸序列,所述sgRNA靶向非人动物B2M基因,同时所述sgRNA在待改变的非人动物B2M基因上的靶序列上是唯一的,且符合5’-NNN(20)-NGG3’或5’-CCN-N(20)-3’的序列排列规则,所述的sgRNA在非人动物B2M基因的靶位点位于非人动物B2M基因的外显子1、外显子1-2的内含子、外显子3或外显子3-4的内含子上;
(ii)合成含有T7启动子及sgRNA scaffold的片段DNA,并将所述片段DNA通过EcoRI和BamHI酶切连接至骨架载体上,经测序验证,获得pT7-sgRNA载体;
(iii)将步骤(i)获得的正向寡核苷酸和反向寡核苷酸变性、退火,形成可以连入步骤(2)所述的pT7-sgRNA载体的双链;
(iv)将步骤(iii)中退火的双链sgRNA寡聚核苷酸分别与pT7-sgRNA载体进行链接,筛选获得sgRNA载体。
优选的,所述步骤(i)中sgRNA靶向的5’端靶位点序列如SEQ ID NO:17-23任一项所示,3’端靶位点序列如SEQ ID NO:24-31任一项所示。进一步优选的,所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO:19所示,3’端靶位点序列如SEQ ID NO:30所示。更进一步优选的,所述的正向寡核苷酸序列如SEQ ID NO:33或SEQ ID NO:37所示;反向寡核苷酸序列如SEQ ID NO:35或SEQ ID NO:39所示。
优选的,所述的步骤(ii)中所述T7启动子及sgRNA scaffold的片段DNA如SEQ IDNO:40所示。
在本发明的一个具体实施方式中,所述的制备方法包括如下步骤:
(i)将序列如SEQ ID NO:17-23所示的任一项sgRNA靶序列和/或SEQ ID NO:24-31所示的任一项sgRNA靶序列,制备获得正向寡核苷酸序列如SEQ ID NO:33或SEQ ID NO:37所示和反向寡核苷酸序列如SEQ ID NO:35或SEQ ID NO:39所示;
(ii)合成含有T7启动子及sgRNA scaffold的片段DNA如SEQ ID NO:40所示,将其通过EcoRI和BamHI酶切连接至骨架载体上,经测序验证,获得pT7-sgRNA载体;
(iii)分别合成步骤(i)中所述的正向寡核苷酸和反向寡核苷酸,将合成的sgRNA寡聚核苷酸变性、退火,形成可以连入步骤(ii)所述的pT7-sgRNA载体的双链;
(iv)将步骤(iii)中退火的双链sgRNA寡聚核苷酸分别与pT7-sgRNA载体进行链接,筛选获得sgRNA载体。
本发明的第十方面,提供了一种细胞,所述的细胞包含上述的靶向载体、上述的sgRNA、上述的DNA分子、上述的载体和/或上述的制备方法获得的sgRNA载体。
在本发明的一个具体实施方式中,所述的细胞包含上述任一靶向载体和上述任一sgRNA。
本发明的第十一方面,提供了上述的靶向载体、上述的sgRNA、上述的DNA分子、上述的载体、上述的制备方法获得的sgRNA载体和/或上述的细胞在基因修饰中的应用。
优选的,所述的应用包括但不限于敲除、插入或替换B2M基因的外显子1至外显子4的全部或部分核苷酸序列。
优选的,所述的应用包括但不限于敲除、插入或替换H2-D1基因的外显子1至外显子3的全部或部分核苷酸序列。
优选的,所述的应用包括但不限于敲除、插入或替换H2-D1基因的外显子1至外显子8的全部或部分核苷酸序列。
本发明的第十二方面,提供了一种MHC分子人源化改造非人动物的构建方法,所述的MHC分子人源化改造非人动物体内表达MHC嵌合蛋白,所述的MHC嵌合蛋白包括人B2M蛋白的全部或部分和/或人HLA蛋白的全部或部分。
优选的,所述的MHC分子人源化改造非人动物体内表达人源化B2M蛋白和/或MHC嵌合α链。
本发明的第十三方面,提供了一种MHC分子人源化改造非人动物,所述的MHC分子人源化改造非人动物体内表达MHC嵌合蛋白,所述MHC嵌合蛋白包括人B2M蛋白的全部或部分和/或人HLA蛋白的全部或部分。
优选的,所述的MHC分子人源化改造非人动物体内表达人源化B2M蛋白和/或MHC嵌合α链。
优选的,所述的MHC分子人源化改造非人动物体内内源B2M蛋白正常表达,更优选的,所述的MHC分子人源化改造非人动物体内内源B2M蛋白表达降低或缺失。优选的,所述的MHC分子人源化改造非人动物体内表达上述的MHC嵌合蛋白。
优选的,所述的MHC分子人源化改造非人动物的基因组中包含人B2M基因的全部或部分,和/或人HLA基因的全部或部分。进一步优选的,所述的MHC分子人源化改造非人动物的基因组中还包含非人动物H2-D1基因的全部或部分。
最为优选的,所述的MHC分子人源化改造非人动物的基因组中包含上述的嵌合基因。
优选的,所述的嵌合基因在MHC分子人源化改造非人动物中通过调控元件进行调控。进一步优选的,所述的调控元件可以是内源的或者外源的。
在本发明的一个具体实施方式中,所述的调控元件包括启动子。
在本发明的一个具体实施方式中,所述内源调控元件可以来自非人动物B2M或H2-D1基因。
在本发明的一个具体实施方式中,所述的外源调控元件可以来自人B2M或HLA基因。
优选的,所述的MHC分子人源化改造非人动物为纯合或杂合的。
优选的,所述的MHC分子人源化改造非人动物的基因组中至少一个染色体上包含人B2M和/或HLA基因。进一步优选的,所述的MHC分子人源化改造非人动物的基因组中至少一个染色体上包含嵌合基因。
优选的,所述的MHC分子人源化改造非人动物中至少一个细胞表达MHC嵌合蛋白。
优选的,使用基因编辑技术进行MHC分子人源化改造非人动物的构建,所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。
优选的,所述的构建方法包括破坏非人动物内源B2M基因的编码框,将上述嵌合基因插入内源B2M基因座。
优选的,所述的构建方法包括将上述嵌合基因替换非人动物内源B2M基因座的外显子1至外显子4的全部或部分核苷酸序列。
优选的,所述的构建方法包括破坏非人动物内源B2M基因的编码框,将上述嵌合基因插入内源H2-D1基因座上。
优选的,所述的构建方法包括破坏非人动物内源B2M基因的编码框,将上述嵌合基因替换非人动物内源H2-D1基因的外显子1至外显子3。
优选的,所述的构建方法包括破坏非人动物内源B2M基因的编码框,将上述嵌合基因替换非人动物内源H2-D1基因的外显子1至外显子8。
优选的,将上述的嵌合基因可操作的连接在非人动物B2M或H2-D1基因座上,获得MHC分子人源化改造非人动物。
优选的,使用上述的靶向载体和/或上述的sgRNA将上述的嵌合基因插入非人动物B2M基因外显子1上或者替换非人动物B2M基因外显子1至外显子4的全部或部分核苷酸序列。进一步优选的,使用上述的靶向载体和/或上述的sgRNA用上述的嵌合基因替换非人动物B2M基因外显子1至外显子3的全部或部分核苷酸序列。
优选的,使用上述的靶向载体将上述的嵌合基因插入非人动物H2-D1基因座上、替换非人动物H2-D1基因外显子1至外显子3的全部或部分核苷酸序列或者替换非人动物H2-D1基因外显子1至外显子8的全部或部分核苷酸序列。
优选的,将体内表达人B2M蛋白的全部或部分的MHC分子人源化改造非人动物与体内表达人HLA蛋白的MHC分子人源化改造非人动物交配或者体外授精,获得MHC分子人源化改造非人动物。或者将体内表达人源化B2M蛋白的MHC分子人源化改造非人动物与体内表达MHC嵌合α链的MHC分子人源化改造非人动物交配或者体外授精,获得MHC分子人源化改造非人动物。
优选的,提供体内表达人B2M蛋白的全部或部分的MHC分子人源化改造非人动物,将包含人HLA基因的全部或部分核苷酸序列导入非人动物B2M或H2-D1基因座,或者将包含人HLA基因的部分和非人动物H2-D1基因的部分导入非人动物B2M或H2-D1基因座。或者,提供体内表达人源化B2M蛋白的MHC分子人源化改造非人动物,将包含人HLA基因的全部或部分核苷酸序列导入非人动物B2M或H2-D1基因座,或者将包含人HLA基因的部分和非人动物H2-D1基因的部分导入非人动物B2M或H2-D1基因座。
优选的,提供体内表达人HLA蛋白的全部或部分的MHC分子人源化改造非人动物,将包含人B2M基因的全部或部分核苷酸序列导入非人动物B2M或H2-D1基因座。或者,提供体内表达MHC嵌合α链的MHC分子人源化改造非人动物,将包含人B2M基因的全部或部分核苷酸序列导入非人动物B2M或H2-D1基因座。
本发明的第十四方面,提供了一种多基因修饰的非人动物的构建方法,包括如下步骤:
i)提供上述的MHC分子人源化改造非人动物,或者采用上述的构建方法获得的MHC分子人源化改造非人动物;
ii)将步骤i)获得的MHC分子人源化改造非人动物与其他基因修饰的非人动物交配、体外授精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因修饰的非人动物包括但不限于基因HLA-B、HLA-C、H-2K、H2-L等人源化的非人动物。
优选的,所述的多基因修饰的非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物、六基因人源化非人动物、七基因人源化非人动物、八基因人源化非人动物或九基因人源化非人动物。
优选的,所述的多基因修饰的非人动物的基因组中人源化的多个基因中的每一个基因均可以是纯合或杂合的。
本发明的第十五方面,提供了一种上述的构建方法获得的多基因修饰的非人动物或其子代。
本发明的第十六方面,提供了一种B2M基因缺失的动物模型,所述的动物模型中的B2M基因被敲除,该动物模型不表达B2M蛋白。
本发明的第十七方面,提供了一种B2M基因缺失的细胞,所述的B2M基因缺失的细胞基因组中的B2M基因被敲除,该B2M基因缺失的细胞不表达B2M蛋白。
优选的,所述的B2M基因缺失为缺失B2M基因的外显子1至外显子4的全部或部分核苷酸序列。
优选的,所述的B2M基因缺失的动物模型或B2M基因缺失的细胞的制备方法包括使用sgRNA敲除B2M基因的外显子1至外显子4的全部或部分核苷酸序列。进一步优选的,所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO:17-23任一项所示,3’端靶位点序列如SEQ IDNO:24-31任一项所示。更进一步优选的,所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO:19所示,3’端靶位点序列如SEQ ID NO:30所示;
本发明的第十八方面,提供了一种荷瘤或炎症的动物模型,所述的动物模型来源于上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物或者上述的多基因修饰的非人动物或其子代。
本发明的第十九方面,提供了一种荷瘤或炎症的动物模型的制备方法,所述的制备方法包括上述的构建方法获得的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物。优选的,所述的制备方法还包括植入肿瘤细胞的步骤。
本发明的第二十方面,提供了上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物或者上述的多基因修饰的非人动物或其子代在构建荷瘤或炎症的动物模型中的应用。
本发明的第二十一方面,提供了一种细胞或细胞系或原代细胞培养物,所述细胞或细胞系或原代细胞培养物来源于上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代或者上述的荷瘤或炎症的动物模型。
本发明的第二十二方面,提供了一种组织或器官或其培养物,所述组织或器官或其培养物来源于上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代或者上述的荷瘤或炎症的动物模型。
优选的,所述组织或器官为脾脏、肿瘤或其培养物。
本发明的第二十三方面,提供了一种荷瘤后的瘤组织,所述的瘤组织来源于上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代或者上述的荷瘤或炎症的动物模型。
本发明的第二十四方面,提供了一种MHC分子人源化的细胞、组织、器官或荷瘤后的瘤组织,所述的细胞、组织、器官或荷瘤后的瘤组织表达上述的MHC嵌合蛋白。优选的,所述的细胞中内源B2M蛋白表达降低或缺失。进一步优选的,所述的细胞的基因组中包含上述的嵌合基因。
本发明的第二十五方面,提供了一种MHC分子人源化改造的细胞,所述的细胞表达MHC嵌合蛋白,所述的MHC嵌合蛋白包含人B2M蛋白的全部或部分和/或人HLA蛋白的全部或部分。
优选的,所述的细胞表达人源化B2M蛋白和/或MHC嵌合α链。
优选的,所述的细胞中内源B2M蛋白表达降低或缺失。进一步优选的,所述的细胞表达上述的MHC嵌合蛋白。
优选的,所述的细胞的基因组中包含人B2M基因的全部或部分,和/或人HLA基因的全部或部分。进一步优选的,所述的细胞的基因组中还包含非人动物H2-D1基因的全部或部分。最为优选的,所述的细胞的基因组中包含上述的嵌合基因。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备MHC分子人源化改造非人动物的非人哺乳动物。更进一步优选的,所述的啮齿类动物为小鼠或大鼠。其中小鼠B2M基因对应的蛋白序列如SEQ ID NO:2所示,大鼠B2M基因对应的蛋白序列如SEQ ID NO:66所示。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnul小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第二十六方面,提供了一种包含上述嵌合基因的构建体。
本发明的第二十七方面,提供了一种包含上述构建体的细胞。
本发明的第二十八方面,提供了一种包含上述细胞的组织。
本发明的第二十九方面,提供了一种构建人免疫系统重建动物模型的方法,所述的方法包括向个体移植人免疫细胞,获得人免疫系统重建动物模型;其中,所述的个体选自上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代或者上述的荷瘤或炎症的动物模型。
优选的,所述的植入为尾静脉注射。
优选的,所述的人免疫细胞包括但不限于CD34+或外周血单个核细胞(PBMC)。
优选的,所述注射人造血干细胞的量为1.5×105人造血干细胞(HSC)。
优选的,所述的免疫系统重建的标注为hCD45占总活细胞的比例≥25%。
优选的,所述的方法还包括注射人造血干细胞后每间隔一段时间取PBMC进行检测验证是否成功以及观察非人动物存活情况。其中,在本发明的一个具体实施方式中,所述的一段时间为4周。
优选的,所述取PBMC进行检测验证包括检测表达人白细胞表面分子标记(CD45+)的细胞、T细胞(CD3+)、B细胞(CD19+)、NK细胞(CD56+)、单核细胞(CD14+)、粒细胞(CD66b+)和髓系细胞(CD33+)的发育情况。
本发明的第三十方面,提供了一种构建自身免疫疾病动物模型的方法,所述的方法包括用免疫诱导剂免疫个体,获得自身免疫疾病动物模型;其中,所述的个体选自上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代或者上述的荷瘤或炎症的动物模型。
本发明的第三十一方面,提供了一种上述的方法制备获得的动物模型或其子代。
本发明的第三十二方面,提供了来源于上述的MHC嵌合蛋白、上述的嵌合基因、上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代、上述的荷瘤或炎症的动物模型、上述的细胞或细胞系或原代细胞培养物、上述的组织或器官或其培养物、上述的荷瘤后的瘤组织、上述的细胞、上述的构建体、上述的细胞、上述的组织、上述的动物模型或其子代在需要涉及人类细胞的免疫过程的产品开发,制造人类抗体、疫苗,或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;或者在生产和利用动物实验疾病模型,用于人源细胞移植、免疫系统重建、病原学研究,用于开发新的诊断策略和/或治疗策略中的应用;优选的,所述的应用为人造血干细胞的形成、功能研究和/或构建疾病模型;或者在筛选、验证、评价或研究MHC功能、人MHC信号机理、靶向人的抗体、疫苗、靶向人的药物、药效,免疫相关疾病药物以及抗肿瘤或抗炎症药物,筛选和评估人用药及药效研究方面的应用。
优选的,所述的用途为人造血干细胞的形成、功能研究和/或构建疾病模型。
本发明的第三十三方面,提供了一种干预方案的评价方法,所述的评价方法包括向个体植入肿瘤细胞,向植入肿瘤细胞的个体施加干预方案,对施加干预方案后的个体进行肿瘤抑制效果检测和评价;其中,所述的个体选自上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代、上述的荷瘤或炎症的动物模型或者上述的动物模型或其子代。
优选的,所述的干预方案选自CAR-T、药物治疗。进一步优选的,所述的药物为抗体或疫苗。
优选的,所述的肿瘤细胞可以来源于人或非人动物。其中,所述的非人动物为非人哺乳动物。优选的,所述的非人哺乳动物为啮齿类动物。进一步优选的,所述的非人动物为小鼠。
优选的,当所述个体背景为免疫缺陷的,则肿瘤细胞可以来源于人或非人动物。
优选的,当所述个体背景为野生型的,则肿瘤细胞来源于非人动物。
在本发明的一个具体实施方式中,所述的肿瘤细胞为人或鼠的肿瘤细胞。
优选的,所述干预方案的评价方法不是治疗方法。该评价方法对干预方案的效果进行检测和评价,以确定该干预方案是否有治疗效果,即治疗效果不是必然的,只是一种可能性。
本发明的第三十四方面,提供了一种抗体筛选的方法,所述的方法包括向个体体内移植肿瘤细胞后,给予待筛选的抗体,对给予抗体的非人动物或子代进行检测、效果评价,其中,所述的个体选自上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代、上述的荷瘤或炎症的动物模型或者上述的动物模型或其子代。
优选的,所述的肿瘤细胞可以来自人或非人动物。其中,所述的非人动物为非人哺乳动物。优选的,所述的非人哺乳动物为啮齿类动物。进一步优选的,所述的非人动物为小鼠。
优选的,当所述个体背景为免疫缺陷的,则肿瘤细胞可以来源于人或非人动物。
优选的,当所述个体背景为野生型的,则肿瘤细胞来源于非人动物。
在本发明的一个具体实施方式中,所述的肿瘤细胞为人或鼠的肿瘤细胞。
优选的,所述的抗体筛选的方法不是治疗方法。该方法用来筛选抗体,对不同抗体的药效进行检测和比较,以确定哪些抗体可以作为药物,哪些不能作为药物,或者,比较不同抗体的药效敏感程度,即治疗效果不是必然的,只是一种可能性。
本发明的第三十五方面,提供了一种人用药物筛选或评价的方法,所述的方法包括向个体体内移植肿瘤细胞,向移入肿瘤细胞的动物给予候选药物,对给予候选药物的个体进行药效检测和/或比较。其中,所述的个体选自上述的构建方法获得的MHC分子人源化改造非人动物、上述的MHC分子人源化改造非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代、上述的荷瘤或炎症的动物模型或者上述的动物模型或其子代。
优选的,所述的肿瘤细胞可以来自人或非人动物。其中,所述的非人动物为非人哺乳动物。优选的,所述的非人哺乳动物为啮齿类动物。进一步优选的,所述的非人动物为小鼠。
优选的,当所述个体背景为免疫缺陷的,则肿瘤细胞可以来源于人或非人动物。
优选的,当所述个体背景为野生型的,则肿瘤细胞来源于非人动物。
在本发明的一个具体实施方式中,所述的肿瘤细胞为人或鼠的肿瘤细胞。
优选的,所述药物筛选或评价的方法不是治疗方法。该方法用来筛选或评价药物,对候选药物的药效进行检测和比较,以确定哪些候选药物可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度,即治疗效果不是必然的,只是一种可能性。
优选的,所述候选药物包括靶向药物。进一步优选的,所述的靶向药物为抗原结合蛋白。在本发明的一个具体实施方式中,所述的抗原结合蛋白为抗体。
优选的,所述候选药物为单抗或双特异性抗体或两种及两种以上药物的联合使用。
优选的,所述检测包括测定肿瘤细胞的大小和/或增殖速率;优选的,所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。
优选的,所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化,所述的代谢变化包括食物消耗或水消耗的变化。
通过上述的技术方案,本发明取得了良好的技术效果,包括:在MHC分子人源化改造非人动物体内正常表达MHC嵌合蛋白,以及构建的包含B2M和/或HLA基因的嵌合基因。更重要的是,构建了免疫缺陷程度更高的MHC分子人源化改造非人动物。
本发明所述的“连接”为直接连接或者通过接头连接,例如,人B2M蛋白的部分氨基酸与人HLA蛋白的部分氨基酸之间可以直接连接也可以通过接头连接。
本发明所述的“人源化B2M蛋白”,包含来源于人B2M蛋白的部分和非人B2M蛋白部分,其中,所述“人B2M蛋白”为人B2M蛋白的全长氨基酸序列。优选的,所述的人B2M蛋白的部分为连续5-119个氨基酸与人B2M蛋白的氨基酸序列一致。进一步优选的,所述的人B2M蛋白的部分为连续10-100个氨基酸与人B2M蛋白的氨基酸序列一致。在本发明的一个具体实施方式中,所述的MHC嵌合蛋白的氨基酸序列连续20、50、80、99、100、119个氨基酸与人B2M蛋白的氨基酸序列一致。换句话说,所述的人B2M蛋白的部分包含人B2M基因的外显子1至外显子4的全部或部分编码的氨基酸序列。优选的,所述的人B2M蛋白的部分包含人B2M基因的外显子1、外显子2、外显子3、外显子4中的一种、两种、三种或四个的组合编码的氨基酸序列。进一步优选的,所述的人B2M蛋白的部分包含人B2M基因的外显子1、外显子2、外显子3、外显子4中的两种、三种或四种连续外显子编码的氨基酸序列。再进一步优选的,所述的人B2M蛋白的部分包含人B2M基因的外显子1至外显子3的全部或部分编码的氨基酸序列。
本发明所述的“MHC嵌合α链”,包含来源于人HLA蛋白的部分和非人H2-D1蛋白部分,其中,所述“人HLA蛋白”为人HLA蛋白的α链全长氨基酸序列。优选的,所述的人HLA蛋白的部分为连续5-362个氨基酸与人HLA蛋白的氨基酸序列一致。进一步优选的,所述的人HLA蛋白的部分为连续10-203个氨基酸与人HLA蛋白的氨基酸序列一致。更进一步优选的,所述的人HLA蛋白的部分为连续10-100个氨基酸与人HLA蛋白的氨基酸序列一致。在本发明的一个具体实施方式中,所述的人HLA蛋白的部分为连续20、50、80、100、150、183、200、203、250、300、342、362个氨基酸与人HLA蛋白的氨基酸序列一致。更为具体的,所述的人HLA蛋白的部分包含HLA-A2.1蛋白的胞外区的全部或部分。进一步优选的,所述的HLA-A2.1蛋白的胞外区的部分包含Alpha-1、Alpha-2区域;更进一步优选的,所述的HLA-A2.1蛋白的胞外区的部分还包含信号肽。在本发明的一个具体实施方式中,所述的MHC嵌合α链包括人信号肽、人Alpha-1、人Alpha-2和非人动物Alpha-3、非人动物连接肽、非人动物跨膜区以及非人动物胞内区。换句话说,所述的人HLA蛋白的部分为包含人HLA基因的外显子1至外显子8的全部或部分编码的氨基酸序列。优选的,所述的人HLA蛋白的部分为包含人HLA基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8中的一种、两种或三种以上的组合编码的氨基酸序列。其中,所述的三种以上包含三种、四种、五种、六种、七种或八种。进一步优选的,所述的人HLA蛋白的部分包含人HLA基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8中的两种或三种以上连续外显子编码的氨基酸序列。其中,所述的三种以上包含三种、四种、五种、六种、七种或八种。更进一步优选的,所述的人HLA蛋白的部分包含人HLA基因的外显子1至外显子3的全部或部分编码的氨基酸序列。其中,HLA选自HLA-A2.1、HLA-A24.2、HLA-A3.1或HLA-A31.1,H-2优选为H2-D1。本发明所述的“Alpha”同“α”。
本发明所述的“MHC嵌合α链基因”编码所述的MHC嵌合α链,其包含人HLA的α链和非人动物H-2的α链。
本发明所述的“人源化B2M基因”包含人B2M基因的全部或部分,优选不含编码信号肽的核苷酸序列。
本发明所述的“MHC嵌合蛋白”,包含来源相同或不同的同种或不同种蛋白的嵌合。例如可以为来源相同(例如均来源人或均来源于非人)的B2M蛋白的全部或部分与HLA蛋白的全部或部分之间的嵌合,或者来源不同(例如分别来源于人和非人)的B2M蛋白的全部或部分与HLA蛋白的全部或部分之间的嵌合,或者来源相同(例如均来源人或均来源于非人)的HLA蛋白部分与HLA蛋白部分之间的嵌合,或者来源不同(例如分别来源于人和非人)的HLA蛋白部分与HLA蛋白部分之间的嵌合,以及来源相同或不同的B2M蛋白的全部或部分、HLA蛋白部分与HLA蛋白部分之间的嵌合。
本发明所述的“嵌合基因”,包含来源相同或不同的同种或不同种基因的嵌合。例如可以为来源相同(例如均来源人或均来源于非人)的B2M基因的全部或部分与HLA基因的全部或部分之间的嵌合,或者来源不同(例如分别来源于人和非人)的B2M基因的全部或部分与HLA基因的全部或部分之间的嵌合,或者来源相同(例如均来源人或均来源于非人)的HLA基因部分与HLA基因部分之间的嵌合,或者来源不同(例如分别来源于人和非人)的HLA基因部分与HLA基因部分之间的嵌合,以及来源相同或不同的B2M基因的全部或部分、HLA基因部分与HLA基因部分之间的嵌合。
本发明所述的“全部或部分”,“全部”为整体;“部分”为整体中的局部,或者整体中的个体。例如,“外显子1至外显子8的全部”为整体,即外显子1至外显子8的全部核苷酸序列;“外显子1至外显子8的部分”为整体的局部或整体的个体,即外显子1至外显子8中的一个或两个以上连续或间隔的核苷酸序列。
本发明所述的“两种或三种以上连续外显子”是指例如外显子1、2,外显子2、3,外显子1、2、3,外显子2、3、4,以及连续4个、5个、6个、7个或8个连续外显子。
本发明所述的“编码序列”为Coding sequence,即CDS,是编码一段蛋白产物的序列,其可能是一个ORF,也可能包括多个ORF。
本发明所述“同源性”,是指在使用蛋白序列或核苷酸序列的方面,本领域技术人员可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。
本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:Molecular Cloning A Laboratory Manual,2ndEd.,ed.By Sambrook,FritschandManiatis(Cold Spring Harbor Laboratory Press:1989);DNA Cloning,Volumes I and II(D.N.Glovered.,1985);Oligonucleotide Synthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelsonand M.Simon,eds.inchief,Academic Press,Inc.,New York),specifically,Vols.154and 155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,ed.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods InCell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook Of Experimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);and Manipulating the Mouse Embryo,(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1986)。
在一个方面,所述非人动物是哺乳动物。优选的,所述非人动物是小型哺乳动物,例如跳鼠科。在一个实施方式中,所述非人动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述
基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。
在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠及NOD、NOD/SCID、NOD-Prkdcscid IL-2rgnull背景的小鼠。
以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:HLA-A2立体结构示意图;
图2:小鼠B2M基因和人B2M基因座对比示意图(非按比例);
图3:小鼠H2-D1与人HLA-A基因座对比示意图(非按比例);
图4:小鼠B2M基因座上B2M和HLA-A基因人源化改造示意图(非按比例);
图5:小鼠B2M基因人源化改造示意图(非按比例);
图6:小鼠H2-D1基因人源化改造示意图(非按比例);
图7:小鼠H2-D1基因座上B2M和HLA-A基因人源化改造示意图(非按比例);
图8:小鼠B2M基因座上B2M和HLA-A基因人源化改造示意图(非按比例);
图9:B2M基因座打靶策略及靶向载体设计示意图(非按比例);
图10:sgRNA1-sgRNA15活性检测结果,其中,Con.为阴性对照,PC为阳性对照,blank为空白对照;
图11:MHC人源化小鼠鼠尾PCR鉴定结果(F0),其中,M为Marker,WT为野生型,PC为阳性对照,H2O为水对照,其中图A为5’端引物检测结果,图B为3’端引物检测结果;
图12:F1代MHC人源化小鼠示例性PCR检测结果,其中,M为Marker,H2O为水对照,WT为野生型对照,PC为阳性对照,F1-01、F1-02、F1-03、F1-04、F1-05、F1-06和F1-07为阳性小鼠编号;
图13:F1代MHC人源化小鼠示例性Southern检测结果,其中,M为Marker,WT为野生型对照,F1-01、F1-02、F1-03、F1-04、F1-05、F1-06和F1-07为小鼠编号;
图14:MHC人源化小鼠体内B2M蛋白(A-H)和HLA-A2.1蛋白(I-P)表达流式检测结果,其中MHC(H/H)为MHC人源化纯合子小鼠;
图15:MHC人源化纯合子小鼠淋巴细胞亚群分析,其中MHC(H/H)为MHC人源化纯合子小鼠;
图16:基因敲除小鼠鼠尾PCR鉴定结果,其中,M为Marker,WT为野生型,H2O为水对照;
图17:B-NDG背景小鼠B2M基因座上B2M和HLA-A2.1基因人源化改造示意图(非按比例);
图18:B-NDG背景小鼠B2M基因座打靶策略及靶向载体设计示意图(非按比例);
图19:F0代B-NDG背景MHC人源化小鼠示例性PCR检测结果,其中,M为Marker,H2O为水对照,WT为野生型对照,PC为阳性对照,BNDG-F0-01至BNDG-F0-06为小鼠编号;
图20:F1代B-NDG背景MHC人源化小鼠示例性PCR检测结果,其中,M为Marker,PC为阳性对照,H2O为水对照,WT为野生型对照,BNDG-F1-01和BNDG-F1-02为小鼠编号;
图21:F1代B-NDG背景MHC人源化小鼠示例性Southern检测结果,其中,M为Marker,WT为野生型对照,BNDG-F1-01和BNDG-F1-02为小鼠编号;
图22:B-NDG背景MHC人源化小鼠中B2M蛋白(A-D)和HLA-A2.1蛋白(E-H)表达流式检测结果,其中MHC B-NDG(H/+)为B-NDG背景MHC人源化杂合子小鼠;
图23:小鼠B2M蛋白与人B2M蛋白氨基酸序列比对表;
图24:大鼠B2M蛋白与人B2M蛋白氨基酸序列比对表;
图25:小鼠H2-D1蛋白与人HLA-A2.1蛋白氨基酸序列比对表;
图26:小鼠H2-D1蛋白与人HLA-A*0101氨基酸系列比对表。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
在下述每一实施例中,设备和材料是从以下所指出的几家公司获得:
NOD-Prkdcscid IL-2rgnull(B-NDG)小鼠来源北京百奥赛图基因生物技术有限公司,货号B-CM-001或B-CM-002;
UCA试剂盒来源北京百奥赛图基因生物技术有限公司,货号BCG-DX-001;
Ambion体外转录试剂盒购自Ambion,货号AM1354;
Cas9mRNA来源SIGMA,货号CAS9MRNA-1EA;
PE anti-humanβ2-microglobulin Antibody(hβ2M PE)购自Biolegend,货号316305;
PE anti-mouseβ2-microglobulin Antibody(mβ2M PE)购自Biolegend,货号154503;
PE anti-human HLA-A2 Antibody(hHLA-A2 PE)购自Biolegend,货号343305;
PE anti-mouse H-2Kb/H-2Db Antibody(H-2Kb/H-2Db PE)购自Biolegend,货号114607;
FITC anti-mouse CD19 Antibody(mCD19FITC)购自Biolegend,货号115506;
Purified anti-mouse CD16/32 Antibody购自Biolegend,货号101302;
APC anti-mCD45(mCD45APC)购自Biolegend,货号559864;
APC/Cy7 anti-mouse TCRβchain Antibody(mTCRβAPC/Cy7)购自Biolegend,货号109220;
Alexa
Figure BDA0002890336600000311
488anti-mouse CD3 Antibody(mCD3 Alexa Flour 488)购自Biolegend,货号100210;
PE anti-mouse CD19 Antibody(mCD19 PE)购自Biolegend,货号115508;
Brilliant Violet 421TM anti-mouse CD4 Antibody(mCD4 BV421)购自Biolegend,货号100438;
Brilliant Violet 711TM anti-mouse CD8a Antibody(mCD8a BV711)购自Biolegend,货号100747;
BamHI、BglII、EcoNI、SspI酶购自NEB,货号分别为R3136、R0144、R0521、R3132;
实施例1 MHC分子人源化小鼠
本实施例对非人动物(如小鼠)进行改造,使该非人动物体内包含编码人B2M和HLA-A2.1蛋白的核苷酸序列,得到经遗传修饰的非人动物体内可表达人或人源化B2M和HLA-A2.1蛋白或MHC嵌合α链。小鼠B2M基因(NCBI Gene ID:12010,Primary source:MGI:88127,UniProt ID:P01887,基于NM_009735.3→NP_033865.2的转录本,其mRNA序列如SEQID NO:1所示,对应的蛋白序列如SEQ ID NO:2所示)和人B2M基因(NCBI Gene ID:567,Primary source:HGNC:914,UniProt ID:P61769,基于NM_004048.3→NP_004039.1的转录本,其mRNA序列如SEQ ID NO:3所示,对应的蛋白序列如SEQ ID NO:4所示)对比示意图如图2所示。
小鼠H2-D1基因(NCBI Gene ID:14964,Primary source:MGI:95896,UniProt ID:P01899)(基于NM_010380.3→NP_034510.3的转录本,其mRNA序列如SEQ ID NO:5所示,对应的蛋白序列如SEQ ID NO:6所示)与人HLA-A基因(NCBI Gene ID:3105,Primary source:HGNC:4931,UniProt ID:P04439)(基于NM_001242758.1→NP_001229687.1的转录本,其mRNA序列如SEQ ID NO:7所示,对应的蛋白序列如SEQ ID NO:8所示)对比示意图如图3所示。
本发明的目的是得到一种人源化MHC分子,可通过多种策略实现本发明的目的。例如,可以将小鼠内源B2M基因和内源H2-D1基因失活后,转入编码人B2M和人HLA-A2.1信号肽和胞外区的1-203aa的核苷酸序列及小鼠H2-D1部分胞外区(Alpha-3和连接肽)及跨膜区和胞内区(207-362aa)编码的核苷酸序列;还可以采用在小鼠B2M和/或小鼠H2-D1基因座上进行不同的改造和组合,例如,(1)在小鼠内源B2M基因座进行人源化改造,在内源B2M基因1号外显子上插入一段含有编码人B2M、编码人HLA-A2.1的信号肽、Alpha-1、Alpha-2区域的序列(例如,AAC24825.1的第1-203aa,位于人HLA-A2.1的第1、2、3外显子区域)和编码小鼠H2-D1的Alpha-3、连接肽(Connecting peptide)、跨膜区和胞内区(例如,NP_034510.3的第207-362aa,位于鼠H2-D1的第4、5、6、7、8外显子区域)序列,或用上述序列直接替换小鼠内源B2M基因的第1、2、3外显子序列(见图4);(2)将小鼠内源B2M基因直接进行人源化改造,将编码区替换为人B2M编码区序列(见图5),同时将人HLA-A2.1蛋白的信号肽、Alpha-1、Alpha-2区域和小鼠H2-D1的Alpha-3、连接肽、跨膜区和胞内区(SEQ ID NO:64)的编码序列通过转基因等方式转入小鼠体内,或在小鼠H2-D1基因座用编码人HLA-A2.1的信号肽、Alpha-1、Alpha-2区域的序列替换小鼠H2-D1的信号肽、Alpha-1、Alpha-2区域(见图6),当对小鼠B2M基因和H2-D1基因分别进行人源化改造时,可以采用一步或分步打靶的方式制备双基因人源化小鼠,也可以分别制备单基因人源化小鼠后通过交配等常规方式获得双基因人源化小鼠,其体内同时表达人B2M蛋白和MHC嵌合α链;(3)敲除小鼠内源B2M基因,并将人B2M和HLA-A2.1蛋白信号肽、Alpha-1、Alpha-2区域(SEQ ID NO:63)的编码序列替换小鼠H2-D1基因的信号肽、Alpha-1、Alpha-2区域(见图7)。
本实施例以图4所示改造方式为例进行小鼠MHC分子人源化改造,可用基因编辑技术对小鼠细胞进行修饰,在内源小鼠B2M基因座敲进一段含有编码人B2M蛋白、人HLA-A2.1蛋白的部分和小鼠H2-D1蛋白的部分的序列,同时破坏小鼠B2M基因的编码框,期望得到的人源化小鼠体内可表达人源化MHC分子,该MHC分子中含有人B2M蛋白、人HLA-A2.1蛋白(选用NCBI登录号为AAC24825.1的序列,SEQ ID NO:59)的Alpha-1、Alpha-2区域和小鼠H2-D1蛋白的Alpha-3、连接肽、跨膜区和胞内区,人HLA-A2.1蛋白部分与小鼠H2-D1蛋白部分直接连接,且该小鼠体内不表达内源B2M蛋白。进一步的,为确保人HLA-A2.1蛋白的正确表达,还可将包含人HLA-A2.1的信号肽序列插入到人B2M编码区之前。最终得到的改造后的人源化小鼠B2M基因座的示意图如图8所示,人源化小鼠B2M、HLA-A2.1和H2-D1基因转录的mRNA序列如SEQ ID NO:9所示,得到的人源化B2M基因座的DNA序列(仅涉及改造部分)如SEQ IDNO:10所示。
鉴于人B2M具有多种亚型或转录本,本文所述的方法可应用于其它亚型或转录本。
引入CRISPR/Cas系统进行基因编辑,进一步的设计如图9所示的打靶策略示意图,图中显示了靶向载体上含有小鼠B2M上游和下游的同源臂序列,以及包含编码人B2M蛋白、人HLA-A2.1蛋白的部分和小鼠H2-D1蛋白的部分的序列片段(简称A片段)。其中,上述上游同源臂序列(5’同源臂,SEQ ID NO:11)与NCBI登录号为NC_000068.7的第122146329-122147737位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:12)与NCBI登录号为NC_000068.7的第122152171-122153513位核苷酸序列相同;A片段的5’-3’端依次为人HLA-A2.1信号肽序列、人B2M序列、柔性接头(Linker)的核苷酸序列、人HLA-A2.1序列、小鼠H2-D1序列,其中,人HLA-A2.1信号肽序列(SEQ ID NO:13)与GenBank序列号为AF055066.1的第99567-99638位核苷酸序列相同,人B2M序列(SEQ ID NO:14)与NCBI登录号为NM_004048.3的第91-387位核苷酸序列相同,柔性接头为45bp的常用融合蛋白柔性(GGGGS)3linker(如SEQ ID NO:67),其序列为:5’-GGAGGTGGCGGATCCGGCGGAGGCGGCTCGGGTGGCGGCGGCTCT-3’(SEQ ID NO:51),人HLA-A2.1序列(SEQ ID NO:15)与GenBank序列号为AF055066.1的第98606-99435位核苷酸序列相同,小鼠H2-D1序列(SEQ ID NO:16)与NCBI登录号为NC_000083.6的第35266871-35267765位核苷酸序列相同。该小鼠体内表达的蛋白如SEQ IDNO:61所示,但由于柔性接头的存在,该蛋白将会具有人B2M蛋白和人HLA-A2.1蛋白功能域。
靶向载体构建可采用常规方法进行,如酶切连接、直接合成等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体用于后续实验。
靶序列决定了sgRNA的靶向特异性和诱导Cas9切割目的基因的效率。因此,高效特异的靶序列选择和设计是构建sgRNA表达载体的前提。设计并合成识别5’端靶位点(sgRNA1-sgRNA7)、3’端靶位点(sgRNA8-sgRNA15)的sgRNA。5’端靶位点和3’端靶位点分别位于B2M基因外显子1、外显子1-2的内含子、外显子3或外显子3-4的内含子,各sgRNA在B2M上的靶位点序列如下:
sgRNA1靶位点序列(SEQ ID NO:17):5’-CCTGGCCAATCCCGTCGGGAAGG-3’
sgRNA2靶位点序列(SEQ ID NO:18):5’-CCGTCAGCACACTCGCAAACAGG-3’
sgRNA3靶位点序列(SEQ ID NO:19):5’-GTTCTCCTTCCCGACGGGATTGG-3’
sgRNA4靶位点序列(SEQ ID NO:20):5’-ACTCTGGATAGCATACAGGCCGG-3’
sgRNA5靶位点序列(SEQ ID NO:21):5’-CTGGTGCTTGTCTCACTGACCGG-3’
sgRNA6靶位点序列(SEQ ID NO:22):5’-GGGGAAAGAGGCACTCACTCTGG-3’
sgRNA7靶位点序列(SEQ ID NO:23):5’-GACAAGCACCAGAAAGACCAGGG-3’
sgRNA8靶位点序列(SEQ ID NO:24):5’-CTGGAGGCTTCCGGACACTCAGG-3’
sgRNA9靶位点序列(SEQ ID NO:25):5’-TGATCAAGCATCATGATGGTAGG-3’
sgRNA10靶位点序列(SEQ ID NO:26):5’-AGGAGCGTGAGAGGGAACGTGGG-3’
sgRNA11靶位点序列(SEQ ID NO:27):5’-GAGGAACGTAGCCATGTCACTGG-3’
sgRNA12靶位点序列(SEQ ID NO:28):5’-CATGTCACTGGCCCTCTAAAGGG-3’
sgRNA13靶位点序列(SEQ ID NO:29):5’-CATGTGATCAAGCATCATGATGG-3’
sgRNA14靶位点序列(SEQ ID NO:30):5’-ACCCGCAGAGCTCTGTCACTCGG-3’
sgRNA15靶位点序列(SEQ ID NO:31):5’-CTCTGTCACTCGGCTCCTCTGGG-3’
利用UCA试剂盒检测多个sgRNA的活性,从结果可见sgRNA具有不同活性,其中,sgRNA2和sgRNA15相对活性较低,这可能是由于靶位点序列的特殊性导致,但根据我们的实验及其具体活性值,sgRNA2和sgRNA15的相对活性值仍显著高于阴性对照组值,仍可判断sgRNA2和sgRNA15是具有活性的,并且活性满足基因打靶实验要求,除SEQ ID NO:17-31以外,其他不具备活性的sgRNA结果未显示,检测结果见表1和图10。从中选择sgRNA3和sgRNA14进行后续实验。在其5’端及互补链上分别加上酶切位点得到正向寡核苷酸和反向寡核苷酸序列见表2),退火后将退火产物分别连接至pT7-sgRNA质粒(质粒先用BbsI线性化),获得表达载体pT7-B2M-HLA-A2.1-3和pT7-B2M-HLA-A2.1-14。
表1 UCA检测sgRNA相对活性的结果
Figure BDA0002890336600000341
表2 sgRNA3和sgRNA14序列列表
Figure BDA0002890336600000342
Figure BDA0002890336600000351
pT7-sgRNA载体由质粒合成公司合成含有T7启动子及sgRNA scaffold的片段DNA(SEQ ID NO:40)并依次通过酶切(EcoRI及BamHI)连接至骨架载体(来源Takara,货号3299)上,经专业测序公司测序验证,结果表明获得了目的质粒。
取小鼠的原核期受精卵,例如C57BL/6小鼠,利用显微注射仪将pT7-B2M-HLA-A2.1-3、pT7-B2M-HLA-A2.1-14质粒的体外转录产物(使用Ambion体外转录试剂盒,按照说明书方法进行转录)、靶向载体与Cas9 mRNA预混好后注射至小鼠受精卵细胞质或细胞核中。按照《小鼠胚胎操作实验手册(第三版)》(安德拉斯·纳吉,化学工业出版社,2006)中的方法进行受精卵的显微注射,注射后的受精卵转移至培养液中短暂培养,然后移植至受体母鼠的输卵管中发育,将获得的小鼠(F0代)通过杂交和自交,扩大种群数量,建立稳定的B2M与HLA-A2.1基因突变小鼠品系。
可通过常规检测方法(如PCR分析)鉴定F0代小鼠体细胞的基因型,部分F0代小鼠的鉴定结果见图11。结合5’端引物检测结果和3’端引物检测结果可知,图11中编号为F0-1到F0-10的10只小鼠为阳性小鼠。PCR分析包括下述引物:
5’端引物:
L-GT-F(SEQ ID NO:41):5’-GAATGTGTGCCTCCTCTCAGTTTCC-3’
L-GT-R(SEQ ID NO:42):5’-TCCTTCCCGTTCTCCAGGTATCTGC-3’
3’端引物:
R-GT-F(SEQ ID NO:43):5’-GCGGCTACTACAACCAGAGCGAG-3’
R-GT-R(SEQ ID NO:44):5’-TCCAGCAATAAGAACCAGTCCCTAGCT-3’
其中,引物L-GT-F位置位于5’同源臂左侧,R-GT-R位于3’同源臂右侧,L-GT-R和R-GT-F均位于人源序列上。
将F0鉴定为阳性的MHC人源化小鼠与野生型小鼠交配得到F1代小鼠。可使用同样的PCR方法对F1代小鼠进行基因型鉴定,结果见图12,显示有7只F1代小鼠为阳性小鼠,编号分别为:F1-01、F1-02、F1-03、F1-04、F1-05、F1-06、F1-07。对这7只F1代PCR鉴定为阳性的小鼠进行Southern blot检测,确认是否存在随机插入。剪取鼠尾提取基因组DNA,选用BamHI酶或BglII酶消化基因组,转膜,杂交。探针P1、P2分别位于5’同源臂外侧及3’同源臂上,具体探针及目的片段的长度见表3。
表3具体探针及目的片段的长度
Figure BDA0002890336600000352
Figure BDA0002890336600000361
探针合成引物如下:
P1-F(SEQ ID NO:45):5’-ATGAGGTCTTTTTGTGGGCAGAGCA-3’
P1-R(SEQ ID NO:46):5’-CTCCCTACGGCCACATCACCATTAC-3’
P2-F(SEQ ID NO:47):5’-TAACTTCATGTAAGGCACCGTCAC-3’
P2-R(SEQ ID NO:48):5’-TCCAGACCTCACCATCAAATGAG-3’
Southern blot检测结果见图13。综合P1、P2探针的结果表明,7只小鼠均无随机插入,证实这7只小鼠为阳性杂合小鼠且不存在随机插入。这表明使用本方法能构建出可稳定传代,且无随机插入的MHC人源化基因工程小鼠。
将F1代鉴定为阳性的杂合小鼠相互交配,获得F2代MHC人源化纯合子小鼠(H/H)。
可通过常规检测方法确认阳性小鼠体内人源化B2M蛋白和MHC嵌合α链的表达情况,例如使用ELISA方法等。具体来说,分别选取野生型C57BL/6雌性小鼠(6周龄)和本实施例制备的MHC人源化雌性纯合子小鼠(6周龄)各1只,给每只小鼠腹腔注射7.5μg/200μl的mCD3抗体,24h后脱颈安乐死后取脾脏细胞,用抗鼠B2M抗体mβ2M PE或抗鼠H-2Kb/H-2Db抗体或抗人B2M抗体hβ2M PE或抗人HLA-A2抗体hHLA-A2 PE和抗鼠CD45抗体mCD45 APC识别染色后进行流式检测,检测结果见图14。如图所示,无论是否经过mCD3刺激,只能在C57BL/6小鼠体内检测到表达鼠B2M的细胞(图14A、14C),不能检测到表达人或人源化B2M的细胞(图14E、14G),只能在MHC人源化纯合子小鼠体内检测到表达人B2M的细胞(图14F、14H)或表达MHC嵌合α链的细胞(图14N、14P),不能检测到表达鼠B2M的细胞(14B、14D);由于本实施例并没有敲除小鼠H2-D1编码序列,因此在MHC人源化纯合子小鼠体内检测到少量表达鼠H2-D1的细胞(图14G、14L)。
为确认F2代MHC人源化纯合子小鼠体内B细胞和T细胞的分化与野生型小鼠是否一致,可通过流式细胞术等常规方法分析小鼠的淋巴细胞亚群。具体来说,分别选取野生型C57BL/6雄性小鼠(16周龄)、MHC人源化纯合子雄性小鼠(13周龄)各1只,分离脾脏细胞后用抗鼠CD45抗体mCD45 APC进行流式检测,检测结果如图15(A、B)所示,野生型C57BL/6小鼠、MHC人源化纯合子小鼠体内白细胞含量分别为88.6%和96.5%;再用鼠源T细胞表面抗体mTCRB-APC-Cy7、抗鼠CD19抗体mCD19-PE标记T细胞、B细胞进行流式检测,结果显示,野生型C57BL/6小鼠体内T细胞、B细胞分别为23.8%、61.4%(图15C),MHC人源化纯合子小鼠体内T细胞、B细胞分别为27.7%、61.8%(图15D);进一步用抗鼠CD4抗体mCD4-BV421、抗鼠mCD8a抗体mCD8a-BV711识别染色后进行流式检测,结果如图15E、15F所示,野生型C57BL/6小鼠和MHC人源化纯合子小鼠体内CD4+T细胞和CD8+T细胞含量基本一致。可见,MHC人源化小鼠体内淋巴细胞亚群的表达谱与野生型C57BL/6小鼠体内淋巴细胞亚群表达谱相似,表明MHC人源化小鼠体内T细胞和B细胞的分化不受B2M与HLA-A2.1基因人源化改造的影响。
此外,由于Cas9的切割造成基因组DNA的双链断裂,通过染色体同源重组的修复方式会随机产生插入/缺失突变,可能得到B2M蛋白功能丧失的基因敲除小鼠。为此设计一对引物用于检测基因敲除小鼠,野生型小鼠应没有PCR条带,基因敲除小鼠应有1条PCR条带,产物长度应为约682bp,结果见图16,其中编号1到10为B2M基因敲除小鼠。引物分别位于5’端靶位点左侧和3’端靶位点右侧,序列如下:
SEQ ID NO:49:5’-GAATAAATGAAGGCGGTCCCAGGCT-3’
SEQ ID NO:50:5’-AGGTGAGTTCTGGCTCCACCATTTG-3’
实施例2具有重度免疫缺陷的MHC多肽人源化小鼠
除实施例1所述改造策略,还可以设计MHC分子人源化程度更高的小鼠。进一步的,可设计MHC分子人源化免疫缺陷小鼠,为糖尿病、移植排斥等免疫系统疾病发病机制研究、防治药物开发等提供高效的实验动物模型。本实施例以B-NDG小鼠为背景,对MHC分子进行更高程度的人源化改造,采用基因编辑技术对B-NDG小鼠进行修饰,在内源B2M基因座敲进一段含有编码人B2M蛋白和HLA-A2.1蛋白的编码序列,同时破坏小鼠B2M基因的编码框,期望得到的B-NDG背景人源化小鼠体内可表达人源化MHC分子,该MHC分子中含有人B2M蛋白和人HLA-A2.1蛋白,且该小鼠体内不表达内源B2M蛋白。进一步的,为确保人HLA-A2.1蛋白的正确表达,可将包含人HLA-A2.1的信号肽序列插入到人B2M编码区之前。最终得到的改造后的B-NDG背景人源化小鼠B2M基因座的示意图如图17所示,B-NDG背景人源化小鼠B2M、HLA-A2.1基因转录的mRNA序列如SEQ ID NO:52所示。该小鼠体内表达的蛋白如SEQ ID NO:62所示,但由于柔性接头的存在,该蛋白将会具有人B2M蛋白和人HLA-A2.1蛋白功能域。
鉴于人B2M具有多种亚型或转录本,本文所述的方法可应用于其它亚型或转录本。
进一步的,设计如图18所示的打靶策略示意图,靶向载体与实施例1的靶向载体相似,不同之处仅在于:5’同源臂(SEQ ID NO:60)与NCBI登录号为NC_000068.7的第122146329-122147737位核苷酸序列有99%的同源性,区别在于第122147015位G替换为T,122147108位和122147591位C替换为T;3’同源臂(SEQ ID NO:53)与NCBI登录号为NC_000068.7的第122152171-122153513位核苷酸序列有99%的同源性,区别在于第122152258位与122152391位G替换为A,122152771位A替换为G,122152788位1个A缺失,122153104位T替换为C,122153148位A替换为C;BNDG-A片段(SEQ ID NO:65)与A片段相似,区别在于其中包含编码全人HLA-A2.1蛋白的序列,该序列(SEQ ID NO:54)与GenBank序列号为AF055066.1的第95493-99436位核苷酸序列相同,且不包含小鼠H2-D1蛋白的编码序列部分。
靶向载体构建可采用常规方法进行,如酶切连接、直接合成等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体用于后续显微注射实验。sgRNA与实施例1使用的sgRNA一致。
具体来说,利用显微注射仪将pT7-B2M-HLA-A2.1-3、pT7-B2M-HLA-A2.1-14质粒的体外转录产物(使用Ambion体外转录试剂盒,按照说明书方法进行转录)、靶向载体与Cas9mRNA预混好后注射至B-NDG小鼠受精卵细胞质或细胞核中。按照《小鼠胚胎操作实验手册(第三版)》(安德拉斯·纳吉,化学工业出版社,2006)中的方法进行受精卵的显微注射,注射后的受精卵转移至培养液中短暂培养,然后移植至受体母鼠的输卵管中发育,将获得的F0代小鼠与B-NDG小鼠交配,通过对阳性子代的筛选、杂交和自交,扩大种群数量,建立稳定的B2M与HLA-A2.1基因突变B-NDG小鼠品系。
可通过常规检测方法(如PCR分析)鉴定F0代B-NDG背景人源化小鼠体细胞的基因型,部分F0代小鼠的鉴定结果见图19。结合5’端引物检测结果和3’端引物检测结果可知,图19中编号为BNDG-F0-01至BNDG-F0-06的6只小鼠均为阳性小鼠。PCR分析包括下述引物:
5’端引物:
L-GT-F(SEQ ID NO:41):5’-GAATGTGTGCCTCCTCTCAGTTTCC-3’
BNDG-L-GT-R(SEQ ID NO:55):5’-CAGCTCCAAAGAGAACCAGGCCAG-3’
3’端引物:
BNDG-R-GT-F(SEQ ID NO:56):5’-TACCCTGCGGAGATCACACTGACC-3’
R-GT-R(SEQ ID NO:44):5’-TCCAGCAATAAGAACCAGTCCCTAGCT-3’
将F0鉴定为阳性的人源化小鼠与B-NDG小鼠交配得到F1代小鼠。可使用同样的PCR方法对F1代小鼠进行基因型鉴定,鉴定结果见图20。进一步的,将PCR鉴定为阳性的2只F1小鼠进行Southern blot检测,确认是否存在随机插入。剪取鼠尾提取基因组DNA,选用EcoNI或SspI酶消化基因组,转膜,杂交。探针BNDG-P1、BNDG-P2(见表4)分别位于5’同源臂外侧和3’同源臂上。探针合成引物如下:
BNDG-P1-F(SEQ ID NO:57):5’-TTCTGATGCTCCTTCCTTCCGTGC-3’
BNDG-P1-R(SEQ ID NO:58):5’-TTCTCTGTGCTCAGTGTTCCCTGC-3’
BNDG-P2-F(SEQ ID NO:47):5’-TAACTTCATGTAAGGCACCGTCAC-3’
BNDG-P2-R(SEQ ID NO:48):5’-TCCAGACCTCACCATCAAATGAG-3’
表4具体探针及目的片段的长度
限制性内切酶 探针 野生型片段大小 重组序列片段大小
EcoNI BNDG-P1探针 8.8kb 5.3kb
SspI BNDG-P2探针 12.1 kb 7.6kb
Southern blot检测结果见图21。综合BNDG-P1、BNDG-P2探针的结果表明,2只小鼠均无随机插入,证实2只小鼠为阳性杂合小鼠且不存在随机插入,编号分别为BNDG-F1-01、BNDG-F1-02。这表明使用本方法能构建出可稳定传代且无随机插入的MHC人源化基因工程小鼠。
可通过常规检测方法确认B-NDG背景阳性小鼠体内人B2M蛋白和HLA-A2.1蛋白的表达情况,例如使用流式细胞术等。具体来说,分别选取6周龄雌性B-NDG小鼠和本实施例制备的B-NDG背景MHC人源化小鼠杂合子各1只,脱颈安乐死后取脾脏细胞,用抗鼠B2M抗体mβ2M PE或抗鼠H-2Kb/H-2Db抗体或抗人B2M抗体hβ2M PE或抗人HLA-A2抗体hHLA-A2 PE和抗鼠CD45抗体mCD45 APC识别染色后进行流式检测,检测结果见图22。如图所示,在B-NDG小鼠和B-NDG背景MHC人源化杂合子小鼠体内均可检测到表达鼠B2M的细胞(图22A、22B)或鼠H-2D细胞(图22E、22F),但只能在B-NDG背景MHC人源化小鼠体内检测到表达人B2M蛋白(图22D)或人HLA-A2蛋白的细胞(图22H),不能在B-NDG小鼠体内检测到表达人B2M蛋白的细胞(图22C)或人HLA-A2蛋白的细胞(图22G)。
实施例3基于胚胎干细胞的制备方法
采用其它基因编辑系统和制备方法也可以得到本发明的非人哺乳动物,包括但不限于利用胚胎干细胞(embryonic stem cell,ES)的基因打靶技术、锌指核酸酶(ZFN)技术、转录激活子样效应因子核酸酶(TALEN)技术、归巢核酸内切酶(兆碱基大范围核酶)或其他分子生物学技术。本实施例以传统的ES细胞基因同源重组技术为例,阐述如何采用其它方法制备获得MHC人源化小鼠。
根据本发明的基因编辑策略和MHC人源化小鼠基因示意图(图8、9),发明人设计了新的打靶策略并设计了新的靶向载体。鉴于本发明的目的之一是破坏小鼠B2M基因编码框,并在鼠B2M基因座插入编码人B2M和HLA-A2.1蛋白、小鼠H2-D1蛋白的核酸序列,为此,发明人设计了包含5’同源臂、3’同源臂人源化基因片段的靶向载体,在靶向载体上构建了用于阳性克隆筛选的抗性基因,如新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统,如Frt或LoxP重组位点。进一步的,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因,如白喉毒素A亚基的编码基因(DTA)。靶向载体构建可采用常规方法进行,如酶切连接等。将构建正确的靶向载体转染小鼠胚胎干细胞,利用阳性克隆筛选标记基因对得到的靶向载体转染细胞进行筛选,并利用Southern Blot技术进行DNA重组鉴定。将筛选出的正确阳性克隆按照《小鼠胚胎操作实验手册(第三版)》中的方法将阳性克隆细胞(黑色鼠)通过显微注射进入已分离好的囊胚中(白色鼠),注射后的嵌合囊胚转移至培养液中短暂培养,然后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。通过提取鼠尾基因组和PCR检测,挑选基因正确重组的F0代嵌合鼠用于后续繁殖和鉴定。将F0代嵌合鼠与野生型鼠交配获得F1代鼠,通过提取鼠尾基因组和PCR检测,挑选可以稳定遗传的基因重组阳性F1代杂合子小鼠。再将F1代杂合小鼠互相交配即可获得基因重组阳性F2代纯合子鼠。此外,可将F1代杂合鼠与Flp或Cre工具鼠交配去除阳性克隆筛选标记基因(neo等)后,再通过互相交配即可得到基因人源化纯合子小鼠。对获得的F1代杂合或F2代纯合鼠进行基因型和表型检测的方法与前述实施例1一致。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
序列表
<110> 北京百奥赛图基因生物技术有限公司
<120> MHC分子人源化的非人动物的构建方法及应用
<130> 1
<160> 68
<170> SIPOSequenceListing 1.0
<210> 1
<211> 858
<212> DNA/RNA
<213> 小鼠(Mouse)
<400> 1
tttcagtggc tgctactcgg cgcttcagtc gcggtcgctt cagtcgtcag catggctcgc 60
tcggtgaccc tggtctttct ggtgcttgtc tcactgaccg gcctgtatgc tatccagaaa 120
acccctcaaa ttcaagtata ctcacgccac ccaccggaga atgggaagcc gaacatactg 180
aactgctacg taacacagtt ccacccgcct cacattgaaa tccaaatgct gaagaacggg 240
aaaaaaattc ctaaagtaga gatgtcagat atgtccttca gcaaggactg gtctttctat 300
atcctggctc acactgaatt cacccccact gagactgata catacgcctg cagagttaag 360
catgccagta tggccgagcc caagaccgtc tactgggatc gagacatgtg atcaagcatc 420
atgatgctct gaagattcat ttgaacctgc ttaattacaa atccagtttc taatatgcta 480
tacaatttat gcacgcagaa agaaatagca atgtacacat caccttcttt atatcttact 540
ttaaatattt tatgcatgtt ttcaaaaaat tggaaatatc ctagatagct gagcaataaa 600
tcttcaataa gtattttgat cagaataata aatataattt taagaacaat agttgatcat 660
atgccaaacc ctctgtactt ctcattactt ggatgcagtt actcatcttt ggtctatcac 720
aacataagtg acatactttc cttttggtaa agcaaagagg cctaattgaa gtctgtcact 780
gtgcccaatg cttagcaatt ctcaccccca accctgtggc tacttctgct tttgttactt 840
ttactaaaaa taaaaaac 858
<210> 2
<211> 119
<212> PRT
<213> 小鼠(Mouse)
<400> 2
Met Ala Arg Ser Val Thr Leu Val Phe Leu Val Leu Val Ser Leu Thr
1 5 10 15
Gly Leu Tyr Ala Ile Gln Lys Thr Pro Gln Ile Gln Val Tyr Ser Arg
20 25 30
His Pro Pro Glu Asn Gly Lys Pro Asn Ile Leu Asn Cys Tyr Val Thr
35 40 45
Gln Phe His Pro Pro His Ile Glu Ile Gln Met Leu Lys Asn Gly Lys
50 55 60
Lys Ile Pro Lys Val Glu Met Ser Asp Met Ser Phe Ser Lys Asp Trp
65 70 75 80
Ser Phe Tyr Ile Leu Ala His Thr Glu Phe Thr Pro Thr Glu Thr Asp
85 90 95
Thr Tyr Ala Cys Arg Val Lys His Ala Ser Met Ala Glu Pro Lys Thr
100 105 110
Val Tyr Trp Asp Arg Asp Met
115
<210> 3
<211> 1675
<212> DNA/RNA
<213> 人(human)
<400> 3
attcctgaag ctgacagcat tcgggccgag atgtctcgct ccgtggcctt agctgtgctc 60
gcgctactct ctctttctgg cctggaggct atccagcgta ctccaaagat tcaggtttac 120
tcacgtcatc cagcagagaa tggaaagtca aatttcctga attgctatgt gtctgggttt 180
catccatccg acattgaagt tgacttactg aagaatggag agagaattga aaaagtggag 240
cattcagact tgtctttcag caaggactgg tctttctatc tcttgtacta cactgaattc 300
acccccactg aaaaagatga gtatgcctgc cgtgtgaacc atgtgacttt gtcacagccc 360
aagatagtta agtgggatcg agacatgtaa gcagcatcat ggaggtttga agatgccgca 420
tttggattgg atgaattcca aattctgctt gcttgctttt taatattgat atgcttatac 480
acttacactt tatgcacaaa atgtagggtt ataataatgt taacatggac atgatcttct 540
ttataattct actttgagtg ctgtctccat gtttgatgta tctgagcagg ttgctccaca 600
ggtagctcta ggagggctgg caacttagag gtggggagca gagaattctc ttatccaaca 660
tcaacatctt ggtcagattt gaactcttca atctcttgca ctcaaagctt gttaagatag 720
ttaagcgtgc ataagttaac ttccaattta catactctgc ttagaatttg ggggaaaatt 780
tagaaatata attgacagga ttattggaaa tttgttataa tgaatgaaac attttgtcat 840
ataagattca tatttacttc ttatacattt gataaagtaa ggcatggttg tggttaatct 900
ggtttatttt tgttccacaa gttaaataaa tcataaaact tgatgtgtta tctcttatat 960
ctcactccca ctattacccc tttattttca aacagggaaa cagtcttcaa gttccacttg 1020
gtaaaaaatg tgaacccctt gtatatagag tttggctcac agtgtaaagg gcctcagtga 1080
ttcacatttt ccagattagg aatctgatgc tcaaagaagt taaatggcat agttggggtg 1140
acacagctgt ctagtgggag gccagccttc tatattttag ccagcgttct ttcctgcggg 1200
ccaggtcatg aggagtatgc agactctaag agggagcaaa agtatctgaa ggatttaata 1260
ttttagcaag gaatagatat acaatcatcc cttggtctcc ctgggggatt ggtttcagga 1320
ccccttcttg gacaccaaat ctatggatat ttaagtccct tctataaaat ggtatagtat 1380
ttgcatataa cctatccaca tcctcctgta tactttaaat catttctaga ttacttgtaa 1440
tacctaatac aatgtaaatg ctatgcaaat agttgttatt gtttaaggaa taatgacaag 1500
aaaaaaaagt ctgtacatgc tcagtaaaga cacaaccatc cctttttttc cccagtgttt 1560
ttgatccatg gtttgctgaa tccacagatg tggagcccct ggatacggaa ggcccgctgt 1620
actttgaatg acaaataaca gatttaaaat tttcaaggca tagttttata cctga 1675
<210> 4
<211> 119
<212> PRT
<213> 人(human)
<400> 4
Met Ser Arg Ser Val Ala Leu Ala Val Leu Ala Leu Leu Ser Leu Ser
1 5 10 15
Gly Leu Glu Ala Ile Gln Arg Thr Pro Lys Ile Gln Val Tyr Ser Arg
20 25 30
His Pro Ala Glu Asn Gly Lys Ser Asn Phe Leu Asn Cys Tyr Val Ser
35 40 45
Gly Phe His Pro Ser Asp Ile Glu Val Asp Leu Leu Lys Asn Gly Glu
50 55 60
Arg Ile Glu Lys Val Glu His Ser Asp Leu Ser Phe Ser Lys Asp Trp
65 70 75 80
Ser Phe Tyr Leu Leu Tyr Tyr Thr Glu Phe Thr Pro Thr Glu Lys Asp
85 90 95
Glu Tyr Ala Cys Arg Val Asn His Val Thr Leu Ser Gln Pro Lys Ile
100 105 110
Val Lys Trp Asp Arg Asp Met
115
<210> 5
<211> 1736
<212> DNA/RNA
<213> 小鼠(Mouse)
<400> 5
tcagacaccc gggatcccag atgggggcga tggctccgcg cacgctgctc ctgctgctgg 60
cggccgccct ggccccgact cagacccgcg cgggcccaca ctcgatgcgg tatttcgaga 120
ccgccgtgtc ccggcccggc ctcgaggagc cccggtacat ctctgtcggc tatgtggaca 180
acaaggagtt cgtgcgcttc gacagcgacg cggagaatcc gagatatgag ccgcgggcgc 240
cgtggatgga gcaggagggg ccggagtatt gggagcggga aacacagaaa gccaagggcc 300
aagagcagtg gttccgagtg agcctgagga acctgctcgg ctactacaac cagagcgcgg 360
gcggctctca cacactccag cagatgtctg gctgtgactt ggggtcggac tggcgcctcc 420
tccgcgggta cctgcagttc gcctatgaag gccgcgatta catcgccctg aacgaagacc 480
tgaaaacgtg gacggcggcg gacatggcgg cgcagatcac ccgacgcaag tgggagcaga 540
gtggtgctgc agagcattac aaggcctacc tggagggcga gtgcgtggag tggctccaca 600
gatacctgaa gaacgggaac gcgacgctgc tgcgcacaga ttccccaaag gcacatgtga 660
cccatcaccc cagatctaaa ggtgaagtca ccctgaggtg ctgggccctg ggcttctacc 720
ctgctgacat caccctgacc tggcagttga atggggagga gctgacccag gacatggagc 780
ttgtggagac caggcctgca ggggatggaa ccttccagaa gtgggcatct gtggtggtgc 840
ctcttgggaa ggagcagaat tacacatgcc gtgtgtacca tgaggggctg cctgagcccc 900
tcaccctgag atgggagcct cctccgtcca ctgactctta catggtgatc gttgctgttc 960
tgggtgtcct tggagctatg gccatcattg gagctgtggt ggcttttgtg atgaagagaa 1020
ggagaaacac aggtggaaaa ggaggggact atgctctggc tccaggctcc cagagctctg 1080
aaatgtctct ccgagattgt aaagcgtgaa gacagctgcc tggactgtac tgagtgacag 1140
acgatgtgtt caggtctctc ctgtgacatc cagagccctc agttctcttt acacaacatt 1200
gtctgatgtt ccctgtgagc ttgggttcag tgtgaagaac tgtggagccc agcctgccct 1260
gcacaccagg accctatccc tgcactgccc tgtgttccct tccatagcca accttgctgc 1320
tccagccaaa cactggggga catctgcatc ctgtaagctc catgctaccc tgagctgcag 1380
ctcctcactt ccacactgag aataataatt tgaatgtggg tggctggaga gatggctcag 1440
cgctgactgc tcttccaaag gtcctgagtt caaatcccag caaccacatg gtggctcaca 1500
accatctgta atgggatcta acaccctctt ctgcagtgtc tgaagacagc tacagtgtac 1560
ttacatataa taataaataa gtctttaaaa aataatttga aagtgacctt gattgttaac 1620
atcttgatct agggctgatt tcttgttaat ttcatggatt gagaatgctt agaggttttt 1680
ttgtttgttt gattgatttt tttgaagaaa taaatggcag atgaaggaac ttccag 1736
<210> 6
<211> 362
<212> PRT
<213> 小鼠(Mouse)
<400> 6
Met Gly Ala Met Ala Pro Arg Thr Leu Leu Leu Leu Leu Ala Ala Ala
1 5 10 15
Leu Ala Pro Thr Gln Thr Arg Ala Gly Pro His Ser Met Arg Tyr Phe
20 25 30
Glu Thr Ala Val Ser Arg Pro Gly Leu Glu Glu Pro Arg Tyr Ile Ser
35 40 45
Val Gly Tyr Val Asp Asn Lys Glu Phe Val Arg Phe Asp Ser Asp Ala
50 55 60
Glu Asn Pro Arg Tyr Glu Pro Arg Ala Pro Trp Met Glu Gln Glu Gly
65 70 75 80
Pro Glu Tyr Trp Glu Arg Glu Thr Gln Lys Ala Lys Gly Gln Glu Gln
85 90 95
Trp Phe Arg Val Ser Leu Arg Asn Leu Leu Gly Tyr Tyr Asn Gln Ser
100 105 110
Ala Gly Gly Ser His Thr Leu Gln Gln Met Ser Gly Cys Asp Leu Gly
115 120 125
Ser Asp Trp Arg Leu Leu Arg Gly Tyr Leu Gln Phe Ala Tyr Glu Gly
130 135 140
Arg Asp Tyr Ile Ala Leu Asn Glu Asp Leu Lys Thr Trp Thr Ala Ala
145 150 155 160
Asp Met Ala Ala Gln Ile Thr Arg Arg Lys Trp Glu Gln Ser Gly Ala
165 170 175
Ala Glu His Tyr Lys Ala Tyr Leu Glu Gly Glu Cys Val Glu Trp Leu
180 185 190
His Arg Tyr Leu Lys Asn Gly Asn Ala Thr Leu Leu Arg Thr Asp Ser
195 200 205
Pro Lys Ala His Val Thr His His Pro Arg Ser Lys Gly Glu Val Thr
210 215 220
Leu Arg Cys Trp Ala Leu Gly Phe Tyr Pro Ala Asp Ile Thr Leu Thr
225 230 235 240
Trp Gln Leu Asn Gly Glu Glu Leu Thr Gln Asp Met Glu Leu Val Glu
245 250 255
Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ser Val Val
260 265 270
Val Pro Leu Gly Lys Glu Gln Asn Tyr Thr Cys Arg Val Tyr His Glu
275 280 285
Gly Leu Pro Glu Pro Leu Thr Leu Arg Trp Glu Pro Pro Pro Ser Thr
290 295 300
Asp Ser Tyr Met Val Ile Val Ala Val Leu Gly Val Leu Gly Ala Met
305 310 315 320
Ala Ile Ile Gly Ala Val Val Ala Phe Val Met Lys Arg Arg Arg Asn
325 330 335
Thr Gly Gly Lys Gly Gly Asp Tyr Ala Leu Ala Pro Gly Ser Gln Ser
340 345 350
Ser Glu Met Ser Leu Arg Asp Cys Lys Ala
355 360
<210> 7
<211> 1611
<212> DNA/RNA
<213> 人(human)
<400> 7
gagaagccaa tcagtgtcgt cgcggtcgct gttctaaagt ccgcacgcac ccaccgggac 60
tcagattctc cccagacgcc gaggatggcc gtcatggcgc cccgaaccct cctcctgcta 120
ctctcggggg ccctggccct gacccagacc tgggcgggct cccactccat gaggtatttc 180
ttcacatccg tgtcccggcc cggccgcggg gagccccgct tcatcgccgt gggctacgtg 240
gacgacacgc agttcgtgcg gttcgacagc gacgccgcga gccagaagat ggagccgcgg 300
gcgccgtgga tagagcagga ggggccggag tattgggacc aggagacacg gaatatgaag 360
gcccactcac agactgaccg agcgaacctg gggaccctgc gcggctacta caaccagagc 420
gaggacggtt ctcacaccat ccagataatg tatggctgcg acgtggggcc ggacgggcgc 480
ttcctccgcg ggtaccggca ggacgcctac gacggcaagg attacatcgc cctgaacgag 540
gacctgcgct cttggaccgc ggcggacatg gcagctcaga tcaccaagcg caagtgggag 600
gcggtccatg cggcggagca gcggagagtc tacctggagg gccggtgcgt ggacgggctc 660
cgcagatacc tggagaacgg gaaggagacg ctgcagcgca cggacccccc caagacacat 720
atgacccacc accccatctc tgaccatgag gccaccctga ggtgctgggc cctgggcttc 780
taccctgcgg agatcacact gacctggcag cgggatgggg aggaccagac ccaggacacg 840
gagctcgtgg agaccaggcc tgcaggggat ggaaccttcc agaagtgggc ggctgtggtg 900
gtgccttctg gagaggagca gagatacacc tgccatgtgc agcatgaggg tctgcccaag 960
cccctcaccc tgagatggga gctgtcttcc cagcccacca tccccatcgt gggcatcatt 1020
gctggcctgg ttctccttgg agctgtgatc actggagctg tggtcgctgc cgtgatgtgg 1080
aggaggaaga gctcagatag aaaaggaggg agttacactc aggctgcaag cagtgacagt 1140
gcccagggct ctgatgtgtc tctcacagct tgtaaagtgt gagacagctg ccttgtgtgg 1200
gactgagagg caagagttgt tcctgccctt ccctttgtga cttgaagaac cctgactttg 1260
tttctgcaaa ggcacctgca tgtgtctgtg ttcgtgtagg cataatgtga ggaggtgggg 1320
agagcacccc acccccatgt ccaccatgac cctcttccca cgctgacctg tgctccctct 1380
ccaatcatct ttcctgttcc agagaggtgg ggctgaggtg tctccatctc tgtctcaact 1440
tcatggtgca ctgagctgta acttcttcct tccctattaa aattagaacc tgagtataaa 1500
tttactttct caaattcttg ccatgagagg ttgatgagtt aattaaagga gaagattcct 1560
aaaatttgag agacaaaatt aatggaacgc atgagaacct tccagagtcc a 1611
<210> 8
<211> 365
<212> PRT
<213> 人(human)
<400> 8
Met Ala Val Met Ala Pro Arg Thr Leu Leu Leu Leu Leu Ser Gly Ala
1 5 10 15
Leu Ala Leu Thr Gln Thr Trp Ala Gly Ser His Ser Met Arg Tyr Phe
20 25 30
Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe Ile Ala
35 40 45
Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser Asp Ala
50 55 60
Ala Ser Gln Lys Met Glu Pro Arg Ala Pro Trp Ile Glu Gln Glu Gly
65 70 75 80
Pro Glu Tyr Trp Asp Gln Glu Thr Arg Asn Met Lys Ala His Ser Gln
85 90 95
Thr Asp Arg Ala Asn Leu Gly Thr Leu Arg Gly Tyr Tyr Asn Gln Ser
100 105 110
Glu Asp Gly Ser His Thr Ile Gln Ile Met Tyr Gly Cys Asp Val Gly
115 120 125
Pro Asp Gly Arg Phe Leu Arg Gly Tyr Arg Gln Asp Ala Tyr Asp Gly
130 135 140
Lys Asp Tyr Ile Ala Leu Asn Glu Asp Leu Arg Ser Trp Thr Ala Ala
145 150 155 160
Asp Met Ala Ala Gln Ile Thr Lys Arg Lys Trp Glu Ala Val His Ala
165 170 175
Ala Glu Gln Arg Arg Val Tyr Leu Glu Gly Arg Cys Val Asp Gly Leu
180 185 190
Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr Asp Pro
195 200 205
Pro Lys Thr His Met Thr His His Pro Ile Ser Asp His Glu Ala Thr
210 215 220
Leu Arg Cys Trp Ala Leu Gly Phe Tyr Pro Ala Glu Ile Thr Leu Thr
225 230 235 240
Trp Gln Arg Asp Gly Glu Asp Gln Thr Gln Asp Thr Glu Leu Val Glu
245 250 255
Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ala Val Val
260 265 270
Val Pro Ser Gly Glu Glu Gln Arg Tyr Thr Cys His Val Gln His Glu
275 280 285
Gly Leu Pro Lys Pro Leu Thr Leu Arg Trp Glu Leu Ser Ser Gln Pro
290 295 300
Thr Ile Pro Ile Val Gly Ile Ile Ala Gly Leu Val Leu Leu Gly Ala
305 310 315 320
Val Ile Thr Gly Ala Val Val Ala Ala Val Met Trp Arg Arg Lys Ser
325 330 335
Ser Asp Arg Lys Gly Gly Ser Tyr Thr Gln Ala Ala Ser Ser Asp Ser
340 345 350
Ala Gln Gly Ser Asp Val Ser Leu Thr Ala Cys Lys Val
355 360 365
<210> 9
<211> 2109
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 9
tttcagtggc tgctactcgg cgcttcagtc gcggtcgctt cagtcgtcag catggccgtc 60
atggcgcccc gaaccctcgt cctgctactc tcgggggctc tggccctgac ccagacctgg 120
gcgatccagc gtactccaaa gattcaggtt tactcacgtc atccagcaga gaatggaaag 180
tcaaatttcc tgaattgcta tgtgtctggg tttcatccat ccgacattga agttgactta 240
ctgaagaatg gagagagaat tgaaaaagtg gagcattcag acttgtcttt cagcaaggac 300
tggtctttct atctcttgta ctacactgaa ttcaccccca ctgaaaaaga tgagtatgcc 360
tgccgtgtga accatgtgac tttgtcacag cccaagatag ttaagtggga tcgagacatg 420
ggaggtggcg gatccggcgg aggcggctcg ggtggcggcg gctctggctc tcactccatg 480
aggtatttct tcacatccgt gtcccggccc ggccgcgggg agccccgctt catcgcagtg 540
ggctacgtgg acgacacgca gttcgtgcgg ttcgacagcg acgccgcgag ccagaggatg 600
gagccgcggg cgccgtggat agagcaggag ggtccggagt attgggacgg ggagacacgg 660
aaagtgaagg cccactcaca gactcaccga gtggacctgg ggaccctgcg cggctactac 720
aaccagagcg aggccggttc tcacaccgtc cagaggatgt atggctgcga cgtggggtcg 780
gactggcgct tcctccgcgg gtaccaccag tacgcctacg acggcaagga ttacatcgcc 840
ctgaaagagg acctgcgctc ttggaccgcg gcggacatgg cagctcagac caccaagcac 900
aagtgggagg cggcccatgt ggcggagcag ttgagagcct acctggaggg cacgtgcgtg 960
gagtggctcc gcagatacct ggagaacggg aaggagacgc tgcagcgcac ggattcccca 1020
aaggcacatg tgacccatca ccccagatct aaaggtgaag tcaccctgag gtgctgggcc 1080
ctgggcttct accctgctga catcaccctg acctggcagt tgaatgggga ggagctgacc 1140
caggacatgg agcttgtgga gaccaggcct gcaggggatg gaaccttcca gaagtgggca 1200
tctgtggtgg tgcctcttgg gaaggagcag aattacacat gccgtgtgta ccatgagggg 1260
ctgcctgagc ccctcaccct gagatgggag cctcctccgt ccactgactc ttacatggtg 1320
atcgttgctg ttctgggtgt ccttggagct atggccatca ttggagctgt ggtggctttt 1380
gtgatgaaga gaaggagaaa cacaggtgga aaaggagggg actatgctct ggctccaggc 1440
tcccagagct ctgaaatgtc tctccgagat tgtaaagcgt gaagacagct gcctggactg 1500
tactgagtga cagacgatgt gttcaggtct ctcctgtgac atccagagcc ctcagttctc 1560
tttacacaac attgtctgat gttccctgtg agcttgggtt cagtgtgaag aactgtggag 1620
cccagcctgc cctgcacacc aggaccctat ccctgcactg ccctgtgttc ccttccatag 1680
ccaaccttgc tgctccagcc aaacactggg ggacatctgc atcctgtaag ctccatgcta 1740
ccctgagctg cagctcctca cttccacact gagaataata atttgaatgt gggtggctgg 1800
agagatggct cagcgctgac tgctcttcca aaggtcctga gttcaaatcc cagcaaccac 1860
atggtggctc acaaccatct gtaatgggat ctaacaccct cttctgcagt gtctgaagac 1920
agctacagtg tacttacata taataataaa taagtcttta aaaaataatt tgaaagtgac 1980
cttgattgtt aacatcttga tctagggctg atttcttgtt aatttcatgg attgagaatg 2040
cttagaggtt tttttgtttg tttgattgat ttttttgaag aaataaatgg cagatgaagg 2100
aacttccag 2109
<210> 10
<211> 4694
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tttcagtggc tgctactcgg cgcttcagtc gcggtcgctt cagtcgtcag catggccgtc 60
atggcgcccc gaaccctcgt cctgctactc tcgggggctc tggccctgac ccagacctgg 120
gcgatccagc gtactccaaa gattcaggtt tactcacgtc atccagcaga gaatggaaag 180
tcaaatttcc tgaattgcta tgtgtctggg tttcatccat ccgacattga agttgactta 240
ctgaagaatg gagagagaat tgaaaaagtg gagcattcag acttgtcttt cagcaaggac 300
tggtctttct atctcttgta ctacactgaa ttcaccccca ctgaaaaaga tgagtatgcc 360
tgccgtgtga accatgtgac tttgtcacag cccaagatag ttaagtggga tcgagacatg 420
ggaggtggcg gatccggcgg aggcggctcg ggtggcggcg gctctggctc tcactccatg 480
aggtatttct tcacatccgt gtcccggccc ggccgcgggg agccccgctt catcgcagtg 540
ggctacgtgg acgacacgca gttcgtgcgg ttcgacagcg acgccgcgag ccagaggatg 600
gagccgcggg cgccgtggat agagcaggag ggtccggagt attgggacgg ggagacacgg 660
aaagtgaagg cccactcaca gactcaccga gtggacctgg ggaccctgcg cggctactac 720
aaccagagcg aggccggtga gtgaccccgg cccggggcgc aggtcacgac ctctcatccc 780
ccacggacgg gccaggtcgc ccacagtctc cgggtccgag atccgccccg aagccgcggg 840
accccgagac ccttgccccg ggagaggccc aggcgccttt acccggtttc attttcagtt 900
taggccaaaa atccccccag gttggtcggg gcggggcggg gctcggggga ccgggctgac 960
cgcggggtcc gggccaggtt ctcacaccgt ccagaggatg tatggctgcg acgtggggtc 1020
ggactggcgc ttcctccgcg ggtaccacca gtacgcctac gacggcaagg attacatcgc 1080
cctgaaagag gacctgcgct cttggaccgc ggcggacatg gcagctcaga ccaccaagca 1140
caagtgggag gcggcccatg tggcggagca gttgagagcc tacctggagg gcacgtgcgt 1200
ggagtggctc cgcagatacc tggagaacgg gaaggagacg ctgcagcgca cgggtaccag 1260
gggccacggg gcgcctccct gatcgcctgt agatctggat cctgtgtgac atacctgtac 1320
cttgtcctcc agagtcaggg gctgggagtc attttctctg gctacagact ttgtgatggc 1380
tgttcactcg gactgacagt taacgttggt cagcaagatg accacagtgg ttgagtctca 1440
gtggtgggac ccttccagta gcatatgccc ctaattttga tatgaactca aacagatatt 1500
aaattactta ttttccattc cctattccat tctgtgacta tctctctcat gctattgaac 1560
atcacataag gatggccatg ttcacccact ggctcatgtg gattccctct tagcttcttt 1620
gtcccaaaag aaaatgtgca gtcctgtgct gaggggacca gctctgcttt tggtcactag 1680
tgcaatgaca gtgtagtgtc aaatagacac atagttcact ctcatcattg atttaactga 1740
gtcttgtgta gatttcagtt tgtcttgtta attgtggaat ttcttaaatc ttccacacag 1800
attccccaaa ggcacatgtg acccatcacc ccagatctaa aggtgaagtc accctgaggt 1860
gctgggccct gggcttctac cctgctgaca tcaccctgac ctggcagttg aatggggagg 1920
agctgaccca ggacatggag cttgtggaga ccaggcctgc aggggatgga accttccaga 1980
agtgggcatc tgtggtggtg cctcttggga aggagcagaa ttacacatgc cgtgtgtacc 2040
atgaggggct gcctgagccc ctcaccctga gatggggtaa ggagggtgtg ggtgcagagc 2100
tggggtcagg gaaagctgga gccttctgca gaccctgagc tggtcaggga tgagagctgg 2160
ggtcataacc ctcaccttca tttcctgtac ctgtccttcc cagagcctcc tccgtccact 2220
gactcttaca tggtgatcgt tgctgttctg ggtgtccttg gagctatggc catcattgga 2280
gctgtggtgg cttttgtgat gaagagaagg agaaacacag gtaagaaagg gcagggtctg 2340
agttttctct cagcctcctt tagaagtgtg ctctgctcat taatggggaa cacagccaca 2400
ccccacattg ctactgtctc taactgggtc tgctgtcagt tctgggaatt tccagtgtca 2460
agatcttcct tgaactctca cagcttttct tttcacaggt ggaaaaggag gggactatgc 2520
tctggctcca ggttagtgtg gggacaggat tgttctgggg gacattggag tgaagttgga 2580
gatgatggga gctctgggaa tccataatag ctcctccaga gaaatcttct aggggcctga 2640
gttgtgccat gaagtgaata cattcatgta catatgcata tacatttgtt ttgttttacc 2700
ctaggctccc agagctctga aatgtctctc cgagattgta aaggtgacac tctagggtct 2760
gattggggag gggcaatgtg gacatgattg ggtttcaggg actcccagaa tctcctgaga 2820
gtgagtggtg ggttgctgga atgttgtctt cacagtgatg gttcatgact ctcattctct 2880
agcgtgaaga cagctgcctg gactgtactg agtgacagac gatgtgttca ggtctctcct 2940
gtgacatcca gagccctcag ttctctttac acaacattgt ctgatgttcc ctgtgagctt 3000
gggttcagtg tgaagaactg tggagcccag cctgccctgc acaccaggac cctatccctg 3060
cactgccctg tgttcccttc catagccaac cttgctgctc cagccaaaca ctgggggaca 3120
tctgcatcct gtaagctcca tgctaccctg agctgcagct cctcacttcc acactgagaa 3180
taataatttg aatgtgggtg gctggagaga tggctcagcg ctgactgctc ttccaaaggt 3240
cctgagttca aatcccagca accacatggt ggctcacaac catctgtaat gggatctaac 3300
accctcttct gcagtgtctg aagacagcta cagtgtactt acatataata ataaataagt 3360
ctttaaaaaa taatttgaaa gtgaccttga ttgttaacat cttgatctag ggctgatttc 3420
ttgttaattt catggattga gaatgcttag aggttttttt gtttgtttga ttgatttttt 3480
tgaagaaata aatggcagat gaaggaactt ccagaatctg ggtcactatg ctgtgtgtat 3540
ctgttgggac aggatgaggc tgtggcagct gagtgtgaac agggctgtgc ccaggtgggc 3600
tcagtccatt ttgatctgtg atggggccac acctcggctg tgtcacctct gggctctgtt 3660
ctctccatca ctctgaggca catcctgaga gtttgtgatc acaaagacac agggagggcc 3720
tgagccttgc cctgtcccca ggattatgag cccctagggc taaagatcag agactcaact 3780
aggacagagc tctgcgggta catcttagcc ctttcagtct ctagttggta ggcactagat 3840
ttaccttctg gaggcttccg gacactcagg gaaagaaatg gacagggttg taacttcatg 3900
taaggcaccg tcactgatgt gtcagaagga agttgaggag cgtgagaggg aacgtgggtg 3960
tctctgtcag gtggagtcta gtggtagaaa atccagcttt tcggtgaaat ccagggccct 4020
tgaggccaaa agctcactca aatcttgtat tatatttatt tctaggaaag gggaattgat 4080
gaagggggtg gggatgggtg atctgcccag acaagcagtt accaaatggt ggagccagaa 4140
ctcacctcct ttaagaaggt gattgtccta caaactcatt tgatggtgag gtctggaatg 4200
taaataatgt aatgttcggc taaccttctc cttctctccc tcccttcccc ttttcttttc 4260
agctctgaag attcatttga acctgcttaa ttacaaatcc agtttctaat atgctataca 4320
atttatgcac gcagaaagaa atagcaatgt acacatcacc ttctttatat cttactttaa 4380
atattttatg catgttttca aaaaattgga aatatcctag atagctgagc aataaatctt 4440
caataagtat tttgatcaga ataataaata taattttaag aacaatagtt gatcatatgc 4500
caaaccctct gtacttctca ttacttggat gcagttactc atctttggtc tatcacaaca 4560
taagtgacat actttccttt tggtaaagca aagaggccta attgaagtct gtcactgtgc 4620
ccaatgctta gcaattctca cccccaaccc tgtggctact tctgcttttg ttacttttac 4680
taaaaataaa aaac 4694
<210> 11
<211> 1409
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gcatttccta gtacagttca acacagtgtt tagtataatt taatattaac atttcaggtc 60
tttaatgtat taaatgagtt tttcttttta attagatgaa gtatcttaac tcacaccttt 120
atacataaaa attattctta tatttcagtt acaaaaaggg atagcaaaat aacataaatg 180
attatgattc ttaaacatta ctggatcaaa atactatatg ctgggtagac actgtaggat 240
tgggtctctg tttattatct cattaatgtc cgtggagact attttatttt tttctagttt 300
agacacagcc tccacactag agattgttaa aggtttttaa aaatatgttc aagaaatcca 360
gaagttatgt tgttctcctt ggggaagcca aggccaaagc cacttcaact gcaagcatgg 420
ccatttctcc atgtcctgat gccccatgcc ctcttcctac ccttcctcac tcgagctgct 480
tgcggtggtg tctccctgtg ctcacagcct gcctctgtcc tggcttttgg ccaggggttt 540
aacttctcta ctgggtccac cgctgatgta atatacattc tgagtaaaac tatggcagcc 600
tttgtcttcc gagccgataa gcagaaaccc caagggaatg catctcaagg tttatctcct 660
catccagaaa aaataattta ttcggggatt cacttcactt ggtcacttag tttaccaatg 720
gccctgttct aagaaagtac tactaagaga atggacagga aacccagcta agccattgtc 780
cttccccaaa acccatggac agaacaaaga aaattaccta aatttttcaa gggtacccga 840
ttaagttctc catccaaagc tctaaaagga gaaacctgct agaagcaagg tcagaaatcc 900
tctcagttgc ctttaggaca ggagggtctt tttacacacg gaatcctgaa actgcctttg 960
tatttctggg ctgagattat aaactaaggg ttgagttctg ccagttaatg ctcttaattg 1020
tcctggcttt agttttcaag aatgcaaact tcaggtccta agtccttttc tgagtgggat 1080
attgtcagca attgaataaa tgaaggcggt cccaggctga acgaccagat acaccaaact 1140
caagagcaca ccctagatag tagggcacca agggtccagc ccaggctgtt tgaaatatca 1200
cgggacttta taagaacatg aaactgaaaa tgggaaagtc cctttgtaac ctagttcagc 1260
atcaacagct aggagactgg tgacgacctc cggatctgag tccggattgg ctgtgagttc 1320
aggaactata taagagcgcg cgccctggct ggctctcatt tcagtggctg ctactcggcg 1380
cttcagtcgc ggtcgcttca gtcgtcagc 1409
<210> 12
<211> 1343
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gacagagctc tgcgggtaca tcttagccct ttcagtctct agttggtagg cactagattt 60
accttctgga ggcttccgga cactcaggga aagaaatgga cagggttgta acttcatgta 120
aggcaccgtc actgatgtgt cagaaggaag ttgaggagcg tgagagggaa cgtgggtgtc 180
tctgtcaggt ggagtctagt ggtagaaaat ccagcttttc ggtgaaatcc agggcccttg 240
aggccaaaag ctcactcaaa tcttgtatta tatttatttc taggaaaggg gaattgatga 300
agggggtggg gatgggtgat ctgcccagac aagcagttac caaatggtgg agccagaact 360
cacctccttt aagaaggtga ttgtcctaca aactcatttg atggtgaggt ctggaatgta 420
aataatgtaa tgttcggcta accttctcct tctctccctc ccttcccctt ttcttttcag 480
ctctgaagat tcatttgaac ctgcttaatt acaaatccag tttctaatat gctatacaat 540
ttatgcacgc agaaagaaat agcaatgtac acatcacctt ctttatatct tactttaaat 600
attttatgca tgttttcaaa aaattggaaa tatcctagat agctgagcaa taaatcttca 660
ataagtattt tgatcagaat aataaatata attttaagaa caatagttga tcatatgcca 720
aaccctctgt acttctcatt acttggatgc agttactcat ctttggtcta tcacaacata 780
agtgacatac tttccttttg gtaaagcaaa gaggcctaat tgaagtctgt cactgtgccc 840
aatgcttagc aattctcacc cccaaccctg tggctacttc tgcttttgtt acttttacta 900
aaaataaaaa actaaaaaaa aaaaaaaaaa ttgttgccag acattgccag tgttacatga 960
agtggtttct aggtagcata aatgcctgca agcacgtgcg tatttttcat catctaaaga 1020
ggcagtgggt atcttagaag gttcttgcag aagcaggctc ctcaactaag ggtcgagagg 1080
aaagtgacta ggaaaggcct ccaaagcaga gcagtaggag gtggtgatga aggtcaggga 1140
ataataggaa gaaactgaga ggggagtgag gatctcagac gtgctggtcc cacagggagc 1200
tctagagcag agatcacatc ttacagtttg tcttggtgat gtgcacagct tgttgctggc 1260
tccacaggac tgtatgctag gatgaaagcc cagatacttt ggggtgcagg ttatggttat 1320
ggggtgcaag ttatggttat tgg 1343
<210> 13
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
atggccgtca tggcgccccg aaccctcgtc ctgctactct cgggggctct ggccctgacc 60
cagacctggg cg 72
<210> 14
<211> 297
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
atccagcgta ctccaaagat tcaggtttac tcacgtcatc cagcagagaa tggaaagtca 60
aatttcctga attgctatgt gtctgggttt catccatccg acattgaagt tgacttactg 120
aagaatggag agagaattga aaaagtggag cattcagact tgtctttcag caaggactgg 180
tctttctatc tcttgtacta cactgaattc acccccactg aaaaagatga gtatgcctgc 240
cgtgtgaacc atgtgacttt gtcacagccc aagatagtta agtgggatcg agacatg 297
<210> 15
<211> 831
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ggctctcact ccatgaggta tttcttcaca tccgtgtccc ggcccggccg cggggagccc 60
cgcttcatcg cagtgggcta cgtggacgac acgcagttcg tgcggttcga cagcgacgcc 120
gcgagccaga ggatggagcc gcgggcgccg tggatagagc aggagggtcc ggagtattgg 180
gacggggaga cacggaaagt gaaggcccac tcacagactc accgagtgga cctggggacc 240
ctgcgcggct actacaacca gagcgaggcc ggtgagtgac cccggcccgg ggcgcaggtc 300
acgacctctc atcccccacg gacgggccag gtcgcccaca gtctccgggt ccgagatccg 360
ccccgaagcc gcgggacccc gagacccttg ccccgggaga ggcccaggcg cctttacccg 420
gtttcatttt cagtttaggc caaaaatccc cccaggttgg tcggggcggg gcggggctcg 480
ggggaccggg ctgaccgcgg ggtccgggcc aggttctcac accgtccaga ggatgtatgg 540
ctgcgacgtg gggtcggact ggcgcttcct ccgcgggtac caccagtacg cctacgacgg 600
caaggattac atcgccctga aagaggacct gcgctcttgg accgcggcgg acatggcagc 660
tcagaccacc aagcacaagt gggaggcggc ccatgtggcg gagcagttga gagcctacct 720
ggagggcacg tgcgtggagt ggctccgcag atacctggag aacgggaagg agacgctgca 780
gcgcacgggt accaggggcc acggggcgcc tccctgatcg cctgtagatc t 831
<210> 16
<211> 2486
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
ggatcctgtg tgacatacct gtaccttgtc ctccagagtc aggggctggg agtcattttc 60
tctggctaca gactttgtga tggctgttca ctcggactga cagttaacgt tggtcagcaa 120
gatgaccaca gtggttgagt ctcagtggtg ggacccttcc agtagcatat gcccctaatt 180
ttgatatgaa ctcaaacaga tattaaatta cttattttcc attccctatt ccattctgtg 240
actatctctc tcatgctatt gaacatcaca taaggatggc catgttcacc cactggctca 300
tgtggattcc ctcttagctt ctttgtccca aaagaaaatg tgcagtcctg tgctgagggg 360
accagctctg cttttggtca ctagtgcaat gacagtgtag tgtcaaatag acacatagtt 420
cactctcatc attgatttaa ctgagtcttg tgtagatttc agtttgtctt gttaattgtg 480
gaatttctta aatcttccac acagattccc caaaggcaca tgtgacccat caccccagat 540
ctaaaggtga agtcaccctg aggtgctggg ccctgggctt ctaccctgct gacatcaccc 600
tgacctggca gttgaatggg gaggagctga cccaggacat ggagcttgtg gagaccaggc 660
ctgcagggga tggaaccttc cagaagtggg catctgtggt ggtgcctctt gggaaggagc 720
agaattacac atgccgtgtg taccatgagg ggctgcctga gcccctcacc ctgagatggg 780
gtaaggaggg tgtgggtgca gagctggggt cagggaaagc tggagccttc tgcagaccct 840
gagctggtca gggatgagag ctggggtcat aaccctcacc ttcatttcct gtacctgtcc 900
ttcccagagc ctcctccgtc cactgactct tacatggtga tcgttgctgt tctgggtgtc 960
cttggagcta tggccatcat tggagctgtg gtggcttttg tgatgaagag aaggagaaac 1020
acaggtaaga aagggcaggg tctgagtttt ctctcagcct cctttagaag tgtgctctgc 1080
tcattaatgg ggaacacagc cacaccccac attgctactg tctctaactg ggtctgctgt 1140
cagttctggg aatttccagt gtcaagatct tccttgaact ctcacagctt ttcttttcac 1200
aggtggaaaa ggaggggact atgctctggc tccaggttag tgtggggaca ggattgttct 1260
gggggacatt ggagtgaagt tggagatgat gggagctctg ggaatccata atagctcctc 1320
cagagaaatc ttctaggggc ctgagttgtg ccatgaagtg aatacattca tgtacatatg 1380
catatacatt tgttttgttt taccctaggc tcccagagct ctgaaatgtc tctccgagat 1440
tgtaaaggtg acactctagg gtctgattgg ggaggggcaa tgtggacatg attgggtttc 1500
agggactccc agaatctcct gagagtgagt ggtgggttgc tggaatgttg tcttcacagt 1560
gatggttcat gactctcatt ctctagcgtg aagacagctg cctggactgt actgagtgac 1620
agacgatgtg ttcaggtctc tcctgtgaca tccagagccc tcagttctct ttacacaaca 1680
ttgtctgatg ttccctgtga gcttgggttc agtgtgaaga actgtggagc ccagcctgcc 1740
ctgcacacca ggaccctatc cctgcactgc cctgtgttcc cttccatagc caaccttgct 1800
gctccagcca aacactgggg gacatctgca tcctgtaagc tccatgctac cctgagctgc 1860
agctcctcac ttccacactg agaataataa tttgaatgtg ggtggctgga gagatggctc 1920
agcgctgact gctcttccaa aggtcctgag ttcaaatccc agcaaccaca tggtggctca 1980
caaccatctg taatgggatc taacaccctc ttctgcagtg tctgaagaca gctacagtgt 2040
acttacatat aataataaat aagtctttaa aaaataattt gaaagtgacc ttgattgtta 2100
acatcttgat ctagggctga tttcttgtta atttcatgga ttgagaatgc ttagaggttt 2160
ttttgtttgt ttgattgatt tttttgaaga aataaatggc agatgaagga acttccagaa 2220
tctgggtcac tatgctgtgt gtatctgttg ggacaggatg aggctgtggc agctgagtgt 2280
gaacagggct gtgcccaggt gggctcagtc cattttgatc tgtgatgggg ccacacctcg 2340
gctgtgtcac ctctgggctc tgttctctcc atcactctga ggcacatcct gagagtttgt 2400
gatcacaaag acacagggag ggcctgagcc ttgccctgtc cccaggatta tgagccccta 2460
gggctaaaga tcagagactc aactag 2486
<210> 17
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
cctggccaat cccgtcggga agg 23
<210> 18
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ccgtcagcac actcgcaaac agg 23
<210> 19
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
gttctccttc ccgacgggat tgg 23
<210> 20
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
actctggata gcatacaggc cgg 23
<210> 21
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ctggtgcttg tctcactgac cgg 23
<210> 22
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
ggggaaagag gcactcactc tgg 23
<210> 23
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
gacaagcacc agaaagacca ggg 23
<210> 24
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
ctggaggctt ccggacactc agg 23
<210> 25
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
tgatcaagca tcatgatggt agg 23
<210> 26
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
aggagcgtga gagggaacgt ggg 23
<210> 27
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gaggaacgta gccatgtcac tgg 23
<210> 28
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
catgtcactg gccctctaaa ggg 23
<210> 29
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
catgtgatca agcatcatga tgg 23
<210> 30
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
acccgcagag ctctgtcact cgg 23
<210> 31
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
ctctgtcact cggctcctct ggg 23
<210> 32
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gttctccttc ccgacgggat 20
<210> 33
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
taggttctcc ttcccgacgg gat 23
<210> 34
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
atcccgtcgg gaaggagaa 19
<210> 35
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
aaacatcccg tcgggaagga gaa 23
<210> 36
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
acccgcagag ctctgtcact 20
<210> 37
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
taggacccgc agagctctgt cact 24
<210> 38
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
agtgacagac tctgcgggt 19
<210> 39
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
aaacagtgac agactctgcg ggt 23
<210> 40
<211> 132
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
gaattctaat acgactcact atagggggtc ttcgagaaga cctgttttag agctagaaat 60
agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120
tttaaaggat cc 132
<210> 41
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
gaatgtgtgc ctcctctcag tttcc 25
<210> 42
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
tccttcccgt tctccaggta tctgc 25
<210> 43
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
gcggctacta caaccagagc gag 23
<210> 44
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
tccagcaata agaaccagtc cctagct 27
<210> 45
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
atgaggtctt tttgtgggca gagca 25
<210> 46
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
ctccctacgg ccacatcacc attac 25
<210> 47
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
taacttcatg taaggcaccg tcac 24
<210> 48
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
tccagacctc accatcaaat gag 23
<210> 49
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
gaataaatga aggcggtccc aggct 25
<210> 50
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
aggtgagttc tggctccacc atttg 25
<210> 51
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
ggaggtggcg gatccggcgg aggcggctcg ggtggcggcg gctct 45
<210> 52
<211> 1891
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 52
tttcagtggc tgctactcgg cgcttcagtc gcggtcgctt cagtcgtcag catggccgtc 60
atggcgcccc gaaccctcgt cctgctactc tcgggggctc tggccctgac ccagacctgg 120
gcgatccagc gtactccaaa gattcaggtt tactcacgtc atccagcaga gaatggaaag 180
tcaaatttcc tgaattgcta tgtgtctggg tttcatccat ccgacattga agttgactta 240
ctgaagaatg gagagagaat tgaaaaagtg gagcattcag acttgtcttt cagcaaggac 300
tggtctttct atctcttgta ctacactgaa ttcaccccca ctgaaaaaga tgagtatgcc 360
tgccgtgtga accatgtgac tttgtcacag cccaagatag ttaagtggga tcgagacatg 420
ggaggtggcg gatccggcgg aggcggctcg ggtggcggcg gctctggctc tcactccatg 480
aggtatttct tcacatccgt gtcccggccc ggccgcgggg agccccgctt catcgcagtg 540
ggctacgtgg acgacacgca gttcgtgcgg ttcgacagcg acgccgcgag ccagaggatg 600
gagccgcggg cgccgtggat agagcaggag ggtccggagt attgggacgg ggagacacgg 660
aaagtgaagg cccactcaca gactcaccga gtggacctgg ggaccctgcg cggctactac 720
aaccagagcg aggccggttc tcacaccgtc cagaggatgt atggctgcga cgtggggtcg 780
gactggcgct tcctccgcgg gtaccaccag tacgcctacg acggcaagga ttacatcgcc 840
ctgaaagagg acctgcgctc ttggaccgcg gcggacatgg cagctcagac caccaagcac 900
aagtgggagg cggcccatgt ggcggagcag ttgagagcct acctggaggg cacgtgcgtg 960
gagtggctcc gcagatacct ggagaacggg aaggagacgc tgcagcgcac ggacgccccc 1020
aaaacgcata tgactcacca cgctgtctct gaccatgaag ccaccctgag gtgctgggcc 1080
ctgagcttct accctgcgga gatcacactg acctggcagc gggatgggga ggaccagacc 1140
caggacacgg agctcgtgga gaccaggcct gcaggggatg gaaccttcca gaagtgggcg 1200
gctgtggtgg tgccttctgg acaggagcag agatacacct gccatgtgca gcatgagggt 1260
ttgcccaagc ccctcaccct gagatgggag ccgtcttccc agcccaccat ccccatcgtg 1320
ggcatcattg ctggcctggt tctctttgga gctgtgatca ctggagctgt ggtcgctgct 1380
gtgatgtgga ggaggaagag ctcagataga aaaggaggga gctactctca ggctgcaagc 1440
agtgacagtg cccagggctc tgatgtgtct ctcacagctt gtaaagtgtg agacagctgc 1500
cttgtgtggg actgagaggc aagagttgtt cctgcccttc cctttgtgac ttgaagaacc 1560
ctgactttgt ttctgcaaag gcacctgcat gtgtctgtgt tcgtgtaggc ataatgtgag 1620
gaggtgggga gaccacccca cccccatgtc caccatgacc ctcttcccac gctgacctgt 1680
gctccctccc caatcatctt tcctgttcca gagaggtggg gctgaggtgt ctccatctct 1740
gtctcaactt catggtgcac tgagctgtaa cttcttcctt ccctattaaa attagaacct 1800
gagtataaat ttactttctc aaattcttgc catgagaggt tgatgagtta attaaaggag 1860
aagattccta aaatttgaga gacaaaataa a 1891
<210> 53
<211> 1342
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
gacagagctc tgcgggtaca tcttagccct ttcagtctct agttggtagg cactagattt 60
accttctgga ggcttccgga cactcagaga aagaaatgga cagggttgta acttcatgta 120
aggcaccgtc actgatgtgt cagaaggaag ttgaggagcg tgagagggaa cgtgggtgtc 180
tctgtcaggt ggagtctagt ggtagaaaat ccagcttttc agtgaaatcc agggcccttg 240
aggccaaaag ctcactcaaa tcttgtatta tatttatttc taggaaaggg gaattgatga 300
agggggtggg gatgggtgat ctgcccagac aagcagttac caaatggtgg agccagaact 360
cacctccttt aagaaggtga ttgtcctaca aactcatttg atggtgaggt ctggaatgta 420
aataatgtaa tgttcggcta accttctcct tctctccctc ccttcccctt ttcttttcag 480
ctctgaagat tcatttgaac ctgcttaatt acaaatccag tttctaatat gctatacaat 540
ttatgcacgc agaaagaaat agcaatgtac acatcacctt ctttatatct tactttaaat 600
gttttatgca tgttttcaaa aattggaaat atcctagata gctgagcaat aaatcttcaa 660
taagtatttt gatcagaata ataaatataa ttttaagaac aatagttgat catatgccaa 720
accctctgta cttctcatta cttggatgca gttactcatc tttggtctat cacaacataa 780
gtgacatact ttccttttgg taaagcaaag aggcctaatt gaagtctgtc actgtgccca 840
atgcttagca attctcaccc ccaaccctgt ggctacttct gcttttgtta cttttactaa 900
aaataaaaaa ctaaaaaaaa aaaaaaaaat tgctgccaga cattgccagt gttacatgaa 960
gtggtttcta ggtagcctaa atgcctgcaa gcacgtgcgt atttttcatc atctaaagag 1020
gcagtgggta tcttagaagg ttcttgcaga agcaggctcc tcaactaagg gtcgagagga 1080
aagtgactag gaaaggcctc caaagcagag cagtaggagg tggtgatgaa ggtcagggaa 1140
taataggaag aaactgagag gggagtgagg atctcagacg tgctggtccc acagggagct 1200
ctagagcaga gatcacatct tacagtttgt cttggtgatg tgcacagctt gttgctggct 1260
ccacaggact gtatgctagg atgaaagccc agatactttg gggtgcaggt tatggttatg 1320
gggtgcaagt tatggttatt gg 1342
<210> 54
<211> 3944
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
ggctctcact ccatgaggta tttcttcaca tccgtgtccc ggcccggccg cggggagccc 60
cgcttcatcg cagtgggcta cgtggacgac acgcagttcg tgcggttcga cagcgacgcc 120
gcgagccaga ggatggagcc gcgggcgccg tggatagagc aggagggtcc ggagtattgg 180
gacggggaga cacggaaagt gaaggcccac tcacagactc accgagtgga cctggggacc 240
ctgcgcggct actacaacca gagcgaggcc ggtgagtgac cccggcccgg ggcgcaggtc 300
acgacctctc atcccccacg gacgggccag gtcgcccaca gtctccgggt ccgagatccg 360
ccccgaagcc gcgggacccc gagacccttg ccccgggaga ggcccaggcg cctttacccg 420
gtttcatttt cagtttaggc caaaaatccc cccaggttgg tcggggcggg gcggggctcg 480
ggggaccggg ctgaccgcgg ggtccgggcc aggttctcac accgtccaga ggatgtatgg 540
ctgcgacgtg gggtcggact ggcgcttcct ccgcgggtac caccagtacg cctacgacgg 600
caaggattac atcgccctga aagaggacct gcgctcttgg accgcggcgg acatggcagc 660
tcagaccacc aagcacaagt gggaggcggc ccatgtggcg gagcagttga gagcctacct 720
ggagggcacg tgcgtggagt ggctccgcag atacctggag aacgggaagg agacgctgca 780
gcgcacgggt accaggggcc acggggcgcc tccctgatcg cctgtagatc tcccgggctg 840
gcctcccaca aggaggggag acaattggga ccaacactag aatatcgccc tccctctggt 900
cctgagggag aggaatcctc ctgggtttcc agatcctgta ccagagagtg actctgaggt 960
tccgccctgc tctctgacac aattaaggga taaaatctct gaaggaatga cgggaagacg 1020
atccctcgaa tactgatgag tggttccctt tgacacacac aggcagcagc cttgggcccg 1080
tgacttttcc tctcaggcct tgttctctgc ttcacactca atgtgtgtgg gggtctgagt 1140
ccagcacttc tgagtccttc agcctccact caggtcagga ccagaagtcg ctgttccctc 1200
ttcagggact agaattttcc acggaatagg agattatccc aggtgcctgt gtccaggctg 1260
gtgtctgggt tctgtgctcc cttccccatc ccaggtgtcc tgtccattct caagatagcc 1320
acatgtgtgc tggaggagtg tcccatgaca gatgcaaaat gcctgaatga tctgactctt 1380
cctgacagac gcccccaaaa cgcatatgac tcaccacgct gtctctgacc atgaagccac 1440
cctgaggtgc tgggccctga gcttctaccc tgcggagatc acactgacct ggcagcggga 1500
tggggaggac cagacccagg acacggagct cgtggagacc aggcctgcag gggatggaac 1560
cttccagaag tgggcggctg tggtggtgcc ttctggacag gagcagagat acacctgcca 1620
tgtgcagcat gagggtttgc ccaagcccct caccctgaga tggggtaagg agggagacgg 1680
gggtgtcatg tcttttaggg aaagcaggag cctctctgac ctttagcagg gtcagggccc 1740
ctcaccttcc cctcttttcc cagagccgtc ttcccagccc accatcccca tcgtgggcat 1800
cattgctggc ctggttctct ttggagctgt gatcactgga gctgtggtcg ctgctgtgat 1860
gtggaggagg aagagctcag gtggggaagg ggtgaagggt gggtctgaga tttcttgtct 1920
cactgagggt tccaagaccc aggtagaagt gtgccctgcc tcgttactgg gaagcaccac 1980
ccacaattat gggcctaccc agcctgggcc ctgtgtgcca gcacttactc ttttgtaaag 2040
cacctgttaa aatgaaggac agatttatca ccttgattac agcggtgatg ggacctgatc 2100
ccagcagtca caagtcacag gggaaggtcc ctgaggacct tcaggagggc ggttggtcca 2160
ggacccacac ctgctttctt catgtttcct gatcccgccc tgggtctgca gtcacacatt 2220
tctggaaact tctctgaggt ccaagacttg gaggttcctc taggacctta aggccctgac 2280
tcctttctgg tatctcacag gacattttct tcccacagat agaaaaggag ggagctactc 2340
tcaggctgca agtaagtatg aaggaggctg atgcctgagg tccttgggat attgtgtttg 2400
ggagcccatg ggggagctca cccaccccac aattcctcct ctagccacat cttctgtggg 2460
atctgaccag gttctgtttt tgttctaccc caggcagtga cagtgcccag ggctctgatg 2520
tgtctctcac agcttgtaaa ggtgagagcc tggagggcct gatgtgtgtt gggtgttggg 2580
cggaacagtg gacacagctg tgctatgggg tttctttcca ttggatgtat tgagcatgcg 2640
atgggctgtt taaagtgtga cccctcactg tgacagatac gaatttgttc atgaatattt 2700
ttttctatag tgtgagacag ctgccttgtg tgggactgag aggcaagagt tgttcctgcc 2760
cttccctttg tgacttgaag aaccctgact ttgtttctgc aaaggcacct gcatgtgtct 2820
gtgttcgtgt aggcataatg tgaggaggtg gggagaccac cccaccccca tgtccaccat 2880
gaccctcttc ccacgctgac ctgtgctccc tccccaatca tctttcctgt tccagagagg 2940
tggggctgag gtgtctccat ctctgtctca acttcatggt gcactgagct gtaacttctt 3000
ccttccctat taaaattaga acctgagtat aaatttactt tctcaaattc ttgccatgag 3060
aggttgatga gttaattaaa ggagaagatt cctaaaattt gagagacaaa ataaatggaa 3120
cacatgagaa ccttccagag tccacgtgtt gcttatgctg atttgttgca ggggaggaga 3180
gtagatgggg ctgtgcccag tttctgttcc ggccactatg ggctttatgt ggtcactgct 3240
tggctgggtc atctttgctg ctccattgtc cttggccctt cagtagaacc ttgtcccact 3300
aagacctgtg atcacaggga gttggatgtc acctagggtg gtccctgcat acaaatctcc 3360
ttgcggtatc aagagacaaa ttttcagacc tgtctaggtc ttgccttcct cccagggctt 3420
tttcctcaat tgtattttca atttttctcc aatcttttta aaggaaccag attgtgacat 3480
ttgcagagag gagtggtccc atagtttctc atcatgatta actttctgtt ggaactcctg 3540
ttctgccctc ctactcttct tcctgctctg aattgtagta atcctagtgc tggctccaat 3600
ccaaactcat agatttataa agcagagtct aatttagatt catatgtggt tggaaaattg 3660
tacccataag gctagggtta ttgttcctga agagaaatat atggttttgt gctgaagtgt 3720
gcaggagggt tggtgtggga ggagggagga cacacaagca gccctggtga gaaaagcact 3780
ggcggcgtgg atgtccatgt gaacttatgt tctttagctg ccacaaaaca gcatttgccc 3840
tgtggctaca ttaataaagg tatgggcttt agaataggga gatgctctac agtggtcatt 3900
cattcaactg acatttgttg tctgctaggg atatgactgc tttt 3944
<210> 55
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
cagctccaaa gagaaccagg ccag 24
<210> 56
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
taccctgcgg agatcacact gacc 24
<210> 57
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
ttctgatgct ccttccttcc gtgc 24
<210> 58
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
ttctctgtgc tcagtgttcc ctgc 24
<210> 59
<211> 362
<212> PRT
<213> 人(human)
<400> 59
Met Ala Pro Arg Thr Leu Val Leu Leu Leu Ser Gly Ala Leu Ala Leu
1 5 10 15
Thr Gln Thr Trp Ala Gly Ser His Ser Met Arg Tyr Phe Phe Thr Ser
20 25 30
Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe Ile Ala Val Gly Tyr
35 40 45
Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser Asp Ala Ala Ser Gln
50 55 60
Arg Met Glu Pro Arg Ala Pro Trp Ile Glu Gln Glu Gly Pro Glu Tyr
65 70 75 80
Trp Asp Gly Glu Thr Arg Lys Val Lys Ala His Ser Gln Thr His Arg
85 90 95
Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr Asn Gln Ser Glu Ala Gly
100 105 110
Ser His Thr Val Gln Arg Met Tyr Gly Cys Asp Val Gly Ser Asp Trp
115 120 125
Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala Tyr Asp Gly Lys Asp Tyr
130 135 140
Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp Thr Ala Ala Asp Met Ala
145 150 155 160
Ala Gln Thr Thr Lys His Lys Trp Glu Ala Ala His Val Ala Glu Gln
165 170 175
Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val Glu Trp Leu Arg Arg Tyr
180 185 190
Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr Asp Ala Pro Lys Thr
195 200 205
His Met Thr His His Ala Val Ser Asp His Glu Ala Thr Leu Arg Cys
210 215 220
Trp Ala Leu Ser Phe Tyr Pro Ala Glu Ile Thr Leu Thr Trp Gln Arg
225 230 235 240
Asp Gly Glu Asp Gln Thr Gln Asp Thr Glu Leu Val Glu Thr Arg Pro
245 250 255
Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ala Val Val Val Pro Ser
260 265 270
Gly Gln Glu Gln Arg Tyr Thr Cys His Val Gln His Glu Gly Leu Pro
275 280 285
Lys Pro Leu Thr Leu Arg Trp Glu Pro Ser Ser Gln Pro Thr Ile Pro
290 295 300
Ile Val Gly Ile Ile Ala Gly Leu Val Leu Phe Gly Ala Val Ile Thr
305 310 315 320
Gly Ala Val Val Ala Ala Val Met Trp Arg Arg Lys Ser Ser Asp Arg
325 330 335
Lys Gly Gly Ser Tyr Ser Gln Ala Ala Ser Ser Asp Ser Ala Gln Gly
340 345 350
Ser Asp Val Ser Leu Thr Ala Cys Lys Val
355 360
<210> 60
<211> 1409
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
gcatttccta gtacagttca acacagtgtt tagtataatt taatattaac atttcaggtc 60
tttaatgtat taaatgagtt tttcttttta attagatgaa gtatcttaac tcacaccttt 120
atacataaaa attattctta tatttcagtt acaaaaaggg atagcaaaat aacataaatg 180
attatgattc ttaaacatta ctggatcaaa atactatatg ctgggtagac actgtaggat 240
tgggtctctg tttattatct cattaatgtc cgtggagact attttatttt tttctagttt 300
agacacagcc tccacactag agattgttaa aggtttttaa aaatatgttc aagaaatcca 360
gaagttatgt tgttctcctt ggggaagcca aggccaaagc cacttcaact gcaagcatgg 420
ccatttctcc atgtcctgat gccccatgcc ctcttcctac ccttcctcac tcgagctgct 480
tgcggtggtg tctccctgtg ctcacagcct gcctctgtcc tggcttttgg ccaggggttt 540
aacttctcta ctgggtccac cgctgatgta atatacattc tgagtaaaac tatggcagcc 600
tttgtcttcc gagccgataa gcagaaaccc caagggaatg catctcaagg tttatctcct 660
catccagaaa aaataattta ttcgggtatt cacttcactt ggtcacttag tttaccaatg 720
gccctgttct aagaaagtac tactaagaga atggacagga aacccagcta agccattgtt 780
cttccccaaa acccatggac agaacaaaga aaattaccta aatttttcaa gggtacccga 840
ttaagttctc catccaaagc tctaaaagga gaaacctgct agaagcaagg tcagaaatcc 900
tctcagttgc ctttaggaca ggagggtctt tttacacacg gaatcctgaa actgcctttg 960
tatttctggg ctgagattat aaactaaggg ttgagttctg ccagttaatg ctcttaattg 1020
tcctggcttt agttttcaag aatgcaaact tcaggtccta agtccttttc tgagtgggat 1080
attgtcagca attgaataaa tgaaggcggt cccaggctga acgaccagat acaccaaact 1140
caagagcaca ccctagatag tagggcacca agggtccagc ccaggctgtt tgaaatatca 1200
cgggacttta taagaacatg aaactgaaaa tgggaaagtc cctttgtaac ctagttcagc 1260
attaacagct aggagactgg tgacgacctc cggatctgag tccggattgg ctgtgagttc 1320
aggaactata taagagcgcg cgccctggct ggctctcatt tcagtggctg ctactcggcg 1380
cttcagtcgc ggtcgcttca gtcgtcagc 1409
<210> 61
<211> 476
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 61
Met Ala Val Met Ala Pro Arg Thr Leu Val Leu Leu Leu Ser Gly Ala
1 5 10 15
Leu Ala Leu Thr Gln Thr Trp Ala Ile Gln Arg Thr Pro Lys Ile Gln
20 25 30
Val Tyr Ser Arg His Pro Ala Glu Asn Gly Lys Ser Asn Phe Leu Asn
35 40 45
Cys Tyr Val Ser Gly Phe His Pro Ser Asp Ile Glu Val Asp Leu Leu
50 55 60
Lys Asn Gly Glu Arg Ile Glu Lys Val Glu His Ser Asp Leu Ser Phe
65 70 75 80
Ser Lys Asp Trp Ser Phe Tyr Leu Leu Tyr Tyr Thr Glu Phe Thr Pro
85 90 95
Thr Glu Lys Asp Glu Tyr Ala Cys Arg Val Asn His Val Thr Leu Ser
100 105 110
Gln Pro Lys Ile Val Lys Trp Asp Arg Asp Met Gly Gly Gly Gly Ser
115 120 125
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ser His Ser Met Arg
130 135 140
Tyr Phe Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe
145 150 155 160
Ile Ala Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser
165 170 175
Asp Ala Ala Ser Gln Arg Met Glu Pro Arg Ala Pro Trp Ile Glu Gln
180 185 190
Glu Gly Pro Glu Tyr Trp Asp Gly Glu Thr Arg Lys Val Lys Ala His
195 200 205
Ser Gln Thr His Arg Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr Asn
210 215 220
Gln Ser Glu Ala Gly Ser His Thr Val Gln Arg Met Tyr Gly Cys Asp
225 230 235 240
Val Gly Ser Asp Trp Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala Tyr
245 250 255
Asp Gly Lys Asp Tyr Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp Thr
260 265 270
Ala Ala Asp Met Ala Ala Gln Thr Thr Lys His Lys Trp Glu Ala Ala
275 280 285
His Val Ala Glu Gln Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val Glu
290 295 300
Trp Leu Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr
305 310 315 320
Asp Ser Pro Lys Ala His Val Thr His His Pro Arg Ser Lys Gly Glu
325 330 335
Val Thr Leu Arg Cys Trp Ala Leu Gly Phe Tyr Pro Ala Asp Ile Thr
340 345 350
Leu Thr Trp Gln Leu Asn Gly Glu Glu Leu Thr Gln Asp Met Glu Leu
355 360 365
Val Glu Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ser
370 375 380
Val Val Val Pro Leu Gly Lys Glu Gln Asn Tyr Thr Cys Arg Val Tyr
385 390 395 400
His Glu Gly Leu Pro Glu Pro Leu Thr Leu Arg Trp Glu Pro Pro Pro
405 410 415
Ser Thr Asp Ser Tyr Met Val Ile Val Ala Val Leu Gly Val Leu Gly
420 425 430
Ala Met Ala Ile Ile Gly Ala Val Val Ala Phe Val Met Lys Arg Arg
435 440 445
Arg Asn Thr Gly Gly Lys Gly Gly Asp Tyr Ala Leu Ala Pro Gly Ser
450 455 460
Gln Ser Ser Glu Met Ser Leu Arg Asp Cys Lys Ala
465 470 475
<210> 62
<211> 479
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 62
Met Ala Val Met Ala Pro Arg Thr Leu Val Leu Leu Leu Ser Gly Ala
1 5 10 15
Leu Ala Leu Thr Gln Thr Trp Ala Ile Gln Arg Thr Pro Lys Ile Gln
20 25 30
Val Tyr Ser Arg His Pro Ala Glu Asn Gly Lys Ser Asn Phe Leu Asn
35 40 45
Cys Tyr Val Ser Gly Phe His Pro Ser Asp Ile Glu Val Asp Leu Leu
50 55 60
Lys Asn Gly Glu Arg Ile Glu Lys Val Glu His Ser Asp Leu Ser Phe
65 70 75 80
Ser Lys Asp Trp Ser Phe Tyr Leu Leu Tyr Tyr Thr Glu Phe Thr Pro
85 90 95
Thr Glu Lys Asp Glu Tyr Ala Cys Arg Val Asn His Val Thr Leu Ser
100 105 110
Gln Pro Lys Ile Val Lys Trp Asp Arg Asp Met Gly Gly Gly Gly Ser
115 120 125
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ser His Ser Met Arg
130 135 140
Tyr Phe Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe
145 150 155 160
Ile Ala Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser
165 170 175
Asp Ala Ala Ser Gln Arg Met Glu Pro Arg Ala Pro Trp Ile Glu Gln
180 185 190
Glu Gly Pro Glu Tyr Trp Asp Gly Glu Thr Arg Lys Val Lys Ala His
195 200 205
Ser Gln Thr His Arg Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr Asn
210 215 220
Gln Ser Glu Ala Gly Ser His Thr Val Gln Arg Met Tyr Gly Cys Asp
225 230 235 240
Val Gly Ser Asp Trp Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala Tyr
245 250 255
Asp Gly Lys Asp Tyr Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp Thr
260 265 270
Ala Ala Asp Met Ala Ala Gln Thr Thr Lys His Lys Trp Glu Ala Ala
275 280 285
His Val Ala Glu Gln Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val Glu
290 295 300
Trp Leu Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr
305 310 315 320
Asp Ala Pro Lys Thr His Met Thr His His Ala Val Ser Asp His Glu
325 330 335
Ala Thr Leu Arg Cys Trp Ala Leu Ser Phe Tyr Pro Ala Glu Ile Thr
340 345 350
Leu Thr Trp Gln Arg Asp Gly Glu Asp Gln Thr Gln Asp Thr Glu Leu
355 360 365
Val Glu Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ala
370 375 380
Val Val Val Pro Ser Gly Gln Glu Gln Arg Tyr Thr Cys His Val Gln
385 390 395 400
His Glu Gly Leu Pro Lys Pro Leu Thr Leu Arg Trp Glu Pro Ser Ser
405 410 415
Gln Pro Thr Ile Pro Ile Val Gly Ile Ile Ala Gly Leu Val Leu Phe
420 425 430
Gly Ala Val Ile Thr Gly Ala Val Val Ala Ala Val Met Trp Arg Arg
435 440 445
Lys Ser Ser Asp Arg Lys Gly Gly Ser Tyr Ser Gln Ala Ala Ser Ser
450 455 460
Asp Ser Ala Gln Gly Ser Asp Val Ser Leu Thr Ala Cys Lys Val
465 470 475
<210> 63
<211> 337
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 63
Met Ser Arg Ser Val Ala Leu Ala Val Leu Ala Leu Leu Ser Leu Ser
1 5 10 15
Gly Leu Glu Ala Ile Gln Arg Thr Pro Lys Ile Gln Val Tyr Ser Arg
20 25 30
His Pro Ala Glu Asn Gly Lys Ser Asn Phe Leu Asn Cys Tyr Val Ser
35 40 45
Gly Phe His Pro Ser Asp Ile Glu Val Asp Leu Leu Lys Asn Gly Glu
50 55 60
Arg Ile Glu Lys Val Glu His Ser Asp Leu Ser Phe Ser Lys Asp Trp
65 70 75 80
Ser Phe Tyr Leu Leu Tyr Tyr Thr Glu Phe Thr Pro Thr Glu Lys Asp
85 90 95
Glu Tyr Ala Cys Arg Val Asn His Val Thr Leu Ser Gln Pro Lys Ile
100 105 110
Val Lys Trp Asp Arg Asp Met Gly Gly Gly Gly Ser Gly Gly Gly Gly
115 120 125
Ser Gly Gly Gly Gly Ser Met Ala Pro Arg Thr Leu Val Leu Leu Leu
130 135 140
Ser Gly Ala Leu Ala Leu Thr Gln Thr Trp Ala Gly Ser His Ser Met
145 150 155 160
Arg Tyr Phe Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg
165 170 175
Phe Ile Ala Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp
180 185 190
Ser Asp Ala Ala Ser Gln Arg Met Glu Pro Arg Ala Pro Trp Ile Glu
195 200 205
Gln Glu Gly Pro Glu Tyr Trp Asp Gly Glu Thr Arg Lys Val Lys Ala
210 215 220
His Ser Gln Thr His Arg Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr
225 230 235 240
Asn Gln Ser Glu Ala Gly Ser His Thr Val Gln Arg Met Tyr Gly Cys
245 250 255
Asp Val Gly Ser Asp Trp Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala
260 265 270
Tyr Asp Gly Lys Asp Tyr Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp
275 280 285
Thr Ala Ala Asp Met Ala Ala Gln Thr Thr Lys His Lys Trp Glu Ala
290 295 300
Ala His Val Ala Glu Gln Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val
305 310 315 320
Glu Trp Leu Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg
325 330 335
Thr
<210> 64
<211> 358
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 64
Met Ala Pro Arg Thr Leu Val Leu Leu Leu Ser Gly Ala Leu Ala Leu
1 5 10 15
Thr Gln Thr Trp Ala Gly Ser His Ser Met Arg Tyr Phe Phe Thr Ser
20 25 30
Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe Ile Ala Val Gly Tyr
35 40 45
Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser Asp Ala Ala Ser Gln
50 55 60
Arg Met Glu Pro Arg Ala Pro Trp Ile Glu Gln Glu Gly Pro Glu Tyr
65 70 75 80
Trp Asp Gly Glu Thr Arg Lys Val Lys Ala His Ser Gln Thr His Arg
85 90 95
Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr Asn Gln Ser Glu Ala Gly
100 105 110
Ser His Thr Val Gln Arg Met Tyr Gly Cys Asp Val Gly Ser Asp Trp
115 120 125
Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala Tyr Asp Gly Lys Asp Tyr
130 135 140
Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp Thr Ala Ala Asp Met Ala
145 150 155 160
Ala Gln Thr Thr Lys His Lys Trp Glu Ala Ala His Val Ala Glu Gln
165 170 175
Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val Glu Trp Leu Arg Arg Tyr
180 185 190
Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr Ser Pro Lys Ala His
195 200 205
Val Thr His His Pro Arg Ser Lys Gly Glu Val Thr Leu Arg Cys Trp
210 215 220
Ala Leu Gly Phe Tyr Pro Ala Asp Ile Thr Leu Thr Trp Gln Leu Asn
225 230 235 240
Gly Glu Glu Leu Thr Gln Asp Met Glu Leu Val Glu Thr Arg Pro Ala
245 250 255
Gly Asp Gly Thr Phe Gln Lys Trp Ala Ser Val Val Val Pro Leu Gly
260 265 270
Lys Glu Gln Asn Tyr Thr Cys Arg Val Tyr His Glu Gly Leu Pro Glu
275 280 285
Pro Leu Thr Leu Arg Trp Glu Pro Pro Pro Ser Thr Asp Ser Tyr Met
290 295 300
Val Ile Val Ala Val Leu Gly Val Leu Gly Ala Met Ala Ile Ile Gly
305 310 315 320
Ala Val Val Ala Phe Val Met Lys Arg Arg Arg Asn Thr Gly Gly Lys
325 330 335
Gly Gly Asp Tyr Ala Leu Ala Pro Gly Ser Gln Ser Ser Glu Met Ser
340 345 350
Leu Arg Asp Cys Lys Ala
355
<210> 65
<211> 3690
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
atggccgtca tggcgccccg aaccctcgtc ctgctactct cgggggctct ggccctgacc 60
cagacctggg cgatccagcg tactccaaag attcaggttt actcacgtca tccagcagag 120
aatggaaagt caaatttcct gaattgctat gtgtctgggt ttcatccatc cgacattgaa 180
gttgacttac tgaagaatgg agagagaatt gaaaaagtgg agcattcaga cttgtctttc 240
agcaaggact ggtctttcta tctcttgtac tacactgaat tcacccccac tgaaaaagat 300
gagtatgcct gccgtgtgaa ccatgtgact ttgtcacagc ccaagatagt taagtgggat 360
cgagacatgg gaggtggcgg atccggcgga ggcggctcgg gtggcggcgg ctctggctct 420
cactccatga ggtatttctt cacatccgtg tcccggcccg gccgcgggga gccccgcttc 480
atcgcagtgg gctacgtgga cgacacgcag ttcgtgcggt tcgacagcga cgccgcgagc 540
cagaggatgg agccgcgggc gccgtggata gagcaggagg gtccggagta ttgggacggg 600
gagacacgga aagtgaaggc ccactcacag actcaccgag tggacctggg gaccctgcgc 660
ggctactaca accagagcga ggccggtgag tgaccccggc ccggggcgca ggtcacgacc 720
tctcatcccc cacggacggg ccaggtcgcc cacagtctcc gggtccgaga tccgccccga 780
agccgcggga ccccgagacc cttgccccgg gagaggccca ggcgccttta cccggtttca 840
ttttcagttt aggccaaaaa tccccccagg ttggtcgggg cggggcgggg ctcgggggac 900
cgggctgacc gcggggtccg ggccaggttc tcacaccgtc cagaggatgt atggctgcga 960
cgtggggtcg gactggcgct tcctccgcgg gtaccaccag tacgcctacg acggcaagga 1020
ttacatcgcc ctgaaagagg acctgcgctc ttggaccgcg gcggacatgg cagctcagac 1080
caccaagcac aagtgggagg cggcccatgt ggcggagcag ttgagagcct acctggaggg 1140
cacgtgcgtg gagtggctcc gcagatacct ggagaacggg aaggagacgc tgcagcgcac 1200
gggtaccagg ggccacgggg cgcctccctg atcgcctgta gatctcccgg gctggcctcc 1260
cacaaggagg ggagacaatt gggaccaaca ctagaatatc gccctccctc tggtcctgag 1320
ggagaggaat cctcctgggt ttccagatcc tgtaccagag agtgactctg aggttccgcc 1380
ctgctctctg acacaattaa gggataaaat ctctgaagga atgacgggaa gacgatccct 1440
cgaatactga tgagtggttc cctttgacac acacaggcag cagccttggg cccgtgactt 1500
ttcctctcag gccttgttct ctgcttcaca ctcaatgtgt gtgggggtct gagtccagca 1560
cttctgagtc cttcagcctc cactcaggtc aggaccagaa gtcgctgttc cctcttcagg 1620
gactagaatt ttccacggaa taggagatta tcccaggtgc ctgtgtccag gctggtgtct 1680
gggttctgtg ctcccttccc catcccaggt gtcctgtcca ttctcaagat agccacatgt 1740
gtgctggagg agtgtcccat gacagatgca aaatgcctga atgatctgac tcttcctgac 1800
agacgccccc aaaacgcata tgactcacca cgctgtctct gaccatgaag ccaccctgag 1860
gtgctgggcc ctgagcttct accctgcgga gatcacactg acctggcagc gggatgggga 1920
ggaccagacc caggacacgg agctcgtgga gaccaggcct gcaggggatg gaaccttcca 1980
gaagtgggcg gctgtggtgg tgccttctgg acaggagcag agatacacct gccatgtgca 2040
gcatgagggt ttgcccaagc ccctcaccct gagatggggt aaggagggag acgggggtgt 2100
catgtctttt agggaaagca ggagcctctc tgacctttag cagggtcagg gcccctcacc 2160
ttcccctctt ttcccagagc cgtcttccca gcccaccatc cccatcgtgg gcatcattgc 2220
tggcctggtt ctctttggag ctgtgatcac tggagctgtg gtcgctgctg tgatgtggag 2280
gaggaagagc tcaggtgggg aaggggtgaa gggtgggtct gagatttctt gtctcactga 2340
gggttccaag acccaggtag aagtgtgccc tgcctcgtta ctgggaagca ccacccacaa 2400
ttatgggcct acccagcctg ggccctgtgt gccagcactt actcttttgt aaagcacctg 2460
ttaaaatgaa ggacagattt atcaccttga ttacagcggt gatgggacct gatcccagca 2520
gtcacaagtc acaggggaag gtccctgagg accttcagga gggcggttgg tccaggaccc 2580
acacctgctt tcttcatgtt tcctgatccc gccctgggtc tgcagtcaca catttctgga 2640
aacttctctg aggtccaaga cttggaggtt cctctaggac cttaaggccc tgactccttt 2700
ctggtatctc acaggacatt ttcttcccac agatagaaaa ggagggagct actctcaggc 2760
tgcaagtaag tatgaaggag gctgatgcct gaggtccttg ggatattgtg tttgggagcc 2820
catgggggag ctcacccacc ccacaattcc tcctctagcc acatcttctg tgggatctga 2880
ccaggttctg tttttgttct accccaggca gtgacagtgc ccagggctct gatgtgtctc 2940
tcacagcttg taaaggtgag agcctggagg gcctgatgtg tgttgggtgt tgggcggaac 3000
agtggacaca gctgtgctat ggggtttctt tccattggat gtattgagca tgcgatgggc 3060
tgtttaaagt gtgacccctc actgtgacag atacgaattt gttcatgaat atttttttct 3120
atagtgtgag acagctgcct tgtgtgggac tgagaggcaa gagttgttcc tgcccttccc 3180
tttgtgactt gaagaaccct gactttgttt ctgcaaaggc acctgcatgt gtctgtgttc 3240
gtgtaggcat aatgtgagga ggtggggaga ccaccccacc cccatgtcca ccatgaccct 3300
cttcccacgc tgacctgtgc tccctcccca atcatctttc ctgttccaga gaggtggggc 3360
tgaggtgtct ccatctctgt ctcaacttca tggtgcactg agctgtaact tcttccttcc 3420
ctattaaaat tagaacctga gtataaattt actttctcaa attcttgcca tgagaggttg 3480
atgagttaat taaaggagaa gattcctaaa atttgagaga caaaataaat ggaacacatg 3540
agaaccttcc agagtccacg tgttgcttat gctgatttgt tgcaggggag gagagtagat 3600
ggggctgtgc ccagtttctg ttccggccac tatgggcttt atgtggtcac tgcttggctg 3660
ggtcatcttt gctgctccat tgtccttggc 3690
<210> 66
<211> 119
<212> PRT
<213> 大鼠(Rat)
<400> 66
Met Ala Arg Ser Val Thr Val Ile Phe Leu Val Leu Val Ser Leu Ala
1 5 10 15
Val Val Leu Ala Ile Gln Lys Thr Pro Gln Ile Gln Val Tyr Ser Arg
20 25 30
His Pro Pro Glu Asn Gly Lys Pro Asn Phe Leu Asn Cys Tyr Val Ser
35 40 45
Gln Phe His Pro Pro Gln Ile Glu Ile Glu Leu Leu Lys Asn Gly Lys
50 55 60
Lys Ile Pro Asn Ile Glu Met Ser Asp Leu Ser Phe Ser Lys Asp Trp
65 70 75 80
Ser Phe Tyr Ile Leu Ala His Thr Glu Phe Thr Pro Thr Glu Thr Asp
85 90 95
Val Tyr Ala Cys Arg Val Lys His Val Thr Leu Lys Glu Pro Lys Thr
100 105 110
Val Thr Trp Asp Arg Asp Met
115
<210> 67
<211> 15
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 67
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 68
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 68
Gly Gly Gly Gly Ser
1 5

Claims (28)

1.一种MHC分子人源化的非人动物的构建方法,其特征在于,所述的非人动物体内表达MHC嵌合蛋白,所述的MHC嵌合蛋白包含1)人或人源化B2M蛋白;和/或,2)MHC嵌合α链。
2.根据权利要求1所述的构建方法,其特征在于,所述的非人动物体内内源B2M蛋白表达降低或缺失。
3.根据权利要求1或2所述的构建方法,其特征在于,所述的MHC嵌合α链包含HLA-A2.1蛋白的Alpha-1、Alpha-2区域;优选还包含信号肽;进一步优选的,还包含Alpha-3、连接肽、胞内区和/或跨膜区;更进一步优选的,所述的MHC嵌合α链的氨基酸序列包含下列组中的一种:
A)SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示的氨基酸序列;
B)与SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
D)与SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
4.根据权利要求1-3任一所述的构建方法,其特征在于,所述的人或人源化B2M蛋白的氨基酸序列包含下列组中的一种:
a)SEQ ID NO:4或SEQ ID NO:4第21-119位所示的氨基酸序列;
b)与SEQ ID NO:4或SEQ ID NO:4第21-119位所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)与SEQ ID NO:4或SEQ ID NO:4第21-119位所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
d)与SEQ ID NO:4或SEQ ID NO:4第21-119位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
5.根据权利要求1-4任一所述的构建方法,其特征在于,所述的MHC嵌合蛋白还包含非人动物H2-D1蛋白的跨膜区和/或胞内区;优选还包含Alpha-3和/或连接肽;进一步优选的,包含下列组中的一种:
1)SEQ ID NO:6第207-362位所示氨基酸序列;
2)与SEQ ID NO:6第207-362位所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
3)与SEQ ID NO:6第207-362位所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
4)与SEQ ID NO:6第207-362位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
6.根据权利要求1-5任一所述的构建方法,其特征在于,所述的MHC嵌合蛋白包含人B2M蛋白的全部或部分,和人HLA蛋白的全部或部分;优选的,所述的人B2M蛋白的全部或部分的氨基酸序列与人HLA蛋白的全部或部分的氨基酸序列直接连接或通过具有连接功能的接头蛋白连接;进一步优选的,所述的MHC嵌合蛋白的氨基酸序列包含下列组中的一种:
I)SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示的氨基酸序列;
II)与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
III)与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
IV)与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
7.根据权利要求1-6任一所述的构建方法,其特征在于,所述的非人动物的基因组中包含MHC嵌合基因,所述的MHC嵌合基因包含人或人源化B2M基因,和/或,MHC嵌合α链基因。
8.根据权利要求7所述的构建方法,其特征在于,所述的MHC嵌合α链基因包含编码HLA-A2.1蛋白Alpha-1、Alpha-2区域的核苷酸序列,优选还包含编码信号肽的核苷酸序列,进一步优选还包含编码Alpha-3、连接肽、胞内区和/或跨膜区的核苷酸序列;或者,所述的MHC嵌合α链基因包含人HLA基因的外显子2至外显子3的编码序列,优选的,还包含外显子1的编码序列,进一步优选还包含外显子4至外显子8的编码序列;
优选的,所述MHC嵌合α链基因的核苷酸序列包含下列组中的一种:
(A)SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示核苷酸序列;
(B)与SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(C)与SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
(D)具有SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
9.根据权利要求7或8所述的构建方法,其特征在于,所述的人源化B2M基因包含编码人B2M蛋白的核苷酸序列或者人B2M基因的外显子1至外显子3的编码序列;优选的,所述的人源化B2M基因包含下列组中的一种:
(a)SEQ ID NO:14所示核苷酸序列;
(b)与SEQ ID NO:14所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(c)与SEQ ID NO:14所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
(d)具有SEQ ID NO:14所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
10.根据权利要求7-9任一所述的构建方法,其特征在于,所述的MHC嵌合基因还包含非人动物H2-D1基因的外显子4至外显子8的编码序列或者编码非人动物H2-D1蛋白的Alpha-3、连接肽、胞内区和/或跨膜区的核苷酸序列,优选包含下列组中的一种:
(1)SEQ ID NO:16所示核苷酸序列;
(2)与SEQ ID NO:16所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(3)与SEQ ID NO:16所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
(4)具有SEQ ID NO:16所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
11.根据权利要求7-10任一所述的构建方法,其特征在于,所述MHC嵌合基因包含人B2M基因的部分,和人HLA基因的部分;优选的,所述的人B2M基因的部分的核苷酸序列与人HLA基因的部分的核苷酸序列直接连接或通过编码具有连接功能的接头蛋白的核苷酸序列连接,优选的,所述的MHC嵌合基因编码所述的MHC嵌合蛋白,进一步优选的,所述的MHC嵌合基因的核苷酸序列包含下列组中的一种:
(I)SEQ ID NO:10或SEQ ID NO:65所示序列;
(II)转录的mRNA序列为SEQ ID NO:9或SEQ ID NO:52所示序列;
(III)与SEQ ID NO:10、SEQ ID NO:65、SEQ ID NO:9或SEQ ID NO:52所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(IV)与SEQ ID NO:10、SEQ ID NO:65、SEQ ID NO:9或SEQ ID NO:52所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或,
(V)具有SEQ ID NO:10、SEQ ID NO:65、SEQ ID NO:9或SEQ ID NO:52所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
12.根据权利要求1-11任一所述的构建方法,其特征在于,将MHC嵌合基因可操作的连接在非人动物B2M或H2-D1基因座上;
优选的,将MHC嵌合基因插入非人动物B2M基因外显子1上或者替换非人动物B2M基因外显子1至外显子4的核苷酸序列的全部或部分;优选为替换非人动物B2M基因外显子1至外显子3的核苷酸序列;
优选的,将MHC嵌合基因插入非人动物H2-D1基因座上或替换非人动物H2-D1基因外显子1至外显子3的核苷酸序列或者替换非人动物H2-D1基因外显子1至外显子8的核苷酸序列。
13.根据权利要求1-12任一所述的构建方法,其特征在于,将体内表达人或人源化B2M蛋白的非人动物与体内表达MHC嵌合α链的非人动物交配或者体外授精;
或者,提供体内表达人或人源化B2M蛋白的非人动物,将包含MHC嵌合α链基因的核苷酸序列导入非人动物B2M或H2-D1基因座;
或者,提供体内表达MHC嵌合α链的非人动物,将包含人或人源化B2M基因的核苷酸序列导入非人动物B2M或H2-D1基因座。
14.根据权利要求1-13任一所述的构建方法,其特征在于,使用B2M基因的靶向载体或H2-D1基因的靶向载体,和/或sgRNA进行非人动物的构建,
所述的B2M基因的靶向载体包含MHC嵌合基因或人源化B2M基因,优选还包含5’臂和/或3’臂,所述的5’臂或3’臂与NCBI登录号为NC_000068.7至少具有90%同源性的核苷酸,优选自B2M基因基因组DNA的100-10000个长度的核苷酸,进一步优选的,所述5’臂如SEQ ID NO:11或SEQ ID NO:60所示,所述的3’臂如SEQ ID NO:12或SEQ ID NO:53所示;
所述的H2-D1基因的靶向载体包含MHC嵌合基因或人HLA基因的外显子1至外显子3与非人动物H2-D1基因的外显子4至外显子8的编码序列,优选还包含5’臂和/或3’臂,所述的5’臂或3’臂与NCBI登录号为NC_000083.6至少具有90%同源性的核苷酸,优选自H2-D1基因基因组DNA的100-10000个长度的核苷酸;
所述的sgRNA在非人动物B2M基因的靶位点位于非人动物B2M基因的外显子1、外显子1-2的内含子、外显子3或外显子3-4的内含子上,优选的,所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO:17-23任一项所示,3’端靶位点序列如SEQ ID NO:24-31任一项所示。
15.一种MHC嵌合蛋白,其特征在于,所述的MHC嵌合蛋白包含人或人源化B2M蛋白,和/或MHC嵌合α链;
优选的,所述的MHC嵌合α链包含人HLA蛋白Alpha-1、Alpha-2区域,进一步优选还包含信号肽,更进一步优选还包含Alpha-3、连接肽、胞内区和/或跨膜区,再进一步优选的,包含SEQ ID NO:59、SEQ ID NO:8、SEQ ID NO:59第1-203位或SEQ ID NO:59第22-203位所示的氨基酸序列;
优选的,所述的人或人源化B2M蛋白包含SEQ ID NO:4或SEQ ID NO:4第21-119位所示的氨基酸序列。
16.根据权利要求15所述的MHC嵌合蛋白,其特征在于,所述的MHC嵌合蛋白还包括非人动物H2-D1蛋白的的跨膜区和/或胞内区;优选还包含Alpha-3和/或连接肽,进一步优选包含SEQ ID NO:6第207-362位所示氨基酸序列。
17.根据权利要求15或16所述的MHC嵌合蛋白,其特征在于,所述的人或人源化B2M蛋白的氨基酸序列与MHC嵌合α链的氨基酸序列直接连接或通过具有连接功能的接头蛋白连接;进一步优选的,所述的MHC嵌合蛋白的氨基酸序列包含下列组中的一种:
I)SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示氨基酸序列;
II)与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
III)与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
IV)与SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
18.一种嵌合基因,其特征在于,所述的嵌合基因包含人或人源化B2M基因,和/或,MHC嵌合α链基因;
优选的,所述的MHC嵌合α链基因包含人HLA基因的外显子2至外显子3的编码序列,进一步优选的,还包含外显子1的编码序列,更进一步优选还包含外显子4至外显子8的编码序列;再进一步优选的,包含SEQ ID NO:15、SEQ ID NO:13或SEQ ID NO:54所示核苷酸序列;
优选的,所述的人或人源化B2M基因包含人B2M基因的外显子1至外显子3的编码序列;进一步优选的,包含SEQ ID NO:14所示核苷酸序列。
19.根据权利要求18所述的嵌合基因,其特征在于,所述的嵌合基因还包含非人动物H2-D1基因的外显子4至外显子8的编码序列,优选包含SEQ ID NO:16所示核苷酸序列。
20.根据权利要求18-19任一所述的嵌合基因,其特征在于,所述嵌合基因包含人B2M基因的部分,和人HLA基因的部分;优选的,所述的人B2M基因的部分的核苷酸序列与人HLA基因的部分的核苷酸序列直接连接或通过编码具有连接功能的接头蛋白的核苷酸序列连接;进一步优选的,所述的嵌合基因编码权利要求15-17任一所述的MHC嵌合蛋白,更进一步优选的,所述的嵌合基因的核苷酸序列包含下列组中的一种:
(I)SEQ ID NO:10或SEQ ID NO:65所示序列;
(II)转录的mRNA序列为SEQ ID NO:9或SEQ ID NO:52所示序列;
(III)与SEQ ID NO:10、SEQ ID NO:65、SEQ ID NO:9或SEQ ID NO:52所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(IV)与SEQ ID NO:10、SEQ ID NO:65、SEQ ID NO:9或SEQ ID NO:52所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
(V)具有SEQ ID NO:10、SEQ ID NO:65、SEQ ID NO:9或SEQ ID NO:52所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
21.一种B2M基因的靶向载体,其特征在于,所述的靶向载体包含权利要求18-20任一所述的嵌合基因。
22.根据权利要求21所述的靶向载体,其特征在于,所述的靶向载体还包含5’臂和/或3’臂,所述的5’臂或3’臂选自B2M基因基因组DNA的100-10000个长度的核苷酸;优选的,与NCBI登录号为NC_000068.7至少具有90%同源性的核苷酸;进一步优选的,所述5’臂序列如SEQ ID NO:11或SEQ ID NO:60所示,所述3’臂序列如SEQ ID NO:12或SEQ ID NO:53所示。
23.一种靶向B2M基因的sgRNA,其特征在于,所述的sgRNA靶向非人动物B2M基因,优选的,所述sgRNA在非人动物B2M基因的靶位点位于非人动物B2M基因的外显子1、外显子1-2的内含子、外显子3或外显子3-4的内含子上,进一步优选的,所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO:17-23任一项所示,3’端靶位点序列如SEQ ID NO:24-31任一项所示。
24.一种多基因修饰的非人动物的构建方法,其特征在于,包括如下步骤:
i)采用权利要求1-14任一所述的构建方法获得的非人动物;
ii)将步骤i)获得的非人动物与其他基因修饰的非人动物交配、体外授精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
25.根据权利要求24所述的构建方法,其特征在于,所述的其他基因修饰的非人动物包括基因HLA-B、HLA-C、H-2K、H-2L等人源化的非人动物。
26.一种MHC分子人源化的细胞、组织、器官或荷瘤后的瘤组织,其特征在于,所述的细胞、组织、器官或荷瘤后的瘤组织表达权利要求15-17任一所述的MHC嵌合蛋白,优选的,所述的细胞中内源B2M蛋白表达降低或缺失;进一步优选的,所述的细胞的基因组中包含权利要求18-20任一所述的嵌合基因。
27.根据权利要求1-14、16-17、19-20和23任一所述的构建方法、MHC嵌合蛋白、嵌合基因或sgRNA,其特征在于,所述的非人动物为非人哺乳动物,优选的,所述的非人哺乳动物为啮齿类动物,更优选的,所述的啮齿类动物为小鼠或大鼠或免疫缺陷鼠。
28.来源于权利要求1-14任一所述构建方法获得的非人动物、权利要求15-17任一所述的MHC嵌合蛋白、权利要求18-20任一所述的嵌合基因、权利要求24-25任一所述的构建方法获得的多基因修饰的非人动物、权利要求26所述的细胞、组织、器官或荷瘤后的瘤组织在需要涉及人类细胞的免疫过程的产品开发,制造人类抗体、疫苗,或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;或者在生产和利用动物实验疾病模型,用于人源细胞移植、免疫系统重建、病原学研究;优选的,所述的应用为人造血干细胞的形成、功能研究和/或构建疾病模型;或者在筛选、验证、评价或研究MHC功能、人MHC信号机理、靶向人的抗体、疫苗、靶向人的药物、药效,免疫相关疾病药物以及抗肿瘤或抗炎症药物,筛选和评估人用药及药效研究方面的应用。
CN202110026238.1A 2020-01-10 2021-01-08 Mhc分子人源化的非人动物的构建方法及应用 Active CN113105555B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010028231 2020-01-10
CN2020100282319 2020-01-10

Publications (2)

Publication Number Publication Date
CN113105555A true CN113105555A (zh) 2021-07-13
CN113105555B CN113105555B (zh) 2023-05-30

Family

ID=76709353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110026238.1A Active CN113105555B (zh) 2020-01-10 2021-01-08 Mhc分子人源化的非人动物的构建方法及应用

Country Status (7)

Country Link
US (1) US20230072216A1 (zh)
EP (1) EP4087392A4 (zh)
JP (1) JP2023509082A (zh)
KR (1) KR20220125797A (zh)
CN (1) CN113105555B (zh)
IL (1) IL294356A (zh)
WO (1) WO2021139799A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023176982A1 (ja) * 2022-03-14 2023-09-21 公益財団法人東京都医学総合研究所 Mhc遺伝子群ヒト化動物
CN116875613B (zh) * 2023-09-07 2024-01-12 中国疾病预防控制中心职业卫生与中毒控制所 一种人源化h2-d基因敲入小鼠模型的构建方法及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2903025A1 (en) * 2013-03-11 2014-10-09 Regeneron Pharmaceuticals, Inc. Transgenic mice expressing chimeric major histocompatibility complex (mhc) class ii molecules
CN105578876A (zh) * 2013-10-18 2016-05-11 大鹏药品工业株式会社 表达hlai类的非人动物
CN105188358B (zh) * 2013-03-11 2018-01-26 瑞泽恩制药公司 表达嵌合的主要组织相容性复合物(mhc)i类分子的转基因小鼠
CN110055223A (zh) * 2018-01-19 2019-07-26 北京百奥赛图基因生物技术有限公司 一种B2m基因改造的免疫缺陷动物的制备方法及其应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040225112A1 (en) * 2003-05-06 2004-11-11 Crew Mark D. Genes encoding single chain human leukocyte antigen E (HLA-E) proteins to prevent natural killer cell-mediated cytotoxicity
MX355725B (es) * 2011-10-28 2018-04-27 Regeneron Pharma Ratones con complejo principal de histocompatibilidad modificado geneticamente.
SG10201707449TA (en) * 2012-11-05 2017-10-30 Regeneron Pharma Genetically modified non-human animals and methods of use thereof
RS57963B1 (sr) * 2013-02-22 2019-01-31 Regeneron Pharma Miševi koji eksprimiraju humanizovani glavni kompleks histokompatibilnosti
US11712026B2 (en) * 2017-10-18 2023-08-01 The Jackson Laboratory Murine-MHC-deficient HLA-transgenic nod-mouse models for T1D therapy development
RU2020131383A (ru) * 2018-03-24 2022-04-26 Ридженерон Фармасьютикалз, Инк. Генетически модифицированные животные, отличные от человека, для выработки терапевтических антител против комплексов пептид-mhc, способы их получения и варианты применения

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2903025A1 (en) * 2013-03-11 2014-10-09 Regeneron Pharmaceuticals, Inc. Transgenic mice expressing chimeric major histocompatibility complex (mhc) class ii molecules
CN105188358B (zh) * 2013-03-11 2018-01-26 瑞泽恩制药公司 表达嵌合的主要组织相容性复合物(mhc)i类分子的转基因小鼠
CN105578876A (zh) * 2013-10-18 2016-05-11 大鹏药品工业株式会社 表达hlai类的非人动物
CN110055223A (zh) * 2018-01-19 2019-07-26 北京百奥赛图基因生物技术有限公司 一种B2m基因改造的免疫缺陷动物的制备方法及其应用

Also Published As

Publication number Publication date
IL294356A (en) 2022-08-01
US20230072216A1 (en) 2023-03-09
KR20220125797A (ko) 2022-09-14
JP2023509082A (ja) 2023-03-06
WO2021139799A1 (en) 2021-07-15
EP4087392A1 (en) 2022-11-16
CN113105555B (zh) 2023-05-30
EP4087392A4 (en) 2024-02-21

Similar Documents

Publication Publication Date Title
US11279948B2 (en) Genetically modified non-human animal with human or chimeric OX40
US11505806B2 (en) Genetically modified non-human animal with human or chimeric OX40
US11071290B2 (en) Genetically modified non-human animal with human or chimeric CTLA-4
WO2018068756A1 (en) Genetically modified non-human animal with human or chimeric btla
US20190357506A1 (en) Genetically modified non-human animal with human or chimeric tim-3
WO2018086583A1 (en) Genetically modified non-human animal with human or chimeric lag-3
WO2020135518A1 (en) Genetically modified non-human animal with human or chimeric il15
US20190343098A1 (en) Genetically modified non-human animal with human or chimeric cd40
US20190343096A1 (en) Genetically modified non-human animal with human or chimeric cd27
WO2018113774A1 (en) Genetically modified non-human animal with human or chimeric cd27
WO2019141251A1 (en) Immunodeficient non-human animal
US20190335728A1 (en) Genetically modified non-human animal with human or chimeric cd28
US10945419B2 (en) Genetically modified non-human animal with human or chimeric GITR
CN112779285B (zh) 人源化il-10和il-10ra基因改造动物的构建方法和应用
CN111304246A (zh) 一种人源化细胞因子动物模型、制备方法及应用
CN113105555B (zh) Mhc分子人源化的非人动物的构建方法及应用
US10925264B2 (en) Genetically modified non-human animal with human or chimeric LAG-3
CN112779284B (zh) Thpo基因人源化的非人动物的构建方法及应用
CN113429486A (zh) 基因修饰非人动物的构建方法及应用
CN113429472A (zh) Cd94和nkg2a基因人源化的非人动物及其制备方法和应用
CN113881681B (zh) Ccr8基因人源化非人动物及其构建方法和应用
US11564381B2 (en) Genetically modified non-human animal with human or chimeric LAG3
CN115011606A (zh) Cd37基因人源化非人动物的构建方法及应用
WO2022253322A1 (en) Genetically modified non-human animal with human or chimeric vsig4
CN112553194B (zh) Kit基因修饰的非人动物的制备方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant