CN114835799A - Il1rap基因人源化非人动物的构建方法及应用 - Google Patents

Il1rap基因人源化非人动物的构建方法及应用 Download PDF

Info

Publication number
CN114835799A
CN114835799A CN202210590472.1A CN202210590472A CN114835799A CN 114835799 A CN114835799 A CN 114835799A CN 202210590472 A CN202210590472 A CN 202210590472A CN 114835799 A CN114835799 A CN 114835799A
Authority
CN
China
Prior art keywords
il1rap
gene
nucleotide sequence
humanized
human
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210590472.1A
Other languages
English (en)
Inventor
周小飞
尚诚彰
刘重慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baccetus Beijing Pharmaceutical Technology Co ltd
Biocytogen Jiangsu Gene Biotechnology Co ltd
Original Assignee
Baccetus Beijing Pharmaceutical Technology Co ltd
Biocytogen Jiangsu Gene Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baccetus Beijing Pharmaceutical Technology Co ltd, Biocytogen Jiangsu Gene Biotechnology Co ltd filed Critical Baccetus Beijing Pharmaceutical Technology Co ltd
Publication of CN114835799A publication Critical patent/CN114835799A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/027New breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/715Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons
    • C07K14/7155Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons for interleukins [IL]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0693Tumour cells; Cancer cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5011Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing antineoplastic activity
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0331Animal model for proliferative diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/60Vectors containing traps for, e.g. exons, promoters
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/715Assays involving receptors, cell surface antigens or cell surface determinants for cytokines; for lymphokines; for interferons
    • G01N2333/7155Assays involving receptors, cell surface antigens or cell surface determinants for cytokines; for lymphokines; for interferons for interleukins [IL]
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/24Immunology or allergic disorders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/70Mechanisms involved in disease identification
    • G01N2800/7023(Hyper)proliferation
    • G01N2800/7028Cancer
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Abstract

本发明提供了一种IL1RAP基因人源化的非人动物及其构建方法、一种人源化IL1RAP蛋白、一种人源化IL1RAP基因、一种IL1RAP基因的靶向载体和其在生物医药领域的应用,利用同源重组的方式将编码人IL1RAP蛋白的核苷酸序列导入非人动物基因组中,该动物体内能正常表达人或人源化IL1RAP蛋白,可以作为人IL1RAP信号机理研究、肿瘤及自身免疫性疾病药物筛选的动物模型,对免疫靶点的新药研发具有重要的应用价值。

Description

IL1RAP基因人源化非人动物的构建方法及应用
技术领域
本发明属于动物基因工程和基因遗传修饰领域,具体地说,涉及一种IL1RAP基因改造非人动物模型的构建方法及其在生物医药领域的应用。
背景技术
白细胞介素-1受体附属蛋白(IL1RAP或IL-1RAcP)也被称为白细胞介素-1受体3(IL-1R-3或IL-1R3),属于白细胞介素-1(IL-1)受体家族,是IL-1受体复合物的必要部分,介导IL-1依赖的NFkB活化等通路。IL1RAP包含3个IGG样C2型(免疫球蛋白样)结构域和1个TIR结构域,主要存在IL1、IL33或IL36受体的组织中表达,如淋巴结(胸腺、扁桃体)、骨髓、脑、肺、皮肤、肠道、肝脏和胎盘。已有研究表明IL1RAP对IL-1、IL-33和IL-36信号转导的传递不可或缺,通过促进粘附分子、细胞因子、趋化因子和其他炎性介质的产生和表达来诱导和放大免疫应答,参与包括痛风、关节炎和癌症在内的多种疾病,并且被认识是慢性髓性白血病干细胞的生物标记。
实验动物疾病模型对于研究人类疾病发生的病因、发病机制、开发防治技术和开发药物是不可缺少的研究工具。但由于动物与人类的生理结构和代谢系统本身的差异,传统的动物模型并不能很好的反映人体的真实状况,在动物体内建立更接近人类的生理特征的疾病模型是生物医药行业的迫切需求。随着基因工程技术的不断发展和成熟,用人类基因替代或置换动物的同源性基因已经实现,通过这种方式开发人源化实验动物模型是动物模型未来的发展方向。其中基因人源化动物模型,即利用基因编辑技术,用人源正常或突变基因替换动物基因组的同源基因,可建立更接近人类生理或疾病特征的正常或突变基因动物模型。然而,由于动物与人类在生理学及病理学方面存在差异,加上基因的复杂性,如何能构建出“有效”的人源化动物模型用于新药研发仍是最大的挑战。具体的,对于人源化非人动物的构建,最重要也是最具挑战性的问题在于特定人源供体序列和非人动物受体插入或替换区域的选择。不同的基因序列、结构以及功能的不同,使得一种基因人源化改造方案不能简单的套用到另一种基因的人源化改造。
现有技术中并没有IL1RAP基因人源化动物的构建成功,更没有公开本申请特定选择的外源核苷酸序列进行IL1RAP基因人源化改造。
鉴于IL1RAP在癌症及自身免疫性疾病等治疗领域的巨大应用潜力,为进一步探索其相关生物学特性,提高临床前期药效试验的有效性,提高研发成功率,使临床前期的试验更有效并使研发失败最小化,本领域急需开发IL1RAP人源化的非人动物模型。采用本申请所述方法获得的非人动物不但本身具有重要应用价值,如改进和提升细胞或组织移植人源化动物模型,更重要的是,由于人类基因片段的插入,动物体内可表达或部分表达人源蛋白,可作为仅能识别人蛋白序列的药物的靶点,为在动物水平进行抗人抗体及其它药物的筛选提供了可能。此外,本方法得到的非人动物还可与其它基因人源化非人动物交配得到多基因人源化动物模型,用于筛选和评估针对该信号通路的人用药及联合用药的药效研究。本发明在学术和临床研究中具有广阔的应用前景。
发明内容
本发明的第一方面,提供了一种人源化IL1RAP蛋白,所述的人源化IL1RAP蛋白包含人IL1RAP蛋白的全部或部分。
优选的,所述的人源化IL1RAP蛋白包含人IL1RAP蛋白的胞外区、跨膜区、胞内区和/或胞质区。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白包含人IL1RAP蛋白的胞外区。优选包含SEQ ID NO:2第21-367位所示氨基酸序列;或者,包含与SEQ ID NO:2第21-367位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:2第21-367位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2第21-367位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白包含人IL1RAP蛋白的信号肽。优选还包含SEQ ID NO:2第1-20位所示氨基酸序列;或者,包含与SEQ ID NO:2第1-20位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:2第1-20位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2第1-20位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白包含人IL1RAP蛋白的信号肽和胞外区,优选的,所述的人IL1RAP蛋白的信号肽和胞外区包含SEQ ID NO:2第1-367位所示氨基酸序列;或者,包含与SEQ ID NO:2第1-367位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:2第1-367位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2第1-367位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白包含非人动物IL1RAP蛋白的跨膜区和/或胞质区。优选包含SEQ ID NO:1第368–388、389–570或368-570位所示氨基酸序列;或者,包含与SEQ ID NO:1第368–388、389–570或368-570位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQID NO:1第368–388、389–570或368-570位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:1第368–388、389–570或368-570位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化IL1RAP蛋白包含人IL1RAP基因的全部或部分编码的氨基酸序列。进一步优选的,所述的人源化IL1RAP蛋白包含人IL1RAP基因1号外显子至11号外显子的全部或部分编码的氨基酸序列。更进一步优选包含人IL1RAP基因2号外显子至9号外显子的全部或部分编码的氨基酸序列。再进一步优选包含人IL1RAP基因3号外显子至9号外显子的全部或部分编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白包含人IL1RAP基因2号外显子的部分至9号外显子的部分编码的氨基酸序列。其中,2号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、50、60、61、62、63、64、65bp的核苷酸序列,进一步优选的,包含64bp的核苷酸序列;优选的,2号外显子的部分至少包含从2号外显子的起始密码子开始至2号外显子的最后一个核苷酸;优选的,2号外显子的部分至少包含编码区的核苷酸序列。9号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、45、50、55、60、70、100、130、140、150bp的核苷酸序列,进一步优选的,包含50bp的核苷酸序列;优选的,9号外显子的部分至少包含编码胞外区的核苷酸序列。或者,9号外显子的部分至少包含从9号外显子的5’-3’的长度为10-150bp优选为20-50bp(具体为10、20、30、40、50、60、70、80、90、100、110、120、130、140或150bp)的核苷酸序列。
在本发明的一个具体实施方式中,包含从2号外显子的起始密码子至9号外显子中编码胞外区C端的核苷酸序列。
优选的,所述的人源化IL1RAP蛋白包含非人动物IL1RAP基因的部分编码的氨基酸序列。进一步优选的,包含非人动物9号-11号外显子的全部或部分编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白包含非人动物IL1RAP基因的9号外显子的部分至11号外显子的部分编码的氨基酸序列。其中,9号外显子的部分至少包含30bp的核苷酸序列,例如至少包含30、35、40、45、50、55、60、70、90、95、100、105、110、130、140、150bp的核苷酸序列,进一步优选的,包含100bp的核苷酸序列;优选的,9号外显子的部分至少包含从9号外显子编码跨膜区N端的核苷酸序列开始至9号外显子的最后一个核苷酸序列。或者,9号外显子的部分至少包含从9号外显子的3’-5’的长度为10-150bp优选为20-100bp(具体为10、20、30、40、50、60、70、80、90、100、110、120、130、140或150bp)的核苷酸序列。
11号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、250、300、350、360、365、367、368、369、370、400、500、700、1000、1500、2000、3000、3048bp的核苷酸序列,进一步优选的,包含368bp的核苷酸序列;优选的,11号外显子的部分至少包含编码胞质区的核苷酸序列。或者,11号外显子的部分至少包含从11号外显子的5’-3’的长度为10-3000bp优选为20-368bp(具体为10、50、100、150、200、250、300、350、368、400、450、500、1000、2000或3000bp)的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白包含非人动物IL1RAP基因的从9号外显子编码跨膜区N端的核苷酸序列开始至11号外显子的终止密码子编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白从N端至C端依次为人IL1RAP蛋白的部分、非人动物IL1RAP蛋白的部分。其中,所述的人IL1RAP蛋白的部分与非人动物IL1RAP蛋白的部分可以为直接连接或者通过现有技术中常见的接头(例如多肽)连接。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白包括人IL1RAP蛋白的信号肽和胞外区,以及非人动物IL1RAP蛋白的跨膜区和胞质区。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白包括人IL1RAP基因的部分编码的氨基酸序列和非人动物IL1RAP基因编码的氨基酸序列。其中,人IL1RAP基因的部分编码的氨基酸序列与非人动物IL1RAP基因编码的氨基酸序列之间直接连接或通过接头连接。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白包括人IL1RAP基因的2号外显子的部分至9号外显子的部分编码的氨基酸序列,以及非人动物IL1RAP基因的9号外显子的部分至11号外显子的部分编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白的氨基酸序列包含下列组中的任一种:
A)SEQ ID NO:8所示氨基酸序列;
B)与SEQ ID NO:8所示氨基酸序列同一性至少为85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:8所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
D)与SEQ ID NO:8所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP蛋白包含至少50个氨基酸序列与人IL1RAP的相应氨基酸序列相同,进一步地,所述至少50个氨基酸序列是信号肽和/或胞外区的氨基酸序列。
本发明的第二方面,提供了一种编码上述的人源化IL1RAP蛋白的核酸。
本发明的第三方面,提供了一种人源化IL1RAP基因,所述的人源化IL1RAP基因包含人IL1RAP基因的部分。
优选的,包含人IL1RAP基因的1号至11号外显子的全部或部分核苷酸序列。进一步优选的,包含人IL1RAP基因的2号至9号外显子的全部或部分核苷酸序列。再进一步优选的,包含人IL1RAP基因的3号至9号外显子的全部或部分核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP基因包含人IL1RAP基因的2号外显子的部分至9号外显子的部分核苷酸序列。其中,2号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、50、60、61、62、63、64、65bp的核苷酸序列,进一步优选的,包含64bp的核苷酸序列;优选的,2号外显子的部分至少包含从2号外显子的起始密码子至2号外显子的最后一个核苷酸,优选的,2号外显子的部分至少包含编码区的核苷酸序列。9号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、45、50、55、60、70、100、130、140、150bp的核苷酸序列,进一步优选的,包含50bp的核苷酸序列;优选的,9号外显子的部分至少包含编码胞外区的核苷酸序列。或者,9号外显子的部分至少包含从9号外显子的5’-3’的长度为10-150bp优选为20-50bp(具体为10、20、30、40、50、60、70、80、90、100、110、120、130、140或150bp)的核苷酸序列。
在本发明的一个具体实施方式中,包含从2号外显子的起始密码子至9号外显子中编码胞外区C端的核苷酸序列。
优选的,所述的人源化IL1RAP基因包含编码人IL1RAP蛋白的全部或部分的核苷酸序列。进一步优选的,包含编码人IL1RAP蛋白的胞外区、跨膜区、胞质区和/或信号肽的核苷酸序列。
优选的,所述的人源化IL1RAP基因包含编码人IL1RAP蛋白胞外区的核苷酸序列。进一步优选的,所述的人源化IL1RAP基因还包含编码人IL1RAP蛋白的信号肽的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP基因包含编码SEQ ID NO:2第21-367位或者第1-367位的核苷酸序列。或者,包含与编码SEQ ID NO:2第21-367位或者第1-367位的核苷酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与编码SEQ ID NO:2第21-367位或者第1-367位的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含具有编码SEQ ID NO:2第21-367位或者第1-367位的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化IL1RAP基因中包含的人IL1RAP基因的核苷酸序列可以为基因组DNA序列、cDNA序列或者CDS序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP基因包含SEQ ID NO:5所示的核苷酸序列;或者,包含与SEQ ID NO:5所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:5所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:5所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化IL1RAP基因包含非人动物IL1RAP基因的1号外显子、9号至11号外显子的全部或部分。
在本发明的一个具体实施方式中,所述的人源化IL1RAP基因包含非人动物IL1RAP基因1号外显子的全部和9号外显子的部分至11号外显子的部分核苷酸序列。其中,9号外显子的部分至少包含30bp的核苷酸序列,例如至少包含30、35、40、45、50、55、60、70、90、95、100、105、110、130、140、150bp的核苷酸序列,进一步优选的,包含100bp的核苷酸序列;优选的,9号外显子的部分至少包含从9号外显子编码跨膜区N端的核苷酸序列开始至9号外显子的最后一个核苷酸序列。或者,9号外显子的部分至少包含从9号外显子的3’-5’的长度为10-150bp优选为20-100bp(具体为10、20、30、40、50、60、70、80、90、100、110、120、130、140或150bp)的核苷酸序列。
11号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、250、300、350、360、365、367、368、369、370、400、500、700、1000、1500、2000、3000、3048bp的核苷酸序列,进一步优选的,包含368bp的核苷酸序列;优选的,11号外显子的部分至少包含编码胞质区的核苷酸序列。或者,11号外显子的部分至少包含从11号外显子的5’-3’的长度为10-3000bp优选为20-368bp(具体为10、50、100、150、200、250、300、350、368、400、450、500、1000、2000或3000bp)的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP基因包含非人动物的1号外显子的全部和从9号外显子的编码跨膜区N端的核苷酸序列开始至11号外显子的终止密码子。
优选的,所述的人源化IL1RAP基因还包含编码非人动物IL1RAP蛋白的核苷酸序列。进一步优选的,包含编码人IL1RAP蛋白的跨膜区和/或胞质区的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP基因还包含编码SEQ IDNO:1第368–388、389–570或368-570位的核苷酸序列;或者,包含与编码SEQ ID NO:1第368–388、389–570或368-570位的核苷酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与编码SEQ ID NO:1第368–388、389–570或368-570位的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含具有编码SEQ ID NO:1第368–388、389–570或368-570位的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化IL1RAP基因中包含的非人动物IL1RAP基因的核苷酸序列可以为基因组DNA序列、cDNA序列或者CDS序列。
在本发明的一个具体实施方式中,所述的人源化IL1RAP基因包含SEQ ID NO:6所示的核苷酸序列;或者,包含与SEQ ID NO:6所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:6所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:6所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化IL1RAP基因还包含非人动物IL1RAP基因的3’UTR和/或polyA(pA)。
在本发明的一个具体实施方式中,所述的人源化IL1RAP基因从5’-3’依次为人IL1RAP基因的部分或编码人IL1RAP蛋白的部分核苷酸序列、非人动物IL1RAP基因的部分或编码非人动物IL1RAP蛋白的部分核苷酸序列。在本发明的一个具体实施方式中,所述的人源化IL1RAP基因从5’-3’依次为编码人IL1RAP蛋白的信号肽、胞外区,以及非人动物IL1RAP蛋白的跨膜区和胞质区的核苷酸序列。在本发明的一个具体实施方式中,所述的人源化IL1RAP基因从5’-3’依次为人IL1RAP基因的2号外显子的部分至9号外显子的部分(可以为基因组DNA序列、cDNA序列或者CDS序列),以及非人动物IL1RAP基因的9号外显子的部分至11号外显子的部分(可以为基因组DNA序列、cDNA序列或者CDS序列)。在本发明的一个具体实施方式中,所述的人源化IL1RAP基因从5’-3’依次为非人动物IL1RAP基因的1号外显子,人IL1RAP基因的2号外显子的部分至9号外显子的部分,非人动物IL1RAP基因的9号外显子的部分至11号外显子的部分,以及非人动物2号外显子至11号外显子。
优选在非人动物IL1RAP基因的部分或编码非人动物IL1RAP蛋白的部分核苷酸序列之后还包含非人动物IL1RAP基因的3’UTR和/或polyA(pA)。
其中,所述的人IL1RAP基因的部分或编码人IL1RAP蛋白的部分核苷酸序列与非人动物IL1RAP基因的部分或编码非人动物IL1RAP蛋白的部分核苷酸序列之间可以直接连接或者通过现有技术常见的接头(例如核酸接头)连接。
在本发明的一个具体实施方式中,所述的人源化IL1RAP基因编码上述人源化IL1RAP蛋白。
在本发明的一个具体实施方式中,所述的人源化IL1RAP基因的核苷酸序列包含下列组中的任一种:
A)转录的mRNA包含SEQ ID NO:7所示核苷酸序列;
B)转录的mRNA与SEQ ID NO:7所示核苷酸序列的同一性至少为85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)转录的mRNA与SEQ ID NO:7所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
D)转录的mRNA具有SEQ ID NO:7所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;或,
E)SEQ ID NO:35所示核苷酸序列;
F)与SEQ ID NO:35所示核苷酸序列的同一性至少为85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
G)与SEQ ID NO:35所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
H)具有SEQ ID NO:35所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化IL1RAP基因包含SEQ ID NO:9和/或10所示的核苷酸序列。
优选的,所述的人源化IL1RAP基因还包括特异性诱导物或阻遏物。进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-Off System/Tet-On System)或他莫昔芬系统(Tamoxifen System)。
本发明的第四方面,提供了一种靶向载体,所述的靶向载体包含下列组中的一种:
A)编码上述的人或人源化IL1RAP蛋白的核苷酸序列;
B)编码人IL1RAP蛋白的部分核苷酸序列,优选编码人IL1RAP蛋白的胞外区、跨膜区、胞质区和/或信号肽的核苷酸序列,进一步优选包含编码人IL1RAP蛋白的胞外区的核苷酸序列,更进一步优选还包含编码人IL1RAP蛋白信号肽的核苷酸序列;
在本发明的一个具体实施方式中,包含编码人IL1RAP蛋白的胞外区和信号肽的核苷酸序列。优选包含编码SEQ ID NO:2第1-20、21-367或1-367位所示氨基酸序列;或者,包含与SEQ ID NO:2第1-20、21-367或1-367位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列。
C)人IL1RAP基因的部分或上述的人源化IL1RAP基因;或,
D)人IL1RAP基因的部分,优选人IL1RAP基因的1号至11号外显子的全部或部分,进一步优选人IL1RAP基因的2号至9号外显子的全部或部分,更优选包含2号外显子的部分至9号外显子的部分,优选包含人IL1RAP基因的从2号外显子的起始密码子至9号外显子中编码胞外区C端的核苷酸序列,其中,2号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、50、60、61、62、63、64、65bp的核苷酸序列,进一步优选的,包含64bp的核苷酸序列;优选的,2号外显子的部分至少包含从2号外显子的起始密码子至2号外显子的最后一个核苷酸,优选的,2号外显子的部分至少包含编码区的核苷酸序列。9号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、45、50、55、60、70、100、130、140、150bp的核苷酸序列,进一步优选的,包含50bp的核苷酸序列;优选的,9号外显子的部分至少包含编码胞外区的核苷酸序列;优选包含SEQ ID NO:5所示核苷酸序列;或者,包含与SEQID NO:5所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%。
在本发明的一个具体实施方式中,所述的靶向载体或polyA(pA)包含SEQ ID NO:9所示的核苷酸序列。
在本发明的一个具体实施方式中,所述的靶向载体还包含SEQ ID NO:10所示的核苷酸序列。
优选的,所述的靶向载体还包含5’臂(5’同源臂)和/或3’臂(3’同源臂)。
所述的5’臂为与待改变的转换区5’端同源的DNA片段,其选自非人动物IL1RAP基因基因组DNA的100-10000个长度的核苷酸。优选的,所述的5’臂与NCBI登录号为NC_000082.7至少具有90%同源性的核苷酸。进一步优选的,所述5’臂序列如SEQ ID NO:3所示。
所述的3’臂为与待改变的转换区3’端同源的第二个DNA片段,其选自非人动物IL1RAP基因基因组DNA的100-10000个长度的核苷酸;优选的,所述的3’臂与NCBI登录号为NC_000082.7至少具有90%同源性的核苷酸;进一步优选的,所述3’臂序列如SEQ ID NO:4所示。
在本发明的一个具体实施方式中,所述的靶向载体包含从5’-3’依次为5’臂、人IL1RAP基因的核苷酸序列(或编码人IL1RAP蛋白的部分核苷酸序列)、非人动物的IL1RAP基因的核苷酸序列(或编码非人动物IL1RAP蛋白的核苷酸序列)、3’臂。优选的,在非人动物IL1RAP基因的核苷酸序列之后还包含非人动物3’UTR和/或polyA(pA)。
在本发明的一个具体实施方式中,所述的靶向载体包含从5’-3’依次为5’臂、人IL1RAP基因的核苷酸序列(或编码人IL1RAP蛋白的部分核苷酸序列)、3’臂。
优选的,所述的待改变的转换区位于非人动物IL1RAP基因的1号至11号外显子上。
在本发明的一个具体实施方式中,位于非人动物IL1RAP基因的2号外显子上。
在本发明的另一个具体实施方式中,位于非人动物IL1RAP基因的2号至9号外显子上。
优选的,所述的靶向载体还包含标记基因。进一步优选的,所述标记基因为负筛选标记的编码基因。更进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。
在本发明的一个具体实施方式中,所述的靶向载体中还包括阳性克隆筛选的抗性基因。进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。
在本发明的一个具体实施方式中,所述的靶向载体中还包括特异性重组系统。进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的Cre-Lox重组系统)。Frt(或LoxP)位点分别装在抗性基因的两侧。
本发明的第五方面,提供了一种包含上述靶向载体的细胞。
本发明的第六方面,提供了一种上述的靶向载体或者上述包含靶向载体的细胞在IL1RAP基因编辑中的应用。
本发明的第七方面,提供了一种人源化的非人动物,所述的非人动物体内表达人或人源化IL1RAP蛋白;或者,所述的非人动物的基因组中包含人或人源化IL1RAP基因。
优选的,所述的人源化IL1RAP蛋白为上述的人源化IL1RAP蛋白。优选的,所述的人源化IL1RAP基因为上述的核酸或上述的人源化IL1RAP基因。
优选的,编码人或人源化IL1RAP蛋白的核苷酸序列或者所述人或人源化IL1RAP基因的核苷酸序列可操作地连接到至少一条染色体中内源性IL1RAP基因座处的内源性调控元件。
优选的,所述的非人动物的内源IL1RAP蛋白表达降低或缺失。
所述的非人动物进一步包含其他基因修饰,所述的其他基因选自IL33、PD-L1、IL10、IL1B、IL1R1、IL13、IL17、CCR5或CCR8中的至少一种。
本发明的第八方面,提供了一种上述的非人动物或其构建方法,所述的非人动物体内表达上述的人或人源化IL1RAP蛋白,和/或,所述的非人动物的基因组中包含上述的人或人源化IL1RAP基因。
优选的,所述的非人动物的内源IL1RAP蛋白表达降低或缺失。
所述的非人动物包含人IL1RAP基因的部分。
优选的,包含人IL1RAP基因的1号至11号外显子的全部或部分。进一步优选的,包含人IL1RAP基因的2号至9号外显子的全部或部分。更进一步优选的,包含人IL1RAP基因的3号至9号外显子的全部或部分。
在本发明的一个具体实施方式中,所述的非人动物的基因组中包含人IL1RAP基因的2号外显子的部分至9号外显子的部分。其中,2号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、50、60、61、62、63、64、65bp的核苷酸序列,进一步优选的,包含64bp的核苷酸序列;优选的,2号外显子的部分至少包含从2号外显子的起始密码子至2号外显子的最后一个核苷酸。9号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、45、50、55、60、70、100、130、140、150bp的核苷酸序列,进一步优选的,包含50bp的核苷酸序列;优选的,9号外显子的部分至少包含编码胞外区的核苷酸序列。或者,9号外显子的部分至少包含从9号外显子的5’-3’的长度为10-150bp优选为20-50bp(具体为10、20、30、40、50、60、70、80、90、100、110、120、130、140或150bp)的核苷酸序列。
在本发明的一个具体实施方式中,所述的非人动物的基因组中包含从2号外显子的起始密码子至9号外显子中编码胞外区C端的核苷酸序列。
优选的,所述的非人动物的基因组中包含编码人IL1RAP蛋白的核苷酸序列。进一步优选的,包含编码人IL1RAP蛋白的胞外区、跨膜区、胞质区和/或信号肽的核苷酸序列。
优选的,所述的非人动物的基因组中包含编码人IL1RAP蛋白胞外区的核苷酸序列。进一步优选的,包含编码人IL1RAP蛋白的信号肽的核苷酸序列。
在本发明的一个具体实施方式中,所述的非人动物基因组中包含编码SEQ ID NO:2第1-20、21-367位或者第1-367位的核苷酸序列。或者,包含与编码SEQ ID NO:2第1-20、21-367位或者第1-367位的核苷酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与编码SEQ ID NO:2第1-20、21-367位或者第1-367位的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含具有编码SEQ ID NO:2第1-20、21-367位或者第1-367位的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的非人动物的基因组中包含的人IL1RAP基因的核苷酸序列可以为基因组DNA序列、cDNA序列或者CDS序列。
在本发明的一个具体实施方式中,所述的非人动物的基因组中包含SEQ ID NO:5所示的核苷酸序列;或者,包含与SEQ ID NO:5所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:5所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ IDNO:5所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的非人动物的基因组中包含下列组中的任一种:
A)转录的mRNA包含SEQ ID NO:7所示核苷酸序列;
B)转录的mRNA与SEQ ID NO:7所示核苷酸序列的同一性至少为85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)转录的mRNA与SEQ ID NO:7所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
D)转录的mRNA具有SEQ ID NO:7所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;或,
E)SEQ ID NO:35所示核苷酸序列;
F)与SEQ ID NO:35所示核苷酸序列的同一性至少为85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
G)与SEQ ID NO:35所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
H)具有SEQ ID NO:35所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,人或人源化IL1RAP基因或编码人或人源化IL1RAP蛋白的核苷酸序列可操作地连接到至少一条染色体中内源性IL1RAP基因座处的内源调控元件。
优选的,所述的构建方法包括将供体核苷酸序列导入非人动物IL1RAP基因座,其中,所述的供体核苷酸序列包含下列组中的一种:
A)编码上述的人或人源化IL1RAP蛋白的核苷酸序列;
B)编码人IL1RAP蛋白的部分核苷酸序列,优选编码人IL1RAP蛋白的胞外区、跨膜区、胞质区和/或信号肽的核苷酸序列,进一步优选包含编码人IL1RAP蛋白的胞外区的核苷酸序列,更进一步优选还包含编码人IL1RAP蛋白信号肽的核苷酸序列;
在本发明的一个具体实施方式中,包含编码人IL1RAP蛋白的胞外区和信号肽的核苷酸序列。优选包含编码SEQ ID NO:2第1-20、21-367或1-367位所示氨基酸序列;或者,包含与SEQ ID NO:2第1-20、21-367或1-367位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列。
C)人IL1RAP基因的部分或上述的人源化IL1RAP基因;或,
D)人IL1RAP基因的部分,优选人IL1RAP基因的1号至11号外显子的全部或部分,进一步优选人IL1RAP基因的2号至9号外显子的全部或部分,更优选包含2号外显子的部分至9号外显子的部分,优选包含人IL1RAP基因的从2号外显子的起始密码子至9号外显子中编码胞外区C端的核苷酸序列,其中,2号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、50、60、61、62、63、64、65bp的核苷酸序列,进一步优选的,包含64bp的核苷酸序列;优选的,2号外显子的部分至少包含从2号外显子的起始密码子至2号外显子的最后一个核苷酸,优选的,2号外显子的部分至少包含编码区的核苷酸序列。9号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、45、50、55、60、70、100、130、140、150bp的核苷酸序列,进一步优选的,包含50bp的核苷酸序列;优选的,9号外显子的部分至少包含编码胞外区的核苷酸序列;优选包含SEQ ID NO:5所示核苷酸序列;或者,包含与SEQID NO:5所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%。
优选的,所述的人或人源化IL1RAP基因、编码人或人源化IL1RAP蛋白的核苷酸序列、供体核苷酸序列在非人动物中通过调控元件进行调控。进一步优选的,所述的调控元件可以是内源性或者外源性。
所述的内源性调控元件为非人动物IL1RAP基因调控元件,所述的外源性调控元件为人IL1RAP基因调控元件。
优选的,所述的调控元件包括但不限于启动子。
优选的,所述的导入为插入或替换。
优选的,导入非人动物IL1RAP基因座为插入非人动物IL1RAP基因的2号外显子,优选插入的核苷酸序列还包含辅助序列(例如终止密码子、翻转序列或敲除序列),所述辅助序列优选为终止密码子、WPRE、3’UTR和/或polyA(pA),所述辅助序列的功能为终止基因表达、调节基因表达或稳定基因表达。
优选的,所述的插入还伴随有1-5bp核苷酸的删除,进一步优选的,所述的插入还伴随有ATG的删除。
在本发明的一个具体实施方式中,导入非人动物IL1RAP基因座为插入非人动物IL1RAP基因的起始密码子前,5’UTR之后。
在本发明的一个具体实施方式中,导入非人动物IL1RAP基因座为插入非人动物IL1RAP基因的起始密码子处,并删除内源起始密码子。
优选的,导入非人动物IL1RAP基因座为替换非人动物IL1RAP基因的2号外显子的部分至9号外显子的部分,进一步优选为2号外显子的起始密码子至9号外显子中编码胞外区C端的核苷酸序列,其中,2号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、50、60、61、62、63、64、65bp的核苷酸序列,进一步优选的,包含64bp的核苷酸序列;优选的,2号外显子的部分至少包含从2号外显子的起始密码子至2号外显子的最后一个核苷酸,优选的,2号外显子的部分至少包含编码区的核苷酸序列。9号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、45、50、55、60、70、100、130、140、150bp的核苷酸序列,进一步优选的,包含50bp的核苷酸序列;优选的,9号外显子的部分至少包含编码胞外区的核苷酸序列;或者,
优选的,导入非人动物IL1RAP基因座为替换非人动物IL1RAP基因的编码序列。
优选的,所述的构建方法包括首先修饰非人动物内源IL1RAP基因的编码框,将编码人或人源化IL1RAP蛋白的核苷酸序列或者人源化IL1RAP基因的核苷酸序列插入非人动物IL1RAP基因的内源调控元件之后。其中,所述的修饰非人动物IL1RAP基因的编码框可以采用敲除非人动物IL1RAP基因的功能区或者采用插入一段序列,使得非人动物IL1RAP蛋白不表达或表达的蛋白无功能。进一步优选的,所述的修饰非人动物IL1RAP基因的编码框可以为敲除非人动物IL1RAP基因的1号外显子至11号外显子的全部或部分核苷酸序列。
在本发明的一个具体实施方式中,所述的构建方法包括将编码人或人源化IL1RAP蛋白的核苷酸序列或者人源化IL1RAP基因的核苷酸序列,和辅助序列插入非人动物IL1RAP基因内源调控元件(优选为起始密码子处)之后。优选的,所述的辅助序列可以为终止密码子、翻转序列或敲除序列,例如终止密码子、WPRE、3’UTR和/或polyA(pA),使得IL1RAP基因人源化的非人动物体内表达人或人源化IL1RAP蛋白,不表达非人动物IL1RAP蛋白。进一步优选的,所述的辅助序列为3’UTR和/或polyA(pA)。
在本发明的一个具体实施方式中,所述的构建方法包括将编码人IL1RAP蛋白的全部或部分(优选为人IL1RAP蛋白的胞外区、信号肽、胞内区和/或胞质区,进一步优选为胞外区,再进一步优选为胞外区和信号肽)插入或替换至非人动物IL1RAP基因的相应区域(优选为编码非人动物IL1RAP蛋白的胞外区的核苷酸序列,进一步优选为编码非人动物IL1RAP蛋白的胞外区和信号肽的核苷酸序列)。
在本发明的一个具体实施方式中,所述的构建方法包括将人IL1RAP基因的部分(优选为人IL1RAP基因的1号至11号外显子的全部或部分,进一步优选为人IL1RAP基因2号至9号外显子的全部或部分,更进一步优选为从2号外显子的起始密码子至9号外显子中编码胞外区C端的核苷酸序列)插入或替换至非人动物IL1RAP基因的相应区域(优选为1号至11号外显子的全部或部分,进一步优选为2号至9号外显子的全部或部分,更进一步优选为2号外显子的部分至9号外显子的部分)。
优选的,使用基因编辑技术进行人源化的非人动物的构建,所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。
在本发明的一个具体实施方式中,使用上述靶向载体进行非人动物的构建。
在本发明的一个具体实施方式中,所述的构建方法包括将上述靶向载体导入非人动物细胞中,培养该细胞(优选为受精卵),然后将培养后的细胞移植至雌性非人动物输卵管内,允许其发育,鉴定筛选获得人源化的非人动物。
优选的,为提高重组效率,还可以使用sgRNA与上述靶向载体一起进行非人动物的构建。其中,所述的sgRNA靶向非人动物IL1RAP基因,同时所述sgRNA的序列在待改变的IL1RAP基因上的靶序列上。
在本发明的一个具体实施方式中,所述的构建方法包括将上述靶向载体、sgRNA及Cas9导入非人动物细胞中,培养该细胞(优选为胚胎干细胞),然后将培养后的细胞移植至雌性非人动物输卵管内,允许其发育,鉴定筛选获得IL1RAP基因人源化的非人动物。
优选的,所述的非人动物进一步包含其他基因修饰。
所述的构建方法进一步包括将人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因选自IL33、PD-L1、IL10、IL1B、IL1R1、IL13、IL17、CCR5或CCR8中的至少一种。
优选的,所述的非人动物还表达人或人源化的IL33、PD-L1、IL10、IL1B、IL1R1、IL13、IL17、CCR5或CCR8蛋白中的至少一种。
优选的,所述的非人动物中人或人源化IL1RAP基因或其他基因对于内源被修饰基因座是纯合的。
优选的,所述的非人动物中人或人源化IL1RAP基因或其他基因对于内源被修饰基因座是杂合的。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。再进一步优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-小鼠、Rag 2-/--IL2rg-/-小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第九方面,提供了一种多基因修饰的非人动物的构建方法,包括如下步骤:
(一)提供上述的非人动物或者采用上述的构建方法获得非人动物;
(二)将步骤(一)提供的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因修饰的非人动物包括基因IL33、PD-L1、IL10、IL1B、IL1R1、IL13、IL17、CCR5或CCR8中的一种或两种以上的组合修饰的非人动物。
优选的,所述的多基因修饰的非人动物为双基因修饰非人动物、三基因修饰非人动物、四基因修饰非人动物、五基因修饰非人动物、六基因修饰非人动物、七基因修饰非人动物、八基因修饰非人动物或九基因修饰非人动物。
优选的,所述的多基因修饰的非人动物的基因组中修饰的多个基因中的每一个基因对于内源被替换基因座均可以是纯合的。
优选的,所述的多基因修饰的非人动物的基因组中修饰的多个基因中的每一个基因对于内源被替换基因座均可以是杂合的。
本发明的第十方面,提供了一种上述构建方法获得的非人动物。
本发明的第十一方面,提供了一种细胞、组织或器官,所述的细胞、组织或器官表达上述的人或人源化IL1RAP蛋白,或者所述的细胞、组织或器官的基因组中包含上述的核酸或上述的人或人源化IL1RAP基因;或者,所述的细胞、组织或器官来源于上述的非人动物,或者,上述的构建方法获得的非人动物。
优选的,所述的组织可以为淋巴结(胸腺、扁桃体)、骨髓、脑、肺、皮肤、肠道、肝脏或胎盘等等。
本发明的第十二方面,提供了一种荷瘤后的瘤组织,所述的瘤组织表达上述的人或人源化IL1RAP蛋白或者所述的瘤组织的基因组中包含上述的核酸或上述的人或人源化IL1RAP基因。或者,所述的细胞、组织或器官来源于上述的非人动物,或者,上述的构建方法获得的非人动物。
本发明的第十三方面,提供了一种荷瘤或炎症的动物模型,所述的动物模型来源于上述的非人动物或者上述的构建方法获得的非人动物。
本发明的第十四方面,提供了一种动物的荷瘤或炎症模型的构建方法,所述的构建方法是利用上述构建非人动物、非人动物或其子代或者多基因修饰的非人动物进行的。
本发明的第十五方面,提供了一种上述的非人动物、上述构建方法获得的非人动物在构建荷瘤或炎症的动物模型中的应用。
本发明的第十六方面,提供了一种上述的非人动物、上述构建方法获得的非人动物或者上述的荷瘤或炎症动物模型在制备治疗肿瘤或免疫相关疾病的药物中的用途。
本发明的第十七方面,提供了一种IL1RAP基因人源化的细胞,所述的细胞表达上述的人或人源化IL1RAP蛋白,和/或,所述的细胞的基因组中包含上述的人或人源化IL1RAP基因。
优选的,所述的细胞中内源IL1RAP蛋白表达降低或缺失。
优选的,所述的细胞的基因组中包含人IL1RAP基因的1号至11号外显子的全部或部分。进一步优选包含人IL1RAP基因的2号至9号外显子的全部或部分。更进一步优选的,包含人IL1RAP基因的2号外显子的部分至9号外显子的部分,其中,2号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、50、60、61、62、63、64、65bp的核苷酸序列,进一步优选的,包含64bp的核苷酸序列;优选的,2号外显子的部分至少包含从2号外显子的起始密码子至2号外显子的最后一个核苷酸。9号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、45、50、55、60、70、100、130、140、150bp的核苷酸序列,进一步优选的,包含50bp的核苷酸序列;优选的,9号外显子的部分至少包含编码胞外区的核苷酸序列。
优选的,所述的细胞的基因组中包含编码人IL1RAP蛋白的胞外区、信号肽、胞内区和/或跨膜区的核苷酸序列。进一步优选的,包含编码人IL1RAP蛋白的胞外区的核苷酸序列。更进一步优选的,包含编码人IL1RAP蛋白的胞外区和信号肽的核苷酸序列。
本发明的第十八方面,提供了一种IL1RAP基因人源化的细胞的构建方法,所述的构建方法包括将供体核苷酸序列导入细胞IL1RAP基因座,其中,所述的供体核苷酸序列包含下列组中的一种:
A)编码上述的人或人源化IL1RAP蛋白的核苷酸序列;
B)编码人IL1RAP蛋白的部分核苷酸序列,优选编码人IL1RAP蛋白的胞外区、跨膜区、胞质区和/或信号肽的核苷酸序列,进一步优选包含编码人IL1RAP蛋白的胞外区的核苷酸序列,更进一步优选还包含编码人IL1RAP蛋白信号肽的核苷酸序列;
在本发明的一个具体实施方式中,包含编码人IL1RAP蛋白的胞外区和信号肽的核苷酸序列,优选包含编码SEQ ID NO:2第1-20、21-367或1-367位所示氨基酸序列;或者,包含与SEQ ID NO:2第1-20、21-367或1-367位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列。
C)人IL1RAP基因的部分或上述的人源化IL1RAP基因;或,
D)人IL1RAP基因的部分,优选人IL1RAP基因的1号至11号外显子的全部或部分,进一步优选人IL1RAP基因的2号至9号外显子的全部或部分,更优选包含2号外显子的部分至9号外显子的部分,优选包含人IL1RAP基因的从2号外显子的起始密码子至9号外显子中编码胞外区C端的核苷酸序列,其中,2号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、50、60、61、62、63、64、65bp的核苷酸序列,进一步优选的,包含64bp的核苷酸序列;优选的,2号外显子的部分至少包含从2号外显子的起始密码子至2号外显子的最后一个核苷酸,优选的,2号外显子的部分至少包含编码区的核苷酸序列。9号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、35、40、45、50、55、60、70、100、130、140、150bp的核苷酸序列,进一步优选的,包含50bp的核苷酸序列;优选的,9号外显子的部分至少包含编码胞外区的核苷酸序列;优选包含SEQ ID NO:5所示核苷酸序列;或者,包含与SEQID NO:5所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%。
优选的,使用上述的靶向载体和/或上述的sgRNA进行细胞的构建。
本发明的第十九方面,提供了来源于上述的人源化IL1RAP蛋白、上述的核酸、上述的人源化IL1RAP基因、上述的非人动物、上述的构建方法获得的非人动物、上述的细胞、组织或器官的应用,所述的应用包括:
A)涉及人类细胞的与IL1RAP相关的免疫过程的产品开发中的应用;
B)作为药理学、免疫学、微生物学和医学研究的与IL1RAP相关的模型系统中的应用;
C)涉及生产和利用动物实验疾病模型用于与IL1RAP相关的病原学研究和/或用于开发诊断策略和/或用于开发治疗策略中的应用;
D)在体内研究人IL1RAP信号通路调节剂的筛选、药效检测、评估疗效、验证或评价中的应用;或者,
E)研究IL1RAP基因功能,研究针对人IL1RAP靶位点的药物、药效,研究与IL1RAP相关的免疫相关疾病药物以及抗肿瘤药物方面的应用。
优选的,所述的应用为治疗目的。
优选的,所述的应用为非治疗目的。
本发明的第二十方面,提供了来源于上述的非人动物、上述的构建方法获得的非人动物或者上述的荷瘤或炎症的动物模型用作人IL1RAP特异性调节剂的筛选。
本发明的第二十一方面,提供了一种人IL1RAP特异性调节剂的筛选方法,所述的筛选方法包括向植入肿瘤细胞的个体施加调节剂,检测肿瘤抑制性;其中,所述的个体选自上述的非人动物或者采用上述方法构建的非人动物或者上述的荷瘤或炎症的动物模型。
优选的,所述的调节剂选自CAR-T、药物。进一步优选的,所述的药物为抗体,具体地,该药物可以为抗IL1RAP抗体。
优选的,所述的调节剂为单抗或双特异性抗体或两种及两种以上药物的联合使用。
优选的,所述检测包括测定肿瘤细胞的大小和/或增殖速率。
优选的,所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。
优选的,所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化,所述的代谢变化包括食物消耗或水消耗的变化。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述筛选方法为治疗目的。
优选的,所述筛选方法为非治疗方法。该筛选方法对调节剂的效果进行检测和评价,以确定该调节剂是否有治疗效果,即治疗效果不是必然的,只是一种可能性。
本发明的第二十二方面,提供了一种人用药物筛选或评价的方法,所述的方法包括向个体体内移植人肿瘤细胞,向移入人肿瘤细胞的动物给予候选药物,对给予候选药物的个体进行药效检测和/或比较。其中,所述的个体选自上述的构建方法获得的人源化的非人动物、上述的人源化的非人动物、上述的构建方法获得的多基因修饰的非人动物、上述的多基因修饰的非人动物或其子代或者上述的荷瘤或炎症的动物模型。
优选的,所述药物筛选或评价的方法为治疗目的。
优选的,所述药物筛选或评价的方法为非治疗方法。该方法用来筛选或评价药物,对候选药物的药效进行检测和比较,以确定哪些候选药物可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度,即治疗效果不是必然的,只是一种可能性。
优选的,所述候选药物包括靶向药物。进一步优选的,所述的靶向药物为抗原结合蛋白。在本发明的一个具体实施方式中,所述的抗原结合蛋白为抗体。
优选的,所述候选药物为单抗或双特异性抗体或两种及两种以上药物的联合使用。
优选的,所述检测包括测定肿瘤细胞的大小和/或增殖速率;优选的,所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。
优选的,所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化,所述的代谢变化包括食物消耗或水消耗的变化。
本发明所述的“免疫相关疾病”包括但不限于过敏、哮喘、心肌炎、肾炎、肝炎、系统性红斑狼疮、类风湿性关节炎、硬皮病、甲状腺功能亢进、原发性血小板减少性紫癜、自身免疫性溶血性贫血、溃疡性结肠炎、自身免疫性肝病、糖尿病、疼痛或神经障碍等。
本发明所述的“肿瘤”包括但不限于淋巴瘤、非小细胞肺癌、宫颈癌、白血病、卵巢癌、鼻咽癌、乳腺癌、子宫内膜癌、结肠癌、直肠癌、胃癌、膀胱癌、脑胶质瘤、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺癌、头颈部癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中,所述的白血病选自急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病;所述淋巴瘤选自霍奇金淋巴瘤和非霍奇金淋巴瘤,包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症;所述肉瘤选自骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、以及软骨肉瘤。在本发明的一个具体实施方式中,所述的肿瘤为乳腺癌、卵巢癌、子宫内膜癌、黑色素瘤、肾癌、肺癌、肝癌。
本发明所述“治疗(treating)”(或“治疗(treat)”或“治疗(treatment)”)表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除。
本发明所述的“基因座”广义上讲代表基因在染色体上所占的位置,狭义上讲代表某一基因上的一段DNA片段,即可以是一个基因也可以是一个基因的一部分。例如所述的“IL1RAP基因座”表示IL1RAP基因1号至11号外显子上的任选一段的DNA片段。在本发明的一个具体实施方式中,被插入的IL1RAP的基因座可以是1号至11号外显子上的任一位置,优选为内源调控元件之后,在本发明的一个具体实施方式中为起始密码子处。被替换的IL1RAP基因座可以是IL1RAP基因1号至11号外显子上的任选一段的DNA片段。在本发明的一个具体实施方式中,被替换的IL1RAP基因座可以是IL1RAP基因2号至9号外显子上的任选一段的DNA片段。
本发明所述的“核苷酸序列”包含天然的或经过修饰的核糖核苷酸序列、脱氧核糖核苷酸序列。优选为DNA、cDNA、pre-mRNA、mRNA、rRNA、hnRNA、miRNAs、scRNA、snRNA、siRNA、sgRNA、tRNA。
本发明所述的“人源化IL1RAP蛋白”,包含来源于人IL1RAP蛋白的部分和非人IL1RAP蛋白的部分,其中,所述“人IL1RAP蛋白”或“人IL1RAP蛋白的全部”包含人IL1RAP蛋白的全长氨基酸序列。所述的人IL1RAP蛋白的部分与非人IL1RAP蛋白的部分之间可以直接连接或者接头连接,所述的“接头”为柔性接头,优选为肽接头,其氨基酸数目和种类没有限定,只要可以连接人IL1RAP蛋白的部分与非人IL1RAP蛋白部分,且不影响人源化IL1RAP蛋白的功能即可。优选的,所述的人源化IL1RAP蛋白包含连续或间隔的5-570个氨基酸序列与人IL1RAP蛋白的氨基酸序列一致,优选为连续或间隔的10-347、10-367个,更优选为5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、347、350、367、400、450、500、550或570个氨基酸序列与人IL1RAP蛋白的氨基酸序列一致。
本发明所述的“人源化IL1RAP基因”,包含来源于人IL1RAP基因的部分和非人IL1RAP基因的部分,所述的“人IL1RAP基因”或“人IL1RAP基因的全部”包含人IL1RAP基因的全长核苷酸序列。优选的,所述的人源化IL1RAP基因包括连续或间隔的20bp-145665bp个核苷酸序列与人IL1RAP基因的核苷酸序列一致,优选为连续或间隔的20-4658、20-1101bp个,更优选为20、50、100、200、300、400、500、600、700、800、900、1000、1100、1101、1200、1300、1400、1500、1600、1700、1800、1900、2000、2500、3000、4000、4500、4658、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000、20000、30000、40000、100000、120000或145665个核苷酸序列与人IL1RAP基因的核苷酸序列一致。
本发明所述的“细胞”可以为受精卵细胞或者其他体细胞,优选包括但不限于血小板、单核细胞、小胶质细胞和内皮细胞、中性粒细胞、活化的巨噬细胞、B细胞前体、树突状细胞、自然杀伤细胞、晚期B细胞或浆细胞等等。因此,根据细胞来源的不同,本申请所述的细胞一部分可以发育为动物个体,一部分不能发育为动物个体。
本发明所述的“全部或部分”,“全部”为整体;“部分”为整体中的局部,或者整体中的个体。
本发明所述的“x号至xx号外显子”包含外显子及其期间的内含子的核苷酸序列,例如“9号至11号外显子”包含9号外显子、9-10号内含子、10号外显子、10-11号内含子和11号外显子,又例如“2号外显子的部分至9号外显子的部分”包含2号外显子的部分、2-3号内含子、3号外显子、3-4号内含子、4号外显子、4-5号内含子、5号外显子、5-6号内含子、6号外显子、6-7号内含子、7号外显子、7-8号内含子、8号外显子、8-9号内含子和9号外显子的部分。
本发明所述的“x-xx号内含子”代表x号外显子与xx号外显子之间的内含子,例如“9-10号内含子”代表9号外显子与10号外显子之间的内含子。
本发明所述的“IL1RAP蛋白”,例如“人IL1RAP蛋白”、“非人动物IL1RAP蛋白”或“人源化IL1RAP蛋白”,均包含信号肽、胞外区、胞内区和/或跨膜区,且本发明所述的“胞外区”均不包含信号肽。
本发明所述的“包含”或“包括”是开放式的描述,含有所描述的指定成分或步骤,以及不会实质上影响的其他指定成分或步骤。然而在用于描述蛋白质或核酸的序列时,所述蛋白质或核酸可以是由所述序列组成,或者在所述蛋白质或核酸的一端或两端可以具有额外的氨基酸或核苷酸,但仍然具有本发明所述的活性。
本发明所述“同源性”,是指在使用蛋白序列或核苷酸序列的方面,本领域技术人员可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。
本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:Molecular Cloning A Laboratory Manual,2ndEd.,ed.By Sambrook,FritschandManiatis(Cold Spring Harbor Laboratory Press:1989);DNA Cloning,Volumes I and II(D.N.Glovered.,1985);Oligonucleotide Synthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;Nucleic Acid Hybridization(B.D.Hames&
S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelsonand M.Simon,eds.inchief,Academic Press,Inc.,New York),specifically,Vols.154and 155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,ed.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods InCell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook Of Experimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);and Manipulating the Mouse Embryo,(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1986)。
在一个方面,所述非人动物是哺乳动物。优选的,所述非人动物是小型哺乳动物。在一个实施方式中,所述人源化的非人动物是啮齿类动物。在一个实施方式中,所述啮齿类动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。
在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠及NOD、NOD/SCID、NOD-Prkdcscid IL-2rgnull背景的小鼠。
以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。
下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:小鼠IL1RAP基因座和人IL1RAP基因座对比示意图(非按比例);
图2:小鼠IL1RAP基因人源化改造示意图(非按比例),具体为用人exon2至exon9部分序列替换对小鼠相应的内源序列;
图3:小鼠IL1RAP基因人源化改造示意图(非按比例),具体为将人IL1RAP编码序列与小鼠IL1RAP编码序列的拼接序列插入或替换小鼠内源特定位置;
图4:IL1RAP基因打靶策略及靶向载体设计示意图(非按比例);
图5:克隆Southern Blot鉴定结果,其中WT为野生型对照;
图6:F1代小鼠基因型鉴定结果,其中WT为野生型对照,PC为阳性对照,H2O为水对照,M为Marker;
图7:RT-PCR检测mRNA表达情况结果示意图,其中+/+为野生型C57BL/6小鼠,H/H为IL1RAP人源化纯合小鼠。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
在下述每一实施例中,设备和材料是从以下所指出的几家公司获得:
DraIII、EcoRV酶购自NEB,货号分别为R3510、R3195S;
C57BL/6小鼠购自中国食品药品检定研究院国家啮齿类实验动物种子中心;
Brilliant Violet 510TManti-mouse CD45 Antibody购自Biolegend,货号103138;
Purified anti-mouse CD16/32Antibody购自Biolegend,货号101302;
Zombie NIRTMFixable Viability Kit购自Biolegend,货号423106;
PerCP anti-mouse Ly-6G/Ly-6C(Gr-1)Antibody购自Biolegend,货号108426;
V450 Rat Anti-mouse CD11b购自BD Biosciences,货号560455;
FITC anti-mouse F4/80Antibody购自Biolegend,货号123108;
Human IL-1RAcP/IL-1R3 PE-conjugated Antibody购自R&D,货号FAB676P。
实施例1IL1RAP基因人源化小鼠
小鼠IL1RAP基因(NCBI Gene ID:16180,Primary source:MGI:104975,UniProt:Q61730,位于16号染色体NC_000082.7的第26400259至26548878位,基于转录本NM_008364.2及其编码蛋白NP_032390.1(SEQ ID NO:1))和人IL1RAP基因(NCBI Gene ID:3556,Primary source:HGNC:5995,UniProt ID:Q9NPH3,位于3号染色体NC_000003.12的第190514085至190659750位,基于转录本NM_001167929.2及其编码蛋白NP_001161401.1(SEQID NO:2))对比示意图如图1所示。
为了达到本发明的目的,可在小鼠内源IL1RAP基因座引入编码人IL1RAP蛋白的核苷酸序列,使得该小鼠表达人或人源化IL1RAP蛋白,并且有多种替换方式。例如,使用基因编辑技术,在小鼠IL1RAP基因调节元件的控制下,将编码人信号肽和胞外区的序列敲进小鼠基因座,例如用人exon2至exon9部分序列替换对小鼠相应的内源序列,得到人源化IL1RAP基因座示意图如图2所示,或者将含有人核苷酸序列的片段或者人核苷酸序列与小鼠的拼接序列插入小鼠内源特定位置,并使得插入位点以后的内源序列终止表达,得到人源化IL1RAP基因座示意图如图3所示,实现对小鼠IL1RAP基因的人源化改造。
以图3的改造方式为例,设计如图4所示的打靶策略,图中显示了靶向载体上含有小鼠IL1RAP基因上游和下游的同源臂序列,以及敲进的AB片段,其中AB片段包含含有人IL1RAP核苷酸序列的KI片段(SEQ ID NO:35)。其中,上游同源臂序列(5’同源臂,SEQ IDNO:3)与NCBI登录号为NC_000082.7的第26438528至26442905位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:4)与NCBI登录号为NC_000082.7的第26442909至26446614位核苷酸序列相同;敲进片段中含有人IL1RAP编码序列和鼠IL1RAP编码序列,其中人IL1RAP编码序列(SEQ ID NO:5)与NCBI登录号为NM_001167929.2的第137至1237位核苷酸序列相同,鼠IL1RAP编码序列(SEQ ID NO:6)与NCBI登录号为NM_008364.2的第1285至1896位核苷酸序列相同。改造后的人源化小鼠IL1RAP的mRNA序列如SEQ ID NO:7所示,其表达的氨基酸序列如SEQ ID NO:8所示。
靶向载体上还存在辅助序列,包括鼠编码序列下游的3’UTR、polyA(pA)(SEQ IDNO:9)及用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neocassette)。其中Neo盒5’端与pA直接连接,3’端与小鼠IL1RAP基因座的接合设计为
Figure BDA0003667112480000201
Figure BDA0003667112480000202
内,其中序列“CCGC”的最后一个“C”是Neo盒的最后一个核苷酸,序列
Figure BDA0003667112480000203
的第一个“G”是鼠的第一个核苷酸。此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。
鉴于人IL1RAP和鼠IL1RAP具有多种亚型或转录本,本文所述的方法可应用于其它亚型或转录本。
靶向载体构建可采用常规方法进行,如酶切连接、直接合成等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR(引物见表1)和Southern Blot技术进行检测确认外源基因的整合情况,筛选出正确的阳性克隆细胞。经PCR鉴定为阳性的克隆再进行Southern Blot(分别用DraIII或EcoRV消化细胞DNA并使用3个探针进行杂交,探针大小见表2)检测,结果如图5所示,检测结果表明PCR鉴定为阳性的多个克隆中,有5个克隆(2-B03、3-G02、4-C02、4-D11、4-E02)为阳性杂合克隆且无随机插入。
表1:PCR引物及目的条带大小
Figure BDA0003667112480000211
Southern Blot检测包括如下探针引物:
5’探针(5’Probe):
F:5’-TCATGGTTGTCTGTGAGCCAGAGGA-3’(SEQ ID NO:15)
R:5’-AGAGAACGCAAATGCAGAAAGCAGG-3’(SEQ ID NO:16)
3’探针(3’Probe):
F:5’-GTACACATGTGCCACAGGGAAGGT-3’(SEQ ID NO:17)
R:5’-CTCTGGGTCCTGGTGGCACTCTATC-3’(SEQ ID NO:18)
Neo探针(Neo Probe):
F:5’-GGATCGGCCATTGAACAAGATGG-3’(SEQ ID NO:19)
R:5’-CAGAAGAACTCGTCAAGAAGGCG-3’(SEQ ID NO:20)
表2:探针序列及重组序列片段大小
Figure BDA0003667112480000212
按照本领域已知的技术将筛选出的阳性克隆细胞(黑色鼠)导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因后,再通过互相交配即可得到表达人源化IL1RAP蛋白的IL1RAP基因人源化纯合子小鼠。可通过PCR(引物见表3)鉴定子代小鼠体细胞的基因型,示例性的F1代小鼠(已去Neo标记基因)的鉴定结果见图6,其中,编号为F1-0048、F1-0049、F1-0050、F1-0051、F1-0053、F1-0055和F1-0058的小鼠为阳性杂合小鼠。
表3:PCR引物及目的条带大小
Figure BDA0003667112480000221
其中,WT为野生型目的条带,Mut为IL1RAP重组成功目的条带
可采用RT-PCR检测IL1RAP人源化小鼠体内人源化IL1RAP mRNA的表达情况。分别选取12周龄野生型C57BL/6小鼠和IL1RAP人源化纯合小鼠各一只,脱颈安乐死后取肝脏组织,提取细胞总RNA,利用逆转录试剂盒逆转录成cDNA后进行PCR扩增,引物序列下表4所示。
表4:引物序列及目的片段大小
Figure BDA0003667112480000222
检测结果显示(图7),在野生型C57BL/6小鼠细胞中可检测到鼠IL1RAP mRNA表达,未检测出人源化IL1RAP mRNA表达;在人源化IL1RAP纯合子小鼠细胞中检测到人源化IL1RAP表达,未检测出鼠IL1RAP mRNA表达。
通过流式方法确认小鼠体内人源化IL1RAP蛋白的表达情况。选取7-8周龄的野生型C57BL/6小鼠和IL1RAP基因人源化纯合小鼠各1只,分别取脾脏细胞,在流式细胞仪上,通过排除用活力染料(Zombie NIR,BioLegend)标记的死细胞,并用荧光染料标记的抗体Human IL-1RAcP/IL-1R3PE-conjugated Antibody(hIL1RAcP-PE)、抗CD45抗体BrilliantViolet 510TM anti-mouse CD45、抗鼠Gr-1抗体PerCP anti-mouse Ly-6G/Ly-6C(Gr-1)Antibody、抗鼠CD11b抗体V450 Rat Anti-mouse CD11b、抗鼠F4/80抗体FITC anti-mouseF4/80Antibody染色来标记。流式分析结果表明,与野生型C57BL/6小鼠相比,抗人IL1RAP抗体可以检测到人源化小鼠脾脏内的单核细胞(简称Mon,标记为CD45+Gr1-CD11b+F4/80-)及巨噬细胞(简称
Figure BDA0003667112480000223
标记为CD45+Gr1-CD11b+F4/80+)表面表达人源化IL1RAP蛋白,其中,野生型小鼠巨噬细胞hILRAcP的比例为0.86%,IL1RAP基因人源化纯合子巨噬细胞中hILRAcP的比例为21.8%;野生型小鼠单核细胞中hILRAcP的比例为0.99%,IL1RAP基因人源化纯合子单核细胞中hILRAcP的比例为9.23%。说明在IL1RAP人源化纯合子小鼠脾脏内可以成功表达人源化IL1RAP蛋白。
实施例2双重人源化或多重双人源化小鼠的制备
利用本方法或制得的IL1RAP基因人源化小鼠还可以制备双人源化或多人源化小鼠模型。如,前述实施例1中,囊胚显微注射使用的胚胎干细胞可选择来源于含有IL33、PD-L1、IL10、IL1B、IL1R1、IL13、IL17、CCR5、CCR8等其它基因修饰的小鼠,或者,也可在人源化IL1RAP小鼠的基础上,利用分离小鼠ES胚胎干细胞和基因重组打靶技术,获得IL1RAP与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将本方法得到的IL1RAP小鼠纯合子或杂合子与其它基因修饰的纯合或杂合小鼠交配,对其后代进行筛选,根据孟德尔遗传规律,可有一定机率得到人源化IL1RAP与其它基因修饰的双基因或多基因修饰的杂合小鼠,再将杂合子相互交配可以得到双基因或多基因修饰的纯合子,利用这些双基因或多基因修饰的小鼠可以进行靶向人IL1RAP和其它基因调节剂的体内药效验证等。
实施例3药效验证
利用本方法制得的IL1RAP人源化小鼠可以用于评估靶向人IL1RAP的药物的药效。例如,取IL1RAP人源化小鼠纯合子皮下接种小鼠结肠癌细胞MC38,待肿瘤体积生长到约100mm3后根据肿瘤体积分为对照组或治疗组,治疗组随机选择靶向人IL1RAP的药物,对照组注射等体积的生理盐水或PBS。定期测量肿瘤体积并称量小鼠的体重,通过比较小鼠体重变化和肿瘤大小即可有效评估药物的体内安全性和体内药效。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
序列表
<110> 百奥赛图江苏基因生物技术有限公司
百奥赛图(北京)医药科技股份有限公司
<120> IL1RAP基因人源化非人动物的构建方法及应用
<130> BHIL1RAP.002CN1-P0102021030240Z
<150> 202110595203X
<151> 2021-05-28
<160> 35
<170> SIPOSequenceListing 1.0
<210> 1
<211> 570
<212> PRT
<213> Mus musculus
<400> 1
Met Gly Leu Leu Trp Tyr Leu Met Ser Leu Ser Phe Tyr Gly Ile Leu
1 5 10 15
Gln Ser His Ala Ser Glu Arg Cys Asp Asp Trp Gly Leu Asp Thr Met
20 25 30
Arg Gln Ile Gln Val Phe Glu Asp Glu Pro Ala Arg Ile Lys Cys Pro
35 40 45
Leu Phe Glu His Phe Leu Lys Tyr Asn Tyr Ser Thr Ala His Ser Ser
50 55 60
Gly Leu Thr Leu Ile Trp Tyr Trp Thr Arg Gln Asp Arg Asp Leu Glu
65 70 75 80
Glu Pro Ile Asn Phe Arg Leu Pro Glu Asn Arg Ile Ser Lys Glu Lys
85 90 95
Asp Val Leu Trp Phe Arg Pro Thr Leu Leu Asn Asp Thr Gly Asn Tyr
100 105 110
Thr Cys Met Leu Arg Asn Thr Thr Tyr Cys Ser Lys Val Ala Phe Pro
115 120 125
Leu Glu Val Val Gln Lys Asp Ser Cys Phe Asn Ser Ala Met Arg Phe
130 135 140
Pro Val His Lys Met Tyr Ile Glu His Gly Ile His Lys Ile Thr Cys
145 150 155 160
Pro Asn Val Asp Gly Tyr Phe Pro Ser Ser Val Lys Pro Ser Val Thr
165 170 175
Trp Tyr Lys Gly Cys Thr Glu Ile Val Asp Phe His Asn Val Leu Pro
180 185 190
Glu Gly Met Asn Leu Ser Phe Phe Ile Pro Leu Val Ser Asn Asn Gly
195 200 205
Asn Tyr Thr Cys Val Val Thr Tyr Pro Glu Asn Gly Arg Leu Phe His
210 215 220
Leu Thr Arg Thr Val Thr Val Lys Val Val Gly Ser Pro Lys Asp Ala
225 230 235 240
Leu Pro Pro Gln Ile Tyr Ser Pro Asn Asp Arg Val Val Tyr Glu Lys
245 250 255
Glu Pro Gly Glu Glu Leu Val Ile Pro Cys Lys Val Tyr Phe Ser Phe
260 265 270
Ile Met Asp Ser His Asn Glu Val Trp Trp Thr Ile Asp Gly Lys Lys
275 280 285
Pro Asp Asp Val Thr Val Asp Ile Thr Ile Asn Glu Ser Val Ser Tyr
290 295 300
Ser Ser Thr Glu Asp Glu Thr Arg Thr Gln Ile Leu Ser Ile Lys Lys
305 310 315 320
Val Thr Pro Glu Asp Leu Arg Arg Asn Tyr Val Cys His Ala Arg Asn
325 330 335
Thr Lys Gly Glu Ala Glu Gln Ala Ala Lys Val Lys Gln Lys Val Ile
340 345 350
Pro Pro Arg Tyr Thr Val Glu Leu Ala Cys Gly Phe Gly Ala Thr Val
355 360 365
Phe Leu Val Val Val Leu Ile Val Val Tyr His Val Tyr Trp Leu Glu
370 375 380
Met Val Leu Phe Tyr Arg Ala His Phe Gly Thr Asp Glu Thr Ile Leu
385 390 395 400
Asp Gly Lys Glu Tyr Asp Ile Tyr Val Ser Tyr Ala Arg Asn Val Glu
405 410 415
Glu Glu Glu Phe Val Leu Leu Thr Leu Arg Gly Val Leu Glu Asn Glu
420 425 430
Phe Gly Tyr Lys Leu Cys Ile Phe Asp Arg Asp Ser Leu Pro Gly Gly
435 440 445
Ile Val Thr Asp Glu Thr Leu Ser Phe Ile Gln Lys Ser Arg Arg Leu
450 455 460
Leu Val Val Leu Ser Pro Asn Tyr Val Leu Gln Gly Thr Gln Ala Leu
465 470 475 480
Leu Glu Leu Lys Ala Gly Leu Glu Asn Met Ala Ser Arg Gly Asn Ile
485 490 495
Asn Val Ile Leu Val Gln Tyr Lys Ala Val Lys Asp Met Lys Val Lys
500 505 510
Glu Leu Lys Arg Ala Lys Thr Val Leu Thr Val Ile Lys Trp Lys Gly
515 520 525
Glu Lys Ser Lys Tyr Pro Gln Gly Arg Phe Trp Lys Gln Leu Gln Val
530 535 540
Ala Met Pro Val Lys Lys Ser Pro Arg Trp Ser Ser Asn Asp Lys Gln
545 550 555 560
Gly Leu Ser Tyr Ser Ser Leu Lys Asn Val
565 570
<210> 2
<211> 570
<212> PRT
<213> Homo sapiens
<400> 2
Met Thr Leu Leu Trp Cys Val Val Ser Leu Tyr Phe Tyr Gly Ile Leu
1 5 10 15
Gln Ser Asp Ala Ser Glu Arg Cys Asp Asp Trp Gly Leu Asp Thr Met
20 25 30
Arg Gln Ile Gln Val Phe Glu Asp Glu Pro Ala Arg Ile Lys Cys Pro
35 40 45
Leu Phe Glu His Phe Leu Lys Phe Asn Tyr Ser Thr Ala His Ser Ala
50 55 60
Gly Leu Thr Leu Ile Trp Tyr Trp Thr Arg Gln Asp Arg Asp Leu Glu
65 70 75 80
Glu Pro Ile Asn Phe Arg Leu Pro Glu Asn Arg Ile Ser Lys Glu Lys
85 90 95
Asp Val Leu Trp Phe Arg Pro Thr Leu Leu Asn Asp Thr Gly Asn Tyr
100 105 110
Thr Cys Met Leu Arg Asn Thr Thr Tyr Cys Ser Lys Val Ala Phe Pro
115 120 125
Leu Glu Val Val Gln Lys Asp Ser Cys Phe Asn Ser Pro Met Lys Leu
130 135 140
Pro Val His Lys Leu Tyr Ile Glu Tyr Gly Ile Gln Arg Ile Thr Cys
145 150 155 160
Pro Asn Val Asp Gly Tyr Phe Pro Ser Ser Val Lys Pro Thr Ile Thr
165 170 175
Trp Tyr Met Gly Cys Tyr Lys Ile Gln Asn Phe Asn Asn Val Ile Pro
180 185 190
Glu Gly Met Asn Leu Ser Phe Leu Ile Ala Leu Ile Ser Asn Asn Gly
195 200 205
Asn Tyr Thr Cys Val Val Thr Tyr Pro Glu Asn Gly Arg Thr Phe His
210 215 220
Leu Thr Arg Thr Leu Thr Val Lys Val Val Gly Ser Pro Lys Asn Ala
225 230 235 240
Val Pro Pro Val Ile His Ser Pro Asn Asp His Val Val Tyr Glu Lys
245 250 255
Glu Pro Gly Glu Glu Leu Leu Ile Pro Cys Thr Val Tyr Phe Ser Phe
260 265 270
Leu Met Asp Ser Arg Asn Glu Val Trp Trp Thr Ile Asp Gly Lys Lys
275 280 285
Pro Asp Asp Ile Thr Ile Asp Val Thr Ile Asn Glu Ser Ile Ser His
290 295 300
Ser Arg Thr Glu Asp Glu Thr Arg Thr Gln Ile Leu Ser Ile Lys Lys
305 310 315 320
Val Thr Ser Glu Asp Leu Lys Arg Ser Tyr Val Cys His Ala Arg Ser
325 330 335
Ala Lys Gly Glu Val Ala Lys Ala Ala Lys Val Lys Gln Lys Val Pro
340 345 350
Ala Pro Arg Tyr Thr Val Glu Leu Ala Cys Gly Phe Gly Ala Thr Val
355 360 365
Leu Leu Val Val Ile Leu Ile Val Val Tyr His Val Tyr Trp Leu Glu
370 375 380
Met Val Leu Phe Tyr Arg Ala His Phe Gly Thr Asp Glu Thr Ile Leu
385 390 395 400
Asp Gly Lys Glu Tyr Asp Ile Tyr Val Ser Tyr Ala Arg Asn Ala Glu
405 410 415
Glu Glu Glu Phe Val Leu Leu Thr Leu Arg Gly Val Leu Glu Asn Glu
420 425 430
Phe Gly Tyr Lys Leu Cys Ile Phe Asp Arg Asp Ser Leu Pro Gly Gly
435 440 445
Ile Val Thr Asp Glu Thr Leu Ser Phe Ile Gln Lys Ser Arg Arg Leu
450 455 460
Leu Val Val Leu Ser Pro Asn Tyr Val Leu Gln Gly Thr Gln Ala Leu
465 470 475 480
Leu Glu Leu Lys Ala Gly Leu Glu Asn Met Ala Ser Arg Gly Asn Ile
485 490 495
Asn Val Ile Leu Val Gln Tyr Lys Ala Val Lys Glu Thr Lys Val Lys
500 505 510
Glu Leu Lys Arg Ala Lys Thr Val Leu Thr Val Ile Lys Trp Lys Gly
515 520 525
Glu Lys Ser Lys Tyr Pro Gln Gly Arg Phe Trp Lys Gln Leu Gln Val
530 535 540
Ala Met Pro Val Lys Lys Ser Pro Arg Arg Ser Ser Ser Asp Glu Gln
545 550 555 560
Gly Leu Ser Tyr Ser Ser Leu Lys Asn Val
565 570
<210> 3
<211> 4378
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gtgtgttaat ggaaaccata ttccagctta tctgtaattt agagaatagt aaggaaaacc 60
acagatgggc ttccaatagc tgaggactca gagaagcagt ttggtagcag tattgatctg 120
acaaagcttt ggccatctat ggcttgtgct ctgctagggg ccaagtgttc catggttaga 180
tcattacaaa gaacataaac agtaagtaaa atcagatcca tggccgcagg aggcttatca 240
aacttgtagg gtgactttgt aggatacaga cacagtaaaa ttcccaggaa gaaaacctga 300
caactgctca ttcttaaggt ctgagtctag cgattctggt gcatcatagg agcgacaatt 360
cttcaagcat aggagaatac atagagtcag ctaacagata accgctaccc tgcggctcag 420
ggaaatgcca ttgtgcaaac aaaatctgag caactggctt tgaggccttg agcctagaat 480
gctggtccag ggagggaaca cctgaatgct aactcaaagc ctaggccaac cagaaggtta 540
tcgagcttcg agaatgtgga taatggcaag tttttgtata aaggtaggtg taagagtcag 600
gaggagaaag tgaagcctta ctaacatttc tatgcctatg tagaattaag catgcatttg 660
aaactcctga acctaaggat atgataggaa atagaatgga taacaggaaa gactggctgg 720
gcacatatgt agatctctat aatctgaagc taggacggga tgcactagac accatcacag 780
ttatataaaa ctagctgcaa ttcaggtact gtaagtcagt ttttctatct cctactaaat 840
agcctctcat tccaagatcc aataattgaa agtgtattcc tttttacaat gacagaaatt 900
ccaaggctga gtgcaagtca gtattaaatg aaccatcatc ctctaagagg gttcaggcta 960
gccagccatc tcccactaac attggtacct ttagtccgtc agaatatcct gcacaatcca 1020
atttcagttt tgtcggcttg atgttttatt catcacaggg caaggttgac cctggatttg 1080
tatttgaaca aaggttatct ttggattagc tctctgttgg tgacctgact ctgctccatc 1140
gtgcataatc cagtaactct tgggaatatc aattaaggtc ctcaatcaca ctaattagaa 1200
tgtcttctat gtgttgccct aggaactcag caacttataa acaggtaatt ggtgaaattc 1260
aaagagaggt atgtgtgtgc agatctgtgt attagcctcc ctcccacccc tatctgtgtg 1320
tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtaaa tgcaatgagg aaggtcagaa 1380
tactttagta aggctggaac tgctgcgctc tgaatctgca gtgcaaaatc ttcttgatct 1440
tactgacaag gattgatgtg gaattattaa ttacttttat taatgacttg ggtgaggaca 1500
taggtggcat gctgagcaag tgtgtcaatg acaaaagcct agcaggagag cagtaactgt 1560
gatgacaaat tcaggatcca aaattactcc aagacagatt ttagtggcca ttctcttttg 1620
ttatgtgcct ggcagagtga ccttcctaag tcctaagttg ataactcgtg tgttactgta 1680
tcaggtctct acccagaaaa cagttattta gtctgatatg aaagttaact cacttggggg 1740
ccctgtgctc catccaatag ctgactgtga gcatctactt atgtgtttgc taggccccgg 1800
cctagtctca caagagacag ctatatcagg gccctttcag caaaatcttg ctagtgtatg 1860
caatggtgtc ctcttttgga ggctaattat gggatggatc tctggatatg gcagtctcta 1920
gatggtccat ccttttgtct cagctccaaa gtttgtctct gtaactcctt ccatggagga 1980
actagagaaa gtatccaagg agctaaagag atctgcaacc ctgtaggtac aacaacatta 2040
tgaactaacc agtaccccgg agctcttgac tctagctgca tatgtatcaa aagatggcct 2100
agtcggctat cactggaaag agagacccat tggacatgca aactttatat gccccaatac 2160
aggggaacac cagggccaaa aaatgggaat gggtgggtag ggaagtgtgg gggagggtat 2220
gggggacttt tgggatagca ttctaaatgt aattgaggaa aatacgtaat aataaaaaat 2280
attaaaaaaa aaaaagaaag ttaactcaca tgtctttggc ttgcttttct cggcaccggc 2340
accttctctt acaggccctt tctgctttac aattgaatga tctgcggctc tcttcccaat 2400
accctgtact tgagccaaac agtagtatca ctagatggtt attacactat ttttattatg 2460
tctcttattt tctttatctt tgaatgttag cctccaagac tctcatttct ccggatgctc 2520
cttctgcttc aattcccaat aaacaacatg ttctccctca gtgtgaaagc cttgtgttcc 2580
agcttcccgg aggctttggt tggagcaatc tctcatttgt tcatcttgag ttgtattggc 2640
ttgttgcttt cttttaccac attttacttt gtactccagt ttgttctttt ggtacatatt 2700
tgacgtttcc ataagactgc ttactactat gttctctgtc tgatccgtca tatttcttgt 2760
ctgtgtctgc acatatatat tttatgcata gttgaagaca ttgaggtagt cttcatggct 2820
ttactgactg tagagaaata ttcatcaaag gcctttcatt atgcttacta gaatccactg 2880
aagttagatg aatgtaactt attaataaaa ataagtaaaa tactctgggg agaaagatgg 2940
tgctggggct caagacgtgg gtgttgcatg tcttacggaa gtgctgtccc aacagggtac 3000
ctctgaagct ctcaacatgt ttttattgaa tgagtgaatg aatgatagat ggatggatac 3060
aactaaattc tcctaagata atggtctgag gactggaatg tagctgtcca aggaaaggag 3120
atttgatatt tgaaacaaaa tgttttcatg caacacctct tgtgataaac ttatctgtga 3180
tttttatgta gataacctaa ggaaggaatt agagatattt gatggtctgt tgttaagata 3240
aatggtaggt gtagaaatta tatacaatac agatgaagct gtttgggtaa taccaattta 3300
tacaattcat ttccatgtag tactcttata aatagcccat tttggtgtat tatgtcaagc 3360
tatcaagtat ttgttttggc cattttaggt atgtgggttc ctgtgcttga tgtttttgtt 3420
gttgctattg ttgttttttg tttatttttt gtaatatccc atctatgttg ctttctaaaa 3480
gtatcatgtg cacaagctac cagatgtccc taagcatgtc tgtatgaatg ctttcatcaa 3540
ttagaaggca gtcatgagcc aggaatttct gagtcattcc atatttctgt atttataacc 3600
ctggagatat tttaccattg agaggcatat aaaaaggtgt actttacaga gttgttaaat 3660
ctcatgcact aaagaccata caaccaagta taggagcagg gcccttgcta gttggcagtt 3720
tcctctggtt atcgtcagaa tgctaaaatt cacagacatt tctgccttgc catttgtctt 3780
tgcagtgtat aaacaagagc ggcagggcag aaggtttcca tatttcttga tgatataaat 3840
tctgtgtggt tgactataga ctaggtttgg atccaggatc tctagatgtt caattcatta 3900
ctgagacgaa acagtacctg gatcataaca tatttcccac tgagactaca caagggacct 3960
gaaagaaggg tgagagggtc aagttcatct gttagaagtt tcactgcagg tcagaaaatc 4020
cagatgaact tttttttttt ccatatagca gttatagttc agtaattagc agagaattct 4080
gcagcctcac agctggaatg taatgatggc cagaccactt tttagtcaag ggatctcagt 4140
tatgttattt aaactttttt tgagtttatc tctctgtaat ttggggattt aaaagcaaat 4200
gatgataaac agcaaaagct atcaaatttg ttgttggttc tgacaataaa gcttgggaat 4260
attctaaaac ccttggaatg gttcttagtc tatagttatc acacattcac ggtgattatt 4320
attagaactc ttcagggaag aagtaccctc tcttactttt taaatttatg ttgacagg 4378
<210> 4
<211> 3706
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ggacttctgt ggtatttgat gagtctgtcc ttctatggga tcctgcagag tcatgcttcg 60
ggtgagtatg tggtgctgga taaatgactg aaattaattt aacatacagg atcctatata 120
gtgaatttaa atgagcataa tgttggtttt gttccacaga attctgtagt tgcatagaat 180
caagtgtctg aaagaaccat agaattaggg gatgagagaa actagacaac ttaggaaggg 240
gtctgatgag tataaacaca gggacatctc ttcaacttca tgccccacag gctaattctc 300
tgtattctca tctcaagtac tgtggaggaa atggcaggga gattatacaa cctggctctc 360
ggactttgac cactgggatg ttgaagaaag aaacaaacaa accaaaaatg atagttttga 420
tcaaactgca tgtatatagg caacaaagaa tttgttggta tgctccttct ttgaccatgg 480
ctttgtatga ggagtcaacc aagatatttc ttgagtttga ataaccaaac gtagtcaccc 540
tgatggtgga tcacatgtaa gccagaggta ggaaaagttg gctatatgtc tctcatctct 600
aaattgcttt tcagtgtcac ccatgtttgc tctatctagt tagcatctaa gtgcaggttg 660
ttatattttt ttttgactca ttgagttttt ataaatattc ttgcccatgg gactgaaatt 720
agtctctgcc atttccatat atttctttga tttagtttca tgattgaaaa agaaaatacc 780
taaagggctg cttcttgaat ttttacgcag ggactccagg gatcctaatt ttaataagga 840
tcctgatgta aaattcctgt gcacacgatg ggctctgctt tgactgtcat tgctttaatg 900
cctattctct gtgagaaccc tttcgaagtg ttaagtcagc attatgtaac tgtgacccca 960
gtgttctgcc atccgtacct tcaactcctc ttcccttggc atgaatttca gccctcctgc 1020
catcctgatc atctttgctg ggtgcatttc agtttttcta tgccacttag agcattgtat 1080
tagaaaccaa aaataactct aaagacaggg tgtaactagg acagagtaga gctgaaagta 1140
cagataatat ctaaacttgc tggcccattg ggacttcaca gaggagaggc tgtattctaa 1200
ccaggccttc tatccaactg ggatgcagta atacagctgg gccacattaa tataccagca 1260
tctaggcggt atctgtctcg tttgattgga agggacttgc tgtactgatt cttaaatatg 1320
ctgacgataa ccctggacta taatttattt tcacttgact tattactaat tgaatgttat 1380
tttcttacag aggctttcct tgaccatttt aattgcaata gccctgctag tcactcctct 1440
accctcttcc attgctttaa catttcccat catctgccaa tattccatta actctttatg 1500
gtacttcttc tctgtcattt gtccttcaat ccatccttat cctcttctcc actgtctttt 1560
tcttctttcc aacctctctt ctttccttgt ctcctacttc tttacctgtc atctccctct 1620
ctctgaatct gatttcacag atttatttat cttccttttt gttttcccaa acacttgaaa 1680
tgatgattaa cacatagaga tgcagtacaa gtgcaaaaat gataaacaga tgggtaaata 1740
tcccatccga ggcacctttt ctcaactgga cccattcgtg ttgctaacat ttaattccac 1800
actcatgatt cccattagca tgacaagtac catgcctgga agttaaagtg agagatgtcc 1860
atgctactgc tgttgagaga tctaggcttc ccagagtttg ggaggtctat tgcctgccca 1920
atggtcctga cagtgccgcc tttctgaatg accttcactg tattctccca gagatcccct 1980
tcccccaaat gctgttggta agtgcacttt cttcccagga actgtgactc ataattctgt 2040
caggggaagc tgccttcttg aataagatga gttctcatac cagctccatt gagtcacgat 2100
gggagaggaa acatgttgta atcccctctg cccatctggc acacactcat gccttcctta 2160
tgaagaggtg tattgtgtct gtgtctctgc tgtacttcct cattggaggg aggggaacaa 2220
aaaggaagtg ttgttgacaa aaaagaaaaa aatgaaaggg gcaactggct ctggggataa 2280
aagggatcat tgcgatcttg aaggatctgc caatctctct ataggatggt gtcacctctg 2340
agagggaccg agatgtaggc agacttgttg gtcttccgtg aggctctctg tggttcagtt 2400
tcacttcttc gtgaaaatac acactaacat aaggaactga ggagaaatat cccgagtgat 2460
ctaccgtact ctatattcat aggatacaag tcagggattt ggcattctgg acccagagtt 2520
gactgtcata caatgaggtt cctgtgcaga gaattggctt tcaaggccta aaactgtgac 2580
accagagtgt ggtcttctgg atggaaaatt tgctttcctc atacctttaa aaatttggaa 2640
ggaaacattt catctcaaat aataataatt taaagaataa acagcaacaa caacaacaac 2700
aacaacaaca atataataac aagtataact tgccattaag gaattaaagc ttggataatt 2760
ttgttagtga caacataatg aaatgtggct cttttagaag tcatgcaact ccttttcctt 2820
aaatgctttc tgaactaccc agatcatgac tattgtaact ctgtcttttt cactagacac 2880
ttacatcctg tacagttcaa tgagttatat ccacacagct agtattcagc ataactgaag 2940
tttccacttg tttttcactt ccaaaaatgc ctgctatttt tattaaatat ggatcccctg 3000
ggctccacca aaagtgccaa tgatgtaaag agaaggttgt gatgcaaaga gcagcagaga 3060
taccattagg gaagtccctc cctcactctg gaagaactgc ctggtcagga ttctatgctg 3120
tctacttaag cggttacatc tttaccattc cctcaagacc attttcttca catggaagat 3180
tgctgcaatt ctcatttcaa acctcagtgc tccccctttt gcttgttata cttctcagca 3240
tttccactat tagctggaag gagttcctgc ttacaggaat taaaagggaa aaatatcagt 3300
tcagatcatc cctccccatt gatccctttt cccattgtct acctgttaga gggctggact 3360
gctagagcta cctctgagta aaaatacata tttggtgacc tctttggctc agagttggag 3420
agacagtgaa atgagtgtcc aggaggataa acttgaaaat cttgcagtat caaaaatttg 3480
ctttctctgt agatcctatt ttttttaaaa taggcaatgc atttattgac tccccaaaat 3540
gtgtgggcac aaagatctat ggatgtgctt tgttgttgtt gttgttgttt caaagtcaac 3600
actgataaat atggaacatg catagggtta gattttgcac acatgtccca ggaggaggga 3660
gtccttgcaa tttaggaaat caaggactta gaagttggct gagctg 3706
<210> 5
<211> 1101
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atgacacttc tgtggtgtgt agtgagtctc tacttttatg gaatcctgca aagtgatgcc 60
tcagaacgct gcgatgactg gggactagac accatgaggc aaatccaagt gtttgaagat 120
gagccagctc gcatcaagtg cccactcttt gaacacttct tgaaattcaa ctacagcaca 180
gcccattcag ctggccttac tctgatctgg tattggacta ggcaggaccg ggaccttgag 240
gagccaatta acttccgcct ccccgagaac cgcattagta aggagaaaga tgtgctgtgg 300
ttccggccca ctctcctcaa tgacactggc aactatacct gcatgttaag gaacactaca 360
tattgcagca aagttgcatt tcccttggaa gttgttcaaa aagacagctg tttcaattcc 420
cccatgaaac tcccagtgca taaactgtat atagaatatg gcattcagag gatcacttgt 480
ccaaatgtag atggatattt tccttccagt gtcaaaccga ctatcacttg gtatatgggc 540
tgttataaaa tacagaattt taataatgta atacccgaag gtatgaactt gagtttcctc 600
attgccttaa tttcaaataa tggaaattac acatgtgttg ttacatatcc agaaaatgga 660
cgtacgtttc atctcaccag gactctgact gtaaaggtag taggctctcc aaaaaatgca 720
gtgccccctg tgatccattc acctaatgat catgtggtct atgagaaaga accaggagag 780
gagctactca ttccctgtac ggtctatttt agttttctga tggattctcg caatgaggtt 840
tggtggacca ttgatggaaa aaaacctgat gacatcacta ttgatgtcac cattaacgaa 900
agtataagtc atagtagaac agaagatgaa acaagaactc agattttgag catcaagaaa 960
gttacctctg aggatctcaa gcgcagctat gtctgtcatg ctagaagtgc caaaggcgaa 1020
gttgccaaag cagccaaggt gaagcagaaa gtgccagctc caagatacac agtggaactg 1080
gcttgtggtt ttggagccac a 1101
<210> 6
<211> 612
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gtctttctgg tagtggttct cattgtggtt taccatgttt actggctgga gatggtcctc 60
ttttaccgag ctcactttgg aacagatgaa acaattcttg atggaaagga gtatgatatt 120
tatgtttcct atgcaagaaa tgtggaagaa gaggaatttg tgctgctgac gctgcgtgga 180
gttttggaga atgagtttgg atacaagctg tgcatcttcg acagagacag cctgcctggg 240
ggaattgtca cagatgagac cctgagcttc attcagaaaa gcagacgact cctggttgtc 300
ctaagtccca actacgtgct ccagggaaca caagccctcc tggagctcaa ggctggccta 360
gaaaatatgg cctcccgggg caacatcaac gtcattttag tgcagtacaa agctgtgaag 420
gacatgaagg tgaaagagct gaagcgggct aagacggtgc tcacggtcat taaatggaaa 480
ggagagaaat ccaagtatcc tcagggcagg ttctggaagc agttgcaggt ggccatgcca 540
gtgaagaaga gtcccaggtg gtctagcaat gacaagcagg gtctctccta ctcatccctg 600
aaaaacgtat ga 612
<210> 7
<211> 4576
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ggggaggagc tccggagggg gaaaaagaaa gtgcggcgga aagtaagagg ctagtcgggg 60
aaggctgcca gcatctggct ttcctaggtt cggcttggac cagggcgctg aaagaggcag 120
tggtcggcca ccctgcatcc atctggtcgc tgtcgccgag cctgctgggc tggcccgata 180
aggatgacac ttctgtggtg tgtagtgagt ctctactttt atggaatcct gcaaagtgat 240
gcctcagaac gctgcgatga ctggggacta gacaccatga ggcaaatcca agtgtttgaa 300
gatgagccag ctcgcatcaa gtgcccactc tttgaacact tcttgaaatt caactacagc 360
acagcccatt cagctggcct tactctgatc tggtattgga ctaggcagga ccgggacctt 420
gaggagccaa ttaacttccg cctccccgag aaccgcatta gtaaggagaa agatgtgctg 480
tggttccggc ccactctcct caatgacact ggcaactata cctgcatgtt aaggaacact 540
acatattgca gcaaagttgc atttcccttg gaagttgttc aaaaagacag ctgtttcaat 600
tcccccatga aactcccagt gcataaactg tatatagaat atggcattca gaggatcact 660
tgtccaaatg tagatggata ttttccttcc agtgtcaaac cgactatcac ttggtatatg 720
ggctgttata aaatacagaa ttttaataat gtaatacccg aaggtatgaa cttgagtttc 780
ctcattgcct taatttcaaa taatggaaat tacacatgtg ttgttacata tccagaaaat 840
ggacgtacgt ttcatctcac caggactctg actgtaaagg tagtaggctc tccaaaaaat 900
gcagtgcccc ctgtgatcca ttcacctaat gatcatgtgg tctatgagaa agaaccagga 960
gaggagctac tcattccctg tacggtctat tttagttttc tgatggattc tcgcaatgag 1020
gtttggtgga ccattgatgg aaaaaaacct gatgacatca ctattgatgt caccattaac 1080
gaaagtataa gtcatagtag aacagaagat gaaacaagaa ctcagatttt gagcatcaag 1140
aaagttacct ctgaggatct caagcgcagc tatgtctgtc atgctagaag tgccaaaggc 1200
gaagttgcca aagcagccaa ggtgaagcag aaagtgccag ctccaagata cacagtggaa 1260
ctggcttgtg gttttggagc cacagtcttt ctggtagtgg ttctcattgt ggtttaccat 1320
gtttactggc tggagatggt cctcttttac cgagctcact ttggaacaga tgaaacaatt 1380
cttgatggaa aggagtatga tatttatgtt tcctatgcaa gaaatgtgga agaagaggaa 1440
tttgtgctgc tgacgctgcg tggagttttg gagaatgagt ttggatacaa gctgtgcatc 1500
ttcgacagag acagcctgcc tgggggaatt gtcacagatg agaccctgag cttcattcag 1560
aaaagcagac gactcctggt tgtcctaagt cccaactacg tgctccaggg aacacaagcc 1620
ctcctggagc tcaaggctgg cctagaaaat atggcctccc ggggcaacat caacgtcatt 1680
ttagtgcagt acaaagctgt gaaggacatg aaggtgaaag agctgaagcg ggctaagacg 1740
gtgctcacgg tcattaaatg gaaaggagag aaatccaagt atcctcaggg caggttctgg 1800
aagcagttgc aggtggccat gccagtgaag aagagtccca ggtggtctag caatgacaag 1860
cagggtctct cctactcatc cctgaaaaac gtatgaaagg agaagtgagg gggtacaaag 1920
aacaaggcgg ttcatgggag gaagggcccc ctctttcctt ctaggctgtg gcttcataga 1980
cagaaaaaga gtcctgtcta agccccctgg gaggaaaata ttccgggact gtacggctgg 2040
cagctctgcc tctcagcaat actaagcgtt acagtgatgg actccacagt ccgccaccag 2100
ttctaaaagt cattttgatc tttacaagta aagatgtgtc tgatgcaccc ccacctctgt 2160
tcttccctct tttctaatct cttcgtaaaa atctcacctc tatggaactg ctttgcccag 2220
tgactcaaaa ctctgtttaa agatacttta cctgctgaca ggagtatcgc ctgtttctca 2280
gtaggacact cctttaattt tctcttctct tccgtcatcc attaagcatg taatcaggga 2340
ctaaatctgt gtgagctgag gctatttcac tcctttgctt ctgtgtctgt tgaatctacc 2400
acctaagcaa gactaacagt caaactgcag ctgttcctcg tgactgatta agcgacatac 2460
tgccttcctg ctactaaacc ccattcgctc tcatctcagg taatggagat catatttata 2520
aacttgaaaa agccatggct tttgttttat catagtaatt tctcatctgt ctacagatag 2580
acaggtcggt acttgttcct tcctttccct acctattgga tctgtcactc atatctcata 2640
ggcagcatca cgcttgctgc ggtctgcggg gaagctttaa tggtgctaat ggagagtgag 2700
aaaatgcaaa agcgctctca gggcattttt cacatgggaa gagagcacag aagagaatgc 2760
ttggcggttt gtttgttaat tctgacccta gaggggaaaa ccaggaaagt ggttaatcct 2820
cactccttca cacacctctt cattatgaag tggaggtgag aggtactgag tttccttttg 2880
gcattactat tccaaaagaa tgattattca tggtaattaa ttgtgcagtg cctgtagtac 2940
cttgctccaa atggatcacc ctgcaaatca ttaataatga agtggtttta ttagtttcaa 3000
gcagaatttc actatttctc agacttgcaa aagtgaaagg caagtataac attcacattt 3060
agagaggcca atttctattt catatctaac atgtatatat atgtatatac atatatacat 3120
atatatatga tctctgtaca cataaatttt atatgtctat gtatatagaa gtatccacaa 3180
atgacatgtg tgtgtgtata tccacctgcc tataaattat ctctgtgtat tattttgggc 3240
tatacataat cacacacata catctttcag tagtcattgg caaaatattg aaagccagta 3300
gaactagtgt tcaatcttta aattatgtta atagtgttat ggttttgtgt tgatattttc 3360
atttcatttc atttctgttc catttgtgaa ttcctggctc tctgtatata gttgtcaaag 3420
ttcttacctc ccctaaatta atatgaacga cttaatgctt caacagttga tctgggttgc 3480
aggggaatct cttgtttgtg aacctcccat tgccactgct caacagtgat catctaatat 3540
tgcttgagtt tctactttat tccctgaggt cacatttaga attgaagtta aactaagcta 3600
tgtgaactga tgaagaaaaa cagatattgt tttaaagaag tctgagtacc ctataaacat 3660
gactcataaa ttaaggaaga ccttaaccaa gttttgttaa taatgttaag caagtctaaa 3720
attacttatt catcagtact gaagtccaca gttaaccatt gctttgttag aattattgat 3780
tactttaaat tgaaaagagt tcccttctga atccttgact taaaactatg atatagtgtc 3840
gttcttgcat ctaacctttt agaagtgcta atgctgtttt tggtatttca aataattacc 3900
atttccacta ataacctttt aatcacagta ccagataagt tccacataaa ctttgaatgt 3960
taccttccgc atggacttat gggaacacaa gggccagact tgtcaccaca gctgttccct 4020
ctgttctctg tagtttctgc acggttggag tctgtattca tcccagccac tattatatca 4080
cctccatgtt tttctattta taggcccttc ttattctgag cccactctag tgctatagca 4140
taaagcatat caaatctaaa taacatatct catcctaagt agatttaatt tcaagactca 4200
gtgtttcaga agatgcttca aatagaacag cagagagagg gggacacaca cttgtattta 4260
tgataatgag aacttctgca cccaggttaa caaagcagca tgctatgtag agtgtatatg 4320
tatacagcca catgggattt aattctcttt tgtatcttag atgagtccca gagatgctaa 4380
taaaaaaaaa agtactgtct tgtattgaga aacaaaagga tcactccact tgttaactac 4440
ccaattgttt ccataggttt tagtactgta agaccatttt taattttatt cataaacata 4500
tgtattttcc attttcattt gatttgtata tttacatatt tttgcaataa accgtttatt 4560
ttcacctttg aatttt 4576
<210> 8
<211> 570
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Met Thr Leu Leu Trp Cys Val Val Ser Leu Tyr Phe Tyr Gly Ile Leu
1 5 10 15
Gln Ser Asp Ala Ser Glu Arg Cys Asp Asp Trp Gly Leu Asp Thr Met
20 25 30
Arg Gln Ile Gln Val Phe Glu Asp Glu Pro Ala Arg Ile Lys Cys Pro
35 40 45
Leu Phe Glu His Phe Leu Lys Phe Asn Tyr Ser Thr Ala His Ser Ala
50 55 60
Gly Leu Thr Leu Ile Trp Tyr Trp Thr Arg Gln Asp Arg Asp Leu Glu
65 70 75 80
Glu Pro Ile Asn Phe Arg Leu Pro Glu Asn Arg Ile Ser Lys Glu Lys
85 90 95
Asp Val Leu Trp Phe Arg Pro Thr Leu Leu Asn Asp Thr Gly Asn Tyr
100 105 110
Thr Cys Met Leu Arg Asn Thr Thr Tyr Cys Ser Lys Val Ala Phe Pro
115 120 125
Leu Glu Val Val Gln Lys Asp Ser Cys Phe Asn Ser Pro Met Lys Leu
130 135 140
Pro Val His Lys Leu Tyr Ile Glu Tyr Gly Ile Gln Arg Ile Thr Cys
145 150 155 160
Pro Asn Val Asp Gly Tyr Phe Pro Ser Ser Val Lys Pro Thr Ile Thr
165 170 175
Trp Tyr Met Gly Cys Tyr Lys Ile Gln Asn Phe Asn Asn Val Ile Pro
180 185 190
Glu Gly Met Asn Leu Ser Phe Leu Ile Ala Leu Ile Ser Asn Asn Gly
195 200 205
Asn Tyr Thr Cys Val Val Thr Tyr Pro Glu Asn Gly Arg Thr Phe His
210 215 220
Leu Thr Arg Thr Leu Thr Val Lys Val Val Gly Ser Pro Lys Asn Ala
225 230 235 240
Val Pro Pro Val Ile His Ser Pro Asn Asp His Val Val Tyr Glu Lys
245 250 255
Glu Pro Gly Glu Glu Leu Leu Ile Pro Cys Thr Val Tyr Phe Ser Phe
260 265 270
Leu Met Asp Ser Arg Asn Glu Val Trp Trp Thr Ile Asp Gly Lys Lys
275 280 285
Pro Asp Asp Ile Thr Ile Asp Val Thr Ile Asn Glu Ser Ile Ser His
290 295 300
Ser Arg Thr Glu Asp Glu Thr Arg Thr Gln Ile Leu Ser Ile Lys Lys
305 310 315 320
Val Thr Ser Glu Asp Leu Lys Arg Ser Tyr Val Cys His Ala Arg Ser
325 330 335
Ala Lys Gly Glu Val Ala Lys Ala Ala Lys Val Lys Gln Lys Val Pro
340 345 350
Ala Pro Arg Tyr Thr Val Glu Leu Ala Cys Gly Phe Gly Ala Thr Val
355 360 365
Phe Leu Val Val Val Leu Ile Val Val Tyr His Val Tyr Trp Leu Glu
370 375 380
Met Val Leu Phe Tyr Arg Ala His Phe Gly Thr Asp Glu Thr Ile Leu
385 390 395 400
Asp Gly Lys Glu Tyr Asp Ile Tyr Val Ser Tyr Ala Arg Asn Val Glu
405 410 415
Glu Glu Glu Phe Val Leu Leu Thr Leu Arg Gly Val Leu Glu Asn Glu
420 425 430
Phe Gly Tyr Lys Leu Cys Ile Phe Asp Arg Asp Ser Leu Pro Gly Gly
435 440 445
Ile Val Thr Asp Glu Thr Leu Ser Phe Ile Gln Lys Ser Arg Arg Leu
450 455 460
Leu Val Val Leu Ser Pro Asn Tyr Val Leu Gln Gly Thr Gln Ala Leu
465 470 475 480
Leu Glu Leu Lys Ala Gly Leu Glu Asn Met Ala Ser Arg Gly Asn Ile
485 490 495
Asn Val Ile Leu Val Gln Tyr Lys Ala Val Lys Asp Met Lys Val Lys
500 505 510
Glu Leu Lys Arg Ala Lys Thr Val Leu Thr Val Ile Lys Trp Lys Gly
515 520 525
Glu Lys Ser Lys Tyr Pro Gln Gly Arg Phe Trp Lys Gln Leu Gln Val
530 535 540
Ala Met Pro Val Lys Lys Ser Pro Arg Trp Ser Ser Asn Asp Lys Gln
545 550 555 560
Gly Leu Ser Tyr Ser Ser Leu Lys Asn Val
565 570
<210> 9
<211> 228
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
atcgataccg tcgacctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 60
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 120
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 180
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctgggga 228
<210> 10
<211> 98
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ttcatcagtc aggtacataa ttaggtggat ccactagttc tagagcggcc gcggacttct 60
gtggtatttg atgagtctgt ccttctatgg gatcctgc 98
<210> 11
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
agggaggatt gtgaggcaat accag 25
<210> 12
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gttcaaagag tgggcacttg atgcg 25
<210> 13
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gctcgactag agcttgcgga 20
<210> 14
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
tggagccaag acgtgttacg ttagc 25
<210> 15
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
tcatggttgt ctgtgagcca gagga 25
<210> 16
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
agagaacgca aatgcagaaa gcagg 25
<210> 17
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gtacacatgt gccacaggga aggt 24
<210> 18
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ctctgggtcc tggtggcact ctatc 25
<210> 19
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ggatcggcca ttgaacaaga tgg 23
<210> 20
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
cagaagaact cgtcaagaag gcg 23
<210> 21
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
tgttggttct gacaataaag cttggg 26
<210> 22
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
cagacccctt cctaagttgt ctagt 25
<210> 23
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
gttgagactc agaaagacgg gcaat 25
<210> 24
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gttcaaagag tgggcacttg atgcg 25
<210> 25
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
aggatcactc cacttgttaa ctaccc 26
<210> 26
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
acatactcac ccgaagcatg actct 25
<210> 27
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gacaagcgtt agtaggcaca tatac 25
<210> 28
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gctccaattt cccacaacat tagt 24
<210> 29
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
cttccgcctc ccagagaatc 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
ttccctggag cacgtagttg 20
<210> 31
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
cctgcaaagt gatgcctcag aa 22
<210> 32
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
cgtcagcagc acaaattcct c 21
<210> 33
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
tcaccatctt ccaggagcga ga 22
<210> 34
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gaaggccatg ccagtgagct t 21
<210> 35
<211> 4393
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
atgacacttc tgtggtgtgt agtgagtctc tacttttatg gaatcctgca aagtgatgcc 60
tcagaacgct gcgatgactg gggactagac accatgaggc aaatccaagt gtttgaagat 120
gagccagctc gcatcaagtg cccactcttt gaacacttct tgaaattcaa ctacagcaca 180
gcccattcag ctggccttac tctgatctgg tattggacta ggcaggaccg ggaccttgag 240
gagccaatta acttccgcct ccccgagaac cgcattagta aggagaaaga tgtgctgtgg 300
ttccggccca ctctcctcaa tgacactggc aactatacct gcatgttaag gaacactaca 360
tattgcagca aagttgcatt tcccttggaa gttgttcaaa aagacagctg tttcaattcc 420
cccatgaaac tcccagtgca taaactgtat atagaatatg gcattcagag gatcacttgt 480
ccaaatgtag atggatattt tccttccagt gtcaaaccga ctatcacttg gtatatgggc 540
tgttataaaa tacagaattt taataatgta atacccgaag gtatgaactt gagtttcctc 600
attgccttaa tttcaaataa tggaaattac acatgtgttg ttacatatcc agaaaatgga 660
cgtacgtttc atctcaccag gactctgact gtaaaggtag taggctctcc aaaaaatgca 720
gtgccccctg tgatccattc acctaatgat catgtggtct atgagaaaga accaggagag 780
gagctactca ttccctgtac ggtctatttt agttttctga tggattctcg caatgaggtt 840
tggtggacca ttgatggaaa aaaacctgat gacatcacta ttgatgtcac cattaacgaa 900
agtataagtc atagtagaac agaagatgaa acaagaactc agattttgag catcaagaaa 960
gttacctctg aggatctcaa gcgcagctat gtctgtcatg ctagaagtgc caaaggcgaa 1020
gttgccaaag cagccaaggt gaagcagaaa gtgccagctc caagatacac agtggaactg 1080
gcttgtggtt ttggagccac agtctttctg gtagtggttc tcattgtggt ttaccatgtt 1140
tactggctgg agatggtcct cttttaccga gctcactttg gaacagatga aacaattctt 1200
gatggaaagg agtatgatat ttatgtttcc tatgcaagaa atgtggaaga agaggaattt 1260
gtgctgctga cgctgcgtgg agttttggag aatgagtttg gatacaagct gtgcatcttc 1320
gacagagaca gcctgcctgg gggaattgtc acagatgaga ccctgagctt cattcagaaa 1380
agcagacgac tcctggttgt cctaagtccc aactacgtgc tccagggaac acaagccctc 1440
ctggagctca aggctggcct agaaaatatg gcctcccggg gcaacatcaa cgtcatttta 1500
gtgcagtaca aagctgtgaa ggacatgaag gtgaaagagc tgaagcgggc taagacggtg 1560
ctcacggtca ttaaatggaa aggagagaaa tccaagtatc ctcagggcag gttctggaag 1620
cagttgcagg tggccatgcc agtgaagaag agtcccaggt ggtctagcaa tgacaagcag 1680
ggtctctcct actcatccct gaaaaacgta tgaaaggaga agtgaggggg tacaaagaac 1740
aaggcggttc atgggaggaa gggccccctc tttccttcta ggctgtggct tcatagacag 1800
aaaaagagtc ctgtctaagc cccctgggag gaaaatattc cgggactgta cggctggcag 1860
ctctgcctct cagcaatact aagcgttaca gtgatggact ccacagtccg ccaccagttc 1920
taaaagtcat tttgatcttt acaagtaaag atgtgtctga tgcaccccca cctctgttct 1980
tccctctttt ctaatctctt cgtaaaaatc tcacctctat ggaactgctt tgcccagtga 2040
ctcaaaactc tgtttaaaga tactttacct gctgacagga gtatcgcctg tttctcagta 2100
ggacactcct ttaattttct cttctcttcc gtcatccatt aagcatgtaa tcagggacta 2160
aatctgtgtg agctgaggct atttcactcc tttgcttctg tgtctgttga atctaccacc 2220
taagcaagac taacagtcaa actgcagctg ttcctcgtga ctgattaagc gacatactgc 2280
cttcctgcta ctaaacccca ttcgctctca tctcaggtaa tggagatcat atttataaac 2340
ttgaaaaagc catggctttt gttttatcat agtaatttct catctgtcta cagatagaca 2400
ggtcggtact tgttccttcc tttccctacc tattggatct gtcactcata tctcataggc 2460
agcatcacgc ttgctgcggt ctgcggggaa gctttaatgg tgctaatgga gagtgagaaa 2520
atgcaaaagc gctctcaggg catttttcac atgggaagag agcacagaag agaatgcttg 2580
gcggtttgtt tgttaattct gaccctagag gggaaaacca ggaaagtggt taatcctcac 2640
tccttcacac acctcttcat tatgaagtgg aggtgagagg tactgagttt ccttttggca 2700
ttactattcc aaaagaatga ttattcatgg taattaattg tgcagtgcct gtagtacctt 2760
gctccaaatg gatcaccctg caaatcatta ataatgaagt ggttttatta gtttcaagca 2820
gaatttcact atttctcaga cttgcaaaag tgaaaggcaa gtataacatt cacatttaga 2880
gaggccaatt tctatttcat atctaacatg tatatatatg tatatacata tatacatata 2940
tatatgatct ctgtacacat aaattttata tgtctatgta tatagaagta tccacaaatg 3000
acatgtgtgt gtgtatatcc acctgcctat aaattatctc tgtgtattat tttgggctat 3060
acataatcac acacatacat ctttcagtag tcattggcaa aatattgaaa gccagtagaa 3120
ctagtgttca atctttaaat tatgttaata gtgttatggt tttgtgttga tattttcatt 3180
tcatttcatt tctgttccat ttgtgaattc ctggctctct gtatatagtt gtcaaagttc 3240
ttacctcccc taaattaata tgaacgactt aatgcttcaa cagttgatct gggttgcagg 3300
ggaatctctt gtttgtgaac ctcccattgc cactgctcaa cagtgatcat ctaatattgc 3360
ttgagtttct actttattcc ctgaggtcac atttagaatt gaagttaaac taagctatgt 3420
gaactgatga agaaaaacag atattgtttt aaagaagtct gagtacccta taaacatgac 3480
tcataaatta aggaagacct taaccaagtt ttgttaataa tgttaagcaa gtctaaaatt 3540
acttattcat cagtactgaa gtccacagtt aaccattgct ttgttagaat tattgattac 3600
tttaaattga aaagagttcc cttctgaatc cttgacttaa aactatgata tagtgtcgtt 3660
cttgcatcta accttttaga agtgctaatg ctgtttttgg tatttcaaat aattaccatt 3720
tccactaata accttttaat cacagtacca gataagttcc acataaactt tgaatgttac 3780
cttccgcatg gacttatggg aacacaaggg ccagacttgt caccacagct gttccctctg 3840
ttctctgtag tttctgcacg gttggagtct gtattcatcc cagccactat tatatcacct 3900
ccatgttttt ctatttatag gcccttctta ttctgagccc actctagtgc tatagcataa 3960
agcatatcaa atctaaataa catatctcat cctaagtaga tttaatttca agactcagtg 4020
tttcagaaga tgcttcaaat agaacagcag agagaggggg acacacactt gtatttatga 4080
taatgagaac ttctgcaccc aggttaacaa agcagcatgc tatgtagagt gtatatgtat 4140
acagccacat gggatttaat tctcttttgt atcttagatg agtcccagag atgctaataa 4200
aaaaaaaagt actgtcttgt attgagaaac aaaaggatca ctccacttgt taactaccca 4260
attgtttcca taggttttag tactgtaaga ccatttttaa ttttattcat aaacatatgt 4320
attttccatt ttcatttgat ttgtatattt acatattttt gcaataaacc gtttattttc 4380
acctttgaat ttt 4393

Claims (21)

1.一种人源化IL1RAP蛋白,其特征在于,所述的人源化IL1RAP蛋白包含人IL1RAP蛋白的全部或部分。
2.根据权利要求1所述的人源化IL1RAP蛋白,其特征在于,所述的人源化IL1RAP蛋白包含人IL1RAP蛋白的胞外区,优选还包含人IL1RAP蛋白的信号肽,进一步优选还包含非人动物IL1RAP蛋白的跨膜区和胞质区;
再进一步优选的,所述的人IL1RAP蛋白的胞外区包含SEQ ID NO:2第21-367位所示氨基酸序列;或者,包含与SEQ ID NO:2第21-367位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
再进一步优选的,所述的人IL1RAP蛋白的信号肽包含SEQ ID NO:2第1-20位所示氨基酸序列;或者,包含与SEQ ID NO:2第1-20位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
再进一步优选的,所述的非人动物IL1RAP蛋白的跨膜区和胞质区包含SEQ ID NO:1第368-570位所示氨基酸序列;或者,包含与SEQ ID NO:1第368-570位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%。
3.根据权利要求1-2任一所述的人源化IL1RAP蛋白,其特征在于,所述的人源化IL1RAP蛋白的氨基酸序列包含下列组中的任一种:
A)SEQ ID NO:8所示氨基酸序列;
B)与SEQ ID NO:8所示氨基酸序列同一性至少为85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:8所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
D)与SEQ ID NO:8所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
4.一种人源化IL1RAP基因,其特征在于,所述的人源化IL1RAP基因包含人IL1RAP基因的部分;
优选的,所述的人源化IL1RAP基因编码权利要求1-3任一所述的人源化IL1RAP蛋白。
5.根据权利要求4所述的人源化IL1RAP基因,其特征在于,所述的人源化IL1RAP基因包含人IL1RAP基因的2号至9号外显子的全部或部分核苷酸序列,优选包含人IL1RAP基因的2号外显子的部分至9号外显子的部分核苷酸序列,其中,2号外显子的部分至少包含20bp的核苷酸序列,9号外显子的部分至少包含20bp的核苷酸序列;
进一步优选的,所述的人源化IL1RAP基因包含SEQ ID NO:5所示的核苷酸序列;或者,包含与SEQ ID NO:5所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:5所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:5所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
6.根据权利要求4-5任一所述的人源化IL1RAP基因,其特征在于,所述的人源化IL1RAP基因包含非人动物IL1RAP基因的9号外显子的部分至11号外显子的部分,其中,9号外显子的部分至少包含30bp的核苷酸序列,11号外显子的部分至少包含100bp的核苷酸序列;
优选的,所述的人源化IL1RAP基因包含SEQ ID NO:6所示的核苷酸序列;或者,包含与SEQ ID NO:6所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:6所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:6所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
7.根据权利要求4-6任一所述的人源化IL1RAP基因,其特征在于,所述的人源化IL1RAP基因的核苷酸序列包含下列组中的任一种:
A)转录的mRNA包含SEQ ID NO:7所示核苷酸序列;
B)转录的mRNA与SEQ ID NO:7所示核苷酸序列的同一性至少为85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)转录的mRNA与SEQ ID NO:7所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
D)转录的mRNA具有SEQ ID NO:7所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;或,
E)SEQ ID NO:35所示核苷酸序列;
F)与SEQ ID NO:35所示核苷酸序列的同一性至少为85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
G)与SEQ ID NO:35所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
H)具有SEQ ID NO:35所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
8.一种靶向载体,其特征在于,所述的靶向载体包含下列组中的一种:
A)编码权利要求1-3任一所述的人源化IL1RAP蛋白的核苷酸序列;
B)编码人IL1RAP蛋白的胞外区的核苷酸序列,优选还包含编码人IL1RAP蛋白的信号肽的核苷酸序列,进一步优选包含编码SEQ ID NO:2第1-20、21-367或1-367位所示氨基酸序列;或者,包含与SEQ ID NO:2第1-20、21-367或1-367位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
C)权利要求4-7任一所述的人源化IL1RAP基因;或,
D)人IL1RAP基因的2号外显子的部分至9号外显子的部分,其中,2号外显子的部分至少包含20bp的核苷酸序列,9号外显子的部分至少包含20bp的核苷酸序列;优选包含SEQ IDNO:5所示核苷酸序列;或者,包含与SEQ ID NO:5所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%。
9.根据权利要求8所述的靶向载体,其特征在于,所述的靶向载体还包含5’臂和/或3’臂,其中,所述的5’臂与NCBI登录号为NC_000082.7至少具有90%同源性的核苷酸,优选的,所述5’臂序列如SEQ ID NO:3所示;所述的3’臂与NCBI登录号为NC_000082.7至少具有90%同源性的核苷酸;优选的,所述3’臂序列如SEQ ID NO:4所示。
10.一种非人动物的构建方法,其特征在于,所述的非人动物体内表达人或人源化IL1RAP蛋白,和/或,所述的非人动物的基因组中包含人或人源化IL1RAP基因;
优选的,所述的人源化IL1RAP蛋白为权利要求1-3任一所述的人源化IL1RAP蛋白;
优选的,所述的人源化IL1RAP基因为权利要求4-7任一所述的人源化IL1RAP基因。
11.根据权利要求10所述的构建方法,其特征在于,所述的非人动物的内源IL1RAP蛋白表达降低或缺失。
12.根据权利要求10-11任一所述的构建方法,其特征在于,所述的构建方法包括将供体核苷酸序列导入非人动物IL1RAP基因座,其中,所述的供体核苷酸序列包含下列组中的一种:
A)编码权利要求1-3任一所述的人源化IL1RAP蛋白的核苷酸序列;
B)编码人IL1RAP蛋白的胞外区的核苷酸序列,优选还包含编码人IL1RAP蛋白的信号肽的核苷酸序列,进一步优选包含编码SEQ ID NO:2第1-20、21-367或1-367位所示氨基酸序列;或者,包含与SEQ ID NO:2第1-20、21-367或1-367位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
C)权利要求4-7任一所述的人源化IL1RAP基因;或,
D)人IL1RAP基因的2号外显子的部分至9号外显子的部分,其中,2号外显子的部分至少包含20bp的核苷酸序列,9号外显子的部分至少包含20bp的核苷酸序列;优选包含SEQ IDNO:5所示核苷酸序列;或者,包含与SEQ ID NO:5所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%。
13.根据权利要求12所述的构建方法,其特征在于,所述的导入为插入或替换,
优选的,导入非人动物IL1RAP基因座为插入非人动物IL1RAP基因的2号外显子,优选插入的核苷酸序列还包含终止表达的辅助序列;
优选的,导入非人动物IL1RAP基因座为替换非人动物IL1RAP基因的2号外显子的部分至9号外显子的部分,其中,2号外显子的部分至少包含20bp的核苷酸序列,9号外显子的部分至少包含20bp的核苷酸序列;
优选的,导入非人动物IL1RAP基因座为替换非人动物IL1RAP基因的编码序列。
14.根据权利要求10-13任一所述的构建方法,其特征在于,其中,人或人源化IL1RAP基因、编码人或人源化IL1RAP蛋白的核苷酸序列、供体核苷酸序列在非人动物中通过内源调控元件进行调控。
15.根据权利要求10-14任一所述的构建方法,其特征在于,使用权利要求8-9任一所述靶向载体进行非人动物的构建。
16.根据权利要求10-15任一所述的构建方法,其特征在于,所述的构建方法进一步包括将非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物;优选的,所述的其他基因选自IL33、PD-L1、IL10、IL1B、IL1R1、IL13、IL17、CCR5或CCR8中的至少一种。
17.根据权利要求10-16任一所述的构建方法,其特征在于,所述的非人动物中人或人源化IL1RAP基因或其他基因对于内源被修饰基因座是纯合的。
18.根据权利要求10-17任一所述的构建方法或者权利要求2-3任一所述的人源化IL1RAP蛋白或者权利要求6-7任一所述的人源化IL1RAP基因,其特征在于,所述的非人动物为大鼠或小鼠。
19.一种细胞、组织或器官,其特征在于,所述的细胞、组织或器官表达权利要求1-3任一所述的人源化IL1RAP蛋白,或者所述的细胞、组织或器官的基因组中包含权利要求4-7任一所述的人源化IL1RAP基因;或者,所述的细胞、组织或器官来源于权利要求10-18任一所述的构建方法获得的非人动物。
20.一种荷瘤后的瘤组织,其特征在于,所述的瘤组织表达权利要求1-3任一所述的人源化IL1RAP蛋白或者所述的瘤组织的基因组中包含权利要求4-7任一所述的人源化IL1RAP基因,或者,所述的瘤组织来源于权利要求10-18任一所述的构建方法获得的非人动物。
21.来源于权利要求1-3任一所述的人源化IL1RAP蛋白,或,权利要求4-7任一所述的人源化IL1RAP基因,或,权利要求10-18任一所述的构建方法获得的非人动物,或,权利要求19所述的细胞、组织或器官,或权利要求20所述的瘤组织的应用,其特征在于,所述的应用包括:
A)涉及人类细胞的与IL1RAP相关的免疫过程的产品开发中的应用;
B)作为药理学、免疫学、微生物学和医学研究的与IL1RAP相关的模型系统中的应用;
C)涉及生产和利用动物实验疾病模型用于与IL1RAP相关的病原学研究和/或用于开发诊断策略和/或用于开发治疗策略中的应用;
D)在体内研究人IL1RAP信号通路调节剂的筛选、药效检测、评估疗效、验证或评价中的应用;或者,
E)研究IL1RAP基因功能,研究针对人IL1RAP靶位点的药物、药效,研究与IL1RAP相关的免疫相关疾病药物以及抗肿瘤药物方面的应用。
CN202210590472.1A 2021-05-28 2022-05-27 Il1rap基因人源化非人动物的构建方法及应用 Withdrawn CN114835799A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110595203X 2021-05-28
CN202110595203 2021-05-28

Publications (1)

Publication Number Publication Date
CN114835799A true CN114835799A (zh) 2022-08-02

Family

ID=82572205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210590472.1A Withdrawn CN114835799A (zh) 2021-05-28 2022-05-27 Il1rap基因人源化非人动物的构建方法及应用

Country Status (2)

Country Link
CN (1) CN114835799A (zh)
WO (1) WO2022247937A1 (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PE64396A1 (es) * 1995-01-23 1997-01-28 Hoffmann La Roche Proteina accesoria del receptor de la interleucina 1
TW202021618A (zh) * 2018-08-17 2020-06-16 美商23與我有限公司 抗il1rap抗體及其使用方法
WO2021018198A1 (en) * 2019-07-29 2021-02-04 Beijing Biocytogen Co., Ltd Genetically modified non-human animal with human or chimeric il33
US20220312749A1 (en) * 2019-08-09 2022-10-06 Biocytogen Pharmaceuticals (Beijing) Co., Ltd. Genetically modified non-human animal with human or chimeric il2ra
CN112779285B (zh) * 2019-11-11 2023-01-06 百奥赛图(北京)医药科技股份有限公司 人源化il-10和il-10ra基因改造动物的构建方法和应用
CN114277055A (zh) * 2020-04-07 2022-04-05 百奥赛图(北京)医药科技股份有限公司 Il1b和il1a基因人源化的非人动物及其构建方法和应用
CN111793646B (zh) * 2020-09-08 2021-01-15 北京百奥赛图基因生物技术有限公司 Il1r1基因人源化改造的非人动物的构建方法及其应用

Also Published As

Publication number Publication date
WO2022247937A1 (en) 2022-12-01

Similar Documents

Publication Publication Date Title
CN109913493B (zh) 人源化cd3基因改造动物模型的制备方法及应用
CN112779285B (zh) 人源化il-10和il-10ra基因改造动物的构建方法和应用
CN111808882B (zh) Il7r基因人源化改造的动物模型的构建方法及其应用
CN111793646B (zh) Il1r1基因人源化改造的非人动物的构建方法及其应用
CN112300265B (zh) Il33基因人源化的非人动物的构建方法和应用
CN113429486A (zh) 基因修饰非人动物的构建方法及应用
CN113429472A (zh) Cd94和nkg2a基因人源化的非人动物及其制备方法和应用
CN114751973B (zh) Siglec15基因人源化非人动物的构建方法和应用
CN113881681B (zh) Ccr8基因人源化非人动物及其构建方法和应用
CN112501206B (zh) Psma基因人源化非人动物的构建方法及应用
CN112553213B (zh) Cx3cr1基因人源化的非人动物及其构建方法和应用
CN112553252B (zh) Tnfr2基因人源化的非人动物的构建方法和应用
CN113046389B (zh) 一种ccr2基因人源化的非人动物及其构建方法和应用
CN114134152A (zh) Glp1r基因人源化的非人动物及其构建方法和应用
CN114835799A (zh) Il1rap基因人源化非人动物的构建方法及应用
CN113388640B (zh) Ccr4基因人源化的非人动物及其构建方法和应用
CN112481302B (zh) Masp2基因人源化的非人动物的构建方法及应用
CN112501204B (zh) Il21r基因人源化非人动物及其构建方法和应用
CN115786354A (zh) Tgfb1、garp和/或lrrc33基因人源化非人动物的构建方法及应用
CN115010800A (zh) Pvrig基因人源化非人动物的构建方法及应用
CN115918611A (zh) Tgfbr2基因人源化非人动物及其构建方法和应用
CN115043929A (zh) Vsig4基因人源化非人动物的构建方法及应用
CN115260303A (zh) Cd70基因人源化非人动物的构建方法及应用
CN115850442A (zh) 一种tslp和/或tslpr基因人源化的非人动物及其构建方法和应用
CN117417960A (zh) Ighe和fcer1a基因人源化的非人动物及其制备方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20220802