CN115918611A - Tgfbr2基因人源化非人动物及其构建方法和应用 - Google Patents

Tgfbr2基因人源化非人动物及其构建方法和应用 Download PDF

Info

Publication number
CN115918611A
CN115918611A CN202211326865.8A CN202211326865A CN115918611A CN 115918611 A CN115918611 A CN 115918611A CN 202211326865 A CN202211326865 A CN 202211326865A CN 115918611 A CN115918611 A CN 115918611A
Authority
CN
China
Prior art keywords
seq
tgfbr2
human
exon
humanized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211326865.8A
Other languages
English (en)
Inventor
孙晓霞
周小飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baccetus Beijing Pharmaceutical Technology Co ltd
Original Assignee
Baccetus Beijing Pharmaceutical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baccetus Beijing Pharmaceutical Technology Co ltd filed Critical Baccetus Beijing Pharmaceutical Technology Co ltd
Publication of CN115918611A publication Critical patent/CN115918611A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • C07K14/495Transforming growth factor [TGF]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/71Receptors; Cell surface antigens; Cell surface determinants for growth factors; for growth regulators
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/502Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5082Supracellular entities, e.g. tissue, organisms
    • G01N33/5088Supracellular entities, e.g. tissue, organisms of vertebrates
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/564Immunoassay; Biospecific binding assay; Materials therefor for pre-existing immune complex or autoimmune disease, i.e. systemic lupus erythematosus, rheumatoid arthritis, multiple sclerosis, rheumatoid factors or complement components C1-C9
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/15Animals comprising multiple alterations of the genome, by transgenesis or homologous recombination, e.g. obtained by cross-breeding
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Toxicology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Food Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Environmental Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Veterinary Medicine (AREA)
  • Genetics & Genomics (AREA)
  • Rheumatology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Epidemiology (AREA)
  • Diabetes (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Husbandry (AREA)
  • Endocrinology (AREA)
  • Public Health (AREA)
  • Rehabilitation Therapy (AREA)

Abstract

本发明提供了一种TGFBR2基因人源化的非人动物及其构建方法、一种人源化TGFBR2蛋白、一种人源化TGFBR2基因、一种TGFBR2基因的靶向载体、一种TGFBR2基因人源化的细胞和其在生物医药领域的应用,所述的构建方法包括利用同源重组的方式将编码人TGFBR2蛋白的核苷酸序列导入非人动物基因组中,该动物体内能正常表达人或人源化TGFBR2蛋白,可以作为人TGFBR2信号机理研究、肿瘤及免疫相关疾病药物筛选的动物模型,对免疫靶点的新药研发具有重要的应用价值。

Description

TGFBR2基因人源化非人动物及其构建方法和应用
技术领域
本发明属于动物基因工程和基因遗传修饰领域,具体地说,涉及一种TGFBR2基因人源化的非人动物及其构建方法和在生物医药领域的应用。
背景技术
TGFBR2(transforming growth factor beta receptor 2)是一种单通道I型膜蛋白受体,在脂肪、肺和25种其他组织中广泛存在,在单核细胞、T细胞、B细胞、NK细胞中均有表达,尤其在嗜酸性粒细胞以及初始CD4 T细胞中高表达,组织特异性及细胞特异性低。TGFβ在哺乳动物中包括TGFβ1、TGFβ2和TGFβ3三种类型。TGFβ受体超家族分为两类,分别为TGFβreceptor type 1和TGFβreceptor type 2。三型TGFβ的受体为TGFβreceptor1及TGFβreceptor2。2个TGFBR1和2个TGFBR2分子组成的受体复合物,与细胞因子二聚体对称结合,导致组成性活性TGFBR2磷酸化和激活TGFRB1。活化的TGFBR1磷酸化SMAD2,SMAD2与受体解离并与SMAD4相互作用。SMAD2-SMAD4复合物随后易位至细胞核,在那里调节TGF-β调节基因的转录,这构成了典型的SMAD依赖性TGF-β信号级联反应。TGFBR2与TGFBR1形成的跨膜丝氨酸/苏氨酸激酶,将TGFB1、TGFB2和TGFB3信号从细胞表面转导至细胞质,从而调节大量生理和病理过程,包括上皮细胞和造血细胞中的细胞周期停滞、间充质细胞增殖和分化控制、伤口愈合、细胞外基质生成、免疫抑制和致癌作用。TGFβ信号在肿瘤的发生和维持中起到了复杂的作用,其抑瘤和促瘤作用可能取决于肿瘤发生的阶段和肿瘤微环境,TGFβ信号在癌前病变中起到抑瘤作用,而在癌症转移中则起到了促进作用。
目前9项临床前研药物中5项为TGFBR2表达抑制剂。处于临床I期的有3项,礼来开发的LY3022859(IMC-TR1)是一种抗TGFβR2 IgG1单克隆抗体,可抑制受体介导的信号激活;默克公司的靶向PD-L1(CD274)和TGFBR2受体的胞外端的双功能融合蛋白M7824(MSB0011359 C)在晚期实体瘤中的I期试验,江苏恒瑞紧随其后,在研药物SHR-1701也处于I期临床开发,为双功能融合蛋白,由靶向PD-L1(CD274)的单克隆抗体与TGFBR2的胞外域融合组成,用于治疗转移性或局部晚期实体瘤,包括复发性或转移性鼻咽癌。
随着基因工程技术的不断发展和成熟,用人类基因替代或置换动物的同源性基因已经实现,通过这种方式开发人源化实验动物模型是动物模型未来的发展方向。其中基因人源化动物模型,即利用基因编辑技术,用人源正常或突变基因替换动物基因组的同源基因,可建立更接近人类生理或疾病特征的正常或突变基因动物模型。基因人源化动物不但本身具有重要应用价值,如通过基因人源化可改进和提升细胞或组织移植人源化动物模型,更重要的是,由于人类基因片段的插入,动物体内可表达或部分表达人源蛋白,可作为仅能识别人蛋白序列的药物的靶点,为在动物水平进行抗人抗体及其它药物的筛选提供了可能。然而,由于动物与人类在生理学及病理学方面存在差异,加上基因的复杂性,例如,人和小鼠TGFBR2蛋白的一致性为92%,而主要功能域的同一性为87%,如何能构建出“有效”的人源化动物模型用于新药研发仍是最大的挑战。
鉴于TGFBR2复杂的作用机制,以及在肿瘤治疗领域的巨大应用价值,为进一步探索其相关生物学特性,提高临床前期药效试验的有效性,提高研发成功率,使临床前期的试验更有效并使研发失败最小化,本领域急需开发TGFBR2相关信号通路的非人动物模型。此外,本方法得到的非人动物还可与其它基因人源化非人动物交配得到多基因人源化动物模型,用于筛选和评估针对该信号通路的人用药及联合用药的药效研究。本发明在学术和临床研究中具有广阔的应用前景。
发明内容
本发明的第一方面,提供了一种TGFBR2基因人源化的非人动物的构建方法,所述的非人动物体内表达人或人源化TGFBR2蛋白。
优选的,所述的非人动物的内源TGFBR2蛋白表达降低或缺失。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的全部或部分。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的信号肽、胞外区、跨膜区和/或胞质区的全部或部分。
优选的,所述人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分,其中,所述的人TGFBR2的胞外区的部分包含人TGFBR2胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144、150、151、152、153、154、160、161个连续氨基酸。
在本发明的一个具体实施方式中,所述人源化TGFBR2蛋白包含SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示的氨基酸序列,或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2信号肽的全部或部分。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含SEQ ID NO:2的第1-22位所示的氨基酸序列,或者,包含与SEQ ID NO:2的第1-22位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQID NO:2的第1-22位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2的第1-22位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分。
进一步优选的,包含人TGFBR2胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144、150、151、152、153、154、160、161个连续氨基酸。
在本发明的一个具体实施方式中,包含SEQ ID NO:44第29-182位所示的氨基酸序列,或者,包含与SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ IDNO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白还包含非人动物TGFBR2蛋白的胞外区的部分、跨膜区的全部、信号肽的全部和胞质区的全部。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含SEQ ID NO:43第1-28和183-592位所示的氨基酸序列,或者,包含与SEQ ID NO:43第1-28和183-592位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:43第1-28和183-592位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:43第1-28和183-592位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分和信号肽的全部或部分。
在本发明的一个具体实施方式中,包含SEQ ID NO:2的第1-166位所示的氨基酸序列,或者,包含与SEQ ID NO:2的第1-166位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ IDNO:2的第1-166位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2的第1-166位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白还包含非人动物TGFBR2的跨膜区的部分和胞质区的全部。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含SEQ ID NO:1的第167-567位所示的氨基酸序列,或者,包含与SEQ ID NO:1的第167-567位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:1的第167-567位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:1的第167-567位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2基因的全部或部分编码的氨基酸序列。进一步优选的,包含人TGFBR2基因的1号至8号外显子的全部或部分编码的氨基酸序列。更进一步优选的,包含人TGFBR2基因的1号至8号外显子中的一种、两种或三种以上的外显子编码的氨基酸序列;更进一步优选的,包含人TGFBR2基因的1号至5号外显子的全部或部分编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分编码的氨基酸序列,其中,1号外显子的部分至少包含5bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2基因的1号至7号外显子的全部或部分编码的氨基酸序列。进一步优选的,包含人TGFBR2基因的1号至7号外显子中的一种、两种或三种以上外显子的组合编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分编码的氨基酸序列,其中1号外显子的部分至少包含编码区的核苷酸序列,4号外显子的部分至少包含编码胞外区的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的任一种:
A)SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列;
B)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
或者,
D)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的部分和非人动物TGFBR2蛋白的部分。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的胞外区的全部和信号肽的全部以及非人动物TGFBR2蛋白的跨膜区的部分和胞质区的全部。
在本发明的另一个实施方式中,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的胞外区的全部或部分,以及非人动物TGFBR2蛋白的信号肽的全部、胞质区的全部、跨膜区的全部或部分和胞外区的全部或部分。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的一种:
A)SEQ ID NO:53的全部或部分;
B)与SEQ ID NO:53的氨基酸序列同一性至少为60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:53的氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
D)与SEQ ID NO:53所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的一种:
a)SEQ ID NO:13氨基酸序列的全部或部分;
b)与SEQ ID NO:13氨基酸序列同一性至少为60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)与SEQ ID NO:13所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
d)与SEQ ID NO:13所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的非人动物基因组中包含人或人源化TGFBR2基因,所述的人源化TGFBR2基因包含人TGFBR2基因的部分。
优选的,所述的非人动物的基因组中包含编码人TGFBR2蛋白的全部或部分核苷酸序列,优选包含编码人TGFBR2蛋白的胞外区、跨膜区、信号肽和/或胞质区的全部或部分核苷酸序列,进一步优选包含编码胞外区的全部或部分核苷酸序列,其中胞外区的部分包含人TGFBR2胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144、150、151、152、153、154、160、161个连续氨基酸,再进一步优选的,包含编码SEQ ID NO:2第23-166位或SEQID NO:44第29-182位氨基酸的核苷酸序列。
优选的,所述的非人动物的基因组中还包含编码人TGFBR2的信号肽的全部或部分核苷酸序列,优选包含编码SEQ ID NO:2的第1-22位所示氨基酸的核苷酸序列。
优选的,所述的非人动物的基因组中包含编码人TGFBR2的胞外区的全部或部分和跨膜区的全部或部分核苷酸序列,优选包含编码人TGFBR2胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144、150、151、152、153、154、160、161个连续氨基酸,进一步优选包含编码SEQ ID NO:44第29-182位氨基酸的核苷酸序列。
优选的,所述的非人动物的基因组中包含编码人TGFBR2的胞外区和信号肽的核苷酸序列,优选包含编码SEQ ID NO:2第1-166位氨基酸的核苷酸序列。
优选的,所述的非人动物的基因组中包含人TGFBR2基因的全部或部分;优选的,包含人TGFBR2基因的1号至8号外显子的全部或部分,进一步优选包含人TGFBR2基因的1号至8号外显子中的一种、两种或三种以上的组合,更进一步优选包含人TGFBR2基因的1号至5号外显子的全部或部分。
优选的,所述的非人动物的基因组中包含人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分,其中,1号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、10、15、20、30、40、50、100、150、200、300、400、476bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、10、15、16、17、18、19、20、30、40、50、100、150、200、500、600、700、800bp的核苷酸序列。优选还包含人TGFBR2基因的1-2号内含子和/或4-5号内含子。
优选的,所述的人源化TGFBR2基因还包含非人动物TGFBR2基因的部分,进一步优选包含非人动物TGFBR2基因的1号外显子的部分、5号外显子的部分和6号至8号外显子的全部。
优选的,所述的非人动物的基因组中包含人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分,其中,1号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、60、70、80、90、91、92、93、94、95、100、150、200、300、350、377bp的核苷酸序列,1号外显子的部分包含编码区的核苷酸序列,4号外显子的部分至少包含20bp的核苷酸序列例如至少包含20、30、40、41、42、43、44、45、50、100、150、200、500、600、700、800bp的核苷酸序列,4号外显子的部分包含编码胞外区的核苷酸序列。
优选的,所述的人源化TGFBR2基因还包含非人动物TGFBR2基因的部分,优选包含非人动物TGFBR2基因的1号外显子的全部或部分、2号外显子的全部或部分、4号外显子的部分、5号外显子的全部、6号外显子的全部、7号外显子的全部。
在本发明的一个具体实施方式中,所述的非人动物的基因组中包含SEQ ID NO:7或SEQ ID NO:47所示核苷酸序列;或者,包含与SEQ ID NO:7或SEQ ID NO:47所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:7或SEQ ID NO:47所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:7或SEQ ID NO:47所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,编码人或人源化TGFBR2蛋白的核苷酸序列或者人或人源化TGFBR2基因的核苷酸序列可操作地连接至至少一条染色体中内源TGFBR2基因座处的内源性调控元件。
优选的,所述的非人动物的内源TGFBR2蛋白表达降低或缺失。
优选的,所述的构建方法包括将供体核苷酸序列导入非人动物TGFBR2基因座上。
优选的,所述的供体核苷酸序列包含人TGFBR2基因的全部或部分。
在一些具体实施方式中,所述的供体核苷酸序列包含下列组中的任一种:
A)编码人或人源化TGFBR2蛋白的核苷酸序列;
B)编码人TGFBR2蛋白的信号肽、胞外区、跨膜区和/或胞质区的核苷酸序列的全部或部分;优选包含编码胞外区的全部或部分的核苷酸序列;进一步优选还包含编码信号肽的核苷酸序列;更进一步优选的,包含编码SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位氨基酸的核苷酸序列;再进一步优选的,包含编码SEQ ID NO:13或SEQ ID NO:53的核苷酸序列;
C)人或人源化TGFBR2基因的核苷酸序列;或,
D)人TGFBR2基因的1号至8号外显子的全部或部分,优选的,人TGFBR2基因的1号至8号外显子中的一种、两种或三种以上的核苷酸序列,进一步优选的,人TGFBR2基因的1号至5号外显子的全部或部分;更进一步优选的,人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分,其中,1号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、10、15、20、30、40、50、100、150、200、300、400、476bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、10、15、16、17、18、19、20、30、40、50、100、150、200、500、600、700、800bp的核苷酸序列。优选还包含1-2号内含子和/或4-5号内含子。
在本发明的一个具体实施方式中,包含SEQ ID NO:47所示的核苷酸序列;
E)人TGFBR2基因的1号至7号外显子的全部或部分,优选的,人TGFBR2基因的1号至7号外显子中的一种、两种或三种以上的组合,进一步优选的,人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分,其中,1号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、60、70、80、90、91、92、93、94、95、100、150、200、300、350、377bp的核苷酸序列,1号外显子的部分包含编码区的核苷酸序列,4号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、50、100、150、200、500、600、700、800bp的核苷酸序列,4号外显子的部分包含编码胞外区的核苷酸序列。
在本发明的一个具体实施方式中,包含SEQ ID NO:7所示的核苷酸序列。
在一些具体实施方式中,所述的供体核苷酸序列还包含编码P2A的核苷酸序列;优选的,所述的编码P2A的核苷酸序列位于人TGFBR2基因部分的上游;优选的,所述的编码P2A的核苷酸序列如SEQ ID NO:4所示。
优选的,所述的供体核苷酸序列还包含部分非人动物TGFBR2基因,在一些具体实施方式中,所述的非人动物TGFBR2基因的部分为非人动物TGFBR2基因的1号至8号外显子的部分,优选的,包括非人动物TGFBR2基因的1号外显子的部分、5号外显子的部分、6号-8号外显子的全部或部分。进一步优选还包含非人动物TGFBR2基因5-6号内含子。
优选的,所述的供体核苷酸序列还包含非人动物TGFBR2基因的部分,所述的非人动物TGFBR2基因的部分为非人动物TGFBR2基因的1号外显子、2号外显子、4号外显子、5号外显子、6号外显子和/或7号外显子的全部或部分;优选的,为非人动物TGFBR2基因4号外显子的部分、5号外显子的全部、6号外显子的全部和/或7号外显子的全部或部分;可选的,还包含内含子。
在一些具体实施方式中,所述的供体核苷酸序列中包含人TGFBR2基因的部分和非人动物TGFBR2基因的部分,排列顺序为:人TGFBR2基因1号外显子的部分、2号外显子的全部、3号外显子的全部、4号外显子的部分,以及非人动物TGFBR2基因的4号外显子的部分、5号外显子的全部、6号外显子的全部和7号外显子的全部或部分。
优选的,所述的供体核苷酸序列还包含编码P2A的核苷酸序列。
优选的,所述的供体核苷酸序列还包含筛选标记的编码基因。进一步优选的,所述标记基因为负筛选标记的编码基因。更进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。
在本发明的一个具体实施方式中,所述的供体核苷酸序列还包括阳性克隆筛选的抗性基因。进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。
在本发明的一个具体实施方式中,所述的供体苷酸序列还包括特异性重组系统。进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统)。所述的特异性重组系统为具有两个Frt重组位点,分别连接在抗性基因的两侧。
优选的,所述的人源化TGFBR2基因包含与SEQ ID NO:8和/或SEQ ID NO:9具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ ID NO:8和/或SEQID NO:9所示的核苷酸序列。
优选的,所述的人源化TGFBR2基因包含与SEQ ID NO:10和/或SEQ ID NO:11具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ ID NO:10和/或SEQ ID NO:11所示的核苷酸序列。
优选的,所述的人源化TGFBR2基因包含与SEQ ID NO:39和/或SEQ ID NO:40具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ ID NO:39和/或SEQ ID NO:40所示的核苷酸序列。
优选的,所述的人源化TGFBR2基因包含与SEQ ID NO:48、49、50和/或51具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ IDNO:48、49、50和/或51所示的核苷酸序列。
在一些具体实施方式中,所述的人源化TGFBR2基因包含SEQ ID NO:3、SEQ IDNO:7、SEQ ID NO:36、SEQ ID NO:47或SEQ ID NO:54所示核苷酸序列;或者,包含与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:36、SEQ ID NO:47或SEQ ID NO:54所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQID NO:3、SEQ ID NO:7、SEQ ID NO:36、SEQ ID NO:47或SEQ ID NO:54所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:3、SEQ IDNO:7、SEQ ID NO:36、SEQ ID NO:47或SEQ ID NO:54所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人TGFBR2基因的部分或人源化TGFBR2基因在非人动物中通过调控元件进行调控,进一步优选的,所述的调控元件是内源性或者外源性。
优选的,所述的调控元件包括内源性启动子。
所述的导入为插入或替换。其中,所述的替换可以为相应位置的替换或者替换基因的某一段不对应的序列。
优选的,所述的导入非人动物TGFBR2基因座为替换非人动物的TGFBR2基因的1号至8号外显子的全部或部分。
进一步优选为替换非人动物TGFBR2基因的相应位置,更进一步优选为1号至5号外显子的全部或部分。
进一步优选为替换非人动物TGFBR2基因的2号外显子,更进一步优选为替换非人动物基因组中编码SEQ ID NO:1的第61-88位氨基酸的核苷酸序列。
优选的,所述的导入非人动物TGFBR2基因座为插入非人动物TGFBR2基因的1号至8号外显子的全部或部分,优选为插入非人动物TGFBR2基因的1号或2号外显子,进一步优选插入非人动物TGFBR2基因的起始密码子上。
在本发明的一个具体实施方式中,所述的构建方法包括用人TGFBR2基因的1号至8号外显子的全部或部分相应替换非人动物TGFBR2基因的1号至8号外显子的全部或部分。
在本发明的一个具体实施方式中,所述的构建方法包括用人TGFBR2基因的1号至8号外显子中的一种、两种或三种以上外显子的组合相应替换非人动物1号至8号外显子中的一种、两种或三种以上外显子的组合。
在本发明的一个具体实施方式中,所述的构建方法包括用人TGFBR2基因的1号至5号外显子的全部或部分相应替换非人动物TGFBR2基因的1号至5号外显子的全部或部分。
在本发明的一个具体实施方式中,所述的构建方法包括用人TGFBR2基因的1号外显子的部分(优选至少包含5bp的核苷酸序列)、2号至4号外显子的全部和5号外显子的部分(优选至少包含5bp的核苷酸序列),优选还包含1-2号内含子和/或4-5号内含子相应替换非人动物TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分。
在本发明的一个具体实施方式中,所述的构建方法包括用编码人TGFBR2的胞外区的全部或部分相应替换编码非人动物TGFBR2胞外区的全部或部分。
在本发明的一个具体实施方式中,所述的构建方法包括用编码人TGFBR2的胞外区的全部或部分替换编码非人动物TGFBR2胞外区的部分。
在本发明的一个具体实施方式中,所述的构建方法包括用编码人TGFBR2的胞外区、信号肽、以及非人动物TGFBR2跨膜区的部分和胞质区的核苷酸序列插入或替换非人动物2号外显子的一段序列。优选为非人动物2号外显子中编码SEQ ID NO:1第61-88位氨基酸的核苷酸序列。
在本发明的一个具体实施方式,所述的构建方法包括用人或人源化TGFBR2基因插入或替换非人动物2号外显子的一段序列。优选为非人动物2号外显子中编码SEQ ID NO:1第61-88位氨基酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的构建方法包括用编码人或人源化TGFBR2蛋白的核苷酸序列插入或替换非人动物2号外显子的一段序列。优选为非人动物2号外显子中编码SEQ ID NO:1第61-88位氨基酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的构建方法包括用编码人TGFBR2的胞外区、信号肽、以及非人动物TGFBR2跨膜区的全部或部分和胞质区的核苷酸序列插入非人动物TGFBR2基因的1号外显子。优选为插入非人动物TGFBR2基因的ATG之前,UTR之后的位置。
在本发明的一个具体实施方式,所述的构建方法包括用人或人源化TGFBR2基因插入非人动物TGFBR2基因的1号外显子。优选为插入非人动物TGFBR2基因的ATG之前,UTR之后的位置。
在本发明的一个具体实施方式中,所述的构建方法包括用编码人或人源化TGFBR2蛋白的核苷酸序列插入非人动物TGFBR2基因的1号外显子。优选为插入非人动物TGFBR2基因的ATG之前,UTR之后的位置。
优选的,使用基因编辑技术进行非人动物的构建,所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。
优选的,所述的构建方法包括使用靶向载体和/或sgRNA进行非人动物的构建。
优选的,所述的靶向载体包括供体核苷酸序列,所述的供体核苷酸序列包含下列组中的任一种:
A)编码人或人源化TGFBR2蛋白的核苷酸序列;
B)编码人TGFBR2蛋白的信号肽、胞外区、跨膜区和/或胞质区的核苷酸序列的全部或部分;优选包含编码胞外区的全部或部分的核苷酸序列;进一步优选还包含编码信号肽的核苷酸序列;更进一步优选的,包含编码SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位氨基酸的核苷酸序列;再进一步优选的,包含编码SEQ ID NO:13或SEQ ID NO:53的核苷酸序列;
C)人或人源化TGFBR2基因的核苷酸序列;或,
D)人TGFBR2基因的1号至8号外显子的全部或部分,优选的,人TGFBR2基因的1号至8号外显子中的一种、两种或三种以上的核苷酸序列,进一步优选的,人TGFBR2基因的1号至5号外显子的全部或部分;更进一步优选的,人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分,其中,1号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、10、15、20、30、40、50、100、150、200、300、400、476bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、10、15、16、17、18、19、20、30、40、50、100、150、200、500、600、700、800bp的核苷酸序列;优选还包含1-2号内含子和/或4-5号内含子。
E)人TGFBR2基因的1号至7号外显子的全部或部分,优选的,人TGFBR2基因的1号至7号外显子中的一种、两种或三种以上的组合,进一步优选的,人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分,其中,1号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、60、70、80、90、91、92、93、94、95、100、150、200、300、350、377bp的核苷酸序列,1号外显子的部分包含编码区的核苷酸序列,4号外显子的部分至少包含20bp的核苷酸序列例如至少包含20、30、40、41、42、43、44、45、50、100、150、200、500、600、700、800bp的核苷酸序列,4号外显子的部分包含编码胞外区的核苷酸序列。
在本发明的一个具体实施方式中,所述的靶向载体包含编码SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位氨基酸的核苷酸序列,或者,编码与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位的氨基酸序列同一性至少为60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;或者,编码与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位的氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸的核苷酸序列;或者,编码与SEQ ID NO:2第1-166位或SEQID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列的核苷酸序列。
在本发明的另一个具体实施方式中,所述的靶向载体包含SEQ ID NO:7或SEQIDNO:47所示核苷酸序列,或者,包含与SEQ ID NO:7或SEQ ID NO:47所示核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:7或SEQ ID NO:47所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:7或SEQ IDNO:47所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的靶向载体还包含非人动物TGFBR2基因的部分,优选包含编码非人动物TGFBR2的胞质区和跨膜区的核苷酸序列,进一步优选包含编码SEQ ID NO:1第167-567位氨基酸的核苷酸序列,更进一步优选的,包含SEQ ID NO:31所示的核苷酸序列。
优选的,所述的靶向载体还包含部分非人动物TGFBR2基因,在一些具体实施方式中,所述的非人动物TGFBR2基因的部分为非人动物TGFBR2基因的1号至8号外显子的部分,优选的,包括非人动物TGFBR2基因的1号外显子的部分、5号外显子的部分、6号至8号外显子的全部或部分。
在一些具体实施方式中,所述的靶向载体还包含非人动物TGFBR2基因的部分,所述的非人动物TGFBR2基因的部分为非人动物TGFBR2基因的1号外显子、2号外显子、3号外显子、4号外显子、5号外显子、6号外显子和/或7号外显子的全部或部分;优选的,为非人动物TGFBR2基因的2号外显子的全部或部分、3号外显子的全部或部分、4号外显子、5号外显子、6号外显子和/或7号外显子的全部或部分。
在一个具体实施方式中,所述的靶向载体从5’端至3’端依次包含人TGFBR2基因1号外显子的全部或部分、2号外显子的全部、3号外显子的全部和4号外显子的全部或部分,以及非人动物TGFBR2基因4号外显子的部分、5号外显子的全部、6号外显子的全部和7号外显子的全部或部分。
在一个具体实施方式中,所述的靶向载体从5’端至3’端依次包含编码人TGFBR2信号肽和胞外区的核苷酸序列和编码非人动物TGFBR2胞质区和跨膜区的全部或部分的核苷酸序列。
在一些具体实施方式中,所述的靶向载体还包含编码P2A的核苷酸序列;优选的,所述的编码P2A的核苷酸序列位于人TGFBR2基因部分的上游;优选的,所述的编码P2A的核苷酸序列如SEQ ID NO:4所示。
优选的,所述的靶向载体包含与SEQ ID NO:8和/或SEQ ID NO:9具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ ID NO:8和/或SEQ ID NO:9所示的核苷酸序列。
优选的,所述的靶向载体包含与SEQ ID NO:10和/或SEQ ID NO:11具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ ID NO:10和/或SEQ IDNO:11所示的核苷酸序列。
优选的,所述的靶向载体包含与SEQ ID NO:39和/或SEQ ID NO:40具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ ID NO:39和/或SEQ IDNO:40所示的核苷酸序列。
优选的,所述的靶向载体包含与SEQ ID NO:48、49、50和/或51具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ ID NO:48、49、50和/或51所示的核苷酸序列。
在本发明的一个具体实施方式中,所述的靶向载体包含SEQ ID NO:3、SEQ ID NO:36或SEQ ID NO:54所示核苷酸序列,或者,包含与SEQ ID NO:3、SEQ ID NO:36或SEQ IDNO:54所示核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:3、SEQ ID NO:36或SEQ IDNO:54所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:3、SEQ IDNO:36或SEQ ID NO:54所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的靶向载体编码上述的人源化TGFBR2蛋白。
优选的,所述的靶向载体还包含5’臂和/或3’臂。
所述的5’臂(或5’同源臂)为与非人动物TGFBR2基因5’端同源的DNA片段,其选自非人动物TGFBR2基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的5’臂与NCBI登录号为NC_000075.7至少具有90%同源性的核苷酸。更进一步优选的,所述5’臂序列与SEQ ID NO:5、SEQ ID NO:18、SEQ IDNO:37或SEQ ID NO:45具有90%同源性,或者如SEQ ID NO:5、SEQ ID NO:18、SEQ ID NO:37或SEQ ID NO:45所示。
所述的3’臂(或3’同源臂)为与非人动物TGFBR2基因3’端同源的DNA片段,其选自非人动物TGFBR2基因DNA的100-10000个长度的核苷酸。进一步优选的,所述的3’臂与NCBI登录号为NC_000075.7至少具有90%同源性的核苷酸。更进一步优选的,所述的3’臂序列与SEQ ID NO:6、SEQ ID NO:19、SEQ ID NO:38或SEQ ID NO:46具有90%同源性,或者如SEQID NO:6、SEQ ID NO:19、SEQ ID NO:38或SEQ ID NO:46所示。
优选的,所述的靶向载体还包含非人动物3’UTR。
优选的,所述的靶向载体还包含非人动物5’UTR。
在一个具体实施方式中,使用sgRNA进行非人动物的构建。其中,所述的sgRNA靶向非人动物TGFBR2基因,同时所述sgRNA的序列在待改变的TGFBR2基因上的靶序列上是唯一的。
优选的,所述sgRNA的靶位点位于TGFBR2基因的2号外显子序列上。
进一步优选的,所述的sgRNA在TGFBR2基因上的靶序列如SEQ ID NO:20-21任一所示。
优选的,所述sgRNA的靶位点位于TGFBR2基因的1号外显子序列上。
进一步优选的,所述的sgRNA在TGFBR2基因上的靶序列如SEQ ID NO:41所示。
优选的,所述的TGFBR2基因人源化非人动物中的人或人源化TGFBR2基因对于内源TGFBR2基因的替换为纯合或杂合的。
优选的,所述的人源化TGFBR2基因和/或其他基因对于内源被修饰基因座为纯合的;
优选的,所述的人源化TGFBR2基因和/或其他基因对于内源被修饰基因座为杂合的。优选的,所述非人动物的基因组中至少一个染色体上包含人源化TGFBR2基因。
优选的,所述的非人动物中至少一个细胞表达人或人源化TGFBR2蛋白。
优选的,所述的构建方法包括将使用靶向载体将所述的供体核苷酸序列导入非人动物细胞中,培养该细胞,然后将培养后的细胞移植至雌性非人动物输卵管内,允许其发育,鉴定筛选获得TGFBR2基因人源化的非人动物。
优选的,所述的构建方法包括用靶向非人动物内源TGFBR2基因的引导RNA将所述的供体核苷酸序列导入到非人动物内源TGFBR2基因座上。
优选的,所述的构建方法进一步包括将TGFBR2基因人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因选自PD-1、PD-L1、CD27、CD40、CD73、CD226、OX40、4-1BB、LAG3、TIGIT中的至少一种。
所述非人动物中人或人源化TGFBR2基因和/或所述其他基因对于内源被替换基因座为纯合或杂合的。
本发明的第二方面,提供了一种TGFBR2基因人源化的非人动物,所述的非人动物体内表达人或人源化TGFBR2蛋白。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的全部或部分。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的信号肽、胞外区、跨膜区和/或胞质区的全部或部分。
优选的,所述人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分,其中,所述的人TGFBR2的胞外区的部分包含人TGFBR2胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144、150、151、152、153、154、160、161个连续氨基酸。
在本发明的一个具体实施方式中,所述人源化TGFBR2蛋白包含SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示的氨基酸序列,或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2信号肽的全部或部分。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含SEQ ID NO:2的第1-22位所示的氨基酸序列,或者,包含与SEQ ID NO:2的第1-22位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQID NO:2的第1-22位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2的第1-22位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分。
进一步优选的,包含人TGFBR2胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144、150、151、152、153、154、160、161个连续氨基酸。
在本发明的一个具体实施方式中,包含SEQ ID NO:44第29-182位所示的氨基酸序列,或者,包含与SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ IDNO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白还包含非人动物TGFBR2蛋白的胞外区的部分、跨膜区的全部、信号肽的全部和胞质区的全部。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含SEQ ID NO:43第1-28和183-592位所示的氨基酸序列,或者,包含与SEQ ID NO:43第1-28和183-592位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:43第1-28和183-592位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:43第1-28和183-592位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分和信号肽的全部或部分。
在本发明的一个具体实施方式中,包含SEQ ID NO:2的第1-166位所示的氨基酸序列,或者,包含与SEQ ID NO:2的第1-166位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ IDNO:2的第1-166位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2的第1-166位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白还包含非人动物TGFBR2的跨膜区的部分和胞质区的全部。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含SEQ ID NO:1的第167-567位所示的氨基酸序列,或者,包含与SEQ ID NO:1的第167-567位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:1的第167-567位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:1的第167-567位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2基因的全部或部分编码的氨基酸序列。进一步优选的,包含人TGFBR2基因的1号至8号外显子的全部或部分编码的氨基酸序列。更进一步优选的,包含人TGFBR2基因的1号至8号外显子中的一种、两种或三种以上的外显子编码的氨基酸序列;更进一步优选的,包含人TGFBR2基因的1号至5号外显子的全部或部分编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分编码的氨基酸序列,其中,1号外显子的部分至少包含5bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2基因的1号至7号外显子的全部或部分编码的氨基酸序列。进一步优选的,包含人TGFBR2基因的1号至7号外显子中的一种、两种或三种以上外显子的组合编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分编码的氨基酸序列,其中1号外显子的部分至少包含编码区的核苷酸序列,4号外显子的部分至少包含编码胞外区的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的任一种:
A)SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列;
B)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
或者,
D)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的部分和非人动物TGFBR2蛋白的部分。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的胞外区和信号肽以及非人动物TGFBR2蛋白的跨膜区的全部或部分和胞质区。
在本发明的另一个实施方式中,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的胞外区的全部或部分,以及非人动物TGFBR2蛋白的信号肽的全部、胞质区的全部、跨膜区的全部或部分和胞外区的全部或部分。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的一种:
A)SEQ ID NO:53的全部或部分;
B)与SEQ ID NO:53的氨基酸序列同一性至少为60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:53的氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
D)与SEQ ID NO:53所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的一种:
a)SEQ ID NO:13氨基酸序列的全部或部分;
b)与SEQ ID NO:13氨基酸序列同一性至少为60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)与SEQ ID NO:13所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
d)与SEQ ID NO:13所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
所述的非人动物的基因组中包含编码人TGFBR2蛋白的全部或部分核苷酸序列,优选包含编码人TGFBR2蛋白的胞外区、跨膜区、信号肽和/或胞质区的全部或部分核苷酸序列,进一步优选包含编码胞外区的全部或部分核苷酸序列,其中胞外区的部分包含人TGFBR2胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144、150、151、152、153、154、160、161个连续氨基酸,再进一步优选的,包含编码SEQ ID NO:2第23-166位或SEQID NO:44第29-182位氨基酸的核苷酸序列。
优选的,所述的非人动物的基因组中还包含编码人TGFBR2的信号肽的全部或部分核苷酸序列,优选包含编码SEQ ID NO:2的第1-22位所示氨基酸的核苷酸序列。
优选的,所述的非人动物的基因组中包含编码人TGFBR2的胞外区的全部或部分,优选包含编码人TGFBR2胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144、150、151、152、153、154、160、161个连续氨基酸,进一步优选包含编码SEQ ID NO:44第29-182位氨基酸的核苷酸序列。
优选的,所述的非人动物的基因组中包含编码人TGFBR2的胞外区和信号肽的核苷酸序列,优选包含编码SEQ ID NO:2第1-166位氨基酸的核苷酸序列。
优选的,所述的非人动物的基因组中包含人TGFBR2基因的全部或部分;进一步优选的,包含人TGFBR2基因的1号至8号外显子的全部或部分,更进一步优选包含人TGFBR2基因的1号至8号外显子中的一种、两种或三种以上的组合,再进一步优选包含人TGFBR2基因的1号至5号外显子的全部或部分。
优选的,所述的非人动物的基因组中包含人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分,其中,1号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、10、15、20、30、40、50、100、150、200、300、400、476bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、10、15、16、17、18、19、20、30、40、50、100、150、200、500、600、700、800bp的核苷酸序列。优选还包含人TGFBR2基因的1-2号内含子和/或4-5号内含子。
优选的,所述的人源化TGFBR2基因还包含非人动物TGFBR2基因的部分,进一步优选包含非人动物TGFBR2基因的1号外显子的部分、5号外显子的部分和6号至8号外显子的全部。
优选的,所述的非人动物的基因组中包含人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分,其中,1号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、60、70、80、90、91、92、93、94、95、100、150、200、300、350、377bp的核苷酸序列,1号外显子的部分包含编码区的核苷酸序列,4号外显子的部分至少包含20bp的核苷酸序列例如至少包含20、30、40、41、42、43、44、45、50、100、150、200、500、600、700、800bp的核苷酸序列,4号外显子的部分包含编码胞外区的核苷酸序列。
优选的,所述的人源化TGFBR2基因还包含非人动物TGFBR2基因的部分,优选包含非人动物TGFBR2基因的1号外显子的全部或部分、2号外显子的全部或部分、4号外显子的部分、5号外显子的全部、6号外显子的全部、7号外显子的全部。
在本发明的一个具体实施方式中,所述的非人动物的基因组中包含SEQ ID NO:7或SEQ ID NO:47所示核苷酸序列;或者,包含与SEQ ID NO:7或SEQ ID NO:47所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:7或SEQ ID NO:47所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:7或SEQ ID NO:47所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,编码人或人源化TGFBR2蛋白的核苷酸序列或者人或人源化TGFBR2基因的核苷酸序列可操作地连接至至少一条染色体中内源TGFBR2基因座处的内源性调控元件。
优选的,所述的非人动物的内源TGFBR2蛋白表达降低或缺失。
优选的,所述的非人动物是本发明如上所述的构建方法构建的。
优选的,所述的非人动物进一步包含其他基因修饰,所述其他基因选自PD-1、PD-L1、CD27、CD40、CD73、CD226、OX40、4-1BB、LAG3、TIGIT中的至少一种。
优选的,所述的非人动物中的TGFBR2基因、人或人源化TGFBR2基因和所述其他基因对于内源被修饰基因座为纯合的;
优选的,所述的非人动物中的TGFBR2基因、人或人源化TGFBR2基因和所述其他基因对于内源被修饰基因座为杂合的。优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第三方面,提供了一种靶向载体,所述的靶向载体包含供体核苷酸序列,优选的,所述的供体核苷酸序列包含下列组中的任一种:
A)编码人或人源化TGFBR2蛋白的核苷酸序列;
B)编码人TGFBR2蛋白的信号肽、胞外区、跨膜区和/或胞质区的核苷酸序列的全部或部分;优选包含编码胞外区的全部或部分的核苷酸序列;进一步优选还包含编码信号肽的核苷酸序列;更进一步优选的,包含编码SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位氨基酸的核苷酸序列;再进一步优选的,包含编码SEQ ID NO:13或SEQ ID NO:53的核苷酸序列;
C)人或人源化TGFBR2基因的核苷酸序列;或,
D)人TGFBR2基因的1号至8号外显子的全部或部分,优选的,人TGFBR2基因的1号至8号外显子中的一种、两种或三种以上的核苷酸序列,进一步优选的,人TGFBR2基因的1号至5号外显子的全部或部分;更进一步优选的,人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分,其中,1号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、10、15、20、30、40、50、100、150、200、300、400、476bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、10、15、16、17、18、19、20、30、40、50、100、150、200、500、600、700、800bp的核苷酸序列;优选还包含1-2号内含子和/或4-5号内含子。
E)人TGFBR2基因的1号至7号外显子的全部或部分,优选的,人TGFBR2基因的1号至7号外显子中的一种、两种或三种以上的组合,进一步优选的,人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分,其中,1号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、60、70、80、90、91、92、93、94、95、100、150、200、300、350、377bp的核苷酸序列,1号外显子的部分包含编码区的核苷酸序列,4号外显子的部分至少包含20bp的核苷酸序列例如至少包含20、30、40、41、42、43、44、45、50、100、150、200、500、600、700、800bp的核苷酸序列,4号外显子的部分包含编码胞外区的核苷酸序列。
在本发明的一个具体实施方式中,所述的靶向载体包含编码SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位氨基酸的核苷酸序列,或者,编码与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位的氨基酸序列同一性至少为60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;或者,编码与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位的氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸的核苷酸序列;或者,编码与SEQ ID NO:2第1-166位或SEQID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列的核苷酸序列。
在本发明的另一个具体实施方式中,所述的靶向载体包含SEQ ID NO:7或SEQIDNO:47所示核苷酸序列,或者,包含与SEQ ID NO:7或SEQ ID NO:47所示核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:7或SEQ ID NO:47所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:7或SEQ IDNO:47所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的靶向载体还包含非人动物TGFBR2基因的部分,优选包含编码非人动物TGFBR2的胞质区和跨膜区的核苷酸序列,进一步优选包含编码SEQ ID NO:1第167-567位氨基酸的核苷酸序列,更进一步优选的,包含SEQ ID NO:31所示的核苷酸序列。
优选的,所述的靶向载体还包含部分非人动物TGFBR2基因,在一些具体实施方式中,所述的非人动物TGFBR2基因的部分为非人动物TGFBR2基因的1号至8号外显子的部分,优选的,包括非人动物TGFBR2基因的1号外显子的部分、5号外显子的部分、6号至8号外显子的全部或部分。
在一些具体实施方式中,所述的靶向载体还包含非人动物TGFBR2基因的部分,所述的非人动物TGFBR2基因的部分为非人动物TGFBR2基因的1号外显子、2号外显子、3号外显子、4号外显子、5号外显子、6号外显子和/或7号外显子的全部或部分;优选的,为非人动物TGFBR2基因的2号外显子的全部或部分、3号外显子的全部或部分、4号外显子、5号外显子、6号外显子和/或7号外显子的全部或部分。
在一个具体实施方式中,所述的靶向载体从5’端至3’端依次包含人TGFBR2基因1号外显子的全部或部分、2号外显子的全部、3号外显子的全部和4号外显子的全部或部分,以及非人动物TGFBR2基因4号外显子的部分、5号外显子的全部、6号外显子的全部和7号外显子的全部或部分。
在一个具体实施方式中,所述的靶向载体从5’端至3’端依次包含编码人TGFBR2信号肽和胞外区的核苷酸序列和编码非人动物TGFBR2胞质区和跨膜区的全部或部分的核苷酸序列。
在一些具体实施方式中,所述的靶向载体还包含编码P2A的核苷酸序列;优选的,所述的编码P2A的核苷酸序列位于人TGFBR2基因部分的上游;优选的,所述的编码P2A的核苷酸序列如SEQ ID NO:4所示。
优选的,所述的靶向载体包含与SEQ ID NO:8和/或SEQ ID NO:9具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ ID NO:8和/或SEQ ID NO:9所示的核苷酸序列。
优选的,所述的靶向载体包含与SEQ ID NO:10和/或SEQ ID NO:11具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ ID NO:10和/或SEQ IDNO:11所示的核苷酸序列。
优选的,所述的靶向载体包含与SEQ ID NO:39和/或SEQ ID NO:40具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ ID NO:39和/或SEQ IDNO:40所示的核苷酸序列。
优选的,所述的靶向载体包含与SEQ ID NO:48、49、50和/或51具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ ID NO:48、49、50和/或51所示的核苷酸序列。
在本发明的一个具体实施方式中,所述的靶向载体包含SEQ ID NO:3、SEQ ID NO:36或SEQ ID NO:54所示核苷酸序列,或者,包含与SEQ ID NO:3、SEQ ID NO:36或SEQ IDNO:54所示核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:3、SEQ ID NO:36或SEQ IDNO:54所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:3、SEQ IDNO:36或SEQ ID NO:54所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的靶向载体编码上述的人源化TGFBR2蛋白。
优选的,所述的靶向载体还包含5’臂和/或3’臂。
所述的5’臂(或5’同源臂)为与非人动物TGFBR2基因5’端同源的DNA片段,其选自非人动物TGFBR2基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的5’臂与NCBI登录号为NC_000075.7至少具有90%同源性的核苷酸。更进一步优选的,所述5’臂序列与SEQ ID NO:5、SEQ ID NO:18、SEQ IDNO:37或SEQ ID NO:45具有90%同源性,或者如SEQ ID NO:5、SEQ ID NO:18、SEQ ID NO:37或SEQ ID NO:45所示。
所述的3’臂(或3’同源臂)为与非人动物TGFBR2基因3’端同源的DNA片段,其选自非人动物TGFBR2基因DNA的100-10000个长度的核苷酸。进一步优选的,所述的3’臂与NCBI登录号为NC_000075.7至少具有90%同源性的核苷酸。更进一步优选的,所述的3’臂序列与SEQ ID NO:6、SEQ ID NO:19、SEQ ID NO:38或SEQ ID NO:46具有90%同源性,或者如SEQID NO:6、SEQ ID NO:19、SEQ ID NO:38或SEQ ID NO:46所示。
优选的,所述的靶向载体还包含非人动物3’UTR。
优选的,所述的靶向载体还包含非人动物5’UTR。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
优选的,所述的靶向载体还包含筛选标记的编码基因。进一步优选的,所述标记基因为负筛选标记的编码基因。更进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。
在本发明的一个具体实施方式中,所述的靶向载体中还包括阳性克隆筛选的抗性基因。进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。
在本发明的一个具体实施方式中,所述的靶向载体中还包括特异性重组系统。进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统)。所述的特异性重组系统为具有两个Frt重组位点,分别连接在抗性基因的两侧。
本发明的第四方面,提供了一种sgRNA分子,所述的sgRNA靶向非人动物TGFBR2基因,同时所述sgRNA的序列在待改变的TGFBR2基因上的靶序列上是唯一的。
优选的,所述sgRNA的靶位点位于TGFBR2基因的2号外显子序列上。
进一步优选的,所述的sgRNA在TGFBR2基因上的靶序列如SEQ ID NO:20-21任一所示。
优选的,所述sgRNA的靶位点位于TGFBR2基因的1号外显子序列上。
进一步优选的,所述的sgRNA在TGFBR2基因上的靶序列如SEQ ID NO:41所示。
本发明的第五方面,提供了一种包含上述靶向载体和/或sgRNA的细胞。
优选的,所述的细胞不能发育成动物个体。
本发明的第六方面,提供了上述靶向载体、上述sgRNA、上述细胞在TGFBR2基因修饰中的应用。优选的,所述的应用包括但不限于敲除、插入或替换。
本发明的第七方面,提供了一种人源化TGFBR2蛋白,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的全部或部分。
所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的信号肽、胞外区、跨膜区和/或胞质区。
优选的,所述人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分,其中,所述的人TGFBR2的胞外区的部分包含人TGFBR2胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144、150、151、152、153、154、160、161个连续氨基酸。
在本发明的一个具体实施方式中,所述人源化TGFBR2蛋白包含SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示的氨基酸序列,或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2信号肽的全部或部分。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含SEQ ID NO:2的第1-22位所示的氨基酸序列,或者,包含与SEQ ID NO:2的第1-22位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQID NO:2的第1-22位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2的第1-22位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分。
进一步优选的,包含人TGFBR2胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144、150、151、152、153、154、160、161个连续氨基酸。
在本发明的一个具体实施方式中,包含SEQ ID NO:44第29-182位所示的氨基酸序列,或者,包含与SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ IDNO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白还包含非人动物TGFBR2蛋白的胞外区的部分、跨膜区的全部、信号肽的全部和胞质区的全部。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含SEQ ID NO:43第1-28和183-592位所示的氨基酸序列,或者,包含与SEQ ID NO:43第1-28和183-592位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:43第1-28和183-592位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:43第1-28和183-592位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分和信号肽的全部或部分。
在本发明的一个具体实施方式中,包含SEQ ID NO:2的第1-166位所示的氨基酸序列,或者,包含与SEQ ID NO:2的第1-166位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ IDNO:2的第1-166位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2的第1-166位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白还包含非人动物TGFBR2的跨膜区的部分和胞质区的全部。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含SEQ ID NO:1的第167-567位所示的氨基酸序列,或者,包含与SEQ ID NO:1的第167-567位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:1的第167-567位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:1的第167-567位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2基因的全部或部分编码的氨基酸序列。进一步优选的,包含人TGFBR2基因的1号至8号外显子的全部或部分编码的氨基酸序列。更进一步优选的,包含人TGFBR2基因的1号至8号外显子中的一种、两种或三种以上的外显子编码的氨基酸序列;更进一步优选的,包含人TGFBR2基因的1号至5号外显子的全部或部分编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分编码的氨基酸序列,其中,1号外显子的部分至少包含5bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2基因的1号至7号外显子的全部或部分编码的氨基酸序列。进一步优选的,包含人TGFBR2基因的1号至7号外显子中的一种、两种或三种以上外显子的组合编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分编码的氨基酸序列,其中1号外显子的部分至少包含编码区的核苷酸序列,4号外显子的部分至少包含编码胞外区的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的任一种:
A)SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列;
B)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
或者,
D)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的部分和非人动物TGFBR2蛋白的部分。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的胞外区和信号肽以及非人动物TGFBR2蛋白的跨膜区的全部或部分和胞质区。
在本发明的另一个实施方式中,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的胞外区的全部或部分,以及非人动物TGFBR2蛋白的信号肽的全部、胞质区的全部、跨膜区的全部或部分和胞外区的全部或部分。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的一种:
A)SEQ ID NO:53的全部或部分;
B)与SEQ ID NO:53的氨基酸序列同一性至少为60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:53的氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
D)与SEQ ID NO:53所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的一种:
a)SEQ ID NO:13氨基酸序列的全部或部分;
b)与SEQ ID NO:13氨基酸序列同一性至少为60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)与SEQ ID NO:13所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
d)与SEQ ID NO:13所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第八方面,提供了一种编码上述人源化TGFBR2蛋白的核酸。
本发明的第九方面,提供了一种人源化TGFBR2基因,所述的人源化TGFBR2基因包含人TGFBR2基因的全部或部分。
优选的,所述的人源化TGFBR2基因编码上述的人源化TGFBR2蛋白。
优选的,所述的人源化TGFBR2基因包含人TGFBR2基因的1号至8号外显子的全部或部分。进一步优选的,包含人TGFBR2基因的1号至8号外显子中的一种、两种或三种以上的组合,进一步优选的,包含人TGFBR2基因的1号至5号外显子的全部或部分。
在本发明的一个具体实施方式中,所述的人源化TGFBR2基因包含人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分,其中,1号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、10、15、20、30、40、50、100、150、200、300、400、476bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列例如至少包含5、10、15、16、17、18、19、20、30、40、50、100、150、200、500、600、700、800bp的核苷酸序列。优选还包含人TGFBR2基因的1-2号内含子和/或4-5号内含子。
优选的,所述的人源化TGFBR2基因还包含非人动物TGFBR2基因的部分,进一步优选包含非人动物TGFBR2基因的1号外显子的部分、5号外显子的部分和6号至8号外显子的全部。
优选的,所述的人源化TGFBR2基因还包含非人动物TGFBR2基因的部分,优选包含非人动物TGFBR2基因的1号外显子的部分、5号外显子的部分和6号至8号外显子的全部。进一步优选还包含非人动物TGFBR2的5-6号内含子。
优选的,所述的人源化TGFBR2基因还包含非人动物TGFBR2基因的部分,优选包含非人动物TGFBR2基因的1号外显子的全部或部分、2号外显子的全部或部分、4号外显子的部分、5号外显子的全部、6号外显子的全部、7号外显子的全部。
优选的,所述的人源化TGFBR2基因包含人TGFBR2基因的1号至7号外显子的全部或部分。进一步优选的,包含人TGFBR2基因的1号至7号外显子中的一种、两种或三种以上的外显子的组合。
在本发明的一个具体实施方式中,所述的人源化TGFBR2基因包含人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分,其中,1号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、60、70、80、90、91、92、93、94、95、100、150、200、300、350、377bp的核苷酸序列,1号外显子的部分包含编码区的核苷酸序列,4号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、50、100、150、200、500、600、700、800bp的核苷酸序列,4号外显子的部分包含编码胞外区的核苷酸序列。
在本发明的一个具体实施方式中,包含非人动物TGFBR2基因的1号至7号外显子的全部或部分。
优选的,所述的人源化TGFBR2基因包含编码人TGFBR2蛋白的核苷酸序列。进一步优选的,包含编码人TGFBR2蛋白的胞外区、跨膜区、胞质区和/或信号肽的全部或部分。
优选的,所述的人源化TGFBR2基因包含编码人TGFBR2蛋白胞外区的全部或部分的核苷酸序列。进一步优选包含编码人TGFBR2蛋白信号肽的全部或部分。
在本发明的一个具体实施方式中,所述的人源化TGFBR2基因包含编码人TGFBR2蛋白胞外区和信号肽的全部核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2基因包含编码人TGFBR2胞外区的全部或部分。
在本发明的一个具体实施方式中,所述的人源化TGFBR2基因包含编码人TGFBR2胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144、150、151、152、153、154、160、161个连续氨基酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2基因包含编码人TGFBR2蛋白胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144个连续氨基酸的核苷酸序列和人TGFBR2信号肽至少5、10、15、16、17、18、19、20、21、22个连续氨基酸的核苷酸序列的核苷酸序列。
优选的,所述的人源化TGFBR2基因包含编码与SEQ ID NO:2第1-166位或SEQ IDNO:44第29-182位的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列的核苷酸序列;或者,包含与编码SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有编码SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2基因包含编码人TGFBR2蛋白胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144个连续氨基酸的核苷酸序列、人TGFBR2信号肽至少5、10、15、16、17、18、19、20、21、22个连续氨基酸的核苷酸序列的核苷酸序列和非人动物TGFBR2蛋白胞质区的全部和跨膜区部分的核苷酸序列。
优选的,所述的人源化TGFBR2基因包含编码与SEQ ID NO:1的第167-567位的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:1的第167-567位所示氨基酸序列的核苷酸序列;或者,包含与编码SEQID NO:1的第167-567位的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有编码SEQ ID NO:1的第167-567位的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2基因包含编码人TGFBR2胞外区至少50、60、70、80、90、100、110、120、130、135、138、140、144、150、151、152、153、154、160、161个连续氨基酸的核苷酸序列,以及非人动物部分胞外区、全部跨膜区和胞质区和信号肽的核苷酸序列。
优选的,所述的人源化TGFBR2基因包含编码与SEQ ID NO:43第1-28和183-592位的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:43第1-28和183-592位所示氨基酸序列的核苷酸序列;或者,包含与编码SEQ ID NO:43第1-28和183-592位的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有编码SEQ ID NO:43第1-28和183-592位的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在一些具体实施方式中,所述的人源化TGFBR2基因还包含编码P2A的核苷酸序列;优选的,所述的编码P2A的核苷酸序列位于人TGFBR2基因部分的上游;优选的,所述的编码P2A的核苷酸序列如SEQ ID NO:4所示。
在一些具体实施方式中,所述的人源化TGFBR2基因包含SEQ ID NO:7或SEQ IDNO:47所示核苷酸序列;或者,包含与SEQ ID NO:7或SEQ ID NO:47所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQID NO:7或SEQ ID NO:47所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:7或SEQ IDNO:47所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在一些具体实施方式中,所述的人源化TGFBR2基因包含SEQ ID NO:31所示核苷酸序列;或者,包含与SEQ ID NO:31所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:31所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:31所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在一个具体实施方式中,所述的人源化TGFBR2基因从5’端至3’端依次包含非人动物TGFBR2基因的1号外显子的部分,人TGFBR2基因1号外显子的部分、2号至4号外显子的全部和5号外显子的部分,非人动物TGFBR2基因的5号外显子的部分、6号至8号外显子的全部。优选还包含人TGFBR2的1-2号内含子、4-5号内含子,以及非人动物TGFBR2的5-6号内含子。
在一个具体实施方式中,所述的人源化TGFBR2基因从5’端至3’端依次包含非人动物TGFBR2基因的1号外显子的部分,人TGFBR2基因的1号外显子的全部或部分、2号外显子的全部、3号外显子的全部和4号外显子的部分,以及非人动物TGFBR2基因的4号外显子的部分、5号外显子的全部、6号外显子的全部和7号外显子的全部。
在一个具体实施方式中,所述的人源化TGFBR2基因依次包含非人动物TGFBR2基因的1-2号外显子的部分,人TGFBR2基因1号外显子的全部或部分、2号外显子的全部或部分、3号外显子的全部和4号外显子的全部或部分,以及非人动物TGFBR2基因4号外显子的全部或部分、5号外显子的全部、6号外显子的全部和7号外显子的全部或部分。
优选的,所述的人源化TGFBR2基因在非人动物中通过调控元件进行调控,进一步优选的,所述的调控元件是内源性或者外源性。
优选的,所述的调控元件包括内源性启动子。
优选的,所述的TGFBR2基因人源化非人动物中的人或人源化TGFBR2基因对于内源TGFBR2基因的替换为纯合或杂合的。
优选的,所述的非人动物的TGFBR2基因对于内源TGFBR2基因座的替换是纯合或者杂合的。
优选的,所述非人动物的基因组中至少一个染色体上包含人源化TGFBR2基因。
优选的,所述的非人动物中至少一个细胞表达人或人源化TGFBR2蛋白。
优选的,所述的人源化TGFBR2基因包括非人动物TGFBR2基因的5’UTR和/或3’UTR。
优选的,所述的人源化TGFBR2基因的核苷酸序列包含与SEQ ID NO:8和/或SEQ IDNO:9具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQ IDNO:8和/或SEQ ID NO:9所示的核苷酸序列。
优选的,所述的人源化TGFBR2基因的核苷酸序列包含与SEQ ID NO:39和/或SEQID NO:40具有至少60%、70%、80%、90%或至少95%同一性的核苷酸序列,或者包含SEQID NO:39和/或SEQ ID NO:40所示的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2基因包含SEQ ID NO:3、SEQ ID NO:36、SEQ ID NO:54所示核苷酸序列;或者,包含与SEQ ID NO:3、SEQ ID NO:36、SEQ ID NO:54所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:3、SEQ IDNO:36、SEQ ID NO:54所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:3、SEQ ID NO:36、SEQ ID NO:54所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化TGFBR2基因的核苷酸序列转录的mRNA包含下列组中的一种:
(a)SEQ ID NO:12、SEQ ID NO:42或SEQ ID NO:52所示核苷酸序列的全部或部分;
(b)与SEQ ID NO:12、SEQ ID NO:42或SEQ ID NO:52所示核苷酸序列的同一性至少为60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(c)与SEQ ID NO:12、SEQ ID NO:42或SEQ ID NO:52所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或,
(d)与SEQ ID NO:12、SEQ ID NO:42或SEQ ID NO:52所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化TGFBR2基因还包括特异性诱导物或阻遏物。进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-Off System/Tet-On System)或他莫昔芬系统(Tamoxifen System)。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第十方面,提供了一种基因人源化的细胞,所述的细胞表达上述的人或人源化TGFBR2蛋白。
优选的,所述的细胞包含上述的人源化TGFBR2基因。
优选的,所述的细胞还包含其他基因修饰,所述其他基因选自PD-1、PD-L1、CD27、CD40、CD73、CD226、OX40、4-1BB、LAG3、TIGIT中的至少一种。
本发明的第十一方面,提供了一种TGFBR2基因敲除的非人动物的构建方法,所述的构建方法包括使用所述的靶向载体和/或所述的sgRNA进行非人动物的构建。其中,所述的sgRNA靶向非人动物TGFBR2基因,同时所述sgRNA的序列在待改变的TNFSF9基因上的靶序列上是唯一的,所述的sgRNA靶向非人动物TGFBR2基因,所述的sgRNA在TGFBR2基因上的靶序列如SEQ ID NO:20-21或41任一所示。
本发明的第十二方面,提供了一种TGFBR2基因敲除的非人动物,所述的非人动物缺失TGFBR2基因的全部或部分。
优选缺失TGFBR2基因的1号外显子至8号外显子的全部或部分。进一步优选缺失TGFBR2基因的1号至8号外显子中的一种、两种或三种以上的组合。优选的,缺失2号外显子的全部或部分或1号至5号外显子的全部或部分。
在一些具体实施方式中,所述的TGFBR2基因敲除的非人动物是由如上所述的构建方法得到的。
本发明的第十三方面,提供了一种多基因修饰的非人动物的构建方法,包括如下步骤:
I)提供上述的非人动物,或者采用上述构建方法获得的非人动物;
II)将步骤I)提供的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因修饰的非人动物包括基因PD-1、PD-L1、CD27、CD40、CD73、CD226、OX40、4-1BB、LAG3和/或TIGIT人源化的非人动物。
优选的,所述的多基因修饰的非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物、六基因人源化非人动物、七基因人源化非人动物、八基因人源化非人动物或九基因人源化非人动物。
优选的,所述的多基因修饰的非人动物的基因组中人源化的多个基因中的每一个基因对于内源基因座的替换均可以是纯合或杂合的。
本发明的第十四方面,提供了一种上述构建方法获得的TGFBR2基因人源化的非人动物、TGFBR2基因敲除的非人动物或者多基因修饰的非人动物或其子代。
本发明的第十五方面,提供了一种动物模型,所述的动物模型来源于上述的非人动物、上述的构建方法获得的非人动物,或者,上述的非人动物或其子代。优选的,所述动物模型为荷瘤或炎症动物模型。
本发明的第十六方面,提供了一种动物的荷瘤或炎症动物模型的制备方法,所述的制备方法包括构建上述的TGFBR2基因人源化的非人动物、TGFBR2基因敲除的非人动物、上述的动物模型或者多基因修饰的非人动物或其子代的步骤。优选的,还包括植入肿瘤细胞的步骤。
本发明的第十七方面,提供了上述的TGFBR2基因人源化的非人动物、TGFBR2基因敲除的非人动物、多基因修饰的非人动物或其子代、上述的动物模型或者上述的构建方法获得的TGFBR2基因人源化的非人动物、TGFBR2基因敲除的非人动物、多基因修饰的非人动物或其子代在制备动物模型中的应用。
本发明的第十八方面,提供了一种所述的细胞、组织或器官,所述的细胞、组织或器官表达所述的人源化TGFBR2蛋白,或者,所述的细胞、组织或器官的基因组中包含上述的人或人源化TGFBR2基因,或者,所述的细胞、组织或器官来源于所述的人源化的非人动物,或者,来源于所述的构建方法获得的非人动物,或者来源于上述的动物模型。
所述的细胞、组织或器官不能发育成动物个体。
本发明的第十九方面,提供了一种荷瘤后的瘤组织,所述的瘤组织来源于上述的非人动物或其子代、上述的构建方法获得的非人动物,或者上述的动物模型。
本发明的第二十方面,提供了一种TGFBR2基因人源化非人动物的基因组。
优选的,所述的基因组中包含人或人源化TGFBR2基因的全部或部分,和/或,包含编码人或人源化TGFBR2蛋白的全部或部分的核苷酸序列。
优选的,所述的人源化TGFBR2基因为上述的人源化TGFBR2基因。
优选的,所述的人源化TGFBR2蛋白为上述的人源化TGFBR2蛋白。
优选的,所述的基因组,包含在非人动物内源TGFBR2基因座处用人TGFBR2基因的基因组片段(优选编码人TGFBR2的信号肽和/或胞外区的全部或部分序列,或者,编码人TGFBR2的胞外区的全部或部分序列),和/或,非人动物TGFBR2基因的基因组片段(优选编码非人动物TGFBR2的跨膜区和/或胞质区的全部或部分序列),导入非人动物TGFBR2基因的基因组片段以形成经修饰的TGFBR2基因。
优选的,所述的基因组,包含在非人动物内源TGFBR2基因座处用人源化TGFBR2基因导入非人动物TGFBR2基因的基因组片段以形成经修饰的TGFBR2基因。
所述的经修饰的TGFBR2基因编码人源化TGFBR2蛋白。
优选的,所述的导入为插入或替换。
优选的,所述的插入为插入非人动物TGFBR2基因的1号外显子起始密码子处。
优选的,所述的替换为替换非人动物TGFBR2基因的2号外显子处,或者,非人动物TGFBR2基因的1号外显子的部分、2号至3号外显子的全部和5号外显子的部分。
优选的,所述的经修饰的TGFBR2基因的表达受到非人动物内源调控元件的控制。
优选的,所述的非人动物可以选自啮齿类动物、斑马鱼、猪、鸡、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
本发明的第二十一方面,提供了包含上述TGFBR2基因人源化非人动物的基因组的细胞、组织或器官。
优选的,上述任一细胞、组织或器官或荷瘤后的瘤组织包括可以发育为动物个体或不能发育为动物个体的细胞、组织或器官或荷瘤后的瘤组织。
本发明的第二十二方面,提供了来源于上述的人源化TGFBR2蛋白、上述的核酸、上述的人源化TGFBR2基因、上述的非人动物或其子代、上述的TGFBR2基因人源化的细胞、上述的构建方法获得的非人动物、上述的动物模型、上述的细胞、组织或器官、上述的荷瘤后的瘤组织的应用,所述的应用包含:
A)涉及人类细胞的与TGFBR2相关的免疫过程的产品开发中的应用;
B)作为药理学、免疫学、微生物学和医学研究的与TGFBR2相关的模型系统中的应用;
C)涉及生产和利用动物实验疾病模型用于与TGFBR2相关的病原学研究和/或用于开发诊断策略和/或用于开发治疗策略中的应用;
D)在体内研究人TGFBR2信号通路调节剂的筛选、药效检测、评估疗效、验证或评价中的应用;或者,
E)研究TGFBR2基因功能,研究针对人TGFBR2靶位点的药物、药效,研究与TGFBR2相关的免疫相关疾病药物以及抗肿瘤药物方面的应用。
优选的,所述应用包括疾病的治疗和/或诊断方法,或,非疾病的治疗和/或诊断方法。
本发明的第二十三方面,提供了一种人TGFBR2特异性调节剂的筛选方法,所述的筛选方法包括向植入肿瘤细胞的个体施加调节剂,检测肿瘤抑制性;其中,所述的个体选自上述的非人动物或其子代、上述的构建方法获得的非人动物、或者上述的荷瘤或炎症模型。
优选的,所述的调节剂选自CAR-T、药物。进一步优选的,所述的药物为抗体。
优选的,所述的调节剂为单抗或双特异性抗体或两种及两种以上药物的联合使用。
优选的,所述检测包括测定肿瘤细胞的大小和/或增殖速率。
优选的,所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。
优选的,所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化,所述的代谢变化包括食物消耗或水消耗的变化。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述人TGFBR2特异性调节剂的筛选方法包括治疗和非治疗方法。
在一个具体实施方式中,该方法用来筛选或评价药物,对候选药物的药效进行检测和比较,以确定哪些候选药物可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度,即治疗效果不是必然的,只是一种可能性。
本发明的第二十四方面,提供了一种干预方案的评价方法,所述的评价方法包括向个体植入肿瘤细胞,向植入肿瘤细胞的个体施加干预方案,对施加干预方案后的个体进行肿瘤抑制效果检测和评价;其中,所述的个体选自上述的非人动物,上述的构建方法获得的非人动物,上述的非人动物或其子代,或者上述的荷瘤或炎症模型。
优选的,所述的干预方案选自CAR-T、药物治疗。进一步优选的,所述的药物为抗原结合蛋白。所述的抗体结合蛋白为抗体。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述干预方案的评价方法包括治疗和非治疗方法。
在一个具体实施方式中,该评价方法对干预方案的效果进行检测和评价,以确定该干预方案是否有治疗效果,即治疗效果不是必然的,只是一种可能性。
本发明的第二十五方面,提供了一种来源于上述的非人动物或其子代、上述的构建方法获得的非人动物、上述的荷瘤或炎症模型在制备人TGFBR2特异性调节剂中的用途。
本发明的第二十六方面,提供了一种来源于上述的非人动物或其子代、上述的构建方法获得的非人动物、上述的荷瘤或炎症模型在制备治疗肿瘤、炎症或免疫相关疾病的药物中的用途。
本发明所述的“免疫相关疾病”包括但不限于过敏、哮喘、心肌炎、肾炎、肝炎、系统性红斑狼疮、类风湿性关节炎、硬皮病、甲状腺功能亢进、原发性血小板减少性紫癜、自身免疫性溶血性贫血、溃疡性结肠炎、自身免疫性肝病、糖尿病、疼痛或神经障碍等。
本发明所述的“炎症”包括急性炎症,也包括慢性炎症。具体的,包括但不限于变质性炎症、渗出性炎症(浆液性炎、纤维素性炎、化脓性炎、出血性炎、坏死性炎、卡他性炎)、增生性炎症、特异性炎症(结核、梅毒、麻疯、淋巴肉芽肿等)。
本发明所述的“肿瘤”包括但不限于淋巴瘤、非小细胞肺癌、白血病、卵巢癌、鼻咽癌、乳腺癌、子宫内膜癌、结肠癌、直肠癌、胃癌、膀胱癌、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺癌、头颈部癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中,所述的白血病选自急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病;所述淋巴瘤选自霍奇金淋巴瘤和非霍奇金淋巴瘤,包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症;所述肉瘤选自骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、以及软骨肉瘤。
本发明所述的TGFBR2基因人源化的非人动物,其体内可以正常表达人或人源化TGFBR2蛋白,可用于针对人TGFBR2靶位点的药物筛选、药效评估、免疫疾病和肿瘤治疗,可以加快新药研发过程、节约时间和成本。对于研究TGFBR2蛋白功能及相关疾病药物筛选提供了有效的保障。
本发明所述的“全部或部分”,“全部”为整体,“部分”为整体中的局部,或者组成整体的个体。
本发明所述的“人源化TGFBR2蛋白”,包含来源于人TGFBR2蛋白的部分和非人TGFBR2蛋白的部分。其中,所述的“人TGFBR2蛋白”同人TGFBR2蛋白的全部,即其氨基酸序列与人TGFBR2蛋白的全长氨基酸序列一致。所述的“人TGFBR2蛋白的部分”,为连续或间隔的5-592个氨基酸序列与人TGFBR2蛋白的氨基酸序列一致。优选为连续或间隔10-567、10-166、10-154个,具体为连续10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、166、170、180、190、200、250、300、350、400、450、500、550、567、592个氨基酸序列与人TGFBR2蛋白的氨基酸序列一致。
本发明所述的“人TGFBR2蛋白的跨膜区的全部”、“人TGFBR2蛋白的胞质区的全部”或“人TGFBR2蛋白的胞外区的全部”,代表其氨基酸序列分别与人TGFBR2蛋白的跨膜区、胞质区或胞外区的全长氨基酸序列一致。
本发明所述的“人TGFBR2蛋白的胞外区的部分”,为连续或间隔5-144个氨基酸序列与人TGFBR2蛋白的胞外区氨基酸序列一致,优选为10-139,具体为连续5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、144个氨基酸序列与人TGFBR2蛋白的胞外区氨基酸序列一致。
本发明所述的“非人动物TGFBR2蛋白的部分”,为连续或间隔5-567或5-592个氨基酸序列与非人动物TGFBR2蛋白的氨基酸序列一致,具体为连续5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、450、500、550、567、592个氨基酸序列与非人动物TGFBR2蛋白的氨基酸序列一致。
本发明所述的“人源化TGFBR2基因”,包含来源于人TGFBR2基因的部分和非人TGFBR2基因的部分。其中,所述的“人TGFBR2基因”同人TGFBR2基因的全部,即其核苷酸序列与人TGFBR2基因的全长核苷酸序列一致。
在一个具体实施方式中,所述的“人TGFBR2基因的部分”为连续或间隔的20-87542bp个核苷酸序列与人TGFBR2基因的核苷酸序列一致,优选为20、50、100、200、300、400、500、600、700、800、900、1000、2000、4000、6000、10000、15000、20000、25000、30000、35000、40000、45000、50000、55000、60000、70000、80000、850000、87542bp个核苷酸序列与人TGFBR2基因的核苷酸序列一致。
在一些具体实施方式中,所述的“人TGFBR2基因的部分”为连续或间隔的20-498bp个核苷酸序列与人TGFBR2基因的核苷酸序列一致,优选为20、50、100、200、250、300、350、400、450、498bp个核苷酸序列与人TGFBR2基因的核苷酸序列一致。
在一个具体实施方式中,所述的“人TGFBR2基因的部分”为连续或间隔的20-4842bp个核苷酸序列与人TGFBR2基因的核苷酸序列一致,优选为20、50、100、200、300、400、500、600、690、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2500、3000、3955、4000或4842bp个核苷酸序列与人TGFBR2基因的核苷酸序列一致。
本发明所述的“外显子的部分”表示连续或间隔几个、几十个或几百个核苷酸序列与全部的外显子核苷酸序列一致。例如人TGFBR2基因的1号外显子的部分,包含连续或间隔的5-476或5-377bp个,优选5-10个核苷酸序列与人TGFBR2基因的1号外显子核苷酸序列一致。
本发明所述的“xx号至xxx号外显子”或“xx号至xxx号外显子的全部”包含外显子及其期间的内含子的核苷酸序列,例如“2号至4号外显子”包含2号外显子、2-3号内含子、3号外显子、3-4号内含子和4号外显子的全部核苷酸序列。
本发明所述的“x-xx号内含子”表示x号外显子与xx号外显子之间的内含子。例如“1-2号内含子”表示1号外显子与2号外显子之间的内含子。
本发明所述的“非人动物TGFBR2基因的部分”为连续或间隔20-90973bp个核苷酸序列与非人动物TGFBR2基因的核苷酸序列一致,具体为连续20、50、100、200、300、400、500、599、690、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000、20000、21000、22000、22000、23000、24000、25000、26000、27000、28000、29000、300000、40000、50000、60000、70000、80000、85000、90000、90973个核苷酸序列与非人动物TGFBR2基因的核苷酸序列一致。
本发明所述的“基因座”广义上讲代表基因在染色体上所占的位置,狭义上讲代表某一基因上的一段DNA片段,即可以是一个基因也可以是一个基因的一部分。例如所述的“TGFBR2基因座”表示TGFBR2基因1号至8号外显子上的任选一段的DNA片段。在本发明的一个具体实施方式中,被替换的TGFBR2基因座可以是TGFBR2基因1号至8号外显子上的任选一段的DNA片段。
本发明所述的“核苷酸序列”包含天然的或经过修饰的核糖核苷酸序列、脱氧核糖核苷酸序列。优选为DNA、cDNA、pre-mRNA、mRNA、rRNA、hnRNA、miRNAs、scRNA、snRNA、siRNA、sgRNA、tRNA。
本发明所述的“三个以上”包括连续的三个以上或者间隔的三个以上,具体的包括但不限于三个、四个、五个、六个、七个或八个以上等。
本发明所述的“治疗”表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除,且是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。
本发明所述的“同源性”,是指在使用氨基酸序列或核苷酸序列的方面,本领域技术人员在保证与已知序列相似结构或功能的前提下,可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。
本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:Molecular Cloning A Laboratory Manual,2ndEd.,ed.By Sambrook,Fritschand Maniatis(Cold Spring Harbor Laboratory Press:1989);DNA Cloning,Volumes I and II(D.N.Glovered.,1985);Oligonucleotide Synthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelsonand M.Simon,eds.inchief,Academic Press,Inc.,New York),specifically,Vols.154and 155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,ed.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods InCell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook Of Experimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);and Manipulating the Mouse Embryo,(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1986)。
在一个方面,所述非人动物是哺乳动物。优选的,所述非人动物是小型哺乳动物,例如跳鼠科。在一个实施方式中,所述非人动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。
在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠及NOD、NOD/SCID、NOD-Prkdcscid IL-2rgnull背景的小鼠。
以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。
下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:小鼠TGFBR2基因座和人TGFBR2基因座对比示意图(非按比例);
图2:小鼠TGFBR2基因人源化改造示意图(非按比例);
图3:TGFBR2基因打靶策略及靶向载体设计示意图(非按比例);
图4:TGFBR2基因人源化小鼠FRT重组过程示意图(非按比例);
图5:TGFBR2基因打靶策略及靶向载体设计示意图(非按比例);
图6:小鼠TGFBR2基因人源化改造示意图(非按比例);
图7:TGFBR2基因打靶策略及靶向载体设计示意图(非按比例);
图8:小鼠TGFBR2基因座和人TGFBR2基因座对比示意图(非按比例);
图9:小鼠TGFBR2基因人源化改造示意图(非按比例);
图10:TGFBR2基因打靶策略及靶向载体设计示意图(非按比例);
图11:TGFBR2基因人源化小鼠F1代鼠尾PCR鉴定结果,其中,WT为野生型,H2O为水对照,M为Marker;
图12:RT-PCR鉴定TGFBR2基因人源化纯合子小鼠体内mRNA表达,其中+/+为野生型C57BL/6小鼠,H/H为TGFBR2基因人源化纯合子小鼠,H2O为水对照;
图13:脾脏中白细胞亚群(13A)和T细胞亚群占比的流式检测结果(13B),其中+/+为野生型C57BL/6小鼠,H/H为TGFBR2基因人源化纯合子小鼠;
图14:淋巴结中白细胞亚群(14A)和T细胞亚群占比的流式检测结果(14B),其中+/+为野生型C57BL/6小鼠,H/H为TGFBR2基因人源化纯合子小鼠;
图15:血液中白细胞亚群(15A)和T细胞亚群占比的流式检测结果(15B),其中+/+为野生型C57BL/6小鼠,H/H为TGFBR2基因人源化纯合子小鼠。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
在下述每一实施例中,设备和材料是从以下所指出的几家公司获得:
StuI酶、NcoI酶购自NEB,货号分别为R0187S、R3193S;
C57BL/6小鼠、Flp工具鼠购自中国食品药品检定研究院国家啮齿类实验动物种子中心;
Brilliant Violet 510TM anti-mouse CD45 Antibody购自Biolegend,货号103138;
Brilliant Violet 605TM anti-mouse CD19 Antibody购自Biolegend,货号115540;
Purified anti-mouse CD16/32Antibody购自Biolegend,货号101302;
Zombie NIRTM Fixable Viability Kit购自Biolegend,货号423106;
Brilliant Violet 711TM anti-mouse TCRβchain Antibody购自Biolegend,货号109243;
Mouse TGF-beta RII PE-conjugated Antibody购自R&D,货号FAB532P;
PE anti-human TGF-βReceptor II Antibody购自Biolegend,货号399703;
FITC anti-Mouse CD19 Antibody购自Biolegend,货号115506;
PerCP/Cyanine5.5 anti-mouse TCRβchain Antibody购自Biolegend,货号:109228;
APC anti-human TGF-βReceptor II Antibody购自Biolegend,货号:399705;
Goat IgG PE-conjugated Antibody购自R&D,货号:IC108P
APC Rat IgG2b,κIsotype Ctrl Antibody购自Biolegend,货号:400612;
Zombie NIRTM Fixable Viability Kit购自Biolegend,货号:423106;
PerCP anti-mouse Ly-6G/Ly-6C(Gr-1)Antibody购自Biolegend,货号:108426;
Brilliant Violet 421TM anti-mouse CD4 Antibody购自Biolegend,货号:100438;
FITC anti-mouse F4/80Antibody购自Biolegend,货号:123108;
PE anti-mouse CD8a Antibody购自Biolegend,货号:100708;
PE/CyTM 7Mouse anti-mouse NK1.1购自BD Pharmingen,货号:552878;
APC anti-mouse/rat Foxp3 Antibody购自eBioscience,货号:17-5773-82;
APC Hamster Anti-Mouse TCRβChain购自BD PharmingenTM,货号:553174;
Brilliant Violet 605TM anti-mouse CD11c Antibody购自Biolegend,货号:117334;
PE anti-mouse/human CD11b Antibody购自Biolegend,货号:101208。
实施例1TGFBR2基因人源化小鼠(一)
小鼠TGFBR2基因(NCBI Gene ID:21813,Primary source:MGI:98729,UniProt:Q3UG22,位于9号染色体NC_000075.7的第115916763至116004431位,基于转录本NM_029575.3及其编码蛋白NP_083851.3(SEQ ID NO:1))和人TGFBR2基因(NCBI Gene ID:7048,Primary source:HGNC:11773,UniProt ID:P37173-1,位于3号染色体NC_000003.12的第30606472至30694142位,基于转录本NM_003242.6及其编码蛋白NP_003233.4(SEQ IDNO:2))对比示意图如图1所示。
为了达到本发明的目的,可在小鼠内源TGFBR2基因座引入编码人TGFBR2蛋白的核苷酸序列,使得该小鼠表达人或人源化TGFBR2蛋白。具体来说,用基因编辑技术,在小鼠TGFBR2基因调节元件的控制下,用人TGFBR2基因组编码区替换小鼠TGFBR2基因组编码区,或用包含人TGFBR2基因和包含鼠TGRBR2基因的嵌合基因序列插入或替换到小鼠的内源TGFBR2基因座上,得到人源化TGFBR2基因座示意图如图2所示,实现对小鼠TGFBR2基因的人源化改造。
设计如图3所示的打靶策略,图中显示了靶向载体上含有小鼠TGFBR2基因上游和下游的同源臂序列,以及包含P2A序列、人TGFBR2、鼠TGFBR2以及STOP序列的A1片段(SEQ IDNO:3)。其中,P2A序列如SEQ ID NO:4所示;上游同源臂序列(5’同源臂,SEQ ID NO:5)与NCBI登录号为NC_000075.7的第115960696至115964481位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:6)与NCBI登录号为NC_000075.7的第115956141至115960230位核苷酸序列相同。A1片段上人TGFBR2的核苷酸序列(SEQ ID NO:7)与NCBI登录号为NM_003242.6的第284至781位核苷酸序列相同;A1片段上鼠TGFBR2的核苷酸序列为SEQ ID NO:31;A1片段序列上游与小鼠的连接设计为:
Figure BDA0003908354980000471
Figure BDA0003908354980000472
其中序列
Figure BDA0003908354980000473
中“T”是小鼠最后一个核苷酸,序列GGAA中第一个“G”是A1片段第一个核苷酸。A1片段序列下游与小鼠的连接设计为:
Figure BDA0003908354980000474
Figure BDA0003908354980000475
其中序列
Figure BDA0003908354980000476
中最后一个C是A1片段的最后一个核苷酸,序列AGAA中第一个A是小鼠序列的第一个核苷酸。
靶向载体上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neo cassette)。其中Neo盒5’端与STOP序列的连接设计为:
Figure BDA0003908354980000477
Figure BDA0003908354980000478
Figure BDA0003908354980000479
其中序列
Figure BDA00039083549800004710
中最后一个A是STOP序列的最后一个核苷酸,序列GTCG的第一个G是Neo盒的第一个核苷酸;Neo盒3’端与小鼠基因的连接设计为:
Figure BDA00039083549800004711
Figure BDA00039083549800004712
其中序列
Figure BDA00039083549800004713
中最后一个C是Neo盒的最后一个核苷酸,序列AGAAT中第一个A是小鼠的第一个核苷酸。此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。改造后的人源化小鼠TGFBR2的mRNA序列如SEQ ID NO:12所示,表达的蛋白序列如SEQ ID NO:13所示。
鉴于人TGFBR2具有多种亚型或转录本,本文所述的方法可应用于其它亚型或转录本。
靶向载体构建可采用常规方法进行,如酶切连接等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况,筛选出正确的阳性克隆细胞,经PCR鉴定为阳性的克隆,再进行Southern Blot检测,Southern检测为阳性的克隆,进一步测序验证为阳性的且无随机插入的克隆进行下一步实验。
其中,PCR测定包括下述引物:
WT-F:5’-AGTTAACAGTGATGTCATGGCCAGCG-3’(SEQ ID NO:14)
WT-R:5’-GTGGATGCTAAGAGGTGAAACGA-3’(SEQ ID NO:15);
将筛选出的正确阳性克隆细胞(黑色鼠)按照本领域已知的技术导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因(该过程示意图见图4)后,再通过互相交配即可得到TGFBR2基因人源化纯合子小鼠。可通过PCR鉴定子代小鼠体细胞的基因型(引物序列如SEQ ID NO:14-17所示),使用本方法能构建出可稳定传代且无随机插入的TGFBR2基因人源化小鼠(V1)。
其中,PCR引物为:
WT-F:5’-AGTTAACAGTGATGTCATGGCCAGCG-3’(SEQ ID NO:14)
Mut-R:5’-GGAGAAGCAGCATCTTCCAGAATAAAGT-3’(SEQ ID NO:16)
Mut-F:5’-CACACCTCCCCCTGAACCTGAAAC-3’(SEQ ID NO:17)
WT-R:5’-GTGGATGCTAAGAGGTGAAACGA-3’(SEQ ID NO:15)
此外,还可引入CRISPR/Cas系统进行基因编辑,设计如图5所示的打靶策略,图中显示了靶向载体上含有小鼠TGFBR2基因上游和下游的同源臂序列,以及包含人TNFBR2的A2片段(SEQ ID NO:54)。其中,上游同源臂序列(5’同源臂,SEQ ID NO:18)与NCBI登录号为NC_000075.7的第115960696至115962174位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:19)与NCBI登录号为NC_000075.7的第115958894至115960321位核苷酸序列相同,人TGFBR2的核苷酸序列与NCBI登录号为NM_003242.6的第284至781位核苷酸序列相同(SEQ ID NO:7)。
靶向载体构建可采用常规方法进行,如酶切连接、直接合成等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体用于后续实验。
靶序列决定了sgRNA的靶向特异性和诱导Cas9切割目的基因的效率。因此,高效特异的靶序列选择和设计是构建sgRNA表达载体的前提。设计并合成识别靶位点的sgRNA序列,各sgRNA在TGFBR2基因上的靶序列如下:
sgRNA1靶位点(SEQ ID NO:20):5’-ATGAAGTCTGCGTGGCCGTGTGG-3’;
sgRNA2靶位点(SEQ ID NO:21):5’-TCATGTGTGCTCGTGGCAAGAGG-3’;
利用UCA试剂盒检测sgRNA的活性,确定其可介导高校切割效率后,在其5’端及互补链上分别加上酶切位点得到正向寡核苷酸和反向寡核苷酸序列(见表1),退火后将退火产物连接至pT7-sgRNA质粒(质粒先用BbsI线性化),获得表达载体pT7-TGFBR2-1和pT7-TGFBR2-2。
表1 sgRNA1和sgRNA2序列列表
Figure BDA0003908354980000491
pT7-sgRNA载体由质粒合成公司合成含有T7启动子及sgRNA scaffold的片段DNA(SEQ ID NO:28)并依次通过酶切(EcoRI及BamHI)连接至骨架载体(来源Takara,货号3299)上,经专业测序公司测序验证,结果表明获得了目的质粒。
取小鼠的原核期受精卵,例如C57BL/6小鼠,利用显微注射仪将pT7-TGFBR2-1和pT7-TGFBR2-2质粒的体外转录产物(使用Ambion体外转录试剂盒,按照说明书方法进行转录)、靶向载体与Cas9 mRNA预混好后注射至小鼠受精卵细胞质或细胞核中。按照《小鼠胚胎操作实验手册(第三版)》(安德拉斯·纳吉,化学工业出版社,2006)中的方法进行受精卵的显微注射,注射后的受精卵转移至培养液中短暂培养,然后移植至受体母鼠的输卵管中发育,将获得的小鼠(F0代)通过杂交和自交,扩大种群数量,建立稳定的TGFBR2基因人源化小鼠品系。
可通过常规检测方法(如PCR分析)鉴定F0代小鼠体细胞的基因型。结合5’端引物检测结果和3’端引物PCR检测结果,经测序进一步验证为阳性小鼠。将F0鉴定为阳性的TGFBR2基因人源化小鼠与野生型小鼠交配得到F1代小鼠。可使用同样的PCR方法(引物序列如表2所示)对F1代小鼠进行基因型鉴定,示例性的F1代小鼠的鉴定结果见图11,其中,编号为F1-01、F1-02、F1-03、F1-04、F1-05、F1-06、F1-07、F1-08、F1-09、F1-10、F1-11、F1-12、F1-13和F1-14的小鼠为阳性杂合子小鼠。
表2 F1代基因型PCR检测引物序列及重组片段大小
Figure BDA0003908354980000501
对F1代PCR鉴定为阳性的小鼠进行Southern blot检测,确认是否存在随机插入。剪取鼠尾提取基因组DNA,选用StuI酶或NcoI酶消化基因组,转膜,杂交。5’探针和3’探针分别位于5’同源臂上及3’同源臂外侧,具体探针及目的片段的长度见表3。获得可稳定传代,且无随机插入的TGFBR2基因人源化的基因工程小鼠。
表3具体探针及目的片段的长度
限制性内切酶 探针 野生型片段大小 重组序列片段大小
StuI 5’Probe 4.7kb 7.0kb
NcoI 3’Probe 4.3kb
探针合成引物如下:
5’Probe-F(SEQ ID NO:32):5’-TTTAGAGACCCAGGAAGCAGGTGTT-3’,
5’Probe-R(SEQ ID NO:33):5’-CAGTAAGACAACCCTGCCATGCACTC-3’;
3’Probe-F(SEQ ID NO:34):5’-AACTGATGAATGGGAGCAGTGGTGG-3’,
3’Probe-R(SEQ ID NO:35):5’-GCAGACACTCTATGCCTGTGTGGAG-3’;
将F1代鉴定为阳性的杂合小鼠相互交配,获得F2代TGFBR2基因人源化纯合子小鼠(V2)。
可通过常规检测方法确认阳性小鼠体内人源化TGFBR2蛋白的表达情况,例如流式细胞术等。具体来说,分别取8周龄雄性C57BL/6野生型小鼠和8周龄雄性TGFBR2基因人源化杂合子小鼠各1只,脱颈安乐死后取脾脏组织,分别用抗鼠TGFBR2抗体Mouse TGF-beta RIIPE-conjugated Antibody(mTGFBR2)、抗人TGFBR2抗体PE anti-human TGF-βReceptor IIAntibody(hTGFBR2)、抗鼠TCRβ抗体Brilliant Violet 711TM anti-mouse TCRβ(mTCRβ)、鼠白细胞识别抗体Brilliant Violet 510TM anti-mouse CD45(mCD45)、抗鼠CD19抗体Brilliant Violet 605TM anti-mouse CD19(mCD19)、抗鼠CD16/32抗体Purified anti-mouse CD16/32等识别染色后进行流式检测,检测人或人源化TGFBR2蛋白的表达情况。
结果表明,C57BL/6小鼠脾脏中B细胞(特征为mCD45+mCD19+)有0.97%hTGFBR2阳性细胞(特征为mCD45+mCD19+hTGFBR2+),有23.7%mTGFBR2阳性细胞(特征为mCD45+mCD19+mTGFBR2+),TGFBR2杂合子小鼠脾脏中B细胞(特征为mCD45+mCD19+)有12.2%hTGFBR2阳性细胞(特征为mCD45+mCD19+hTGFBR2+),有10.8%mTGFBR2阳性细胞(特征为mCD45+mCD19+mTGFBR2+)。
C57BL/6小鼠脾脏中T细胞(特征为mCD45+mTCRβ+)有0.60%hTGFBR2阳性细胞(特征为mCD45+mTCRβ+hTGFBR2+),有23.1%mTGFBR2阳性细胞(特征为mCD45+mTCRβ+mTGFBR2+),TGFBR2杂合子小鼠脾脏中T细胞(特征为mCD45+mTCRβ+)有15.8%hTGFBR2阳性细胞(特征为mCD45+mTCRβ+hTGFBR2+),有11.0%mTGFBR2阳性细胞(特征为mCD45+mTCRβ+mTGFBR2+)。
综上,C57BL/6与TGFBR2人源化杂合子小鼠中可以检测到小鼠TGFBR2蛋白表达,但只有TGFBR2人源化杂合子小鼠体内可以检测到人源化TGFBR2蛋白表达。说明人源化TGFBR2蛋白在TGFBR2人源化杂合子小鼠体内可以正常表达。
实施例2TGFBR2人源化小鼠(二)
还可将实施例1中人鼠嵌合序列插入到5’UTR之后ATG之前,成功获得了TGFBR2人源化小鼠。改造小鼠的基因座的示意图如图6所示,实现对小鼠TGFBR2人源化改造。
设计如图7所示的打靶策略,图中显示了靶向载体上含有小鼠TGFBR2基因上游和下游的同源臂序列,以及包含人TGFBR2序列A3片段(SEQ ID NO:36)。其中,上游同源臂序列(5’同源臂,SEQ ID NO:37)与NCBI登录号为NC_000075.7的第116004106至116006016位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:38)与NCBI登录号为NC_000075.7的第116003093至116004102位核苷酸序列至少99%一致或相同。A3片段上人TGFBR2的核苷酸序列(SEQ ID NO:7)与NCBI登录号为NM_003242.6的第284至781位核苷酸序列相同;A3片段上鼠TGFBR2的核苷酸序列为SEQ ID NO:31;A3片段序列上游与小鼠的连接设计为:
Figure BDA0003908354980000521
Figure BDA0003908354980000522
其中序列CTGCC中最后一个C是小鼠最后一个核苷酸,序列ATGGG中的A是A3片段第一个核苷酸。A3片段序列下游与小鼠的连接设计为:
Figure BDA0003908354980000523
Figure BDA0003908354980000524
其中序列
Figure BDA0003908354980000525
中最后一个C是A3片段的最后一个核苷酸,序列GGTC中第一个G是小鼠序列的第一个核苷酸。
靶向载体的构建用本领域已知的方式进行。sgRNA的设计在TGFBR2基因上的靶序列如下:
sgRNA靶位点(SEQ ID NO:41):5’-GAGTGGCCAGGGCGCGACCCTGG-3’;
利用UCA试剂盒检测sgRNA的活性,确定其可介导高效切割效率后,在其5’端及互补链上分别加上酶切位点得到正向寡核苷酸和反向寡核苷酸序列,退火后将退火产物连接至pT7-sgRNA质粒(质粒先用BbsI线性化),获得表达载体pT7-TGFBR2。显微注射方法及小鼠基因型检测方法可以参照实施例1,可获得稳定传代,且无随机插入的TGFBR2基因人源化的基因工程小鼠(V3)。改造后的人源化小鼠TGFBR2的mRNA序列如SEQ ID NO:42所示,表达的蛋白序列如SEQ ID NO:13所示。
可采用RT-PCR方法对F2代纯合子小鼠(V3)进行基因型鉴定,选取6周龄雌性C57BL/6野生型小鼠和TGFBR2基因人源化纯合子小鼠各1只,脱颈安乐死后取脾脏组织,使用表4所示引物进行RT-PCR检测,鉴定结果见图12,在C57BL/6野生型小鼠脾细胞中可以检测到鼠的TGFBR2 mRNA,人的TGFBR2 mRNA仅在TGFBR2基因人源化纯合子小鼠中可以检测到。
表4 F2代基因型RT-PCR检测引物序列及重组片段大小
Figure BDA0003908354980000526
Figure BDA0003908354980000531
使用流式细胞术对C57BL/6野生型小鼠和TGFBR2基因人源化纯合子小鼠体内蛋白表达情况进行检测。具体来说,分别取7周龄雌性C57BL/6野生型小鼠和TGFBR2基因人源化纯合子小鼠各1只,脱颈安乐死后取脾脏组织,分别用鼠白细胞识别抗体Brilliant Violet510TM anti-mouse CD45(mCD45)、抗鼠CD 19抗体FITC anti-Mouse CD19、抗鼠TCRβ抗体PerCP/Cy5.5 anti-mouse TCRβchain、抗人TGF-βAPC受体anti-human TGF-βReceptor IIAntibody、抗鼠TGFBR2抗体Mouse TGF-beta RII PE-conjugated Antibody(mTGFBR2)、Goat IgG PE-conjugated Antibody、APC Rat IgG2b,κIsotype Ctrl Antibody、ZombieNIRTM Fixable Viability Kit、抗鼠CD16/32抗体Purified anti-mouse CD16/32识别染色后进行流式检测,检测人或人源化TGFBR2蛋白的表达情况。
结果表明,C57BL/6小鼠脾脏中B细胞有2.75%hTGFBR2阳性细胞(特征为mCD45+mCD19+hTGFBR2+),有27.7%mTGFBR2阳性细胞(特征为mCD45+mCD19+mTGFBR2+),TGFBR2纯合子小鼠脾脏中B细胞有14.4%hTGFBR2阳性细胞(特征为mCD45+mCD19+hTGFBR2+),有5.53%mTGFBR2阳性细胞(特征为mCD45+mCD19+mTGFBR2+)。
C57BL/6小鼠脾脏中T细胞有3.02%hTGFBR2阳性细胞(特征为mCD45+mTCRβ+hTGFBR2+),有16.9%mTGFBR2阳性细胞(特征为mCD45+mTCRβ+mTGFBR2+),TGFBR2纯合子小鼠脾脏中T细胞有18.9%hTGFBR2阳性细胞(特征为mCD45+mTCRβ+hTGFBR2+),有10.4%mTGFBR2阳性细胞(特征为mCD45+mTCRβ+mTGFBR2+)。
C57BL/6小鼠脾脏中NK细胞有2.42%hTGFBR2阳性细胞(特征为mCD45+mTCRβ-mNK1.1+hTGFBR2+),有28.6%mTGFBR2阳性细胞(特征为mCD45+mTCRβ-mNK1.1+mTGFBR2+),TGFBR2纯合子小鼠脾脏中NK细胞有16.4%hTGFBR2阳性细胞(特征为mCD45+mTCRβ-mNK1.1+hTGFBR2+),有27.8%mTGFBR2阳性细胞(特征为mCD45+mTCRβ-mNK1.1+mTGFBR2+)。
可见,C57BL/6小鼠中只能检测到小鼠TGFBR2蛋白表达。由于Mouse TGF-beta RIIPE-conjugated Antibody与人TGFBR2具有交叉反应性,结合RT-PCR检测结果,可确认在TGFBR2基因人源化纯合子小鼠中只能检测到人的TGFBR2蛋白。
进一步地,使用流式细胞术对C57BL/6野生型小鼠和TGFBR2基因人源化纯合子小鼠(H/H)的脾脏、淋巴结和血液组织进行免疫分型检测。具体的,分别取9周龄雌性C57BL/6野生型小鼠和TGFBR2基因人源化纯合子小鼠各3只,脱颈安乐死后取脾脏、淋巴结血液组织使用Purified anti-mouse CD16/32Antibody、Zombie NIRTM Fixable Viability Kit、Brilliant Violet 510TM anti-mouse CD45 Antibody、PerCP anti-mouse Ly-6G/Ly-6C(Gr-1)Antibody、Brilliant Violet 421TM anti-mouse CD4 Antibody、FITC anti-mouseF4/80Antibody、PE anti-mouse CD8a Antibody、PE/CyTM 7Mouse anti-mouse NK1.1、APCanti-mouse/rat Foxp3 Antibody、FITC anti-Mouse CD19 Antibody、PerCP/Cy5.5 anti-mouse TCRβchain等抗体进行免疫分型检测,脾脏和血液中白细胞亚型和T细胞亚型检测结果分别如图13和图15所示,从图中可以看出,TGFBR2基因人源化纯合子小鼠脾脏和血液中B细胞(B Cells)、T细胞(T cells)、NK细胞(NK cells)、CD4+T细胞(CD4+T cells)、CD8+T细胞(CD8+T cells)、粒细胞(Granulocytes)、DC细胞(Dendritic cells)、巨噬细胞(Macrophages)和单核细胞(Monocytes)等白细胞亚型与C57BL/6野生型小鼠基本一致(图13(A)和图15(A)),CD4+T细胞(CD4+T cells)、CD8+T(CD8+Tcells)细胞和Tregs细胞(Tregs)等T细胞亚型百分比与C57BL/6野生型小鼠基本一致(图13(B)和图15(B))。
淋巴结中白细胞亚型和T细胞亚型检测结果分别如图14(A)和图14(B)所示,从图中可以看出,TGFBR2基因人源化纯合子小鼠淋巴结中B细胞、T细胞、NK细胞等白细胞亚型与C57BL/6野生型小鼠基本一致,CD4+T细胞、CD8+T细胞和Tregs细胞等T细胞亚型百分比与C57BL/6野生型小鼠基本一致。表明TGFBR2基因的人源化改造没有影响小鼠体内脾脏、淋巴结和血液中白细胞和T细胞的分化、发育和分布。
鉴于人TGFBR2具有多种亚型或转录本,本文所述的方法可应用于其它亚型或转录本。
小鼠TGFBR2基因(NCBI Gene ID:21813,Primary source:MGI:98729,UniProt:Q62312-1,位于9号染色体NC_000075.7的第115916763至116004431位,基于转录本NM_009371.3及其编码蛋白NP_033397.3(SEQ ID NO:43))和人TGFBR2基因(NCBI Gene ID:7048,Primary source:HGNC:11773,UniProt ID:P37173-2,位于3号染色体NC_000003.12的第30606472至30694142位,基于转录本NM_001024847.2及其编码蛋白NP_001020018.1(SEQ ID NO:44))对比示意图如图8所示。
为了达到本发明的目的,可在小鼠内源TGFBR2基因座引入编码人TGFBR2蛋白的核苷酸序列,使得该小鼠表达人或人源化TGFBR2蛋白。具体来说,用基因编辑技术,在小鼠TGFBR2基因调节元件的控制下,用人TGFBR2基因组编码区替换小鼠TGFBR2基因组编码区,或用包含人TGFBR2基因的1号外显子部分序列至5号外显子部分序列约64kb替换小鼠1号外显子的部分序列至5号外显子的部分序列约64kb,得到人源化TGFBR2基因座示意图如图9所示,实现对小鼠TGFBR2基因的人源化改造。
设计如图10所示的打靶策略,图中显示了靶向载体上含有小鼠TGFBR2基因上游和下游的同源臂序列,以及包含人TGFBR2序列的A4片段。其中,上游同源臂序列(5’同源臂,SEQ ID NO:45)与NCBI登录号为NC_000075.7的第116004022至116007886位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:46)与NCBI登录号为NC_000075.7的第115933903至115939354位核苷酸序列相同。A4片段上人TGFBR2的核苷酸序列(SEQ ID NO:47)与NCBI登录号为NC_000003.12的第30606968至30671654位核苷酸序列相同;人TGFBR2序列上游与小鼠的连接设计为:
Figure BDA0003908354980000551
Figure BDA0003908354980000552
Figure BDA0003908354980000553
其中序列“CGTT”中最后一个“T”是小鼠最后一个核苷酸,序列
Figure BDA0003908354980000554
中“C”是人第一个核苷酸。人TGFBR2序列下游与小鼠的连接设计为
Figure BDA0003908354980000555
Figure BDA0003908354980000556
其中序列“CAAT”中“T”是人的最后一个核苷酸,序列
Figure BDA0003908354980000557
中第一个“C”是小鼠序列的第一个核苷酸。
靶向载体上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neo cassette)。其中Neo盒5’端与人基因的连接设计为:
Figure BDA0003908354980000558
Figure BDA0003908354980000559
其中序列“GGGA”中“A”是人的最后一个核苷酸,序列“GGAT”的第一个“G”是Neo盒的第一个核苷酸;Neo盒3’端与人基因的连接设计为
Figure BDA00039083549800005510
Figure BDA00039083549800005511
Figure BDA00039083549800005512
其中序列
Figure BDA00039083549800005513
中最后一个“C”是Neo盒的最后一个核苷酸,序列“AAGA”中第一个“A”是人的第一个核苷酸。此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。改造后的人源化小鼠TGFBR2的mRNA序列如SEQ ID NO:52所示,表达的蛋白序列如SEQ ID NO:53所示。后续步骤可参照实施例1中胚胎干细胞制备TGFBR2人源化小鼠的方法,获得可稳定传代,且无随机插入的TGFBR2基因人源化的基因工程小鼠(V4)。
实施例3药效验证
利用本方法制得的TGFBR2人源化小鼠可以用于评估靶向人TGFBR2的抗体药物的药效。例如,取TGFBR2人源化纯合子小鼠皮下接种结肠癌细胞MC38,待肿瘤体积生长到约100mm3后根据肿瘤体积分为对照组或治疗组,治疗组注射靶向人TGFBR2的抗体药物,对照组注射等体积的生理盐水。定期测量肿瘤体积并称量小鼠的体重,通过比较小鼠体重变化和肿瘤体积,可有效评估抗体药物在人源化TGFBR2小鼠体内安全性和体内药效。
实施例4双重人源化或多重双人源化小鼠的制备
利用本方法或制得的TGFBR2小鼠还可以制备双人源化或多人源化小鼠模型。如,前述实施例1或2中,囊胚显微注射使用的胚胎干细胞可选择来源于含有PD-1、PD-L1、CD27、CD40、CD73、CD226、OX40、4-1BB、LAG3、TIGIT等其它基因修饰的小鼠,或者,也可在人源化TGFBR2小鼠的基础上,利用分离小鼠ES胚胎干细胞和基因重组打靶技术,获得TGFBR2与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将本方法得到的TGFBR2小鼠纯合子或杂合子与其它基因修饰的纯合或杂合小鼠交配,对其后代进行筛选,根据孟德尔遗传规律,可有一定机率得到人源化TGFBR2与其它基因修饰的双基因或多基因修饰的杂合小鼠,再将杂合子相互交配可以得到双基因或多基因修饰的纯合子,利用这些双基因或多基因修饰的小鼠可以进行靶向人TGFBR2和其它基因调节剂的体内药效验证等。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。

Claims (33)

1.一种TGFBR2基因人源化的非人动物的构建方法,其特征在于,所述的非人动物体内表达人或人源化TGFBR2蛋白,所述的非人动物基因组包含人或人源化TGFBR2基因。
2.根据权利要求1所述的构建方法,其特征在于,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的全部或部分,优选的,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的信号肽、胞外区、跨膜区和/或胞质区的全部或部分;
进一步优选的,所述人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分;更优选的,所述的人TGFBR2的胞外区的部分包含人TGFBR2胞外区至少50个连续氨基酸;更进一步优选的,包含SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示的氨基酸序列,或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ IDNO:2第23-166位或SEQ ID NO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列,
进一步优选的,所述的人源化TGFBR2蛋白包含人TGFBR2信号肽的全部或部分;更优选的,包含SEQ ID NO:2的第1-22位所示的氨基酸序列,或者,包含与SEQ ID NO:2的第1-22位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:2的第1-22位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2的第1-22位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
3.根据权利要求1或2所述的构建方法,其特征在于,所述的人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分;
优选的,包含人TGFBR2胞外区至少50个连续氨基酸,优选的,所述的人源化TGFBR2蛋白还包含非人动物TGFBR2蛋白的胞外区的部分、跨膜区的全部、信号肽的全部和胞质区的全部;
优选的,所述的人源化TGFBR2蛋白包含SEQ ID NO:43第1-28和183-592位所示的氨基酸序列,或者,包含与SEQ ID NO:43第1-28和183-592位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:43第1-28和183-592位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:43第1-28和183-592位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
4.根据权利要求1-3任一所述的人源化TGFBR2蛋白,其特征在于,所述的人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分和信号肽的全部或部分,优选的,所述的人源化TGFBR2蛋白还包含非人动物TGFBR2的跨膜区的部分和胞质区的全部;
优选的,所述的人源化TGFBR2蛋白包含SEQ ID NO:1的第167-567位所示的氨基酸序列,或者,包含与SEQ ID NO:1的第167-567位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:1的第167-567位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:1的第167-567位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
5.根据权利要求1-4任一所述的人源化TGFBR2蛋白,其特征在于,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的任一种:
A)SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列;
B)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
或者,
D)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列,
优选的,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的任一种:
a)为SEQ ID NO:13或SEQ ID NO:53的全部或部分;
b)与SEQ ID NO:13或SEQ ID NO:53的氨基酸序列同一性至少为60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)与SEQ ID NO:13或SEQ ID NO:53的氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
d)与SEQ ID NO:13或SEQ ID NO:53所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
6.根据权利要求1-5任一所述的构建方法,其特征在于,所述的非人动物的基因组中包含人TGFBR2基因的全部或部分;优选的,包含人TGFBR2基因的1号至8号外显子的全部或部分,进一步优选包含人TGFBR2基因的1号至8号外显子中的一种、两种或三种以上的组合,更进一步优选包含人TGFBR2基因的1号至5号外显子的全部或部分。
7.根据权利要求6所述的构建方法,其特征在于,所述的非人动物的基因组中包含人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分,其中,1号外显子的部分至少包含5bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列,优选的,所述的人源化TGFBR2基因还包含非人动物TGFBR2基因的部分,进一步优选包含非人动物TGFBR2基因的1号外显子的部分、5号外显子的部分和6号至8号外显子的全部。
8.根据权利要求6所述的构建方法,其特征在于,所述的非人动物的基因组中包含人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分,其中,1号外显子的部分至少包含50bp的核苷酸序列,4号外显子的部分至少包含20bp的核苷酸序列,优选的,所述的人源化TGFBR2基因还包含非人动物TGFBR2基因的部分,优选包含非人动物TGFBR2基因的1号外显子的全部或部分、2号外显子的全部或部分、4号外显子的部分、5号外显子的全部、6号外显子的全部、7号外显子的全部。
9.根据权利要求6-8任一所述的构建方法,其特征在于,所述的非人动物的基因组中包含SEQ ID NO:7或SEQ ID NO:47所示核苷酸序列;或者,包含与SEQ ID NO:7或SEQ ID NO:47所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:7或SEQ ID NO:47所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:7或SEQ ID NO:47所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
10.根据权利要求1-9任一所述的构建方法,其特征在于,人TGFBR2基因的部分或人源化TGFBR2基因在非人动物体内通过内源调控元件进行调控。
11.根据权利要求1-10任一所述的构建方法,其特征在于,所述的构建方法包括将供体核苷酸序列导入非人动物TGFBR2基因座上,所述的供体核苷酸序列包含下列组中的任一种:
A)编码人或人源化TGFBR2蛋白的核苷酸序列;
B)编码人TGFBR2蛋白的信号肽、胞外区、跨膜区和/或胞质区的核苷酸序列的全部或部分;优选包含编码胞外区的全部或部分的核苷酸序列;进一步优选还包含编码信号肽的核苷酸序列;更进一步优选的,包含编码SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位氨基酸的核苷酸序列;再进一步优选的,包含编码SEQ ID NO:13或SEQ ID NO:53的核苷酸序列;
C)人或人源化TGFBR2基因的核苷酸序列;或,
D)人TGFBR2基因的1号至8号外显子的全部或部分,优选的,人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分,其中,1号外显子的部分至少包含5bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列;再进一步优选的,包含SEQ IDNO:47所示的核苷酸序列;
E)人TGFBR2基因的1号至7号外显子的全部或部分,优选的,人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分,其中,1号外显子的部分包含编码区的核苷酸序列,4号外显子的部分包含编码胞外区的核苷酸序列;更进一步优选的,包含SEQ ID NO:7所示的核苷酸序列。
12.根据权利要求11所述的构建方法,其特征在于,所述的导入为替换或插入。
13.根据权利要求12所述的构建方法,其特征在于,所述的导入非人动物TGFBR2基因座为替换非人动物的TGFBR2基因的1号至8号外显子的全部或部分;
进一步优选为替换非人动物TGFBR2基因的相应位置,更进一步优选为1号至5号外显子的全部或部分;或者,
进一步优选为替换非人动物TGFBR2基因的2号外显子的全部或部分。
14.根据权利要求12所述的构建方法,其特征在于,所述的导入非人动物TGFBR2基因座为插入非人动物TGFBR2基因的1号至8号外显子的全部或部分,优选为插入非人动物TGFBR2基因的1号外显子起始密码子上。
15.根据权利要求1-14任一所述的构建方法,其特征在于,使用靶向载体进行非人动物的构建;优选的,所述的靶向载体包括供体核苷酸序列,所述的供体核苷酸序列包含下列组中的任一种:
A)编码人或人源化TGFBR2蛋白的核苷酸序列;
B)编码人TGFBR2蛋白的信号肽、胞外区、跨膜区和/或胞质区的核苷酸序列的全部或部分;优选包含编码胞外区的全部或部分的核苷酸序列;进一步优选还包含编码信号肽的核苷酸序列;更进一步优选的,包含编码SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位氨基酸的核苷酸序列;再进一步优选的,包含编码SEQ ID NO:13或SEQ ID NO:53的核苷酸序列;
C)人或人源化TGFBR2基因的核苷酸序列;或,
D)人TGFBR2基因的1号至8号外显子的全部或部分,优选的,人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分,其中,1号外显子的部分至少包含5bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列;再进一步优选的,包含SEQ IDNO:47所示的核苷酸序列;
E)人TGFBR2基因的1号至7号外显子的全部或部分,优选的,人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分,其中,1号外显子的部分包含编码区的核苷酸序列,4号外显子的部分包含编码胞外区的核苷酸序列;更进一步优选的,包含SEQ ID NO:7所示的核苷酸序列。
16.根据权利要求15所述的构建方法,其特征在于,所述的靶向载体还包含5’臂和/或3’臂;所述的5’臂与NCBI登录号为NC_000075.7至少具有90%同源性的核苷酸;优选的,所述5’臂序列如SEQ ID NO:5、SEQ ID NO:18、SEQ ID NO:37或SEQ ID NO:45所示;
所述的3’臂与NCBI登录号为NC_000075.7至少具有90%同源性的核苷酸;更进一步优选的,所述的3’臂序列如SEQ ID NO:6、SEQ ID NO:19、SEQ ID NO:38或SEQ ID NO:46所示。
17.根据权利要求1-16任一所述的构建方法,其特征在于,所述的构建方法进一步包括将TGFBR2基因人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物,优选的,所述的其他基因选自PD-1、PD-L1、CD27、CD40、CD73、CD226、OX40、4-1BB、LAG3、TIGIT中的至少一种,
优选的,所述的人源化TGFBR2基因和/或其他基因对于内源被修饰基因座为纯合的;
优选的,所述的人源化TGFBR2基因和/或其他基因对于内源被修饰基因座为杂合的。
18.一种靶向载体,其特征在于,所述的靶向载体包含供体核苷酸序列,优选的,所述的供体核苷酸序列包含下列组中的一种:
A)编码人或人源化TGFBR2蛋白的核苷酸序列;
B)编码人TGFBR2蛋白的信号肽、胞外区、跨膜区和/或胞质区的核苷酸序列的全部或部分;优选包含编码胞外区的全部或部分的核苷酸序列;进一步优选还包含编码信号肽的核苷酸序列;更进一步优选的,包含编码SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位氨基酸的核苷酸序列;再进一步优选的,包含编码SEQ ID NO:13或SEQ ID NO:53的核苷酸序列;
C)人或人源化TGFBR2基因的核苷酸序列;或,
D)人TGFBR2基因的1号至8号外显子的全部或部分,优选的,人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分,其中,1号外显子的部分至少包含5bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列,更进一步优选的,包含SEQ IDNO:47所示核苷酸序列,或者,包含与SEQ ID NO:47所示核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:47所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ IDNO:47所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
E)人TGFBR2基因的1号至7号外显子的全部或部分,优选的,人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分,其中,1号外显子的部分至少包含50bp的核苷酸序列,4号外显子的部分至少包含20bp的核苷酸序列,更进一步优选的,包含SEQ ID NO:7和/或31所示核苷酸序列,或者,包含与SEQ ID NO:7和/或31所示核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:7和/或31所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:7和/或31所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
19.根据权利要求18所述的靶向载体,其特征在于,所述的靶向载体包含SEQ ID NO:3、SEQ ID NO:36或SEQ ID NO:54所示核苷酸序列,或者,包含与SEQ ID NO:3、SEQ ID NO:36或SEQ ID NO:54所示核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:3、SEQ ID NO:36或SEQ ID NO:54所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:3、SEQ ID NO:36或SEQ ID NO:54所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列,
优选的,所述的靶向载体还包含5’臂和/或3’臂;
所述的5’臂与NCBI登录号为NC_000075.7至少具有90%同源性的核苷酸;优选的,所述5’臂序列如SEQ ID NO:5、SEQ ID NO:18、SEQ ID NO:37或SEQ ID NO:45所示;
所述的3’臂与NCBI登录号为NC_000075.7至少具有90%同源性的核苷酸;更进一步优选的,所述的3’臂序列如SEQ ID NO:6、SEQ ID NO:19、SEQ ID NO:38或SEQ ID NO:46所示。
20.一种人源化TGFBR2蛋白,其特征在于,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的部分。
21.根据权利要求20所述的人源化TGFBR2蛋白,其特征在于,所述的人源化TGFBR2蛋白包含人TGFBR2蛋白的信号肽、胞外区、跨膜区和/或胞质区;
优选的,所述人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分;进一步优选的,所述的人TGFBR2的胞外区的部分包含人TGFBR2胞外区至少50个连续氨基酸;再进一步优选的,包含SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示的氨基酸序列,或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2第23-166位或SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列,
优选的,其特征在于,所述的人源化TGFBR2蛋白包含人TGFBR2信号肽的全部或部分;进一步优选的,包含SEQ ID NO:2的第1-22位所示的氨基酸序列,或者,包含与SEQ ID NO:2的第1-22位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:2的第1-22位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2的第1-22位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
22.根据权利要求20-21任一所述的人源化TGFBR2蛋白,其特征在于,所述的人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分;
优选的,包含人TGFBR2胞外区至少50个连续氨基酸,进一步优选的,所述的人源化TGFBR2蛋白还包含非人动物TGFBR2蛋白的胞外区的部分、跨膜区的全部、信号肽的全部和胞质区的全部;
更优选的,所述的人源化TGFBR2蛋白包含SEQ ID NO:43第1-28和183-592位所示的氨基酸序列,或者,包含与SEQ ID NO:43第1-28和183-592位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:43第1-28和183-592位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:43第1-28和183-592位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
23.根据权利要求21-22任一所述的人源化TGFBR2蛋白,其特征在于,所述的人源化TGFBR2蛋白包含人TGFBR2的胞外区的全部或部分和信号肽的全部或部分,优选的,所述的人源化TGFBR2蛋白还包含非人动物TGFBR2的跨膜区的部分和胞质区的全部;
进一步优选的,所述的人源化TGFBR2蛋白包含SEQ ID NO:1的第167-567位所示的氨基酸序列,或者,包含与SEQ ID NO:1的第167-567位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:1的第167-567位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:1的第167-567位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
24.根据权利要求20-23任一所述的人源化TGFBR2蛋白,其特征在于,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的任一种:
A)SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列;
B)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
或者,
D)与SEQ ID NO:2第1-166位或SEQ ID NO:44第29-182位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列,
优选的,所述的人源化TGFBR2蛋白的氨基酸序列包含下列组中的任一种:
a)为SEQ ID NO:13或SEQ ID NO:53的全部或部分;
b)与SEQ ID NO:13或SEQ ID NO:53的氨基酸序列同一性至少为60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)与SEQ ID NO:13或SEQ ID NO:53的氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,
d)与SEQ ID NO:13或SEQ ID NO:53所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
25.一种人源化TGFBR2基因,其特征在于,所述的人源化TGFBR2基因包含人TGFBR2基因的部分,优选的,所述的人源化TGFBR2基因编码权利要求20-24任一所述的人源化TGFBR2蛋白。
26.根据权利要求25所述的人源化TGFBR2基因,其特征在于,所述的人源化TGFBR2基因包含人TGFBR2基因的1号至8号外显子的全部或部分,优选的,包含人TGFBR2基因的1号至5号外显子的全部或部分。
27.根据权利要求25-26任一所述的人源化TGFBR2基因,其特征在于,所述的人源化TGFBR2基因包含人TGFBR2基因的1号外显子的部分、2号至4号外显子的全部和5号外显子的部分,其中,1号外显子的部分至少包含5bp的核苷酸序列,5号外显子的部分至少包含5bp的核苷酸序列,优选的,所述的人源化TGFBR2基因还包含非人动物TGFBR2基因的部分,优选包含非人动物TGFBR2基因的1号外显子的部分、5号外显子的部分和6号至8号外显子的全部。
28.根据权利要求25-26任一所述的人源化TGFBR2基因,其特征在于,所述的人源化TGFBR2基因包含人TGFBR2基因的1号外显子的部分、2号外显子的全部、3号外显子的全部和4号外显子的部分,其中,1号外显子的部分至少包含50bp的核苷酸序列,4号外显子的部分至少包含20bp的核苷酸序列,优选的,所述的人源化TGFBR2基因还包含非人动物TGFBR2基因的部分,优选包含非人动物TGFBR2基因的1号外显子的全部或部分、2号外显子的全部或部分、4号外显子的部分、5号外显子的全部、6号外显子的全部、7号外显子的全部;进一步优选还包含非人动物TGFBR2基因的1号至7号外显子的全部或部分。
29.根据权利要求25-28任一所述的人源化TGFBR2基因,其特征在于,所述的人源化TGFBR2基因包含SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:36、SEQ ID NO:47或SEQ ID NO:54所示核苷酸序列;或者,包含与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:36、SEQ ID NO:47或SEQ ID NO:54所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:36、SEQ IDNO:47或SEQ ID NO:54所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:36、SEQ ID NO:47或SEQ IDNO:54所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
30.根据权利要求25-29任一所述的人源化TGFBR2基因,其特征在于,所述的人源化TGFBR2基因的核苷酸序列转录的mRNA包含下列组中的一种:
(a)为SEQ ID NO:12、SEQ ID NO:42或SEQ ID NO:52所示核苷酸序列的全部或部分;
(b)与SEQ ID NO:12、SEQ ID NO:42或SEQ ID NO:52所示核苷酸序列的同一性至少为60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(c)与SEQ ID NO:12、SEQ ID NO:42或SEQ ID NO:52所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或,
(d)与SEQ ID NO:12、SEQ ID NO:42或SEQ ID NO:52所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
31.根据权利要求20-24任一所述的人源化TGFBR2蛋白、权利要求25-30任一所述的人源化TGFBR2基因、权利要求1-17任一所述的构建方法,其特征在于,所述非人动物为非人哺乳动物,优选的,所述非人哺乳动物为啮齿类动物,进一步优选的,所述的啮齿类动物为大鼠或小鼠。
32.一种细胞、组织或器官,其特征在于,所述的细胞、组织或器官表达权利要求20-24任一所述的人源化TGFBR2蛋白,或者,所述的细胞、组织或器官的基因组中包含权利要求25-30任一所述的人源化TGFBR2基因,或者,所述的细胞、组织或器官来源于权利要求1-17任一所述的构建方法获得的非人动物,
优选的,所述的组织为一种荷瘤后的瘤组织。
33.一种权利要求20-24任一所述的人源化TGFBR2蛋白、权利要求25-30任一所述的人源化TGFBR2基因、权利要求1-17任一所述的构建方法获得的非人动物、权利要求32所述的细胞、组织或器官的应用,其特征在于,所述的应用包含:
A)涉及人类细胞的与TGFBR2相关的免疫过程的产品开发中的应用;
B)作为药理学、免疫学、微生物学和医学研究的与TGFBR2相关的模型系统中的应用;
C)涉及生产和利用动物实验疾病模型用于与TGFBR2相关的病原学研究和/或用于开发诊断策略和/或用于开发治疗策略中的应用;
D)在体内研究人TGFBR2信号通路调节剂的筛选、药效检测、评估疗效、验证或评价中的应用;或者,
E)研究TGFBR2基因功能,研究针对人TGFBR2靶位点的药物、药效,研究与TGFBR2相关的免疫相关疾病药物以及抗肿瘤药物方面的应用。
CN202211326865.8A 2021-10-25 2022-10-25 Tgfbr2基因人源化非人动物及其构建方法和应用 Pending CN115918611A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2021112435080 2021-10-25
CN202111243508 2021-10-25

Publications (1)

Publication Number Publication Date
CN115918611A true CN115918611A (zh) 2023-04-07

Family

ID=85825793

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211326865.8A Pending CN115918611A (zh) 2021-10-25 2022-10-25 Tgfbr2基因人源化非人动物及其构建方法和应用

Country Status (2)

Country Link
CN (1) CN115918611A (zh)
WO (1) WO2023072081A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220015343A1 (en) * 2018-12-17 2022-01-20 Biocytogen Pharmaceuticals (Beijing) Co., Ltd. Genetically modified non-human animal with human or chimeric genes
CN114025788A (zh) * 2019-05-01 2022-02-08 朱诺治疗学股份有限公司 从经修饰的tgfbr2基因座表达重组受体的细胞、相关多核苷酸和方法

Also Published As

Publication number Publication date
WO2023072081A1 (en) 2023-05-04

Similar Documents

Publication Publication Date Title
CN108588126B (zh) Cd47基因人源化改造动物模型的制备方法及应用
CN107815467B (zh) 人源化基因改造动物模型的制备方法及应用
CN111808882B (zh) Il7r基因人源化改造的动物模型的构建方法及其应用
CN111793647B (zh) Cd226基因人源化非人动物的构建方法及应用
CN113429472B (zh) Cd94和nkg2a基因人源化的非人动物及其制备方法和应用
CN107955817B (zh) 人源化基因改造动物模型的制备方法及应用
CN112779284B (zh) Thpo基因人源化的非人动物的构建方法及应用
CN113651892A (zh) Tlr8基因人源化的非人动物及其构建方法和应用
CN114751973B (zh) Siglec15基因人源化非人动物的构建方法和应用
CN113881681B (zh) Ccr8基因人源化非人动物及其构建方法和应用
CN115785251A (zh) Tfr1基因人源化非人动物及其构建方法和应用
CN115011606A (zh) Cd37基因人源化非人动物的构建方法及应用
CN112501206B (zh) Psma基因人源化非人动物的构建方法及应用
CN112553252B (zh) Tnfr2基因人源化的非人动物的构建方法和应用
CN115918611A (zh) Tgfbr2基因人源化非人动物及其构建方法和应用
CN113388640B (zh) Ccr4基因人源化的非人动物及其构建方法和应用
CN117384960B (zh) 一种tl1a基因人源化非人动物及其构建方法和应用
CN115948464A (zh) 一种trem1基因人源化的非人动物及其构建方法和应用
WO2024012578A1 (zh) 一种tlr7和/或tlr8基因人源化修饰的非人动物
CN115873902A (zh) 一种cd200和/或cd200r基因人源化的非人动物及其构建方法和应用
CN116463376A (zh) Baffr和/或baff基因人源化非人动物的构建方法及应用
CN116083483A (zh) Il21基因人源化非人动物及其构建方法和应用
CN115772541A (zh) Cd98hc基因人源化非人动物的构建方法及应用
CN115997729A (zh) Nkp46基因人源化非人动物及其构建方法和应用
CN116420680A (zh) Igf1r基因人源化非人动物及其构建方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination