CN114853871A - Csf1和/或csf1r基因人源化的非人动物及其构建方法和应用 - Google Patents

Csf1和/或csf1r基因人源化的非人动物及其构建方法和应用 Download PDF

Info

Publication number
CN114853871A
CN114853871A CN202210415419.8A CN202210415419A CN114853871A CN 114853871 A CN114853871 A CN 114853871A CN 202210415419 A CN202210415419 A CN 202210415419A CN 114853871 A CN114853871 A CN 114853871A
Authority
CN
China
Prior art keywords
csf1
ser
humanized
exon
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210415419.8A
Other languages
English (en)
Other versions
CN114853871B (zh
Inventor
吕锐利
张淑金
赵素曼
刘重慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baccetus Beijing Pharmaceutical Technology Co ltd
Original Assignee
Baccetus Beijing Pharmaceutical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baccetus Beijing Pharmaceutical Technology Co ltd filed Critical Baccetus Beijing Pharmaceutical Technology Co ltd
Publication of CN114853871A publication Critical patent/CN114853871A/zh
Application granted granted Critical
Publication of CN114853871B publication Critical patent/CN114853871B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • C07K14/53Colony-stimulating factor [CSF]
    • C07K14/535Granulocyte CSF; Granulocyte-macrophage CSF
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • C07K14/53Colony-stimulating factor [CSF]
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Knock-in vertebrates, e.g. humanised vertebrates
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/15Animals comprising multiple alterations of the genome, by transgenesis or homologous recombination, e.g. obtained by cross-breeding
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Environmental Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Genetics & Genomics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Toxicology (AREA)
  • Veterinary Medicine (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Animal Husbandry (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了一种CSF1和/或CSF1R基因人源化的非人动物及其构建方法,一种人源化CSF1和/或CSF1R蛋白、人源化CSF1和/或CSF1R基因、CSF1和/或CSF1R基因的靶向载体,以及上述构建方法获得的非人动物及其在生物医药领域的应用,利用同源重组的方式将人CSF1和/或CSF1R基因的全部或部分核苷酸序列导入非人动物基因组中,该动物体内能正常表达人或人源化CSF1和/或CSF1R蛋白,可以作为人CSF1和/或CSF1R信号机理研究、肿瘤及免疫相关疾病药物筛选的动物模型,对免疫靶点的新药研发具有重要的应用价值。

Description

CSF1和/或CSF1R基因人源化的非人动物及其构建方法和应用
技术领域
本发明属于动物基因工程和基因遗传修饰领域,具体地说,涉及一种CSF1和/或CSF1R基因人源化的非人动物及其构建方法和在生物医药领域的应用。
背景技术
细胞的分化、发育、增殖乃至活化,均受到多个细胞因子信号的协同作用,其中巨噬细胞集落刺激因子M-CSF(Macrophage-colony stimulating factor,又称colony-stimulating factor 1,CSF1)是骨髓祖细胞分化为单核细胞谱系细胞(monocyte lineagecells),如巨噬细胞,破骨细胞和小胶质细胞所必须的细胞因子,在单核巨噬细胞的存活、增殖、分化及维持活性促进造血功能中具有重要作用。除了此之外,已有研究表明CSF1在破骨细胞的分化、雌性生殖道细胞的分化、胎盘的形成及血管和淋巴的发育过程也有重要作用,并做为促炎因子参与炎性反应,是肿瘤和炎症的有效标志。
CSF1R(Colony Stimulating Factor 1Receptor),又称CD115、C-FMS、FIM2,是一种单链酪氨酸激酶跨膜受体,属于Ⅲ型蛋白酪氨酸激酶受体家族(RTKⅢ),由巨噬细胞、成纤维细胞、上皮细胞和肿瘤细胞产生,能调节巨噬细胞的形态和运动、促进单核吞噬细胞的增殖和分化,而且还是炎症病灶的趋化因子,在免疫应答中发挥重要作用。CSF1R被CSF1激活后会形成同源二聚体,导致其激酶活性的活化,进而激活包括MAPK/ERK在内的许多细胞内信号通路。当ERK磷酸化时,Elk1(ETS转录因子家族成员)与血清应答元件(SRF)形成复合物,导致大量有丝分裂诱导基因的表达。这种相互作用可以被许多癌症类型所利用以逃避免疫系统监控,例如弥漫型腱鞘膜巨细胞瘤(dt-GCT),通过过度表达细胞因子CSF1,驱动肿瘤相关巨噬细胞(TAMs)的发育和存活,进而抑制肿瘤的局部免疫反应。目前已在乳腺癌、卵巢癌、鼻咽癌等多种恶性肿瘤中检测到CSF1R的异常表达。此外,CSF1R信号通路激活的巨噬细胞群还与炎症和骨病等多种疾病的病理学相关。Xu-Ming Dai等人研究发现CSF1R基因敲除可导致小鼠发生骨质疏松(Xu-Ming Dai et al.Blood.2002,99(1):111-120.);X.Hu等人报道CSF1R在类风湿性关节炎的组织和细胞中高表达,可促进类风湿关节炎滑膜细胞(RA-FLS)增殖,抑制细胞凋亡并加速细胞周期(X.Hu.etal.Clinical&ExperimentalImmunology.2019,195(2):237-250.)。
随着基因工程技术的不断发展和成熟,用人类基因替代或置换动物的同源性基因已经实现,通过这种方式开发人源化实验动物模型(humanized animal model)是动物模型未来的发展方向。其中基因人源化动物模型,即利用基因编辑技术,用人正常或突变基因替换动物基因组的同源基因,可建立更接近人类生理或疾病特征的正常或突变基因动物模型。基因人源化动物不但本身具有重要应用价值,如通过基因人源化可改进和提升细胞或组织移植人源化动物模型。更重要的是,由于人类基因片段的插入,动物体内可表达或部分表达人源化蛋白,可作为仅能识别人蛋白序列的药物的靶点,为在动物水平进行抗人抗体及其它药物的筛选提供了可能。然而,由于动物与人类在生理学及病理学方面存在差异,加上基因(即遗传因子)的复杂性,如何能构建出“有效”的人源化动物模型用于新药研发仍是最大的挑战(Scheer N.et al.Drug Discov Today;18(23-24):1200-11,2013)。
鉴于CSF1/CSF1R信号通路在免疫治疗领域具有巨大应用价值,为进一步的研究相关的生物学特性,提高临床前期的药效试验的有效性,提高研发成功率,使临床前期的试验更有效并使研发失败最小化,本领域急需开发涉及CSF1/CSF1R信号通路的非人动物模型。此外,本方法得到的非人动物还可与其它基因人源化非人动物交配得到多基因人源化动物模型,用于筛选和评估针对该信号通路的人用药及联合用药的药效研究。本发明在学术和临床研究中具有广阔的应用前景。
发明内容
本发明利用基因编辑技术,用人的正常或突变基因替换非人动物基因组的同源基因,建立更接近人类生理或疾病特征的正常或突变基因的非人动物。通过基因人源化可改进和提升细胞或组织移植,更重要的是,由于人类基因片段的插入,动物体内可表达或部分表达人源蛋白,可作为仅能识别人蛋白序列的药物的靶点,为在动物水平进行抗人抗体及其它药物的筛选提供了可能。
本发明的第一方面,提供了一种人源化CSF1蛋白,所述的人源化CSF1蛋白包含人CSF1蛋白的全部或部分和非人动物CSF1蛋白的部分。
优选的,所述的人源化CSF1蛋白包含人CSF1蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分。进一步优选的,所述的人源化CSF1蛋白包含人CSF1蛋白的跨膜区、胞质区和/或胞外区的全部或部分。
优选的,所述的非人动物CSF1蛋白的部分为非人动物CSF1蛋白的信号肽和/或胞外区。
在本发明的一个具体实施方式中,所述的人源化CSF1蛋白包含人CSF1蛋白胞外区的全部或部分,优选的,包含至少50个连续氨基酸的人CSF1蛋白胞外区,例如包含至少50、100、200、300、400、450、451、452、453、454、455、456、457、458、459、460、464个连续氨基酸的人CSF1蛋白胞外区,进一步优选的,包含459个连续氨基酸的人CSF1蛋白胞外区;优选的,包含N端去除0-5(例如0、1、2、3、4、5)个氨基酸的人CSF1蛋白胞外区,进一步优选的,包含N端去除5个氨基酸的人CSF1蛋白胞外区;更优选的,包含与SEQ ID NO:2的第38-496位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第38-496位所示的氨基酸序列;所述的人源化CSF1蛋白还包含人CSF1蛋白跨膜区的全部或部分,优选的,所述的跨膜区包含与SEQ ID NO:2的第497-517位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第497-517位所示氨基酸序列;所述的人源化CSF1蛋白还包含人CSF1蛋白胞质区的全部或部分,优选的,所述的胞质区包含与SEQ ID NO:2的第518-554位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第518-554位所示氨基酸序列。
优选的,所述的人源化CSF1蛋白包含人CSF1基因的1号至9号外显子编码的氨基酸序列的全部或部分。进一步优选的,包含1号至9号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合编码的氨基酸序列的全部或部分。更进一步优选的,包含2号至8号外显子编码的氨基酸序列的全部或部分。再进一步优选的,包含2号外显子的部分、3号外显子至7号外显子的全部和8号外显子的部分编码的氨基酸序列的全部或部分,其中,2号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、45、46、47、48、49、50、51、52、53、54、55、60、70、80、90、100、110、120、123bp的核苷酸序列,进一步优选的,包含51bp的核苷酸序列;优选的,2号外显子的部分包含编码胞外区去除N端1-5优选1、2、3、4、5更优选为编码胞外区去除N端5个氨基酸的2号外显子的核苷酸序列,8号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、46、47、48、49、50、56bp的核苷酸序列,进一步优选的,包含43bp的核苷酸序列;优选的,8号外显子的部分包含从8号外显子第一个核苷酸开始至终止密码子。最为优选的,所述的人源化CSF1蛋白包含与SEQ ID NO:5具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列编码的氨基酸序列或者SEQ ID NO:5编码的氨基酸序列。
优选的,所述人源化CSF1蛋白的信号肽来源于非人动物,所述人源化CSF1蛋白的胞外区至多0-5(例如0、1、2、3、4、5)个氨基酸序列来源于非人动物,其中,所述的人源化CSF1蛋白的胞外区包含非人动物CSF1蛋白胞外区N端0-5(例如0、1、2、3、4、5)个氨基酸序列,进一步优选的,包含非人动物CSF1蛋白胞外区N端5个氨基酸序列。
优选的,所述的人源化CSF1蛋白还包含非人动物CSF1基因编码的氨基酸序列的全部或部分,优选为非人动物CSF1基因的1号和/或9号外显子编码的氨基酸序列的全部或部分,进一步优选还包含2号外显子的部分和/或8号外显子的部分编码的氨基酸序列的全部或部分。
在本发明的一个具体实施方式中,所述的人源化CSF1蛋白的氨基酸序列包含下列组中的一种:
A)为SEQ ID NO:2的第38-554位氨基酸序列的全部或部分;
B)与SEQ ID NO:2的第38-554位氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:2的第38-554位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
D)与SEQ ID NO:2的第38-554位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化CSF1蛋白的氨基酸序列选自下列组中的一种:
I)为SEQ ID NO:10氨基酸序列的全部或部分;
II)与SEQ ID NO:10氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的氨基酸序列;
III)与SEQ ID NO:10所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
IV)与SEQ ID NO:10所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第二方面,提供了一种人源化CSF1基因,所述的人源化CSF1基因包含人CSF1基因的部分和非人动物CSF1基因的部分。
优选的,所述的人源化CSF1基因包含编码人CSF1蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列,其中,所述的胞外区包含人CSF1蛋白胞外区的全部或部分,优选的,包含至少50个连续氨基酸的人CSF1蛋白胞外区,例如包含至少50、100、200、300、400、450、451、452、453、454、455、456、457、458、459、460、464个连续氨基酸的人CSF1蛋白胞外区,进一步优选的,包含459个连续氨基酸的人CSF1蛋白胞外区;优选的,包含N端去除0-5(例如0、1、2、3、4、5)个氨基酸的人CSF1蛋白胞外区,进一步优选的,包含N端去除5个氨基酸的人CSF1蛋白胞外区;更优选的,包含与SEQ ID NO:2的第38-496位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第38-496位所示的氨基酸序列;所述的跨膜区包含人CSF1蛋白跨膜区的全部或部分,优选的,所述的跨膜区包含与SEQ ID NO:2的第497-517位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第497-517位所示氨基酸序列;所述的胞质区包含人CSF1蛋白胞质区的全部或部分,优选的,所述的胞质区包含与SEQ ID NO:2的第518-554位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第518-554位所示氨基酸序列。
优选的,所述的人源化CSF1基因编码上述的人源化CSF1蛋白。
优选的,所述的人源化CSF1基因包含人CSF1基因的1号至9号外显子的全部或部分。进一步优选的,包含1号至9号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合的全部或部分。更进一步优选的,包含2号至8号外显子的全部或部分。再进一步优选的,包含2号外显子的部分、3号外显子至7号外显子的全部和8号外显子的部分,优选还包含2-3号内含子和/或7-8号内含子,更优选的包含2-8号外显子之间的任一内含子,其中,2号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、45、46、47、48、49、50、51、52、53、54、55、60、70、80、90、100、110、120、123bp的核苷酸序列,进一步优选的,包含51bp的核苷酸序列;优选的,2号外显子的部分包含编码胞外区去除N端1-5优选1、2、3、4、5,更优选为编码胞外区去除N端5个氨基酸的2号外显子的核苷酸序列,8号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、46、47、48、49、50、56bp的核苷酸序列,进一步优选的,包含43bp的核苷酸序列;优选的,8号外显子的部分包含从8号外显子第一个核苷酸开始至终止密码子。
优选的,所述的非人动物CSF1基因的部分为非人动物CSF1基因的1号和/或9号外显子;进一步优选还包含非人动物2号外显子的部分和/或8号外显子的部分。
在本发明的一个具体实施方式中,所述的人源化CSF1基因包含与SEQ ID NO:6、7和/或8具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列,或者包含SEQ ID NO:6、7和/或8所示的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化CSF1基因包含下列组中的一种:
(A)为SEQ ID NO:5所示核苷酸序列的全部或部分;
(B)与SEQ ID NO:5所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(C)与SEQ ID NO:5所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(D)具有SEQ ID NO:5所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化CSF1基因转录的mRNA选自下列组中的一种:
(i)为SEQ ID NO:9所示核苷酸序列的全部或部分;
(ii)与SEQ ID NO:9所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)与SEQ ID NO:9所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)与SEQ ID NO:9所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化CSF1基因还包括特异性诱导物或阻遏物。进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-Off System/Tet-On System)或他莫昔芬系统(Tamoxifen System)。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第三方面,提供了一种靶向载体,所述的靶向载体包含人CSF1基因的部分。
优选的,所述的人CSF1基因的部分包含人CSF1基因的1号至9号外显子的全部或部分。进一步优选的,包含1号至9号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合。再进一步优选的,包含2号至8号外显子的全部或部分。更进一步优选的,包含2号外显子的部分、3号外显子至7号外显子的全部和8号外显子的部分,优选还包含2-3号内含子和/或7-8号内含子,更优选的包含2-8号外显子之间的任一内含子,其中,2号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、45、46、47、48、49、50、51、52、53、54、55、60、70、80、90、100、110、120、123bp的核苷酸序列,进一步优选的,包含51bp的核苷酸序列;优选的,2号外显子的部分包含编码胞外区去除N端1-5优选1、2、3、4、5,更优选为编码胞外区去除N端5个氨基酸的2号外显子的核苷酸序列,8号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、46、47、48、49、50、56bp的核苷酸序列,进一步优选的,包含43bp的核苷酸序列;优选的,8号外显子的部分包含从8号外显子第一个核苷酸开始至终止密码子。最为优选的,所述的靶向载体包含与SEQ IDNO:5具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者与SEQ ID NO:5所示核苷酸序列一致。
优选的,所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段,即5’臂,其选自非人动物CSF1基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的5’臂与NCBI登录号为NC_000069.7至少具有90%同源性的核苷酸。更进一步优选的,所述5’臂序列与SEQ ID NO:3至少具有90%同源性,或者如SEQ ID NO:3所示。和/或,所述的靶向载体还包含与待改变的转换区3’端同源的DNA片段,即3’臂,其选自非人动物CSF1基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的3’臂与NCBI登录号为NC_000069.7至少具有90%同源性的核苷酸。更进一步优选的,所述的3’臂序列与SEQ ID NO:4至少具有90%同源性,或者如SEQ ID NO:4所示。
优选的,所述的待改变的转换区位于非人动物CSF1基因座上。进一步优选的,位于CSF1基因的1号至9号外显子上。更进一步优选的,位于2号至8号外显子上。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
优选的,所述的靶向载体还包含标记基因。进一步优选的,所述标记基因为负筛选标记的编码基因。更进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。
在本发明的一个具体实施方式中,所述的靶向载体中还包括阳性克隆筛选的抗性基因。进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。
在本发明的一个具体实施方式中,所述的靶向载体中还包括特异性重组系统。进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统)。所述的特异性重组系统为具有两个Frt重组位点,分别同向连接在抗性基因的两侧。
本发明的第四方面,提供了一种包含上述靶向载体的细胞。
本发明的第五方面,提供了上述靶向载体,或者上述的细胞在CSF1基因修饰中的应用,优选的,所述的应用包括但不限于敲除、插入或替换。
本发明的第六方面,提供了一种CSF1基因人源化的非人动物的构建方法,所述的构建方法包括用包含人CSF1基因的部分核苷酸序列导入非人动物CSF1基因座,所述的非人动物体内表达人或人源化CSF1蛋白。
优选的,所述的人源化CSF1蛋白包括上述的人源化CSF1蛋白。
优选的,所述的非人动物的基因组中还包含人源化CSF1基因,所述的人源化CSF1基因包括上述的人源化CSF1基因。
优选的,所述的人CSF1基因的部分核苷酸序列包含人CSF1基因的1号至9号外显子的全部或部分核苷酸序列,进一步优选的,包含1号至9号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合的全部或部分核苷酸序列,再进一步优选的,包含2号至8号外显子的全部或部分核苷酸序列。最为优选的,包含2号外显子的部分、3号外显子至7号外显子的全部和8号外显子的部分,优选还包含2-3号内含子和/或7-8号内含子,更优选的包含2-8号外显子之间的任一内含子,其中,2号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、45、46、47、48、49、50、51、52、53、54、55、60、70、80、90、100、110、120、123bp的核苷酸序列,进一步优选的,包含51bp的核苷酸序列;优选的,2号外显子的部分包含编码胞外区去除N端1-5优选1、2、3、4、5,更优选为5个氨基酸的2号外显子的核苷酸序列,8号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、46、47、48、49、50、56bp的核苷酸序列,进一步优选的,包含43bp的核苷酸序列;优选的,8号外显子的部分包含从8号外显子第一个核苷酸开始至终止密码子。在本发明的一个具体实施方式中,包含与SEQ ID NO:5具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含SEQ ID NO:5所示的核苷酸序列。
优选的,所述的构建方法包括用包含编码人CSF1蛋白的全部或部分核苷酸序列导入非人动物CSF1基因座。进一步优选的,所述的构建方法包括用包含编码人CSF1蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列导入非人动物CSF1基因座;优选的,用包含编码人CSF1蛋白的跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列导入非人动物CSF1基因座,其中,所述的胞外区包含人CSF1蛋白胞外区的全部或部分,优选的,包含至少50个连续氨基酸的人CSF1蛋白胞外区,例如包含至少50、100、200、300、400、450、451、452、453、454、455、456、457、458、459、460、464个连续氨基酸的人CSF1蛋白胞外区,进一步优选的,包含459个连续氨基酸的人CSF1蛋白胞外区;优选的,包含N端去除0-5(例如0、1、2、3、4、5)个连续氨基酸的人CSF1蛋白胞外区,进一步优选的,包含N端去除5个连续氨基酸的人CSF1蛋白胞外区;更优选的,包含与SEQ ID NO:2的第38-496位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第38-496位所示的氨基酸序列;所述的跨膜区包含人CSF1蛋白跨膜区的全部或部分,优选的,所述的跨膜区包含与SEQ ID NO:2的第497-517位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第497-517位所示氨基酸序列;所述的胞质区包含人CSF1蛋白胞质区的全部或部分,优选的,所述的胞质区包含与SEQ ID NO:2的第518-554位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第518-554位所示氨基酸序列,更进一步优选的,用包含与编码SEQID NO:2的第38-554位的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者用包含编码SEQ ID NO:2的第38-554位的核苷酸序列导入非人动物CSF1基因座。
在本发明的一个具体实施方式中,用包含编码人CSF1蛋白的cDNA序列导入非人动物CSF1基因座。
在本发明的一个具体实施方式中,用包含编码人源化CSF1蛋白的核苷酸序列导入非人动物CSF1基因座。
在本发明的一个具体实施方式中,用包含人源化CSF1基因的核苷酸序列导入非人动物CSF1基因座。
优选的,本申请中所述的导入包括但不限于插入、替换或转基因,所述的替换优选为原位替换。
优选的,所述的插入或替换的位点为CSF1基因的内源调控元件之后。
优选的,所述的插入为首先破坏非人动物内源CSF1基因的编码框或者破坏插入序列之后的内源CSF1基因的编码框,随后进行插入操作。或者所述的插入步骤即可给内源CSF1基因造成移码突变又可以实现插入人源序列的步骤。
进一步优选的,可在插入序列中加入辅助序列(例如终止密码子或含有终止功能的序列等)或其他方法(例如,翻转序列,或敲除序列)使得插入位点后的非人动物内源CSF1蛋白不能正常表达。
优选的,所述的导入为替换或插入,在本发明的一个具体实施方式中,所述的导入非人动物CSF1基因座为替换非人动物相应区域,进一步优选的,非人动物CSF1基因的2号至8号外显子的全部或部分被替换,更进一步优选的,非人动物CSF1基因的2号外显子的部分、3号外显子至7号外显子的全部和8号外显子的部分被替换。
优选的,编码SEQ ID NO:1的第38-552位所示氨基酸的核苷酸序列被替换。
优选的,所述的非人动物是纯合或者杂合的。
优选的,所述非人动物的基因组中至少一个染色体上包含人源化CSF1基因。
优选的,所述的非人动物中至少一个细胞表达人或人源化CSF1蛋白。
优选的,使用基因编辑技术进行非人动物的构建,所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、规律成簇间隔短回文重复(CRISPR/Cas9)技术、锌指核酸酶(ZFN)技术、转录激活子样效应因子核酸酶(TALEN)技术、归巢核酸内切酶(兆碱基大范围核酶)或其他分子生物学技术。
优选的,使用上述的靶向载体进行非人动物的构建。
根据本发明的一些实施例,该构建方法进一步包括:将CSF1基因人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因为CSF1R、PD-1、PD-L1、IL6、IL3、IL15、CSF2、TPO和CD40中的至少一种基因修饰的非人动物。
优选的,所述的非人动物还表达人或人源化的CSF1R、PD-1、PD-L1、IL6、IL3、IL15、CSF2、TPO和CD40蛋白中的至少一种。
优选的,所述的多基因修饰的非人动物的基因组中修饰的多个基因中的每一个基因均对于内源被替换基因座为纯合或杂合的。
优选的,所述其他基因为CSF1R基因,所述的CSF1R基因为人源化CSF1R基因。
优选的,所述的非人动物包含人或人源化CSF1R基因,所述的构建方法包括用包含人CSF1R基因的部分核苷酸序列导入非人动物CSF1R基因座,所述的非人动物表达人或人源化CSF1R蛋白。
优选的,所述的人源化CSF1R蛋白包含人CSF1R蛋白的全部或部分。
优选的,所述的人源化CSF1R蛋白包含人CSF1R蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分。进一步优选的,所述的人源化CSF1R蛋白包含人CSF1R蛋白的胞外区的全部或部分。
优选的,所述的人源化CSF1R蛋白还包含非人动物CSF1R蛋白的部分,更优选为非人动物CSF1R蛋白的信号肽、跨膜区和/或胞质区。
在本发明的一个具体实施方式中,所述的人源化CSF1R蛋白包含的人CSF1R蛋白的胞外区的氨基酸序列包含与SEQ ID NO:35的第20-517位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者与SEQ ID NO:35的第20-517位所示氨基酸序列一致;信号肽、跨膜区和胞质区来源于非人动物。
优选的,所述的人源化CSF1R蛋白包含人CSF1R基因的1号至22号外显子编码的氨基酸序列的全部或部分。进一步优选的,包含1号至22号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合编码的氨基酸序列的全部或部分。更进一步优选的,包含3号至11号外显子编码的氨基酸序列的全部或部分。再进一步优选的,包含3号外显子的部分、4号外显子至10号外显子的全部和11号外显子的部分,其中,3号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、210、220、230、240、250、251、252、253、254、255、256、258bp的核苷酸序列,进一步优选的,包含250bp的核苷酸序列;3号外显子的部分包含编码胞外区的3号外显子的核苷酸序列,11号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、50、60、70、80、90、100、110、116bp的核苷酸序列,进一步优选的,包含41bp的核苷酸序列;11号外显子的部分包含编码胞外区的11号外显子的核苷酸序列。最为优选的,所述的人源化CSF1R蛋白包含与SEQ IDNO:38具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列编码的氨基酸序列或者SEQ ID NO:38编码的氨基酸序列。
优选的,所述的人源化CSF1R蛋白还包含非人动物CSF1R基因编码的氨基酸序列的全部或部分,优选为非人动物CSF1R基因的1号至2号外显子和/或12号至22号外显子编码的氨基酸序列的全部或部分,进一步优选还包含3号外显子的部分和/或11号外显子的部分编码的氨基酸序列的全部或部分。
在本发明的一个具体实施方式中,所述的人源化CSF1R蛋白的氨基酸序列包含下列组中的一种:
A)为SEQ ID NO:35的第20-517位氨基酸序列的全部或部分;
B)与SEQ ID NO:35的第20-517位氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:35的第20-517位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
D)与SEQ ID NO:35的第20-517位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化CSF1R蛋白的氨基酸序列选自下列组中的一种:
I)为SEQ ID NO:43氨基酸序列的全部或部分;
II)与SEQ ID NO:43氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
III)与SEQ ID NO:43所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
IV)与SEQ ID NO:43所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化CSF1R基因包含编码人CSF1R蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列。进一步优选的,包含编码人CSF1R蛋白胞外区的全部或部分核苷酸序列。更进一步优选的包含与编码SEQ ID NO:35的第20-517位的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:35的第20-517位的核苷酸序列。
优选的,所述的人源化CSF1R基因编码上述的人源化CSF1R蛋白。
优选的,所述的人源化CSF1R基因包含人CSF1R基因的1号至22号外显子的全部或部分。进一步优选的,包含1号至22号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合的全部或部分。更进一步优选的,包含3号至11号外显子的全部或部分。再进一步优选的,包含3号外显子的部分、4号外显子至10号外显子的全部和11号外显子的部分,优选还包含3-4号内含子和/或10-11号内含子,更优选的包含3-11号外显子之间的任一内含子,其中,3号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、210、220、230、240、250、251、252、253、254、255、256、258bp的核苷酸序列,进一步优选的,包含250bp的核苷酸序列;3号外显子的部分包含编码胞外区的3号外显子的核苷酸序列,11号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、50、60、70、80、90、100、110、116bp的核苷酸序列,进一步优选的,包含41bp的核苷酸序列;11号外显子的部分包含编码胞外区的11号外显子的核苷酸序列。
优选的,所述的人源化CSF1R基因还包含非人动物CSF1R基因的部分;优选为非人动物CSF1R基因的1号至2号外显子和/或12号至22号外显子,进一步优选还包含3号外显子的部分和/或11号外显子的部分。
在本发明的一个具体实施方式中,所述的人源化CSF1R基因包含与SEQ ID NO:39、40和/或41具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列,或者包含SEQ ID NO:39、40和/或41所示的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化CSF1R基因包含下列组中的一种:
(A)为SEQ ID NO:38所示核苷酸序列的全部或部分;
(B)与SEQ ID NO:38所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(C)与SEQ ID NO:38所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(D)具有SEQ ID NO:38所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化CSF1R基因转录的mRNA选自下列组中的一种:
(i)为SEQ ID NO:42所示核苷酸序列的全部或部分;
(ii)与SEQ ID NO:42所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)与SEQ ID NO:42所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)与SEQ ID NO:42所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的构建方法包括用包含编码人CSF1R蛋白的全部或部分核苷酸序列导入非人动物CSF1R基因座。进一步优选的,用包含编码人CSF1R蛋白胞外区的全部或部分核苷酸序列导入非人动物CSF1R基因座。更进一步优选的,用包含与编码SEQ ID NO:35的第20-517位的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者用包含编码SEQ ID NO:35的第20-517位的核苷酸序列导入非人动物CSF1R基因座。
优选的,所述的构建方法包括用包含人CSF1R基因的部分核苷酸序列导入非人动物CSF1R基因座。进一步优选的,用包含人CSF1R基因的1号至22号外显子的全部或部分核苷酸序列导入非人动物CSF1R基因座。更进一步优选的,用包含1号至22号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合的全部或部分核苷酸序列导入非人动物CSF1R基因座。再进一步优选的,用包含3号至11号外显子的全部或部分核苷酸序列导入非人动物CSF1R基因座。最为优选的,用包含3号外显子的部分、4号外显子至10号外显子的全部和11号外显子的部分,优选还包含3-4号内含子和/或10-11号内含子核苷酸序列导入非人动物CSF1R基因座,其中,3号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、210、220、230、240、250、251、252、253、254、255、256、257bp的核苷酸序列,进一步优选的,包含250bp的核苷酸序列;3号外显子的部分包含编码胞外区的3号外显子的核苷酸序列,11号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、50、60、70、80、90、100、110、115bp的核苷酸序列,进一步优选的,包含41bp的核苷酸序列;11号外显子的部分包含编码胞外区的11号外显子的核苷酸序列。在本发明的一个具体实施方式中,用包含与SEQ ID NO:38具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者用包含SEQ ID NO:38所示核苷酸序列导入非人动物CSF1R基因座。
在本发明的一个具体实施方式中,用包含编码人CSF1R蛋白的cDNA序列导入非人动物CSF1R基因座。
在本发明的一个具体实施方式中,用包含编码人源化CSF1R蛋白的核苷酸序列导入非人动物CSF1R基因座。
在本发明的一个具体实施方式中,用包含人源化CSF1R基因的核苷酸序列导入非人动物CSF1R基因座。
优选的,所述的插入或替换的位点为CSF1R基因的内源调控元件之后。
优选的,所述的插入为首先破坏非人动物内源CSF1R基因的编码框或者破坏插入序列之后的内源CSF1R基因的编码框,随后进行插入操作。或者所述的插入步骤即可给内源CSF1R基因造成移码突变又可以实现插入人源序列的步骤。
进一步优选的,可在插入序列中加入辅助序列(例如终止密码子或含有终止功能的序列等)或其他方法(例如,翻转序列,或敲除序列)使得插入位点后的非人动物内源CSF1R蛋白不能正常表达。
优选的,所述非人动物的基因组中至少一个染色体上包含人源化CSF1R基因。
优选的,所述的非人动物中至少一个细胞表达人或人源化CSF1R蛋白。
优选的,使用靶向载体进行非人动物的构建,其中,所述的靶向载体包含人CSF1R基因的部分。进一步优选的,包含人CSF1R基因的1号至22号外显子的全部或部分。更进一步优选的,包含1号至22号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合。再进一步优选的,包含3号至11号外显子的全部或部分。更进一步优选的,包含3号外显子的部分、4号外显子至10号外显子的全部和11号外显子的部分,优选还包含3-4号内含子和/或10-11号内含子核苷酸序列,其中,3号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、210、220、230、240、250、251、252、253、254、255、256、258bp的核苷酸序列,进一步优选的,包含250bp的核苷酸序列;3号外显子的部分包含编码胞外区的3号外显子的核苷酸序列,11号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、50、60、70、80、90、100、110、116bp的核苷酸序列,进一步优选的,包含41bp的核苷酸序列;11号外显子的部分包含编码胞外区的11号外显子的核苷酸序列。最为优选的,包含与SEQ ID NO:38具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者与SEQ ID NO:38所示核苷酸序列一致。
优选的,所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段,即5’臂,其选自非人动物CSF1R基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的5’臂与NCBI登录号为NC_000084.6至少具有90%同源性的核苷酸。更进一步优选的,所述5’臂序列与SEQ ID NO:36至少具有90%同源性,或者如SEQ ID NO:36所示。和/或,所述的靶向载体还包含与待改变的转换区3’端同源的DNA片段,即3’臂,其选自非人动物CSF1R基因基因组DNA的100-10000个长度的核苷酸。优选的,所述的3’臂与NCBI登录号为NC_000084.6至少具有90%同源性的核苷酸。进一步优选的,所述的3’臂序列与SEQ ID NO:37至少具有90%同源性,或者如SEQ ID NO:37所示。
优选的,所述的待改变的转换区位于非人动物CSF1R基因座上。进一步优选的,位于CSF1R基因的1号至22号外显子上。更进一步优选的,位于3号至11号外显子上。
在本发明的一个具体实施方式中,所述的构建方法包括将上述靶向载体导入非人动物细胞中,培养该细胞(优选为胚胎干细胞),然后将培养后的细胞移植至雌性非人动物输卵管内,允许其发育,鉴定筛选获得CSF1和/或CSF1R基因人源化的非人动物。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第七方面,提供了一种CSF1基因人源化的非人动物,所述的非人动物为上述的构建方法获得的非人动物。
本发明的第八方面,提供了一种人源化CSF1R蛋白,所述的人源化CSF1R蛋白包含人CSF1R蛋白的全部或部分。
优选的,所述的人源化CSF1R蛋白包含人CSF1R蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分。进一步优选的,所述的人源化CSF1R蛋白包含人CSF1R蛋白的胞外区的全部或部分。
优选的,所述的人源化CSF1R蛋白还包含非人动物CSF1R蛋白的部分,更优选为非人动物CSF1R蛋白的信号肽、跨膜区和/或胞质区。
在本发明的一个具体实施方式中,所述的人源化CSF1R蛋白包含人CSF1R蛋白的胞外区的全部或部分,优选的,所述的人源化CSF1R蛋白包含的人CSF1R蛋白的胞外区的氨基酸序列包含与SEQ ID NO:35的第20-517位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者与SEQ ID NO:35的第20-517位所示氨基酸序列一致;信号肽、跨膜区和胞质区来源于非人动物。
优选的,所述的人源化CSF1R蛋白包含人CSF1R基因的1号至22号外显子编码的氨基酸序列的全部或部分。进一步优选的,包含1号至22号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合编码的氨基酸序列的全部或部分。更进一步优选的,包含3号至11号外显子编码的氨基酸序列的全部或部分。再进一步优选的,包含3号外显子的部分、4号外显子至10号外显子的全部和11号外显子的部分,其中,3号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、210、220、230、240、250、251、252、253、254、255、256、258bp的核苷酸序列,进一步优选的,包含250bp的核苷酸序列;3号外显子的部分包含编码胞外区的3号外显子的核苷酸序列,11号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、50、60、70、80、90、100、110、116bp的核苷酸序列,进一步优选的,包含41bp的核苷酸序列;11号外显子的部分包含编码胞外区的11号外显子的核苷酸序列。最为优选的,包含与SEQ ID NO:38具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列编码的氨基酸序列或者SEQID NO:38编码的氨基酸序列。
优选的,所述的人源化CSF1R蛋白还包含非人动物CSF1R基因编码的氨基酸序列的全部或部分,优选为非人动物CSF1R基因的1号至2号外显子和/或12号至22号外显子编码的氨基酸序列的全部或部分,进一步优选还包含3号外显子的部分和/或11号外显子的部分编码的氨基酸序列的全部或部分。
在本发明的一个具体实施方式中,所述的人源化CSF1R蛋白的氨基酸序列包含下列组中的一种:
A)为SEQ ID NO:35的第20-517位氨基酸序列的全部或部分;
B)与SEQ ID NO:35的第20-517位氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:35的第20-517位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
D)与SEQ ID NO:35的第20-517位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化CSF1R蛋白的氨基酸序列选自下列组中的一种:
I)为SEQ ID NO:43氨基酸序列的全部或部分;
II)与SEQ ID NO:43氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
III)与SEQ ID NO:43所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
IV)与SEQ ID NO:43所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第九方面,提供了一种人源化CSF1R基因,所述的人源化CSF1R基因包含人CSF1R基因的部分。
优选的,所述的人源化CSF1R基因包含编码人CSF1R蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列。进一步优选的,包含编码人CSF1R蛋白胞外区的全部或部分核苷酸序列。更进一步优选的包含与编码SEQ ID NO:35的第20-517位的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者编码SEQ ID NO:35的第20-517位的核苷酸序列。
优选的,所述的人源化CSF1R基因编码上述的人源化CSF1R蛋白。
优选的,所述的人源化CSF1R基因包含人CSF1R基因的1号至22号外显子的全部或部分。进一步优选的,包含1号至22号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合的全部或部分。更进一步优选的,包含3号至11号外显子的全部或部分。再进一步优选的,包含3号外显子的部分、4号外显子至10号外显子的全部和11号外显子的部分,优选还包含3-4号内含子和/或10-11号内含子,更优选的包含3-11号外显子之间的任一内含子,其中,3号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、210、220、230、240、250、251、252、253、254、255、256、258bp的核苷酸序列,进一步优选的,包含250bp的核苷酸序列;3号外显子的部分包含编码胞外区的3号外显子的核苷酸序列,11号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、50、60、70、80、90、100、110、116bp的核苷酸序列,进一步优选的,包含41bp的核苷酸序列;11号外显子的部分包含编码胞外区的11号外显子的核苷酸序列。
优选的,所述的人源化CSF1R基因还包含非人动物CSF1R基因的部分;优选为非人动物CSF1R基因的1号至2号外显子和/或12号至22号外显子,进一步优选还包含3号外显子的部分和/或11号外显子的部分。
在本发明的一个具体实施方式中,所述的人源化CSF1R基因包含与SEQ ID NO:39、40和/或41具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列,或者包含SEQ ID NO:39、40和/或41所示的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化CSF1R基因包含下列组中的一种:
(A)为SEQ ID NO:38所示核苷酸序列的全部或部分;
(B)与SEQ ID NO:38所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(C)与SEQ ID NO:38所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(D)具有SEQ ID NO:38所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化CSF1R基因转录的mRNA选自下列组中的一种:
(i)为SEQ ID NO:42所示核苷酸序列的全部或部分;
(ii)与SEQ ID NO:42所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)与SEQ ID NO:42所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)与SEQ ID NO:42所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第十方面,提供了一种靶向载体,所述的靶向载体包含人CSF1R基因的部分。
优选的,所述的人CSF1R基因的部分包含人CSF1R基因的1号至22号外显子的全部或部分。进一步优选的,包含1号至22号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合。更进一步优选的,包含3号至11号外显子的全部或部分。再进一步优选的,包含3号外显子的部分、4号外显子至10号外显子的全部和11号外显子的部分,优选还包含3-4号内含子和/或10-11号内含子核苷酸序列,其中,3号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、210、220、230、240、250、251、252、253、254、255、256、258bp的核苷酸序列,进一步优选的,包含250bp的核苷酸序列;3号外显子的部分包含编码胞外区的3号外显子的核苷酸序列,11号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、50、60、70、80、90、100、110、116bp的核苷酸序列,进一步优选的,包含41bp的核苷酸序列;11号外显子的部分包含编码胞外区的11号外显子的核苷酸序列。在本发明的一个具体实施方式中,包含与SEQ ID NO:38具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者与SEQ ID NO:38所示核苷酸序列一致。
优选的,所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段,即5’
臂,其选自非人动物CSF1R基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的5’臂与NCBI登录号为NC_000084.6至少具有90%同源性的核苷酸。更进一步优选的,所述5’臂序列与SEQ ID NO:36至少具有90%同源性,或者如SEQ ID NO:36所示。和/或,所述的靶向载体还包含与待改变的转换区3’端同源的DNA片段,即3’臂,其选自非人动物CSF1R基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的3’臂与NCBI登录号为NC_000084.6至少具有90%同源性的核苷酸。更进一步优选的,所述的3’臂序列与SEQ ID NO:37至少具有90%同源性,或者如SEQ ID NO:37所示。
优选的,所述的待改变的转换区位于非人动物CSF1R基因座上。进一步优选的,位于CSF1R基因的1号至22号外显子上。更进一步优选的,位于3号至11号外显子上。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
优选的,所述的靶向载体还包含标记基因。进一步优选的,所述标记基因为负筛选标记的编码基因。更进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。
在本发明的一个具体实施方式中,所述的靶向载体中还包括阳性克隆筛选的抗性基因。进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。
在本发明的一个具体实施方式中,所述的靶向载体中还包括特异性重组系统。进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统)。所述的特异性重组系统为具有两个Frt重组位点,分别同向连接在抗性基因的两侧。
本发明的第十一方面,提供了一种CSF1R基因人源化的非人动物,所述的非人动物体内表达人或人源化CSF1R蛋白。
优选的,所述的非人动物的内源CSF1R蛋白表达降低或缺失。
优选的,所述的非人动物体内表达上述的人源化CSF1R蛋白。
优选的,人CSF1R基因的部分或者人源化CSF1R基因的核苷酸序列可操作的连接至非人动物内源调控元件。
优选的,所述的非人动物体内包含人CSF1R基因的部分,更优选包含上述的人源化CSF1R基因。
根据本发明的一些实施例,所述的非人动物进一步包含其他基因修饰,所述其他基因选自CSF1、PD-1、PD-L1、IL6、IL3、IL15、CSF2、TPO和CD40中的至少一种。
优选的,所述其他基因为CSF1基因,所述的CSF1基因为人源化CSF1基因,所述的人源化CSF1基因如上述的人源化CSF1基因。
根据本发明的一些实施例,所述人或人源化CSF1R基因和/或所述其他基因对于内源被修饰基因座为纯合或杂合。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第十二方面,提供了一种CSF1R基因人源化的非人动物的构建方法,所述的非人动物体内表达人或人源化CSF1R蛋白。
优选的,所述的非人动物选自上述的非人动物。
优选的,所述的构建方法包括用包含编码人CSF1R蛋白的全部或部分核苷酸序列导入非人动物CSF1R基因座。进一步优选的,用包含编码人CSF1R蛋白胞外区的全部或部分核苷酸序列导入非人动物CSF1R基因座。更进一步优选的,用包含与编码SEQ ID NO:35的第20-517位的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者用包含编码SEQ ID NO:35的第20-517位的核苷酸序列导入非人动物CSF1R基因座。
优选的,所述的构建方法包括用包含人CSF1R基因的部分核苷酸序列导入非人动物CSF1R基因座上。进一步优选的,用包含人CSF1R基因的1号至22号外显子的全部或部分核苷酸序列导入非人动物CSF1R基因座。更进一步优选的,用包含1号至22号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合的全部或部分核苷酸序列导入非人动物CSF1R基因座。再进一步优选的,用包含3号至11号外显子的全部或部分核苷酸序列导入非人动物CSF1R基因座。最为优选的,用包含3号外显子的部分、4号外显子至10号外显子的全部和11号外显子的部分,优选还包含3-4号内含子和/或10-11号内含子核苷酸序列导入非人动物CSF1R基因座,其中,3号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、210、220、230、240、250、251、252、253、254、255、256、258bp的核苷酸序列,进一步优选的,包含250bp的核苷酸序列;3号外显子的部分包含编码胞外区的3号外显子的核苷酸序列,11号外显子的部分至少包含20bp的核苷酸序列,例如至少包含20、30、40、41、42、43、44、45、50、60、70、80、90、100、110、116bp的核苷酸序列,进一步优选的,包含41bp的核苷酸序列;11号外显子的部分包含编码胞外区的11号外显子的核苷酸序列。在本发明的一个具体实施方式中,用包含与SEQ ID NO:38具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者用包含SEQ ID NO:38所示核苷酸序列导入非人动物CSF1R基因座。
在本发明的一个具体实施方式中,用包含编码人CSF1R蛋白的cDNA序列导入非人动物CSF1R基因座。
在本发明的一个具体实施方式中,用包含编码人源化CSF1R蛋白的核苷酸序列导入非人动物CSF1R基因座。
在本发明的一个具体实施方式中,用包含人源化CSF1R基因的核苷酸序列导入非人动物CSF1R基因座。
优选的,所述的插入或替换的位点为CSF1R基因的内源调控元件之后。
优选的,所述的插入为首先破坏非人动物内源CSF1R基因的编码框或者破坏插入序列之后的内源CSF1R基因的编码框,随后进行插入操作。或者所述的插入步骤即可给内源CSF1R基因造成移码突变又可以实现插入人源序列的步骤。
进一步优选的,可在插入序列中加入辅助序列(例如终止密码子或含有终止功能的序列等)或其他方法(例如,翻转序列,或敲除序列)使得插入位点后的非人动物内源CSF1R蛋白不能正常表达。
优选的,所述的导入为替换或插入,在本发明的一个具体实施方式中,所述的导入非人动物CSF1R基因座为替换非人动物相应区域,进一步优选的,非人动物CSF1R基因的3号至11号外显子的全部或部分被替换,更进一步优选的,非人动物CSF1R基因的3号外显子的部分、4号外显子至10号外显子的全部和11号外显子的部分被替换。
优选的,编码SEQ ID NO:34的第20-515位所示氨基酸的核苷酸序列被替换。
优选的,所述的非人动物是纯合或者杂合的。
优选的,所述非人动物的基因组中至少一个染色体上包含人源化CSF1R基因。
优选的,所述的非人动物中至少一个细胞表达人或人源化CSF1R蛋白。
优选的,使用基因编辑技术进行非人动物的构建,所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、规律成簇间隔短回文重复(CRISPR/Cas9)技术、锌指核酸酶(ZFN)技术、转录激活子样效应因子核酸酶(TALEN)技术、归巢核酸内切酶(兆碱基大范围核酶)或其他分子生物学技术。
优选的,使用上述的靶向载体进行非人动物的构建。
根据本发明的一些实施例,该构建方法进一步包括:将CSF1R基因人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因为CSF1、PD-1、PD-L1、IL6、IL3、IL15、CSF2、TPO和CD40中的至少一种基因。
优选的,所述的非人动物还表达人或人源化的CSF1、PD-1、PD-L1、IL6、IL3、IL15、CSF2、TPO和CD40蛋白中的至少一种。
优选的,所述其他基因为CSF1基因,所述的CSF1基因为人源化CSF1基因,所述的人源化CSF1基因如上述的人源化CSF1基因。
优选的,所述的多基因修饰的非人动物的基因组中修饰的多个基因中的每一个基因均对于内源被修饰基因座为纯合或杂合的。
在本发明的一个具体实施方式中,所述的构建方法包括将上述靶向载体导入非人动物细胞中,培养该细胞(优选为胚胎干细胞),然后将培养后的细胞移植至雌性非人动物输卵管内,允许其发育,鉴定筛选获得CSF1R基因人源化的非人动物。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第十三方面,提供了一种CSF1基因与CSF1R基因人源化的非人动物的构建方法,包括采用上述CSF1基因人源化的非人动物或上述构建方法获得的CSF1基因人源化的非人动物与上述CSF1R基因人源化的非人动物或上述的构建方法获得的CSF1R基因人源化的非人动物交配、体外授精;或者直接对上述CSF1基因人源化的非人动物或上述构建方法获得的CSF1基因人源化的非人动物的CSF1R基因采用上述CSF1R基因人源化的非人动物的构建方法进行基因编辑;或者直接对上述CSF1R基因人源化的非人动物或上述构建方法获得的CSFR1基因人源化的非人动物的CSF1基因采用上述CSF1基因人源化的非人动物的构建方法进行基因编辑。
本发明的第十四方面,提供了一种多基因修饰的非人动物的构建方法,包括如下步骤:
(一)提供上述的非人动物、上述的构建方法获得的非人动物;
(二)将步骤(一)提供的非人动物与其他基因修饰的非人动物交配、体外授精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因修饰的非人动物包括基因PD-1、PD-L1、IL6、IL3、IL15、CSF2、TPO或CD40中的一种或两种以上的组合人源化的非人动物。
优选的,所述的多基因修饰的非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物、六基因人源化非人动物、七基因人源化非人动物、八基因人源化非人动物或九基因人源化非人动物。
优选的,所述的多基因修饰的非人动物的基因组中人源化的多个基因中的每一个基因均可以是纯合或杂合的。
本发明的第十五方面,提供了一种上述的构建方法获得的非人动物或其子代。
本发明的第十六方面,提供了一种CSF1基因缺失的非人动物,所述的非人动物缺失CSF1基因的全部或部分核苷酸序列。
优选的,所述的非人动物缺失CSF1基因的1号至9号外显子的全部或部分。进一步优选的,缺失CSF1基因的2号至8号外显子的全部或部分。更进一步优选的,缺失2号外显子的部分、3号外显子至7号外显子的全部和8号外显子的部分,优选还缺失2-3号内含子和/或7-8号内含子核苷酸序列。
本发明的第十七方面,提供了一种动物的荷瘤或炎症模型,所述的荷瘤或炎症模型来源于上述的非人动物、上述的构建方法获得的非人动物或者上述的非人动物或其子代。
本发明的第十八方面,提供了一种动物的荷瘤或炎症模型的构建方法,包括上述构建非人动物、非人动物或其子代、基因缺失的动物或者多基因修饰的非人动物的构建方法。
本发明的第十九方面,提供了来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述构建的多基因修饰的非人动物在制备动物的荷瘤或炎症模型中的应用。
本发明的第二十方面,提供了一种细胞或细胞系或原代细胞培养物,所述细胞或细胞系或原代细胞培养物来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的荷瘤或炎症模型。优选的,所述的细胞或细胞系或原代细胞培养物不能发育为动物个体。
本发明的第二十一方面,提供了一种组织或器官或其培养物,所述组织或器官或其培养物来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的荷瘤或炎症模型。优选的,所述的组织或器官或其培养物不能发育为动物个体。
本发明的第二十二方面,提供了一种荷瘤后的瘤组织,所述的瘤组织来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的荷瘤或炎症模型。优选的,所述的荷瘤后的瘤组织不能发育为动物个体。
本发明的第二十三方面,提供了一种CSF1基因人源化的细胞,所述的细胞表达人或人源化CSF1蛋白。
优选的,所述的细胞表达上述的人源化CSF1蛋白。
优选的,所述的细胞的基因组中包含人CSF1基因的部分。更优选的,所述的细胞包含上述的人源化CSF1基因。优选的,所述的细胞不能发育为动物个体。
本发明的第二十四方面,提供了一种CSF1基因缺失的细胞,所述的细胞缺失CSF1基因的全部或部分核苷酸序列。
优选的,所述的细胞缺失CSF1基因的1号至9号外显子的全部或部分。进一步优选的,缺失CSF1基因的2号至8号外显子的全部或部分。更进一步优选的,缺失2号外显子的部分、3号外显子至7号外显子的全部和8号外显子的部分,优选还缺失2-3号内含子和/或7-8号内含子核苷酸序列。优选的,所述的细胞不能发育为动物个体。
本发明的第二十五方面,提供了一种表达上述的人源化CSF1蛋白或包含上述人源化CSF1基因的构建体。
本发明的第二十六方面,提供了一种包含上述构建体的细胞。优选的,所述的细胞不能发育为动物个体。
本发明的第二十七方面,提供了一种包含上述细胞的组织。优选的,所述的组织不能发育为动物个体。
本发明的第二十八方面,提供了来源于上述的人源化CSF1蛋白、上述的人源化CSF1基因、上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的荷瘤或炎症模型、上述的细胞或细胞系或原代细胞培养物、上述的组织或器官或其培养物、上述的荷瘤后的瘤组织、上述的细胞、上述的构建体、上述的细胞或上述的组织的应用,所述应用包括:
在需要涉及人类细胞的免疫过程的产品开发,制造抗体,或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;
在生产和利用动物实验疾病模型,用于开发新的诊断策略和/或治疗策略中的应用;
或者,
在筛选、验证、评价或研究CSF1和/或CSF1R通路功能、人CSF1和/或CSF1R通路信号机理、靶向人的抗体、靶向人的药物、药效,免疫相关疾病药物以及抗肿瘤药物,筛选和评估人用药及药效研究方面的应用。优选的,所述应用不是疾病的治疗和/或诊断方法。
本发明的第二十九方面,提供了一种人CSF1和/或CSF1R特异性调节剂的筛选方法,所述的筛选方法包括向植入肿瘤细胞的个体施加调节剂,检测肿瘤抑制性;其中,所述的个体选自上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的荷瘤或炎症模型。
优选的,所述的调节剂选自CAR-T、药物;优选的,所述的药物为抗体。
优选的,所述的调节剂为单抗或双特异性抗体或两种及两种以上药物的联合使用。
优选的,所述检测包括测定肿瘤细胞的大小和/或增殖速率。
优选的,所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。
优选的,所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化,所述的代谢变化包括食物消耗或水消耗的变化。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述人CSF1和/或CSF1R特异性调节剂的筛选方法不是治疗方法。该方法用来筛选或评价药物,对候选药物的药效进行检测和比较,以确定哪些候选药物可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度,即治疗效果不是必然的,只是一种可能性。
本发明的第三十方面,提供了一种干预方案的评价方法,所述的评价方法包括向个体植入肿瘤细胞,向植入肿瘤细胞的个体施加干预方案,对施加干预方案后的个体进行肿瘤抑制效果检测和评价;其中,所述的个体选自上述的非人动物,上述的构建方法获得的非人动物,上述的非人动物或其子代,或者上述的荷瘤或炎症模型。
优选的,所述的干预方案选自CAR-T、药物治疗。进一步优选的,所述的药物为抗原结合蛋白。所述的抗体结合蛋白为抗体。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述干预方案的评价方法不是治疗方法。该评价方法对干预方案的效果进行检测和评价,以确定该干预方案是否有治疗效果,即治疗效果不是必然的,只是一种可能性。
本发明的第三十一方面,提供了一种来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的荷瘤或炎症模型在制备人CSF1和/或CSF1R特异性调节剂中的用途。
本发明的第三十二方面,提供了一种来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的荷瘤或炎症模型在制备治疗肿瘤或免疫相关疾病的药物中的用途。
本发明所述的CSF1和/或CSF1R基因人源化的非人动物,其体内可正常表达人或人源化CSF1和/或CSF1R蛋白,可用于针对人CSF1和/或CSF1R通路靶位点的药物筛选、药效评估、免疫相关疾病和肿瘤治疗,可以加快新药研发过程、节约时间和成本。
本发明所述的“免疫相关疾病”包括但不限于过敏、哮喘、心肌炎、肾炎、肝炎、系统性红斑狼疮、类风湿性关节炎、硬皮病、甲状腺功能亢进、原发性血小板减少性紫癜、自身免疫性溶血性贫血、溃疡性结肠炎、自身免疫性肝病、糖尿病、疼痛或神经障碍等。
本发明所述的“肿瘤”包括但不限于淋巴瘤、非小细胞肺癌、宫颈癌、白血病、卵巢癌、鼻咽癌、乳腺癌、子宫内膜癌、结肠癌、直肠癌、胃癌、膀胱癌、脑胶质瘤、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺癌、头颈部癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中,所述的白血病选自急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病;所述淋巴瘤选自霍奇金淋巴瘤和非霍奇金淋巴瘤,包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症;所述肉瘤选自骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、以及软骨肉瘤。在本发明的一个具体实施方式中,所述的肿瘤为乳腺癌、卵巢癌、子宫内膜癌、黑色素瘤、肾癌、肺癌、肝癌。
本发明所述的“全部或部分”,“全部”为整体,“部分”为整体中的局部,或者组成整体的个体。
本发明所述的“人源化CSF1蛋白”,包含来源于人CSF1蛋白的部分和非人CSF1蛋白的部分。
本发明所述的“人源化CSF1R蛋白”,包含来源于人CSF1R蛋白的部分和非人CSF1R蛋白的部分。
本发明所述的“人源化CSF1蛋白”,包含来源于人CSF1蛋白的部分。其中,所述的“人CSF1蛋白”同“人CSF1蛋白的全部”,即其氨基酸序列与人CSF1蛋白的全长氨基酸序列一致。所述的“人CSF1蛋白的部分”,为连续或间隔的5-554个(优选为10-517个)氨基酸序列与人CSF1蛋白的氨基酸序列一致或与人CSF1蛋白的氨基酸序列具有70%以上同源性。
本发明所述的“人源化CSF1R蛋白”,包含来源于人CSF1R蛋白的部分。其中,所述的“人CSF1R蛋白”同“人CSF1R蛋白的全部”,即其氨基酸序列与人CSF1R蛋白的全长氨基酸序列一致。所述的“人CSF1R蛋白的部分”,为连续或间隔的5-972个(优选为10-498个)氨基酸序列与人CSF1R蛋白的氨基酸序列一致或与人CSF1R蛋白的氨基酸序列具有70%以上同源性。
本发明所述的“人源化CSF1基因”,包含来源于人CSF1基因的部分和非人CSF1基因的部分。其中,所述的“人CSF1基因”同“人CSF1基因的全部”,即其核苷酸序列与人CSF1基因的全长核苷酸序列一致。所述的“人CSF1基因的部分”为连续或间隔的20-20487bp(优选为20-3994bp或20-1554bp)个核苷酸序列与人CSF1核苷酸序列一致或与人CSF1核苷酸序列具有70%以上同源性。
本发明所述的“人源化CSF1R基因”,包含来源于人CSF1R基因的部分和非人CSF1R基因的部分。其中,所述的“人CSF1R基因”同“人CSF1基因的全部”,即其核苷酸序列与人CSF1R基因的全长核苷酸序列一致。所述的“人CSF1R基因的部分”为连续或间隔的20-60082bp(优选为20-4006bp或20-1494bp)个核苷酸序列与人CSF1核苷酸序列一致或与人CSF1R核苷酸序列具有70%以上同源性。
本发明所述的“xx号至xxx号外显子”或“xx号至xxx号外显子的全部”包含外显子及其期间的内含子的核苷酸序列,例如所述的“2号至3号外显子”包含2号外显子、2-3号内含子、3号外显子的全部核苷酸序列。
本发明所述的“x-xx号内含子”表示x号外显子与xx号外显子之间的内含子。例如“2-3号内含子”表示2号外显子与3号外显子之间的内含子。
本发明所述的“外显子的部分”表示连续或间隔几个、几十个或几百个核苷酸序列与全部的外显子核苷酸序列一致。例如人CSF1基因的2号外显子的部分,包含连续或间隔的5-123bp个,优选10-51bp个核苷酸序列与人CSF1基因的2号外显子核苷酸序列一致。在本发明的一个具体实施方式中,所述的“人源化CSF1基因”中包含的“2号外显子的部分”至少包括编码胞外区去除N端1-5个氨基酸的2号外显子的核苷酸序列。
本发明所述的“基因座”广义上讲代表基因在染色体上所占的位置,狭义上讲代表某一基因上的一段DNA片段,即可以是一个基因也可以是一个基因的一部分。例如所述的“CSF1基因座”表示CSF1基因1号至9号外显子上的任选一段的DNA片段。优选为1号外显子、2号外显子、3号外显子、4号外显子、5号外显子、6号外显子、7号外显子、8号外显子、9号外显子或其期间的内含子中的任一个或两个或多个的组合,或一个或两个或多个的全部或部分,更优选为CSF1基因的2号至8号外显子上。
本发明所述的“核苷酸序列”包含天然的或经过修饰的核糖核苷酸序列、脱氧核糖核苷酸序列。优选为DNA、cDNA、pre-mRNA、mRNA、rRNA、hnRNA、miRNAs、scRNA、snRNA、siRNA、sgRNA、tRNA。
本发明所述“治疗(treating)”(或“治疗(treat)”或“治疗(treatment)”)表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除。术语“治疗(treating)”等是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。
本发明所述“同源性”,是指在使用氨基酸序列或核苷酸序列的方面,本领域技术人员在保证与已知序列相似结构或功能的前提下,可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。
本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。
在一个方面,所述非人动物是哺乳动物。在一个方面,所述非人动物是小型哺乳动物,例如跳鼠科。在一个实施方式中,所述基因人源化的非人动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。
在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:Molecular Cloning A Laboratory Manual,2ndEd.,ed.By Sambrook,FritschandManiatis(Cold Spring Harbor Laboratory Press:1989);DNA Cloning,Volumes Iand II(D.N.Glovered.,1985);Oligonucleotide Synthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelsonand M.Simon,eds.inchief,Academic Press,Inc.,New York),specifically,Vols.154and 155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,ed.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods InCell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook Of Experimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);and Manipulating the Mouse Embryo,(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1986)。
以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。
下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:小鼠CSF1基因和人CSF1基因座对比示意图(非按比例);
图2:小鼠CSF1基因人源化改造示意图(非按比例);
图3:CSF1基因打靶策略及靶向载体设计示意图(非按比例);
图4:CSF1重组后细胞Southern blot结果,其中WT为野生型对照;
图5:人源化CSF1小鼠FRT重组过程示意图(非按比例);
图6:CSF1人源化F1代小鼠鼠尾PCR鉴定体细胞基因型,其中,WT为野生型,H2O为水对照,PC为阳性对照;
图7:野生型C57BL/6小鼠(WT)和CSF1基因人源化杂合子小鼠(H/+)脾脏组织RT-PCR检测结果,其中M为Marker,H2O为水对照,GAPGH为内参;
图8:野生型C57BL/6小鼠(WT)和CSF1基因人源化杂合子小鼠(H/+)脾脏组织ELISA检测结果;
图9:小鼠CSF1R基因和人CSF1R基因座对比示意图(非按比例);
图10:小鼠CSF1R基因人源化改造示意图(非按比例);
图11:CSF1R基因打靶策略及靶向载体设计示意图(非按比例);
图12:CSF1R人源化F1代小鼠流式分析结果,其中,图(A)、(C)为野生型C57BL6(WT)对照,图(B)、(D)为CSF1R人源化杂合子小鼠(H/+)检测结果图;
图13:ELISA检测结果,其中WT为野生型C57BL/6小鼠,H/H为CSF1/CSF1R双基因人源化纯合子小鼠,mCSF1为鼠CSF1蛋白,hCSF1为人源化CSF1蛋白,ND为Not Detected;
图14:流式细胞术检测结果,其中WT为野生型C57BL/6小鼠,H/H为CSF1/CSF1R双基因人源化纯合子小鼠;
图15:将小鼠结肠癌细胞MC38植入人源化CSF1/CSF1R小鼠体内,进行抗肿瘤药效试验后小鼠的体重结果示意图;
图16:将小鼠结肠癌细胞MC38植入人源化CSF1/CSF1R小鼠体内,进行抗肿瘤药效试验后小鼠的体重变化结果示意图;
图17:将小鼠结肠癌细胞MC38植入人源化CSF1/CSF1R小鼠体内,进行抗肿瘤药效试验后小鼠体内肿瘤体积结果示意图。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
在下述每一实施例中,设备和材料是从以下所指出的几家公司获得:
HeraeusTM FrescoTM 21Microcentrifuge购自Thermo Fisher Scientific,型号Fresco 21;
Figure BDA0003605687210000341
Mouse M-CSF ELISA Kit购自RayBio,货号ELH-MCSF;
Figure BDA0003605687210000342
Human M-CSF ELISA Kit购自RayBio,货号ELM-MCSF;
APC anti-mouse CD115(CSF-1R)Antibody(mCSF1R-APC)购自Biolegend,货号135509;
PE anti-human CD115(CSF-1R)Antibody(hCSF1R-PE)购自Biolegend,货号347303;
V450 Rat Anti-CD11b Antibody(mCD11b-V450)购自BD Horizon,货号560455;
BclI、DraIII、HindIII酶购自NEB,货号分别为R0160S、R0510、R0104M;
Attune Nxt Acoustic Focusing Cytometer购自Thermo Fisher,型号AttuneNxt;
PrimeScript 1st Strand cDNA Synthesis Kit购自TAKARA,型号6110A;
HeraeusTM FrescoTM 21Microcentrifuge购自Thermo Fisher,型号Fresco 21;
Figure BDA0003605687210000351
Mouse M-CSF ELISA Kit购自RayBio,货号ELH-MCSF;
Figure BDA0003605687210000352
Human M-CSF ELISA Kit购自RayBio,货号ELM-MCSF。
实施例1CSF1基因人源化小鼠
本实施例对非人动物(如小鼠)进行改造,使该非人动物体内包含编码人CSF1蛋白的核苷酸序列,得到经遗传修饰的非人动物体内可表达人或人源化CSF1蛋白。小鼠CSF1基因(NCBI Gene ID:12977,Primary source:MGI:1339753,UniProt ID:P07141,位于3号染色体NC_000069.7的第107648364至107668048位,基于转录本NM_007778.4及其编码蛋白NP_031804.3(SEQ ID NO:1))和人CSF1基因(NCBI Gene ID:1435,Primary source:HGNC:2432,UniProt ID:P09603,位于1号染色体NC_000001.11的第109910506至109930992位,基于转录本NM_000757.6及其编码蛋白NP_000748.4(SEQ ID NO:2))对比示意图如图1所示。
为了达到本发明的目的,可在小鼠内源CSF1基因座引入编码人CSF1蛋白的全部或部分核苷酸序列,使得该小鼠表达人或人源化CSF1蛋白。具体来说,可以通过基因编辑技术在小鼠内源CSF1基因座上用人CSF1基因核苷酸序列替换小鼠CSF1基因,如将小鼠CSF1基因的2号外显子部分序列至8号外显子部分序列的9929bp长度的序列用对应的人DNA序列替换,得到人源化CSF1基因序列(示意图如图2所示),实现对小鼠CSF1基因的人源化改造。
如图3所示的打靶策略示意图中,显示了靶向载体上含有小鼠CSF1基因上游和下游的同源臂序列,以及包含人CSF1 DNA序列的A1片段。其中,上游同源臂序列(5’同源臂,SEQ ID NO:3)与NCBI登录号为NC_000069.7的第107667454至107663984位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:4)与NCBI登录号为NC_000069.7的第107653604至107649963位核苷酸序列相同;A1片段上包含人CSF1基因的2号外显子部分序列至8号外显子部分序列的基因组DNA序列(SEQ ID NO:5),该DNA序列与NCBI登录号为NC_000001.11的第109914331至109925189位核苷酸序列相同;A1片段中人CSF1 DNA片段3’端与小鼠CSF1基因的连接设计为
Figure BDA0003605687210000353
Figure BDA0003605687210000361
Figure BDA0003605687210000362
(SEQ ID NO:6),其中序列“TGTAG”的最后一个“G”是人的最后一个核苷酸,序列“
Figure BDA0003605687210000363
”的第一个“A”是小鼠的第一个核苷酸。
靶向载体上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neo cassette)。其中Neo盒5’端与小鼠基因的连接设计为
Figure BDA0003605687210000364
Figure BDA0003605687210000365
Figure BDA0003605687210000366
其中序列“CAAAT”的最后一个“T”是小鼠的最后一个核苷酸,序列“
Figure BDA0003605687210000367
”的第一个“C”是Neo盒的第一个核苷酸;Neo盒3’端与小鼠基因的连接设计为
Figure BDA0003605687210000368
Figure BDA0003605687210000369
Figure BDA00036056872100003610
其中序列“GATCC”的最后一个“C”是Neo盒的最后一个核苷酸,序列“
Figure BDA00036056872100003611
”的第一个“T”是小鼠的第一个核苷酸。此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。改造后的人源化小鼠CSF1的mRNA序列如SEQ ID NO:9所示,表达的蛋白序列如SEQ ID NO:10所示。
靶向载体构建可采用常规方法进行,如酶切连接等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况,筛选出正确的阳性克隆细胞,经PCR鉴定为阳性的克隆再进行Southern Blot(分别用BclI、DraIII或HindIII消化细胞DNA并使用3个探针进行杂交,探针及目的片段长度如表1所示)检测,结果见如图4所示,检测结果表明12个经PCR验证为阳性的克隆,经测序发现除3-G07外,其余11个均为阳性克隆且无随机插入,具体编号为1-A02、1-B08、1-E05、2-A04、2-A12、2-D06、3-C08、3-D06、3-D09、3-E05、3-G02。
表1:具体探针及目的片段长度
限制性内切酶 探针 野生型片段大小 重组序列片段大小
BclI 5’Probe 8.9kb 11.9kb
DraIII 3’Probe 13kb 9.2kb
HindIII Neo Probe 6.2kb
其中,PCR测定包括下述引物:
F1:5’-GAGCCAGGGTGATTTCCCATAAA-3’(SEQ ID NO:11),
R1:5’-CAGAGGTCCTAACTTTGGGAAGG-3’(SEQ ID NO:12);
F2:5’-GCTCGACTAGAGCTTGCGGA-3’(SEQ ID NO:13),
R2:5’-AGAGGGCACTTAAGCAAGTTGAG-3’(SEQ ID NO:14);
Southern Blot检测包括如下探针引物:
5’探针(5’Probe):
5’Probe-F:5’-TTGAACAATGCATAGGAGGGAGC-3’(SEQ ID NO:15),
5’Probe-R:5’-GCTAGCTCTCTTCCCCGTCG-3’(SEQ ID NO:16);
3’探针(3’Probe):
3’Probe-F:5’-TTCCCGTAAAGGCATAAAGGCA-3’(SEQ ID NO:17),
3’Probe-R:5’-GAGGAGAGGCTGAAGGAAGTG-3’(SEQ ID NO:18);
Neo探针(Neo Probe):
Neo Probe-F:5’-GGATCGGCCATTGAACAAGAT-3’(SEQ ID NO:19),
Neo Probe-R:5’-CAGAAGAACTCGTCAAGAAGGC-3’(SEQ ID NO:20)。
将筛选出的正确阳性克隆细胞(黑色鼠)按照本领域已知的技术导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因(该过程示意图见图5)后,再通过互相交配即可得到人源化CSF1基因纯合子小鼠。可通过PCR鉴定子代小鼠体细胞的基因型(引物如表2所示),示例性的F1代小鼠(已去除Neo标记基因)的鉴定结果见图6,其中,编号为F1-01、F1-02的2只小鼠均为阳性杂合小鼠。
表2:引物名称及具体序列
Figure BDA0003605687210000371
这表明使用本方法能构建出可稳定传代且无随机插入的CSF1基因人源化小鼠。可通过常规检测方法确认阳性小鼠体内人源化CSF1 mRNA及蛋白表达情况,例如RT-PCR、ELISA方法等。具体来说,分别取9周龄C57BL/6野生型小鼠和CSF1基因人源化杂合子小鼠各3只,腹腔注射LPS(200ug/200ul)刺激处理,3小时后分别取脾脏组织进行RT-PCR和ELISA检测。RT-PCR检测所用引物如表3所示,检测结果如图7所示,从图中可以看出,在C57BL/6野生型小鼠脾脏中检测到鼠CSF1 mRNA(图7A),未检测到人源化CSF1 mRNA(图7B),而在CSF1基因人源化杂合子小鼠脾脏中检测到鼠CSF1 mRNA(图7A),也检测到人源化CSF1 mRNA(图7B)。
表3:RT-PCR检测引物序列
Figure BDA0003605687210000381
ELISA检测结果如图8所示,从图中可以看出,在C57BL/6野生型小鼠脾脏中检测到鼠CSF1蛋白的表达(图8A),未检测到人源化CSF1蛋白的表达(图8B),而在CSF1基因人源化杂合子小鼠脾脏中既检测到鼠CSF1蛋白的表达(图8A),也检测到人源化CSF1蛋白的表达(图8B)。
实施例2 CSF1R基因人源化小鼠
本实施例对非人动物(如小鼠)进行改造,使该非人动物体内包含编码人CSF1R蛋白的全部或部分核苷酸序列,得到经遗传修饰的非人动物,其体内可表达人或人源化CSF1R蛋白。小鼠CSF1R基因(NCBI Gene ID:12978,Primary source:MGI:1339758,UniProt ID:P09581,位于18号染色体NC_000084.6的第61105572至61131139位,基于转录本NM_001037859.2及其编码蛋白NP_001032948.2(SEQ ID NO:34))和人CSF1R基因(NCBI GeneID:1436,Primary source:HGNC:2433,UniProt ID:P07333,位于5号染色体NC_000005.10的第150053291至150113372位,基于转录本NM_005211.3及其编码蛋白NP_005202.2(SEQID NO:35))对比示意图如图9所示。
为了达到本发明的目的,可在小鼠内源CSF1R基因座引入编码人CSF1R蛋白的全部或部分核苷酸序列,使得该小鼠表达人或人源化CSF1R蛋白。具体来说,可以通过基因编辑技术在小鼠内源CSF1R基因座上用人CSF1R基因核苷酸序列替换小鼠CSF1R基因,如将小鼠CSF1R基因的3号外显子部分序列至11号外显子部分序列的9369bp长度的序列用对应的人DNA序列替换,得到人源化CSF1R基因序列(示意图如图10所示),实现对小鼠CSF1R基因的人源化改造。
如图11所示的打靶策略示意图中,显示了靶向载体上含有小鼠CSF1R基因上游和下游的同源臂序列,以及包含人CSF1R基因部分序列的A片段。其中,上游同源臂序列(5’同源臂,SEQ ID NO:36)与NCBI登录号为NC_000084.6的第61104995至61109623位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:37)与NCBI登录号为NC_000084.6的第61119606至61124121位核苷酸序列相同;A片段上包含人CSF1R基因的3号外显子部分序列至11号外显子部分序列的基因组DNA序列(SEQ ID NO:38),该DNA序列与NCBI登录号为NC_000005.10的第150068290至150081016位核苷酸序列相同;A片段中人CSF1R 3’端与小鼠CSF1R基因的连接设计为
Figure BDA0003605687210000391
Figure BDA0003605687210000392
Figure BDA0003605687210000393
其中序列“CACCA”的最后一个“A”是人的最后一个核苷酸,序列“
Figure BDA0003605687210000394
”的第一个“G”是小鼠的第一个核苷酸。
靶向载体上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neo cassette)。其中Neo盒5’端与小鼠基因的连接设计为
Figure BDA0003605687210000395
Figure BDA0003605687210000396
Figure BDA0003605687210000397
其中序列“ACTAC”的最后一个“C”是小鼠的最后一个核苷酸,序列“
Figure BDA0003605687210000398
”的“G”是Neo盒的第一个核苷酸;Neo盒3’端与小鼠基因的连接设计为
Figure BDA0003605687210000399
Figure BDA00036056872100003910
Figure BDA00036056872100003911
其中序列“ATATT”的最后一个“T”是Neo盒的最后一个核苷酸,序列“
Figure BDA00036056872100003912
”的第一个“C”是小鼠的第一个核苷酸。此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。改造后的人源化小鼠CSF1R的mRNA序列如SEQ ID NO:42所示,表达的蛋白序列如SEQ ID NO:43所示。
靶向载体构建可采用常规方法进行,如酶切连接等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况,将筛选出的正确阳性克隆细胞(黑色鼠)按照本领域已知的技术导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因后,再通过互相交配即可得到人源化CSF1R基因纯合子小鼠。
可通过常规检测方法确认阳性小鼠体内人源化CSF1R蛋白的表达情况,例如使用流式细胞术等。具体来说,分别取6周龄野生型C57BL/6小鼠和CSF1R人源化小鼠的血液,用抗鼠CSF1R抗体mCSF1R-APC或抗人CSF1R抗体hCSF1R-PE和mCD11b-V450识别染色后进行流式检测,检测结果见图12。如图12所示,在CSF1R人源化杂合子小鼠体内检测到鼠CSF1R蛋白(图12B)和人源化CSF1R蛋白(图12D);而在野生型C57BL/6小鼠体内只能检测到鼠CSF1R蛋白(图12A),未检测到人源化CSF1R蛋白(图12C)。
实施例3 CSF1/CSF1R双基因人源化小鼠制备
将实施例1获得的CSF1基因人源化小鼠和实施例2获得的CSF1R基因人源化小鼠交配,并对其后代进行筛选,获得CSF1/CSF1R双基因人源化纯合子小鼠,分别采用ELISA方法和流式细胞术检测该纯合子小鼠体内人源化人源化CSF1蛋白和CSF1R蛋白的表达情况。具体来说,分别选取7周龄雌性野生型C57BL/6小鼠和本实施例获得的CSF1/CSF1R双基因人源化纯合子小鼠各3只,经腹腔注射浓度为200μg/200μL的脂多糖(LPS)刺激处理,3小时后收集脾脏细胞,并分别使用
Figure BDA0003605687210000401
Mouse M-CSF ELISA Kit和
Figure BDA0003605687210000402
Human M-CSF ELISAKit检测CSF1表达情况,检测结果如图13所示。从图中可以看出,在野生型C57BL/6小鼠体内仅检测到鼠CSF1蛋白(图13A),未检测出人源化CSF1蛋白的表达(图13B);在CSF1/CSF1R双基因人源化纯合子小鼠体内仅检测到人源化CSF1蛋白(图13B),未检测到鼠CSF1蛋白的表达(图13A)。
采用流式细胞术检测小鼠体内CSF1R蛋白的表达情况。具体来说,分别选取7周龄雌性野生型C57BL/6小鼠和CSF1/CSF1R双基因人源化纯合子小鼠各1只,采集外周血后分别使用抗鼠CD45抗体Brilliant Violet 510TM anti-mouse CD45 Antibody、抗鼠CD11b抗体V450 Rat Anti-mouse CD11b(mCD11b-V450)、抗鼠CD155抗体APC anti-mouse CD115(CSF-1R)Antibody(mCSF1R-APC)或抗人CD155抗体PE anti-human CD115(CSF-1R)Antibody(hCSF1R-PE)识别染色后进行检测,检测结果如图14所示。从图中可以看出,在野生型C57BL/6小鼠体内仅检测到鼠CSF1R蛋白(图14C),未检测出人源化CSF1R蛋白的表达(图14A);在CSF1/CSF1R双基因人源化纯合子小鼠体内仅检测到人源化CSF1R蛋白(图14B),未检测到鼠CSF1R蛋白的表达(图14D)。
实施例4双重人源化或多重人源化小鼠的制备
利用本方法或制得的CSF1和/或CSF1R基因人源化小鼠还可以制备双人源化或多人源化小鼠模型。如,前述实施例1或实施例2中,囊胚显微注射使用的胚胎干细胞可选择来源于含有PD-1、PD-L1、IL6、IL3、IL15、CSF2、TPO、CD40等其它基因修饰的小鼠,或者,也可在CSF1和/或CSF1R基因人源化小鼠的基础上,利用分离小鼠ES胚胎干细胞和基因重组打靶技术,获得CSF1和/或CSF1R与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将本方法得到的CSF1和/或CSF1R小鼠纯合子或杂合子与其它基因修饰的纯合或杂合小鼠交配,对其后代进行筛选,根据孟德尔遗传规律,可有一定机率得到人源化CSF1和/或CSF1R与其它基因修饰的双基因或多基因修饰的杂合小鼠,再将杂合子相互交配可以得到双基因或多基因修饰的纯合子,利用这些双基因或多基因修饰的小鼠可以进行靶向人CSF1和/或CSF1R和其它基因调节剂的体内药效验证等。
实施例5体内药效验证
AMG-820(药物信息参考专利:CN101802008B)是一种针对CSF1R的全人源单克隆IgG2抗体,由AmMax Bio公司开发,目前处于临床II期,作为膝关节腱鞘巨细胞瘤的关节内治疗。
axatilimab(重链全长(HC)序列为SEQ ID NO:44,轻链全长(LC)序列为SEQ IDNO:45)是一种针对CSF1R的人源化单克隆抗体,由Syndax Pharmaceuticals公司开发,目前处于临床II期,用于治疗因新型冠状病毒病继发呼吸道体征和症状的住院患者并用于治疗患有活动性慢性移植物抗宿主病的患者。
cabiralizumab(重链全长(HC)序列为SEQ ID NO:46,轻链全长(LC)序列为SEQ IDNO:47)是一种靶向CSF1R的人源化单克隆抗体,由Amgen公司、百时美施贵宝和小野制药开发,目前处于临床I/II期,用于治疗肿瘤适应症。
emactuzumab(重链全长(HC)序列为SEQ ID NO:48,轻链全长(LC)序列为SEQ IDNO:49)是一种人源化抗CSF1R单克隆抗体,由罗氏公司开发,目前处于临床I期,用于治疗实体瘤。
IMC-CS4(重链可变区(VH)序列为SEQ ID NO:50,轻链可变区(VL)序列为SEQ IDNO:51)是一种靶向CSF1R的人单克隆抗体,由礼来公司开发,用于治疗晚期实体瘤。
利用本发明制备的CSF1/CSF1R双基因人源化纯合子小鼠构建肿瘤模型,可用于测试靶向人CSF1R的药物的药效。具体来说,选取实施例3制备的CSF1/CSF1R双基因人源化纯合子小鼠(8-9周龄、雌性),皮下接种小鼠结肠癌细胞MC38(5×105个),待肿瘤体积约100mm3后,按瘤体积分为对照组或治疗组(n=6/组)。对照组注射PBS,治疗组使用抗人CSF1R抗体AMG-820analog、axatilimab analog、cabiralizumab analog、ema ctuzumab analog、IMC-CS4 analog。给药方式:腹腔注射(i.p.),分组当天开始给药,每周给药2次,共给药6次。每周测量肿瘤体积2次,接种后单只小鼠肿瘤体积达到3000mm3时执行安乐死。具体分组和给药情况见表4。实验周期内小鼠体重情况和肿瘤体积测量结果分别如图15-17所示。
表4:分组及给药情况
Figure BDA0003605687210000421
表5中列出了各个实验的主要数据和分析结果,具体包括分组时、分组后14天、分组后第21天时的肿瘤体积、小鼠存活情况、无肿瘤小鼠情况、肿瘤(体积)抑制率(TumorGrowth Inhibition value,TGITV)以及治疗组与对照组小鼠肿瘤体积的统计学差异(P值)。
表5:肿瘤体积、存活情况及肿瘤抑制率
Figure BDA0003605687210000422
如图15、16和表5所示,整体来看,各组实验过程中,动物健康状态良好,在第21天时,所有治疗组(G2、G3、G4、G5、G6)与对照组(G1)相比,动物体重呈增长趋势(图15和16),均无明显差异(P>0.05),表明动物对抗人CSF1R抗体AMG-820analog、axatilimab analog、cabiralizumab analog、emactuzumab analog、IMC-CS4 analog的耐受性良好,未对动物产生明显毒性作用,安全性较好。如图17和表5所示,从肿瘤体积结果上看,在各个时期,治疗组肿瘤体积均小于对照组,且在第21天,G2、G3、G4、G5和G6组小鼠肿瘤体积分别为935±193mm3、526±114mm3、648±150mm3、808±181mm3和794±145mm3,均小于对照组1031±126mm3,不同治疗组表现不同的治疗结果,尤其是G3组与对照组相比具有显著差异(P<0.05)。在实验结果表明本发明实施例的方法制备的CSF1/CSF1R双基因人源化纯合子小鼠可用于靶向人CSF1R的药物(如,抗体药物)研发及筛选。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
序列表
<110> 百奥赛图(北京)医药科技股份有限公司
<120> CSF1和/或CSF1R基因人源化的非人动物及其构建方法和应用
<130> 1
<150> CN202110425356.X
<151> 2021-04-20
<150> CN202210185622.0
<151> 2022-02-28
<160> 51
<170> SIPOSequenceListing 1.0
<210> 1
<211> 552
<212> PRT
<213> 小鼠(Mouse)
<400> 1
Met Thr Ala Arg Gly Ala Ala Gly Arg Cys Pro Ser Ser Thr Trp Leu
1 5 10 15
Gly Ser Arg Leu Leu Leu Val Cys Leu Leu Met Ser Arg Ser Ile Ala
20 25 30
Lys Glu Val Ser Glu His Cys Ser His Met Ile Gly Asn Gly His Leu
35 40 45
Lys Val Leu Gln Gln Leu Ile Asp Ser Gln Met Glu Thr Ser Cys Gln
50 55 60
Ile Ala Phe Glu Phe Val Asp Gln Glu Gln Leu Asp Asp Pro Val Cys
65 70 75 80
Tyr Leu Lys Lys Ala Phe Phe Leu Val Gln Asp Ile Ile Asp Glu Thr
85 90 95
Met Arg Phe Lys Asp Asn Thr Pro Asn Ala Asn Ala Thr Glu Arg Leu
100 105 110
Gln Glu Leu Ser Asn Asn Leu Asn Ser Cys Phe Thr Lys Asp Tyr Glu
115 120 125
Glu Gln Asn Lys Ala Cys Val Arg Thr Phe His Glu Thr Pro Leu Gln
130 135 140
Leu Leu Glu Lys Ile Lys Asn Phe Phe Asn Glu Thr Lys Asn Leu Leu
145 150 155 160
Glu Lys Asp Trp Asn Ile Phe Thr Lys Asn Cys Asn Asn Ser Phe Ala
165 170 175
Lys Cys Ser Ser Arg Asp Val Val Thr Lys Pro Asp Cys Asn Cys Leu
180 185 190
Tyr Pro Lys Ala Thr Pro Ser Ser Asp Pro Ala Ser Ala Ser Pro His
195 200 205
Gln Pro Pro Ala Pro Ser Met Ala Pro Leu Ala Gly Leu Ala Trp Asp
210 215 220
Asp Ser Gln Arg Thr Glu Gly Ser Ser Leu Leu Pro Ser Glu Leu Pro
225 230 235 240
Leu Arg Ile Glu Asp Pro Gly Ser Ala Lys Gln Arg Pro Pro Arg Ser
245 250 255
Thr Cys Gln Thr Leu Glu Ser Thr Glu Gln Pro Asn His Gly Asp Arg
260 265 270
Leu Thr Glu Asp Ser Gln Pro His Pro Ser Ala Gly Gly Pro Val Pro
275 280 285
Gly Val Glu Asp Ile Leu Glu Ser Ser Leu Gly Thr Asn Trp Val Leu
290 295 300
Glu Glu Ala Ser Gly Glu Ala Ser Glu Gly Phe Leu Thr Gln Glu Ala
305 310 315 320
Lys Phe Ser Pro Ser Thr Pro Val Gly Gly Ser Ile Gln Ala Glu Thr
325 330 335
Asp Arg Pro Arg Ala Leu Ser Ala Ser Pro Phe Pro Lys Ser Thr Glu
340 345 350
Asp Gln Lys Pro Val Asp Ile Thr Asp Arg Pro Leu Thr Glu Val Asn
355 360 365
Pro Met Arg Pro Ile Gly Gln Thr Gln Asn Asn Thr Pro Glu Lys Thr
370 375 380
Asp Gly Thr Ser Thr Leu Arg Glu Asp His Gln Glu Pro Gly Ser Pro
385 390 395 400
His Ile Ala Thr Pro Asn Pro Gln Arg Val Ser Asn Ser Ala Thr Pro
405 410 415
Val Ala Gln Leu Leu Leu Pro Lys Ser His Ser Trp Gly Ile Val Leu
420 425 430
Pro Leu Gly Glu Leu Glu Gly Lys Arg Ser Thr Arg Asp Arg Arg Ser
435 440 445
Pro Ala Glu Leu Glu Gly Gly Ser Ala Ser Glu Gly Ala Ala Arg Pro
450 455 460
Val Ala Arg Phe Asn Ser Ile Pro Leu Thr Asp Thr Gly His Val Glu
465 470 475 480
Gln His Glu Gly Ser Ser Asp Pro Gln Ile Pro Glu Ser Val Phe His
485 490 495
Leu Leu Val Pro Gly Ile Ile Leu Val Leu Leu Thr Val Gly Gly Leu
500 505 510
Leu Phe Tyr Lys Trp Lys Trp Arg Ser His Arg Asp Pro Gln Thr Leu
515 520 525
Asp Ser Ser Val Gly Arg Pro Glu Asp Ser Ser Leu Thr Gln Asp Glu
530 535 540
Asp Arg Gln Val Glu Leu Pro Val
545 550
<210> 2
<211> 554
<212> PRT
<213> 人(human)
<400> 2
Met Thr Ala Pro Gly Ala Ala Gly Arg Cys Pro Pro Thr Thr Trp Leu
1 5 10 15
Gly Ser Leu Leu Leu Leu Val Cys Leu Leu Ala Ser Arg Ser Ile Thr
20 25 30
Glu Glu Val Ser Glu Tyr Cys Ser His Met Ile Gly Ser Gly His Leu
35 40 45
Gln Ser Leu Gln Arg Leu Ile Asp Ser Gln Met Glu Thr Ser Cys Gln
50 55 60
Ile Thr Phe Glu Phe Val Asp Gln Glu Gln Leu Lys Asp Pro Val Cys
65 70 75 80
Tyr Leu Lys Lys Ala Phe Leu Leu Val Gln Asp Ile Met Glu Asp Thr
85 90 95
Met Arg Phe Arg Asp Asn Thr Pro Asn Ala Ile Ala Ile Val Gln Leu
100 105 110
Gln Glu Leu Ser Leu Arg Leu Lys Ser Cys Phe Thr Lys Asp Tyr Glu
115 120 125
Glu His Asp Lys Ala Cys Val Arg Thr Phe Tyr Glu Thr Pro Leu Gln
130 135 140
Leu Leu Glu Lys Val Lys Asn Val Phe Asn Glu Thr Lys Asn Leu Leu
145 150 155 160
Asp Lys Asp Trp Asn Ile Phe Ser Lys Asn Cys Asn Asn Ser Phe Ala
165 170 175
Glu Cys Ser Ser Gln Asp Val Val Thr Lys Pro Asp Cys Asn Cys Leu
180 185 190
Tyr Pro Lys Ala Ile Pro Ser Ser Asp Pro Ala Ser Val Ser Pro His
195 200 205
Gln Pro Leu Ala Pro Ser Met Ala Pro Val Ala Gly Leu Thr Trp Glu
210 215 220
Asp Ser Glu Gly Thr Glu Gly Ser Ser Leu Leu Pro Gly Glu Gln Pro
225 230 235 240
Leu His Thr Val Asp Pro Gly Ser Ala Lys Gln Arg Pro Pro Arg Ser
245 250 255
Thr Cys Gln Ser Phe Glu Pro Pro Glu Thr Pro Val Val Lys Asp Ser
260 265 270
Thr Ile Gly Gly Ser Pro Gln Pro Arg Pro Ser Val Gly Ala Phe Asn
275 280 285
Pro Gly Met Glu Asp Ile Leu Asp Ser Ala Met Gly Thr Asn Trp Val
290 295 300
Pro Glu Glu Ala Ser Gly Glu Ala Ser Glu Ile Pro Val Pro Gln Gly
305 310 315 320
Thr Glu Leu Ser Pro Ser Arg Pro Gly Gly Gly Ser Met Gln Thr Glu
325 330 335
Pro Ala Arg Pro Ser Asn Phe Leu Ser Ala Ser Ser Pro Leu Pro Ala
340 345 350
Ser Ala Lys Gly Gln Gln Pro Ala Asp Val Thr Gly Thr Ala Leu Pro
355 360 365
Arg Val Gly Pro Val Arg Pro Thr Gly Gln Asp Trp Asn His Thr Pro
370 375 380
Gln Lys Thr Asp His Pro Ser Ala Leu Leu Arg Asp Pro Pro Glu Pro
385 390 395 400
Gly Ser Pro Arg Ile Ser Ser Leu Arg Pro Gln Gly Leu Ser Asn Pro
405 410 415
Ser Thr Leu Ser Ala Gln Pro Gln Leu Ser Arg Ser His Ser Ser Gly
420 425 430
Ser Val Leu Pro Leu Gly Glu Leu Glu Gly Arg Arg Ser Thr Arg Asp
435 440 445
Arg Arg Ser Pro Ala Glu Pro Glu Gly Gly Pro Ala Ser Glu Gly Ala
450 455 460
Ala Arg Pro Leu Pro Arg Phe Asn Ser Val Pro Leu Thr Asp Thr Gly
465 470 475 480
His Glu Arg Gln Ser Glu Gly Ser Phe Ser Pro Gln Leu Gln Glu Ser
485 490 495
Val Phe His Leu Leu Val Pro Ser Val Ile Leu Val Leu Leu Ala Val
500 505 510
Gly Gly Leu Leu Phe Tyr Arg Trp Arg Arg Arg Ser His Gln Glu Pro
515 520 525
Gln Arg Ala Asp Ser Pro Leu Glu Gln Pro Glu Gly Ser Pro Leu Thr
530 535 540
Gln Asp Asp Arg Gln Val Glu Leu Pro Val
545 550
<210> 3
<211> 3471
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tcttcagcca ctagcgagca agggagcgag cgaaccaggg cggccaacac gccgtgccgg 60
gacccagctg cccgtatgac cgcgcggggc gccgcggggc gctgcccttc ttcggtaagc 120
tgcaaccgtg gcgcgcgggg cccgggccgg gctggggcag gagctctgca gcaagcagca 180
ggcggctctg cggggccact tggagcggac agccccttct cgccagctgc ccaggcttct 240
cggccctggg ttctggcttc cttactgctt ctaagctacg gctgaggccc gcggtatttc 300
aatagctgct cctggggctg cagcgctttg cgaggtaaag agaaggctgc tcatcccatt 360
gcacggagga gaacactgag ctacccacag gctggagaga gagatggggg tctggggggg 420
gggggtatcg cagggattgg cacaggccca atgtctgcca gaatggtcaa ccaggtctcc 480
aggttccgag tgacacaaga tccgagtgtg gcatcatccc cagtagatat ctttctttgg 540
ttgttgcaca tgttttaggc cccagttggg agtgggcctt cagggtaggg aaaattcagg 600
ctcactcagc tttacaccag gacctgtgct gagcaacctg ttggcagaga gagagagaga 660
gagagagaga gagagagaga gatgggcatg ctgctacttg ttcaatggat gtgtaggaac 720
tattagggac ttgggtggct ctttgagggg agctggaccc gaatcttttc ttgaagaaaa 780
tgagatgggg ctattctaga ctctgcggct gactgaggaa agaaagtgca aggagagttc 840
agagctgcag ctgataatgg gctgctcaga agctgtctcc agtaatggca gcagatgata 900
gcatggctct tacagagtga aggatggtac tttcaatcca cagcaagtgg gtttgcttca 960
gaagagaatg agagggaaaa cctggagggt aggaaccgaa cttgtgatgg gcagcgcgtt 1020
gcaggtgtct gggaggagag aaaagtagaa cagcagagag aggggctcag tgagaggcag 1080
aaggtggggt taggaggagg ggaagggagg aagttatccc acatgcaaca agcataaaga 1140
gagaagaggg aagaaaagaa agactacaag gagacataag aggaaagaga ggaggccgag 1200
gttcagccag gcagtcaggc cgggtctctg tctgcagact gtactgattg gaaaatggaa 1260
catgatgtct tgaagtgctc agagactgcc gcagtttcca ggctgctctc atagtcagag 1320
gctgaggcag tgggtgggag gaagaagcaa gccaggaaga gcctgtccag ccagatgcag 1380
gctagagtat taacccttgg gtgtccatct gtatccctgt ctatggcagc attggggtta 1440
cagagccaga tccaggagtg gctggtcatc tttgaagcca gcagctgtgc attatttctg 1500
tgcatgcttg aaatgccacc aaaagccagg tagccctgaa gtaatgtctt tatcttgcta 1560
tctccaaaca tcaatggctt gaaattcctg ggttgagata tttctgaaca tctccattcc 1620
cgggtccttt ccttcatacc atacacacat ggactgacag gctgagtgat accagcctgg 1680
gccagagtca tcttctgcag tcatttcctt taacaggttc tgagactggg gttcaggaga 1740
cccgggctgc cactcccact caggactaac tttccaattg cccaaccatg cccaatgcag 1800
tttatcaacc catagctggc tgcaccctct cccccacctc tttctccctg tctctctgtg 1860
tctgtcactc tgtgtctctg actgtctgtc tctgactgtc tgtctctgac tctctgtctc 1920
tctctctctc taaggtcagg caaggaacct aacaggtcct gtgcgtaatg gcattaggca 1980
accctgtgcc ttaacaccca tcagcatctt ccacccttta aggcctcact cttccctccg 2040
catggcccag ccaaagctgc ctttcctccc tggtactcac tggcaaggct ttgggctttt 2100
agatgtaacc cagtgttgtt atggactgtt tcatagcctc cctgtgtttt tccaatgcgc 2160
tcctatttgc aacatttgtc tcatcatctg gactattggg gcagagccag atccaagaag 2220
gtgccagtca tcactccacc ctgccagcat ttccctgaat tgggggatat cagcagccag 2280
aatgctcaga atggcagcat caggccaggg aaagaaagcc caagagtccc tctgccccag 2340
gctggcatct cccgggatac cctattggag cccgaaggga tggaaggatt ttagagtaga 2400
ggaggaggaa ggaagaaagg agaaaggaag gacccagtca ggtgtcagga gccagaccta 2460
ggactctagg gatgagcagc tgcagggcca ggtgggtgct gacggaaagg agagaacttt 2520
cttgctgtgg caagagtttg ctgactagat gaagggcctg atgggtctca gataaacaga 2580
tgccagcagg gaaacacagc attgtccttg attagtcagc tggactcctc ttgaaatgca 2640
agtccaaggc tctaggaggt ctcccactgg agctgagttc ccagtgttgc atcctggtat 2700
tttcccctgt agaaccagac ctgtgtaacc aggtgggaag gaaggaatga aggaaggaag 2760
gaaggtgcca ggggtaatga gtgtttctgg cttgcaatct gaaagctagt gactgaccac 2820
aagtttgaag gcagcttaca aggtatctat ttgtctcagt gttaaaagtt aaaaggatag 2880
aaaatcttac ccttgagtct ctcagtcact aaaacttata ctggttggca caccaccagt 2940
attatcatta gacattctct gtaagatgga aaggtggctc atcatttaaa aacacttgtt 3000
gctcttgcag tggatccagg ttcaaatccc agaatctaga tgatggttca caaccattca 3060
tacctccagg tccaggagat tccaagaagg aagcacatag agtgtgtgca tgcaagcagg 3120
caaaatattc ataaacacaa aacaaaaaca gtaagccttt taaaattgtc ttttaaagta 3180
ctctgtattg ttgagctgct ctgggttaac ctcagaagag ttcttggaga agatggcatt 3240
tgggctatta ccaagggaag agtgaggtgg tgccctggct gataagaatc taatggtgct 3300
gcagcatggg aatggggcgt tgtttctttg cccttagtgg gacatggggg tagctaggga 3360
gaggaagtgc tggaaagaca tgactccctt ctgttataga catggctggg ctcccggctg 3420
ctgctggtct gtctcctcat gagcaggagt attgccaagg aggtgtcaga a 3471
<210> 4
<211> 3642
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tgtgccttat ctggtcctac tcccaagcca aggttattgc tgcctccctg atttaggatc 60
attgtgccat agaaatttag tcttaggaga gctgtcgaga ggtcatttgg cccagtgtcc 120
cagcctaaaa gggttactct gcatccccca cagggagtca gccagcttcc tgcacacaca 180
cacacacact cccagttcca ggcaagttct ctgcatgcca gtctgctcaa ctggggtcac 240
aacattgggg tcacaacaca caacactggg ggagttcctt ccttatgtag gcaaagctgc 300
cttcctttct tcccttccca gaccaatcct ctctcatctt ctcatgaggc ctgatattta 360
aagtcagcta ttcatgtcac cttttaaaat tctctgtgtt aagtgtggcc aagcccctca 420
aacattcctt atatgatatg gttttcagac ccctcaccat cctggacaca ctcgtttgtc 480
aatgtccctc tgaaaatgtg gcgcccagcc ctggacacag tactccagat gttgtctgac 540
cagctcagag tacagtggga cggttgtctt ccttgatctg gacagtactc ttctactcgt 600
gcagattaag atcacattag ttttaacagc tgcatcatat attgtcatat gttgagcttg 660
tagtctatta aaaaccccag ttctatttcc tgtgaacctt tgtccagtag accgtcgcca 720
tcccatactc ccatacttgg acacaaccgt tttagccaaa gtgtagctgg tgctcacctt 780
tgttaaaact ccttgttgtt ttctgcccat cccctgagcc tactgaaagt gttttagttc 840
ctaatttggt cactttataa ctcctggttg ggtcccctgc acattaatgc gtgtcttttg 900
ttgtccttgc ccacgctatt ggtggagatg tgacctgtat tcttcctcta cacccaccca 960
caccagccta tccagaagcc ttcccttcct aaaatattcc acatccctct ggttgatctt 1020
ttaattcatt ctgctctgtt gtatatggct gatgctatat taatccacat acatttggat 1080
gttgttttat gtattttaaa tcatatttta tgtatatatg taaattttga actactaaga 1140
agattgtaag cccctagagg gcagggacta tcttcctttt tatttttttt ccccttcact 1200
tcattaattc tagtacagac agtgccccct ctatccttgt caaaaactta gtaaatggtg 1260
gtagctgttt tcaggtctga atcaccaact aaccccggcc agatttctct aactgaccag 1320
ccttctggct gaccaattaa ctagccaact aatcaactca tcttaccagc tagttggcta 1380
actgactact tggccaacta gctggtaact acttaactga ctagttcttg attgatgagc 1440
tgattggcta actagctggc agagtgctta gttgatttgc tgactgactg gatggcaaac 1500
tagctgtgtg atcggttgaa gtttccagtt ataccccttg ccacatgtaa gcaaactgtc 1560
ccatgtgtag gatgatgtgt ctaagcccct ttcccaaagg aaatatcaca gatgctcaga 1620
gagccaggga gatttatttg aattaaagca agcagcaacc catatctaga atcccgggga 1680
cccactcagc agtaatgtgg gtggagacgg gtgaaatgaa ttagctggct cactggaaca 1740
gctacaagga cacagagtcc ctctgacctg aatcagagag caaaggttgc tggggatttg 1800
ggggctcagt gctgtgtcac cttaccaagg gctaccaggg ttcttcctcc ctgccacctg 1860
tatgaccttg tcctcggccc tggtttctct gtacccagtt gtccttccca tgcctcctaa 1920
ctctcagacc tgcccaagat tttacgttcc tcacctaagg atttcaagat ttcactcagt 1980
cagcgcagat ctaacctgat ccccattcca ggctcaagga gcctatggga actgaatgtc 2040
tgtgtcctga ttgaccaata ctctgacaag gagatgagtg gggcacacag aagtggggac 2100
taagaaaagg tcaccaagtt gtagaaaact caggccctcg gccccaggaa actgggagtt 2160
gggttagagg ctaaggtcat gccctctggg gccttcttcc cgatgggccc tgccagagcc 2220
tgtggcctgg ttgtaccagt atggctcatg cccagtttat agtttcttct tgtttcctat 2280
ccaaagcatg ggaataggct ggtggccaaa ggctgtaggt ctcattttct ttcataccca 2340
tcacaggctt gaccagtggg gctatggaca ttactgggga ggcgccatac agggtccaaa 2400
gtcaaactgt tggctgaagt ccaggggatt tctgctatgg aacaaagagt tctgaggata 2460
ctggacaagg ggacaaagat gggggtgggg tggggagagg gcagggccct ggctcccatg 2520
gatgacaaga ggcaagtccc tcatcccatc tgggaggagg ctaggctgct tggggtgagc 2580
atgcctgttg acagggcaag ccctcccttt tcctggcatt gtctctaccc tctgcccctc 2640
aagcctgagt tctttctatt caaatgcctt tgcccaagtg tcttctgtgc agataccctc 2700
taagggatgg tatgagagtt ggcagagatc accttaggtc attggtctaa gactactgag 2760
atggccttac ctgagaacta gcctagtagg ggcattcaag agcttgttcc ctgctcccat 2820
ctgctagagc aatagccctc tctctctctt ggcctcgacc tcctccagtc ttagtccctc 2880
attttgtggt cactactccc ccaggaggag aggtaggagg tgaggccagg ctatccaaag 2940
gcttggactg ctgccaggca aagctgcctg gtctctctgt ggtgtctggg gtcgcctaga 3000
gggccaggaa aatgaccaga ggaagtcttg ccttaagtca gccaacaacc cacaggaatg 3060
tcacacctcc cccaactatg tccttagcga ccctccccca cactcccctg ctgaccagcc 3120
ttcttccctt ctttccccta cagctgggca cacaggacta tctctttatg gaaggagaca 3180
tatgggaaca tccaccacta ccctctccta ccatcttcct gggaatgtgg cctaccacta 3240
ccagagctcc tgcctaccaa gactggatga aagaagcagc tttgatgggg tctttccatc 3300
ctcaccctta gactctcaac caaagagaaa gggctggagg atgcccccca catactgcca 3360
ctatttattg tgggccctgg aggctccctg cattggagga agggcagctc agcagctcag 3420
gaccctttcc cttaggggct gcttcctccc ctcaaaacca gaacctggca agggactcac 3480
tagcctggat ggcccatggg agaccaggac agatgagaag gagcagaaga gccctgtgcc 3540
cagaagaccc aactggtgcc aaggaatccc agcatggaca ggcagggacc tgtttcccaa 3600
gaagagagcc tgatattcaa agggtgggac agcatctgcc cg 3642
<210> 5
<211> 10859
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tactgtagcc acatgattgg gagtggacac ctgcagtctc tgcagcggct ggtgagtgtg 60
tggccatgct gtattctacc ttctccccac tggggaaatg aaggcaggag ccagggagca 120
ggtcaaagag agcagttgca ggcaggaaaa tagggcagtg cgggacattg cttgtggttc 180
ccactagctc caccagtgat acccttcact aaccttccca aagttaggac ctctggtctc 240
cccagctcga agccctctct gactgccctg caggcagtgg atgctgtggg cttccagctg 300
cttgcctggg ttagtgattg cccaggaaca tcaaccactg attctgaaaa ggcttctgag 360
gtctgctgtc cctcagtggg atgcctcctc tgggaagcta gcccaggcgg cctgctgtgt 420
ccagatgttg catctagctc ctggactctc atatgtggcg ccagtctggc atcagagccc 480
cacccagatt tggaggggaa gcgcttgcct aactcccagc cttccacact cacttccctg 540
gctcttgccc ataccctgag gctgggatgg cctgctcatc tgggccatga aggagcctgt 600
atctcattct aatcagaccc atacgtggtc cagccaggca gaatcaggtt gctgtcatgg 660
ctgctgtcct gctcagtggg aatttaccat tcctctggcc agccaggcag ggtggggcat 720
cactggctaa cgccagctcc agggccctga gcttggggcc tgtgggctgt gccttccgcc 780
tctcttgccc cagcactact tctcctgtat gtagttgctg tagcaatcca aggtagacca 840
agagccccag cattctctga ggcttaaaat ccagaactgc tgctctgggg ctaaagaggg 900
ctttaagggc atccagctcc aacccctaca ggtgttcaat ccccagagct tgtccagcct 960
ctgcttgaat tcctaccatg acagggtgct cactgcctcc agggaagatt atatcctata 1020
ttcttctata gacatctctt ccttaaaaca aatgggcatt tgtcagattt cgtggggtgg 1080
tagaaggaaa gaagagactt cttgttcttc tacagccttc ccctgggcat ctggaaggca 1140
ctgatcttct cctagacttg actctgtctt tccacgtgtg gttggcaggg atgaagttca 1200
aaccccaatc cactcagaag ctaaggtccc cgttttgaag aaggctgaag gctgagttga 1260
gctgtaggtt accctgcaat cgttggcctg ctctctctta cagattgaca gtcagatgga 1320
gacctcgtgc caaattacat ttgagtttgt agaccaggaa cagttggtga gtgatggctt 1380
tttacaaaat ccatgcacca gcctgcatgc aactcccagg gtggggtgtg tgggggagca 1440
tgaaagcggc agaatgccta ctgctggaaa gggtgagagt gtgaggatcc atgggtgctc 1500
aactctgggg tgccaggatc cagggctcaa gtcccctgcc attcccttct cctggcctga 1560
tacataacaa gcgctcacta ggtaccaagc actttgctaa tgtagttctg acagtaccac 1620
tatgtggtac acaaatacag tttattatcc acagagaggt gaaaggagca tagctagtag 1680
gtgctagagg cctgatttga atccaggaag gttggctgta gggcttgagg caaatcaata 1740
cttcttccag gtcacaagct ttgcttaagg atgtcacttc tcttcaccag gccaaccagc 1800
aggcaggtag gcagtccagc ccttcctgga cttgccccac acccaaccag ccaccaagtg 1860
ctgctggttc tgcctctcag catctctggg ttctgtctcc tccatcccca ccttcacccc 1920
tcaatcagtt gcttggacaa tttcaagagc ctcctaactg gtgtctccct gctttctagt 1980
tcactcctca tcttaccact gggggaaatt ttctgaaacg ccaacctgct gcctttacct 2040
ccttctccca aaaacatcag ggcccccatc actccagaag aaagccaagg ttgtctagtc 2100
tgggttacac caggtctagc cattctccac cacacaagcc tctataccac ctccccattc 2160
cctgcttctt cctgcctccc atctttgcac aagctctttc caatgactgt catgcctttc 2220
cacctgcccc ccaatcatta ttccacatct attcatcttt atgcctcatg caaaactgcc 2280
ttgataccca gaagttgccc ctgtttctga gcttccacac acctgaccca tatgcacctc 2340
tgttaggact agagatcacc tcatggtcca aagaatagcc tcagtatttt atgcactcac 2400
tcgcttgctc tagcactcat gcctgaacta gcatttgcta ggaacctact ggactagatg 2460
ctgggggtag agagctaaag cagagtgggt cttcaaggca actaccatct ctttagggag 2520
acaaaacaca gaggttattc tttggaccat gagatagtct tcagcacccc tatgtcctgg 2580
aggatttgaa ggggccatat ggtaaaagat atttgtgaaa gcaagacaag aggaagacag 2640
aaagaaaggc aggggaaggt tccctggagc ccaccttccc tatatacatc catcgtgatt 2700
aaagcctcat attccagaaa cccagagaac tctctaatca gaatccacat ttccttcact 2760
ctagcccagt ctccagtggc gctagatccc aaagagagag aaagacaggc aagctgaggg 2820
cggcattctc ctagttgctg gcatggtgtg gtccctcccc tgggggaagg gggagagcaa 2880
gctgcaaccc tccatctgcc tggggttggg ggttcccagg ccacaatggc caggccataa 2940
gctccaggtt cctgtttttc agaaagatcc agtgtgctac cttaagaagg catttctcct 3000
ggtacaagac ataatggagg acaccatgcg cttcagagat aacaccccca atgccatcgc 3060
cattgtgcag ctgcaggaac tctctttgag gctgaagagc tgcttcacca aggattatga 3120
agagcatgac aaggtaggaa gccctgaggc ctggagcact gagtgagggc agagggtggc 3180
tgtggaggcg ccgctctatc cacaggcaca gagtacattc gctcacctcg cctcacgcca 3240
ttgcttgctc actctcattt atttgtcatc ccaccaacct ttaccaggca ggaggcagga 3300
gggatcatgc tgggccctga caatgtcatc atgagcaaca aatacatggt cccaccccat 3360
gcagcttata gtcaagtgag cttggcagct gttaaacaaa ccatgacacc agtaaataga 3420
attacaaact ataaggactg ttcattccaa cagcaagcag ttattgtgtg tctgttgtgt 3480
accagacact gttctagaca ccaggaaaca gctgtgatga aaacagacaa aaatccccac 3540
attcctggaa cttacatttg ggggtgacgg tagtggtggt gagacagtta acaaaatatg 3600
taagtaaaat atacaacatg tagcatggca ataacagcac tggagaagag taaaccaggg 3660
atgagacgac ccgaaggaag tggaggagtg agctgggaac aagaacctga agggctcaag 3720
gagagcaaca gggaactcag acttccatgg agttggggaa gcagagacaa gaaaggcttc 3780
tgagtaagca aatattgatt tgagctccaa agatgagtaa gaattgaaag cagtaaggct 3840
agaagaacat tctggaacag gaaaagctat gcacaaagcc ctaaggtaaa caaacaggaa 3900
agtgcacatt cagggaccca aagggttatc agcatggcca gagcatggga agtgaaggag 3960
ggggaggaga gaagtcagga gccagatcac atgtggtttt agagatgtgg gattttgtct 4020
taagggtgag ggaagctgtt gtgaacaggc atgtggctta atctcaggtt ataagactga 4080
cctggttgct atgtggagga tagaccacag ggggcaggaa tggaggctgg gagaccagca 4140
gaaggtgtga gtccaggcta gacacattgg cggcttggac caaggtggga cagtgaaggt 4200
ggaggcaagt ggactggaca tgttcccgtg ggtttagggg cagaatcaac aagacttggt 4260
acgtgcagtg gatgtgagaa gctgagggaa agaaaaagcc aaggatggtt tttgtcttga 4320
gcacctggat attccaatga tgctgaaacg gggatgatcc atgggcagag caggtttgag 4380
ggaagacagt tcagtctggg gcacagcaga cgtgaggtgc tcatgaaatg gtgagtggag 4440
acgttgagga ggcagctagg tgtgcgggtc ttgagtgtga ccagcaatgc acagatctat 4500
gaggcatggg ggttcggctt atctgtgaag ccatgggact ggacagcact gccactgtga 4560
gaagagaagc aggcccagga acccagcatt tggagggcaa gcagaggatg ggggacctgg 4620
caaggggcag cctgaaggtg ggaggaaaag agggagagtg cagagtcgag gcactgcatt 4680
ccaagatgga taagggatgg agattcataa aaaagcgttg agaaatcaag caaggtgagg 4740
gctaaaattg tccattggat ttggcaacgt gtcacacatg ctggatcagg gtgaacagaa 4800
agagaggaag tagagacacc actgtggaag aacttggatc cgaatggggg caggaaaaga 4860
gatgtagctg gagggagtgt gtaattgagg gaggactttt tgttctgttt ttgttgtcgt 4920
tgttttgaga cagggtctca ttctgtcacc caagctgaag ttcagcggcg caatcacgac 4980
tcactgcagc ccaacctccc aggctcaatt gatcctctga cttcagtctc ctgagtagct 5040
gggacaacag gcacacccca ctatgcccag ctattttttg tagagatagg gtttcgcaat 5100
gttgcccagg ctggtctcaa actcccaggc tcaagcaatc tgtctgcctt ggcctcccag 5160
agtgctggga ttacaaatgt gagttactgt gcctggccag gaaaacattt ttaataagag 5220
aggtattaaa tctgcggttt tccaacatta agattcctaa gaatcacttg gggaatgtgt 5280
tgaaaatgca tattcctagg acacacccct agagagtctg atacactggg tttaagagtg 5340
gctccagggc cgggcgcggt ggttcatgcc tctaatcctg gcactttggg aggccgagac 5400
agtggatcac ctgaggtcag gagttcaaga ccagcctgcc caacagggcg aaaccccatc 5460
tttactaaaa atacaaaaat tagcagctgg tggtggcgca tgcctgtaat ccaagctact 5520
cgggaggctg aggcagtaga atcgcttgac ccagggtggc ggaggttgca gtgagctgag 5580
atcgaaactc catctcaaaa taaataaata aataaataaa taaataaata aataaataaa 5640
taaataaaag actgaaccca ggaatctgca tcttaagcag ctgtcgcact gatgattatg 5700
acccccttgg atattcactt gtagacatgt gtgaatgctg aggggcaggc tccaagagag 5760
agggtgggtg aagctggagg agctagctcc cagcaagtct ctggagaaga cagtgggagg 5820
gattcagagc tcctgaggga gagtgagagt gagacttcat ctcaaaaaaa aaaaaaatgt 5880
ttaccagata gacgtacgaa tgagaagact gggctcagct ccatcactta ccagctaggt 5940
ggcagtgacc aagtaaactg ccggagtctc actctctccc aggctggagt gcagtagtgc 6000
catctcagct cactgcaacc tttgcctccc gggttcaagc aattctcctg cctcagcctc 6060
ccgagtagct gggattacag gcacgcacca ccatgcccag ctaatttttg tctttctagc 6120
tgggattaca ggcacgtgcc accatgcctg gctaattttt gtctttttag taaagacaag 6180
gtttcaccat gttggtcagg ctgatctcga actcctgacc tcgtgatcag cctgcctcgg 6240
cctcccaaca tgctgggatt acaggtgtga gccaccgcac ccggcctatc tggtaaacat 6300
ttcttaaggg ctgactgcat aggccaggga gatgcggcga tgccttcaag gacttcacag 6360
cctagaaaag cccatgtttc ttccctgtga agctcagttt aaggaaaaac ttggtatctg 6420
tgattcagtg gcatttaggc cctggatgaa gctgtgagca tgcatggcat ggccttgtgt 6480
gaaaggagag gtgggcccgg gagtgaaccc tgagggatgg cagcatttgg atatcaggag 6540
gagaagggga gcttggtaag gagacagaaa gagcagcttg aaaggtggga gaagacccag 6600
gatgatgcag cttctcagag ctccagtggg tgtgggaagc cggggcccct tgagcagcac 6660
agaagacagg gctgggacct cctcagccct ccctctaaga cacaccaatg ccagcaaagg 6720
acccatatgc ctggcggctg ccccgttccc ttctccacac cacagctcaa tgatttttct 6780
caaactcaac tcttaccatg ccactgccca cccctaacac cccttcagat gttttccctt 6840
tgctctgtgg acaaaactaa aagttctggt cttggcccac gaggccctca agacctggcc 6900
cttgctaacc tctctccatg tgcgtctctt gccacgctcc tcctagatgg tagtgctgca 6960
gccacaccag ccttctttta gtctttgggc ttttcatgca ttttcttgcc tcaggacttt 7020
tgcacggtct gttcttgcag cctggacagc tctctgggat cccatctctt tcctggtttc 7080
tcttgctcat cttttagttg attccttggg gaaattctcc ctgaacactt gtttagttcc 7140
ccttgttgca caccatcgga tggcccagta cttattcata ggactcattg cacttgtaac 7200
aatgtgttta gtccctgctg gattgctgga ctcagtgtcc aactcagcca ggaaccacct 7260
ctctcttgtt cgttgcatga ttcccaggta attaccatat gcctggcaca taaacatatg 7320
ttgaatgggt ctgtgaataa atgacatatc tcataacctc aggactcatt ctgctgcaaa 7380
ccaggggaaa ggggagcaag gaaacaaaag ggaaaaagaa gacagatgtg agaaaggcca 7440
agggaatttg acaaataaga tggagacatg gggccaatgg tcatgctcac aaaagggggc 7500
cctgatctcc ttccaggcct gcgtccgaac tttctatgag acacctctcc agttgctgga 7560
gaaggtcaag aatgtcttta atgaaacaaa gaatctcctt gacaaggact ggaatatttt 7620
cagcaagaac tgcaacaaca gctttgctga atgctccagc caaggtaagc atggcagggg 7680
ccagcaagtg tgtgggggtg gtagcatatg gaatggggat tgggaggtga gatgtgaagc 7740
tggggggacc cctggggagg cagcctggct gctactcgtg ttcccgtgtg catgaatgtg 7800
cttgttctgt gtatatatgt ggcttcacgt acctctggtc ctgggcacat gtcttttctg 7860
acatgtgtgt gcatgcacac ctacatatgt ctgcatgtgg cagcgtcaag aaggatcatg 7920
ctggtgcctt gagattaggg agtggaaatg ggagcctgtc ttgggagccc tgtaggtatg 7980
gaagctttcc ccactggctc tgcaggctgg ctgaacgtgt ggggggttct gtggagacag 8040
ctgacaccca tctgggagtc agggcccttg ctccaggagc tctgctgcga atcaccatga 8100
taccctggct ccagaagtcc ccaggatgcc ttgggtgttt cctcaaggga caaggctgga 8160
tttgaagtct gagcatcatt ggaactccca gggctggctc agctgcatac atgtgtacac 8220
tgcgtgtcct cgtctctgcg tctcgtgcca cacgtgccct cctacattca accttgcttc 8280
ccaaggcagg gtctagggcc ctgcaacctg ccagtggcca agtccagtct cgttgcttca 8340
atcccaagtc ctcaagcctt ggctgcattc tagccccagc ctgttcctgc ctgtggctgt 8400
ggctgtggct gtggctgtgt ggctcctggc tatgcatgaa accagtgtct ctggggcttg 8460
aagttgtctt gtattggtct ggaaggcaac cgttcagcct cctgacctga ctgctgctca 8520
cccctagctt ggcctgtggc cagtgggaac ccctgcatgg gctgttctct tatcttcctt 8580
ctccccaacc cccagtgtgt gcatctcaac cctattcttt gtcactgctc atgagaccct 8640
gcatacggca ccttccctgt gtcatgagca cccactctag tcccatcctc ttctcagccc 8700
cagggctgag ctaggagatg agggcccccc agactcacat tcccctcttg ccccgctctg 8760
ggaaagctgt gctggaggct agtgactcta tctcctcccc atctttctct ctccttctct 8820
ctgtggttct ttcagatgtg gtgaccaagc ctgattgcaa ctgcctgtac cccaaagcca 8880
tccctagcag tgacccggcc tctgtctccc ctcatcagcc cctcgccccc tccatggccc 8940
ctgtggctgg cttgacctgg gaggactctg agggaactga gggcagctcc ctcttgcctg 9000
gtgagcagcc cctgcacaca gtggatccag gcagtgccaa gcagcggcca cccaggagca 9060
cctgccagag ctttgagccg ccagagaccc cagttgtcaa ggacagcacc atcggtggct 9120
caccacagcc tcgcccctct gtcggggcct tcaaccccgg gatggaggat attcttgact 9180
ctgcaatggg cactaattgg gtcccagaag aagcctctgg agaggccagt gagattcccg 9240
taccccaagg gacagagctt tccccctcca ggccaggagg gggcagcatg cagacagagc 9300
ccgccagacc cagcaacttc ctctcagcat cttctccact ccctgcatca gcaaagggcc 9360
aacagccggc agatgtaact ggtaccgcct tgcccagggt gggccccgtg aggcccactg 9420
gccaggactg gaatcacacc ccccagaaga cagaccatcc atctgccctg ctcagagacc 9480
ccccggagcc aggctctccc aggatctcat cactgcgccc ccagggcctc agcaacccct 9540
ccaccctctc tgctcagcca cagctttcca gaagccactc ctcgggcagc gtgctgcccc 9600
ttggggagct ggagggcagg aggagcacca gggatcggag gagccccgca gagccagaag 9660
gaggaccagc aagtgaaggg gcagccaggc ccctgccccg ttttaactcc gttcctttga 9720
ctgacacagg ccatgagagg cagtccgagg gatccttcag cccgcagctc caggagtctg 9780
tcttccacct gctggtgccc agtgtcatcc tggtcttgct ggccgtcgga ggcctcttgt 9840
tctacaggtg gaggcggcgg gtgagtagat ccccatgagg aagaagagca cgtcccttag 9900
ggcaggggca gagcctggcg ggggtgcagg tggggggaca gcttgggtgc ggcctgagtt 9960
cttcagacac agagagatag gggctggctc agcacagagg atgagaggtg gaaatggagg 10020
attacttcga gaattgggaa ggttcaagct ataaggtcaa tgggaaggga ctggagcaga 10080
agggagcggg agagaatatt catgggctga cagcaggatg atatccagac gggcagggag 10140
ctggaggagg agagcaatgc tgtgtgagcg tgtcagggca ggcgtacact ggaagctctg 10200
cagagcctgg ggcaggagga cccataggga acagcctgca agggtgtggg gagaggagag 10260
gggacaccat cagcagagag acctcacaaa tctcccttgg gcctctggct gatccccact 10320
tttgggaagt tgggaggact cttgcaactc tctcataaat acctggggca gcccttactg 10380
gggatgggcc accgcccccc cacactcccc cagctcctca gtgagatgct ctttcctgtc 10440
ctcagagcca tcaagagcct cagagagcgg attctccctt ggagcaacca gagggcaggt 10500
gagagcttga ggtggggctc tgggaggcac tgggggcctg gcttgggatc tgtttcccct 10560
cttcgtggtg gtggggctct cctgcttgct ctgaggaaat ggagctgcag aacaggatgg 10620
gggagagaag aagggcctct gtcctttccc agatatctgg gctttttcct gatttctccg 10680
tagagttaga cagttctggg tcttttcaat ctgagagggc ctagagcatg tctggggctt 10740
aggggtaaac ttacggagtc cccttattcc cctgctcctg ctgatgtcta ataccagccc 10800
tgtgctctgc ctgcagcccc ctgactcagg atgacagaca ggtggaactg ccagtgtag 10859
<210> 6
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
cctgactcag gatgacagac aggtggaact gccagtgtag aaaggattct atggtaaggt 60
tctgattttg atatctctct 80
<210> 7
<211> 100
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ccagcttggt gctgagccct gacctcctca gcatcctctt cttgccaaat caccttgtga 60
agcttgatat cgaattccga agttcctatt ctctagaaag 100
<210> 8
<211> 100
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tctctagaaa gtataggaac ttcatcagtc aggtacataa tggtggatcc tgtgccttat 60
ctggtcctac tcccaagcca aggttattgc tgcctccctg 100
<210> 9
<211> 4198
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 9
acagagcgac ggggaagaga gctagcgggg acgaccaggc ggcccgcttg ggggaaggga 60
gtcggcggct cagtgggcct ctggggtgta gtatgtgtca gtgcctgtga gtgtgtttgt 120
gtgtgtgtat gtctgtgtgt gtctggcgga gagccagggt gatttcccat aaaccacatg 180
ccccgccagc ccgcccgctt aaaaggctgt gccgagggct ggccagcgaa gctcggccag 240
gggaaagtga aagtttgcct cggtgctctc ggtgtcgctg cggctctctg catcccagga 300
cagcggcgtg gccctcgacc ggggcgcggg ctcttcagcc actagcgagc aagggagcga 360
gcgaaccagg gcggccaaca cgccgtgccg ggacccagct gcccgtatga ccgcgcgggg 420
cgccgcgggg cgctgccctt cttcgacatg gctgggctcc cggctgctgc tggtctgtct 480
cctcatgagc aggagtattg ccaaggaggt gtcagaatac tgtagccaca tgattgggag 540
tggacacctg cagtctctgc agcggctgat tgacagtcag atggagacct cgtgccaaat 600
tacatttgag tttgtagacc aggaacagtt gaaagatcca gtgtgctacc ttaagaaggc 660
atttctcctg gtacaagaca taatggagga caccatgcgc ttcagagata acacccccaa 720
tgccatcgcc attgtgcagc tgcaggaact ctctttgagg ctgaagagct gcttcaccaa 780
ggattatgaa gagcatgaca aggcctgcgt ccgaactttc tatgagacac ctctccagtt 840
gctggagaag gtcaagaatg tctttaatga aacaaagaat ctccttgaca aggactggaa 900
tattttcagc aagaactgca acaacagctt tgctgaatgc tccagccaag atgtggtgac 960
caagcctgat tgcaactgcc tgtaccccaa agccatccct agcagtgacc cggcctctgt 1020
ctcccctcat cagcccctcg ccccctccat ggcccctgtg gctggcttga cctgggagga 1080
ctctgaggga actgagggca gctccctctt gcctggtgag cagcccctgc acacagtgga 1140
tccaggcagt gccaagcagc ggccacccag gagcacctgc cagagctttg agccgccaga 1200
gaccccagtt gtcaaggaca gcaccatcgg tggctcacca cagcctcgcc cctctgtcgg 1260
ggccttcaac cccgggatgg aggatattct tgactctgca atgggcacta attgggtccc 1320
agaagaagcc tctggagagg ccagtgagat tcccgtaccc caagggacag agctttcccc 1380
ctccaggcca ggagggggca gcatgcagac agagcccgcc agacccagca acttcctctc 1440
agcatcttct ccactccctg catcagcaaa gggccaacag ccggcagatg taactggtac 1500
cgccttgccc agggtgggcc ccgtgaggcc cactggccag gactggaatc acacccccca 1560
gaagacagac catccatctg ccctgctcag agaccccccg gagccaggct ctcccaggat 1620
ctcatcactg cgcccccagg gcctcagcaa cccctccacc ctctctgctc agccacagct 1680
ttccagaagc cactcctcgg gcagcgtgct gccccttggg gagctggagg gcaggaggag 1740
caccagggat cggaggagcc ccgcagagcc agaaggagga ccagcaagtg aaggggcagc 1800
caggcccctg ccccgtttta actccgttcc tttgactgac acaggccatg agaggcagtc 1860
cgagggatcc ttcagcccgc agctccagga gtctgtcttc cacctgctgg tgcccagtgt 1920
catcctggtc ttgctggccg tcggaggcct cttgttctac aggtggaggc ggcggagcca 1980
tcaagagcct cagagagcgg attctccctt ggagcaacca gagggcagcc ccctgactca 2040
ggatgacaga caggtggaac tgccagtgta gaaaggattc tatgctgggc acacaggact 2100
atctctttat ggaaggagac atatgggaac atccaccact accctctcct accatcttcc 2160
tgggaatgtg gcctaccact accagagctc ctgcctacca agactggatg aaagaagcag 2220
ctttgatggg gtctttccat cctcaccctt agactctcaa ccaaagagaa agggctggag 2280
gatgcccccc acatactgcc actatttatt gtgggccctg gaggctccct gcattggagg 2340
aagggcagct cagcagctca ggaccctttc ccttaggggc tgcttcctcc cctcaaaacc 2400
agaacctggc aagggactca ctagcctgga tggcccatgg gagaccagga cagatgagaa 2460
ggagcagaag agccctgtgc ccagaagacc caactggtgc caaggaatcc cagcatggac 2520
aggcagggac ctgtttccca agaagagagc ctgatattca aagggtggga cagcatctgc 2580
ccgacttccc gtaaaggcat aaaggcacgc agcccaaaag acgggaagag gaggcctttg 2640
gctgcttgtg ttgacagctt aaaggggtct acaccctcaa cttgcttaag tgccctctgc 2700
tgatagccag gaaggaggga gaccagccct gcccctcagg acctgacctg gctcatgatg 2760
ccaagaggaa gacagagctc tagcctcgtc ttctcctgcc cacagcccct gccagagttc 2820
ttttgcccag cagaggcacc cctcatgaag gaagccattg cactgtgaat actgaacctg 2880
cctgctgaac agcctgtccc atccatccct atgagtgacc atccgtccga atgttctccc 2940
acttccttca gcctctcctc ggcttcttgc actgagctgg cctcacgtgt tgactgaggg 3000
agcccctgag ccccaacctt cccctgcctc agcctttgat tgtccagggt gaagctgtgg 3060
gagaaccgcc tgggctacca gtcagagctg gtctttgggc tgtgttcctt gcccaggttt 3120
ctgcatcttg cactttgaca ttcccaggag ggaagtgact agtggaaggg agagaggaag 3180
gggaggcaga gacaaaggcc acaggcagag ctatgaatga gaatgggtct tgaaaatatg 3240
tgtgcacccc taagcttgaa attgatctct atactctagc ccctcagcca gcctccttcc 3300
tgttgtctga aacctggagc taagcaggtt gtcctgtcac aagctctggg gactgagctc 3360
catgctccaa ccccaccctc ttctgacctt tgttctccag acctgaccca ggtaggcaag 3420
ggtaccctcc cagtctcacc taccatactg tgccatctct agccaagcaa gccaggttta 3480
gagaagggtc aaaaaaaaaa aaaagggttg tttacttcca acttgttctg atgccctctg 3540
tttcccaggc caggcttgtc tgtggtgacc tgggcatggg tgacagggct ctcatttgcc 3600
ccttggtctc tttatgctgc tgagtccccc tttcctgccc tccctggcta ctgggtcaat 3660
aatctttcag gccatgaatc tgggaggaga gtggtctgta agctccatca gccctgtcct 3720
gagacagcag gggggaagga cactggagac tttcttgtgg ggcttactta gccttctggt 3780
tacagactat ttccatgcta gaaaatacat attttaaaat agaaggaaaa acacagaaac 3840
aaaacaaaac aaggcattct ctacccctcc accttaaaca tatattatta aagacagaag 3900
agaaaatcca acccattgca agaagctctt tgtgggtgcc tggttacatc ggagcagggg 3960
agcctcaaat ccacctttgg agccgcccct gtgtgcatta ggaacccttc tctcctctga 4020
gaaagctcag agggagcact gcctcacaaa ctgtgagact gcgtttttta tacttggaag 4080
tggtgaatta ttttatataa ggtcatttaa atatctattt aaaaaatagg aagctgcttt 4140
tatatttaat aataaaagaa gtgcacaagc tgccacgtgt gaaaaaaaaa aaaaaaaa 4198
<210> 10
<211> 554
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 10
Met Thr Ala Arg Gly Ala Ala Gly Arg Cys Pro Ser Ser Thr Trp Leu
1 5 10 15
Gly Ser Arg Leu Leu Leu Val Cys Leu Leu Met Ser Arg Ser Ile Ala
20 25 30
Lys Glu Val Ser Glu Tyr Cys Ser His Met Ile Gly Ser Gly His Leu
35 40 45
Gln Ser Leu Gln Arg Leu Ile Asp Ser Gln Met Glu Thr Ser Cys Gln
50 55 60
Ile Thr Phe Glu Phe Val Asp Gln Glu Gln Leu Lys Asp Pro Val Cys
65 70 75 80
Tyr Leu Lys Lys Ala Phe Leu Leu Val Gln Asp Ile Met Glu Asp Thr
85 90 95
Met Arg Phe Arg Asp Asn Thr Pro Asn Ala Ile Ala Ile Val Gln Leu
100 105 110
Gln Glu Leu Ser Leu Arg Leu Lys Ser Cys Phe Thr Lys Asp Tyr Glu
115 120 125
Glu His Asp Lys Ala Cys Val Arg Thr Phe Tyr Glu Thr Pro Leu Gln
130 135 140
Leu Leu Glu Lys Val Lys Asn Val Phe Asn Glu Thr Lys Asn Leu Leu
145 150 155 160
Asp Lys Asp Trp Asn Ile Phe Ser Lys Asn Cys Asn Asn Ser Phe Ala
165 170 175
Glu Cys Ser Ser Gln Asp Val Val Thr Lys Pro Asp Cys Asn Cys Leu
180 185 190
Tyr Pro Lys Ala Ile Pro Ser Ser Asp Pro Ala Ser Val Ser Pro His
195 200 205
Gln Pro Leu Ala Pro Ser Met Ala Pro Val Ala Gly Leu Thr Trp Glu
210 215 220
Asp Ser Glu Gly Thr Glu Gly Ser Ser Leu Leu Pro Gly Glu Gln Pro
225 230 235 240
Leu His Thr Val Asp Pro Gly Ser Ala Lys Gln Arg Pro Pro Arg Ser
245 250 255
Thr Cys Gln Ser Phe Glu Pro Pro Glu Thr Pro Val Val Lys Asp Ser
260 265 270
Thr Ile Gly Gly Ser Pro Gln Pro Arg Pro Ser Val Gly Ala Phe Asn
275 280 285
Pro Gly Met Glu Asp Ile Leu Asp Ser Ala Met Gly Thr Asn Trp Val
290 295 300
Pro Glu Glu Ala Ser Gly Glu Ala Ser Glu Ile Pro Val Pro Gln Gly
305 310 315 320
Thr Glu Leu Ser Pro Ser Arg Pro Gly Gly Gly Ser Met Gln Thr Glu
325 330 335
Pro Ala Arg Pro Ser Asn Phe Leu Ser Ala Ser Ser Pro Leu Pro Ala
340 345 350
Ser Ala Lys Gly Gln Gln Pro Ala Asp Val Thr Gly Thr Ala Leu Pro
355 360 365
Arg Val Gly Pro Val Arg Pro Thr Gly Gln Asp Trp Asn His Thr Pro
370 375 380
Gln Lys Thr Asp His Pro Ser Ala Leu Leu Arg Asp Pro Pro Glu Pro
385 390 395 400
Gly Ser Pro Arg Ile Ser Ser Leu Arg Pro Gln Gly Leu Ser Asn Pro
405 410 415
Ser Thr Leu Ser Ala Gln Pro Gln Leu Ser Arg Ser His Ser Ser Gly
420 425 430
Ser Val Leu Pro Leu Gly Glu Leu Glu Gly Arg Arg Ser Thr Arg Asp
435 440 445
Arg Arg Ser Pro Ala Glu Pro Glu Gly Gly Pro Ala Ser Glu Gly Ala
450 455 460
Ala Arg Pro Leu Pro Arg Phe Asn Ser Val Pro Leu Thr Asp Thr Gly
465 470 475 480
His Glu Arg Gln Ser Glu Gly Ser Phe Ser Pro Gln Leu Gln Glu Ser
485 490 495
Val Phe His Leu Leu Val Pro Ser Val Ile Leu Val Leu Leu Ala Val
500 505 510
Gly Gly Leu Leu Phe Tyr Arg Trp Arg Arg Arg Ser His Gln Glu Pro
515 520 525
Gln Arg Ala Asp Ser Pro Leu Glu Gln Pro Glu Gly Ser Pro Leu Thr
530 535 540
Gln Asp Asp Arg Gln Val Glu Leu Pro Val
545 550
<210> 11
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gagccagggt gatttcccat aaa 23
<210> 12
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
cagaggtcct aactttggga agg 23
<210> 13
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gctcgactag agcttgcgga 20
<210> 14
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
agagggcact taagcaagtt gag 23
<210> 15
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ttgaacaatg cataggaggg agc 23
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gctagctctc ttccccgtcg 20
<210> 17
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ttcccgtaaa ggcataaagg ca 22
<210> 18
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
gaggagaggc tgaaggaagt g 21
<210> 19
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ggatcggcca ttgaacaaga t 21
<210> 20
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
cagaagaact cgtcaagaag gc 22
<210> 21
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gcgttgtttc tttgccctta gt 22
<210> 22
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gtaccaggag agccattatc cac 23
<210> 23
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
cagaggtcct aactttggga agg 23
<210> 24
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
tacatctgat cccaaagcaa cca 23
<210> 25
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
ggggatgcag agtaaccctt tta 23
<210> 26
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
gacaagcgtt agtaggcaca tatac 25
<210> 27
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gctccaattt cccacaacat tagt 24
<210> 28
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
aaggcctgtg tccgaacttt 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
tggaggggga aaactttgct 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
tctgtctccc ctcatcagcc 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
cttgctggtc ctccttctgg 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
accacagtcc atgccatcac 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
gcctgcttca ccaccttctt 20
<210> 34
<211> 977
<212> PRT
<213> 小鼠(Mouse)
<400> 34
Met Glu Leu Gly Pro Pro Leu Val Leu Leu Leu Ala Thr Val Trp His
1 5 10 15
Gly Gln Gly Ala Pro Val Ile Glu Pro Ser Gly Pro Glu Leu Val Val
20 25 30
Glu Pro Gly Glu Thr Val Thr Leu Arg Cys Val Ser Asn Gly Ser Val
35 40 45
Glu Trp Asp Gly Pro Ile Ser Pro Tyr Trp Thr Leu Asp Pro Glu Ser
50 55 60
Pro Gly Ser Thr Leu Thr Thr Arg Asn Ala Thr Phe Lys Asn Thr Gly
65 70 75 80
Thr Tyr Arg Cys Thr Glu Leu Glu Asp Pro Met Ala Gly Ser Thr Thr
85 90 95
Ile His Leu Tyr Val Lys Asp Pro Ala His Ser Trp Asn Leu Leu Ala
100 105 110
Gln Glu Val Thr Val Val Glu Gly Gln Glu Ala Val Leu Pro Cys Leu
115 120 125
Ile Thr Asp Pro Ala Leu Lys Asp Ser Val Ser Leu Met Arg Glu Gly
130 135 140
Gly Arg Gln Val Leu Arg Lys Thr Val Tyr Phe Phe Ser Pro Trp Arg
145 150 155 160
Gly Phe Ile Ile Arg Lys Ala Lys Val Leu Asp Ser Asn Thr Tyr Val
165 170 175
Cys Lys Thr Met Val Asn Gly Arg Glu Ser Thr Ser Thr Gly Ile Trp
180 185 190
Leu Lys Val Asn Arg Val His Pro Glu Pro Pro Gln Ile Lys Leu Glu
195 200 205
Pro Ser Lys Leu Val Arg Ile Arg Gly Glu Ala Ala Gln Ile Val Cys
210 215 220
Ser Ala Thr Asn Ala Glu Val Gly Phe Asn Val Ile Leu Lys Arg Gly
225 230 235 240
Asp Thr Lys Leu Glu Ile Pro Leu Asn Ser Asp Phe Gln Asp Asn Tyr
245 250 255
Tyr Lys Lys Val Arg Ala Leu Ser Leu Asn Ala Val Asp Phe Gln Asp
260 265 270
Ala Gly Ile Tyr Ser Cys Val Ala Ser Asn Asp Val Gly Thr Arg Thr
275 280 285
Ala Thr Met Asn Phe Gln Val Val Glu Ser Ala Tyr Leu Asn Leu Thr
290 295 300
Ser Glu Gln Ser Leu Leu Gln Glu Val Ser Val Gly Asp Ser Leu Ile
305 310 315 320
Leu Thr Val His Ala Asp Ala Tyr Pro Ser Ile Gln His Tyr Asn Trp
325 330 335
Thr Tyr Leu Gly Pro Phe Phe Glu Asp Gln Arg Lys Leu Glu Phe Ile
340 345 350
Thr Gln Arg Ala Ile Tyr Arg Tyr Thr Phe Lys Leu Phe Leu Asn Arg
355 360 365
Val Lys Ala Ser Glu Ala Gly Gln Tyr Phe Leu Met Ala Gln Asn Lys
370 375 380
Ala Gly Trp Asn Asn Leu Thr Phe Glu Leu Thr Leu Arg Tyr Pro Pro
385 390 395 400
Glu Val Ser Val Thr Trp Met Pro Val Asn Gly Ser Asp Val Leu Phe
405 410 415
Cys Asp Val Ser Gly Tyr Pro Gln Pro Ser Val Thr Trp Met Glu Cys
420 425 430
Arg Gly His Thr Asp Arg Cys Asp Glu Ala Gln Ala Leu Gln Val Trp
435 440 445
Asn Asp Thr His Pro Glu Val Leu Ser Gln Lys Pro Phe Asp Lys Val
450 455 460
Ile Ile Gln Ser Gln Leu Pro Ile Gly Thr Leu Lys His Asn Met Thr
465 470 475 480
Tyr Phe Cys Lys Thr His Asn Ser Val Gly Asn Ser Ser Gln Tyr Phe
485 490 495
Arg Ala Val Ser Leu Gly Gln Ser Lys Gln Leu Pro Asp Glu Ser Leu
500 505 510
Phe Thr Pro Val Val Val Ala Cys Met Ser Val Met Ser Leu Leu Val
515 520 525
Leu Leu Leu Leu Leu Leu Leu Tyr Lys Tyr Lys Gln Lys Pro Lys Tyr
530 535 540
Gln Val Arg Trp Lys Ile Ile Glu Arg Tyr Glu Gly Asn Ser Tyr Thr
545 550 555 560
Phe Ile Asp Pro Thr Gln Leu Pro Tyr Asn Glu Lys Trp Glu Phe Pro
565 570 575
Arg Asn Asn Leu Gln Phe Gly Lys Thr Leu Gly Ala Gly Ala Phe Gly
580 585 590
Lys Val Val Glu Ala Thr Ala Phe Gly Leu Gly Lys Glu Asp Ala Val
595 600 605
Leu Lys Val Ala Val Lys Met Leu Lys Ser Thr Ala His Ala Asp Glu
610 615 620
Lys Glu Ala Leu Met Ser Glu Leu Lys Ile Met Ser His Leu Gly Gln
625 630 635 640
His Glu Asn Ile Val Asn Leu Leu Gly Ala Cys Thr His Gly Gly Pro
645 650 655
Val Leu Val Ile Thr Glu Tyr Cys Cys Tyr Gly Asp Leu Leu Asn Phe
660 665 670
Leu Arg Arg Lys Ala Glu Ala Met Leu Gly Pro Ser Leu Ser Pro Gly
675 680 685
Gln Asp Ser Glu Gly Asp Ser Ser Tyr Lys Asn Ile His Leu Glu Lys
690 695 700
Lys Tyr Val Arg Arg Asp Ser Gly Phe Ser Ser Gln Gly Val Asp Thr
705 710 715 720
Tyr Val Glu Met Arg Pro Val Ser Thr Ser Ser Ser Asp Ser Phe Phe
725 730 735
Lys Gln Asp Leu Asp Lys Glu Ala Ser Arg Pro Leu Glu Leu Trp Asp
740 745 750
Leu Leu His Phe Ser Ser Gln Val Ala Gln Gly Met Ala Phe Leu Ala
755 760 765
Ser Lys Asn Cys Ile His Arg Asp Val Ala Ala Arg Asn Val Leu Leu
770 775 780
Thr Ser Gly His Val Ala Lys Ile Gly Asp Phe Gly Leu Ala Arg Asp
785 790 795 800
Ile Met Asn Asp Ser Asn Tyr Val Val Lys Gly Asn Ala Arg Leu Pro
805 810 815
Val Lys Trp Met Ala Pro Glu Ser Ile Phe Asp Cys Val Tyr Thr Val
820 825 830
Gln Ser Asp Val Trp Ser Tyr Gly Ile Leu Leu Trp Glu Ile Phe Ser
835 840 845
Leu Gly Leu Asn Pro Tyr Pro Gly Ile Leu Val Asn Asn Lys Phe Tyr
850 855 860
Lys Leu Val Lys Asp Gly Tyr Gln Met Ala Gln Pro Val Phe Ala Pro
865 870 875 880
Lys Asn Ile Tyr Ser Ile Met Gln Ser Cys Trp Asp Leu Glu Pro Thr
885 890 895
Arg Arg Pro Thr Phe Gln Gln Ile Cys Phe Leu Leu Gln Glu Gln Ala
900 905 910
Arg Leu Glu Arg Arg Asp Gln Asp Tyr Ala Asn Leu Pro Ser Ser Gly
915 920 925
Gly Ser Ser Gly Ser Asp Ser Gly Gly Gly Ser Ser Gly Gly Ser Ser
930 935 940
Ser Glu Pro Glu Glu Glu Ser Ser Ser Glu His Leu Ala Cys Cys Glu
945 950 955 960
Pro Gly Asp Ile Ala Gln Pro Leu Leu Gln Pro Asn Asn Tyr Gln Phe
965 970 975
Cys
<210> 35
<211> 972
<212> PRT
<213> 人(human)
<400> 35
Met Gly Pro Gly Val Leu Leu Leu Leu Leu Val Ala Thr Ala Trp His
1 5 10 15
Gly Gln Gly Ile Pro Val Ile Glu Pro Ser Val Pro Glu Leu Val Val
20 25 30
Lys Pro Gly Ala Thr Val Thr Leu Arg Cys Val Gly Asn Gly Ser Val
35 40 45
Glu Trp Asp Gly Pro Pro Ser Pro His Trp Thr Leu Tyr Ser Asp Gly
50 55 60
Ser Ser Ser Ile Leu Ser Thr Asn Asn Ala Thr Phe Gln Asn Thr Gly
65 70 75 80
Thr Tyr Arg Cys Thr Glu Pro Gly Asp Pro Leu Gly Gly Ser Ala Ala
85 90 95
Ile His Leu Tyr Val Lys Asp Pro Ala Arg Pro Trp Asn Val Leu Ala
100 105 110
Gln Glu Val Val Val Phe Glu Asp Gln Asp Ala Leu Leu Pro Cys Leu
115 120 125
Leu Thr Asp Pro Val Leu Glu Ala Gly Val Ser Leu Val Arg Val Arg
130 135 140
Gly Arg Pro Leu Met Arg His Thr Asn Tyr Ser Phe Ser Pro Trp His
145 150 155 160
Gly Phe Thr Ile His Arg Ala Lys Phe Ile Gln Ser Gln Asp Tyr Gln
165 170 175
Cys Ser Ala Leu Met Gly Gly Arg Lys Val Met Ser Ile Ser Ile Arg
180 185 190
Leu Lys Val Gln Lys Val Ile Pro Gly Pro Pro Ala Leu Thr Leu Val
195 200 205
Pro Ala Glu Leu Val Arg Ile Arg Gly Glu Ala Ala Gln Ile Val Cys
210 215 220
Ser Ala Ser Ser Val Asp Val Asn Phe Asp Val Phe Leu Gln His Asn
225 230 235 240
Asn Thr Lys Leu Ala Ile Pro Gln Gln Ser Asp Phe His Asn Asn Arg
245 250 255
Tyr Gln Lys Val Leu Thr Leu Asn Leu Asp Gln Val Asp Phe Gln His
260 265 270
Ala Gly Asn Tyr Ser Cys Val Ala Ser Asn Val Gln Gly Lys His Ser
275 280 285
Thr Ser Met Phe Phe Arg Val Val Glu Ser Ala Tyr Leu Asn Leu Ser
290 295 300
Ser Glu Gln Asn Leu Ile Gln Glu Val Thr Val Gly Glu Gly Leu Asn
305 310 315 320
Leu Lys Val Met Val Glu Ala Tyr Pro Gly Leu Gln Gly Phe Asn Trp
325 330 335
Thr Tyr Leu Gly Pro Phe Ser Asp His Gln Pro Glu Pro Lys Leu Ala
340 345 350
Asn Ala Thr Thr Lys Asp Thr Tyr Arg His Thr Phe Thr Leu Ser Leu
355 360 365
Pro Arg Leu Lys Pro Ser Glu Ala Gly Arg Tyr Ser Phe Leu Ala Arg
370 375 380
Asn Pro Gly Gly Trp Arg Ala Leu Thr Phe Glu Leu Thr Leu Arg Tyr
385 390 395 400
Pro Pro Glu Val Ser Val Ile Trp Thr Phe Ile Asn Gly Ser Gly Thr
405 410 415
Leu Leu Cys Ala Ala Ser Gly Tyr Pro Gln Pro Asn Val Thr Trp Leu
420 425 430
Gln Cys Ser Gly His Thr Asp Arg Cys Asp Glu Ala Gln Val Leu Gln
435 440 445
Val Trp Asp Asp Pro Tyr Pro Glu Val Leu Ser Gln Glu Pro Phe His
450 455 460
Lys Val Thr Val Gln Ser Leu Leu Thr Val Glu Thr Leu Glu His Asn
465 470 475 480
Gln Thr Tyr Glu Cys Arg Ala His Asn Ser Val Gly Ser Gly Ser Trp
485 490 495
Ala Phe Ile Pro Ile Ser Ala Gly Ala His Thr His Pro Pro Asp Glu
500 505 510
Phe Leu Phe Thr Pro Val Val Val Ala Cys Met Ser Ile Met Ala Leu
515 520 525
Leu Leu Leu Leu Leu Leu Leu Leu Leu Tyr Lys Tyr Lys Gln Lys Pro
530 535 540
Lys Tyr Gln Val Arg Trp Lys Ile Ile Glu Ser Tyr Glu Gly Asn Ser
545 550 555 560
Tyr Thr Phe Ile Asp Pro Thr Gln Leu Pro Tyr Asn Glu Lys Trp Glu
565 570 575
Phe Pro Arg Asn Asn Leu Gln Phe Gly Lys Thr Leu Gly Ala Gly Ala
580 585 590
Phe Gly Lys Val Val Glu Ala Thr Ala Phe Gly Leu Gly Lys Glu Asp
595 600 605
Ala Val Leu Lys Val Ala Val Lys Met Leu Lys Ser Thr Ala His Ala
610 615 620
Asp Glu Lys Glu Ala Leu Met Ser Glu Leu Lys Ile Met Ser His Leu
625 630 635 640
Gly Gln His Glu Asn Ile Val Asn Leu Leu Gly Ala Cys Thr His Gly
645 650 655
Gly Pro Val Leu Val Ile Thr Glu Tyr Cys Cys Tyr Gly Asp Leu Leu
660 665 670
Asn Phe Leu Arg Arg Lys Ala Glu Ala Met Leu Gly Pro Ser Leu Ser
675 680 685
Pro Gly Gln Asp Pro Glu Gly Gly Val Asp Tyr Lys Asn Ile His Leu
690 695 700
Glu Lys Lys Tyr Val Arg Arg Asp Ser Gly Phe Ser Ser Gln Gly Val
705 710 715 720
Asp Thr Tyr Val Glu Met Arg Pro Val Ser Thr Ser Ser Asn Asp Ser
725 730 735
Phe Ser Glu Gln Asp Leu Asp Lys Glu Asp Gly Arg Pro Leu Glu Leu
740 745 750
Arg Asp Leu Leu His Phe Ser Ser Gln Val Ala Gln Gly Met Ala Phe
755 760 765
Leu Ala Ser Lys Asn Cys Ile His Arg Asp Val Ala Ala Arg Asn Val
770 775 780
Leu Leu Thr Asn Gly His Val Ala Lys Ile Gly Asp Phe Gly Leu Ala
785 790 795 800
Arg Asp Ile Met Asn Asp Ser Asn Tyr Ile Val Lys Gly Asn Ala Arg
805 810 815
Leu Pro Val Lys Trp Met Ala Pro Glu Ser Ile Phe Asp Cys Val Tyr
820 825 830
Thr Val Gln Ser Asp Val Trp Ser Tyr Gly Ile Leu Leu Trp Glu Ile
835 840 845
Phe Ser Leu Gly Leu Asn Pro Tyr Pro Gly Ile Leu Val Asn Ser Lys
850 855 860
Phe Tyr Lys Leu Val Lys Asp Gly Tyr Gln Met Ala Gln Pro Ala Phe
865 870 875 880
Ala Pro Lys Asn Ile Tyr Ser Ile Met Gln Ala Cys Trp Ala Leu Glu
885 890 895
Pro Thr His Arg Pro Thr Phe Gln Gln Ile Cys Ser Phe Leu Gln Glu
900 905 910
Gln Ala Gln Glu Asp Arg Arg Glu Arg Asp Tyr Thr Asn Leu Pro Ser
915 920 925
Ser Ser Arg Ser Gly Gly Ser Gly Ser Ser Ser Ser Glu Leu Glu Glu
930 935 940
Glu Ser Ser Ser Glu His Leu Thr Cys Cys Glu Gln Gly Asp Ile Ala
945 950 955 960
Gln Pro Leu Leu Gln Pro Asn Asn Tyr Gln Phe Cys
965 970
<210> 36
<211> 4629
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
cagcaagtca gggtctgacc acttgcccta gaaatcaact atgaaaagtg attgctagag 60
gcaggaacag acttgaagcg tccaaggccc tgtctctggg gaagagttca ggtttaacta 120
taagaagacc tggttcagcg gggcaagagt cctgctcaca gtgggtgctg ttggatttta 180
ccagttggtc ccagaggagt tattcctggc tttcatggct tgaggaaaca gtttggtccc 240
catggctcat atttaggggt aacttcattt cttctcatgg ggtgaccgct ctcacctagg 300
gggataatgt catcatggag tgatttgtct acaggacttg ttatttttgg aacctagaat 360
aagtttggtt taggacaatt agtggagact tccagttgct gctataggag gctcattact 420
gtcaaagtcc aaatctccag ttaccttgag gccttctgcc ttaagggcag atgagaaagg 480
tatgaagaat gtaggataac ctgacctctc tcagccaggc tcactgctca tctgggagac 540
tcttatttat gctcctgact cagaggctgc tgctcttggg tatgactcct ctcctaagtg 600
tccttagagg tggtttccta agtctctcaa actccatcat ctcccttcag gatcagttga 660
gcctggcccc agattctgcc tcttcctctg gtgtgtggtg tgtgtgtgtg tgtgtgtgtg 720
tgtgtgtgtg tgtatgtgtg tgtgctttgt tttcttctag agacccaata tttccaaatt 780
ctgtagttcc ctttcaggca acctaaaaaa aaaaaaaaaa aaaaagggga agaggagcca 840
gtgcaacaga caggaacgtg ttcatctgtt cccgtcctca cagaactagc agctgggagc 900
cccgtgccca gccgactctc caacctgcat cggctcacgc tatcccctgg aggctatgga 960
gttggggcct cctctggtcc tgctgctggc cacagtttgg catggtaagg ggagaaaagg 1020
ggagtcctgc tgggggagtg ttgcaaagag ggcatcgctg tcctgcagta gatgcctcat 1080
tctctgcttc acttctctgg cataagagtg cagatttgtg tttatctgtc gagaagagta 1140
ggtgagagtg ggtggaacca cccggggcca gtgctgtgga tgtgtctgag cctaggcttt 1200
gactcacggt gtgctctgag tgtgaccctg gtattttcag gaccaccatc cacatctact 1260
cgtctgcagg tgggagggag ggcggtagtg ggctaacctt gagtgcagcg ctttggggtg 1320
ttacctggga gtctccttta aggcagattc ccataggtct tggtcaggac tgagattcgc 1380
atttctgagg aaatcttatg cgtcagggct gctcaatagc ttttgctgtt cttctttgag 1440
tggtcccacc agctggacag cccagcaggc tgtggttaat taggacctgg cccattcttg 1500
gaaggcttgg gtgaaaaggg tcagggtaga ggaaagaaga ggcctttttg gcccaggact 1560
caagggtgaa aagtttggac aggggtcgga ggagaacacc cgtgagtgag agatcctatg 1620
aataagcaag gaaggatgct agagaggggc ctggggaagg ccagagaggg tctccctaga 1680
cactgtcttc ctaggtctct ccccccaact tctcgggcag cagaagctgc ttcggaactc 1740
ccattcttgg aggaggtctg gctgagggtg agaacgaaca taaatggccc agtgcagcgc 1800
aaggatccca tctaggctcc agctggccta gcacacacat gttctatacc acaccactgc 1860
ttatttggaa agaccttgag ggaagatgct ggggaaggac aggctcattc tggtccctgg 1920
ggaattggtg agatgacagt ccgtggaagg ctctttgctg gctcagccga tctcactggc 1980
tcgtgcactg gcacattcct agtagaatgg gattggtatg tatgcatgag aaagcacaca 2040
ttcttaagaa tactgttaaa gggcatgtga cagatgtgtg tgtgtcaatg cagccctgac 2100
tcagctaaga aagagacaat tattattcct ctcatgccag aaaatcctgt gatttttggt 2160
tcactgcttt tcagtcttta tctcgagggc tgcttgtggg gcagagtgtg tgagtggctg 2220
catgcctgcg tgtgtgtgtg tgtgtgtgtg tgtgtctgtc tgtctgtatc cagctccaaa 2280
aggaagagaa gttgggagat atcagtggaa agcctggggt tttaacctgg aaaattattg 2340
gtgtgtgggt gggaccatgg gggcttctgt aggagctgga atagtgttga agcatttagt 2400
ggcagagaga gagaaagaga gagagagaaa gagagagaga gagagagaga gagagagaga 2460
gagagagaga gagagagaga gagagactgg cctcttctct ttgagtggta gtcatgagtg 2520
caagaggttg gggagcctcc tggagctgat ggtggaagag tccattttgc aagtacaaag 2580
aggagaaagt ttgggtcatg gggagaattc cagaagggag atgcgagatg aagaatggcc 2640
aggatcaggg catcagtggc catcaagtgc tcatccaagg gaaggtagtg atcagcgtgc 2700
ttccctcccg ccaaccctgc cagcgggaag tgagaccatc atgcggctta cgtggaattc 2760
gtcagccctg ttctgtgtaa atatccaggg caacaggcta ggcagaaata agaaggaagc 2820
ttctctcgga gcacatttcc tggaggccaa gacaggagac aaagataagc agagcagagt 2880
agcccgggag aagggagaag tgtctggaac ccaaagatgt gtcctgtgac ctttagggtt 2940
aaggtcctta gctaccacat agcaggccca agagggacat tagcagtacg gcctgagaac 3000
agcaggtggg tcaggaggac tccactgccc tctaggtggc cgctgggatt gttctcacag 3060
gacagaagaa tatctgatgc tcagagggtc aatggctatc agggtcccta gccatagtca 3120
atgtgagccc agggtgaaat agctcgtccc tcttcctgct gatcactgcc caggagagcc 3180
agagccctac atcagcagca gcacactgct ctcctctgtt ccacatctgg ctggttggag 3240
gcttgggcag acaggccaca tgtttccaaa gagtttgaat cagagtgagc agacattaaa 3300
ccaggctgaa atcatctgtg agatgagact ttccatttct gggctcgtgt gtgtgtgtgt 3360
gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgacccact gagagcggtt gtaggaaacc 3420
ctgaagtcct ctaagggctt gatgccctta gggctgccct gtcactgtgt aggaagggtt 3480
gacttgcggg gtcagcaaac aggacagtgg cacagcacag acagactgtg cccagtgtgc 3540
tctgaaaccc agcactcctt gccaagagtc cctcagtgtg tgagaaggac aatggccagg 3600
aggccaggga agcagaagtg agagcccaag tgtcgaaggg ccacaggctg ggcggaaacc 3660
agggccagcc gggtgccagc aatgtgtttc cgcccacaca ggccgggggc gcctgccagg 3720
ccctcagagg ctgtgaatca gttctcactt ccccccttcc cccctatttc aagcctggga 3780
aaaatgctga caccacacag gcaacgagcc tccttcccta agacctgaca gggggtttga 3840
gttctccttt cgccttcaag caaattttcc ttaaaagaga ttggctgcca agaaacccag 3900
caggctcaga gaagcgaggg cagactgggt acctcagcag actgggtacc tctctccttc 3960
atgagcatgg cattctgagc ccccaatgag tctgtactgg agcaggggat gacacaacgg 4020
tttcctggca tctgaacagc ttagcatggc ggggcaatgt gctcactgtc tgcacttgtg 4080
ggtgaaaaga caaaagggag gaggaggatg gatggtctca ggccacccca cagcgcacag 4140
acccgatgcc cagtggtagg agtgggggca gcaggagaca cttggaagat ctctttctac 4200
tgggctaaga actcatgtgt cttttttttt ttttttttct ttcccaagtg aaggaagatg 4260
gcccaggact tggccatctg tttctccatt ggcttatttg aaacatgtct tacttaaaca 4320
ggcttggcct gcttagtaca cgagattgat ggtgccctct cctgggatgg gaaacgatgc 4380
caaaggctgg gcctccgtgg ctttgtggag aagcctacat gtgtggctaa ggaggcgccc 4440
acgtaggtct cagggatgag cctcctgaga gtggcagatg tcaatagagt tggaagctga 4500
ttgaagggtc cagactcatt ccagaaccag agccagagct atcccttcca aagcatggtc 4560
cagtgttggg ggacatctgg ggtgcacccc aggcctcact tgtgtctgcc acctccttca 4620
ggtcagggg 4629
<210> 37
<211> 4516
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
ctgtccttgg agaaacacaa aacccttcct catacggaac taaaagctgt ctctggtgcc 60
ccataagcac caggatctca gagctctttc tgccttgact gacaggcctc acctcatggt 120
ggtctaaggc acctcagctc tctctacaac accattttct gaatatatca ccctgggtac 180
cgtctcattt cccatccagg aaacttacct gcttcttatg tagcccaaag ccaggggacc 240
tgcagcctca ggctggcctt ttctccttca cccttggatg tccattgact gagttgctcc 300
tgaaagaaag acctgaaaga ggcagtctag ttagcagctc tcttctggcc aacctctttg 360
taggtagggg acttggcccc acctgtcttt atccccaggt ctgagtgaga catggcctgt 420
ctatggaagg gttgtttctg ctaagggctg agttgagtca tccccttctg tcccccagag 480
aaaccacaac agtggggaag gcacagggga agaggaaagg acccgagtca gctggcccca 540
gggataggga aaaggtaggg aggatgatgg gtagagagaa gggaagggta gactcagaaa 600
gaaaccactg aacagatttt gggcccaggc ctaaattgaa ggaggagggt ctggagagct 660
tccaggagaa atgcccaggt ctttaccatc cccaggctca atacctaccc cacagaccaa 720
gggcctgatg gggagggtgg ccaaggtctg atgttcccaa gccctcttca atctctgtca 780
aggaatcagt ggagagcctc aacttagagc tagcatgagc aaccagtgaa ttgatctgca 840
gtgaggattt agctaggccc agctcccaag aaagcaaagc attccagtca tccctccttc 900
taggaaggga cctcacaggc cactctacct tcacaaggac aggaccccag agtcaccggg 960
gacggaaaga attcttgagg ttggcagggc ctccgtgctc aaatcatgga ttcggccatg 1020
ggagcttcca gctgaacctc ccttccccct cagaccatcc cttccaacat tgtcctagca 1080
gaggtgggag ggctgagtca gcccagctgc agaggaacaa gggaagcaga agtggctaga 1140
aggaaaacag ttgcagccac agagactcct ggagatggaa gatggaagtg acgggagggg 1200
tcacccagcc ggagggagtt cctctccaga gctcacttca gccactttgc ccaagccata 1260
acatacactt actttattgt tgctgttact agaagtggtg ttttgtgttt gtttgtttgg 1320
ttggttggtt ggttggtttt gttttgtttt gttttgggga ctgggtctcc tatagctttg 1380
aggatggcct caaactccct ctgtagctaa ggctggccat agacacccga tcttcctgct 1440
tccatctccc aaggatgcca gtgtgtgtct tcatgcccac tgggtgtcct tccttatgtc 1500
taactacagt cttctctctt aaagctccag ctggaaggtc ttccttgtag ctacataaac 1560
tctcctctgc ctgtaagact tcagcaatag gctacctcct ccccaacact aactcatgca 1620
tcctttagct cttcttgcta agcacccttg aaggaaggac cttggttgct ggacacagcc 1680
cagtccctgt ccccaaggcc tgactgaaca caagttggtc aggggactga aagtcttggt 1740
gtcctccacc accccagcct agctttcact gtcccatata tgtggccttc cctcagttct 1800
tctcagggca gctcttggca tgatgccctc atgcagttgc ccctggggca gggaaaggtg 1860
aagtactcac tccctctgct actgagaacc tgagagggaa ctggagacag cagaatgtgt 1920
gatatgcagg gcaccccctt tgtgggaggg cacttcctca gcacctttcc ttcttcctag 1980
agttaggaga cagcccctgt cttagaggct tcctgacctt cctgcctgga ggctcccctc 2040
tatttactaa gtcacatggt cacctaccta tttcccgagt ttgtcaggat cgtacccatc 2100
tcaaggctgc ccagcatctg tgggctctat gcctggaaca cttacttctg cctcctcagg 2160
gactctctta taccattctc tgccctgtca ccctgcttcg taggcttcat gaccttattt 2220
tttttttcaa atgttttaaa acatttgttt ctggggctgg gaatatgact cagaggttaa 2280
gagcactgac tgctcttcta gaggacccag gctcaatttc cagcaaccac aggttgattc 2340
aaaatgatct gtaagcccag ttctagggga tccaaccttc tcttctgacc ccgttggata 2400
acaggcatgc atgtggtgcg acagttatac atgcaggaaa aacacccata tacataaaat 2460
aataaaaaat taaaatagca tttgttagta tgtattgatt atatactata ctataatata 2520
taatgatgaa tttcttgtga catcttcaaa catgtaccta atgtatattg atgatattgt 2580
tcacattcac ctcccattac cctcgtcccc cgctcatatc tgctgttccc ctttctgtcc 2640
ccaaactcct ctttcacttt aatttgtgta tgtgtgtgtg aatatgtgtg tgcttgctcg 2700
caggtgtatg tatgtatgta tgtatgtatg tatgtatgta tgtgtatata tttgtgtgtt 2760
tgtgtgcttg tatgtatgca tgcatatgtt ctaatatcta tcattagggt tgcttgcaga 2820
agtgtaggtg agttatttat agagattaag ctatacaatt gaagaaaaca tctctcccac 2880
caccagtaat cactaactgc ctgcagatat tcagggtggg gagcacttgt gagcctctcc 2940
ctcctccacg acgggatgtt gataagactg atcctgtcag gatcttaggc aggtacccac 3000
agctgctgtg agttcagcgc agcaggcaca tcacgcccgg ctgacagtag tgcctaaccc 3060
tccagacgat gccagctctt gtattctttt ctatggtgtc ccctgagccc cagagcgatg 3120
cagctggctg tctcctttat ggcccagtgt tcactggtcg ctcactctca gcactttgtc 3180
agtcatgagt ctctgcagtt actgctgaca gttgcaaaca gcagcttctc caaggaaagc 3240
cgagaacagc actatctatg gggacaggca gacttattta gaaagttagt tgacaggcac 3300
tactgtatcc atttagcaaa acagcagctg gacagtcccc actaaggcta gtaccctccc 3360
tagccaggag cttttgacca aaattacagt accagatgtg gcttcaacct gtagcctcaa 3420
tgtcaatcag aaagcataca gacactccaa tagcagaccc gactttattt gcacgtcttt 3480
tgaggcatta tctgactgtt ccctatttat ttatttaagt tgaatgtctc ttttagccat 3540
tcaaatgcca gccccacagg gccaatcaag gagttgatca tgcatgatga tagaaataca 3600
tgctcaagag gcaggcagat ttctgagttc gaggtcagcc tggtctacag agtaagttcc 3660
aggacagcca aggctacaca gagaaaaacc ctgtctcgaa aaaacaaaaa caaacaaaca 3720
aaaaaaaaaa aagaaagaaa gaaatacgtg ctcagtaaaa tgtctgggag gctgtattgt 3780
tcagcctgga gaagagagca aagtttgact tcagtgtagt tgagatgatg agatgatgct 3840
cagcgaaagg aggcggtccc aaaagatgtc acgtgactgt tgatacgaaa tactcagaac 3900
agtaaaataa attcatgcct tccagtggct agaaagagcg gggggagggg ggagtagggg 3960
agtgctctcc actggccaca gcagagcttg tttctacaag gtcagaagag ttctagatat 4020
tggtttccta tcattactaa taaactcaat accaccgagg tatatgcttg aaatgtttgg 4080
gatggtacat tatctgtttt gtatacttca ctagaattga aaaagaaagc agggctggag 4140
aatagcttag ttgtatagta tgttcttaca catatataag atcctggccc aatccctagc 4200
acccaaaaca gaaatgggaa cataaactct ttgggtgagc aagtggacag gtccatgaat 4260
aatgagtgga tagttctcaa cttctaccct cctccacctt ggcccaggaa atgtcaaata 4320
cagagtcatc aagggagaac tttgggaatc atctgagtct ttgagtgaac agttttaaat 4380
gagtctgagc cttgacgaag gagggaaggt cacatagtaa aggcagaatc aagcacagac 4440
tagttttgga tgctctgtcc acaagatgcc atggtccctc tcagcacata gtaggctgac 4500
aagcttctgg attgtc 4516
<210> 38
<211> 12727
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
atcccagtga tagagcccag tgtccctgag ctggtcgtga agccaggagc aacggtgacc 60
ttgcgatgtg tgggcaatgg cagcgtggaa tgggatggcc ccccatcacc tcactggacc 120
ctgtactctg atggctccag cagcatcctc agcaccaaca acgctacctt ccaaaacacg 180
gggacctatc gctgcactga gcctggagac cccctgggag gcagcgccgc catccacctc 240
tatgtcaaag gtgaggagtc tgagcctcct cccaagaggc ctgacccggc aggccccact 300
acaatgggcc ctaaaattaa caatcgtaac aattcagctc tgcatttact gagtgctggc 360
tatgagcaag gacctggaag agctgctaat gtaatgcagt cctcacaaca accctgcaag 420
tcgggtctat gatgatgcat tttctagaag tgcagggagg ttatccaagg tcacacagcc 480
tcacatagtg ggactagact ggagcccagg tgcgcctgac tctggagcca ccacgctgaa 540
gcatccgctg aactgtcctg gcgtggtgtg acctcagatg aatgatcagc ctctctgagc 600
ttccttgtca cctatgtcca ggtactcctt ggcccagtgg agggagggca gttgtaaccc 660
tgtgccctcc tctactctag accctgcccg gccctggaac gtgctagcac aggaggtggt 720
cgtgttcgag gaccaggacg cactactgcc ctgtctgctc acagacccgg tgctggaagc 780
aggcgtctcg ctggtgcgtg tgcgtggccg gcccctcatg cgccacacca actactcctt 840
ctcgccctgg catggcttca ccatccacag ggccaagttc attcagagcc aggactatca 900
atgcagtgcc ctgatgggtg gcaggaaggt gatgtccatc agcatccggc tgaaagtgca 960
gaaaggtgcg tggggcatgg ggaccggcag ccaggcctga agagtgggga cagagagccg 1020
gcggccacat gggtggtgac tggggactgg gtgtgatggg gggcagtggg atgtcctctt 1080
tctttcactt cttcccctca atggttccac gatcatctat ggggcaggac tgacaaggtg 1140
tcggggcagg gagacaaacc acatgtgagc aaataactca gtgggcaagg tcatctcaag 1200
tcattggaca tgctacaaaa ataaacattc aacatggtag ctgaataagg agtgtgtagg 1260
gcggggagcc tcactgagaa ggaaacactt tattagagcg gaaatctgaa tgacatgaag 1320
aaggtggctg tgcaaagatc tgcttcagca gggggacagt gagtaccaag tggtgaggtg 1380
gggacaggct ctgaatgttc taggtatgga aagaggacgg aagctcagcc tcagacatgg 1440
atttcccact gggggcctgc ctaaggccaa gtgctgggca tgtgtaggag ggatgctgag 1500
ccaagaggca gggaggagat ggtgggtgcg tgtgatggct ctcgcggtgg ccaggtaaca 1560
gtggaggtgg agtctcaccc tgctgggatg gcaggcagga ttctggtttc tgggaggact 1620
ggtgagagca agcaggaccc cagcctgagg acctgggctt gagacagcaa tcagtccctg 1680
taacaagggc cagggtcaga gtgaagcagc tagcccaatg ccactgggat ctgaagccac 1740
taaacctgcc cagggggtca aaggacccca gctgtgtggg cagaggaggc cattagggct 1800
ctttcctggc atttcatcct gcagagccct gggctggcca agagccaaag gtcctgggcc 1860
ctagttctgc cttgacaccc cctcagggac cttgggtgag tcctttcatg tccctgggcc 1920
ttaggaatct ggattagatt atctttcaac agcagcaatg ggcataaata tgaattcaag 1980
gcctactgtg catcaggcat cttgctggct gctggaatat tcctgtcacg gatttgacat 2040
tcgactagag tctaactatt aaatagaaag taaatacaaa tgtgatgagc aagaaaccaa 2100
gctggggagt ggcgggcatg gaggtgctgg ggaggctaat tcatatcagc tggtcacaga 2160
agccttgctg aggaattttt gagctaaaga tctgaaggat gagaacagcc tcccatttga 2220
agtgtgggag gaaaggcatt ccaggaggga aaggtgggtg caaaggccct gtggtaggaa 2280
agaggtccag cgggctgcag tgcagtgaac aaggggtggg gttatcaggg cggtcagaaa 2340
caggttgggc tgtggaagga ctttgacttc ttttctgaga gtaatgggaa gccccaaatg 2400
tttacagagg agagaggcat ggtcccattt atatttgtaa gaggtcactt tagtgaagaa 2460
tctaggtgtg gggggcttgg agggaggcag ggaggtctct gaggaggctg gtgcagaagt 2520
ccagagtgga gaatggtgac gggactgggg aggggtagag gtgatggaga aagtagactt 2580
tccaaggtct ctttaggaca ggccttgcag tggggggact gggagcatca aggctgcctc 2640
ccaggatttg ggatggggca gtgatgggga ccctggcctg tgtgtcctgg cccatggcag 2700
ggaggagagc aatatctcta tcatgttcag ggagcctggg tgttcagggg tctctccccc 2760
ggtctcagtc atcccagggc ccccagcctt gacactggtg cctgcagagc tggtgcggat 2820
tcgaggggag gctgcccaga tcgtgtgctc agccagcagc gttgatgtta actttgatgt 2880
cttcctccaa cacaacaaca ccaaggtcag tccctgcaga tcacaaggtg aagtctggcc 2940
atcctcccag cacaccaggt ttcccatggt ggagtcctgg gcccccaact ccaaactggc 3000
tgtcttagct gaaggcacag ctcagactcc agagaggggt gcagactcac ccgagatctc 3060
actcccagtc agtagctgac acagaatcag gactcatgct tgtgccgctg aactttgtgg 3120
gggtgggtgg ggggaggtgg ttctctgtca ccttgacaca tggcctttgc cccagccttt 3180
agacaaaagc cagaggtgag ctcacttctg atttagcaag ggtttcctag gccaccattg 3240
aagcccagga atataacagc tatttcagaa agacattggg agagagggag gaggagggag 3300
gattccagga gggactcacg ttgggctgcc tctaagagcc ccctcccttc ccactgcacc 3360
tgccgtgttc cagacacagc cctaagccac ttgcatgcat atctcattta ctcctcacta 3420
cagtcttggg gcagggagcc agtattagcc ccattttaca agtgaagcaa caggctcaga 3480
ggaaaggcag atagtaatcc ttaaaggctg aggattggaa cccagatctt tctaatccct 3540
aaactacctt ggtataacat ctccattcct tctggctgca gctcgcaatc cctcaacaat 3600
ctgactttca taataaccgt taccaaaaag tcctgaccct caacctcgat caagtagatt 3660
tccaacatgc cggcaactac tcctgcgtgg ccagcaacgt gcagggcaag cactccacct 3720
ccatgttctt ccgggtggta ggtaagcatc agggtggtgg tggacagtcg gtagggatcc 3780
tgcaggagtg tgagcagaag ggttttgagg aggaagctga tgtcagggaa ggagacctgc 3840
tgaggatatc tctgctggag tttgtttatc caaggcctgg ctaaggagcc actctccagg 3900
agctttccct taccctctcc tgggatctct ctcccatctt ggagctctta cagtgcatgg 3960
ctgcattggg tgcaccttag tgccattttt tgtttatttg gggattgggg tccagtagct 4020
ccctactgga cttcatttgt tcattctttc atgcattcct ttatggaaac atgaaaagac 4080
aatgatcacc cagtgattat gggggaagca caaggtgtcc tgggaacact gaagagtccc 4140
cccaacccag gcttcgagaa ggtggcctct aaactgggat gggaagaatg aaggtgagtt 4200
ggccgggcag aagggtggga aaggaagggg aacagcgctt ctggcagagg gaggaacata 4260
tgcaaggctc aaaggcaaag agaacataga tcatttggaa cactgaaaga acttgacaac 4320
agctgggatg tggagtggtg tgaggagtgg ccacagggga gcagaggagg tggcagaagc 4380
cggaggtaaa ggtgtcttaa agtgagaaag aataactgca tcttaaccta ttgggaggtc 4440
attgtaaaga ggagagtgat ggggtcagat tgtacagagg aggcacttcg tggtggtcag 4500
gagcacacac tccagggcag tgttccaacc tgagtctgcc aaggactagc aggttgctaa 4560
ccaccctgtg tctcagtttt cctacctgta aaatgaagat attaacagta actgccttca 4620
tagatagaag atagatagat tagatagata gatagataga tagatagata gatagataga 4680
tagatagata gataggaagt acttagaaca gggtctgaca caggaaatgc tgtccaagtg 4740
tgcaccagga gatagtatct gagaaggctc agtctggcac catgtgggtt gggtgggaac 4800
ctggaggctg gagaatgggc tgaagatggc cagtggtgtg tggaagagtc tgagatgcag 4860
ggatgaggaa gagaaaggag ataaggatga cctccaggtc tctggctatg gtgattgggt 4920
gcaggcagtg gcagtcactg gactcagacc ctgaagcaag gcagcagctc atcggagtgg 4980
gagcaggctc tgagacattt aggtctggcc gtgcctcatg tgttgaatgt tatgggagat 5040
ggaggtggcg aggagcatga gaatcatgag catcactgcc cctagagtat gtgcaaggca 5100
ctggacttgc agcagattgt gagctctgct gtggacccca atctgcactg ggagctttgg 5160
cagggtaaag gggaagaaga gcaaaagcac aagaattcag ttacggcttc taatcctgtc 5220
tgctttctag tacaggcata cagtcatcac tcaagaaatg tttatgttca ttcacacttt 5280
gggccagaca ctgttctaga catcgaggat acagctgcaa gtgaaacaga tacaacaacc 5340
cccgactcat gaagtgtgtg ctctagctgg gagtgggcaa gcaatgagcc aagtaaatta 5400
ttaaaaaaac aaattatata gcatttgcag cttcagatag ggtgttcacc aaggaagatc 5460
tcactagaaa gctgatattt gagcaaaggc ttaaattgct gaaggagcaa gccatgcggc 5520
cattttggag aagggagctc catcctgcag cgggactgtg cttgccatgt tcaggggaca 5580
agtgggccag tgtggctgcg gggagagagt gagaaaaaaa gtggtctcag atgaggtcag 5640
agagctaaag tgggaaggtg agatgaaagg aggctaccgc agtggtccag gctggagctg 5700
atggtgggtg gactagagtg gtaatggtga aggcagcagg aagttgttgg tgtttggatg 5760
gatgaatgga ctaatggatg gatgaataat agatagatgg attgttgaga gagacagaga 5820
agagaaaagc cttgccccca aaagctcaca gactacttgg agagagaaga aagctacctg 5880
gagggagaac cagatgcatg aagcagtgca gatgtggtgc ctaatgagtg tgtagtctgg 5940
aagggcagca aaagtcgagt ggagtgagag gttcctgtgt cctggagcac tgagtagaga 6000
ctccctcatg ggggtgaatc ttaaaggata aaggggcctc tataatgaaa aggaggagga 6060
tgggatttct ggtagaggaa attgcttgag caaaacctcc aaggttggaa tgactatggt 6120
gtgttcaggg atgttaggag acccagatgg gtggagcgtt gagtgtgtgt gtgtaggaag 6180
gaagagggga ggtggctgga tgagcacagt gagacctgat ttgattgaga gccttgaacg 6240
ccacgctgaa taatggaggc aatgggactc catagagggc ttttgagtag acatatatca 6300
gtgtagaagg gtgaatttca gatttttaga cagaatagag taaggagagg agctcttaga 6360
aatcatctag tccagggctt gtggcagagc cctgaggttt taagaaggca tgtcaggggc 6420
taccatgaca ggcacggaga ggctgagtga attggggttc ttgccacaat tcccttgcct 6480
gagattcaac aagagcagct gtattacaat ctgtgcaaaa tgtcattagg agaaactagt 6540
tagtagctgg gcgtggtggc atgcaactgt tgtcccagct actcgggagg ctgaggccgg 6600
agaatcgctt gaacctggga ggcggaggtt gcagtgagca gagactgtgc cactgcactc 6660
cagcctggat gacagagcaa gactctgttt caaaaaaaaa aaaaaaaaaa actagtcagg 6720
actctttcag atacaagtaa tagaaaccaa ctcaaactgg cctaattaaa aggatttttt 6780
tccttatagc taaaaagctc atggatatca gcttcaggaa cacttggatc caggtgttca 6840
gctgatgctg gaaagaatct atgactcccc aactctcagc cctgccagga aggctttccc 6900
cttgtaggac tccgactatc cgccttgtag tatctgatcc agcaacacca gtaaaatgag 6960
ggcttctctt ttcccagagt cttaacaaaa atcatggaat tgagtgttat ggactcatgg 7020
attcatggta acccaaacca atcaccgggc cagaggggac agagtaccct cactggttgg 7080
cctgggttac acacctactc cagagctata tttggaagcc gcattgacta atttatgacc 7140
agaagaaagg gaaatggatg aggacacgtg aaattgtgtg tgtatgtgtg tgtgtgtttt 7200
cttgctgcca aaaatttttc aaaaacttgg aaaatcacag atatattcaa tctcttcatt 7260
acacaaataa ggagatggag gcacaaatgg ggatagggat ttgcccaggt tctcctaggg 7320
cttcagtgag aaaagttttg atccagggat tctgaagggg gtggtgagaa gaggggtgtc 7380
agaggacctg tcttgggtgg tggggactat gtacctgtga catagctgct cagggactgg 7440
atcaatgggt ggatgacaaa atggacaaat aaacaaggac atcttcccac taatgccaga 7500
tgcttgtgtg ttctgctttc cagagagtgc ctacttgaac ttgagctctg agcagaacct 7560
catccaggag gtgaccgtgg gggaggggct caacctcaaa gtcatggtgg aggcctaccc 7620
aggcctgcaa ggttttaact ggacctacct gggacccttt tctgaccacc agcctgagcc 7680
caagcttgct aatgctacca ccaaggacac atacaggtac cacttatcag ctcccgtcta 7740
cacagcccga caaccagatg gggtatgctt cagcaagcat caggacgctt ggctcatgtc 7800
ccaaccttgg tgtatgacct tgagcaagtc cctgcccctt tctgggcttc gctttccctg 7860
acttcatgga atcccaatat tggtcatctg tgtttgagat ctagatgaaa ttgacctacc 7920
tctccatccc acatccttgg gatagtcaat gccccaccca aggattctac catttcttgg 7980
gagtgtgcat tctcattggt ccctcaagaa ccctcagcct cattcatttt cctctcttgg 8040
ggccaatcca aatgcagaaa acagccccac tcatagacac actcctgata atgactgcac 8100
aagttatctg ctacatacaa aagcttggag ggaggggaag agggaattaa gatcacacaa 8160
tcacagatac atgaaatgtt ctttaaagga ttgtgatcac ccagccccaa gaatttctca 8220
ctggctgctc ttctctgtaa gctcaaaact cttcccatga agtgcaatct ataataactc 8280
cacacccctc ttcttccgtc tctccactcc cacaatcctg tgtattccac acacatttta 8340
gaaatctttt tcctgtctgc ttgtgaactg tgttcttggg gtcttgcttt ctcatccaaa 8400
gtggcttaag caggtaggtt ctaaataaga aagctttgtg cctaagagga acactcatac 8460
caggtatatc aggtattaac tcaggtatta aaatagttcc ttcttttctt tctttttatt 8520
atttttttta gatggagttt tgctcttgtt gctggagtgc aatggcacaa tctcggctca 8580
ctgcaaactc ggcctcccgg gttcaagtga ttctcctgcc tcagcctccc gagtagctgg 8640
gattacagat gcccaccacc acacccagct aatttttgta tttttagtag agacagagtt 8700
tcaccatgtt ggccaggctg gtctcgaact cctgacctca ggtgatctgc ctgcctcggc 8760
ctcccaaggt gctaggatta caggtgtgag ccatcgtgcc tggcctgaaa taatcattca 8820
taccctgccc tttcagaggg agacagtaca gcttaagggc agcgaatacg tggtgtgcat 8880
gccacactca ctctcattct tgtttctgca actctgttct gcagagtgta gatgcggcct 8940
cagagtcctc ctcaacacag gtcccaggca gtatttccag catagttggc tcatgagaga 9000
tctgtttgtc atccctgtgt ggatccctta gacaacttca aaactctttg ggattctcgt 9060
tctagctctg gaagcccaaa cctcattgat tcccacaatc ttgcttgtca attgtcagaa 9120
gcaacaagga tgttttcttg tcctcatctt cctcctctca gttcccttct ggtcctttct 9180
ggccaggtct ctgtcttcct ctcatttaaa gcagaagttc tgaatctgga atgtgtaggc 9240
cctttggagg gggctggtcc atggatcggt ttaatgggtc cataagccac agagacattg 9300
aggaaaggaa cacgagatcc cctaaaacac agtagtctgg gcccattcag cacaaggcag 9360
acaagcctgg acaccaaaca gccacagaat tttagttcat gtgatgggtt gttcataatg 9420
gtgactttca attatccaaa aaagtcaaat tatttttagt taaaggggtt agttatctca 9480
agaagtgacc tgggcagagg ccttgtatat gcccagggtc tggctggatg agactgctct 9540
ctgaatacca tagattttag tctagtagta gctgcagaca tttcccaagc aagaactggc 9600
catttgctat aatttttaaa attttattta ttttgacagt gaactggggg actttttaaa 9660
aaatgtattt attacctaaa caacacatgt tcattatgga caaattgtaa aatagagatt 9720
aaagaaagaa taaaacaaaa aatttcccag aatcagccaa agatgatttt tattgttagt 9780
ttttgctcca gggccttttc tgtaataaag ggtaccattg aattgagtgc ccacaaagat 9840
tcaacttctg tgtcaagcac cctaaaaagg tcctttaatc ctcaagccaa gcctgtgaat 9900
taataaccat cgatatcact ctcacagcaa aggaagtgag ggatcagaga ggttaagtac 9960
ttgtctaaga tcacacagcc aagaaacagc agcaccagga cttgaacccc agtctctgca 10020
gcaacatggc tcagaaccca gggccctaca tcctgcctct tgtctctttc tcagtccctc 10080
ttggcaaggt tggcacttca gggatttgta gcagggattg cagctttcat gaaagcttag 10140
tccagtgaca gtggtcaacg taggcgacct gtgataggcc tcccagcacc ttgaagacat 10200
cacctctatt aaacctcggg aaaaaaacac tttcagataa gaaaaccaac taaggaaatg 10260
ggattggtgg tttttgcatg tctcaatggc accctgtctg agtatctggc ttacccaagg 10320
ccgttgggcc ctgaatattt taccaaaaat aaaataaacc cctttaaggc tgttatctga 10380
ctgcaatcct ggcaggggcc atactaggct ggggctcacc aacaccacct gattctctcc 10440
tgcaggcaca ccttcaccct ctctctgccc cgcctgaagc cctctgaggc tggccgctac 10500
tccttcctgg ccagaaaccc aggaggctgg agagctctga cgtttgagct cacccttcga 10560
tgtgagtgct ggggccgagc gccacctggg gcggaggccc tgggactgcc tggagggatg 10620
gggttgactg gggcagggca cagggaagta ggtactggga gattgggagg tggcggggaa 10680
agtgtgactt ggggcctcct cctttcttcc tcagaccccc cagaggtaag cgtcatatgg 10740
acattcatca acggctctgg cacccttttg tgtgctgcct ctgggtaccc ccagcccaac 10800
gtgacatggc tgcagtgcag tggccacact gataggtaag tgggctccac tcacctccct 10860
cacctgggct caggggctgg gcaccctgtg agtgggaggg acatgctggc gctgggaacc 10920
ctgaagctct gagccacatt ctgcttttgc caggtgtgat gaggcccaag tgctgcaggt 10980
ctgggatgac ccataccctg aggtcctgag ccaggagccc ttccacaagg tgacggtgca 11040
gagcctgctg actgttgaga ccttagagca caaccaaacc tacgagtgca gggcccacaa 11100
cagcgtgggg agtggctcct gggccttcat acccatctct gcaggtgaga gggagccttc 11160
gcacccgcac cgcccccccg cccgcccccc gcccctgctc ctttaggcgg ctcctccccc 11220
accccccacc gagggagctg gggttggctc cacctttgga gcagatccta gcagtaccaa 11280
ggtccacctc tctgggccag tccaagcccc tcctgcctgg caggtccccc gaagcagtag 11340
gacggggtag tctctgagaa agcagagaga aagcagcctg aagaaactgg cccccactct 11400
tgtccctgca ctctaactca tgcatctatt cacaagtatg tgcaggcatt atgcaccgtg 11460
tgccagggac gtgccctatg cagggaagca gtgcctcccc agagctcaga ggctgatgag 11520
ggaggcaggc aatgagcaag gaaacagtcc atctccagct cggggccagc taaggacggc 11580
cttctccaac tctcccctct tgctccagac acagtctatc catttgaggt tgctgtgcaa 11640
gaggctgccc cgggggatga tgcccggccc tgtgcacaac acaggctgcc tctctgcttt 11700
acacaaaggc tccttaccag ctagttctgt gattctcaga ggcccacagc atcctcaggc 11760
ttttgacaac caggctctgg cacccactgt gtgccagacc ctggcatctg cctggctcag 11820
gggtggtcac tcacgtcccc agctgctggc cttggagcaa ctgctaccag ggtccagctg 11880
caagcaggag cctgcggccg cgctgggcct cactgctgga ggttgtatat tataataaag 11940
ccaacatttt gttgaaggct tctgctgcgc caggcactgt gttaagctct ttgtggggat 12000
tatctcgatt aactcctaca aacctaggaa ataaatagaa ttttccctag gctcaatgtc 12060
acacagctcc caagtggcac aggtgaaact tgactgcaga tctaagttac tgatctgagc 12120
aaggaagtgg aaattatgtt ctccaaaaca tcactagaac tagtagtata gattctggga 12180
agaggagact caggggccac aagcctggct tgctagaccc tcagaagggc tgtatgattc 12240
caaaggcatg tggagaagct gcaggggaaa tgcaggagag gaaggttgca gtgtgacctc 12300
cagaaggcct ttctgaacga gcttcctgga ggtgtagtgc atgcaagcca tggctgggca 12360
ccaggccagg ccgctgcaga gaggtttctt gcactggcag agggtgagac tgcatgaccc 12420
cagaggctcc ctacccccag ccacaggagg ctgtgactct ggacagggtt tggggctggg 12480
catgagcaga gctgaagagg ccgtcctctc tgcctttctc ggggagggtg tgcaggagag 12540
gctccagagg cttccagtgg aggatgcttc attcagtcaa caagcattta ttgagcaccc 12600
actgtgttcc aggcagtgtg caggcctgac ctcagggggc tcggaggcac ccctgcctgc 12660
tcactgcttt gcttcatgcc ttccaggagc ccacacgcat cccccggatg agttcctctt 12720
cacacca 12727
<210> 39
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
agcccacacg catcccccgg atgagttcct cttcacacca gtggtggtgg cctgtatgtc 60
tgtcatgtct ctgctggtgc 80
<210> 40
<211> 100
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
ctggttgcta cttaaccact cagacatagc ttagtcacta ccgtgactac gaattccgaa 60
gttcctattc tctagaaagt ataggaactt caggtctgaa 100
<210> 41
<211> 100
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
gaaagtatag gaacttcatc agtcaggtac ataatggtgg atccaatatt ctgtccttgg 60
agaaacacaa aacccttcct catacggaac taaaagctgt 100
<210> 42
<211> 3881
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 42
gggtatgact cctctcctaa gtgtccttag aggtggtttc ctaagtctct caaactccat 60
catctccctt caggatcagt tgagcctggc cccagattct gcctcttcct ctgttccctt 120
tcaggcaacc taaaaaaaaa aaaaaaaaaa aaggggaaga ggagccagtg caacagacag 180
gaacgtgttc atctgttccc gtcctcacag aactagcagc tgggagcccc gtgcccagcc 240
gactctccaa cctgcatcgg ctcacgctat cccctggagg ctatggagtt ggggcctcct 300
ctggtcctgc tgctggccac agtttggcat ggtcagggga tcccagtgat agagcccagt 360
gtccctgagc tggtcgtgaa gccaggagca acggtgacct tgcgatgtgt gggcaatggc 420
agcgtggaat gggatggccc cccatcacct cactggaccc tgtactctga tggctccagc 480
agcatcctca gcaccaacaa cgctaccttc caaaacacgg ggacctatcg ctgcactgag 540
cctggagacc ccctgggagg cagcgccgcc atccacctct atgtcaaaga ccctgcccgg 600
ccctggaacg tgctagcaca ggaggtggtc gtgttcgagg accaggacgc actactgccc 660
tgtctgctca cagacccggt gctggaagca ggcgtctcgc tggtgcgtgt gcgtggccgg 720
cccctcatgc gccacaccaa ctactccttc tcgccctggc atggcttcac catccacagg 780
gccaagttca ttcagagcca ggactatcaa tgcagtgccc tgatgggtgg caggaaggtg 840
atgtccatca gcatccggct gaaagtgcag aaagtcatcc cagggccccc agccttgaca 900
ctggtgcctg cagagctggt gcggattcga ggggaggctg cccagatcgt gtgctcagcc 960
agcagcgttg atgttaactt tgatgtcttc ctccaacaca acaacaccaa gctcgcaatc 1020
cctcaacaat ctgactttca taataaccgt taccaaaaag tcctgaccct caacctcgat 1080
caagtagatt tccaacatgc cggcaactac tcctgcgtgg ccagcaacgt gcagggcaag 1140
cactccacct ccatgttctt ccgggtggta gagagtgcct acttgaactt gagctctgag 1200
cagaacctca tccaggaggt gaccgtgggg gaggggctca acctcaaagt catggtggag 1260
gcctacccag gcctgcaagg ttttaactgg acctacctgg gacccttttc tgaccaccag 1320
cctgagccca agcttgctaa tgctaccacc aaggacacat acaggcacac cttcaccctc 1380
tctctgcccc gcctgaagcc ctctgaggct ggccgctact ccttcctggc cagaaaccca 1440
ggaggctgga gagctctgac gtttgagctc acccttcgat accccccaga ggtaagcgtc 1500
atatggacat tcatcaacgg ctctggcacc cttttgtgtg ctgcctctgg gtacccccag 1560
cccaacgtga catggctgca gtgcagtggc cacactgata ggtgtgatga ggcccaagtg 1620
ctgcaggtct gggatgaccc ataccctgag gtcctgagcc aggagccctt ccacaaggtg 1680
acggtgcaga gcctgctgac tgttgagacc ttagagcaca accaaaccta cgagtgcagg 1740
gcccacaaca gcgtggggag tggctcctgg gccttcatac ccatctctgc aggagcccac 1800
acgcatcccc cggatgagtt cctcttcaca ccagtggtgg tggcctgtat gtctgtcatg 1860
tctctgctgg tgctactgct gttgctgctc ttgtacaagt acaagcagaa gccgaagtac 1920
caggtgcgct ggaagatcat cgagagatac gaaggcaata gctacacctt cattgaccct 1980
actcagttgc cctacaatga gaagtgggag ttccctcgga acaacctgca gtttggtaag 2040
actctaggag ccggtgcctt tgggaaggtg gtggaggcta cagcctttgg tctgggcaaa 2100
gaagatgcag tgctgaaggt ggctgtgaag atgctaaagt ccacggctca tgctgatgag 2160
aaggaggccc tgatgtcaga gctgaagatc atgagtcacc tgggacagca cgagaatata 2220
gtcaacctct tgggagcctg tactcacgga ggacctgtcc tggtcatcac tgaatactgc 2280
tgctatggag acctactcaa ctttctccga aggaaggccg aggctatgct aggacccagc 2340
ctgagtcctg gtcaggactc cgagggagac tccagctaca agaacatcca cctggagaag 2400
aaatatgtgc gcagggacag tggcttctcc agtcagggtg tagacaccta cgtggagatg 2460
aggcctgtct cgacttcttc aagtgactcc ttctttaagc aagatctgga caaagaggcc 2520
agccggcccc tggagctctg ggacctgctc cacttctcca gccaagtggc tcagggcatg 2580
gccttccttg cttctaaaaa ctgcatccac cgggacgtag cagctcgaaa cgtgctgttg 2640
accagcggac atgtggccaa gattggggac tttggactgg ctagggacat catgaatgac 2700
tccaactatg ttgtcaaggg caatgcccgc ctgcctgtaa agtggatggc cccagagagc 2760
atctttgact gcgtctacac agttcagagt gatgtgtggt cctacggcat cctcctctgg 2820
gagatcttct cgcttggtct gaacccctac cccggcatcc tagtgaacaa caagttctac 2880
aaactggtga aggatggata ccaaatggcc cagcctgtat ttgcaccgaa gaacatatac 2940
agcatcatgc agtcctgctg ggacctggag cctaccagaa gacccacctt ccaacagatc 3000
tgcttcctcc tccaggagca ggcccgactg gagaggagag accaggacta tgctaacctg 3060
ccaagcagcg gtggcagcag cggcagtgac agtggtggtg gcagcagcgg tggcagcagc 3120
agtgagccag aagaggagag ctccagtgaa cacctggcct gctgtgagcc aggggacatc 3180
gcccagcccc tgctgcagcc taacaactac cagttctgct gaagtgggag ggagagccga 3240
gtcctgccgc tctctacgtc ccagcttggc ctcctccatg gcacgggcga catggggaga 3300
acatatggac ttcgccctca gcttggccca gctctgacac ttcagaacat gaggggtctg 3360
gggaggtcag aggccccgtt tgttcccaga gcctgggcca tcactgccag tggggttctc 3420
acagtgctag cctctatatt tactatgcca actggtgcac ccctagttct ctttctccat 3480
cctattccca ttttaaaaaa cccgtcccaa actctcgtgt ttcaatggaa agactgattt 3540
atgtctcaaa agacaagagt ctcaaaggct gtgggtaagc tgaaggcttg cctccctgac 3600
agatgcttag actacaggct tcttgggaca ggtggcccct tcctaagctc acaggagtgg 3660
ccaccactct tgaccttcac tctgtctata gtcccgcctc atcctggatc ttgtactgag 3720
cggcagctaa aagtgttcta cccagtgccc tgtcactcta gactggaagg tatggggcct 3780
gatgcaaggc tgaccacacc aacaaacacc gtgtgctcct ctccaagctg actcgtcctc 3840
attaactgtc aacattaaac taacagcatt aacacagcca g 3881
<210> 43
<211> 979
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 43
Met Glu Leu Gly Pro Pro Leu Val Leu Leu Leu Ala Thr Val Trp His
1 5 10 15
Gly Gln Gly Ile Pro Val Ile Glu Pro Ser Val Pro Glu Leu Val Val
20 25 30
Lys Pro Gly Ala Thr Val Thr Leu Arg Cys Val Gly Asn Gly Ser Val
35 40 45
Glu Trp Asp Gly Pro Pro Ser Pro His Trp Thr Leu Tyr Ser Asp Gly
50 55 60
Ser Ser Ser Ile Leu Ser Thr Asn Asn Ala Thr Phe Gln Asn Thr Gly
65 70 75 80
Thr Tyr Arg Cys Thr Glu Pro Gly Asp Pro Leu Gly Gly Ser Ala Ala
85 90 95
Ile His Leu Tyr Val Lys Asp Pro Ala Arg Pro Trp Asn Val Leu Ala
100 105 110
Gln Glu Val Val Val Phe Glu Asp Gln Asp Ala Leu Leu Pro Cys Leu
115 120 125
Leu Thr Asp Pro Val Leu Glu Ala Gly Val Ser Leu Val Arg Val Arg
130 135 140
Gly Arg Pro Leu Met Arg His Thr Asn Tyr Ser Phe Ser Pro Trp His
145 150 155 160
Gly Phe Thr Ile His Arg Ala Lys Phe Ile Gln Ser Gln Asp Tyr Gln
165 170 175
Cys Ser Ala Leu Met Gly Gly Arg Lys Val Met Ser Ile Ser Ile Arg
180 185 190
Leu Lys Val Gln Lys Val Ile Pro Gly Pro Pro Ala Leu Thr Leu Val
195 200 205
Pro Ala Glu Leu Val Arg Ile Arg Gly Glu Ala Ala Gln Ile Val Cys
210 215 220
Ser Ala Ser Ser Val Asp Val Asn Phe Asp Val Phe Leu Gln His Asn
225 230 235 240
Asn Thr Lys Leu Ala Ile Pro Gln Gln Ser Asp Phe His Asn Asn Arg
245 250 255
Tyr Gln Lys Val Leu Thr Leu Asn Leu Asp Gln Val Asp Phe Gln His
260 265 270
Ala Gly Asn Tyr Ser Cys Val Ala Ser Asn Val Gln Gly Lys His Ser
275 280 285
Thr Ser Met Phe Phe Arg Val Val Glu Ser Ala Tyr Leu Asn Leu Ser
290 295 300
Ser Glu Gln Asn Leu Ile Gln Glu Val Thr Val Gly Glu Gly Leu Asn
305 310 315 320
Leu Lys Val Met Val Glu Ala Tyr Pro Gly Leu Gln Gly Phe Asn Trp
325 330 335
Thr Tyr Leu Gly Pro Phe Ser Asp His Gln Pro Glu Pro Lys Leu Ala
340 345 350
Asn Ala Thr Thr Lys Asp Thr Tyr Arg His Thr Phe Thr Leu Ser Leu
355 360 365
Pro Arg Leu Lys Pro Ser Glu Ala Gly Arg Tyr Ser Phe Leu Ala Arg
370 375 380
Asn Pro Gly Gly Trp Arg Ala Leu Thr Phe Glu Leu Thr Leu Arg Tyr
385 390 395 400
Pro Pro Glu Val Ser Val Ile Trp Thr Phe Ile Asn Gly Ser Gly Thr
405 410 415
Leu Leu Cys Ala Ala Ser Gly Tyr Pro Gln Pro Asn Val Thr Trp Leu
420 425 430
Gln Cys Ser Gly His Thr Asp Arg Cys Asp Glu Ala Gln Val Leu Gln
435 440 445
Val Trp Asp Asp Pro Tyr Pro Glu Val Leu Ser Gln Glu Pro Phe His
450 455 460
Lys Val Thr Val Gln Ser Leu Leu Thr Val Glu Thr Leu Glu His Asn
465 470 475 480
Gln Thr Tyr Glu Cys Arg Ala His Asn Ser Val Gly Ser Gly Ser Trp
485 490 495
Ala Phe Ile Pro Ile Ser Ala Gly Ala His Thr His Pro Pro Asp Glu
500 505 510
Phe Leu Phe Thr Pro Val Val Val Ala Cys Met Ser Val Met Ser Leu
515 520 525
Leu Val Leu Leu Leu Leu Leu Leu Leu Tyr Lys Tyr Lys Gln Lys Pro
530 535 540
Lys Tyr Gln Val Arg Trp Lys Ile Ile Glu Arg Tyr Glu Gly Asn Ser
545 550 555 560
Tyr Thr Phe Ile Asp Pro Thr Gln Leu Pro Tyr Asn Glu Lys Trp Glu
565 570 575
Phe Pro Arg Asn Asn Leu Gln Phe Gly Lys Thr Leu Gly Ala Gly Ala
580 585 590
Phe Gly Lys Val Val Glu Ala Thr Ala Phe Gly Leu Gly Lys Glu Asp
595 600 605
Ala Val Leu Lys Val Ala Val Lys Met Leu Lys Ser Thr Ala His Ala
610 615 620
Asp Glu Lys Glu Ala Leu Met Ser Glu Leu Lys Ile Met Ser His Leu
625 630 635 640
Gly Gln His Glu Asn Ile Val Asn Leu Leu Gly Ala Cys Thr His Gly
645 650 655
Gly Pro Val Leu Val Ile Thr Glu Tyr Cys Cys Tyr Gly Asp Leu Leu
660 665 670
Asn Phe Leu Arg Arg Lys Ala Glu Ala Met Leu Gly Pro Ser Leu Ser
675 680 685
Pro Gly Gln Asp Ser Glu Gly Asp Ser Ser Tyr Lys Asn Ile His Leu
690 695 700
Glu Lys Lys Tyr Val Arg Arg Asp Ser Gly Phe Ser Ser Gln Gly Val
705 710 715 720
Asp Thr Tyr Val Glu Met Arg Pro Val Ser Thr Ser Ser Ser Asp Ser
725 730 735
Phe Phe Lys Gln Asp Leu Asp Lys Glu Ala Ser Arg Pro Leu Glu Leu
740 745 750
Trp Asp Leu Leu His Phe Ser Ser Gln Val Ala Gln Gly Met Ala Phe
755 760 765
Leu Ala Ser Lys Asn Cys Ile His Arg Asp Val Ala Ala Arg Asn Val
770 775 780
Leu Leu Thr Ser Gly His Val Ala Lys Ile Gly Asp Phe Gly Leu Ala
785 790 795 800
Arg Asp Ile Met Asn Asp Ser Asn Tyr Val Val Lys Gly Asn Ala Arg
805 810 815
Leu Pro Val Lys Trp Met Ala Pro Glu Ser Ile Phe Asp Cys Val Tyr
820 825 830
Thr Val Gln Ser Asp Val Trp Ser Tyr Gly Ile Leu Leu Trp Glu Ile
835 840 845
Phe Ser Leu Gly Leu Asn Pro Tyr Pro Gly Ile Leu Val Asn Asn Lys
850 855 860
Phe Tyr Lys Leu Val Lys Asp Gly Tyr Gln Met Ala Gln Pro Val Phe
865 870 875 880
Ala Pro Lys Asn Ile Tyr Ser Ile Met Gln Ser Cys Trp Asp Leu Glu
885 890 895
Pro Thr Arg Arg Pro Thr Phe Gln Gln Ile Cys Phe Leu Leu Gln Glu
900 905 910
Gln Ala Arg Leu Glu Arg Arg Asp Gln Asp Tyr Ala Asn Leu Pro Ser
915 920 925
Ser Gly Gly Ser Ser Gly Ser Asp Ser Gly Gly Gly Ser Ser Gly Gly
930 935 940
Ser Ser Ser Glu Pro Glu Glu Glu Ser Ser Ser Glu His Leu Ala Cys
945 950 955 960
Cys Glu Pro Gly Asp Ile Ala Gln Pro Leu Leu Gln Pro Asn Asn Tyr
965 970 975
Gln Phe Cys
<210> 44
<211> 453
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 44
Glu Val Thr Leu Lys Glu Ser Gly Pro Ala Leu Val Lys Pro Thr Gln
1 5 10 15
Thr Leu Thr Leu Thr Cys Thr Phe Ser Gly Phe Ser Leu Thr Thr Tyr
20 25 30
Gly Met Gly Val Gly Trp Ile Arg Gln Pro Pro Gly Lys Ala Leu Glu
35 40 45
Trp Leu Ala Asn Ile Trp Trp Asp Asp Asp Lys Tyr Tyr Asn Pro Ser
50 55 60
Leu Lys Asn Arg Leu Thr Ile Ser Lys Asp Thr Ser Lys Asn Gln Val
65 70 75 80
Val Leu Thr Met Thr Asn Met Asp Pro Val Asp Thr Ala Thr Tyr Tyr
85 90 95
Cys Ala Arg Ile Gly Pro Ile Lys Tyr Pro Thr Ala Pro Tyr Arg Tyr
100 105 110
Phe Asp Phe Trp Gly Gln Gly Thr Met Val Thr Val Ser Ser Ala Ser
115 120 125
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr
130 135 140
Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
145 150 155 160
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
165 170 175
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
180 185 190
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr
195 200 205
Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val
210 215 220
Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe
225 230 235 240
Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
245 250 255
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
260 265 270
Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val
275 280 285
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser
290 295 300
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
305 310 315 320
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser
325 330 335
Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
340 345 350
Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln
355 360 365
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
370 375 380
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
385 390 395 400
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu
405 410 415
Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser
420 425 430
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
435 440 445
Leu Ser Leu Gly Lys
450
<210> 45
<211> 169
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 45
Leu Leu Ile Tyr Tyr Ala Ser Ser Leu Gln Asp Gly Val Pro Ser Arg
1 5 10 15
Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Thr Leu Thr Ile Ser Ser
20 25 30
Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Leu Gln Asp Ser Glu
35 40 45
Tyr Pro Trp Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr
50 55 60
Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu
65 70 75 80
Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro
85 90 95
Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly
100 105 110
Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr
115 120 125
Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His
130 135 140
Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val
145 150 155 160
Thr Lys Ser Phe Asn Arg Gly Glu Cys
165
<210> 46
<211> 449
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 46
Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser
1 5 10 15
Ser Val Lys Val Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Asp Asn
20 25 30
Tyr Met Ile Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Met
35 40 45
Gly Asp Ile Asn Pro Tyr Asn Gly Gly Thr Thr Phe Asn Gln Lys Phe
50 55 60
Lys Gly Arg Val Thr Ile Thr Ala Asp Lys Ser Thr Ser Thr Ala Tyr
65 70 75 80
Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Glu Ser Pro Tyr Phe Ser Asn Leu Tyr Val Met Asp Tyr Trp
100 105 110
Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro
115 120 125
Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr
130 135 140
Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr
145 150 155 160
Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro
165 170 175
Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr
180 185 190
Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val Asp
195 200 205
His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Ser Lys Tyr
210 215 220
Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro
225 230 235 240
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
245 250 255
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp
260 265 270
Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
275 280 285
Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val
290 295 300
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
305 310 315 320
Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys
325 330 335
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
340 345 350
Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
355 360 365
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
370 375 380
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
385 390 395 400
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys
405 410 415
Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu
420 425 430
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly
435 440 445
Lys
<210> 47
<211> 218
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 47
Glu Ile Val Leu Thr Gln Ser Pro Ala Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Lys Ala Ser Gln Ser Val Asp Tyr Asp
20 25 30
Gly Asp Asn Tyr Met Asn Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro
35 40 45
Arg Leu Leu Ile Tyr Ala Ala Ser Asn Leu Glu Ser Gly Ile Pro Ala
50 55 60
Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser
65 70 75 80
Ser Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys His Leu Ser Asn
85 90 95
Glu Asp Leu Ser Thr Glu Gly Gly Gly Thr Lys Val Glu Ile Lys Arg
100 105 110
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
115 120 125
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
130 135 140
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
145 150 155 160
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
165 170 175
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
180 185 190
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro
195 200 205
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
210 215
<210> 48
<211> 446
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 48
Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ala
1 5 10 15
Ser Val Lys Val Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Ser Tyr
20 25 30
Asp Ile Ser Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Met
35 40 45
Gly Val Ile Trp Thr Asp Gly Gly Thr Asn Tyr Ala Gln Lys Leu Gln
50 55 60
Gly Arg Val Thr Met Thr Thr Asp Thr Ser Thr Ser Thr Ala Tyr Met
65 70 75 80
Glu Leu Arg Ser Leu Arg Ser Asp Asp Thr Ala Val Tyr Tyr Cys Ala
85 90 95
Arg Asp Gln Arg Leu Tyr Phe Asp Val Trp Gly Gln Gly Thr Thr Val
100 105 110
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
115 120 125
Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu
130 135 140
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
145 150 155 160
Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser
165 170 175
Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu
180 185 190
Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr
195 200 205
Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr
210 215 220
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
225 230 235 240
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
245 250 255
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
260 265 270
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
275 280 285
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
290 295 300
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
305 310 315 320
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
325 330 335
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
340 345 350
Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
355 360 365
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
370 375 380
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
385 390 395 400
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
405 410 415
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
420 425 430
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
435 440 445
<210> 49
<211> 213
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 49
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Glu Asp Val Asn Thr Tyr
20 25 30
Val Ser Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45
Tyr Ala Ala Ser Asn Arg Tyr Thr Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ser Phe Ser Tyr Pro Thr
85 90 95
Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys Arg Thr Val Ala Ala Pro
100 105 110
Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr
115 120 125
Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys
130 135 140
Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu
145 150 155 160
Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser
165 170 175
Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala
180 185 190
Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe
195 200 205
Asn Arg Gly Glu Cys
210
<210> 50
<211> 120
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 50
Gln Asp Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr
20 25 30
Gly Met His Trp Val Arg Gln Ala Pro Gly Glu Gly Leu Glu Trp Val
35 40 45
Ala Val Ile Trp Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Gly Asp Tyr Glu Val Asp Tyr Gly Met Asp Val Trp Gly Gln
100 105 110
Gly Thr Thr Val Thr Val Ala Ser
115 120
<210> 51
<211> 107
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 51
Ala Ile Gln Leu Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Asn Ala
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45
Tyr Asp Ala Ser Ser Leu Glu Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Phe Asn Ser Tyr Pro Trp
85 90 95
Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
100 105

Claims (24)

1.一种人源化CSF1蛋白,其特征在于,所述的人源化CSF1蛋白包含人CSF1蛋白的部分。
2.根据权利要求1所述的人源化CSF1蛋白,其特征在于,所述的人源化CSF1蛋白包含人CSF1蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分,优选的,所述的人源化CSF1蛋白包含人CSF1蛋白胞外区的全部或部分,进一步优选的,包含至少200个连续氨基酸的人CSF1蛋白胞外区,更优选的,包含与SEQ ID NO:2的第38-496位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第38-496位所示的氨基酸序列;所述的人源化CSF1蛋白还包含人CSF1蛋白跨膜区的全部或部分,优选的,所述的跨膜区包含与SEQ ID NO:2的第497-517位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第497-517位所示氨基酸序列;所述的人源化CSF1蛋白还包含包含人CSF1蛋白胞质区的全部或部分,优选的,所述的胞质区包含与SEQ ID NO:2的第518-554位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第518-554位所示氨基酸序列。
3.根据权利要求1或2所述的人源化CSF1蛋白,其特征在于,所述的人源化CSF1蛋白的氨基酸序列包含下列组中的一种:
A)为SEQ ID NO:2的第38-554位氨基酸序列的全部或部分;
B)与SEQ ID NO:2的第38-554位氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:2的第38-554位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
D)与SEQ ID NO:2的第38-554位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
4.根据权利要求1-3任一所述的人源化CSF1蛋白,其特征在于,所述的人源化CSF1蛋白的氨基酸序列选自下列组中的一种:
I)为SEQ ID NO:10氨基酸序列的全部或部分;
II)与SEQ ID NO:10氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
III)与SEQ ID NO:10所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
IV)与SEQ ID NO:10所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
5.一种人源化CSF1基因,其特征在于,所述的人源化CSF1基因包含人CSF1基因的部分。
6.根据权利要求5所述的人源化CSF1基因,其特征在于,所述的人源化CSF1基因编码权利要求1-4任一所述的人源化CSF1蛋白。
7.根据权利要求5或6所述的人源化CSF1基因,其特征在于,所述的人源化CSF1基因包含人CSF1基因的1号至9号外显子的部分;优选的,包含2号至8号外显子的全部或部分;进一步优选的,包含2号外显子的部分、3号外显子至7号外显子的全部和8号外显子的部分,其中,2号外显子的部分至少包含20bp的核苷酸序列;8号外显子的部分至少包含20bp的核苷酸序列。
8.根据权利要求5-7任一所述的人源化CSF1基因,其特征在于,所述的人源化CSF1基因包含非人动物CSF1基因的1号和/或9号外显子;优选还包括非人动物2号外显子的部分和/或8号外显子的部分。
9.根据权利要求5-8任一所述的人源化CSF1基因,其特征在于,所述的人源化CSF1基因包含下列组中的一种:
(A)为SEQ ID NO:5所示核苷酸序列的全部或部分;
(B)与SEQ ID NO:5所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(C)与SEQ ID NO:5所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(D)具有SEQ ID NO:5所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
10.根据权利要求5-9任一所述的人源化CSF1基因,其特征在于,所述的人源化CSF1基因转录的mRNA选自下列组中的一种:
(i)为SEQ ID NO:9所示核苷酸序列的全部或部分;
(ii)与SEQ ID NO:9所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)与SEQ ID NO:9所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)与SEQ ID NO:9所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
11.一种靶向载体,其特征在于,所述的靶向载体包含人CSF1基因的部分,优选的,所述的人CSF1基因的部分包含人CSF1基因的1号至9号外显子的部分,进一步优选的,包含2号至8号外显子的全部或部分,更优选的,包含2号外显子的部分、3号外显子至7号外显子的全部和8号外显子的部分,其中,2号外显子的部分至少包含20bp的核苷酸序列;8号外显子的部分至少包含20bp的核苷酸序列,更进一步优选的,所述的靶向载体包含与SEQ ID NO:5具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者与SEQ ID NO:5所示核苷酸序列一致,
优选的,所述的靶向载体还包含5’臂,优选的,所述的5’臂与NCBI登录号为NC_000069.7至少具有90%同源性的核苷酸;进一步优选的,所述5’臂序列与SEQ ID NO:3至少具有90%同源性,或者如SEQ ID NO:3所示;和/或,所述的靶向载体还包含3’臂,优选的,所述的3’臂与NCBI登录号为NC_000069.7至少具有90%同源性的核苷酸;进一步优选的,所述的3’臂序列与SEQ ID NO:4至少具有90%同源性,或者如SEQ ID NO:4所示。
12.一种CSF1基因人源化的非人动物的构建方法,其特征在于,所述的构建方法包括用包含人CSF1基因的部分核苷酸序列导入非人动物CSF1基因座,所述的非人动物体内表达人源化CSF1蛋白。
13.根据权利要求12所述的构建方法,其特征在于,所述的人源化CSF1蛋白包括权利要求1-4任一所述的人源化CSF1蛋白,优选的,所述的非人动物的基因组中还包含人源化CSF1基因,所述的人源化CSF1基因包括权利要求5-10任一所述的人源化CSF1基因。
14.根据权利要求12-13任一所述的构建方法,其特征在于,所述的人CSF1基因的部分核苷酸序列包含人CSF1基因的1号至9号外显子的部分核苷酸序列,优选的,包含2号至8号外显子的全部或部分核苷酸序列,进一步优选的,包含2号外显子的部分、3号外显子至7号外显子的全部和8号外显子的部分,其中,2号外显子的部分至少包含20bp的核苷酸序列,8号外显子的部分至少包含20bp的核苷酸序列,更优选的,所述的人CSF1基因的部分核苷酸序列包含与SEQ ID NO:5具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含SEQ ID NO:5所示的核苷酸序列。
15.根据权利要求12-14任一所述的构建方法,其特征在于,所述的导入为替换或插入,优选的,所述的导入非人动物CSF1基因座为替换非人动物相应区域,进一步优选的,非人动物CSF1基因的2号至8号外显子的全部或部分被替换,更进一步优选的,非人动物CSF1基因的2号外显子的部分、3号外显子至7号外显子的全部和8号外显子的部分被替换。
16.根据权利要求12-15任一所述的构建方法,其特征在于,使用权利要求11所述的靶向载体进行非人动物的构建。
17.根据权利要求12-16任一所述的构建方法,其特征在于,所述的构建方法还包括将CSF1基因人源化的非人动物与其他基因修饰的非人动物交配、体外授精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物,优选的,所述的其他基因选自CSF1R、PD-1、PD-L1、IL6、IL3、IL15、CSF2、TPO和CD40中的至少一种。
18.根据权利要求17所述的构建方法,其特征在于,所述其他基因为CSF1R基因,所述的CSF1R基因为人源化CSF1R基因,所述的非人动物体内表达人或人源化CSF1R蛋白。
19.根据权利要求18所述的构建方法,其特征在于,所述的人源化CSF1R蛋白包含人CSF1R蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分,优选的,所述的人源化CSF1R蛋白包含人CSF1R蛋白的胞外区的全部或部分,进一步优选的,所述的人源化CSF1R蛋白包含的人CSF1R蛋白的胞外区的氨基酸序列包含与SEQ ID NO:35的第20-517位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者与SEQ ID NO:35的第20-517位所示氨基酸序列一致。
20.根据权利要求18或19所述的构建方法,其特征在于,所述的人源化CSF1R蛋白的氨基酸序列选自下列组中的一种:
I)为SEQ ID NO:43氨基酸序列的全部或部分;
II)与SEQ ID NO:43氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
III)与SEQ ID NO:43所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
IV)与SEQ ID NO:43所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
21.根据权利要求18-20任一所述的构建方法,其特征在于,所述的人源化CSF1R基因包含人CSF1R基因的1号至22号外显子的全部或部分,优选的,包含3号至11号外显子的全部或部分,进一步优选的,包含3号外显子的部分、4号外显子至10号外显子的全部和11号外显子的部分,其中,3号外显子的部分至少包含100bp的核苷酸序列,11号外显子的部分至少包含20bp的核苷酸序列,优选的,所述的人源化CSF1R基因包含与SEQ ID NO:38具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含SEQ ID NO:38所示的核苷酸序列。
22.一种细胞、组织或器官,其特征在于,所述的细胞、组织或者器官表达权利要求1-4任一所述的人源化CSF1蛋白,所述的细胞、组织或者器官包含权利要求5-10任一所述的人源化CSF1基因,或者所述细胞、组织或者器官来源于权利要求12-21任一所述的构建方法获得的非人动物。
23.根据权利要求12-21任一所述的构建方法或者权利要求22所述的细胞、组织或器官,其特征在于,所述的非人动物为非人哺乳动物;优选的,所述的非人哺乳动物为啮齿类动物;进一步优选的,所述的啮齿类动物为小鼠或大鼠。
24.来源于权利要求1-4任一所述的人源化CSF1蛋白、权利要求5-10任一所述的人源化CSF1基因、权利要求12-21、23任一所述的构建方法获得的非人动物或权利要求22-23所述的细胞、组织或器官的应用,所述应用包括:
在需要涉及人类细胞的免疫过程的产品开发,制造抗体,或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;
在生产和利用动物实验疾病模型,用于开发新的诊断策略和/或治疗策略中的应用;
或者,
在筛选、验证、评价或研究CSF1和/或CSF1R通路功能、人CSF1和/或CSF1R通路信号机理、靶向人的抗体、靶向人的药物、药效,免疫相关疾病药物以及抗肿瘤药物,筛选和评估人用药及药效研究方面的应用。
CN202210415419.8A 2021-04-20 2022-04-20 Csf1和/或csf1r基因人源化的非人动物及其构建方法和应用 Active CN114853871B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN202110425356X 2021-04-20
CN202110425356 2021-04-20
CN202210185622 2022-02-28
CN2022101856220 2022-02-28

Publications (2)

Publication Number Publication Date
CN114853871A true CN114853871A (zh) 2022-08-05
CN114853871B CN114853871B (zh) 2024-04-05

Family

ID=82630684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210415419.8A Active CN114853871B (zh) 2021-04-20 2022-04-20 Csf1和/或csf1r基因人源化的非人动物及其构建方法和应用

Country Status (2)

Country Link
CN (1) CN114853871B (zh)
WO (1) WO2022222958A1 (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111073907A (zh) * 2018-12-25 2020-04-28 百奥赛图江苏基因生物技术有限公司 人源化细胞因子csf1基因改造非人动物的构建方法及应用
CN113046390A (zh) * 2020-03-09 2021-06-29 百奥赛图江苏基因生物技术有限公司 Csf1r基因人源化的非人动物及其构建方法和应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012531896A (ja) * 2009-06-29 2012-12-13 チェン,チンフェン ヒト化非ヒト哺乳動物を製造する方法
MX350385B (es) * 2011-02-15 2017-09-04 Regeneron Pharma Ratones de m-csf humanizada.
JP6283031B2 (ja) * 2012-09-07 2018-02-21 イエール ユニバーシティ 遺伝学的に修飾された非ヒト動物およびその使用法
WO2018102546A1 (en) * 2016-11-30 2018-06-07 The Jackson Laboratory Humanized mouse model with improved human innate immune cell development
WO2019199799A1 (en) * 2018-04-09 2019-10-17 The Wistar Institute Humanized mouse model

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111073907A (zh) * 2018-12-25 2020-04-28 百奥赛图江苏基因生物技术有限公司 人源化细胞因子csf1基因改造非人动物的构建方法及应用
CN113046390A (zh) * 2020-03-09 2021-06-29 百奥赛图江苏基因生物技术有限公司 Csf1r基因人源化的非人动物及其构建方法和应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GRELLIER,B.ET AL.: "3D modeling and characterization of the human CD115 monoclonal antibody H27K15 epitope and design of a chimeric CD115 target", MABS, vol. 6, no. 2, pages 533 - 546, XP055979390, DOI: 10.4161/mabs.27736 *

Also Published As

Publication number Publication date
CN114853871B (zh) 2024-04-05
WO2022222958A1 (en) 2022-10-27

Similar Documents

Publication Publication Date Title
CN111057721B (zh) 人源化IL-4和/或IL-4Rα改造动物模型的制备方法及应用
CN111304246B (zh) 一种人源化细胞因子动物模型、制备方法及应用
CN108424928B (zh) 人源化基因改造动物模型的制备方法及应用
CN111837036A (zh) 具有人或嵌合基因的基因修饰的非人动物
CN112779285B (zh) 人源化il-10和il-10ra基因改造动物的构建方法和应用
CN111218425B (zh) 人源化转基因动物
CN112430621B (zh) Il2ra基因人源化的非人动物的构建方法及应用
CN114277055A (zh) Il1b和il1a基因人源化的非人动物及其构建方法和应用
CN112458117B (zh) Cd155基因人源化的非人动物的构建方法及应用
CN113046390B (zh) Csf1r基因人源化的非人动物及其构建方法和应用
CN113881681B (zh) Ccr8基因人源化非人动物及其构建方法和应用
CN112501205B (zh) Ceacam1基因人源化非人动物的构建方法及应用
CN112553213B (zh) Cx3cr1基因人源化的非人动物及其构建方法和应用
CN112553252B (zh) Tnfr2基因人源化的非人动物的构建方法和应用
CN114853871B (zh) Csf1和/或csf1r基因人源化的非人动物及其构建方法和应用
CN113264996A (zh) 一种人源化的非人动物及其制备方法和应用
CN112501204B (zh) Il21r基因人源化非人动物及其构建方法和应用
CN112481303B (zh) Il15ra基因人源化非人动物及其构建方法和应用
CN113817770B (zh) Cd73基因人源化的非人动物的构建方法及应用
CN112501203B (zh) Il17rb基因人源化的非人动物的构建方法及应用
CN112501202B (zh) Cxcr4基因人源化的非人动物及其构建方法和应用
CN111926038B (zh) Csf2rb基因人源化改造的非人动物的构建方法及其应用
CN115260303A (zh) Cd70基因人源化非人动物的构建方法及应用
CN114134153A (zh) Garp基因人源化非人动物及其构建方法和应用
CN113234139A (zh) Tnfsf9基因人源化的非人动物及其构建方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant