CN115043929A - Vsig4基因人源化非人动物的构建方法及应用 - Google Patents

Vsig4基因人源化非人动物的构建方法及应用 Download PDF

Info

Publication number
CN115043929A
CN115043929A CN202210622450.9A CN202210622450A CN115043929A CN 115043929 A CN115043929 A CN 115043929A CN 202210622450 A CN202210622450 A CN 202210622450A CN 115043929 A CN115043929 A CN 115043929A
Authority
CN
China
Prior art keywords
vsig4
human
exon
nucleotide sequence
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210622450.9A
Other languages
English (en)
Inventor
吕锐利
尚诚彰
聂琰晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baccetus Beijing Pharmaceutical Technology Co ltd
Original Assignee
Baccetus Beijing Pharmaceutical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baccetus Beijing Pharmaceutical Technology Co ltd filed Critical Baccetus Beijing Pharmaceutical Technology Co ltd
Publication of CN115043929A publication Critical patent/CN115043929A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/70532B7 molecules, e.g. CD80, CD86
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Knock-in vertebrates, e.g. humanised vertebrates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • C12N2015/8527Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic for producing animal models, e.g. for tests or diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biomedical Technology (AREA)
  • Veterinary Medicine (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Environmental Sciences (AREA)
  • Public Health (AREA)
  • Cell Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Epidemiology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Urology & Nephrology (AREA)
  • Rheumatology (AREA)
  • Pathology (AREA)
  • Wood Science & Technology (AREA)
  • Diabetes (AREA)
  • Endocrinology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Husbandry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了一种人源化VSIG4蛋白、一种人源化VSIG4基因、一种VSIG4基因的靶向载体、一种VSIG4基因人源化改造非人动物的构建方法、一种人源化的非人动物和其在生物医药领域的应用,利用同源重组的方式将编码人VSIG4蛋白的核苷酸序列导入非人动物基因组中,该动物体内能正常表达人或人源化VSIG4蛋白,可以作为人VSIG4信号机理研究、肿瘤及免疫性疾病药物筛选的动物模型,对免疫靶点的新药研发具有重要的应用价值。

Description

VSIG4基因人源化非人动物的构建方法及应用
技术领域
本发明属于动物基因工程和基因遗传修饰领域,具体地说,涉及一种VSIG4基因改造非人动物模型的构建方法及其在生物医药领域的应用。
背景技术
VSIG4蛋白全称为V-set and immunoglobulin domain containing 4,又名补体受体免疫球蛋白(Complement Receptor Immunoglobulin,CRIg),是免疫球蛋白超家族成员之一,为单次跨膜蛋白,人体中有两种存在形式,包括C2结构域和V结构域的长蛋白和只包括V结构域的短蛋白,小鼠中只有一种含有V结构域的VSIG4蛋白。虽然VSIG4的mRNA在不同组织例如肝脏、肺、胎盘、滑膜、中心神经系统等组织器官中表达,但其蛋白在正常组织中仅集中在肝脏巨噬细胞,滑膜等组织中有微量表达,具有高度巨噬细胞表达特异性。VSIG4可以介导细菌和病毒的清除,可与补体系统中的C3b和C3c结合,参与C3b介导的调理作用,并抑制补体激活通路的活化。虽然VSIG4在调理细菌的吞噬作用中起主要受体作用,越来越多的证据显示其在免疫抑制、抗炎症反应、感染中也发挥着重要功能。体外实验中,VSIG4可溶性重组蛋白能够抑制CD4+、CD8+T细胞和NKT细胞的增殖与活性,抑制细胞因子IL2的表达,促进Foxp3+调节性T细胞(Treg)的分化,在肿瘤的生成和发展中起着重要的调节作用。
实验动物疾病模型对于研究人类疾病发生的病因、发病机制、开发防治技术和开发药物是不可缺少的研究工具。但由于动物与人类的生理结构和代谢系统本身的差异,传统的动物模型并不能很好的反映人体的真实状况,在动物体内建立更接近人类的生理特征的疾病模型是生物医药行业的迫切需求。随着基因工程技术的不断发展和成熟,用人类基因替代或置换动物的同源性基因已经实现,通过这种方式开发人源化实验动物模型是动物模型未来的发展方向。其中基因人源化动物模型,即利用基因编辑技术,用人源正常或突变基因替换动物基因组的同源基因,可建立更接近人类生理或疾病特征的正常或突变基因动物模型。基因人源化动物不但本身具有重要应用价值,如通过基因人源化可改进和提升细胞或组织移植人源化动物模型,更重要的是,由于人类基因片段的插入,动物体内可表达或部分表达人源蛋白,可作为仅能识别人蛋白序列的药物的靶点,为在动物水平进行抗人抗体及其它药物的筛选提供了可能。然而,由于动物与人类在生理学及病理学方面存在差异,加上基因的复杂性,如何能构建出“有效”的人源化动物模型用于新药研发仍是最大的挑战。
鉴于VSIG4在感染、自身免疫性疾病及肿瘤等治疗领域的巨大应用潜力,为进一步探索其相关生物学特性,提高临床前期药效试验的有效性,提高研发成功率,使临床前期的试验更有效并使研发失败最小化,本领域急需开发VSIG4基因改造非人动物模型。此外,本方法得到的非人动物还可与其它基因人源化非人动物交配得到多基因人源化动物模型,用于筛选和评估针对该信号通路的人用药及联合用药的药效研究。本发明在学术和临床研究中具有广阔的应用前景。
发明内容
本发明的第一方面,提供了一种人源化VSIG4蛋白,所述的人源化VSIG4蛋白包含人VSIG4蛋白的全部或部分。
优选的,所述的人源化VSIG4蛋白包含人VSIG4蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分,进一步优选的,所述的人源化VSIG4蛋白包含人VSIG4蛋白的胞外区的全部或部分。
优选的,所述的人源化VSIG4蛋白包含人VSIG4蛋白的胞外区的全部或部分,所述的人源化VSIG4蛋白包含至少50个连续氨基酸的人VSIG4蛋白胞外区,例如至少包含50、70、100、110、120、150、170、200、210、230、250、260、261、262、263、264个连续氨基酸的人VSIG4蛋白胞外区,进一步优选的,包含262或264个连续氨基酸的人VSIG4蛋白胞外区;更优选的,包含与SEQ ID NO:2的第20-281或20-283位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第20-281或20-283位所示氨基酸序列;所述的人源化VSIG4蛋白还包含人VSIG4蛋白信号肽的全部或部分,优选的,包含与SEQID NO:2的第1-19位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第1-19位所示氨基酸序列;所述的人源化VSIG4蛋白还包含人VSIG4蛋白跨膜区的全部或部分,优选的,包含与SEQ ID NO:2的第284-304位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第284-304位所示氨基酸序列;所述的人源化VSIG4蛋白还包含人VSIG4蛋白胞质区的全部或部分,优选的,包含与SEQ ID NO:2的第305-399位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第305-399位所示氨基酸序列。
优选的,所述的人源化VSIG4蛋白包含SEQ ID NO:2第20-281或1-399位所示氨基酸序列;或者,包含与SEQ ID NO:2第20-281或1-399位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:2第20-281或1-399位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2第20-281或1-399位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化VSIG4蛋白还包含非人动物VSIG4蛋白的全部或部分,进一步优选的,包含SEQ ID NO:1第1-19位或186-210位所示氨基酸序列;或者,包含与SEQ IDNO:1第1-19位或186-210位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:1第1-19位或186-210位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:1第1-19位或186-210位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的人源化VSIG4蛋白包含人VSIG4基因的全部或部分编码的氨基酸序列。
优选的,所述的人源化VSIG4蛋白包含人VSIG4基因的1号至8号外显子编码的氨基酸序列的全部或部分。进一步优选的,包含1号至8号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合编码的氨基酸序列的全部或部分。更进一步优选的,包含2号至6号外显子编码的氨基酸序列的全部或部分。再进一步优选的,包含2号外显子的部分、3号外显子至5号外显子的全部和6号外显子的部分编码的氨基酸序列,其中,2号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、130、150、170、200、220、250、270、300、320、350、351、352、353、354、355、356、357bp的核苷酸序列,进一步优选的,包含355bp的核苷酸序列;优选的,2号外显子的部分包含2号外显子中编码胞外区的核苷酸序列,6号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、6、7、8、9、10、20、50、60、70、80、90、100、105bp的核苷酸序列,进一步优选的,包含8bp的核苷酸序列。最为优选的,所述的人源化VSIG4蛋白包含与SEQ ID NO:5或30编码的氨基酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:5或30编码的氨基酸序列。
优选的,所述的人源化VSIG4蛋白还包含非人动物VSIG4基因编码的氨基酸序列的全部或部分,优选为非人动物VSIG4基因的1号外显子和/或6-7号外显子编码的氨基酸序列的全部或部分,进一步优选还包含2号外显子的部分和/或5号外显子的部分编码的氨基酸序列的全部或部分。
在本发明的一个具体实施方式中,所述的人源化VSIG4蛋白的氨基酸序列包含下列组中的一种:
A)为SEQ ID NO:2的第20-281或1-399位氨基酸序列的全部或部分;
B)与SEQ ID NO:2的第20-281或1-399位氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:2的第20-281或1-399位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
D)与SEQ ID NO:2的第20-281或1-399位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化VSIG4蛋白的氨基酸序列选自下列组中的一种:
I)为SEQ ID NO:11或2氨基酸序列的全部或部分;
II)与SEQ ID NO:11或2氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
III)与SEQ ID NO:11或2所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
IV)与SEQ ID NO:11或2所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第二方面,提供了一种编码上述人源化VSIG4蛋白的核酸。
本发明的第三方面,提供了一种人源化VSIG4基因,所述的人源化VSIG4基因包含人VSIG4基因的全部或部分和非人动物VSIG4基因的全部或部分。
优选的,所述的人源化VSIG4基因编码上述的人源化VSIG4蛋白。
优选的,所述的人源化VSIG4基因包含编码人VSIG4蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列,其中,所述的胞外区包含人VSIG4蛋白胞外区的全部或部分,优选的,包含至少50个连续氨基酸的人VSIG4蛋白胞外区,例如至少包含50、70、100、110、120、150、170、200、210、230、250、260、261、262、263、264个连续氨基酸的人VSIG4蛋白胞外区,进一步优选的,包含262或264个连续氨基酸的人VSIG4蛋白胞外区;更优选的,包含与SEQ ID NO:2的第20-281或20-283位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第20-281或20-283位所示氨基酸序列;所述的信号肽包含人VSIG4蛋白信号肽的全部或部分,优选的,包含与SEQ ID NO:2的第1-19位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第1-19位所示氨基酸序列;所述的跨膜区包含人VSIG4蛋白跨膜区的全部或部分,优选的,包含与SEQ ID NO:2的第284-304位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第284-304位所示氨基酸序列;所述的胞质区包含人VSIG4蛋白胞质区的全部或部分,优选的,包含与SEQ ID NO:2的第305-399位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第305-399位所示氨基酸序列。
优选的,所述的人源化VSIG4基因包含编码SEQ ID NO:2第20-281或1-399位的核苷酸序列;或者,包含与编码SEQ ID NO:2第20-281或1-399位的核苷酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与编码SEQ IDNO:2第20-281或1-399位的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含具有编码SEQ ID NO:2第20-281或1-399位的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化VSIG4基因包含人VSIG4基因的1号至8号外显子的全部或部分。进一步优选的,包含1号至8号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合的全部或部分。更进一步优选的,包含2号至6号外显子的全部或部分。再进一步优选的,包含2号外显子的部分、3号外显子至5号外显子的全部和6号外显子的部分,优选还包含2-3号内含子和/或5-6号内含子,更优选的包含2-6号外显子之间的任一内含子,其中,2号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、130、150、170、200、220、250、270、300、320、350、351、352、353、354、355、356、357bp的核苷酸序列,进一步优选的,包含355bp的核苷酸序列;优选的,2号外显子的部分包含2号外显子中编码胞外区的核苷酸序列,6号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、6、7、8、9、10、20、50、60、70、80、90、100、105bp的核苷酸序列,进一步优选的,包含8bp的核苷酸序列。
在本发明的另一个实施方式中,所述的人源化VSIG4基因包含人VSIG4基因的1号外显子的部分、2号外显子至7号外显子的全部和8号外显子的部分,优选还包含1-2号内含子和/或7-8号内含子,更优选的包含1-8号外显子之间的任一内含子,其中,1号外显子的部分至少包含10bp的核苷酸序列,例如至少包含10、20、30、40、50、51、52、53、54、55、56、57、58、59、60、70、80、90、100、110、120、130、137bp的核苷酸序列,进一步优选的,包含55bp的核苷酸序列;优选的,1号外显子的部分包含从起始密码子开始至最后一个核苷酸序列,8号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、210、220、230、235、236、237、238、239、240、250、300、400、500、600、700、750、760、763bp的核苷酸序列,进一步优选的,包含238bp的核苷酸序列;优选的,8号外显子的部分包含从8号外显子第一个核苷酸开始至终止密码子,优选的,所述的人源化VSIG4基因包含人VSIG4的CDS序列。
优选的,所述的非人动物VSIG4基因的部分为非人动物VSIG4基因的1号外显子和/或6-7号外显子;进一步优选还包含非人动物2号外显子的部分和/或5号外显子的部分。
在本发明的一个具体实施方式中,所述的人源化VSIG4基因还包含编码SEQ IDNO:1第1-19位或186-210位的核苷酸序列;或者,包含与编码SEQ ID NO:1第1-19位或186-210位的核苷酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与编码SEQ ID NO:1第1-19位或186-210位的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含具有编码SEQ ID NO:1第1-19位或186-210位的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化VSIG4基因包含与SEQ ID NO:6、7和/或58具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列,或者包含SEQ ID NO:6、7和/或58所示的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化VSIG4基因包含下列组中的一种:
(A)为SEQ ID NO:5、30或31所示核苷酸序列的全部或部分;
(B)与SEQ ID NO:5、30或31所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(C)与SEQ ID NO:5、30或31所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(D)具有SEQ ID NO:5、30或31所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化VSIG4基因转录的mRNA选自下列组中的一种:
(i)为SEQ ID NO:10或33所示核苷酸序列的全部或部分;
(ii)与SEQ ID NO:10或33所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)与SEQ ID NO:10或33所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)与SEQ ID NO:10或33所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个实施方式中,所述的人源化VSIG4基因还包含编码具有连接功能的肽段的核苷酸序列,进一步优选的,所述的人源化VSIG4基因还包含P2A序列,更优选的,所述的P2A序列如SEQ ID NO:29所示。
在本发明的一个实施方式中,所述的人源化VSIG4基因还包含辅助序列STOP序列,所述的STOP序列包含SEQ ID NO:32所示核苷酸序列。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
优选的,所述的人源化VSIG4基因还包括特异性诱导物或阻遏物。进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-Off System/Tet-On System)或他莫昔芬系统(Tamoxifen System)。
本发明的第四方面,提供了一种靶向载体,所述的靶向载体包含供体核苷酸序列,所述的供体核苷酸序列包含人VSIG4基因的部分。
优选的,所述的人VSIG4基因的部分包含人VSIG4基因的1号至8号外显子的全部或部分。进一步优选的,包含1号至8号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合的全部或部分。更进一步优选的,包含2号至6号外显子的全部或部分。再进一步优选的,包含2号外显子的部分、3号外显子至5号外显子的全部和6号外显子的部分,优选还包含2-3号内含子和/或5-6号内含子,更优选的包含2-6号外显子之间的任一内含子,其中,2号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、130、150、170、200、220、250、270、300、320、350、351、352、353、354、355、356、357bp的核苷酸序列,进一步优选的,包含355bp的核苷酸序列;优选的,2号外显子的部分包含2号外显子中编码胞外区的核苷酸序列,6号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、6、7、8、9、10、20、50、60、70、80、90、100、105bp的核苷酸序列,进一步优选的,包含8bp的核苷酸序列。最为优选的,所述的靶向载体包含与SEQ ID NO:5具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含SEQ ID NO:5所示核苷酸序列。
在本申请的一个实施方式中,所述的人VSIG4基因的部分包含人VSIG4基因的1号外显子的部分、2号外显子至7号外显子的全部和8号外显子的部分,优选还包含1-2号内含子和/或7-8号内含子,更优选的包含1-8号外显子之间的任一内含子,其中,1号外显子的部分至少包含10bp的核苷酸序列,例如至少包含10、20、30、40、50、51、52、53、54、55、56、57、58、59、60、70、80、90、100、110、120、130、137bp的核苷酸序列,进一步优选的,包含55bp的核苷酸序列;优选的,1号外显子的部分包含从起始密码子开始至最后一个核苷酸序列,8号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、210、220、230、235、236、237、238、239、240、250、300、400、500、600、700、750、760、763bp的核苷酸序列,进一步优选的,包含238bp的核苷酸序列;优选的,8号外显子的部分包含从8号外显子第一个核苷酸开始至终止密码子,优选的,所述的人VSIG4基因的部分包含包含人VSIG4的CDS序列,最为优选的,所述的靶向载体包含与SEQ ID NO:30具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含SEQ ID NO:30所示核苷酸序列。
优选的,所述的靶向载体还包含与SEQ ID NO:31具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含SEQ ID NO:31所示核苷酸序列。
优选的,所述的靶向载体包含编码人VSIG4蛋白或上述的人源化VSIG4蛋白的核苷酸序列。
优选的,所述的靶向载体包含编码人VSIG4蛋白胞外区的全部或部分核苷酸序列。
优选的,所述的靶向载体包含上述的人源化VSIG4基因的核苷酸序列。
优选的,所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段,即5’臂,其选自非人动物VSIG4基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的5’臂与NCBI登录号为NC_000086.8至少具有90%同源性的核苷酸。更进一步优选的,所述5’臂序列与SEQ ID NO:3、12、27或56至少具有90%同源性,或者如SEQ ID NO:3、12、27或56所示。和/或,所述的靶向载体还包含与待改变的转换区3’端同源的DNA片段,即3’臂,其选自非人动物VSIG4基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的3’臂与NCBI登录号为NC_000086.8至少具有90%同源性的核苷酸。更进一步优选的,所述的3’臂序列与SEQ ID NO:4、13、28或57至少具有90%同源性,或者如SEQ ID NO:4、13、28或57所示。
在本发明的一个具体实施方式中,所述的靶向载体包含与SEQ ID NO:6、7、8、9、58、59和/或34具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列,或者包含SEQ ID NO:6、7、8、9、58、59和/或34所示的核苷酸序列。
优选的,所述的待改变的转换区位于非人动物VSIG4基因座上。进一步优选的,位于VSIG4基因的1号至7号外显子上。更进一步优选的,位于2号至5号外显子或2号外显子上。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
优选的,所述的靶向载体还包含标记基因。进一步优选的,所述标记基因为负筛选标记的编码基因。更进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。
在本发明的一个具体实施方式中,所述的靶向载体中还包括阳性克隆筛选的抗性基因。进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。
在本发明的一个具体实施方式中,所述的靶向载体中还包括特异性重组系统。进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统)。所述的特异性重组系统为具有两个Frt重组位点,分别连接在抗性基因的两侧。
本发明的第五方面,提供了一种sgRNA,所述的sgRNA靶向非人动物VSIG4基因,其靶位点位于VSIG4基因的2号外显子和/或5号外显子上。
优选的,所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO:14-19任一项所示,3’端靶位点序列如SEQ ID NO:20-25任一项所示。
在本发明的一个具体实施方式中,所述的sgRNA靶位点位于VSIG4基因的2号外显子上。
优选的,所述的sgRNA靶向的靶位点序列如SEQ ID NO:14-19任一项所示。
在本发明的一个具体实施方式中,所述的sgRNA靶向的靶位点序列如SEQ ID NO:19所示。
本发明的第六方面,提供了一种编码上述sgRNA的DNA分子。优选的,所述的DNA分子的双链为sgRNA的上下游序列,或者加入酶切位点后的正向寡核苷酸序列或反向寡核苷酸序列。
在本发明的一个具体实施方式中,所述的DNA分子可以为SEQ ID NO:35和SEQ IDNO:37,或者,SEQ ID NO:36和SEQ ID NO:38。
本发明的第七方面,提供了一种包含上述sgRNA的载体。
本发明的第八方面,提供了一种包含上述的靶向载体、上述的sgRNA、上述的DNA分子和/或上述载体的细胞。
本发明的第九方面,提供了一种上述的靶向载体、上述的sgRNA、上述的DNA分子、上述载体和/或上述细胞在VSIG4基因编辑中的应用,所述的应用包括但不限于敲除、插入或替换。
本发明的第十方面,提供了一种VSIG4基因人源化的非人动物,所述的非人动物体内表达人或人源化VSIG4蛋白。
优选的,所述的非人动物的内源VSIG4蛋白表达降低或缺失。
优选的,所述的非人动物体内表达上述的人源化VSIG4蛋白。优选的,人VSIG4基因的部分或者人源化VSIG4基因的核苷酸序列可操作的连接到至少一条染色体中内源性VSIG4基因座处的内源性调控元件。
优选的,所述的非人动物体内包含人VSIG4基因的部分,更优选包含上述的人源化VSIG4基因。
优选的,所述的非人动物的基因组中包含人VSIG4基因的部分。进一步优选的,所述的非人动物的基因组中包含人VSIG4基因的1号至8号外显子的全部或部分。进一步优选的,包含1号至8号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合的全部或部分。更进一步优选的,包含2号至6号外显子的全部或部分。再进一步优选的,包含2号外显子的部分、3号外显子至5号外显子的全部和6号外显子的部分,优选还包含2-3号内含子和/或5-6号内含子,更优选的包含2-6号外显子之间的任一内含子,其中,2号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、130、150、170、200、220、250、270、300、320、350、351、352、353、354、355、356、357bp的核苷酸序列,进一步优选的,包含355bp的核苷酸序列;优选的,2号外显子的部分包含2号外显子中编码胞外区的核苷酸序列,6号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、6、7、8、9、10、20、50、60、70、80、90、100、105bp的核苷酸序列,进一步优选的,包含8bp的核苷酸序列。
在本申请的一个实施方式中,所述的非人动物的基因组中包含人VSIG4基因的1号外显子的部分、2号外显子至7号外显子的全部和8号外显子的部分,优选还包含1-2号内含子和/或7-8号内含子,更优选的包含1-8号外显子之间的任一内含子,其中,1号外显子的部分至少包含10bp的核苷酸序列,例如至少包含10、20、30、40、50、51、52、53、54、55、56、57、58、59、60、70、80、90、100、110、120、130、137bp的核苷酸序列,进一步优选的,包含55bp的核苷酸序列;优选的,1号外显子的部分包含从起始密码子开始至最后一个核苷酸序列,8号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、210、220、230、235、236、237、238、239、240、250、300、400、500、600、700、750、760、763bp的核苷酸序列,进一步优选的,包含238bp的核苷酸序列;优选的,8号外显子的部分包含从8号外显子第一个核苷酸开始至终止密码子,优选的,所述的非人动物的基因组中包含人VSIG4的CDS序列。
在本发明的一个具体实施方式中,所述的非人动物的基因组中包含编码人VSIG4蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列,其中,所述的胞外区包含人VSIG4蛋白胞外区的全部或部分,优选的,包含至少50个连续氨基酸的人VSIG4蛋白胞外区,例如至少包含50、70、100、110、120、150、170、200、210、230、250、260、261、262、263、264个连续氨基酸的人VSIG4蛋白胞外区,进一步优选的,包含262或264个连续氨基酸的人VSIG4蛋白胞外区;更优选的,包含与SEQ ID NO:2的第20-281或20-283位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第20-281或20-283位所示氨基酸序列;所述的信号肽包含人VSIG4蛋白信号肽的全部或部分,优选的,包含与SEQ ID NO:2的第1-19位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第1-19位所示氨基酸序列;所述的跨膜区包含人VSIG4蛋白跨膜区的全部或部分,优选的,包含与SEQ ID NO:2的第284-304位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ IDNO:2的第284-304位所示氨基酸序列;所述的胞质区包含人VSIG4蛋白胞质区的全部或部分,优选的,包含与SEQ ID NO:2的第305-399位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第305-399位所示氨基酸序列,优选的,所述的非人动物的基因组中包含与编码SEQ ID NO:2的第20-281或1-399位的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:2的第20-281或1-399位的核苷酸序列。
根据本发明的一些实施例,所述的非人动物进一步包含其他基因修饰,所述其他基因选自PD-1、PD-L1、IL4、IL4R、IL6、IL6R、IL17、IL7R、CCR5和CCR8中的至少一种。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
根据本发明的一些实施例,该非人动物的人源化VSIG4基因和所述其他基因对于非人动物内源基因座的替换可以是杂合的,也可以是纯合的。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第十一方面,提供了一种VSIG4基因缺失的非人动物,所述的非人动物缺失VSIG4基因的1号至7号外显子的全部或部分。优选的,所述的非人动物缺失VSIG4基因的2号至5号外显子的全部或部分,或者,缺失VSIG4基因的2号外显子的全部或部分。更优选所述的非人动物缺失VSIG4基因的2号外显子的部分、3号外显子至4号外显子的全部和5号外显子的部分,或者,缺失VSIG4基因的2号外显子的部分。
本发明的第十二方面,提供了一种VSIG4基因缺失的非人动物的构建方法,所述的构建方法包括采用上述靶向载体或上述的sgRNA进行非人动物的制备。
本发明的第十三方面,提供了一种VSIG4基因人源化的非人动物的构建方法,所述的非人动物体内表达人或人源化VSIG4蛋白。
优选的,所述的人源化VSIG4蛋白包含上述的人源化VSIG4蛋白。
优选的,所述的非人动物的基因组中还包含人源化VSIG4基因,所述的人源化VSIG4基因包含上述的人源化VSIG4基因。
优选的,所述的非人动物的基因组中还包含上述的核酸。
优选的,所述的非人动物为上述的VSIG4基因人源化的非人动物。
优选的,所述的构建方法包括用包含编码人VSIG4蛋白或上述的人源化VSIG4蛋白的核苷酸序列导入非人动物VSIG4基因座。
优选的,所述的构建方法包括用包含编码人VSIG4蛋白胞外区的全部或部分核苷酸序列导入非人动物VSIG4基因座。
优选的,所述的构建方法包括用包含上述的人源化VSIG4基因的核苷酸序列导入非人动物VSIG4基因座。
优选的,所述的构建方法包括用包含人VSIG4基因的部分核苷酸序列导入非人动物VSIG4基因座,进一步优选的,所述的人VSIG4基因的部分核苷酸序列包含人VSIG4基因的1号至8号外显子的全部或部分。更优选的,包含1号至8号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合的全部或部分。更进一步优选的,包含2号至6号外显子的全部或部分。再进一步优选的,包含2号外显子的部分、3号外显子至5号外显子的全部和6号外显子的部分,优选还包含2-3号内含子和/或5-6号内含子,更优选的包含2-6号外显子之间的任一内含子,其中,2号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、130、150、170、200、220、250、270、300、320、350、351、352、353、354、355、356、357bp的核苷酸序列,进一步优选的,包含355bp的核苷酸序列;优选的,2号外显子的部分包含2号外显子中编码胞外区的核苷酸序列,6号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、6、7、8、9、10、20、50、60、70、80、90、100、105bp的核苷酸序列,进一步优选的,包含8bp的核苷酸序列,优选的,所述的人VSIG4基因的部分核苷酸序列包含与SEQ ID NO:5具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含SEQ IDNO:5所示核苷酸序列。
在本发明的另一个实施方式中,所述的人VSIG4基因的部分核苷酸序列包含人VSIG4基因的1号外显子的部分、2号外显子至7号外显子的全部和8号外显子的部分,优选还包含1-2号内含子和/或7-8号内含子,更优选的包含1-8号外显子之间的任一内含子,其中,1号外显子的部分至少包含10bp的核苷酸序列,例如至少包含10、20、30、40、50、51、52、53、54、55、56、57、58、59、60、70、80、90、100、110、120、130、137bp的核苷酸序列,进一步优选的,包含55bp的核苷酸序列;优选的,1号外显子的部分包含从起始密码子开始至最后一个核苷酸序列,8号外显子的部分至少包含100bp的核苷酸序列,例如至少包含100、150、200、210、220、230、235、236、237、238、239、240、250、300、400、500、600、700、750、760、763bp的核苷酸序列,进一步优选的,包含238bp的核苷酸序列;优选的,8号外显子的部分包含从8号外显子第一个核苷酸开始至终止密码子,优选的,所述的人VSIG4基因的部分核苷酸序列包含人VSIG4的CDS序列,进一步优选的,所述的人VSIG4基因的部分核苷酸序列包含与SEQ ID NO:30具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含SEQ ID NO:30所示核苷酸序列。
优选的,所述的构建方法包括用包含编码人VSIG4蛋白的全部或部分核苷酸序列导入非人动物VSIG4基因座。进一步优选的,所述的构建方法包括用包含编码人VSIG4蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列导入非人动物VSIG4基因座,其中,所述的胞外区包含人VSIG4蛋白胞外区的全部或部分,优选的,包含至少50个连续氨基酸的人VSIG4蛋白胞外区,例如至少包含50、70、100、110、120、150、170、200、210、230、250、260、261、262、263、264个连续氨基酸的人VSIG4蛋白胞外区,进一步优选的,包含262或264个连续氨基酸的人VSIG4蛋白胞外区;更优选的,包含与SEQ ID NO:2的第20-281或20-283位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第20-281或20-283位所示氨基酸序列;所述的信号肽包含人VSIG4蛋白信号肽的全部或部分,优选的,包含与SEQ ID NO:2的第1-19位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第1-19位所示氨基酸序列;所述的跨膜区包含人VSIG4蛋白跨膜区的全部或部分,优选的,包含与SEQ IDNO:2的第284-304位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第284-304位所示氨基酸序列;所述的胞质区包含人VSIG4蛋白胞质区的全部或部分,优选的,包含与SEQ ID NO:2的第305-399位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2的第305-399位所示氨基酸序列,优选的,所述的构建方法包括用包含与编码SEQ ID NO:2的第20-281或1-399位的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:2的第20-281或1-399位的核苷酸序列导入非人动物VSIG4基因座。
优选的,所述的构建方法包括用从5’-3’包含P2A编码序列、人VSIG4的部分核苷酸序列、小鼠VSIG4部分序列和STOP序列导入非人动物VSIG4基因座,其中,所述的P2A编码序列包含SEQ ID NO:29所示核苷酸序列,所述人VSIG4的部分核苷酸序列包含SEQ ID NO:30或编码SEQ ID NO:2第1-399位所示氨基酸的核苷酸序列,所述的小鼠VSIG4部分序列包含SEQ ID NO:31所示核苷酸序列,所述的STOP序列包含SEQ ID NO:32所示核苷酸序列。
在本发明的一个具体实施方式中,用包含编码人VSIG4蛋白的cDNA序列导入非人动物VSIG4基因座。
在本发明的一个具体实施方式中,用包含编码人或人源化VSIG4蛋白的核苷酸序列导入非人动物VSIG4基因座。
在本发明的一个具体实施方式中,用包含人源化VSIG4基因的核苷酸序列导入非人动物VSIG4基因座。
优选的,本申请中所述的导入包括但不限于插入、替换或转基因,所述的替换优选为原位替换,进一步优选的,所述的导入为插入或替换。
优选的,所述的导入非人动物VSIG4基因座包括替换非人动物相应区域,优选为替换非人动物基因组中编码SEQ ID NO:1的第20-185位的核苷酸序列。
优选的,替换非人动物VSIG4基因的2号外显子至5号外显子的全部或部分,进一步优选地,非人动物的2号外显子的部分、3号外显子至4号外显子的全部和5号外显子的部分被替换。
优选的,所述的插入或替换的位点为VSIG4基因的内源调控元件之后,进一步优选的,插入位点位于非人动物2号外显子处,更优选的,插入位点位于NCBI登录号为NM_177789.5序列的208bp和209bp之间。
优选的,所述的插入位点位于编码SEQ ID NO:1的第46位与第47位氨基酸的核苷酸序列之间。
优选的,所述的插入为首先破坏非人动物内源VSIG4基因的编码框或者破坏插入序列之后的内源VSIG4基因的编码框,随后进行插入操作。或者所述的插入步骤即可给内源VSIG4基因造成移码突变又可以实现插入人源序列的步骤。
进一步优选的,可在插入序列中加入辅助序列(例如终止密码子或含有终止功能的序列等)或其他方法(例如,翻转序列,或敲除序列)使得插入位点后的非人动物内源VSIG4蛋白不能正常表达。
优选的,所述的导入的核苷酸序列在非人动物中通过调控元件进行调控。进一步优选的,所述的调控元件可以是内源性或者外源性。
优选的,所述的调控元件包括但不限于内源性启动子。
在本发明的一个具体实施方式中,所述的内源性调控元件来自非人动物VSIG4基因。所述的外源性调控元件来自人VSIG4基因。
优选的,所述的非人动物基因组中人或人源化VSIG4基因对于非人动物内源基因座的替换是纯合或者杂合的。
优选的,所述非人动物的基因组中至少一个染色体上包含人源化VSIG4基因。
优选的,所述的非人动物中至少一个细胞表达人或人源化VSIG4蛋白。
优选的,使用基因编辑技术进行非人动物的构建,所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、规律成簇间隔短回文重复(CRISPR/Cas9)技术、锌指核酸酶(ZFN)技术、转录激活子样效应因子核酸酶(TALEN)技术、归巢核酸内切酶(兆碱基大范围核酶)或其他分子生物学技术。
在本发明的一个具体实施方式中,所述的构建方法包括修饰非人动物VSIG4基因的编码框,将编码人或人源化VSIG4蛋白的核苷酸序列或者人源化VSIG4基因的核苷酸序列插入非人动物VSIG4基因内源调控元件之后。其中,所述的修饰非人动物VSIG4基因的编码框可以采用敲除非人动物VSIG4基因的功能区或者采用插入一段序列,使得非人动物VSIG4蛋白不表达或表达降低或表达的蛋白无功能。进一步优选的,所述的修饰非人动物VSIG4基因的编码框可以为敲除非人动物VSIG4基因的外显子2至外显子5或外显子2的全部或部分核苷酸序列。
在本发明的一个具体实施方式中,所述的构建方法包括将编码人或人源化VSIG4蛋白的核苷酸序列或者人源化VSIG4基因的核苷酸序列和/或辅助序列插入非人动物VSIG4基因内源调控元件之后。优选的,所述的辅助序列可以为终止密码子,使得VSIG4基因人源化的动物模型体内表达人VSIG4蛋白,不表达非人动物VSIG4蛋白。进一步优选的,所述的辅助序列为WPRE、P2A、STOP和/或polyA。
在本发明的一个具体实施方式中,所述的构建方法包括将编码人VSIG4蛋白的全部或部分(优选为人VSIG4蛋白的胞外区、信号肽、胞内区和/或胞质区,进一步优选为胞外区)插入或替换至非人动物VSIG4基因的相应区域(优选为编码非人动物VSIG4蛋白的胞外区的核苷酸序列)。
优选的,使用上述的靶向载体进行非人动物的构建。
优选的,为提高重组效率,还可以使用靶向VSIG4基因的sgRNA与上述靶向载体一起进行非人动物的构建。其中,所述的sgRNA靶向非人动物VSIG4基因,同时所述sgRNA的序列在待改变的VSIG4基因上的靶序列上。
优选的,所述的sgRNA靶位点位于VSIG4基因的2号外显子和/或5号外显子上。
优选的,所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO:14-19任一项所示,3’端靶位点序列如SEQ ID NO:20-25任一项所示。
在本发明的一个具体实施方式中,所述的sgRNA靶位点位于VSIG4基因的2号外显子上。
优选的,所述的sgRNA靶向的靶位点序列如SEQ ID NO:14-19任一项所示。
在本发明的一个具体实施方式中,所述的sgRNA靶向的靶位点序列如SEQ ID NO:19所示。
在本发明的一个具体实施方式中,所述的构建方法包括将上述靶向载体、靶向VSIG4基因的sgRNA及Cas9导入非人动物细胞中,培养该细胞(优选为胚胎干细胞),然后将培养后的细胞移植至雌性非人动物输卵管内,允许其发育,鉴定筛选获得VSIG4基因人源化的非人动物。
在本发明的另一个具体实施方式中,所述构建方法包括将上述靶向载体导入非人动物的胚胎干细胞中,短暂培养后导入事先分离好的囊胚中,得到的嵌合囊胚移植至受体母鼠的输卵管中,允许其发育,鉴定筛选获得VSIG4基因人源化的非人动物。
根据本发明的一些实施例,该构建方法进一步包括:将VSIG4基因人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因为PD-1、PD-L1、IL4、IL4R、IL6、IL6R、IL17、IL7R、CCR5和CCR8中的至少一种基因。
优选的,所述的非人动物还表达人或人源化的PD-1、PD-L1、IL4、IL4R、IL6、IL6R、IL17、IL7R、CCR5和CCR8蛋白中的至少一种。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第十四方面,提供了一种多基因修饰的非人动物的构建方法,包括如下步骤:
(一)提供上述的非人动物、上述的构建方法获得的非人动物;
(二)将步骤(一)提供的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因修饰的非人动物包括基因PD-1、PD-L1、IL4、IL4R、IL6、IL6R、IL17、IL7R、CCR5或CCR8中的一种或两种以上的组合人源化的非人动物。
优选的,所述的多基因修饰的非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物。
优选的,所述的多基因修饰的非人动物的基因组中人源化的多个基因中的每一个基因均可以是纯合或杂合的。
本发明的第十五方面,提供了一种上述的构建方法获得的非人动物或其子代。
本发明的第十六方面,提供了一种动物模型,所述的动物模型来源于上述的非人动物、上述的构建方法获得的非人动物或者上述的非人动物或其子代。优选的,所述动物模型为荷瘤或炎症动物模型。
本发明的第十七方面,提供了一种动物模型的构建方法,包括上述构建非人动物、非人动物或其子代、基因缺失的动物或者多基因修饰的非人动物的构建方法。优选的,所述动物模型为荷瘤或炎症动物模型。
本发明的第十八方面,提供了来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述构建的多基因修饰的非人动物在制备动物模型中的应用。优选的,所述动物模型为荷瘤或炎症动物模型。
本发明的第十九方面,提供了一种细胞或细胞系或原代细胞培养物,所述细胞或细胞系或原代细胞培养物来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的动物模型。优选的,所述的细胞或细胞系或原代细胞培养物不能发育成动物个体。
本发明的第二十方面,提供了一种组织或器官或其培养物,所述组织或器官或其培养物来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的动物模型。优选的,所述的组织或器官或其培养物不能发育成动物个体。
本发明的第二十一方面,提供了一种荷瘤后的瘤组织,所述的瘤组织来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的动物模型。
本发明的第二十二方面,提供了一种VSIG4基因人源化的细胞,所述的细胞表达人或人源化VSIG4蛋白。
优选的,所述的细胞表达上述的人源化VSIG4蛋白。
优选的,所述的细胞的基因组中包含人VSIG4基因的部分。更优选的,所述的细胞包含上述的人源化VSIG4基因。优选的,所述的细胞不能发育成动物个体。
本发明的第二十三方面,提供了一种表达上述的人源化VSIG4蛋白或包含上述人源化VSIG4基因的构建体。
本发明的第二十四方面,提供了一种包含上述构建体的细胞。优选的,所述的细胞不能发育成动物个体。
本发明的第二十五方面,提供了一种包含上述细胞的组织。优选的,所述的组织不能发育成动物个体。
本发明的第二十六方面,提供了来源于上述的人源化VSIG4蛋白、上述的人源化VSIG4基因、上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的动物模型、上述的细胞或细胞系或原代细胞培养物、上述的组织或器官或其培养物、上述的荷瘤后的瘤组织、上述的细胞、上述的构建体、上述的细胞或上述的组织的应用,所述的应用包含:
A)涉及人类细胞的与VSIG4相关的免疫过程的产品开发中的应用;
B)作为药理学、免疫学、微生物学和医学研究的与VSIG4相关的模型系统中的应用;
C)涉及生产和利用动物实验疾病模型用于与VSIG4相关的病原学研究和/或用于开发诊断策略和/或用于开发治疗策略中的应用;
D)在体内研究人VSIG4信号通路调节剂的筛选、药效检测、评估疗效、验证或评价中的应用;或者,
E)研究VSIG4基因功能,研究针对人VSIG4靶位点的药物、药效,研究与VSIG4相关的免疫相关疾病药物以及抗肿瘤药物方面的应用。
优选的,所述应用为非疾病的治疗和诊断目的。
本发明的第二十七方面,提供了一种人VSIG4特异性调节剂的筛选方法,所述的筛选方法包括向植入肿瘤细胞的个体施加调节剂,检测肿瘤抑制性;其中,所述的个体选自上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的动物模型。
优选的,所述的调节剂选自CAR-T、药物;优选的,所述的药物为抗体。
优选的,所述的调节剂为单抗或双特异性抗体或两种及两种以上药物的联合使用。
优选的,所述检测包括测定肿瘤细胞的大小和/或增殖速率。
优选的,所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。
优选的,所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化,所述的代谢变化包括食物消耗或水消耗的变化。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述人VSIG4特异性调节剂的筛选方法不是治疗方法。该方法用来筛选或评价药物,对候选药物的药效进行检测和比较,以确定哪些候选药物可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度,即治疗效果不是必然的,只是一种可能性。
本发明的第二十八方面,提供了一种干预方案的评价方法,所述的评价方法包括向个体植入肿瘤细胞,向植入肿瘤细胞的个体施加干预方案,对施加干预方案后的个体进行肿瘤抑制效果检测和评价;其中,所述的个体选自上述的非人动物,上述的构建方法获得的非人动物,上述的非人动物或其子代,或者上述的动物模型。
优选的,所述的干预方案选自CAR-T、药物治疗。进一步优选的,所述的药物为抗原结合蛋白。所述的抗体结合蛋白为抗体。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述干预方案的评价方法不是治疗方法。该评价方法对干预方案的效果进行检测和评价,以确定该干预方案是否有治疗效果,即治疗效果不是必然的,只是一种可能性。
本发明的第二十九方面,提供了一种来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的动物模型在制备人VSIG4特异性调节剂中的用途。
本发明的第三十方面,提供了一种来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的动物模型在制备治疗肿瘤或免疫相关疾病的药物中的用途。
本发明所述的VSIG4基因人源化的非人动物,其体内可正常表达人或人源化VSIG4蛋白,可用于针对人VSIG4通路靶位点的药物筛选、药效评估、免疫相关疾病和肿瘤治疗,可以加快新药研发过程、节约时间和成本。
本发明所述的“免疫相关疾病”包括但不限于过敏、哮喘、心肌炎、肾炎、肝炎、系统性红斑狼疮、类风湿性关节炎、硬皮病、甲状腺功能亢进、原发性血小板减少性紫癜、自身免疫性溶血性贫血、溃疡性结肠炎、自身免疫性肝病、糖尿病、疼痛或神经障碍等。
本发明所述的“肿瘤”包括但不限于淋巴瘤、非小细胞肺癌、宫颈癌、白血病、卵巢癌、鼻咽癌、乳腺癌、子宫内膜癌、结肠癌、直肠癌、胃癌、膀胱癌、脑胶质瘤、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺癌、头颈部癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中,所述的白血病选自急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病;所述淋巴瘤选自霍奇金淋巴瘤和非霍奇金淋巴瘤,包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症;所述肉瘤选自骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、以及软骨肉瘤。在本发明的一个具体实施方式中,所述的肿瘤为乳腺癌、卵巢癌、子宫内膜癌、黑色素瘤、肾癌、肺癌、肝癌。
本发明所述的“全部或部分”,“全部”为整体,“部分”为整体中的局部,或者组成整体的个体。
本发明所述的“人源化VSIG4蛋白”,包含来源于人VSIG4蛋白的部分和非人VSIG4蛋白的部分。
本发明所述的“人源化VSIG4蛋白”,包含来源于人VSIG4蛋白的部分。其中,所述的“人VSIG4蛋白”同“人VSIG4蛋白的全部”,即其氨基酸序列与人VSIG4蛋白的全长氨基酸序列一致。所述的“人VSIG4蛋白的部分”,为连续或间隔的5-399个(优选为10-399或10-262个)氨基酸序列与人VSIG4蛋白的氨基酸序列一致或与人VSIG4蛋白的氨基酸序列具有70%以上同源性。
本发明所述的“人源化VSIG4基因”,包含来源于人VSIG4基因的部分和非人VSIG4基因的部分。其中,所述的“人VSIG4基因”同“人VSIG4基因的全部”,即其核苷酸序列与人VSIG4基因的全长核苷酸序列一致。所述的“人VSIG4基因的部分”为连续或间隔的20-18355bp(优选为20-8707bp、20-1200bp或20-786bp)个核苷酸序列与人VSIG4核苷酸序列一致或与人VSIG4核苷酸序列具有70%以上同源性。
本发明所述的“xx号至xxx号外显子”或“xx号至xxx号外显子的全部”包含外显子及其期间的内含子的核苷酸序列,例如所述的“2号至3号外显子”包含2号外显子、2-3号内含子、3号外显子的全部核苷酸序列。
本发明所述的“x-xx号内含子”表示x号外显子与xx号外显子之间的内含子。例如“2-3号内含子”表示2号外显子与3号外显子之间的内含子。
本发明所述的“外显子的部分”表示连续或间隔几个、几十个或几百个核苷酸序列与全部的外显子核苷酸序列一致。例如人VSIG4基因的2号外显子的部分,包含连续或间隔的5-357bp个,优选10-355bp个核苷酸序列与人VSIG4基因的2号外显子核苷酸序列一致。在本发明的一个具体实施方式中,所述的“人源化VSIG4基因”中包含的“2号外显子的部分”至少包括2号外显子中编码胞外区的核苷酸序列。
本发明所述的“基因座”广义上讲代表基因在染色体上所占的位置,狭义上讲代表某一基因上的一段DNA片段,即可以是一个基因也可以是一个基因的一部分。例如所述的“VSIG4基因座”表示VSIG4基因1号至7号外显子上的任选一段的DNA片段。优选为1号外显子、2号外显子、3号外显子、4号外显子、5号外显子、6号外显子、7号外显子或其期间的内含子中的任一个或两个或多个的组合,或一个或两个或多个的全部或部分,更优选为VSIG4基因的2号至5号外显子或2号外显子上。
本发明所述的“核苷酸序列”包含天然的或经过修饰的核糖核苷酸序列、脱氧核糖核苷酸序列。优选为DNA、cDNA、pre-mRNA、mRNA、rRNA、hnRNA、miRNAs、scRNA、snRNA、siRNA、sgRNA、tRNA。
本发明所述的“三个以上”包括但不限于三个、四个、五个、六个或七个等等。
本发明所述的“连续三个以上”包括但不限于连续三个、连续四个、连续五个、连续六个、连续七个或连续八个等等。其中“1号至8号外显子的连续三个以上”包括连续三个、四个、五个、六个、七个或八个等等外显子,还包括期间的内含子核苷酸序列。
本发明所述“治疗(treating)”(或“治疗(treat)”或“治疗(treatment)”)表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除。术语“治疗(treating)”等是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。
本发明所述“同源性”,是指在使用氨基酸序列或核苷酸序列的方面,本领域技术人员在保证与已知序列相似结构或功能的前提下,可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。
本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。
在一个方面,所述非人动物是哺乳动物。在一个方面,所述非人动物是小型哺乳动物,例如跳鼠科。在一个实施方式中,所述基因人源化的非人动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。
在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:Molecular Cloning A Laboratory Manual,2ndEd.,ed.By Sambrook,FritschandManiatis(Cold Spring Harbor Laboratory Press:1989);DNA Cloning,Volumes I and II(D.N.Glovered.,1985);Oligonucleotide Synthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelsonand M.Simon,eds.inchief,Academic Press,Inc.,New York),specifically,Vols.154and 155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,ed.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods InCell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook Of Experimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);and Manipulating the Mouse Embryo,(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1986)。
以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。
下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:小鼠VSIG4基因和人VSIG4基因座对比示意图(非按比例);
图2:小鼠VSIG4基因人源化改造示意图一(非按比例);
图3:VSIG4基因打靶策略及靶向载体V1设计示意图(非按比例);
图4:VSIG4基因打靶策略及靶向载体V2设计示意图(非按比例);
图5:小鼠VSIG4基因人源化改造示意图二(非按比例);
图6:VSIG4基因打靶策略及靶向载体V3设计示意图(非按比例);
图7:VSIG4基因打靶策略及靶向载体V4设计示意图(非按比例);
图8:Cas9/sgRNA相对活性;
图9:F0代小鼠基因型鉴定结果,其中M为Marker,WT为野生型对照,H2O为水对照;
图10:F1代小鼠基因型鉴定结果,其中M为Marker,WT为野生型对照,PC为阳性对照,H2O为水对照;
图11:Southern blot检测结果,其中WT为野生型对照;
图12:RT-PCR检测结果,其中+/+为野生型C57BL/6小鼠,H/+为VSIG4基因人源化杂合子小鼠,H2O为水对照;
图13:VSIG4基因人源化纯合小鼠(H/H)和野生型C57BL/6小鼠(+/+)脾脏组织的白细胞亚型(A)和T细胞亚型(B)的免疫分型检测结果;
图14:VSIG4基因人源化纯合小鼠(H/H)和野生型C57BL/6小鼠(+/+)淋巴结组织中白细胞亚型(A)和T细胞亚型(B)的免疫分型检测结果;
图15:VSIG4基因人源化纯合小鼠(H/H)和野生型C57BL/6小鼠(+/+)外周血组织中白细胞亚型(A)和T细胞亚型(B)的免疫分型检测结果;
图16:VSIG4基因人源化小鼠药效验证结果,其中(A)小鼠体重变化情况,(B)为小鼠体内肿瘤变化情况。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
在下述每一实施例中,设备和材料是从以下所指出的几家公司获得:
BbsI、EcoRI、BamHI、AseI、BspHI酶购自NEB,货号分别为R0539L、R0101M、R0136M、R0526M、R0517L;
C57BL/6小鼠购自中国食品药品检定研究院国家啮齿类实验动物种子中心;
Ambion体外转录试剂盒购自Ambion,货号AM1354;
Cas9mRNA来源SIGMA,货号CAS9MRNA-1EA;
UCA试剂盒来源百奥赛图公司,货号BCG-DX-001;
Purified anti-mouse CD16/32Antibody购自Biolegend,货号101302;
Zombie NIRTM Fixable Viability Kit购自Biolegend,货号423106;
Brilliant Violet 510TM anti-mouse CD45购自Biolegend,货号103138;
PerCP anti-mouse Ly-6G/Ly-6C(Gr-1)Antibody购自Biolegend,货号108426;
V450 Rat Anti-mouse CD11b购自BD Horizon,货号560455;
FITC anti-mouse F4/80购自Biolegend,货号123108;
PE-VSIG4 Monoclonal Antibody(NLA14)购自eBioscience,货号12-5752-82;
APC-VSIG4 Monoclonal Antibody(JAV4)购自eBioscience,货号17-5757-41;
Brilliant Violet 421TM anti-mouse CD4 Antibody购自Biolegend,货号100438;
PE anti-mouse CD8a Antibody购自Biolegend,货号100708;
PE/CyTM 7Mouse anti-mouse NK1.1 Antibody购自BD Pharmingen,货号552878;
APC anti-mouse/rat Foxp3 Antibody购自eBioscience,货号17-5773-82;
FITC anti-Mouse CD19 Antibody购自Biolegend,货号115506;
PerCP/Cy5.5 anti-mouse TCRβchain Antibody购自BD PharmingenTM,货号553174;
Brilliant Violet 605TManti-mouse CD11c Antibody购自Biolegend,货号117334;
PE anti-mouse/human CD11b Antibody购自Biolegend,货号101208;
APC/Cy7 anti-mouse CD45 antibody购自Biolegend,货号103116;
PerCP/Cyanine5.5 anti-mouse CD3εantibody购自Biolegend,货号100328;
FITC anti-mouse CD4 antibody购自Biolegend,货号100406;
Brilliant Violet 711TManti-mouse CD8a antibody购自Biolegend,货号100748;
PerCP anti-mouse/human CD11b antibody购自Biolegend,货号101230;
Anti-Mo/Rt FoxP3PE/CyTM7antibody购自eBioscience,货号25-5773-82;
Pacific BlueTM anti-mouse I-A/I-E antibody购自Biolegend,货号107620;
PE/Cyanine7 anti-mouseCD206(MMR)antibody购自Biolegend,货号141720;
Brilliant Violet 711TManti-mouse Ly-6G/Ly-6C(Gr-1)Antibody购自Biolegend,货号108443。
实施例1 VSIG4基因人源化小鼠制备方法一
小鼠VSIG4基因(NCBI Gene ID:278180,Primary source:MGI:2679720,UniProt:F6TUL9,位于X染色体NC_000086.8的第95290807至95337044位,基于转录本NM_177789.5及其编码蛋白NP_808457.1(SEQ ID NO:1))和人VSIG4基因(NCBI Gene ID:11326,Primarysource:HGNC:17032,UniProt ID:Q9Y279,位于X染色体NC_000023.11的第66021738至66040092位,基于转录本NM_007268.3及其编码蛋白NP_009199.1(SEQ ID NO:2))对比示意图如图1所示。
为了达到本发明的目的,可在小鼠内源VSIG4基因座导入编码人VSIG4蛋白的核苷酸序列,使得该小鼠表达人或人源化VSIG4蛋白。具体来说,用基因编辑技术,在小鼠VSIG4基因调节元件的控制下,用编码人VSIG4蛋白的核苷酸序列替换小鼠相应序列,得到人源化VSIG4基因座示意图如图2所示,实现对小鼠VSIG4基因的人源化改造。
进一步设计如图3所示的打靶策略示意图,图中显示了靶向载体V1上含有小鼠VSIG4基因的上游和下游的同源臂序列,以及包含编码人VSIG4蛋白的核苷酸序列的A1片段。其中,上游同源臂序列(5’同源臂,SEQ ID NO:3)与NCBI登录号为NC_000086.8的第95334451至95338756位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:4)与NCBI登录号为NC_000086.8的第95286193至95290531位核苷酸序列相同;A1片段上包含的人VSIG4基因序列(SEQ ID NO:5)与NCBI登录号为NC_000023.11的第66025122至66033828位核苷酸序列相同;A1片段中人VSIG4序列上游与小鼠的连接设计为5’-gtctgtgtttgcctttttgactttgttccctgttttaggccgtcccatcctggaagtgccagagagtgtaacaggacctt-3’(SEQ ID NO:6),其中序列“taggc”中的“c”是小鼠的最后一个核苷酸,序列“cgtccc”中的第一个“c”是人的第一个核苷酸;人VSIG4序列下游与小鼠的连接设计为5’-caaataccacttgatcttgttttaccctctaggaaagagcctgccaatctttgccataatcttcatcatctccctttgct-3’(SEQ ID NO:7),其中序列“agagc”中的“c”是人的最后一个核苷酸,序列“ctgcca”中的第一个“c”是小鼠的第一个核苷酸。
靶向载体V1上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neo cassette)。其中Neo盒5’端与小鼠基因的连接设计为5’-ttattagatatttTCTTTATATACATTTCAAATGCTATCCGATATCGAATTCCGAAGTTCCTATTCTCTAGAAAGTATAGGAA-3’(SEQ IDNO:8),其中序列“TATCC”中的最后一个“C”是小鼠的最后一个核苷酸,序列“GATAT”中的“G”是Neo盒的第一个核苷酸;Neo盒3’端与小鼠基因的连接设计为5’-GAAAGTATAGGAACTTCATCAGTCAGGTACATAATGGTGGATCCAGTACTTGAAAGTTCCCTATACCCTCCCTCCGccctgctcccctac-3’(SEQID NO:9),其中序列“GTACT”中的最后一个“T”是Neo盒的最后一个核苷酸,序列“TGAAA”中的“T”是小鼠的第一个核苷酸。此外,还在靶向载体V1的3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。改造后的人源化小鼠VSIG4的mRNA序列如SEQ ID NO:10所示,表达的蛋白序列如SEQ ID NO:11所示。
靶向载体构建可采用常规方法进行,如酶切连接等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况,筛选出正确的阳性克隆细胞。将筛选出的正确阳性克隆细胞(黑色鼠)按照本领域已知的技术导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因后,再通过互相交配即可得到VSIG4基因人源化纯合子小鼠。
还可引入CRISPR/Cas系统进行基因编辑,设计如图4所示的打靶策略,图中显示了靶向载体V2上含有小鼠VSIG4基因上游和下游的同源臂序列,以及包含人VSIG4核苷酸序列的A2片段。其中,上游同源臂序列(5’同源臂,SEQ ID NO:12)与NCBI登录号为NC_000086.8的第95334451至95335151位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:13)与NCBI登录号为NC_000086.8的第95291492至95293577位核苷酸序列相同,人VSIG4核苷酸序列如SEQ ID NO:5所示。
靶向载体构建可采用常规方法进行,如酶切连接、直接合成等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体用于后续实验。
靶序列决定了sgRNA的靶向特异性和诱导Cas9切割目的基因的效率。因此,高效特异的靶序列选择和设计是构建sgRNA表达载体的前提。设计并合成识别5’端和3’端靶位点的sgRNA序列,各sgRNA在VSIG4基因上的靶序列如下:
sgRNA1靶位点(SEQ ID NO:14):5’-AGGGTGGGGTGGCCTAAAACAGG-3’
sgRNA2靶位点(SEQ ID NO:15):5’-CAGGTCCCTGTCACACTCTCAGG-3’
sgRNA3靶位点(SEQ ID NO:16):5’-GCAAGTTTTGGTGAAATGGCTGG-3’
sgRNA4靶位点(SEQ ID NO:17):5’-CAGGAATCACTATACATGTGAGG-3’
sgRNA5靶位点(SEQ ID NO:18):5’-ATCTTCCTACGTGACTCCACTGG-3’
sgRNA6靶位点(SEQ ID NO:19):5’-TGCATCTATGATCCCCTGAGAGG-3’
sgRNA7靶位点(SEQ ID NO:20):5’-AAATAAGACCAAGTGCTATTTGG-3’
sgRNA8靶位点(SEQ ID NO:21):5’-GACTTTAATACCAACATACCAGG-3’
sgRNA9靶位点(SEQ ID NO:22):5’-GGTCTTGCTACTATCATACCAGG-3’
sgRNA10靶位点(SEQ ID NO:23):5’-AGCTGTTAGTTATCCTATAATGG-3’
sgRNA11靶位点(SEQ ID NO:24):5’-TGACCAAGGATTATAGTAACAGG-3’
sgRNA12靶位点(SEQ ID NO:25):5’-ACATAGGCTTCTCTCAATATTGG-3’
利用UCA试剂盒检测各sgRNA的活性,从中选择活性高、特异性强的两条sgRNA,在其5’端及互补链上分别加上酶切位点得到正向寡核苷酸和反向寡核苷酸序列,退火后将退火产物连接至pT7-sgRNA质粒(质粒先用BbsI线性化),获得表达载体pT7-VSIG4。
pT7-sgRNA载体由质粒合成公司合成含有T7启动子及sgRNA scaffold的片段DNA(SEQ ID NO:26)并依次通过酶切(EcoRI及BamHI)连接至骨架载体(来源Takara,货号3299)上,经专业测序公司测序验证,结果表明获得了目的质粒。
取小鼠的原核期受精卵,例如C57BL/6小鼠,利用显微注射仪将获得的表达载体pT7-VSIG4质粒的体外转录产物(使用Ambion体外转录试剂盒,按照说明书方法进行转录)、靶向载体与Cas9 mRNA预混好后注射至小鼠受精卵细胞质或细胞核中。按照《小鼠胚胎操作实验手册(第三版)》(安德拉斯·纳吉,化学工业出版社,2006)中的方法进行受精卵的显微注射,注射后的受精卵转移至培养液中短暂培养,然后移植至受体母鼠的输卵管中发育,将获得的小鼠(F0代)通过杂交和自交,扩大种群数量,建立稳定的VSIG4基因人源化小鼠品系。
可通过常规检测方法(如PCR分析)鉴定F0代小鼠体细胞的基因型,将F0鉴定为阳性的VSIG4基因人源化小鼠与野生型小鼠交配得到F1代小鼠,再将F1代小鼠相互交配,获得F2代VSIG4基因人源化纯合子小鼠。
实施例2 VSIG4基因人源化小鼠制备方法二
此外,还可以通过基因编辑技术,将编码人VSIG4蛋白的核苷酸序列插入小鼠VSIG4基因2号外显子,并通过编码具有连接功能的肽段(例如P2A)的核苷酸序列连接小鼠序列和人的序列,得到人源化VSIG4基因座示意图如图5所示,实现对小鼠VSIG4基因的人源化改造。
进一步设计如图6所示的打靶策略示意图,图中显示了靶向载体V3上含有小鼠VSIG4基因的上游和下游的同源臂序列,以及包含编码人VSIG4蛋白的核苷酸序列的A3片段。其中,上游同源臂序列(5’同源臂,SEQ ID NO:56)与NCBI登录号为NC_000086.8的第95334370至95338100位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:57)与NCBI登录号为NC_000086.8的第95329107至95332689位核苷酸序列相同;A3片段从5’端到3’端依次包括P2A编码序列(SEQ ID NO:29)、人VSIG4核苷酸序列(SEQ ID NO:30)、小鼠VSIG4核苷酸序列(SEQ ID NO:31)及STOP序列(SEQ ID NO:32),其中人VSIG4核苷酸序列与NCBI登录号为NM_007268.3的第83至1282位核苷酸序列相同,小鼠VSIG4核苷酸序列与NCBI登录号为NC_000086.8的第95290668至95291327位核苷酸序列相同。A3片段上STOP序列与小鼠的连接设计为5’-gtaagtaagcttgggctgcaggtcgagggacctaGTCGACagaggctacaggcaagttttggtgaaatggctggtaagac-3’(SEQ ID NO:58),其中序列“GTCGAC”中的最后一个“C”是STOP序列的最后一个核苷酸,序列“agagg”中的第一个“a”是小鼠的第一个核苷酸。
靶向载体V3上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neo cassette)。其中Neo盒5’端与小鼠基因的连接设计为5’-ctgacctgtgtctttttatagcagtattgtgctggttttgGAATTCCGAAGTTCCTATTCTCTAGAAAGTATAGGAACTTCAGGT-3’(SEQ IDNO:59),其中序列“gttttg”中的最后一个“g”是小鼠的最后一个核苷酸,序列“GAATT”中的“G”是Neo盒的第一个核苷酸;Neo盒3’端与小鼠基因的连接设计为5’-TTCTCTAGAAAGTATAGGAACTTCATCAGTCAGGTACATAATGGTGGATCCcttaatatatttctgtgaaatgttccaaaatctgatattg-3’(SEQ ID NO:34),其中序列“GATCC”中的最后一个“C”是Neo盒的最后一个核苷酸,序列“cttaa”中的“c”是小鼠的第一个核苷酸。此外,还在靶向载体V3的3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。改造后的人源化小鼠VSIG4的mRNA如SEQ ID NO:33所示,表达的蛋白序列如SEQ ID NO:2所示。
靶向载体构建可采用常规方法进行,如酶切连接等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况,筛选出正确的阳性克隆细胞。将筛选出的正确阳性克隆细胞(黑色鼠)按照本领域已知的技术导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因后,再通过互相交配即可得到VSIG4基因人源化纯合子小鼠。
还可引入CRISPR/Cas系统进行基因编辑,设计如图7所示的打靶策略,图中显示了靶向载体4(V4)上含有小鼠VSIG4基因上游和下游的同源臂序列,以及包含编码人VSIG4蛋白的核苷酸序列的A4片段。其中,上游同源臂序列(5’同源臂,SEQ ID NO:27)与NCBI登录号为NC_000086.8的第95334370至95335701位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:28)与NCBI登录号为NC_000086.8的第95332829至95334369位核苷酸序列相同。A4片段从5’端到3’端依次包括P2A编码序列(SEQ ID NO:29)、人VSIG4核苷酸序列、小鼠VSIG4核苷酸序列及STOP序列(SEQ ID NO:32),其中人VSIG4核苷酸序列(SEQ ID NO:30)与NCBI登录号为NM_007268.3的第83至1282位核苷酸序列相同,小鼠VSIG4核苷酸序列(SEQID NO:31)与NCBI登录号为NC_000086.8的第95290668至95291327位核苷酸序列相同。改造后的人源化小鼠VSIG4的mRNA序列如SEQ ID NO:33所示,其表达的蛋白的氨基酸序列如SEQID NO:2所示。
鉴于人VSIG4具有多种亚型或转录本,本文所述的方法可应用于其它亚型或转录本。
采用常规方法构建靶向载体,并将测序验证正确的靶向载体用于后续实验。
设计并合成识别靶位点的sgRNA序列,各sgRNA在VSIG4基因上的靶序列如下:
sgRNA1靶位点(SEQ ID NO:14):5’-AGGGTGGGGTGGCCTAAAACAGG-3’
sgRNA2靶位点(SEQ ID NO:15):5’-CAGGTCCCTGTCACACTCTCAGG-3’
sgRNA3靶位点(SEQ ID NO:16):5’-GCAAGTTTTGGTGAAATGGCTGG-3’
sgRNA4靶位点(SEQ ID NO:17):5’-CAGGAATCACTATACATGTGAGG-3’
sgRNA5靶位点(SEQ ID NO:18):5’-ATCTTCCTACGTGACTCCACTGG-3’
sgRNA6靶位点(SEQ ID NO:19):5’-TGCATCTATGATCCCCTGAGAGG-3’
利用UCA试剂盒检测各sgRNA的活性,检测结果见表1和图8。从中选择sgRNA6进行后续实验。在其5’端及互补链上分别加上酶切位点得到正向寡核苷酸和反向寡核苷酸序列(见表2),退火后将退火产物连接至pT7-sgRNA质粒(质粒先用BbsI线性化),获得表达载体pT7-VSIG4-18。
表1 sgRNA活性检测结果
Con. 1.00±0.07
PC 180.84±2.69
sgRNA1 43.20±0.33
sgRNA2 32.95±0.45
sgRNA3 31.16±1.52
sgRNA4 104.96±2.53
sgRNA5 63.59±1.53
sgRNA6 66.51±3.13
表2 sgRNA6序列列表
Figure BDA0003677353120000181
pT7-sgRNA载体由质粒合成公司合成含有T7启动子及sgRNA scaffold的片段DNA(SEQ ID NO:26)并依次通过酶切(EcoRI及BamHI)连接至骨架载体(来源Takara,货号3299)上,经专业测序公司测序验证,结果表明获得了目的质粒。
取小鼠的原核期受精卵,例如C57BL/6小鼠,利用显微注射仪将pT7-VSIG4-18质粒的体外转录产物(使用Ambion体外转录试剂盒,按照说明书方法进行转录)、靶向载体与Cas9 mRNA预混好后注射至小鼠受精卵细胞质或细胞核中。按照《小鼠胚胎操作实验手册(第三版)》(安德拉斯·纳吉,化学工业出版社,2006)中的方法进行受精卵的显微注射,注射后的受精卵转移至培养液中短暂培养,然后移植至受体母鼠的输卵管中发育,将获得的小鼠(F0代)通过杂交和自交,扩大种群数量,建立稳定的VSIG4基因人源化小鼠品系。
可通过常规检测方法(如PCR分析)鉴定F0代小鼠体细胞的基因型,部分F0代小鼠的鉴定结果见图9。结合PCR引物检测结果,并经测序进一步验证图9中编号为F0-01、F0-02、F0-03、F0-04、F0-05的5只小鼠均为阳性小鼠。PCR引物如表3所示。
表3 F0代基因型PCR检测引物序列及重组片段大小
Figure BDA0003677353120000182
其中,引物L-GT-F位置位于5’同源臂左侧,R-GT-R位于3’同源臂右侧,L-GT-R和R-GT-F均位于人VSIG4序列上。
将F0鉴定为阳性的VSIG4基因人源化小鼠与野生型小鼠交配得到F1代小鼠。可使用同样的PCR方法(引物序列如表4所示)对F1代小鼠进行基因型鉴定,示例性检测结果见图10,显示编号为F1-0010、F1-0012、F1-0013、F1-0018、F1-0019、F1-0022、F1-0023、F1-0082的8只小鼠为阳性小鼠。
表4 F1代基因型PCR检测引物序列及重组片段大小
Figure BDA0003677353120000183
对F1代PCR鉴定为阳性的小鼠进行Southern blot检测,确认是否存在随机插入。剪取鼠尾提取基因组DNA,选用BspHI酶或AseI酶消化基因组,转膜,杂交。5’探针和3’探针分别位于5’同源臂外侧及A3片段上,具体探针及目的片段的长度见表5。Southern blot的部分克隆检测结果见图11,综合3’探针和5’探针的结果表明,编号为F1-0010、F1-0012、F1-0013、F1-0019、F1-0022、F1-0023、F1-0082的7只小鼠均无随机插入,证实这7只小鼠为阳性杂合小鼠且不存在随机插入。这表明使用本方法能构建出可稳定传代且无随机插入的VSIG4基因人源化小鼠。
表5具体探针及目的片段的长度
限制性内切酶 探针 野生型片段大小 重组序列片段大小
AseI 5’Probe 5.5kb 6.7kb
BspHI 3’Probe —— 3.6kb
探针合成引物如下:
5’Probe-F(SEQ ID NO:46):5’-CTTCTCACGATCAACCCAGAACAG-3’,
5’Probe-R(SEQ ID NO:47):5’-GCATAAACATAGCCCATCATTGCTG-3’;
3’Probe-F(SEQ ID NO:48):5’-AACTGATGAATGGGAGCAGTGGTGG-3’,
3’Probe-R(SEQ ID NO:49):5’-GCAGACACTCTATGCCTGTGTGGAG-3’;
将F1代鉴定为阳性的杂合小鼠相互交配,获得F2代VSIG4基因人源化纯合子小鼠。
实施例3 VSIG4基因人源化小鼠体内人或人源化VSIG4蛋白表达检测
可通过常规检测方法确认阳性小鼠体内人或人源化VSIG4的表达情况,例如使用RT-PCR或流式细胞术等。具体来说,分别选取6周龄野生型C57BL/6雌性小鼠和实施例2制备的VSIG4基因人源化杂合子雌性小鼠各1只,脱颈安乐死后取肝脏组织,采用如表6所示的引物序列进行RT-PCR检测,检测结果如图12所示。从图中可以看出,在野生型C57BL/6小鼠体内仅检测到鼠VSIG4 mRNA(图12A),未检测到人源化VSIG4 mRNA(图12B);在VSIG4基因人源化杂合子小鼠体内既检测到鼠VSIG4 mRNA(图12A),也检测到了人源化VSIG4 mRNA(图12B)。
表6 RT-PCR引物序列及目的片段大小
Figure BDA0003677353120000191
使用流式细胞术检测阳性小鼠体内人源化VSIG4蛋白的表达情况。具体来说,分别选取11周龄野生型C57BL/6雄性小鼠和实施例2制备的VSIG4基因人源化纯合子雄性小鼠各1只,分别提取腹腔灌洗液中的巨噬细胞制备单细胞悬液后,使用抗鼠FcγR抗体Purifiedanti-mouse CD16/32Antibody、抗鼠CD45抗体Brilliant Violet 510TM anti-mouse CD45(mCD45)、中性粒细胞标记抗体PerCP anti-mouse Ly-6G/Ly-6C(Gr-1)Antibody(mGr-1)、单核细胞标记抗体V450 Rat Anti-mouse CD11b(mCD11b)、巨噬细胞标记抗体FITC anti-mouse F4/80(mF4/80)、抗鼠VSIG4抗体PE-VSIG4 Monoclonal Antibody(mVSIG4)或抗人VSIG4抗体APC-VSIG4 Monoclonal Antibody(hVSIG4)识别染色后进行流式检测,结果显示,在野生型C57BL/6小鼠腹腔灌洗液的巨噬细胞(特征为mCD45+mGr-1-mCD11b+mF4/80+)中,小鼠VSIG4蛋白(特征为mCD45+mGr-1-mCD11b+mF4/80+mVSIG4+)的比例为19.2%,人源化VSIG4蛋白(特征为mCD45+mGr-1-mCD11b+mF4/80+hVSIG4+)的比例为0.064%;在VSIG4基因人源化纯合子小鼠腹腔灌洗液的巨噬细胞中,人源化VSIG4蛋白的比例为15.7%,小鼠VSIG4蛋白的比例为0.047%。上述结果表明VSIG4基因人源化小鼠能成功表达人源化VSIG4蛋白。
进一步采用流式细胞术检测小鼠体内白细胞亚型和T细胞亚型的免疫分型情况。分别选取7周龄雌性野生型C57BL/6小鼠和实施例2制备的VSIG4基因人源化纯合子小鼠各3只,脱颈安乐死后取脾脏(spleen)、淋巴结(lymph node)和外周血(blood),分别用抗鼠CD45抗体Brilliant Violet 510TM anti-mouse CD45 Antibody(mCD45)、抗鼠Gr-1抗体PerCP anti-mouse Ly-6G/Ly-6C Antibody(mGr-1)、抗鼠CD4抗体Brilliant Violet 421TManti-mouse CD4 Antibody(mCD4)、抗鼠F4/80抗体FITC anti-mouse F4/80 Antibody(mF4/80)、抗鼠CD8抗体PE anti-mouse CD8a Antibody(mCD8)、抗鼠NK1.1抗体PE/CyTM7Mouse anti-mouse NK1.1 Antibody(mNK1.1)、抗鼠Foxp3抗体APC anti-mouse/ratFoxp3Antibody(mFoxp3)、抗鼠CD19抗体FITC anti-Mouse CD19 Antibody(mCD19)、抗鼠TCRβ抗体PerCP/Cy5.5 anti-mouse TCRβchain Antibody(mTCRβ)、抗鼠CD11c抗体Brilliant Violet 605TManti-mouse CD11c Antibody(mCD11c),以及抗鼠/人CD11b抗体PEanti-mouse/human CD11b Antibody(mCD11b)识别染色后进行流式检测。
T细胞的特征为mCD45+mTCRβ+,B细胞的特征为mCD45+mCD19+,NK细胞的特征为mCD45+mTCRβ-mNK1.1+,树突细胞的特征为mCD45+mTCRβ-mCD11c+,粒细胞的特征为mCD45+mGr-1+,单核细胞与巨噬细胞的特征为mCD45+mGr-1-mCD11b+mF4/80+,辅助性T细胞(CD4+Tcell)的特征为mCD45+mCD4+mFoxp3+,杀伤性T细胞(CD8+T cell)的特征为mCD45+mCD8+。
脾脏、淋巴结和外周血的检测结果分别如图13、14和15所示。从图中可以看出,VSIG4基因人源化纯合小鼠(H/H)体内白细胞亚型,包括T细胞、B细胞、NK细胞、树突细胞(Dendritic cells)、粒细胞(Granulocytes)、单核细胞(Monocytes)和巨噬细胞(Macrophages)的百分比与野生型C57BL/6小鼠(+/+)基本一致;T细胞亚型,包括CD4+T细胞、CD8+T细胞、调节性T细胞(Treg)百分比与野生型C57BL/6小鼠也基本一致。表明对野生型小鼠进行VSIG4基因人源化改造没有影响小鼠体内白细胞亚型及T细胞亚型在脾脏、淋巴结和外周血中的总体发育、分化或分布。
实施例4 VSIG4基因人源化小鼠药效验证实验一
选取实施例2制得的7周龄雌性VSIG4基因人源化纯合小鼠10只,皮下接种小鼠结肠癌细胞MC38(5×105个),待肿瘤体积达到100±50mm3进行分组,随机分为对照组G1和治疗组G2(n=5)。对照组注射hIgG1(10mg/kg),治疗组注射抗人VSIG4抗体(Ab1,使用常规方法制备获得),腹腔注射给药,分组当天开始给药,每周给药2次(BIW),共给药6次。每周测量肿瘤体积2次,接种后单只小鼠肿瘤体积达到3000mm3时执行安乐死。
小鼠体内肿瘤变化情况和小鼠体重变化情况如图16所示,结果显示,在实验终点时,对照组和实验组小鼠健康状态良好,体重整体呈现增长趋势(图16A);从肿瘤体积测量结果上看(图16B),对照组和治疗组小鼠肿瘤在实验周期内均持续生长,但与对照组相比,治疗组小鼠肿瘤体积增长变缓,表明抗人VSIG4抗体可在一定程度上抑制肿瘤生长。
进一步地,基于上述药效验证结果,于实验终点时分别取对照组G1和治疗组G2小鼠肿瘤细胞,分离肿瘤浸润淋巴结细胞(TILs)进行流式分析细胞术检测,分析免疫细胞类型。流式细胞术使用抗体包括抗鼠CD45抗体APC/Cy7 anti-mouse CD45antibody(mCD45)、抗鼠CD3抗体PerCP/Cyanine5.5 anti-mouse CD3εantibody(mCD3)、抗鼠CD4抗体FITCanti-mouse CD4 antibody(mCD4)、抗鼠CD8抗体Brilliant Violet 711TM anti-mouseCD8a antibody(mCD8)、抗鼠F4/80抗体FITC anti-mouse F4/80 antibody(mF4/80)、抗鼠/人CD11b抗体PerCP anti-mouse/human CD11b antibody(mCD11b)、抗鼠FoxP3抗体Anti-Mo/Rt FoxP3PE/CyTM 7 antibody(mFoxP3)、抗鼠I-A/I-E抗体Pacific BlueTM anti-mouseI-A/I-E antibody(mI-A/I-E)、抗鼠CD206抗体PE/Cyanine7 anti-mouseCD206(MMR)antibody(mCD206)、抗鼠Gr-1抗体Brilliant Violet 711TM anti-mouse Ly-6G/Ly-6C(Gr-1)Antibody(mGr-1)染色后检测。检测结果如表7所示。
其中,T细胞的特征为mCD45+mCD3+,辅助性T细胞(Th cell)的特征为mCD45+mCD3+mCD4+,调节T细胞(Tregs cell)的特征是为mCD45+mCD3+mCD4+mCD8-mFoxP3+,细胞毒性T淋巴细胞(CTL)的特征是mCD45+mCD3+mCD8+,M1型巨噬细胞(M1)的特征是mCD45+mCD11b+mF4/80+mI-A/I-E+mCD206-,M2型巨噬细胞(M2)的特征是mCD45+mCD11b+mF4/80+mI-A/I-E-mCD206+,髓源抑制性细胞(MDSC)的特征为mCD45+mCD11b+mF4/80-mGr-1+。
表7:对照组和治疗组小鼠TILs检测结果
组别 CTL Th Tregs MDSC M1 M2 M1/M2
G1 11.92% 6.38% 3.33% 9.13% 40.46% 40.44% 1.45
G2 13.43% 7.96% 3.96% 7.66% 53.18% 29.82% 2.33
从表7可以看出,与对照组相比,治疗组小鼠体内CTL细胞、Th细胞、Tregs细胞、M1巨噬细胞和M1/M2比值增加,而MDSC和M2巨噬细胞的百分比降低,抑制肿瘤细胞生长,说明抗人VSIG4抗体具有一定程度的肿瘤抑制性。
上述结果表明,VSIG4基因人源化小鼠可以作为抗人VSIG4抗体体内药效验证与筛选的动物模型。
实施例5双重人源化或多重双人源化小鼠的制备
利用本方法或制得的VSIG4基因人源化小鼠还可以制备双人源化或多人源化小鼠模型。如,前述实施例1中,囊胚显微注射使用的胚胎干细胞可选择来源于含有PD-1、PD-L1、IL4、IL4R、IL6、IL6R、IL17、IL7R、CCR5、CCR8等其它基因修饰的小鼠,或者,也可在人源化VSIG4小鼠的基础上,利用分离小鼠ES胚胎干细胞和基因重组打靶技术,获得VSIG4与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将实施例1或实施例2得到的VSIG4小鼠纯合子或杂合子与其它基因修饰的纯合或杂合小鼠交配,对其后代进行筛选,根据孟德尔遗传规律,可有一定机率得到人源化VSIG4与其它基因修饰的双基因或多基因修饰的杂合小鼠,再将杂合子相互交配可以得到双基因或多基因修饰的纯合子,利用这些双基因或多基因修饰的小鼠可以进行靶向人VSIG4和其它基因调节剂的体内药效验证等。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
序列表
<110> 百奥赛图(北京)医药科技股份有限公司
<120> VSIG4基因人源化非人动物的构建方法及应用
<130> 1
<150> CN202110615989.7
<151> 2021-06-02
<150> CN202111470150.5
<151> 2021-12-03
<160> 59
<170> SIPOSequenceListing 1.0
<210> 1
<211> 280
<212> PRT
<213> 小鼠(Mouse)
<400> 1
Met Glu Ile Ser Ser Gly Leu Leu Phe Leu Gly His Leu Ile Val Leu
1 5 10 15
Thr Tyr Gly His Pro Thr Leu Lys Thr Pro Glu Ser Val Thr Gly Thr
20 25 30
Trp Lys Gly Asp Val Lys Ile Gln Cys Ile Tyr Asp Pro Leu Arg Gly
35 40 45
Tyr Arg Gln Val Leu Val Lys Trp Leu Val Arg His Gly Ser Asp Ser
50 55 60
Val Thr Ile Phe Leu Arg Asp Ser Thr Gly Asp His Ile Gln Gln Ala
65 70 75 80
Lys Tyr Arg Gly Arg Leu Lys Val Ser His Lys Val Pro Gly Asp Val
85 90 95
Ser Leu Gln Ile Asn Thr Leu Gln Met Asp Asp Arg Asn His Tyr Thr
100 105 110
Cys Glu Val Thr Trp Gln Thr Pro Asp Gly Asn Gln Val Ile Arg Asp
115 120 125
Lys Ile Ile Glu Leu Arg Val Arg Lys Tyr Asn Pro Pro Arg Ile Asn
130 135 140
Thr Glu Ala Pro Thr Thr Leu His Ser Ser Leu Glu Ala Thr Thr Ile
145 150 155 160
Met Ser Ser Thr Ser Asp Leu Thr Thr Asn Gly Thr Gly Lys Leu Glu
165 170 175
Glu Thr Ile Ala Gly Ser Gly Arg Asn Leu Pro Ile Phe Ala Ile Ile
180 185 190
Phe Ile Ile Ser Leu Cys Cys Ile Val Ala Val Thr Ile Pro Tyr Ile
195 200 205
Leu Phe Arg Cys Arg Thr Phe Gln Gln Glu Tyr Val Tyr Gly Val Ser
210 215 220
Arg Val Phe Ala Arg Lys Thr Ser Asn Ser Glu Glu Thr Thr Arg Val
225 230 235 240
Thr Thr Ile Ala Thr Asp Glu Pro Asp Ser Gln Ala Leu Ile Ser Asp
245 250 255
Tyr Ser Asp Asp Pro Cys Leu Ser Gln Glu Tyr Gln Ile Thr Ile Arg
260 265 270
Ser Thr Met Ser Ile Pro Ala Cys
275 280
<210> 2
<211> 399
<212> PRT
<213> 人(human)
<400> 2
Met Gly Ile Leu Leu Gly Leu Leu Leu Leu Gly His Leu Thr Val Asp
1 5 10 15
Thr Tyr Gly Arg Pro Ile Leu Glu Val Pro Glu Ser Val Thr Gly Pro
20 25 30
Trp Lys Gly Asp Val Asn Leu Pro Cys Thr Tyr Asp Pro Leu Gln Gly
35 40 45
Tyr Thr Gln Val Leu Val Lys Trp Leu Val Gln Arg Gly Ser Asp Pro
50 55 60
Val Thr Ile Phe Leu Arg Asp Ser Ser Gly Asp His Ile Gln Gln Ala
65 70 75 80
Lys Tyr Gln Gly Arg Leu His Val Ser His Lys Val Pro Gly Asp Val
85 90 95
Ser Leu Gln Leu Ser Thr Leu Glu Met Asp Asp Arg Ser His Tyr Thr
100 105 110
Cys Glu Val Thr Trp Gln Thr Pro Asp Gly Asn Gln Val Val Arg Asp
115 120 125
Lys Ile Thr Glu Leu Arg Val Gln Lys Leu Ser Val Ser Lys Pro Thr
130 135 140
Val Thr Thr Gly Ser Gly Tyr Gly Phe Thr Val Pro Gln Gly Met Arg
145 150 155 160
Ile Ser Leu Gln Cys Gln Ala Arg Gly Ser Pro Pro Ile Ser Tyr Ile
165 170 175
Trp Tyr Lys Gln Gln Thr Asn Asn Gln Glu Pro Ile Lys Val Ala Thr
180 185 190
Leu Ser Thr Leu Leu Phe Lys Pro Ala Val Ile Ala Asp Ser Gly Ser
195 200 205
Tyr Phe Cys Thr Ala Lys Gly Gln Val Gly Ser Glu Gln His Ser Asp
210 215 220
Ile Val Lys Phe Val Val Lys Asp Ser Ser Lys Leu Leu Lys Thr Lys
225 230 235 240
Thr Glu Ala Pro Thr Thr Met Thr Tyr Pro Leu Lys Ala Thr Ser Thr
245 250 255
Val Lys Gln Ser Trp Asp Trp Thr Thr Asp Met Asp Gly Tyr Leu Gly
260 265 270
Glu Thr Ser Ala Gly Pro Gly Lys Ser Leu Pro Val Phe Ala Ile Ile
275 280 285
Leu Ile Ile Ser Leu Cys Cys Met Val Val Phe Thr Met Ala Tyr Ile
290 295 300
Met Leu Cys Arg Lys Thr Ser Gln Gln Glu His Val Tyr Glu Ala Ala
305 310 315 320
Arg Ala His Ala Arg Glu Ala Asn Asp Ser Gly Glu Thr Met Arg Val
325 330 335
Ala Ile Phe Ala Ser Gly Cys Ser Ser Asp Glu Pro Thr Ser Gln Asn
340 345 350
Leu Gly Asn Asn Tyr Ser Asp Glu Pro Cys Ile Gly Gln Glu Tyr Gln
355 360 365
Ile Ile Ala Gln Ile Asn Gly Asn Tyr Ala Arg Leu Leu Asp Thr Val
370 375 380
Pro Leu Asp Tyr Glu Phe Leu Ala Thr Glu Gly Lys Ser Val Cys
385 390 395
<210> 3
<211> 4306
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gccacagtga tccctgctta tgaggcttga aatttttgca tcattttctc tgctgatcat 60
ccataatatg taagttcttt caacacatgc accattatcc ctggaagcac tagaattgaa 120
catgaaaagg taaattctct ggattaaagt aactacattc cttccttctc ccactctaat 180
actgtttcct ttctgagcca gctcaagtac tagcctgcta tactgaagaa aaagggcaca 240
acccttgaga tcaagccata cctgagtgca aatttcccct ttgctcatta ttttttgact 300
gtgtataggt gctatagtga gtctttatat aaatttcctc taacaacaaa gattatacaa 360
gaactagtgt atatctcagc atatcaatgc atactgagca agtacaaggc cctagttgaa 420
atgacctgca ccacaaataa aaagactcac aatgtctttc ttaaaataca aagcaagcat 480
aacagtgagg tacttagcag gatcattttg gagatatgca gatattgagt ataaatatta 540
tctaggtatt tctgtactaa tgatttcaca aattctagtc ttttggttca tttttagaat 600
agaaatgtat ttaattcagt caactcaaca aagtatttat taattattat attatatgtc 660
tggttgtctt tagtgaacat gactatataa aagtaatgcc ttgtttatac ctacattaca 720
gaatgtacag tgaaaaatta aagagatagt aaatgtcagg tacaagcact atagagacaa 780
aagaagaaat gtaagagaat agagatgaaa catataaaga tacaagagta agttcactaa 840
tactcatttt agtacagtgt ctgaatgaat aaaagatgga aaatgccagt tgttattgct 900
gtagccgata ttgtatagat aatgtggctt gatcattttt aatttacaac acacaattac 960
caagtctcat catgttcatg ttacaactga gaaagctaat attcagaagg gttttatttt 1020
tctaaggcct agaattaaaa ctttcaatct aataaagcat tcccttatta agtctaacaa 1080
actacaaata aggcttatct ttctctttaa aaaaataaaa tatagatgtc tttacaaagg 1140
catcatgagg aatactaatt aaagctagtc gtttcttgac atcagagatg gggctactgg 1200
caaaagtcag tcaacaaact ttcccactgt gagatatgcg acaccctcca aagcaactat 1260
atccctagtc ttaacaacta ataaaacaat ttctgtgtag aaagtcatcc agtgcactaa 1320
actcatacta tgaagcactc gagtgcctct aattcacaca gtgtccattt gtattgagga 1380
ctatggagct aatggtacaa attatgaaaa ctgcatatgc cagaacaaat ggtttcccta 1440
gactgaccag aaagtaaaac atccctctat ggtaaacttt gagcagactc aaaattctgg 1500
gacattaaag accagagagc accactggtc ccagagaaag tcaaatccta gtagaatgag 1560
gaacagtttc acccatcctt aaatctctaa ccttacgcag cgtaaaaaga aagaaccctg 1620
tgtgactctt ctgaaatacg gaaggtgggg gaagtgtgtg aggaaactag gattctgagg 1680
gaataaaata gaaaagcaac acagaaactg gcagctacca gcacttccag gttcttcagc 1740
agcaagagga tggaaggatg aatagaagta gcttcaaata ggatggagat ctcatcaggc 1800
ttgctgttcc tgggccacct aatagtgctc acctatggta aggcaggata ttgatacttg 1860
actacctctt caccctctgg cagaaaatgt gagtgttgac tttgagtgtt taccgagaaa 1920
aacttgtttc tcctgggcag tcacagttgc ctgcaattct acaggctttc tgaatgttga 1980
gcagaaggga agaaagtctg gtaaagcttc cagaaactgc cttggataga aattgaaaga 2040
gttcttctct tagaaaatat ctgcatcact ttccaatatt tcagggatgt cagaggactc 2100
caatgtcatg caaactttcc atattctcct tttcccttga aattttataa ttatgactaa 2160
ctttccattt ccaagctttg attcttgctg cagtatatac ctccacaatg aataaatgtt 2220
gttgagtaaa tagatgtgac cttagaagta acctatagcc aaggatgttg aggtacacct 2280
ttaatcctag ctgttgggag gtagaggcac tctgatctct gtgatctcaa ggacactttc 2340
gactacatag aaagttccag gatatctaag gttacatggt gagactcagt ttgtaaataa 2400
atagataaaa gtaacacatg ccactactta gaattgttta caagtgctca gcacttgcta 2460
ttcatacact tttagaacac agacatttac tgatatccat gctactctaa gacttctcac 2520
gatcaaccca gaacagatac tattcctttt ttttcatgtc agcacttcaa acatctaaag 2580
aacggaaaga actgtatcct cttaattttc ttctctaaac taaatatctc tagcttcttt 2640
aactaaagga tgtggtatac tactagctgc tgggataact cacttccctg tgggcatagt 2700
agcccagttg tagggcctgt ttgcagggat ctaattctag attcatagtc cagcagagtc 2760
tgggatatct catagtagca ttatttctgt gactcttctt ccactctcac tattcaagaa 2820
aatgaaatgc cttttcagga aactaagtac aagtaataac tacttaagac ttggtatagg 2880
gtaaaaggat ttttttgctg aatttctgct tgcttcatct tcctataggg tgtcattggc 2940
ttaaacataa tttgaagtac tcagcaatga tgggctatgt ttatgctttt taattttatt 3000
ttattgaagt tgacccctct aatggttaaa atatgccgtg tattttccaa gagttcctgg 3060
tgaggcaaag accatagatg ccacttcagt gttcagatac attagtatat gctttggtac 3120
ttagcagtgt atcctgaaag tcagataaca taacctcgct ccatgcacaa ggcatcgtag 3180
tctacctgct taactgaaaa tatgctaaat aaaaaagatt cagtcagtga taccttgcat 3240
tttgaaacta tatctaccaa gaaagacatt gccaaaaaac agcccctgga cccagttgaa 3300
taaaagtcat caagatatga gcatacatat gaaaacctct aatacaatgg gcacccatct 3360
ctttttgcct ctggactccc tccaactccc cagcccatca agaagcaatt ttctttgttt 3420
tcaccacaca atagctagca caaccagtgc tagagagtta ctcaggttct tttcttttcc 3480
agaccaagta tggatgaaat cttttccccc tcaggatatc attttctaat atctttttgg 3540
taagaactaa aggaaatgaa aaaaaaaaaa aaaacaaaga gaaaagagaa ataaggacag 3600
aaattggcta gacttgcttg caaagtacat gtttcaaatc taatagctaa tggtttggtt 3660
aaataggaat atactccaga atttttgctt caccctatgt ttcatcttta gagtcttcta 3720
tagctcatct ctttcaccct gccagaaaag aatttgattt tatgtcccaa tcactgagcc 3780
tttctcttga atgagtctgt ttcaagcagc aaactgtaca aaatgaagta ctttggtttc 3840
cactattcac cattttcctt cctacatatc atttgaaaat agtgaaagaa aatattatat 3900
atatgtacat atatttacat attctataat attttacata tatgcactta tatgtgtgtg 3960
catacatata catgtaaaat attatagaat tctaaaaatt attctatcct aactctcaca 4020
taatatttgg aggaaaatgg atccttcaca gtggtagtga cttaccgagg gtcacttact 4080
ggcaagacag tgtcgtgaaa ggagcttaaa agcactagag ctaataagtg ttaaagtctt 4140
tgtcgtaggg actgactcac attgatggga aagttaacag accagaagag cacagggatg 4200
aaggaagggt gtttcccaga aacctattga gtctgtcact cataccctca ctccagtgaa 4260
cattttgtct gtgtttgcct ttttgacttt gttccctgtt ttaggc 4306
<210> 4
<211> 4339
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tgaaagttcc ctataccctc cctccgccct gctcccctac ccacccacgc ccacttcttg 60
gccctggcat tcccctgtac tggggcatat aaagcttgca agaccaaggg gcctctcatc 120
caactaggcc atcctctgct acacatgtag ctattgttgt tgtgtatatt gttgttccac 180
ctatagggtt gcagacccct tcagctcctt gggtgctttc tctagcttct ccattgggga 240
ccctatgttc catctttttt tttccatttt tattaggtat ttagctcatt tacatttcca 300
atgctatacc aaaagtcccc catacccacc cacccccact cccctaccca cccactcccc 360
ctttttggcc ctggcgttcc cctgtactgg ggcatataaa gtttgcgtgt ccaatgggcc 420
tcactttccc tatgttccat cttatagatg actgtgagca tccacttcat tttacagaaa 480
atttaaccca gggttaacca acaattttcc cactgaacta aaatattgta ctatttttac 540
ttcttatctt tttttttgtg gtactttttt tctttttttt tctttttttt tattacgtat 600
tttcttcaat tacatttcca atgctatccc aaaagcccca caccacactc ccctacccac 660
ccattcccat tttttggccc tggcattccc ctgtactggg gcatataacg tttgcctgac 720
caatgggcct ctctttccag tgatggccga ctaggtcacc ttttgataca tatgcagcta 780
gagtcaagag ctctggggta ctggttagtt cataatgttg ttcctccaga tctctttagc 840
tccttggata ctttctctag ctcctccatt ggggaccctg tgatccatcc aatagttgac 900
tgtgagcatc ctcttctgtg tttgctaggc cccggcctag tctcacaagg gacagctata 960
tcaccgtcct tgcaacaaag gcttgctagt gtatgcaatg gtgtcatcgc ttggaggcta 1020
attatgggat ggatccctcg atatggcagt ctctagatgg accatccttt tgtctcagct 1080
ccaaactttg tctctgtaac tccttccatg ggtgattgtt tccaattcta agaaggagca 1140
aagtgtccac actttggtct ttgttcttct tcagtttcat atgttttaca tattgtacct 1200
tatatctcgc tatactattt acttcttatc ttgatgatat catactaacc tagccaggct 1260
tgcctttatt tcactctcta aattaggtag gctttgaact tgccacctgc cttagtctcc 1320
caagtaattg gaatgatagg cctgtaactc taatccaagc tttggttttt gttgtctgtt 1380
tgtttcttgg tttgtctttc accttccaac tcatgccacc tcccttctca taatatggat 1440
agccctatct aaagcaaatc aatttttgct taaatagtat tctacataac atccactacc 1500
cagtccatct ttctatcttc tctactttgt gactcttctc ggggcaacag gaagattgtc 1560
aagaagcctc acatctttat caacgtacta tgaatgtaca aataaagtag tttctgtctt 1620
ttcaaagtct gtgtataata tcactaaaat atctggacta gttgcattgg tcatcttttc 1680
tcctcaattc tttttataat gtgaagagac ttttttaaaa ttttattaat ataggttggt 1740
ttatttgaga aagtggtaag atgggtttca atgtttttta aagctttatg catataaatg 1800
ggaagagtaa gagattattt cttaattgat ggaacggggt ggggggaatg aagaaaagtg 1860
tagggaacag gagggtaggg gaaaggaaag aaggaactct atgtactttg gaatgaaact 1920
cccttgtaaa gaaattgttt ggggccacgt ttgcattgct tcctttcccc ccatttattt 1980
catgtcgaat caacttccta aattttcatg ggaactacca tgttgcctat gtagtctgca 2040
tatgcacagg atcagatcag gtttcaacaa gaggtactcc cactttgaaa tgactgcaaa 2100
agtcaaaata gtacacaaaa gtgattgaca gtctgcccta ttttaccccc actgatgctg 2160
ccaagtctat gaccaaaatc tcagcatttt cttctttgac aaatgctagc tatgcataat 2220
tagtgtcaga gatgacttct tcttctccat ctcacttacc agcctccaca acctgggtac 2280
cacccagtag aaacctcagc ttccttcatg aaacatctgt gagtccagcc ctgaaagcct 2340
tgaaaacacc ctttatctca ttctgctctt tagaattaat ccctgggctt gaagagagaa 2400
tgtttattga aattgcccta gtaaagtgag ccacaaattc agggaacccc caacactgga 2460
accaccagga atgtctccta ttcttgcatg tgaaaatgtt tacagattac ttatctgaac 2520
attcacatac cacaaattgg gaagtgaagc ccagagagaa atgaaggttt gtcaaaagta 2580
acatacatca agtcaatggc agaacaaaga ctggaggtta gacctgtgga tttttagcag 2640
tgtgtgtact ttgctgcaga catcttctga agatggtctt tgtccctaaa caatggtatt 2700
tttccatgca gggtaagcca gtaagtcatc cctagataga gatgcatccc tccgacaatt 2760
ctgagcaaaa ttggggtaac aatatgggtc ttgttattta ggtcactggt tagtgggtga 2820
aaagttaaag aatgaaagta ggtatctcca gaaccaaggg agagtatgga atttctccag 2880
aaccaaggga gagtatggaa tttctctaaa gaagcttgcc aaaatatatg ttatgaaatg 2940
ttagactctg gagagaggga ttggagatgc ttcattttat agttctatat tagaagttca 3000
ccccagtgca atgatagaat attaaaggct cagaaaattc tgtttaaaaa gacacgtgta 3060
aaccaataat tcaaaaaatt tttccctctg agtctattct ttcttcttgc cctcctgccc 3120
cagacctaaa tcttatttct cagaggaaaa aaaaatccat tttggttacc atcttgtata 3180
cactatagca ttagaatacc cacagtttga tttatttttt tcgcaaaacc ctggttggta 3240
tttgacctat atagcaaaag gttattgact agtaaaacat caattaattg gtaaatattt 3300
attaataatt aaaatgttgg acaatggtat gagagacagc aatcaactga atataataag 3360
ctctagattc ttacaatata atagggaatt caagaacata ccctggaaaa attcactgac 3420
aactttagaa gatgtgttgg atggtaggac atataatagc acataccagt atgtggttag 3480
ccaaggagta aagaaaagta taggttaact ttcaatagtg ccaagaggaa ttggaatttg 3540
gtagtgtctg aaagcccaat gaagataaac aagaaggttc ttttaagaat gataaaagca 3600
aagtggaaaa gagaaaatgt aggtagctta agatgtgctc cgaaggccag acagtggata 3660
tttatttcct actttctcat agaattcatg atgcttgtat gaaaattctg ctattctggc 3720
tgcaagaaga ggaaagtgaa agaagacatt aataataaat caaataatac tctcattccc 3780
tgtatccctc atgtaccact atgcagtcca tggcattttc acaatgtaca cagatgcata 3840
ccagacttgt agaccccaga gctgcatcgt tcctactctg atgttctctg aataaatgtt 3900
atagttccct taaagacata gaataacacc agagagcttc atgtttcata agcattcata 3960
tgtaggcagc aggctatgtg ctctgtcctg gacctggagc tgataggcat gagccacact 4020
tggggtattt gacaaactga cactctacca cacagagtgt ccaactcagc ttgtcaaata 4080
cacggagcgt gacactgcag atggccagat caggaacctc cactgggcag caagaacatg 4140
ctggaagatg tgcaactgga aagagaaaaa aatagggtga ttatatctta ccctaagtgt 4200
gagacaaatg gcagacacta acatgactga ctaagacaca ccaaaagagg gaagtgaaca 4260
aaacacgcta atgctccaaa caaaaacggg gatcctgggt gtttgtctgg agattctggt 4320
ggcccaagcc tcaattaac 4339
<210> 5
<211> 8707
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
cgtcccatcc tggaagtgcc agagagtgta acaggacctt ggaaagggga tgtgaatctt 60
ccctgcacct atgaccccct gcaaggctac acccaagtct tggtgaagtg gctggtacaa 120
cgtggctcag accctgtcac catctttcta cgtgactctt ctggagacca tatccagcag 180
gcaaagtacc agggccgcct gcatgtgagc cacaaggttc caggagatgt atccctccaa 240
ttgagcaccc tggagatgga tgaccggagc cactacacgt gtgaagtcac ctggcagact 300
cctgatggca accaagtcgt gagagataag attactgagc tccgtgtcca gaaacgtgag 360
tcactatggg ggtaggaaag cactgataat caatgaatca atagtggatg taattctaga 420
aaagcctgaa aaatccagag gccttcgttt atacagaggc tctccacagg tatatgtgct 480
tatcagagga agtggacagg cagaggattc ttagggtcag cattcccata gttaaattta 540
ggaagtgctg ggaagggttc ctgacctgca aatctctatc ccttcgagtg tcccagaaat 600
gccagtatcc atggactagt taccctcctt gggctctggg ctttacaact caaaaatgag 660
tacatttaat ttgtagatag atgctgatag agaagctctg gggaaaggga ggcagaggtt 720
agccaggata agtttgcttg ctggacaatt ttacaaaagt ctggccctga taatccacaa 780
ctgcaggtaa tcaaaagctc tacttgagcc ccagaacaaa ctacattaat tttaaaggtc 840
agttgatttt tacttccaag tattccaaaa ccccgggtaa taccaaaaag tacctacctt 900
caaaggaagc cattttattt gtattgccct ttccttctta tttcctccaa agtcagaagc 960
cccctttagt tccagttgca gatatatgca tgcccttacg cccaacaaga atgattcagc 1020
cttttggtcc catatcctta tgactgccca gagtttcctg tcttgtcttt tctttgcagt 1080
ctctgtctcc aagcccacag tgacaactgg cagcggttat ggcttcacgg tgccccaggg 1140
aatgaggatt agccttcaat gccaggctcg gggttctcct cccatcagtt atatttggta 1200
taagcaacag actaataacc aggaacccat caaagtagca accctaagta ccttactctt 1260
caagcctgcg gtgatagccg actcaggctc ctatttctgc actgccaagg gccaggttgg 1320
ctctgagcag cacagcgaca ttgtgaagtt tgtggtcaaa ggtgagcggc cctctttcct 1380
ggtgagcatc ttaacacaca agcttgaaac aaagatacct caaaaggtgc ccttatgcaa 1440
aagaagaatt gggagaggag gatcccaagc aggcaatggt tgtacaatca caaagaaaaa 1500
aaacttggac tggggacaac agggatagag acattgccta tcatgccata ggttaagtag 1560
ataaagacgg taaaggaaag agagatttac tagcacattg tatttgccag atacaaagta 1620
caataacttg acacacattt tctcattgaa tccccacaac tgtcccatga gatagttatc 1680
attactctta ctttacagaa gaggaaacag agtcagaaag gggaatctac ttgcccatgg 1740
tctcacagca aggaagtata aatctggatt tgtactcaga tttcatgctc ttcctactat 1800
gtctgattgt ttctcatggt tgaatctata tcagatcctg ggcacccttt gaaagctgtt 1860
gttttttgtt tgtgtgttct gtttgtttgg ttattgtttt gcttgtttga ttaggcttga 1920
tctaatatat ctacatgctt tcttttaact tccctccccc acttcattgt aaacccaaat 1980
acaagttctg gttgaagtat cctttaagat gggctcttgt taatcaagat ctgactattt 2040
cttacagcac tgtcctggga gcactacaaa ctatgcatat aaagactgta agctgaggct 2100
taaatgaaga gtccagcagt gatatgtcca gatgagtttt cttagctttc aagagatctc 2160
cttggaaaga aagacacccc aacaaggtta ccattgccca aaacatgttg gaaactaact 2220
gattttaggg aattgccctc agaaccatct gaaaattatt gtcttctgag gatagttctg 2280
tgtaaggaga gggcgtaaac ctagcccaaa tggcttatta ccatttgggc taggagactg 2340
atgttggttt gagactcttg tgtttgcctg gaggaatttg tttcccaaag ttaagctgta 2400
gtgaggatgt gtgtgctgta gatcatggtt tgttagtttt gggaggaaca agagtggtcc 2460
gccctgaaag ttatatgaac agtgtcccag ttctctaaga gctgacagtc tggtcaagca 2520
gagagggcag ggcgtgacca gaaagcccaa gaatgtatac ttcataaaga gactaattga 2580
acattcttgc ctttctgtga gttacttctc agaccaccta ggcaagaact tgctcacagt 2640
aaaccctcct gtttattcct tctcacagtc aatgcttatt acagtgctgt taagcagtgc 2700
tcgccattgc cccctactga cagataggaa aactgaggct cagggaagtt attctcagcc 2760
ttccactctt ccctgctctg tgagccaacg taatctttcc tggctacctc tacctgcctc 2820
cctgtccacc caaccttgtc ccctgagtct gaccccctat ttcacctctg ccctacggaa 2880
ctctcagccc tttcaccctt ccacctcact ctgcactgtt ctttagttct agaatgactc 2940
tggaggccct gcttttgctc atgttcttgg actgctgagc tttgctgacg aacaaaacaa 3000
aacacagata tgaattgact ccacttgaat tttatgctct gcgatatgta ctgcctgacc 3060
ccatgccgtg tgtctatttg cttatctttg tctcattcct catagcagct tttcagcaca 3120
tttctacctt atttcaggcc cccagccttg ctcctaaaag ataaggtaac ttccttcctc 3180
tgtaagaagg tccagaccct cttcatatgt gaattttatc aactaccctc ctctctgcct 3240
tgatatttcc ctatccattt cctcttggct cagagtaagg tatgctttgc tcctctccac 3300
aacaagcccc tcctcctgaa ctcttaacat cagctactcc aatgccctgc aatacccttt 3360
atcctctacc taagccaaat agatatgcat gtataatata tgtatatatg tcagtatgca 3420
agcctaatac atacatatat atatgttatt tttcaaaaat ctttctctcc atctgccacc 3480
tcatctctcc tatgttcact accaaccttc tcacgaaggt agcttccacc agctgaacct 3540
ctcaattcat tcaccacaac ataactttgt aatttggggt catcattaac ctccatatca 3600
ccaaatccca agacctctcc attcatactt ttcctcctca acatctgtgt agcagtggat 3660
cctgttggcc atttcttcca cctcaatatt cttttaatca ctgctattga tgacaccaac 3720
ttatcttggt tcttctaaga ccttcctgaa tgatccttct gagacacctt tgttggctct 3780
tttttcattc actccttaat tgtaaatgtt ctcaaagact caattcttat tcatctctgc 3840
atgtatttct atattatcag gagattttat ttacttctgt ggcttcaaat atcacctgta 3900
gtctgatgac tctccaacca taatattatc tgtatttatt ttttcctgac tgctagatcc 3960
cagtgtctag ttaccttctg gacagcttca tttctaattt cagcgtgttc aaaactgatc 4020
gtacctttta ctcaccaaac ctgttcctca aacctgttag aaaacatagc agtacctttg 4080
actcctcctt ctcttttacc tcgcatcgtc aaataatcat caatattacc aagtgctgtg 4140
aattcaccta ctgaatcaga taccttatta ggctctttct ttctcttcct ataccctcat 4200
ggtctcatat tcttttttaa aaaacaattt caatcatctt ctaaatgttc tccccatgtt 4260
catacattct tacgaagtca tcaacttatt caatatttat tgagtatata ttttatgtca 4320
ctagattata aaattcaaga gtgcagaatt ctacctgtct acttcattgc tgtttttcag 4380
agcccagcaa agtatctggc acaaagaaga cactagacac tagatgaata ctgtatttgt 4440
taatgaatgg ggaaaatatg ctattgcctt acctttgaaa atcctaccac actgttgtca 4500
gaattatttc caaaaaaaat agactgaaca atttttgctt cctttctcaa aaggaagtaa 4560
acctttctca aaaggtgtaa ccttctgtta caccccatgg atctttccaa ctaaagaaca 4620
aagcccaaac ccttttagtc tgttttcagc ctacctatcc agacttatct actaatatgt 4680
ttcgccacat ctaaaacgga gcatgctgtt tcctctgcta gcaagaggga gaagcttatg 4740
gttttctcat gtcttttctg agcaggtaca tggccctgtg cttgtgtgtg gcctcctagt 4800
ttcccagaac tgtgtcagaa ctcttcaaaa tccctatgga aatcttattc ctcaaccatt 4860
tttaaggcta ttttggttag ttttttttgt tttctcgcct attatccatt gcctcaggca 4920
gctgtgtgac aaatgctacc ccatccctgg ggagaggctc ttagcactgg gtgaccaata 4980
aaacaagtct tttgagtcag gtctttcagg gaaccaccag acaggccaaa taatggcaat 5040
tattcaaaaa tgaagtttgt tgggctcact ccagcacctg gaatggggtt gtatgttcaa 5100
gattacctct gaggtagaag gggtaagggg actaggagaa gttaaaacag cacaaagctt 5160
gctgttctta ccaaaactgg gatatttttc ttccataaat cctgtctaag gtgctgcaaa 5220
cctttggcta ttttgcaaaa ttctaaaaaa aaaaaaaaaa aaaaaaaaaa gttgattacg 5280
tcaaattttg cattatttca ctgatgttgt taaagggtaa atttctggag gttattatgt 5340
caccattttc actgatgtca cccattgcca ctttctttat gatacttccc aagtttctct 5400
caagagaatt aattactagg tctcagttag aagttagtaa aaataaaata tattttccca 5460
tccaagttga ctgactctct gaactctagc tacaggttcc ttcgagatct attaatcctg 5520
ggttaaaaac tctgtccttg attgatgtat gaaagatgaa caagcaacac aggacttacc 5580
agcatcatga cagaagtgtt gaggcaggtc caagtatgga cctgaatggc ctttacttac 5640
ttcctatttc cctagggcat taaactattc accaaagggt accaggtccc ttcaatcggt 5700
tcccttttcc ttgcagactc ctcaaagcta ctcaagacca agactgaggc acctacaacc 5760
atgacatacc ccttgaaagg tgagttttgc tagagtctga ggaagtagta gaggttcaaa 5820
atggtgtcat cgtagccaag aaaggaatca caatgccatg gaatggctaa taaacagtca 5880
cttggttcct cagagagaac atagcagtaa aggaatggaa acaaaagaaa ggtaacaatg 5940
atgaatatat actctttttt tgtgaaaact tctgaggcaa aaggaaagag agggttagaa 6000
ttactcccat tggaaataca aaaaacaaga acactaaatt ctattctgct cctagtttga 6060
cttgctgtgt gactttgggt acattacctc ccctcgatgg gaattcttct cactgcccac 6120
acctaacagt aagaaatgaa gatgccttat ctcatggtac tagtggttga taacatggtc 6180
aggtaccctg gaaagtacag cacaaatggc cagggaagga ctccaacctt tgcaaccatc 6240
tcctatctct caactttttg aaagaagaga gacatctctg accctattct ctatattcat 6300
agcaacatct acagtgaagc agtcctggga ctggaccact gacatggatg gctaccttgg 6360
agagaccagt gctgggccag gtaggaatat tgtcaggatt tctatctttt cttcttgact 6420
ctaagctttg tgaccaaaac tttcccttat gcacactgtt ctacagcatt gaaatctgca 6480
aatcattacc tgctatgtgc caagcaatgg tcaagggcac tgaggatggg taaagtgggt 6540
aggatgtaga gagagagata cagatccaga gatgagcaaa gtcagagtga ggttaagggg 6600
agtgataaat gtgcccttta tttagttctc tgttgtcata gtaatatgct ttccaaacat 6660
tctgagcaag aatatggata gggacattat gacatcatga cctcaaccag gtaaggataa 6720
tggctgagtg tcattgcttg agctcttaac cagggctctt caagccgctt gaagctgatt 6780
tctgattcct ccaaagcctt gaaaattccc aagtcagggt ctcagagatt caaatcccaa 6840
ataaatcttt tgtgtttcac ctgcatctga tagtcagttg gtatgccttc acatgactac 6900
attgactgtt gaaataatag aacactctca caccaattga taattagctg ctccccttaa 6960
cccctgagcc ctccattatt acctggggct gccttgtccc attcctcaga actctctaga 7020
ccacccccat ggtcatgcaa caaaaggtat accaaggaat ctctaagact ccaagtctac 7080
agtaggcatc tgttgtgact ggttggaatt aaatagtttg ataactatca ctcctggtac 7140
tcattctctg cctgtgtata attgagagag tggacttcca aatgctcttt gtaactctcc 7200
attcctgatt gcagagtttt ttggctatcc cttggcagca ctcaaacctg ttttatgttc 7260
cacatttgca ttgccatctt tggcttcaag atttccatag ctccgttcct ctccgagaag 7320
aacatctact gggagaagag aagttagaaa ttgcctcata gggagttggt ttggaaaaat 7380
gagaaaataa ccttgggcaa agttattaga tgttgggtct gcgccctatt ttctctacca 7440
agttttttag tacttgactc tcttcaaaag agaatatttc ttcgatttgt accagcttat 7500
aacttgagct ctctcagtcc caacaagaca ctctgaggac cacaaatact ggattcctag 7560
gacacgatat cttagagtct catgaaaaca agccagttgc agcaacaaat cctaagtaca 7620
ctgaggttcc tttcctcacg cctctctatc ccccctgacc tagcatctta gattcagaat 7680
attatagcta aaagtgcttt agacatcatc caatcttttc attgaactta tggggtaact 7740
aaggcctagt gacagtcaaa gttttgtcta aggtcactgt attcattttt ccatggctgc 7800
tgtaaaaact taccccaaac ctagtatctt aaaacagcat aaatatatta tcttccactt 7860
ctggaaataa gtctgacaca attatcactg agctaaaatc aaaatgtcag tcagcaaggc 7920
tatgttccct ttggagggtt tggagaagaa ttaatttcct tgtctttctt ttctggcttc 7980
tagaagctac ccacgttctt tggctcatgg cccccttcct ccattttcaa aactaacaat 8040
gtagcattct caaatctctg ttccttttta ctatgtaaac taacatactg acaggttcca 8100
ggaatttgga tgtgaatatc tttagaggac cattattctg cctaccatag tcatacagaa 8160
agtaaataac agatctagga ctggaagcca agtccagttg attctttcag cttttaggca 8220
taatgggaat atgtgtctca agtggctcag tggaaatatg ttttgagaaa gaaggaagct 8280
ggggacttga ccagagcgtg tgatgggaag aatctttgtg gctagaagta actgaccaga 8340
atcttaataa ggtatgtagc atttttggtg aagctggaaa gtcaggatat tattttcttt 8400
tttctaaggg aaggtgaaaa ccttctgtct tggccctata gaaagcatag acaactagct 8460
caaatgccca ggccaatcag cccaccagtg agtctggaag aacctgttta cacatggcat 8520
ctctttctca agtctttctc atgggactgg agttttttct ctctggctag ctaagaaggt 8580
taggagaata tggaaaatga aaaagaaaaa ggcctggctt agtctaggct gtttcttaga 8640
gtttttgttt ctggccttat tttcaatcaa ataccacttg atcttgtttt accctctagg 8700
aaagagc 8707
<210> 6
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gtctgtgttt gcctttttga ctttgttccc tgttttaggc cgtcccatcc tggaagtgcc 60
agagagtgta acaggacctt 80
<210> 7
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
caaataccac ttgatcttgt tttaccctct aggaaagagc ctgccaatct ttgccataat 60
cttcatcatc tccctttgct 80
<210> 8
<211> 83
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ttattagata ttttctttat atacatttca aatgctatcc gatatcgaat tccgaagttc 60
ctattctcta gaaagtatag gaa 83
<210> 9
<211> 90
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gaaagtatag gaacttcatc agtcaggtac ataatggtgg atccagtact tgaaagttcc 60
ctataccctc cctccgccct gctcccctac 90
<210> 10
<211> 1722
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 10
agctaccagc acttccaggt tcttcagcag caagaggatg gaaggatgaa tagaagtagc 60
ttcaaatagg atggagatct catcaggctt gctgttcctg ggccacctaa tagtgctcac 120
ctatggccgt cccatcctgg aagtgccaga gagtgtaaca ggaccttgga aaggggatgt 180
gaatcttccc tgcacctatg accccctgca aggctacacc caagtcttgg tgaagtggct 240
ggtacaacgt ggctcagacc ctgtcaccat ctttctacgt gactcttctg gagaccatat 300
ccagcaggca aagtaccagg gccgcctgca tgtgagccac aaggttccag gagatgtatc 360
cctccaattg agcaccctgg agatggatga ccggagccac tacacgtgtg aagtcacctg 420
gcagactcct gatggcaacc aagtcgtgag agataagatt actgagctcc gtgtccagaa 480
actctctgtc tccaagccca cagtgacaac tggcagcggt tatggcttca cggtgcccca 540
gggaatgagg attagccttc aatgccaggc tcggggttct cctcccatca gttatatttg 600
gtataagcaa cagactaata accaggaacc catcaaagta gcaaccctaa gtaccttact 660
cttcaagcct gcggtgatag ccgactcagg ctcctatttc tgcactgcca agggccaggt 720
tggctctgag cagcacagcg acattgtgaa gtttgtggtc aaagactcct caaagctact 780
caagaccaag actgaggcac ctacaaccat gacatacccc ttgaaagcaa catctacagt 840
gaagcagtcc tgggactgga ccactgacat ggatggctac cttggagaga ccagtgctgg 900
gccaggaaag agcctgccaa tctttgccat aatcttcatc atctcccttt gctgcatagt 960
agctgtcacc ataccttata tcttgttccg ctgcaggaca ttccaacaag agtatgtcta 1020
tggagtgagc agggtgtttg ccaggaagac aagcaactct gaagaaacca caagggtgac 1080
taccatcgca actgatgaac cagattccca ggctctgatt agtgactact ctgatgatcc 1140
ttgcctcagc caggagtacc aaataaccat cagatcaaca atgtctattc ctgcctgctg 1200
aacacagttt ccagaaacta agaagttctt gctactgaag aaaataacat ctgctaaaat 1260
gcccctacta agtcaaggtc tactggcgta attacctgtt acttatttac tacttgcctt 1320
caacatagct ttctccctgg cttcctttct tcttagacaa cctaaagtat ctatctagtc 1380
tgccaattct ggggccattg agaaatcctg ggtttggcta agaatatact acatgcacct 1440
caagaaatct agcttctggg cttcacccag aacaattttc ttcctagggc cttcacaact 1500
cttctccaaa cagcagagaa attccatagc agtagaggtt ctttatcatg cctccagaca 1560
gcgtgagtct cagtcctaca aactcagaca agcacatggg tctaggatta ctcctctttc 1620
tctagggcca gatgactttt aattgatatt actattgcta cattatgaat ctaatgcaca 1680
tgtattcttt tgttgttaat aaatgtttaa tcatgacatc aa 1722
<210> 11
<211> 376
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 11
Met Glu Ile Ser Ser Gly Leu Leu Phe Leu Gly His Leu Ile Val Leu
1 5 10 15
Thr Tyr Gly Arg Pro Ile Leu Glu Val Pro Glu Ser Val Thr Gly Pro
20 25 30
Trp Lys Gly Asp Val Asn Leu Pro Cys Thr Tyr Asp Pro Leu Gln Gly
35 40 45
Tyr Thr Gln Val Leu Val Lys Trp Leu Val Gln Arg Gly Ser Asp Pro
50 55 60
Val Thr Ile Phe Leu Arg Asp Ser Ser Gly Asp His Ile Gln Gln Ala
65 70 75 80
Lys Tyr Gln Gly Arg Leu His Val Ser His Lys Val Pro Gly Asp Val
85 90 95
Ser Leu Gln Leu Ser Thr Leu Glu Met Asp Asp Arg Ser His Tyr Thr
100 105 110
Cys Glu Val Thr Trp Gln Thr Pro Asp Gly Asn Gln Val Val Arg Asp
115 120 125
Lys Ile Thr Glu Leu Arg Val Gln Lys Leu Ser Val Ser Lys Pro Thr
130 135 140
Val Thr Thr Gly Ser Gly Tyr Gly Phe Thr Val Pro Gln Gly Met Arg
145 150 155 160
Ile Ser Leu Gln Cys Gln Ala Arg Gly Ser Pro Pro Ile Ser Tyr Ile
165 170 175
Trp Tyr Lys Gln Gln Thr Asn Asn Gln Glu Pro Ile Lys Val Ala Thr
180 185 190
Leu Ser Thr Leu Leu Phe Lys Pro Ala Val Ile Ala Asp Ser Gly Ser
195 200 205
Tyr Phe Cys Thr Ala Lys Gly Gln Val Gly Ser Glu Gln His Ser Asp
210 215 220
Ile Val Lys Phe Val Val Lys Asp Ser Ser Lys Leu Leu Lys Thr Lys
225 230 235 240
Thr Glu Ala Pro Thr Thr Met Thr Tyr Pro Leu Lys Ala Thr Ser Thr
245 250 255
Val Lys Gln Ser Trp Asp Trp Thr Thr Asp Met Asp Gly Tyr Leu Gly
260 265 270
Glu Thr Ser Ala Gly Pro Gly Lys Ser Leu Pro Ile Phe Ala Ile Ile
275 280 285
Phe Ile Ile Ser Leu Cys Cys Ile Val Ala Val Thr Ile Pro Tyr Ile
290 295 300
Leu Phe Arg Cys Arg Thr Phe Gln Gln Glu Tyr Val Tyr Gly Val Ser
305 310 315 320
Arg Val Phe Ala Arg Lys Thr Ser Asn Ser Glu Glu Thr Thr Arg Val
325 330 335
Thr Thr Ile Ala Thr Asp Glu Pro Asp Ser Gln Ala Leu Ile Ser Asp
340 345 350
Tyr Ser Asp Asp Pro Cys Leu Ser Gln Glu Tyr Gln Ile Thr Ile Arg
355 360 365
Ser Thr Met Ser Ile Pro Ala Cys
370 375
<210> 12
<211> 701
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ggctagactt gcttgcaaag tacatgtttc aaatctaata gctaatggtt tggttaaata 60
ggaatatact ccagaatttt tgcttcaccc tatgtttcat ctttagagtc ttctatagct 120
catctctttc accctgccag aaaagaattt gattttatgt cccaatcact gagcctttct 180
cttgaatgag tctgtttcaa gcagcaaact gtacaaaatg aagtactttg gtttccacta 240
ttcaccattt tccttcctac atatcatttg aaaatagtga aagaaaatat tatatatatg 300
tacatatatt tacatattct ataatatttt acatatatgc acttatatgt gtgtgcatac 360
atatacatgt aaaatattat agaattctaa aaattattct atcctaactc tcacataata 420
tttggaggaa aatggatcct tcacagtggt agtgacttac cgagggtcac ttactggcaa 480
gacagtgtcg tgaaaggagc ttaaaagcac tagagctaat aagtgttaaa gtctttgtcg 540
tagggactga ctcacattga tgggaaagtt aacagaccag aagagcacag ggatgaagga 600
agggtgtttc ccagaaacct attgagtctg tcactcatac cctcactcca gtgaacattt 660
tgtctgtgtt tgcctttttg actttgttcc ctgttttagg c 701
<210> 13
<211> 2086
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ctgccaatct ttgccataat cttcatcatc tccctttgct gcatagtagc tgtcaccata 60
ccttatatct tgttccgctg caggacattc caacaaggta actgataagt agttcaagtt 120
gtttttttgc ttattcattc ttttcaacat taccttgatc aacattctga tgatgctctg 180
tgtctaacat tccagtgagc ttgaagacca gttttagagt aatgatagag atggatgtta 240
attgtccctg caaacaatga tgtaagattt agagtaccca accaagcaca attatctttg 300
taagtcacct tataagaatg caagagaagc ttccctcaag ttgcttgcca tttatgtgtg 360
gatttccaag ttgaagcata gaagttatca acagcacaca tagcagaaag agtaatgatc 420
caaatgtaaa gaagaaaata ttgaacaaaa aataaagaga agtcaaagct ggaataatca 480
acaaagtttt tcagaagttt taagtagaac taggtcatat tacatgaaga caatatgtaa 540
agggacagta ttccaggaaa gtgaatccac atgagcataa gtacaagggt ctaaattgca 600
aatgactgtg gatcatcata aagaaaaatg atagtgaaat atagggaaga ataaaagttc 660
ctttctaatt agaggaggtt ttaaattcca gcctaaagaa tttcttcact gggttctgca 720
acatttctaa gattaactta gttgttttga tcagggaaac tgcctgatga agacaatatt 780
gtcaaagtta tttactgagt atgggaaaca cagggatgag ggaaattgga atgtttgctt 840
ctaaggctcc cttctcttta aataattcaa tttagtctgt agttactgag aagagtttgt 900
attatagatt ctgagtatat aaagacaaaa agaacagatg tggtgtacag aatttcccaa 960
tcagtgggga agacaaaaca tggaaattgg ggaggggggt cttatacgtt gcattgttag 1020
ctttcttgta atttagtaca tgaatttcca gttgctactc tgaaagatga taaccatctg 1080
gagggcagat ttaagtatca agaaatggtc atctttgtgc caatctaatc ctatggaata 1140
gagaacagtt ctccacagac actaagaagc aatgattatc taataatcgt ctttttaatt 1200
tttaagattt tatgtagtta tctttcatta attcaatgaa acatcaactt ttccatatat 1260
gatatatatg taacaactgc ccactttctt gaataacaga tgggcataag tgcacttaaa 1320
aatggattgg gctatggtcc ttgacatgga accaaattca atgcattttt cctgggctgt 1380
gactgggcaa tcaagcttcc cacagaattt tctgagaatc tttgatgaga ctactgggtg 1440
aagaacaagt cttgtgttct ccctttaccg acaacaagca acatcttcag cctgttgttc 1500
tgagtcaaaa atgccaaagg ggatgaaaat caaagaggat gtatacgttc tacttctcca 1560
acaaatctgc atccctgtat ttcaactcat gacaaaaacc tcttgatatt aaaaagctgt 1620
tacttggaat tctcttcagt ttcctccccc atctttgaat aggtactcag atttcatgtt 1680
tagatcttat atgctctcca tgtaattttc tgacatgaat cttccttatt ttttagagta 1740
tgtctatgga gtgagcaggt aagataccat ctcctattct aacttattaa ccattacctt 1800
ccctcaattc tgttggccat tgacagaaaa ccttgaaact agtcctaata gggtctttca 1860
gggtcagaaa ataatttact ctctcagata aatgtcttca tattatgtcc tggatcagtg 1920
aacacacaag atgatttagg tacaccaact ttctgttctc acagtccctg tctagcagga 1980
tcctgagatt cagtgaacaa gaacataggt ggtgggatgc tagaaaacca ggatctaagc 2040
cctaaaatct ttctcatgag taactaggtc ttggttccta gggtgt 2086
<210> 14
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
agggtggggt ggcctaaaac agg 23
<210> 15
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
caggtccctg tcacactctc agg 23
<210> 16
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gcaagttttg gtgaaatggc tgg 23
<210> 17
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
caggaatcac tatacatgtg agg 23
<210> 18
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
atcttcctac gtgactccac tgg 23
<210> 19
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
tgcatctatg atcccctgag agg 23
<210> 20
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aaataagacc aagtgctatt tgg 23
<210> 21
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gactttaata ccaacatacc agg 23
<210> 22
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
ggtcttgcta ctatcatacc agg 23
<210> 23
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
agctgttagt tatcctataa tgg 23
<210> 24
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
tgaccaagga ttatagtaac agg 23
<210> 25
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
acataggctt ctctcaatat tgg 23
<210> 26
<211> 132
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
gaattctaat acgactcact atagggggtc ttcgagaaga cctgttttag agctagaaat 60
agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120
tttaaaggat cc 132
<210> 27
<211> 1332
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
cctggtgagg caaagaccat agatgccact tcagtgttca gatacattag tatatgcttt 60
ggtacttagc agtgtatcct gaaagtcaga taacataacc tcgctccatg cacaaggcat 120
cgtagtctac ctgcttaact gaaaatatgc taaataaaaa agattcagtc agtgatacct 180
tgcattttga aactatatct accaagaaag acattgccaa aaaacagccc ctggacccag 240
ttgaataaaa gtcatcaaga tatgagcata catatgaaaa cctctaatac aatgggcacc 300
catctctttt tgcctctgga ctccctccaa ctccccagcc catcaagaag caattttctt 360
tgttttcacc acacaatagc tagcacaacc agtgctagag agttactcag gttcttttct 420
tttccagacc aagtatggat gaaatctttt ccccctcagg atatcatttt ctaatatctt 480
tttggtaaga actaaaggaa atgaaaaaaa aaaaaaaaac aaagagaaaa gagaaataag 540
gacagaaatt ggctagactt gcttgcaaag tacatgtttc aaatctaata gctaatggtt 600
tggttaaata ggaatatact ccagaatttt tgcttcaccc tatgtttcat ctttagagtc 660
ttctatagct catctctttc accctgccag aaaagaattt gattttatgt cccaatcact 720
gagcctttct cttgaatgag tctgtttcaa gcagcaaact gtacaaaatg aagtactttg 780
gtttccacta ttcaccattt tccttcctac atatcatttg aaaatagtga aagaaaatat 840
tatatatatg tacatatatt tacatattct ataatatttt acatatatgc acttatatgt 900
gtgtgcatac atatacatgt aaaatattat agaattctaa aaattattct atcctaactc 960
tcacataata tttggaggaa aatggatcct tcacagtggt agtgacttac cgagggtcac 1020
ttactggcaa gacagtgtcg tgaaaggagc ttaaaagcac tagagctaat aagtgttaaa 1080
gtctttgtcg tagggactga ctcacattga tgggaaagtt aacagaccag aagagcacag 1140
ggatgaagga agggtgtttc ccagaaacct attgagtctg tcactcatac cctcactcca 1200
gtgaacattt tgtctgtgtt tgcctttttg actttgttcc ctgttttagg ccaccccacc 1260
ctaaaaacac ctgagagtgt gacagggacc tggaaaggag atgtgaagat tcagtgcatc 1320
tatgatcccc tg 1332
<210> 28
<211> 1541
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
agaggctaca ggcaagtttt ggtgaaatgg ctggtaagac acggctctga ctccgtcacc 60
atcttcctac gtgactccac tggagaccat atccagcagg caaagtacag aggccgcctg 120
aaagtgagcc acaaagttcc aggagatgtg tccctccaaa taaataccct gcagatggat 180
gacaggaatc actatacatg tgaggtcacc tggcagactc ctgatggaaa ccaagtaata 240
agagataaga tcattgagct ccgtgttcgg aaatgtaagt cactgtgaga gtagaaatgc 300
attggtaagc aaagacacag tagagtagtg taatcccaga cacctctgag aaattgagtg 360
gccttggttg ctatgtacat aggttctctg taattctgtt tgctaatcac aagcacctca 420
gggtcaccac cttattagaa atttaaaaag tgtttaaaaa agacaattcc actaggctgt 480
ccattacttt ccaccctgta aggagtatct ttctactcac acagacccca ggtgggaagt 540
gctggttttc atatgacagt gttttgtgat ataaataata ccatatgata ggcaaaggct 600
tgtttgcatt tggagagcag gttttcattt ataagtattt ttgagaataa aaaataaaat 660
tttaaccggg caatggtggc acatgtcttt aatcccagca cttgggaggc agaggcaggc 720
agattctgag ttcgaggcta gcctggtcta caaggtgagt tccaggacag ccagggctat 780
atagagaaac tctgtcttgg aaaacaaaca aacaagcaaa caaataaata gataaataaa 840
taaatatata aataaatata aaatttgtaa atataaaaaa tacaattcca ttgccttata 900
aaatgctacc tatctctcct atattcacta aagtctttct gaggtacata cttcccacca 960
agtacatctc ccaatttacc acaaaacttt gcaaacagaa aagagcatta ttgtctacat 1020
aaagctaaac tctatccatt tatacccaac catataaatt tttctacagc agctgaccct 1080
gctgtccatt tctttctcct tcgtttaacc acttttactt gggttttcta cagtttatct 1140
gcatgactat tcctagatta ctttgcaggc tctaattcac tactttgtac atctagagta 1200
gaggacattg ttcacttcac ccagcttgag aattttcatt tctaatctta cagtctacac 1260
gttgtctctc tcttctctct ttaattattt ttttccaata cagatacttt ttagtcaatt 1320
tcaataccaa tgagaattta atgggcttct gtgtgttttt gaggttgtta ccagaaaatt 1380
attgcctcta attacatatt gaagcatttc cctatgcttg tttctaatat attgagagtt 1440
cccaacctca cattgaagtt cttgatctac ttttgttgat tttttacagg ataatacagg 1500
tcagatttga atattagtga tatccacttt ccccagcacc a 1541
<210> 29
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60
ggacct 66
<210> 30
<211> 1200
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
atggggatct tactgggcct gctactcctg gggcacctaa cagtggacac ttatggccgt 60
cccatcctgg aagtgccaga gagtgtaaca ggaccttgga aaggggatgt gaatcttccc 120
tgcacctatg accccctgca aggctacacc caagtcttgg tgaagtggct ggtacaacgt 180
ggctcagacc ctgtcaccat ctttctacgt gactcttctg gagaccatat ccagcaggca 240
aagtaccagg gccgcctgca tgtgagccac aaggttccag gagatgtatc cctccaattg 300
agcaccctgg agatggatga ccggagccac tacacgtgtg aagtcacctg gcagactcct 360
gatggcaacc aagtcgtgag agataagatt actgagctcc gtgtccagaa actctctgtc 420
tccaagccca cagtgacaac tggcagcggt tatggcttca cggtgcccca gggaatgagg 480
attagccttc aatgccaggc tcggggttct cctcccatca gttatatttg gtataagcaa 540
cagactaata accaggaacc catcaaagta gcaaccctaa gtaccttact cttcaagcct 600
gcggtgatag ccgactcagg ctcctatttc tgcactgcca agggccaggt tggctctgag 660
cagcacagcg acattgtgaa gtttgtggtc aaagactcct caaagctact caagaccaag 720
actgaggcac ctacaaccat gacatacccc ttgaaagcaa catctacagt gaagcagtcc 780
tgggactgga ccactgacat ggatggctac cttggagaga ccagtgctgg gccaggaaag 840
agcctgcctg tctttgccat catcctcatc atctccttgt gctgtatggt ggtttttacc 900
atggcctata tcatgctctg tcggaagaca tcccaacaag agcatgtcta cgaagcagcc 960
agggcacatg ccagagaggc caacgactct ggagaaacca tgagggtggc catcttcgca 1020
agtggctgct ccagtgatga gccaacttcc cagaatctgg gcaacaacta ctctgatgag 1080
ccctgcatag gacaggagta ccagatcatc gcccagatca atggcaacta cgcccgcctg 1140
ctggacacag ttcctctgga ttatgagttt ctggccactg agggcaaaag tgtctgttaa 1200
<210> 31
<211> 660
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
acacagtttc cagaaactaa gaagttcttg ctactgaaga aaataacatc tgctaaaatg 60
cccctactaa gtcaaggtct actggcgtaa ttacctgtta cttatttact acttgccttc 120
aacatagctt tctccctggc ttcctttctt cttagacaac ctaaagtatc tatctagtct 180
gccaattctg gggccattga gaaatcctgg gtttggctaa gaatatacta catgcacctc 240
aagaaatcta gcttctgggc ttcacccaga acaattttct tcctagggcc ttcacaactc 300
ttctccaaac agcagagaaa ttccatagca gtagaggttc tttatcatgc ctccagacag 360
cgtgagtctc agtcctacaa actcagacaa gcacatgggt ctaggattac tcctctttct 420
ctagggccag atgactttta attgatatta ctattgctac attatgaatc taatgcacat 480
gtattctttt gttgttaata aatgtttaat catgacatca acttcagttg tgttggtctt 540
ctctcaatac aataggacct atccgaaatt attaaaatga gacctatccg aaattattaa 600
aatgagacta aaatgctaag gacccctagg aatatagatc acgcactttg ctgtgctctc 660
<210> 32
<211> 1361
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
aggcctatta agggttccgg atcctcgggg acaccaaata tggcgatctc ggccttttcg 60
tttcttggag ctgggacatg tttgccatcg atccatctac caccagaacg gccgttagat 120
ctgctgccac cgttgtttcc accgaagaaa ccaccgttgc cgtaaccacc acgacggttg 180
ttgctaaaga agctgccacc gccacggcca ccgttgtagc cgccgttgtt gttattgtag 240
ttgctcatgt tatttctggc acttcttggt tttcctctta agtgaggagg aacataacca 300
ttctcgttgt tgtcgttgat gcttaaattt tgcacttgtt cgctcagttc agccataata 360
tgaaatgctt ttcttgttgt tcttacggaa taccacttgc cacctatcac cacaactaac 420
tttttcccgt tcctccatct cttttatatt ttttttctcg agggatcttt gtgaaggaac 480
cttacttctg tggtgtgaca taattggaca aactacctac agagatttaa agctctaagg 540
taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt gtttgtgtat 600
tttagattcc aacctatgga actgatgaat gggagcagtg gtggaatgcc tttaatgagg 660
aaaacctgtt ttgctcagaa gaaatgccat ctagtgatga tgaggctact gctgactctc 720
aacattctac tcctccaaaa aagaagagaa aggtagaaga ccccaaggac tttccttcag 780
aattgctaag ttttttgagt catgctgtgt ttagtaatag aactcttgct tgctttgcta 840
tttacaccac aaaggaaaaa gctgcactgc tatacaagaa aattatggaa aaatattctg 900
taacctttat aagtaggcat aacagttata atcataacat actgtttttt cttactccac 960
acaggcatag agtgtctgct attaataact atgctcaaaa attgtgtacc tttagctttt 1020
taatttgtaa aggggttaat aaggaatatt tgatgtatag tgccttgact agagatcata 1080
atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 1140
ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 1200
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 1260
cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgacat 1320
ggtaagtaag cttgggctgc aggtcgaggg acctagtcga c 1361
<210> 33
<211> 1995
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 33
agctaccagc acttccaggt tcttcagcag caagaggatg gaaggatgaa tagaagtagc 60
ttcaaatagg atggagatct catcaggctt gctgttcctg ggccacctaa tagtgctcac 120
ctatggccac cccaccctaa aaacacctga gagtgtgaca gggacctgga aaggagatgt 180
gaagattcag tgcatctatg atcccctggg aagcggagct actaacttca gcctgctgaa 240
gcaggctgga gacgtggagg agaaccctgg acctatgggg atcttactgg gcctgctact 300
cctggggcac ctaacagtgg acacttatgg ccgtcccatc ctggaagtgc cagagagtgt 360
aacaggacct tggaaagggg atgtgaatct tccctgcacc tatgaccccc tgcaaggcta 420
cacccaagtc ttggtgaagt ggctggtaca acgtggctca gaccctgtca ccatctttct 480
acgtgactct tctggagacc atatccagca ggcaaagtac cagggccgcc tgcatgtgag 540
ccacaaggtt ccaggagatg tatccctcca attgagcacc ctggagatgg atgaccggag 600
ccactacacg tgtgaagtca cctggcagac tcctgatggc aaccaagtcg tgagagataa 660
gattactgag ctccgtgtcc agaaactctc tgtctccaag cccacagtga caactggcag 720
cggttatggc ttcacggtgc cccagggaat gaggattagc cttcaatgcc aggctcgggg 780
ttctcctccc atcagttata tttggtataa gcaacagact aataaccagg aacccatcaa 840
agtagcaacc ctaagtacct tactcttcaa gcctgcggtg atagccgact caggctccta 900
tttctgcact gccaagggcc aggttggctc tgagcagcac agcgacattg tgaagtttgt 960
ggtcaaagac tcctcaaagc tactcaagac caagactgag gcacctacaa ccatgacata 1020
ccccttgaaa gcaacatcta cagtgaagca gtcctgggac tggaccactg acatggatgg 1080
ctaccttgga gagaccagtg ctgggccagg aaagagcctg cctgtctttg ccatcatcct 1140
catcatctcc ttgtgctgta tggtggtttt taccatggcc tatatcatgc tctgtcggaa 1200
gacatcccaa caagagcatg tctacgaagc agccagggca catgccagag aggccaacga 1260
ctctggagaa accatgaggg tggccatctt cgcaagtggc tgctccagtg atgagccaac 1320
ttcccagaat ctgggcaaca actactctga tgagccctgc ataggacagg agtaccagat 1380
catcgcccag atcaatggca actacgcccg cctgctggac acagttcctc tggattatga 1440
gtttctggcc actgagggca aaagtgtctg ttaaacacag tttccagaaa ctaagaagtt 1500
cttgctactg aagaaaataa catctgctaa aatgccccta ctaagtcaag gtctactggc 1560
gtaattacct gttacttatt tactacttgc cttcaacata gctttctccc tggcttcctt 1620
tcttcttaga caacctaaag tatctatcta gtctgccaat tctggggcca ttgagaaatc 1680
ctgggtttgg ctaagaatat actacatgca cctcaagaaa tctagcttct gggcttcacc 1740
cagaacaatt ttcttcctag ggccttcaca actcttctcc aaacagcaga gaaattccat 1800
agcagtagag gttctttatc atgcctccag acagcgtgag tctcagtcct acaaactcag 1860
acaagcacat gggtctagga ttactcctct ttctctaggg ccagatgact tttaattgat 1920
attactattg ctacattatg aatctaatgc acatgtattc ttttgttgtt aataaatgtt 1980
taatcatgac atcaa 1995
<210> 34
<211> 91
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
ttctctagaa agtataggaa cttcatcagt caggtacata atggtggatc ccttaatata 60
tttctgtgaa atgttccaaa atctgatatt g 91
<210> 35
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
tgcatctatg atcccctgag 20
<210> 36
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
taggtgcatc tatgatcccc tgag 24
<210> 37
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
ctcaggggat catagatgca 20
<210> 38
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
aaacctcagg ggatcataga tgca 24
<210> 39
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
ctgaatttct gcttgcttca tcttcc 26
<210> 40
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
cttctttagc aacaaccgtc gtgg 24
<210> 41
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
gtgctctcag gcctattaag ggttcc 26
<210> 42
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
ccagcacaat actgctataa aaaga 25
<210> 43
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
cgtagggact gactcacatt gatgg 25
<210> 44
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
cagggtattt atttggaggg acacatc 27
<210> 45
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
ggtccagggt tctcctccac g 21
<210> 46
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
cttctcacga tcaacccaga acag 24
<210> 47
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
gcataaacat agcccatcat tgctg 25
<210> 48
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
aactgatgaa tgggagcagt ggtgg 25
<210> 49
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
gcagacactc tatgcctgtg tggag 25
<210> 50
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
aagtgagcca caaagttcca gg 22
<210> 51
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
tctggttcat cagttgcgat gg 22
<210> 52
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
ttggtgaagt ggctggtaca ac 22
<210> 53
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
atgcagggct catcagagta gt 22
<210> 54
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
accacagtcc atgccatcac 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
tccaccaccc tgttgctgta 20
<210> 56
<211> 3731
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
tgtctggttg tctttagtga acatgactat ataaaagtaa tgccttgttt atacctacat 60
tacagaatgt acagtgaaaa attaaagaga tagtaaatgt caggtacaag cactatagag 120
acaaaagaag aaatgtaaga gaatagagat gaaacatata aagatacaag agtaagttca 180
ctaatactca ttttagtaca gtgtctgaat gaataaaaga tggaaaatgc cagttgttat 240
tgctgtagcc gatattgtat agataatgtg gcttgatcat ttttaattta caacacacaa 300
ttaccaagtc tcatcatgtt catgttacaa ctgagaaagc taatattcag aagggtttta 360
tttttctaag gcctagaatt aaaactttca atctaataaa gcattccctt attaagtcta 420
acaaactaca aataaggctt atctttctct ttaaaaaaat aaaatataga tgtctttaca 480
aaggcatcat gaggaatact aattaaagct agtcgtttct tgacatcaga gatggggcta 540
ctggcaaaag tcagtcaaca aactttccca ctgtgagata tgcgacaccc tccaaagcaa 600
ctatatccct agtcttaaca actaataaaa caatttctgt gtagaaagtc atccagtgca 660
ctaaactcat actatgaagc actcgagtgc ctctaattca cacagtgtcc atttgtattg 720
aggactatgg agctaatggt acaaattatg aaaactgcat atgccagaac aaatggtttc 780
cctagactga ccagaaagta aaacatccct ctatggtaaa ctttgagcag actcaaaatt 840
ctgggacatt aaagaccaga gagcaccact ggtcccagag aaagtcaaat cctagtagaa 900
tgaggaacag tttcacccat ccttaaatct ctaaccttac gcagcgtaaa aagaaagaac 960
cctgtgtgac tcttctgaaa tacggaaggt gggggaagtg tgtgaggaaa ctaggattct 1020
gagggaataa aatagaaaag caacacagaa actggcagct accagcactt ccaggttctt 1080
cagcagcaag aggatggaag gatgaataga agtagcttca aataggatgg agatctcatc 1140
aggcttgctg ttcctgggcc acctaatagt gctcacctat ggtaaggcag gatattgata 1200
cttgactacc tcttcaccct ctggcagaaa atgtgagtgt tgactttgag tgtttaccga 1260
gaaaaacttg tttctcctgg gcagtcacag ttgcctgcaa ttctacaggc tttctgaatg 1320
ttgagcagaa gggaagaaag tctggtaaag cttccagaaa ctgccttgga tagaaattga 1380
aagagttctt ctcttagaaa atatctgcat cactttccaa tatttcaggg atgtcagagg 1440
actccaatgt catgcaaact ttccatattc tccttttccc ttgaaatttt ataattatga 1500
ctaactttcc atttccaagc tttgattctt gctgcagtat atacctccac aatgaataaa 1560
tgttgttgag taaatagatg tgaccttaga agtaacctat agccaaggat gttgaggtac 1620
acctttaatc ctagctgttg ggaggtagag gcactctgat ctctgtgatc tcaaggacac 1680
tttcgactac atagaaagtt ccaggatatc taaggttaca tggtgagact cagtttgtaa 1740
ataaatagat aaaagtaaca catgccacta cttagaattg tttacaagtg ctcagcactt 1800
gctattcata cacttttaga acacagacat ttactgatat ccatgctact ctaagacttc 1860
tcacgatcaa cccagaacag atactattcc ttttttttca tgtcagcact tcaaacatct 1920
aaagaacgga aagaactgta tcctcttaat tttcttctct aaactaaata tctctagctt 1980
ctttaactaa aggatgtggt atactactag ctgctgggat aactcacttc cctgtgggca 2040
tagtagccca gttgtagggc ctgtttgcag ggatctaatt ctagattcat agtccagcag 2100
agtctgggat atctcatagt agcattattt ctgtgactct tcttccactc tcactattca 2160
agaaaatgaa atgccttttc aggaaactaa gtacaagtaa taactactta agacttggta 2220
tagggtaaaa ggattttttt gctgaatttc tgcttgcttc atcttcctat agggtgtcat 2280
tggcttaaac ataatttgaa gtactcagca atgatgggct atgtttatgc tttttaattt 2340
tattttattg aagttgaccc ctctaatggt taaaatatgc cgtgtatttt ccaagagttc 2400
ctggtgaggc aaagaccata gatgccactt cagtgttcag atacattagt atatgctttg 2460
gtacttagca gtgtatcctg aaagtcagat aacataacct cgctccatgc acaaggcatc 2520
gtagtctacc tgcttaactg aaaatatgct aaataaaaaa gattcagtca gtgatacctt 2580
gcattttgaa actatatcta ccaagaaaga cattgccaaa aaacagcccc tggacccagt 2640
tgaataaaag tcatcaagat atgagcatac atatgaaaac ctctaataca atgggcaccc 2700
atctcttttt gcctctggac tccctccaac tccccagccc atcaagaagc aattttcttt 2760
gttttcacca cacaatagct agcacaacca gtgctagaga gttactcagg ttcttttctt 2820
ttccagacca agtatggatg aaatcttttc cccctcagga tatcattttc taatatcttt 2880
ttggtaagaa ctaaaggaaa tgaaaaaaaa aaaaaaaaca aagagaaaag agaaataagg 2940
acagaaattg gctagacttg cttgcaaagt acatgtttca aatctaatag ctaatggttt 3000
ggttaaatag gaatatactc cagaattttt gcttcaccct atgtttcatc tttagagtct 3060
tctatagctc atctctttca ccctgccaga aaagaatttg attttatgtc ccaatcactg 3120
agcctttctc ttgaatgagt ctgtttcaag cagcaaactg tacaaaatga agtactttgg 3180
tttccactat tcaccatttt ccttcctaca tatcatttga aaatagtgaa agaaaatatt 3240
atatatatgt acatatattt acatattcta taatatttta catatatgca cttatatgtg 3300
tgtgcataca tatacatgta aaatattata gaattctaaa aattattcta tcctaactct 3360
cacataatat ttggaggaaa atggatcctt cacagtggta gtgacttacc gagggtcact 3420
tactggcaag acagtgtcgt gaaaggagct taaaagcact agagctaata agtgttaaag 3480
tctttgtcgt agggactgac tcacattgat gggaaagtta acagaccaga agagcacagg 3540
gatgaaggaa gggtgtttcc cagaaaccta ttgagtctgt cactcatacc ctcactccag 3600
tgaacatttt gtctgtgttt gcctttttga ctttgttccc tgttttaggc caccccaccc 3660
taaaaacacc tgagagtgtg acagggacct ggaaaggaga tgtgaagatt cagtgcatct 3720
atgatcccct g 3731
<210> 57
<211> 3583
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
cttaatatat ttctgtgaaa tgttccaaaa tctgatattg taatgatttc agccttctat 60
gtaactgcac atctaaatac tgtaaccatt taaaaattac atttgtctaa ttaatcttga 120
gttgtaagtg taaattattt atttggaatg ttatagtctt atgaaataca ttagtgtatt 180
tctccatcct tcatattgtc tttttaaaat tttttttaga tttatttata tgtgagtgtt 240
ttgtctacag gtattcccat gcaccatatg tatgtctagt acttaaagag gtctgaatag 300
tgatcaaatg ctctctatct ggagttatag atgtttataa gccatcatgt gtgtgctaac 360
aaaaccaaac ccaggtcctc tacaagagca gacagtgatc ttaactatta agccatctct 420
ccaaccaaac atgttgcctt tttattttca tgatagtatc ctttaaggtc ccaacgtttc 480
taattttatt gacacctaac ctatatttgt cttagtactt gtatgttgaa ctatgtccta 540
ccaaacattt cttaacatgc ataaagtctg gcagaaatga gtagtgaagg cacatgggct 600
tgatattttc tttgttagta gttgtttaac tagcaatcca aatgtttttt tacttgttta 660
aattatgtaa ttttatttcc tggttcatct tttaaaatta acatttctgt ttttaagaat 720
ttatcatttt atacatataa gtgttttatc taaatatatg tgtgtcttag ttactttttt 780
attactgtga taaaatgatt taacaaactt atgaagtaaa tagtttgagc ttacaatttc 840
ttttatttgc taatttcttt tttttattag gtatttattt catttacatt tccaatgctt 900
tcccaaaagt cccacacatg ctccctaccc actcccccgc ccacccactc ccaattcttg 960
gccctggcgt tcccctgtac taaggcatat aaagtttgca agaccaatgg gcctctcttt 1020
ccagtgatgg ccgactaggc catcttctga tacatatgca gctagagaca agagctccgg 1080
gggtactggt tagttcatat tgctcttcca tctatagggt tgcagatccc tttagctcct 1140
tggttacttt ctctagctcc tccattgggc gccctgtgat acatccaata gctgactgtg 1200
agcatccact tatgtgtttg aaggccccgg catagtctca caagagacag caatatctgg 1260
gtcctttcag caagatcttg ctaatatatg caatggtgtt agtgtttgga agctgattat 1320
gggatggatc cccggatatg gcagcctcta gatggtccat cctttcatct cagctccaaa 1380
ctttgtctct gtaactcctt ccatgggtgt tttgttccca attctaagac gggacaaagt 1440
gctcacattt tggtcttggt tcttcttgag tttcatgtgt ttcacaaatt ttatcttata 1500
tcttgggtat tctaaatttc tgagctaata tccacttatc agtaagtaca tatggtttga 1560
gttcttttgt gattggatta cctcactcag gatgatgccc tccaggtcca tccatttgcc 1620
taggaatttc ataaattcat tcttttgaac agctgagtag tactccattg tgtaaatgta 1680
cctcattttc tgtatccatt cctctgttga ggggcatctg ggttctttcc agcttctggc 1740
tattataaat aaggctgcta tgaacatcgt agagcatgtg tccttcttac caattggaac 1800
atcttctgga tatatgccaa ggagaggtat tgcaggatcc tctggtagta ctatgtcaaa 1860
ttttctgagg aactaccaga ctgatttcca aagtggttgt aaaagcttgc aatctcacca 1920
gcaatggagg agtgtttctc tttctccaca tcctcgtcag catctactgt gacatgaatt 1980
tttgatctta gccattctga ctggtgtgag gtagaatctc agggttgttt tgacttgcat 2040
ttccctgatg attaaggatg ctgaacattt tttcaggtgc ttctcagcca ttcggtattc 2100
ctcacgtgag aattcttctg tttttttttt ttttgtttgt ttgtttgttt gtttctgttt 2160
ttgttttttt tttggctctg agccccattt tttaataggg ttatttgatt tttctggagt 2220
ccaccttctt aagttcttta tatatattgg atattagtcc cctatctgat ttaggatagg 2280
taaagatcct ttcccaatct gttggtggcc tttttgtctt attgacagta acttttgcct 2340
tgcagaaact ttgcaatttt ttgaggtccc attagtcaat tctcgatctt acagcacaag 2400
ccattgctgt tctattcagg aatttttccc ctttcttcga ggtttttccc tactttctcc 2460
tcaataagtt tcagtgtctc tggttttatg tggagttcct taatccactt agatttgacc 2520
ttagtacaag gagataggaa tggatcaatt tgcattcttc tacatgataa ccgccagttg 2580
tgccagtacc atttgttgaa aatgccgtct tttttccacc agaaggtttt tgctcccttg 2640
tcaaagatca agtgaccata ggtgtgtggg ttcatttctg ggtcttcaat tctattccat 2700
tggtctactt gtctgtctct ataccagtac catgcagttt ttatcacaat tgctctgtag 2760
tacagcttta ggtcaggcat ggtgattcca ccggaggttc ttttatcctt gagcagagtt 2820
tttgctatcc taggcttttt gttattccag atgaatttac agattgccct ttctaatttg 2880
ttgaagaact gatttgtaat tttgatgggg attgcattga atctgtaaat tgcttttggc 2940
aagatagaca tttttactat attaatcctg ccaatccatg agcatgtgag atctttccat 3000
cttctgagat cttctttaat ttctttcttc agagatttga agtttttatc ataaagatct 3060
ttcacttcct tagttagagt caaaccaagg tattttatat tatttgtgac tattgagaag 3120
ggtattgttt ccctaattaa tttctcagtc tatttatcct ttgtgtacag aaaggccatt 3180
gacttgtttc agttaatttt atatccagca aattccctga agctgtttat caggtttagg 3240
aggtctctgg tagaattttt aggatcactt atatatgcta tcatatcatc tgcaaaaagt 3300
gatattttga ctttttcctt gccaatttgt atccccttga tctgctattg ttatcgaatt 3360
gctctggcta gaacttcaag tacaatgttg aataggtatg gagaaagtga gcagccttgt 3420
gtattccctg gttttagtgg gattgcttcc agcttctcac catttacttt gatggtggct 3480
actcgtttgc tgtaaattgc ttttatcatg tttaggtatg ggcctccaat gcctgatctt 3540
tccaagactt taatcatgaa tgggtgttgg attttgtcaa atg 3583
<210> 58
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
gtaagtaagc ttgggctgca ggtcgaggga cctagtcgac agaggctaca ggcaagtttt 60
ggtgaaatgg ctggtaagac 80
<210> 59
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
ctgacctgtg tctttttata gcagtattgt gctggttttg gaattccgaa gttcctattc 60
tctagaaagt ataggaactt caggt 85

Claims (23)

1.一种人源化VSIG4蛋白,其特征在于,所述的人源化VSIG4蛋白包含人VSIG4蛋白的全部或部分。
2.根据权利要求1所述的人源化VSIG4蛋白,其特征在于,所述的人源化VSIG4蛋白包含人VSIG4蛋白的信号肽、胞外区、跨膜区和/或胞质区,优选的,所述的人源化VSIG4蛋白包含人VSIG4蛋白的胞外区的全部或部分,进一步优选的,包含人VSIG4蛋白胞外区至少50个连续氨基酸,优选包含SEQ ID NO:2第20-281或20-283位所示氨基酸序列;或者,包含与SEQID NO:2第20-281或20-283位所示氨基酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:2第20-281或20-283位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或者,包含与SEQ ID NO:2第20-281或20-283位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
3.根据权利要求1或2所述的人源化VSIG4蛋白,其特征在于,所述的人源化VSIG4蛋白的氨基酸序列包含下列组中的任一种:
A)SEQ ID NO:11或2所示氨基酸序列;
B)与SEQ ID NO:11或2所示氨基酸序列同一性至少为85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)与SEQ ID NO:11或2所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
D)与SEQ ID NO:11或2所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
4.一种编码权利要求1-3任一项所述人源化VSIG4蛋白的核酸。
5.一种人源化VSIG4基因,其特征在于,所述的人源化VSIG4基因包含人VSIG4基因的部分。
6.根据权利要求5所述的人源化VSIG4基因,其特征在于,所述的人源化VSIG4基因包含人VSIG4基因的1号至8号外显子的全部或部分,或者,包含2号至6号外显子的全部或部分;优选的,包含1号外显子的部分、2号外显子至7号外显子的全部和8号外显子的部分,其中,1号外显子的部分至少包含10bp的核苷酸序列,8号外显子的部分至少包含100bp的核苷酸序列,或者,包含2号外显子的部分、3号外显子至5号外显子的全部和6号外显子的部分,其中,2号外显子的部分至少包含100bp的核苷酸序列,6号外显子的部分至少包含5bp的核苷酸序列。
7.根据权利要求5或6所述的人源化VSIG4基因,其特征在于,所述的人源化VSIG4基因包含SEQ ID NO:5或30所示的核苷酸序列;或者,包含与SEQ ID NO:5或30所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:5或30所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:5或30所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
8.根据权利要求5-7任一所述的人源化VSIG4基因,其特征在于,所述的人源化VSIG4基因还包含非人动物VSIG4基因的1号外显子和/或6-7号外显子的全部或部分,更进一步优选还包含2号外显子的部分和/或5号外显子的部分核苷酸序列。
9.根据权利要求5-8任一所述的人源化VSIG4基因,其特征在于,所述的人源化VSIG4基因的核苷酸序列包含下列组中的任一种:
A)转录的mRNA为SEQ ID NO:10或33所示核苷酸序列;
B)转录的mRNA与SEQ ID NO:10或33所示核苷酸序列的同一性至少为85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C)转录的mRNA与SEQ ID NO:10或33所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
D)转录的mRNA具有SEQ ID NO:10或33所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;或,
E)包含SEQ ID NO:6、7和/或58所示的核苷酸序列。
10.一种靶向载体,其特征在于,所述的靶向载体包含供体核苷酸序列,优选的,所述的供体核苷酸序列包含下列组中的一种:
A)编码人或人源化VSIG4蛋白的核苷酸序列;
B)编码人VSIG4蛋白的胞外区、跨膜区、胞质区和/或信号肽的核苷酸序列的全部或部分,优选编码人VSIG4蛋白的胞外区的全部或部分核苷酸序列,优选编码人VSIG4蛋白的胞外区至少50个连续氨基酸的核苷酸序列;
C)人或人源化VSIG4基因的核苷酸序列;或,
D)人VSIG4基因的1号至8号外显子的全部或部分,或者,人VSIG4基因的2号至6号外显子的全部或部分;优选的,人VSIG4基因的1号外显子的部分、2号外显子至7号外显子的全部和8号外显子的部分,其中,1号外显子的部分至少包含10bp的核苷酸序列,8号外显子的部分至少包含100bp的核苷酸序列,或者,人VSIG4基因的2号外显子的部分、3号外显子至5号外显子的全部和6号外显子的部分,其中,2号外显子的部分至少包含100bp的核苷酸序列,6号外显子的部分至少包含5bp的核苷酸序列,进一步优选包含SEQ ID NO:5、30或31所示核苷酸序列;或者,包含与SEQ ID NO:5、30或31所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:5、30或31所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:5、30或31所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
11.根据权利要求10所述的靶向载体,其特征在于,所述的靶向载体还包含5’臂和/或3’臂,优选的,所述的5’臂与NCBI登录号为NC_000086.8至少具有90%同源性的核苷酸,进一步优选的,所述5’臂序列如SEQ ID NO:3、12、27或56所示,所述的3’臂与NCBI登录号为NC_000086.8至少具有90%同源性的核苷酸;进一步优选的,所述3’臂序列如SEQ ID NO:4、13、28或57所示。
12.一种非人动物的构建方法,其特征在于,所述的非人动物体内表达人或人源化VSIG4蛋白。
13.根据权利要求12所述的构建方法,其特征在于,所述人源化VSIG4蛋白为权利要求1-3任一项所述的人源化VSIG4蛋白。
14.根据权利要求12或13所述的构建方法,其特征在于,所述的非人动物的基因组中包含权利要求4所述的核酸或权利要求5-9任一项所述的人源化VSIG4基因。
15.根据权利要求12-14任一所述的构建方法,其特征在于,所述的构建方法包括将供体核苷酸序列导入非人动物VSIG4基因座上,优选的,所述的供体核苷酸序列包含下列组中的一种:
A)编码人或人源化VSIG4蛋白的核苷酸序列;
B)编码人VSIG4蛋白的胞外区、跨膜区、胞质区和/或信号肽的核苷酸序列的全部或部分,优选编码人VSIG4蛋白的胞外区的全部或部分核苷酸序列,优选编码人VSIG4蛋白的胞外区至少50个连续氨基酸的核苷酸序列;
C)人源化VSIG4基因的核苷酸序列;
D)人VSIG4基因的1号至8号外显子的全部或部分,或者,人VSIG4基因的2号至6号外显子的全部或部分;优选的,人VSIG4基因的1号外显子的部分、2号外显子至7号外显子的全部和8号外显子的部分,其中,1号外显子的部分至少包含10bp的核苷酸序列,8号外显子的部分至少包含100bp的核苷酸序列,或者,人VSIG4基因的2号外显子的部分、3号外显子至5号外显子的全部和6号外显子的部分,其中,2号外显子的部分至少包含100bp的核苷酸序列,6号外显子的部分至少包含5bp的核苷酸序列,进一步优选包含SEQ ID NO:5、30或31所示核苷酸序列;或者,包含与SEQ ID NO:5、30或31所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或者,包含与SEQ ID NO:5、30或31所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或者,包含具有SEQ ID NO:5、30或31所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;或,
E)从5’-3’包含P2A编码序列、人VSIG4的部分核苷酸序列、小鼠VSIG4部分序列和STOP序列,其中,所述的P2A编码序列包含SEQ ID NO:29所示核苷酸序列,所述人VSIG4的部分核苷酸序列包含SEQ ID NO:30或编码SEQ ID NO:2所示氨基酸的核苷酸序列,所述的小鼠VSIG4部分序列包含SEQ ID NO:31所示核苷酸序列,所述的STOP序列包含SEQ ID NO:32所示核苷酸序列。
16.根据权利要求15所述的构建方法,其特征在于,所述的供体核苷酸序列在非人动物中通过内源调控元件进行调控。
17.根据权利要求15-16任一项所述的构建方法,其特征在于,所述的导入非人动物VSIG4基因座包括替换非人动物相应区域,优选的,替换非人动物VSIG4基因的2号外显子至5号外显子的全部或部分,进一步优选地,非人动物的2号外显子的部分、3号外显子至4号外显子的全部和5号外显子的部分被替换。
18.根据权利要求15-16任一项所述的构建方法,其特征在于,所述的导入非人动物VSIG4基因座包括插入非人动物相应位点,优选的,插入位点位于非人动物2号外显子处。
19.根据权利要求12-18任一项所述的构建方法,其特征在于,使用权利要求10-11任一项所述的靶向载体进行非人动物的构建。
20.根据权利要求12-19任一项所述的构建方法,其特征在于,进一步包括将VSIG4基因人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物,优选的,所述的其他基因选自PD-1、PD-L1、IL4、IL4R、IL6、IL6R、IL17、IL7R、CCR5和CCR8中的至少一种。
21.一种细胞、组织或器官,其特征在于,所述的细胞、组织或器官表达权利要求1-3任一项所述的人源化VSIG4蛋白,或者,所述的细胞、组织或器官包含权利要求4所述的核酸或权利要求5-9任一项所述的人源化VSIG4基因,或者,权利要求12-20任一项所述的构建方法获得的非人动物。
22.一种荷瘤后的瘤组织,其特征在于,所述的瘤组织表达权利要求1-3任一项所述的人源化VSIG4蛋白,或者,所述的荷瘤后的瘤组织包含权利要求4所述的核酸或权利要求5-9任一项所述的人源化VSIG4基因,或者,权利要求12-20任一项所述的构建方法获得的非人动物。
23.一种权利要求1-3任一所述的人源化VSIG4蛋白、权利要求4所述的核酸、权利要求5-9任一所述的人源化VSIG4基因或权利要求12-20任一所述的构建方法获得的非人动物的应用,其特征在于,所述的应用包含:
A)涉及人类细胞的与VSIG4相关的免疫过程的产品开发中的应用;
B)作为药理学、免疫学、微生物学和医学研究的与VSIG4相关的模型系统中的应用;
C)涉及生产和利用动物实验疾病模型用于与VSIG4相关的病原学研究和/或用于开发诊断策略和/或用于开发治疗策略中的应用;
D)在体内研究人VSIG4信号通路调节剂的筛选、药效检测、评估疗效、验证或评价中的应用;或者,
E)研究VSIG4基因功能,研究针对人VSIG4靶位点的药物、药效,研究与VSIG4相关的免疫相关疾病药物以及抗肿瘤药物方面的应用。
CN202210622450.9A 2021-06-02 2022-06-02 Vsig4基因人源化非人动物的构建方法及应用 Pending CN115043929A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN2021106159897 2021-06-02
CN202110615989 2021-06-02
CN202111470150 2021-12-03
CN2021114701505 2021-12-03

Publications (1)

Publication Number Publication Date
CN115043929A true CN115043929A (zh) 2022-09-13

Family

ID=83158643

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210622450.9A Pending CN115043929A (zh) 2021-06-02 2022-06-02 Vsig4基因人源化非人动物的构建方法及应用

Country Status (2)

Country Link
CN (1) CN115043929A (zh)
WO (1) WO2022253322A1 (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107815466A (zh) * 2016-08-31 2018-03-20 北京百奥赛图基因生物技术有限公司 人源化基因改造动物模型的制备方法及应用
CN111808882A (zh) * 2020-09-01 2020-10-23 北京百奥赛图基因生物技术有限公司 Il7r基因人源化改造的动物模型的构建方法及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104046644A (zh) * 2013-03-14 2014-09-17 中国科学院上海生命科学研究院 人源化小鼠模型的构建方法和应用
WO2019072241A1 (en) * 2017-10-13 2019-04-18 Beijing Biocytogen Co., Ltd NON-HUMAN ANIMAL GENETICALLY MODIFIED WITH PD-1 HUMAN OR CHIMERIC

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107815466A (zh) * 2016-08-31 2018-03-20 北京百奥赛图基因生物技术有限公司 人源化基因改造动物模型的制备方法及应用
CN111808882A (zh) * 2020-09-01 2020-10-23 北京百奥赛图基因生物技术有限公司 Il7r基因人源化改造的动物模型的构建方法及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TAO XU等: "VSIG4 is highly expressed and correlated with poor prognosis of high-grade glioma patients", AM J TRANSL RES, vol. 7, no. 6, pages 1172 - 80, XP055772952 *
VOGT L.等: "登录号:NG_021306.1", GENBANK *

Also Published As

Publication number Publication date
WO2022253322A1 (en) 2022-12-08

Similar Documents

Publication Publication Date Title
CN108588126B (zh) Cd47基因人源化改造动物模型的制备方法及应用
US20220015343A1 (en) Genetically modified non-human animal with human or chimeric genes
CN111304246B (zh) 一种人源化细胞因子动物模型、制备方法及应用
CN112779285B (zh) 人源化il-10和il-10ra基因改造动物的构建方法和应用
CN111793646B (zh) Il1r1基因人源化改造的非人动物的构建方法及其应用
CN113429472B (zh) Cd94和nkg2a基因人源化的非人动物及其制备方法和应用
CN114277055A (zh) Il1b和il1a基因人源化的非人动物及其构建方法和应用
CN113429486A (zh) 基因修饰非人动物的构建方法及应用
CN113651892A (zh) Tlr8基因人源化的非人动物及其构建方法和应用
CN112300265B (zh) Il33基因人源化的非人动物的构建方法和应用
CN113881681B (zh) Ccr8基因人源化非人动物及其构建方法和应用
CN114751973B (zh) Siglec15基因人源化非人动物的构建方法和应用
CN108070614B (zh) 人源化基因改造动物模型的制备方法及应用
CN113046389B (zh) 一种ccr2基因人源化的非人动物及其构建方法和应用
CN112501205B (zh) Ceacam1基因人源化非人动物的构建方法及应用
CN112553252B (zh) Tnfr2基因人源化的非人动物的构建方法和应用
CN114134152A (zh) Glp1r基因人源化的非人动物及其构建方法和应用
CN115043929A (zh) Vsig4基因人源化非人动物的构建方法及应用
CN113461802A (zh) 一种cd276基因人源化的非人动物及其构建方法和应用
CN112553213A (zh) Cx3cr1基因人源化的非人动物及其构建方法和应用
CN114835798B (zh) Cd36基因人源化非人动物的构建方法及应用
CN113817770B (zh) Cd73基因人源化的非人动物的构建方法及应用
CN113388640B (zh) Ccr4基因人源化的非人动物及其构建方法和应用
CN114835799A (zh) Il1rap基因人源化非人动物的构建方法及应用
CN115260303A (zh) Cd70基因人源化非人动物的构建方法及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination