CN111304246B - 一种人源化细胞因子动物模型、制备方法及应用 - Google Patents

一种人源化细胞因子动物模型、制备方法及应用 Download PDF

Info

Publication number
CN111304246B
CN111304246B CN201911300689.9A CN201911300689A CN111304246B CN 111304246 B CN111304246 B CN 111304246B CN 201911300689 A CN201911300689 A CN 201911300689A CN 111304246 B CN111304246 B CN 111304246B
Authority
CN
China
Prior art keywords
gene
human
seq
humanized
human animal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911300689.9A
Other languages
English (en)
Other versions
CN111304246A (zh
Inventor
沈月雷
张美玲
姚佳维
郭朝设
郭雅南
白阳
黄蕤
赵磊
尚诚彰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baccetus Beijing Pharmaceutical Technology Co ltd
Biocytogen Jiangsu Gene Biotechnology Co ltd
Original Assignee
Baccetus Beijing Pharmaceutical Technology Co ltd
Biocytogen Jiangsu Gene Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baccetus Beijing Pharmaceutical Technology Co ltd, Biocytogen Jiangsu Gene Biotechnology Co ltd filed Critical Baccetus Beijing Pharmaceutical Technology Co ltd
Priority to CN201911300689.9A priority Critical patent/CN111304246B/zh
Publication of CN111304246A publication Critical patent/CN111304246A/zh
Application granted granted Critical
Publication of CN111304246B publication Critical patent/CN111304246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0276Knock-out vertebrates
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Knock-in vertebrates, e.g. humanised vertebrates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • C07K14/54Interleukins [IL]
    • C07K14/5412IL-6
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/715Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons
    • C07K14/7155Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons for interleukins [IL]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1136Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against growth factors, growth regulators, cytokines, lymphokines or hormones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • A01K2267/0325Animal model for autoimmune diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/035Animal model for multifactorial diseases
    • A01K2267/0368Animal model for inflammation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Veterinary Medicine (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Environmental Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Endocrinology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Diabetes (AREA)
  • Pathology (AREA)
  • Rheumatology (AREA)
  • Urology & Nephrology (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及一种人源化基因改造非人动物,具体涉及表达人源化IL‑6R和/或IL‑6蛋白的动物模型。在一些例子中,表达人源化IL‑6R和/或IL‑6的经遗传修饰的非人动物还有免疫缺陷表型,和/或含有IL3、GM‑CSF等更多细胞因子人源化。本发明还提供了上述包含IL‑6R和/或IL‑6基因修饰的人源化非人动物的构建方法及其在生物医药领域的应用。

Description

一种人源化细胞因子动物模型、制备方法及应用
技术领域
本申请涉及人源化基因改造动物模型的建立方法及应用,具体而言,涉及基于一种人源化IL-6R和/或IL-6基因改造动物模型的构建方法及其在生物医药领域的应用。
背景技术
实验动物疾病模型对于研究人类疾病发生的病因、发病机制、开发防治技术和开发药物是不可缺少的研究工具。但由于动物与人类的生理结构和代谢系统本身的差异,传统的动物模型并不能很好的反映人体的真实状况,在动物体内建立更接近人类的生理特征的疾病模型是生物医药行业的迫切需求。
随着基因工程技术的不断发展和成熟,用人类基因替代或置换动物的同源性基因已经实现,通过这种方式开发人源化实验动物模型(humanized animal model)是动物模型未来的发展方向。其中基因人源化动物模型,即,利用基因编辑技术,用人源正常或突变基因替换动物基因组的同源基因,可建立更接近人类生理或疾病特征的正常或突变基因动物模型。基因人源化动物不但本身具有重要应用价值,如通过基因人源化可改进和提升细胞或组织移植人源化动物模型,更重要的是,由于人类基因片段的插入,动物体内可表达或部分表达人源蛋白,可作为仅能识别人氨基酸序列的药物的靶点,为在动物水平进行抗人抗体及其它药物的筛选提供了可能。然而,由于动物与人类在生理学及病理学方面存在差异,加上基因(即遗传因子)的复杂性,如何能构建出“有效”的人源化动物模型用于新药研发仍是最大的挑战(Scheer N,Snaith M,Wolf CR,Seibler J.Generation and utility ofgenetically humanized mouse models,Drug Discov Today;18(23-24):1200-11,2013)。
细胞的分化、发育、增值乃至活化,均受到多个细胞因子信号的协同作用,其中白介素6(interkeukin6,IL6,IL-6)是一种多效细胞因子,可调节T细胞活化、分化,抑制T细胞凋亡;促进骨髓造血干细胞生长;增强血细胞分化;诱导B细胞分化、产生免疫球蛋白;促进肿瘤细胞生长、增殖和迁移等多种功能。IL-6既可由淋巴细胞(如,T细胞)分泌,也可以由非淋巴细胞分泌(如,成纤维细胞和内皮细胞等)。IL-6的受体是IL-6R,其可以在细胞膜经过蛋白质水解,形成可溶性IL-6R(sIL-6R),在人类中,也可以在翻译阶段进行剪接mRNA,进而产生sIL-6R。IL-6与IL-6R链或sIL-6R结合后,招募2个gp130并促使gp130二聚化,形成的复合物通过JAK启动下游通路,分别称为经典途径和反式途径。由于IL-6R仅表达在少数细胞表面,而sIL-6R广泛存在血清中,而gp130在体细胞中广泛表达,因此IL-6主要通过反式途径发挥作用。正常人血清中的IL-6浓度相对较低,在疾病环境中会迅速升高,例如,在自身免疫性疾病、感染及肿瘤等情况下会快速诱导和大量表达IL-6。国内外研究表明,IL-6介导的信号通路与多种疾病的发生、发展密切相关,包括乳腺癌、类风湿关节炎、系统性红斑狼疮、Castleman病、克罗恩病、肥胖和糖尿病。
鉴于IL-6在各种疾病过程中起重要作用,在治疗领域具有巨大应用价值,目前全球范围内已有3款针对IL-6通路的抗体药物上市,分别是ACTEMRA(tocilizumab,靶向IL-6R,2010年FDA批准,适应症包括类风湿性关节炎、巨细胞动脉炎、细胞因子释放综合征和幼儿及青年特发性关节炎)、SYLVANT(siltuximab,靶向IL-6,2014年FDA批准,用于治疗Castleman病)、KEVZARA(sarilumab,靶向IL-6R,2017年FDA批准,用于治疗成人中度至重度活动性类风湿性关节炎)。此外,还有近10个药物处于临床研究中,Informa数据库显示自2017年至今(2018年10月),新开展的靶向IL-6/IL-6R信号通路的临床研究超过40项,预计随着研究的不断深入,未来会有更多的机构和生物医药企业参与到针对IL-6/IL-6R通路的药物研发中来。
由于啮齿类如小鼠的IL-6蛋白与人IL-6蛋白在氨基酸序列上一致性(Identities)41%左右,IL-6R(Identities)53%,所以,一般情况下识别人IL-6或IL-6R蛋白的抗体,无法识别小鼠IL-6或IL-6R,即在IL-6和IL-6R靶点相关药物研发过程中,无法用普通小鼠来筛选和评价靶向人IL-6和IL-6R药物的药效。另外,在免疫缺陷小鼠如NOD-Prkdcscid IL-2rγnull小鼠中发现,尽管这类小鼠机体免疫功能严重缺陷,对人源细胞和组织几乎没有排斥反应,少量细胞即可成瘤(依赖于细胞系或细胞类型),同时也没有B淋巴细胞泄漏,是最适合人源细胞或组织移植的工具小鼠,并已广泛用于新的人源化小鼠模型研发,但由于鼠的细胞因子不能很好的作用于人的造血细胞,在移植人造血干细胞后,人源细胞的发育和功能上存有缺陷(Watanabe Yet al.,IntImmunol.2009Jul;21(7):843-58)。
鉴于IL-6和IL-6R在治疗领域具有巨大应用价值,且可以辅助改善在免疫缺陷小鼠体内移植人造血干细胞后人源免疫细胞的发育和功能完善,改进现有动物模型的不足,使临床前期的试验更有效,本领域急需开发新的动物模型。
发明内容
本发明的第一方面,涉及一种包含IL-6R基因修饰的人源化非人动物的构建方法,所述的人源化非人动物的基因组中包括人IL-6R基因的全部或部分核苷酸序列;该人源化非人动物体内表达人或人源化IL-6R蛋白。优选的,所述的内源IL-6R蛋白表达降低或缺失。
本发明的第二方面,涉及一种包含IL-6基因修饰的人源化非人动物的构建方法,所述的人源化非人动物的基因组中包括人IL-6基因的全部或部分核苷酸序列,该人源化非人动物表达人或人源化IL-6蛋白。优选的,所述的内源IL-6蛋白表达降低或缺失。
本发明的第三方面,涉及一种包含IL-6R和IL-6基因修饰的人源化非人动物的构建方法,所述的人源化非人动物的基因组中包括人IL-6R和IL-6基因,该人源化非人动物体内表达人或人源化IL-6R和IL-6蛋白。优选的,所述的内源IL-6R和IL-6蛋白表达降低或缺失。
优选的,所述的人IL-6R或IL-6基因通过内源性或外源性调控元件调控。
本发明使用基因编辑技术进行人源化非人动物的构建,所述基因编辑技术包括利用胚胎干细胞的基因打靶技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。
优选的,所述的人源化非人动物的基因组中包括人IL-6R基因的外显子1至外显子10的部分或全部编码序列,所述的人IL-6R基因通过内源性调控元件调控;该人源化非人动物体内表达人或人源化IL-6R蛋白。进一步优选的,所述的外显子1至外显子10的部分为至少30、60、90个与人IL6R基因的核苷酸序列相同,且人源化非人动物体内产生的IL6R蛋白可以结合靶向人特定抗原的抗体。
进一步优选的,所述的人源化非人动物的基因组中包括人IL-6R基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8、外显子9或外显子10的任一种或两种或三种以上的组合。所述的三种以上包括三种、四种、五种、六种、七种、八种、九种或十种。
再进一步优选的,所述的人源化非人动物的基因组中包括人IL-6R基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8、外显子9或外显子10的连续两个或连续三个以上外显子核苷酸序列的组合。所述的连续三个以上包括连续三个、连续四个、连续五个、连续六个、连续七个、连续八个、连续九个或连续十个。
在本发明的一个具体实施方式中,所述的人源化非人动物的基因组中包含人IL6R基因的外显子1的部分、外显子2的全部、外显子3的全部、外显子4的全部、外显子5的全部、外显子6的全部、外显子7的全部、外显子8的全部、外显子9的全部或外显子10的部分核苷酸序列,其中,所述的外显子1的部分为从外显子1的ATG编码序列开始,所述的外显子10的部分核苷酸序列为10号外显子编码序列至TAG。
本发明所述的人源化非人动物的构建方法,包括将人IL-6R基因的全部或部分核苷酸序列插入非人动物IL-6R基因座,或者将人IL-6R基因的全部或部分核苷酸序列替换非人动物IL-6R基因的相应区域,使得该非人动物表达人或人源化IL-6R蛋白。
优选的,所述的构建方法包括将编码人IL-6R蛋白的核苷酸序列插入非人动物IL-6R基因的起始密码子后,并使内源性IL-6R基因不表达或表达降低。
在本发明的一个具体实施方式中,所述的构建方法包括将编码人IL-6R蛋白的核苷酸序列插入非人动物IL-6R基因的外显子1,其中,插入的编码人IL-6R蛋白的核苷酸序列后还包括辅助序列。优选的,所述的辅助序列为WPRE和/或polyA。
在本发明的一个具体实施方式中,所述的构建方法包括使用靶向载体将编码人IL-6R蛋白的核苷酸序列和辅助序列的连接序列插入非人动物IL-6R基因的外显子1;所述的靶向载体包含插入的供体DNA序列,其编码供体转换区,所述的插入的供体DNA序列包含人IL-6R基因的全部或部分核苷酸序列。
优选的,所述的人源化非人动物的基因组中包括嵌合IL-6R基因,所述的嵌合IL-6R基因编码人IL-6R蛋白,所述的嵌合IL-6R基因的核苷酸序列选自:
a)与SEQ ID NO:65所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
b)来源于人IL-6R基因的部分与SEQ ID NO:65第1-1407位所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
c)来源于人IL-6R基因的部分具有SEQ ID NO:65第1-1407位所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
d)来源于人IL-6R基因的部分为与SEQ ID NO:61所示的核苷酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
e)来源于人IL-6R基因的部分为与SEQ ID NO:61第438-1844位所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
f)来源于人IL-6R基因的部分为具有SEQ ID NO:61第438-1844位所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述非人动物为小鼠,所述小鼠IL-6R的mRNA序列的全部或部分片段如SEQ ID NO:59中的全部或部分片段所示,所述小鼠IL-6R的蛋白序列的全部或部分片段如SEQ ID NO:60中的全部或部分片段所示。
在本发明的另一个具体实施方式中,所述人IL-6R的mRNA序列的全部或部分片段如SEQ ID NO:61中的全部或部分片段所示,所述人IL-6R的蛋白序列的全部或部分片段如SEQ ID NO:62中的全部或部分片段所示。
优选的,所述的人源化非人动物的基因组中包括人IL-6基因的至少从外显子1的起始密码子至外显子5的终止密码子的部分或全部核苷酸序列,所述的人IL-6基因长度至少4.7kb,其中,所述的人IL-6基因通过内源性调控元件调控;进一步优选的,所述的人IL-6基因长度至少12.7kb。优选的,所述的人IL-6基因通过人源的调控元件调控。
本发明所述的人源化非人动物的构建方法包括将人IL-6基因的全部或部分核苷酸序列插入非人动物IL-6基因座,或者将人IL-6基因的全部或部分核苷酸序列替换非人动物IL-6基因的相应区域,使得该非人动物表达人IL-6蛋白;优选的,所述的构建方法包括将人IL-6基因的至少从外显子1的起始密码子至外显子5的终止密码子的部分或全部核苷酸序列替换非人动物IL-6基因的相应区域。
所述的构建方法包括利用基因编辑技术,使用靶向载体将人IL-6基因的至少从外显子1的起始密码子至外显子5的终止密码子的部分或全部核苷酸序列替换非人动物IL-6基因的相应区域;所述的靶向载体包含替换的供体DNA序列,其编码供体转换区,所述的替换的供体DNA序列包含人IL-6基因的至少从外显子1的起始密码子至外显子5的终止密码子的部分或全部序列。
所述的构建方法包括基于CRISPR/Cas9技术,使用sgRNA靶向序列将人IL-6基因的至少从外显子1的起始密码子至外显子5的终止密码子的部分或全部核苷酸序列替换非人动物IL-6基因的相应区域;
所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO:22-28任一项所示,3’端靶位点序列如SEQ ID NO:29-36任一项所示;更优选的,使用的sgRNA靶位点序列为SEQ ID NO:26和/或SEQ ID NO:34。
本发明所述的人源化非人动物的基因组中包含嵌合IL-6基因,所述的嵌合IL-6基因编码人或人源化IL-6蛋白。优选的,所述的嵌合IL-6基因的核苷酸序列选自:
a)转录的mRNA序列与SEQ ID NO:49或SEQ ID NO:50所示的核苷酸序列的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
b)转录的mRNA序列与SEQ ID NO:49或SEQ ID NO:50所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
c)转录的mRNA序列具有SEQ ID NO:49或SEQ ID NO:50所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
d)序列中来源于人IL-6基因的部分为与SEQ ID NO:5或SEQ ID NO:7或SEQ IDNO:11或SEQ ID NO:48所示的核苷酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
e)来源于人IL-6基因的部分为与SEQ ID NO:5或SEQ ID NO:7或SEQ ID NO:11或SEQ ID NO:48所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
f)来源于人IL-6基因的部分为具有SEQ ID NO:5或SEQ ID NO:7或SEQ ID NO:11或SEQ ID NO:48所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
本发明的第四方面,涉及一种采用包含上述IL-6R和/或IL-6基因修饰的人源化非人动物的构建方法构建的IL-6R和/或IL-6基因修饰的人源化非人动物或其后代。
本发明的第五方面,涉及一种IL-6基因敲除非人动物的构建方法,具体为将非人动物IL-6基因的外显子1至外显子5全部或部分敲除,使得内源IL-6蛋白失活。
优选的,使用sgRNA序列靶向的5’端靶位点如SEQ ID NO:22-28任一项所示,3’端靶位点的序列如SEQ ID NO:29-36任一项所示;进一步优选的,使用的sgRNA靶位点序列为SEQ ID NO:26和/或SEQ ID NO:34。
本发明的第六方面,涉及一种IL-6R基因的靶向载体,所述的靶向载体包含插入的供体DNA序列,其编码供体转换区,所述的插入的供体DNA序列包含人IL-6R基因的全部或部分核苷酸序列。
优选的,所述的靶向载体包含与待改变的转换区5’端同源的DNA片段,即5’臂,其选自与NCBI登录号为NC_000069.6至少具有90%同源性的核苷酸。进一步优选的,所述5’臂核苷酸序列如SEQ ID NO:63所示。
优选的,所述的靶向载体包含与待改变的转换区3’端同源的第二个DNA片段,即3’臂,其选自NCBI登录号为NC_000069.6至少具有90%同源性的核苷酸。进一步优选的,所述3’臂核苷酸序列如SEQ ID NO:64所示。
优选的,所述的插入的供体DNA序列如SEQ ID NO:65所示。
优选的,所述的待改变的转换区位于Il-6R基因的外显子1至外显子10。
本发明的第七方面,涉及一种IL-6基因的靶向载体,所述的靶向载体包含替换的供体DNA序列,其编码供体转换区,所述的替换的供体DNA序列包含人IL-6基因的全部或部分核苷酸序列。优选的,所述的替换的供体DNA序列包含人IL-6基因的至少从外显子1的起始密码子至外显子5的终止密码子的部分或全部核苷酸序列,所述的人IL-6基因长度至少4.7kb。进一步优选的,所述的人IL-6基因长度至少12.7kb。
优选的,所述的靶向载体包含与待改变的转换区5’端同源的DNA片段,即5’臂,其选自与NCBI登录号为NC_000071.6至少具有90%同源性的核苷酸。进一步优选的,所述5’臂核苷酸序列如SEQ ID NO:9所示。
优选的,所述的靶向载体包含与待改变的转换区3’端同源的第二个DNA片段,即3’臂,其选自NCBI登录号为NC_000071.6至少具有90%同源性的核苷酸。进一步优选的,所述3’臂核苷酸序列如SEQ ID NO:10所示。优选的,所述的插入的供体DNA序列如SEQ ID NO:11所示。
优选的,所述的靶向载体包含与待改变的转换区5’端同源的DNA片段,即5’臂,其选自与NCBI登录号为NC_000071.6至少具有90%同源性的核苷酸。进一步优选的,所述5’臂核苷酸序列如SEQ ID NO:46所示。
优选的,所述的靶向载体包含与待改变的转换区3’端同源的第二个DNA片段,即3’臂,其选自NCBI登录号为NC_000071.6至少具有90%同源性的核苷酸。进一步优选的,所述3’臂核苷酸序列如SEQ ID NO:47所示。优选的,所述的插入的供体DNA序列如SEQ ID NO:48所示。
优选的,所述的待改变的转换区位于IL-6基因至少从外显子1的起始密码子至外显子5的终止密码子的核苷酸序列。
本发明所述的IL-6基因或IL-6R基因的靶向载体还包括可选择的基因标记。
优选的,所述标记基因为负筛选标记的编码基因。进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。
优选的,所述靶向载体还包括阳性克隆筛选的抗性基因。进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。
优选的,所述靶向载体还包括特异性重组系统。进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统)。所述的特异性重组系统为2个,分别装在抗性基因的两侧。
本发明的第八方面,涉及一种特异的靶向IL-6基因的sgRNA序列,所述的sgRNA序列在非人动物IL-6基因的靶位点位于非人动物IL-6基因的外显子1和/或外显子5上;所述的sgRNA序列的靶向的5’端靶位点序列如SEQ ID NO:22-28任一项所示,3’端靶位点序列如SEQ ID NO:29-36任一项所示;优选的,sgRNA序列的靶向的5’端靶位点序列为SEQ ID NO:26,sgRNA序列的靶向的3’端靶位点序列为SEQ ID NO:34。
本发明的第九方面,涉及一种编码上述sgRNA序列的DNA分子。
本发明的第十方面,涉及一种构建人源化非人动物的载体,所述的载体包含特异的靶向IL-6基因的sgRNA序列。所述的载体用于敲除或替换IL-6基因的至少从外显子1的起始密码子至外显子5的终止密码子的部分或全部核苷酸序列。
本发明的第十一方面,涉及所述构建人源化非人动物的载体的制备方法,包括如下步骤:
1)将序列如SEQ ID NO:22-28所示的任一项sgRNA靶序列和/或SEQ ID NO:29-36所示的任一项sgRNA靶序列,制备获得正向寡核苷酸序列和反向寡核苷酸序列;
2)合成含有T7启动子及sgRNA scaffold的片段DNA,将上述片段依次通过EcoRI和BamHI酶切连接至骨架载体pHSG299上,经测序验证,获得pT7-sgRNAG2载体;
3)分别合成步骤1)中所述的正向寡核苷酸和反向寡核苷酸,将合成的sgRNA寡聚核苷酸变性、退火,形成可以连入步骤2)所述的pT7-sgRNAG2载体的双链;
4)将步骤3)中退火的双链sgRNA寡聚核苷酸分别与pT7-sgRNAG2载体进行链接,筛选获得sgRNA载体。
本发明的第十二方面,涉及一种IL-6基因敲除非人动物的制备方法,包括如下步骤:
a)按照上述制备sgRNA载体的方法步骤1)-4),获得sgRNA载体;
b)将sgRNA载体的体外转录产物和Cas9 mRNA进行混合,获得混合液,将混合液注射至小鼠受精卵细胞质或细胞核中,将注射后的受精卵转移至培养液中进行培养,然后移植至受体母鼠的输卵管中发育,得到F0代小鼠;
c)将F0代小鼠利用PCR技术进行检验,验证细胞中的IL-6基因被敲除,获得IL-6基基因敲除阳性小鼠;
d)将步骤c)筛选的阳性小鼠通过杂交和自交的方式,扩大种群数量,建立稳定的IL-6基因敲除小鼠。
优选的,所述步骤c)中验证细胞中的IL-6基因是否被敲除的PCR引物如SEQ IDNO:68和/或SEQ ID NO:69。
本发明的第十三方面,涉及一种IL-6基因人源化非人动物的制备方法,包括如下步骤:
第一步:按照上述制备sgRNA载体的步骤1)-4),获得sgRNA载体;
第二步:将sgRNA载体的体外转录产物、上述的IL-6基因的靶向载体和Cas9mRNA进行混合,将混合液注射至雌性动物受精卵细胞质或细胞核中,将注射后的受精卵转移至培养液中进行培养,然后移植至受体动物的输卵管中发育,得到F0代动物;
第三步:将F0代动物利用PCR技术进行检验,验证细胞中的IL-6基因人源化非人动物。
本发明的第十四方面,涉及一种本发明所述的靶向载体、本发明所述的sgRNA序列或本发明所述的载体在靶向IL-6和/或IL-6R基因中的应用。
本发明的第十五方面,涉及一种包含IL-6R基因的人源化细胞株,所述的人源化细胞株的基因组中包括人IL-6R基因的全部或部分核苷酸序列,该人源化细胞株表达人或人源化IL-6R蛋白。优选的,所述的内源IL-6R蛋白表达降低或缺失。优选的,所述的人IL-6R基因通过内源性或外源性调控元件调控。
优选的,所述的人源化细胞株的基因组中包括人IL-6R基因的外显子1至外显子10的部分或全部编码序列,所述的人IL-6R基因通过内源性调控元件调控;该人源化细胞株表达人或人源化IL-6R蛋白。
本发明的第十六方面,涉及一种包含IL-6基因的人源化细胞株,所述的人源化细胞株的基因组中包括人IL-6基因的全部或部分核苷酸序列,该人源化细胞株表达人或人源化IL-6蛋白。优选的,所述的内源IL-6蛋白表达降低或缺失。
优选的,所述的人源化细胞株的基因组中包括人IL-6基因的至少从外显子1的起始密码子至外显子5的终止密码子的部分或全部核苷酸序列,所述的人IL-6基因长度至少4.7kb或至少12.7kb;优选的,所述的人IL-6基因通过内源性调控元件或外源的调控元件调控。
本发明的第十七方面,涉及一种IL-6基因缺失细胞株,所述的基因缺失细胞株基因组中的IL-6基因被敲除,该基因缺失细胞株不表达IL-6蛋白。
本发明的第十八方面,涉及一种包含IL-6基因人源化和IL-6R基因人源化的非人动物的制备方法,包括将所述的IL-6基因修饰人源化非人动物或本发明制备的IL-6基因修饰人源化非人动物与所述的IL-6R基因修饰的人源化非人动物或本发明制备的IL-6R基因修饰的人源化非人动物交配、体外授精或直接进行基因编辑,并进行筛选,得到包含IL-6基因人源化和IL-6R基因人源化的非人动物。
本发明的第十九方面,涉及一种制备多基因人源化非人动物的方法,包括如下步骤:
(a)制备本发明所述的IL-6基因修饰的人源化非人动物、所述的IL-6R基因修饰的人源化非人动物或所述的包含IL-6基因人源化和IL-6R基因人源化的非人动物;
(b)将步骤(a)制备获得的非人动物与其他基因人源化动物交配、体外授精或直接进行基因编辑,并进行筛选,得到多基因人源化非人动物。
优选的,所述多基因人源化非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物、六基因人源化非人动物、七基因人源化非人动物、八基因人源化非人动物或九基因人源化非人动物。
优选的,所述的其他人源化动物选自基因IL3、GM-CSF、M-SCF、TPO、IL-4、PD-1(201710505554.0,PCT/CN2017/090320)、PD-L1(201710757022.6,PCT/CN2017/099574)、CTLA-4(201710757917.X,PCT/CN2017/099577)、LAG-3(201711103245.7,PCT/CN2017/110435)、BTLA(201710948551.4,PCT/CN2017/106024)、CD27(201711402264.X,PCT/CN2017/117984)、CD28(201710465217.3)、CD40(201710464564.4,201710872886.2)、CD47(201810295709.7,PCT/CN2018/081628)、CD137(201711473251.1,PCT/CN2017/120388)、CD154(201710464564.4,201710872886.2)、OX40(201710757005.2,PCT/CN2017/099575)、SIRPα(201810296193.8,PCT/CN2018/081629)、TIGIT(201710757916.5,PCT/CN2017/099576)、TIM-3(201711103773.2,PCT/CN2017/110494)或GITR(201710465493.X,201710872122.3)人源化动物中的一种或两种以上的组合。
本发明的第二十方面,涉及一种本发明所述的方法制备获得的多基因人源化非人动物或其后代。
本发明的第二十一方面,涉及一种荷瘤动物模型或一种荷瘤动物模型的制备方法,所述的制备方法包括通过本发明任一所述的方法制备非人动物。
优选的,所述的荷瘤动物模型的制备方法还包括在上述方法制备的非人动物或其后代植入肿瘤细胞的步骤。
本发明的第二十二方面,涉及一种炎症动物模型,所述的炎症动物模型的制备方法包括通过本发明任一所述的方法制备非人动物的步骤。
在本发明的一个具体实施方式中,所述的炎性动物模型为胶原诱导性关节炎动物模型。
本发明的第二十三方面,涉及一种细胞或细胞系或原代细胞培养物,所述细胞或细胞系或原代细胞培养物来源于上述的IL-6基因修饰人源化非人动物、上述的IL-6R基因修饰人源化非人动物、包含IL-6基因和IL-6R基因修饰的人源化的非人动物、上述的多基因人源化非人动物或其后代、上述的荷瘤动物模型或所述的炎症动物模型。
本发明的第二十四方面,涉及一种组织或器官或其培养物,所述组织或器官或其培养物来源于上述的IL-6基因修饰人源化非人动物、上述的IL-6R基因修饰人源化非人动物、包含IL-6基因和IL-6R基因修饰的人源化的非人动物、上述的多基因人源化非人动物或其后代、上述的荷瘤动物模型或所述的炎症动物模型。
本发明的第二十五方面,涉及一种嵌合IL-6R基因,所述的嵌合IL-6R基因编码人或人源化IL-6R蛋白,所述的嵌合IL-6R基因的核苷酸序列选自下列组中的一种:
a)与SEQ ID NO:65所示的核苷酸序列的部分或全部的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
b)在严格条件下,与SEQ ID NO:65所示的核苷酸序列杂交;
c)来源于人IL-6R基因的部分与SEQ ID NO:65第1-1407位所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
d)来源于人IL-6R基因的部分具有SEQ ID NO:65第1-1407位所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或,
e)编码的氨基酸序列为SEQ ID NO:62所述氨基酸序列的部分或全部;
f)编码的氨基酸序列与SEQ ID NO:62所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
g)编码的氨基酸序列与SEQ ID NO:62所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
h)编码的氨基酸序列具有SEQ ID NO:62所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列;
或,
i)来源于人IL-6R基因的部分为SEQ ID NO:61所示序列的部分或全部;
j)来源于人IL-6R基因的部分为与SEQ ID NO:61第438-1844位所示的核苷酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
k)来源于人IL-6R基因的部分在严格条件下,与SEQ ID NO:61所示的核苷酸序列杂交;
l)来源于人IL-6R基因的部分为与SEQ ID NO:61第438-1844位所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
m)来源于人IL-6R基因的部分为具有SEQ ID NO:61第438-1844位所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
本发明的第二十六方面,涉及一种嵌合IL-6基因,所述的嵌合IL-6基因编码人或人源化IL-6蛋白,所述的嵌合IL-6基因的核苷酸序列选自下列组中的一种:
a)转录的mRNA序列为SEQ ID NO:49或SEQ ID NO:50所示的序列的部分或全部;
b)转录的mRNA序列与SEQ ID NO:49或SEQ ID NO:50所示的核苷酸序列的部分或全部的同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)转录的mRNA序列在严格条件下,与SEQ ID NO:49或SEQ ID NO:50所示的核苷酸序列杂交;
d)转录的mRNA序列与SEQ ID NO:49或SEQ ID NO:50所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
e)转录的mRNA序列具有SEQ ID NO:49或SEQ ID NO:50所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或,
f)编码的氨基酸序列为SEQ ID NO:6或SEQ ID NO:8所述氨基酸序列的部分或全部;
g)编码的氨基酸序列与SEQ ID NO:6或SEQ ID NO:8所示氨基酸的序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
h)编码的氨基酸序列与SEQ ID NO:6或SEQ ID NO:8所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
i)编码的氨基酸序列具有SEQ ID NO:6或SEQ ID NO:8所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列;
或,
j)来源于人IL-6基因的部分为SEQ ID NO:5或SEQ ID NO:7或SEQ ID NO:11或SEQID NO:48所示序列的部分或全部;
k)来源于人IL-6基因的部分为与SEQ ID NO:5或SEQ ID NO:7或SEQ ID NO:11或SEQ ID NO:48所示的核苷酸序列同一性至少为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
l)来源于人IL-6基因的部分在严格条件下,与SEQ ID NO:5或SEQ ID NO:7或SEQID NO:11或SEQ ID NO:48所示的核苷酸序列杂交;
m)来源于人IL-6基因的部分为与SEQ ID NO:5或SEQ ID NO:7或SEQ ID NO:11或SEQ ID NO:48所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
n)来源于人IL-6基因的部分为具有SEQ ID NO:5或SEQ ID NO:7或SEQ ID NO:11或SEQ ID NO:48所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
本发明的第二十七方面,涉及一种包含上述的嵌合IL-6基因和/或上述的嵌合IL-6R基因的构建体。
本发明的第二十八方面,涉及一种包含上述构建体的细胞。
本发明的第二十九方面,涉及一种包含上述细胞的组织。
优选的,本发明所述非人动物为啮齿类动物;进一步优选的,所述啮齿类动物为大鼠或小鼠。
本发明的第三十方面,涉及一种免疫系统重建的方法,包括:
a)制备本发明所述的IL-6基因修饰的人源化非人动物、IL-6R基因修饰的人源化非人动物、包含IL-6和IL-6R基因修饰的人源化非人动物或多基因人源化非人动物;
b)向步骤a)获得的任一人源化非人动物移植人免疫细胞,获得人免疫系统重建的人源化非人动物。优选的,所述的人免疫细胞包括但不限于CD34+或PBMC。
本发明的第三十一方面,涉及一种自身免疫疾病动物模型的构建方法,所述的方法包括如下步骤:
1)利用本发明任一所述的方法制备非人动物,或者,选择本发明所述的非人动物;
2)用免疫诱导剂免疫步骤1)所述的非人动物,构建所述自身免疫疾病动物模型。
优选的,所述的自身免疫疾病选自多发性硬化症疾病、哮喘、过敏或自身免疫性脑脊髓炎。
优选的,所述的步骤2)中免疫诱导剂为脑或脊髓组织匀浆、髓鞘碱性蛋白或髓磷脂少突胶质细胞糖蛋白(MOG)。
在本发明的一个具体实施方式中,所述的步骤2)中免疫诱导剂为MOG。
优选的,所述的自身免疫疾病动物模型的构建方法,为开放血脑屏障和调动免疫反应,步骤2)之后还包括增强免疫的步骤。
在本发明的一个具体实施方式中,所述的增强免疫为向非人动物注射百日咳毒素(PTX)。
本发明的第三十二方面,涉及来源于上述的IL-6基因修饰的人源化非人动物、上述的IL-6R基因修饰的人源化非人动物、上述的包含IL-6和IL-6R基因修饰的人源化的非人动物、上述的多基因人源化非人动物或其后代、上述的荷瘤动物模型或炎症动物模型、上述的方法获得的人免疫系统重建的人源化非人动物或者上述的构建方法获得的自身免疫疾病动物模型在需要涉及人类细胞的免疫过程的产品开发,制造人类抗体,或者作为药理学、免疫学、微生物学和医学研究的模型系统中的应用;或在生产和利用动物实验疾病模型,用于病原学研究和/或用于开发新的诊断策略和/或治疗策略中的应用;或在筛选、验证、评价或研究IL-6R和/或IL-6基因功能、IL-6R和/或IL-6抗体、针对IL-6R和/或IL-6靶位点的药物、药效研究,免疫相关疾病药物以及抗肿瘤或抗炎症药物,筛选和评估人用药及药效研究方面的用途。
本发明的第三十三方面,涉及来源于上述的IL-6基因修饰的人源化非人动物、上述的IL-6R基因修饰的人源化非人动物、上述的包含IL-6和IL-6R基因修饰的人源化的非人动物、上述的多基因人源化非人动物或其后代在制备荷瘤动物模型和/或炎性动物模型中的应用。
本发明所述的“人源化IL-6蛋白”,包含来源于人IL-6蛋白的部分和非人动物IL-6蛋白的部分,其中,所述的“人IL-6蛋白”为人IL-6蛋白的全长氨基酸序列。
本发明所述的“人源化IL-6R蛋白”包含来源于人IL-6R蛋白的部分和非人动物IL-6R蛋白的部分,其中,所述的“人IL-6R蛋白”为人IL-6R蛋白的全长氨基酸序列。
本发明所述的“嵌合IL-6基因”,包含来源于人IL-6基因的部分和非人动物IL-6基因的部分,其中,所述的“人IL-6基因”为人IL-6基因的全长核苷酸序列。
本发明所述的“嵌合IL-6R基因”,包含来源于人IL-6R基因的部分和非人动物IL-6R基因的部分,其中,所述的“人IL-6R基因”为人IL-6R基因的全长核苷酸序列。
本发明所述的“部分或全部”,“全部”为整体;“部分”为整体中的局部,或者整体中的个体。例如,“外显子1至外显子10的全部”为整体,即外显子1至外显子10的全部核苷酸序列;“外显子1至外显子10的部分”为整体的局部或整体的个体,即外显子1至外显子10中的一个或两个以上连续或间隔的核苷酸序列。
本发明所述的“连续两个或连续三个以上外显子”是指例如外显子1、2,外显子2、3,外显子1、2、3,外显子2、3、4,以及连续4个、5个、6个、7个、8个、9个或10个连续外显子。
本发明所述“同源性”,是指在使用蛋白序列或核苷酸序列的方面,本领域技术人员可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。
本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:Molecular Cloning A Laboratory Manual,2ndEd.,ed.By Sambrook,FritschandManiatis(Cold Spring Harbor Laboratory Press:1989);DNA Cloning,Volumes I and II(D.N.Glovered.,1985);Oligonucleotide Synthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelsonand M.Simon,eds.-in-chief,Academic Press,Inc.,New York),specifically,Vols.154and 155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,ed.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods InCell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook Of Experimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);and Manipulating the Mouse Embryo,(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1986)。
在一个方面,所述非人动物是哺乳动物。在一个方面,所述非人动物是小型哺乳动物,例如跳鼠科或鼠总科超家族。在一个实施方式中,所述基因修饰的动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。
在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠及NOD、NOD/SCID、NOD-Prkdcscid IL-2rgnull背景的小鼠。以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:小鼠和人IL-6基因对比示意图(非按比例),其中,图A:鼠转录本NM_031168.2(SEQ ID NO:1)及其编码蛋白NP_112445.1(SEQ ID NO:2),图1B:鼠转录本NM_001314054.1(SEQ ID NO:3)及其编码蛋白NP_001300983.1(SEQ ID NO:4),图1C:人转录本NM_000600.4(SEQ ID NO:5)及其编码蛋白NP_000591.1(SEQ ID NO:6),图1D:人转录本NM_001318095.1(SEQ ID NO:7)及其编码蛋白NP_001305024.1(SEQ ID NO:8);
图2:人源化小鼠IL-6基因示意图(非按比例);
图3:人源化小鼠IL-6基因示意图(非按比例);
图4:为制备图2所示人源化小鼠的打靶策略示意图(非按比例);
图5:CRE重组过程示意图(非按比例);
图6:为制备图3所示人源化小鼠的打靶策略示意图(非按比例);
图7:sgRNA活性检测结果,其中Con.为阴性对照,PC为阳性对照,(A)为5’端sgRNA活性检测结果,(B)为3’端sgRNA活性检测结果;
图8:F0代鼠尾PCR鉴定结果,其中,图(A)使用引物对L-GT-F1和L-GT-R用于扩增5’端靶位点基因片段;图(B)使用引物对R-GT-F和R-GT-R用于扩增3’端靶位点基因片段;其中,WT为野生型,H2O为水对照,M为Marker,+为阳性对照;
图9:F1代鼠尾PCR鉴定结果,其中,图(A)使用引物对L-GT-F1和L-GT-R用于扩增5’端靶位点基因片段;图(B)使用引物对R-GT-F和R-GT-R用于扩增3’端靶位点基因片段;其中,WT为野生型,H2O为水对照,M为Marker,+为阳性对照;
图10:Southern blot结果,其中(A)中F1-026、F1-027、F1-029、F1-030、F1-032、F1-044、F1-045、F1-046、F1-047、F1-050、F1-052为小鼠编号;(B)中F1-022、F1-023、F1-025、F1-056为小鼠编号;
图11:ELISA检测鼠和人IL-6蛋白表达的结果,其中,+/+代表B-NDG小鼠,h/+代表B-NDG背景人源化IL-6小鼠杂合子;
图12:基因敲除小鼠鼠尾PCR鉴定结果,其中WT为野生型对照,H2O为水对照,M为Marker;图13:小鼠和人IL-6R基因对比示意图(非按比例);
图14:人源化小鼠IL-6R基因示意图(非按比例);
图15:人源化小鼠IL-6R基因的打靶策略示意图(非按比例);
图16:ELISA检测鼠和人IL-6蛋白表达的结果,其中+/+代表C57BL/6小鼠,H/H代表图2所示打靶策略的人源化IL-6小鼠纯合子,其中图A为鼠IL-6的检测结果,图B为人IL-6的检测结果;
图17:Southern blot结果,其中1-G01、1-H01为细胞克隆编号,WT为野生型对照;
图18:FLP重组过程示意图(非按比例);
图19:F1代IL-6R人源化小鼠鼠尾PCR鉴定结果,其中,图(A)使用引物对IL-6R-WT-F和IL-6R-WT-R用于扩增野生型条带靶位点基因片段;图(B)使用引物对IL-6R-WT-F和IL-6R-Mut-R用于扩增重组后条带5’端靶位点基因片段;图(C)使用引物对IL-6R-Frt-F和IL-6R-Frt-R用于扩增去抗性基因后3’端靶位点基因片段;图(D)使用引物对IL-6R-Flp-F和IL-6R-Flp-R用于扩增确认Flp的存在;其中,WT为野生型,H2O为水对照,M为Marker,PC为阳性对照;
图20:流式分析结果,其中,图A、C为C57BL/6野生型鼠(WT)检测结果,图B、D为人源化IL-6R鼠纯合子(IL-6R H/H)检测结果,分别使用mIL-6R-PE(图A、B)或hIL-6R-PE(图C、D)和mTcRβ-APC/Cy7进行细胞标记,流式检测IL-6R蛋白表达;
图21:ELISA检测鼠和人IL-6蛋白表达的结果,其中WT代表C57BL/6野生型鼠,IL-6H/HIL-6RH/H代表C57BL/6背景人源化IL-6/IL-6R双基因小鼠纯合子;
图22:流式分析结果,其中,图A、C为C57BL/6野生型鼠(WT)检测结果,图B、D为人源化IL-6/IL-6R双基因小鼠纯合子(IL-6H/H/IL-6RH/H)检测结果,分别使用mIL-6R PE(图A、B)或hIL-6R PE(图C、D)和mTcRβ-APC/Cy7进行细胞标记,流式检测IL-6R蛋白表达。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
在下述每一实施例中,设备和材料是从以下所指出的几家公司获得:
ScaI,HindIII,SpeI,BglII,EcoRI,BamHI,SspI和EcoRV酶购自NEB,货号分别为:R3122M,R3104M,R0133M,R0144M,R3101M,R3136M,R3132M和R3195M;C57BL/6小鼠购自中国食品药品检定研究院国家啮齿类实验动物种子中心;
NOD-Prkdcscid IL-2rgnull(B-NDG)小鼠来源北京百奥赛图基因生物技术有限公司,货号B-CM-001;
Cre工具鼠来源北京百奥赛图基因生物技术有限公司,货号B-EM-045;
NOD/scid小鼠购自北京华阜康生物科技股份有限公司;
UCA试剂盒来源百奥赛图公司,货号为BCG-DX-001;
小鼠结肠癌细胞MC38购自上海酶研生物技术有限公司;
MEGAshortscriptTMKit(Ambion体外转录试剂盒)购自Thermo Fisher,货号为AM1354;
Cas9mRNA来源SIGMA,货号CAS9MRNA-1EA;
LEGEND MAXTMMouse IL-6ELISA Kit with Pre-coated Plates(小鼠IL.6试剂盒)购自Biolegend,货号431307;
LEGEND MAX Human IL-6ELISA Kit with Pre-coated Plates(人IL-6试剂盒)购自Biolegend,货号430507;
PrimeScriptTM1st strand cDNA Synthesis Kit购自TAKARA,货号6110A;
RNAprep pure Cell/Bacteria Kit(培养细胞/细菌总RNA提取试剂盒)购自天根生化,货号DP430;
APC/Cy7 anti-mouse TCRβchain Antibody(mTcRβ-APC/Cy7)购自Biolegend,货号为:109220;
PE anti-mouse CD126(IL-6Rαchain)Antibody(mIL-6R PE)购自Biolegend,货号为:115805;
PE anti-human CD126(IL-6Rα)Antibody(hIL-6R PE)购自Biolegend,货号为:352803;
hIgG1/kappa购自CrownBio,货号是C0001-3。
实施例1 IL-6基因人源化小鼠
小鼠IL-6基因(NCBI Gene ID:16193,Primary source:MGI:96559,UniProt ID:P08505,位于5号染色体NC_000071.6的第30013114至30019975位)和人IL-6基因(NCBIGene ID:3569,Primary source:HGNC:6018,UniProt ID:P05231,位于7号染色体NC_000007.14的第22725889至22732002位),鉴于人IL-6和小鼠IL-6具有多种亚型或转录本,如图1所示的基因示意图展示了包括图1A:鼠转录本NM_031168.2(SEQ ID NO:1)及其编码蛋白NP_112445.1(SEQ ID NO:2)、图1B:鼠转录本NM_001314054.1(SEQ ID NO:3)及其编码蛋白NP_001300983.1(SEQ ID NO:4)、图1C:人转录本NM_000600.4(SEQ ID NO:5)及其编码蛋白NP_000591.1(SEQ ID NO:6)、图1D:人转录本NM_001318095.1(SEQ ID NO:7)及其编码蛋白NP_001305024.1(SEQ ID NO:8)。
为了达到本发明的目的,可在内源小鼠IL-6基因座引入编码人IL-6蛋白的基因序列,使得该小鼠表达人IL-6蛋白。用基因编辑技术对小鼠细胞进行修饰,在内源小鼠IL-6基因座上用人IL-6基因序列替换特定小鼠IL-6基因序列,在小鼠或人IL-6调节元件的控制下,如将至少包含小鼠ATG至TGA的约6.2kb序列用对应的人DNA序列替换,得到人源化IL-6基因序列,实现对小鼠IL-6基因不同程度的人源化改造。其中一种较大范围的人源化序列替换策略得到的人源化IL-6基因序列示意图如图2所示,另一种IL-6小鼠人源化策略是在IL-6基因座附近进行较小范围的序列替换,得到的小鼠人源化IL-6基因序列示意图如图3所示(后续实施例中将以鼠转录本NM_031168.2→NP_112445.1和人转录本NM_000600.4→NP_000591.1及人转录本NM_001318095.1→NP_001305024.1为例)。
如图4所示的打靶策略示意图中,显示了靶向载体上含有小鼠IL-6上游和下游的同源臂序列(内源IL-6基因座上游约5.5kb和下游约4.8kb的小鼠DNA),以及约12kb人IL-6序列。其中,上述上游同源臂序列(5’同源臂,SEQ ID NO:9)与NCBI登录号为NC_000071.6的第30006059-30011541位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:10)与NCBI登录号为NC_000071.6的第30020010-30024779位核苷酸序列相同;人IL-6的DNA片段序列(SEQ ID NO:11)与NCBI登录号为NC_000007.14的第22722839-22735564位核苷酸序列相同。
靶向载体上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统LoxP重组位点,组成Neo盒(Neo cassette)。其中Neo盒5’端与人IL-6序列相连,连接设计为
Figure BDA0002321664010000183
Figure BDA0002321664010000181
内,其中序列“AGCTC”的最后一个“C”是人的最后一个核苷酸,序列
Figure BDA0002321664010000182
的第一个“G”是Neo盒的第一个核苷酸。Neo盒3’端与小鼠IL-6基因座直接连接,其接合设计为
Figure BDA0002321664010000191
Figure BDA0002321664010000192
内,其中序列“CTAGT”的最后一个“T”是Neo盒的最后一个核苷酸,序列
Figure BDA0002321664010000193
的第一个“C”是鼠的第一个核苷酸。此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。
靶向载体构建可采用常规方法进行,如酶切连接、直接合成等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将构建正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况,经PCR鉴定为阳性的克隆再进行Southern Blot(分别用HindIII或SpeI消化细胞DNA并使用2个探针进行杂交,见表1)检测筛选出正确的阳性克隆细胞进行后续试验。
PCR测定包括下述引物:
F1:5’-TGCATCGCATTGTCTGAGTAGG-3’(SEQ ID NO:14),
R1:5’-ACTTAGGACCTTGCTCATGTTGG-3’(SEQ ID NO:15);
F2:5’-GCTCGACTAGAGCTTGCGGA-3’(SEQ ID NO:16),
R2:5’-CAGAAGCCTGATATCTTAGTGTC-3’(SEQ ID NO:17);
Southern Blot检测包括如下探针引物:
探针1(Probe1):
F:5’-CCATGGAAGGAGTTACAGAGA-3’(SEQ ID NO:18),
R:5’-GTACTGAGGCATATAAAGTTTGC-3’(SEQ ID NO:19);
探针2(Probe2):
F:5’-GGGACCACTATGGTTGAAT-3’(SEQ ID NO:20),
R:5’-CAGAAGCCTGATATCTTAGTGTC-3’(SEQ ID NO:21);
表1具体探针及目的片段的长度
Figure BDA0002321664010000194
将筛选出的正确阳性克隆按照本领域已知的技术将阳性克隆细胞(黑色鼠)导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配,获得F2代纯合子鼠。
将阳性鼠与CRE工具鼠交配去除阳性克隆筛选标记基因(该过程示意图见图5)后,再通过互相交配,得到去Neo的表达人IL-6蛋白的人源化IL-6小鼠纯合子(H/H)。通过PCR等常规方法鉴定子代小鼠体细胞的基因型,结果显示,制备出了人源化IL-6小鼠杂合子及纯合子,且无随机插入。
此外,引入CRISPR/Cas系统进行基因编辑,以图3所示的IL-6基因人源化小鼠为例,设计打靶策略如图6所示。由于靶序列决定了sgRNA的靶向特异性和诱导Cas9切割目的基因的效率,因此,高效特异的靶序列选择和设计是构建sgRNA表达载体的前提。设计并合成识别5’端靶位点(sgRNA1-sgRNA7)、3’端靶位点(sgRNA8-sgRNA15)的sgRNA序列。5’端靶位点和3’端靶位点分别位于IL-6基因第1号外显子和第5号外显子上,各sgRNA在上的靶位点序列如下:
sgRNA1靶位点序列(SEQ ID NO:22):5’-AGTCTCAATAGCTCCGCCAGAGG-3’
sgRNA2靶位点序列(SEQ ID NO:23):5’-GTCTATACCACTTCACAAGTCGG-3’
sgRNA3靶位点序列(SEQ ID NO:24):5’-GGGCGCCTGCTGCTAGCTGATGG-3’
sgRNA4靶位点序列(SEQ ID NO:25):5’-TGCTGGCCAACCCACAATGCTGG-3’
sgRNA5靶位点序列(SEQ ID NO:26):5’-AGTCTCCTGCGTGGAGAAAAGGG-3’
sgRNA6靶位点序列(SEQ ID NO:27):5’-TGTGCTATCTGCTCACTTGCCGG-3’
sgRNA7靶位点序列(SEQ ID NO:28):5’-GCCTTCACTTACTTGCAGAGAGG-3’
sgRNA8靶位点序列(SEQ ID NO:29):5’-ATGCTTAGGCATAACGCACTAGG-3’
sgRNA9靶位点序列(SEQ ID NO:30):5’-GTCCACAAACTGATATGCTTAGG-3’
sgRNA10靶位点序列(SEQ ID NO:31):5’-TGCCTAAGCATATCAGTTTGTGG-3’
sgRNA11靶位点序列(SEQ ID NO:32):5’-AAGTCACTTTGAGATCTACTCGG-3’
sgRNA12靶位点序列(SEQ ID NO:33):5’-TAAGTCAGATACCTGACAACAGG-3’
sgRNA13靶位点序列(SEQ ID NO:34):5’-TATTCTGTTACCTAGCCAGATGG-3’
sgRNA14靶位点序列(SEQ ID NO:35):5’-TTCCAAGAAACCATCTGGCTAGG-3’
sgRNA15靶位点序列(SEQ ID NO:36):5’-GAACTGACAATATGAATGTTGGG-3’
利用UCA试剂盒检测多个sgRNA的活性,从结果可见sgRNA具有不同活性,其中,sgRNA7、sgRNA9、sgRNA15活性相对较低,这可能由于靶位点序列的特殊性导致,但根据我们的实验,sgRNA7、sgRNA9、sgRNA15的数值仍显著高于对照组数值,仍可判断sgRNA7、sgRNA9、sgRNA15是具有活性的,并且活性满足基因打靶实验要求,检测结果参见图7和表2。从中优先选择2个(分别是sgRNA5和sgRNA13)进行后续实验,在其5’端及互补链上分别加上酶切位点得到正向寡核苷酸和反向寡核苷酸(序列见表3),退火后将退火产物分别连接至pT7-sgRNA质粒(质粒先用BbsI线性化),获得表达载体pT7-sgRNA5和pT7-sgRNA13。
pT7-sgRNA载体由质粒合成公司合成含有T7启动子及sgRNA scaffold的片段DNA(SEQ ID NO:37)并依次通过酶切(EcoRI及BamHI)连接至骨架载体(来源Takara,货号3299)上,经专业测序公司测序验证,结果表明获得了目的质粒。
表2 sgRNA的活性检测结果
Figure BDA0002321664010000211
表3 sgRNA序列
Figure BDA0002321664010000212
图6显示的靶向载体上含有小鼠IL-6基因的上游和下游的同源臂序列以及人IL-6序列。其中,上述上游同源臂序列(5’同源臂,SEQ ID NO:46)与NCBI登录号为NC_000071.6的第30011619-30013191位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:47)与NCBI登录号为NC_000071.6的第30019976-30021303位核苷酸序列相同;人IL-6的DNA片段序列(SEQ ID NO:48)与NCBI登录号为NC_000007.14的第22727263-22732018位核苷酸序列相同。改造后的人源化小鼠IL-6的mRNA序列如SEQ ID NO:49(基于转录本NM_000600.4-NP_000591.1)和SEQ ID NO:50(基于转录本NM_001318095.1-NP_001305024.1)所示,其编码的蛋白为人IL-6蛋白,序列如SEQ ID NO:6和SEQ ID NO:8所示。靶向载体构建可采用常规方法进行,如酶切连接、直接合成等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的载体质粒用于后续实验。
取B-NDG小鼠的原核期受精卵,利用显微注射仪将预混好的sgRNA5、sgRNA13的体外转录产物(使用Ambion体外转录试剂盒,按照说明书方法进行转录)和Cas9mRNA及图6显示的靶向载体质粒注射至小鼠受精卵细胞质或细胞核中,按照《小鼠胚胎操作实验手册(第三版)》中的方法进行胚胎的显微注射,注射后的受精卵转移至培养液中短暂培养,然后移植至受体母鼠的输卵管,生产基因改造人源化小鼠,得到首建鼠(即founder鼠,为F0代)。
可通过常规检测方法(如PCR分析)鉴定F0代小鼠体细胞的基因型,以下仅以鼠转录本NM_031168.2→NP_112445.1和人转录本NM_000600.4→NP_000591.1制备IL-6人源化小鼠为例进行验证,部分F0代小鼠的鉴定结果见图8,其中,编号F0-005、F0-009、F0-021、F0-029、F0-032的5只小鼠均为阳性小鼠。PCR引物见表4。
表4 PCR引物及片段大小
Figure BDA0002321664010000221
将获得的F0代阳性小鼠与B-NDG小鼠交配可得到F1代小鼠,即为以B-NDG为背景的人源化IL-6小鼠杂合子(B-NDG(h/+)),可使用同样的PCR方法对F1代小鼠进行基因型鉴定,部分F1代小鼠实验结果见图9,结果显示图中15只F1代小鼠均为阳性小鼠。进一步的使用Southern Blot技术进行检测,检测结果见图10,检测结果表明经PCR验证为阳性的15只小鼠均为阳性杂合子且无随机插入。这表明使用本方法能构建出可稳定传代且无随机插入的基因工程小鼠。
Southern Blot检测时用BglII或ScaI消化DNA并使用2个探针进行杂交(见表5),探针引物如下:
IL-6-5’探针(IL-6-5’Probe):
F:5’-AACAGCTAGCAATGGAGTTGGGCTT-3’(SEQ ID NO:55),
R:5’-AAAGGTGCTTTTTAAGTCGGGAGCA-3’(SEQ ID NO:56);
IL-6-A探针(IL-6-AProbe):
F:5’-AGGTGAGCTTGGAACTGAACCCAAG-3’(SEQ ID NO:57),
R:5’-TACCCACTTTTTGTTGCTGCCTGGA-3’(SEQ ID NO:58);
表5具体探针及目的片段的长度
Figure BDA0002321664010000231
可通过常规检测方法确认上述阳性小鼠体内人或人源化IL-6蛋白的表达情况,例如使用ELISA方法,选取B-NDG小鼠(+/+)和B-NDG背景人源化IL-6小鼠杂合子(h/+)各1只,先给小鼠腹腔注射20μgLPS,2h后取血清,分别稀释1600或300倍后检测鼠或人IL-6蛋白水平,检测结果(见图11)显示,在刺激后的B-NDG小鼠(+/+)体内只能检测到鼠IL-6蛋白的表达,未检测人或人源化IL-6蛋白的表达,在刺激后的B-NDG背景人源化IL-6小鼠杂合子体内可检测到鼠和人IL-6蛋白的表达。
另一个实验中,选取C57/BL6小鼠(+/+)和图2所示的人源化IL-6小鼠纯合子(H/H,C57/BL6背景,此实施例制备)各1只,按照同样方法检测鼠或人IL-6蛋白水平,检测结果(见图16)显示,在经LPS刺激后的C57/BL6小鼠(+/+)体内只能检测到鼠IL-6蛋白的表达,未检测人或人源化IL-6蛋白的表达,在刺激后的人源化IL-6小鼠纯合子(H/H)体内只能检测到人IL-6蛋白的表达,不能检测到鼠IL-6蛋白的表达。
此外,由于Cas9的切割造成基因组DNA的双链断裂,通过染色体同源重组的修复方式会随机产生插入/缺失突变,本方法还可同时得到IL-6蛋白功能丧失的基因敲除小鼠,可通过常规PCR的方法检测基因缺失情况,鉴定结果参见图12,显示编号为KO-001、KO-003、KO-005、KO-012、KO-013、KO-014、KO-018、KO-021、KO-025、KO-029的小鼠为IL-6基因敲除小鼠。PCR分析包括下述引物,其中基因敲除小鼠得到的条带约为571bp。
5’MSD-F:5’-ATAAGGTTTCCAATCAGCCCCACCC-3’(SEQ ID NO:68)
5’MSD-R:5’-ACTTAGGACCTTGCTCATGTTGGGT-3’(SEQ ID NO:69)
实施例2 IL-6R基因人源化小鼠
小鼠IL-6R基因(NCBI Gene ID:16194,Primary source:MGI:105304,UniProtID:P08505,位于3号染色体NC_000069.6的第89869324至89913196位)和人IL-6R基因(NCBIGene ID:3570,Primary source:HGNC:6019,UniProt ID:P08887,位于1号染色体NC_000001.11的第154405193至154469450位),鉴于人IL-6R和小鼠IL-6R具有多种亚型或转录本,如图13所示的基因示意图以鼠转录本NM_010559.3(SEQ ID NO:59)及其编码蛋白NP_034689.2(SEQ ID NO:60)、人转录本NM_000565.3(SEQ ID NO:61)及其编码蛋白NP_000556.1(SEQ ID NO:62)为例。
为了达到本发明的目的,可在内源小鼠IL-6R基因座引入编码人IL-6R蛋白的基因序列,使得该小鼠表达人IL-6R蛋白。例如,可用基因编辑技术对小鼠胚胎干细胞进行修饰,在内源小鼠IL-6R起始密码子(ATG)后插入可编码人或人源化IL-6R蛋白的核苷酸序列,为了让人IL-6R蛋白在小鼠体内可以更稳定、更好的表达,在人IL-6R编码序列后插入辅助序列WPRE(土拨鼠乙肝病毒转录后调控元件)和/或polyA(多聚腺苷酸)。
最终得到的改造后的人源化小鼠IL-6R基因部分示意图见图14所示,该小鼠通过内源性启动子调控人源IL-6R序列的表达,体内表达的IL-6R蛋白为人IL-6R蛋白;并进一步的设计了如图15所示的打靶策略。由于所插入的重组序列后存在终止密码子,使图15所示人源化鼠IL-6R基因座的鼠源编码区不能正常转录和翻译。
鉴于人IL-6R或小鼠IL-6R具有多种亚型或转录本,本文所述的方法可应用于其它亚型或转录本。
如图15所示的打靶策略示意图中,显示了靶向载体上含有小鼠IL-6R上游和下游的同源臂序列(内源IL-6R基因座上游约4.2kb和下游约4.8kb的小鼠DNA),以及包含编码人IL-6R蛋白和辅助序列WPRE、polyA(简称WPRE-PA)的IL-6R-A片段。其中,上述上游同源臂序列(5’同源臂,SEQ ID NO:63)与NCBI登录号为NC_000069.6的第89917172-89913040位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:64)与NCBI登录号为NC_000069.6的第89913026-89908300位核苷酸序列相同;IL-6R-A片段序列(SEQ ID NO:65)中,第1-1407bp为编码人IL-6R蛋白的序列,该序列与NCBI登录号为NM_000565.3的第438-1844位核苷酸序列相同。
靶向载体上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统FRT重组位点,组成Neo盒(Neo cassette)。其中Neo盒位于IL-6R-A片段上,其5’端与WPRE-PA片段序列相连,连接设计为
Figure BDA0002321664010000258
Figure BDA0002321664010000251
Figure BDA0002321664010000252
内,其中序列“GCTGGGGA”的“A”是polyA片段的最后一个核苷酸,序列
Figure BDA0002321664010000253
的“G”是Neo盒的第一个核苷酸。Neo盒3’端与小鼠IL-6R基因座的接合设计为
Figure BDA0002321664010000259
Figure BDA0002321664010000254
Figure BDA0002321664010000255
内,其中序列“AGTACT”的最后一个“T”是Neo盒的最后一个核苷酸,序列
Figure BDA0002321664010000256
的第一个“G”是鼠的第一个核苷酸。此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。
靶向载体构建可采用常规方法进行,如酶切连接、直接合成等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将构建正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况,筛选出正确的阳性克隆细胞。
经PCR鉴定为阳性的克隆再进行Southern Blot检测,筛选出正确的阳性克隆细胞。其中,Southern Blot检测分别用SspI、SpeI或EcoRV酶消化细胞DNA并使用3个探针(见表6)进行杂交,图17中检测结果表明2个克隆(1-G01、1-H01)目的条带大小正确,均为阳性杂合克隆且无随机插入。
表6具体探针及目的片段的长度
Figure BDA0002321664010000257
其中,PCR测定包括下述引物:
IL-6R-F1:5’-AGCGCACGTCTGCCGCGCTGTTC-3’(SEQ ID NO:70),
IL-6R-R1:5’-TGCCTGTAGGTGACTCTCAAGTCCA-3’(SEQ ID NO:71);
IL-6R-F2:5’-CTGGGATTCCACATCTGTTGTCCAC-3’(SEQ ID NO:72),
IL-6R-R2:5’-ACAGTGGCATTGTCTTCCGGCTCTA-3’(SEQ ID NO:73)。
Southern Blot检测包括如下探针引物:
IL-6R-5’探针(IL-6R-5’Probe):
F:5’-CTGGGATTCCACATCTGTTGTCCAC-3’(SEQ ID NO:74),
R:5’-TGCAGCTACCGTTCATGTCCCC-3’(SEQ ID NO:75);
IL-6R-3’探针(IL-6R-3’Probe):
F:5’-GTCAACAAGCACAACTCTTCCAGGG-3’(SEQ ID NO:76),
R:5’-CCAGAGGCTTCTAAACCCTAAAGC-3’(SEQ ID NO:77);
IL-6R-Neo探针(IL-6R-Neo Probe):
F:5’-GGATCGGCCATTGAACAAGAT-3’(SEQ ID NO:78),
R:5’-CAGAAGAACTCGTCAAGAAGGC-3’(SEQ ID NO:79)。
将筛选出的阳性克隆根据本领域技术人员已知的任意方法将阳性克隆细胞(黑色小鼠)导入分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配,获得F2代纯合子鼠。
将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因后(如图18所示),再通过互相交配,得到IL-6R基因人源化F2纯合子小鼠。通过PCR鉴定F1代小鼠细胞的基因型,引物如表7所示。结果如图19所示,编号为IL-6R-F1-1和IL-6R-F1-2的2只小鼠检测结果与预期相符,均为阳性小鼠(其中编号为PC为阳性对照,WT为野生型)。这表明本方法可以构建出稳定传代且无随机插入的IL-6R基因人源化工程小鼠。
表7 PCR引物及片段大小
Figure BDA0002321664010000261
通过常规检测方法可确认小鼠体内人IL-6R蛋白的表达情况,例如可用抗鼠IL-6R抗体mIL-6R PE和鼠源T细胞表面抗体mTcRβ-APC/Cy7或抗人IL-6R抗体hIL-6R PE和mTcRβ-APC/Cy7对小鼠的脾脏细胞识别染色后进行流式检测IL-6R蛋白表达。流式分析结果(见图20)显示,在IL-6R基因人源化纯合子小鼠脾脏内,可检测到表达人IL-6R蛋白(图20D),但不能检测表达鼠IL-6R蛋白(图20B)的细胞;而在野生型C57BL/6小鼠的细胞内只能检测到表达鼠IL-6R蛋白(图20A),未检测到表达人或人源化IL-6R蛋白的细胞(图20C)。
实施例3在IL-6人源化小鼠体内进行人免疫系统重建
利用实施例1制得的IL-6人源化小鼠(B-NDG背景)作为工具能够移植人CD34+细胞并实现人免疫系统重建。先通过辐照清髓,然后给小鼠尾静脉注射的脐带血干细胞。移植后不同时间时收集血浆样品并进行检测。结果显示,IL-6人源化小鼠(B-NDG背景)体内比野生型对照组有更高的人外周血植入,且分化百分比更接近,含有部分成熟B细胞。
实施例4利用人源化小鼠进行疾病模型制备
利用本方法制得小鼠可以诱导制备多重人类疾病模型,包括多发性硬化、哮喘、过敏、关节炎等模型,可以用于测试人特异性抗体的体内药效。例如,IL-6基因人源化小鼠可用于评估人特异性IL-6信号通路的拮抗剂的药效、药代动力学及在本领域已知的各种疾病模型中的体内治疗功效。
以实验性自身免疫性脑脊髓炎(Experimental Autoimmune Encephalomyelitis,EAE)模型的制备为例,可以选取实施例1制备的人源化IL-6小鼠(C57BL/6背景,约10周龄),采用MOG免疫1次(day0,皮下注射200μg/只),并给予腹腔注射百日咳毒素(PertussisToxin,PTX)两次(day0和day2,剂量为400μg/只),获得EAE小鼠模型。
将发病的EAE小鼠模型分组,通过灌胃或鼠尾静脉注射给药,可通过行为学评分、脑/脊髓IHC病理、血清/脑匀浆Th17型多细胞因子检测和CNS及脾的流式细胞术等多重检测指标评定不同人用药物的体内药效情况。
实施例5在人源化小鼠体内进行药效评估
利用本方法制得的人源化小鼠评估靶向人IL-6或IL-6R的调节剂药效。例如,以实施例2制备的IL-6R人源化小鼠为例,先给纯合子小鼠接种肿瘤细胞系MC38,待肿瘤组织约100mm3时进行分组,选择不同的抗人IL-6抗体,对照组选择空白制剂,定期测量肿瘤体积并称量小鼠的体重,可通过结果比较小鼠体重变化和肿瘤大小,有效评估化合物的体内安全性和体内药效。
实施例6双重人源化或多重人源化小鼠的制备及鉴定
利用本方法或制得的IL-6和/或IL-6R小鼠还可以制备双人源化或多人源化小鼠模型。以IL-6为例,如,前述实施例1中,囊胚显微注射使用的胚胎干细胞可选择来源于含有其它基因修饰的小鼠,或者,也可选择对IL-6人源化小鼠的受精卵细胞进行基因编辑,可以进一步得到IL-6与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将本方法得到的IL-6和/或IL-6R小鼠纯合或杂合子与其它基因修饰纯合或杂合小鼠交配,对其后代进行筛选,根据孟德尔遗传规律,可有一定几率得到IL-6和/或IL-6R与其它基因修饰的双基因或多基因修饰的杂合小鼠,再将杂合子相互交配可以得到双基因或多基因修饰的纯合子,利用这些双基因或多基因修饰的小鼠可以进行靶向人IL-6和/或IL-6R和其他基因调节剂的体内药效验证等。
以双重人源化IL-6/IL-6R小鼠为例,由于鼠IL-6与IL-6R基因分别均位于5号和3号染色体上,选择将实施例1制备的C57BL/6背景小鼠IL-6人源化小鼠与实施例2制备的IL-6R人源化小鼠交配,通过阳性子代小鼠的筛选,最终得到双重人源化IL-6/IL-6R小鼠。
进一步的对双重人源化IL-6/IL-6R小鼠的表达情况进行检测。选取1只双重人源化IL-6/IL-6R小鼠纯合子(6-7周龄,其中IL-6的人源化改造如图2所示),另选1只野生型C57BL/6小鼠作为对照,按照前述IL-6单基因小鼠的检测方法检测IL-6的表达情况。先给小鼠腹腔注射20μgLPS,2h后取血清,稀释后检测鼠和人IL-6蛋白水平,检测结果(见图21)所示,在刺激后的C57BL/6小鼠(WT)体内只能检测到鼠IL-6蛋白的表达,未检测人或人源化IL-6蛋白的表达,在刺激后的双重人源化IL-6/IL-6R小鼠纯合子(IL-6H/H/IL-6RH/H)体内可检测到人IL-6蛋白的表达,未能检测到鼠IL-6蛋白的表达。另一个实验中,选取同样的双重人源化IL-6/IL-6R小鼠纯合子1只,另选1只野生型C57BL/6小鼠作为对照,按照前述IL-6R单基因小鼠的检测方法,流式检测小鼠体内IL-6R蛋白的表达。结果显示,流式分析结果(见图22)显示,在双重人源化IL-6/IL-6R小鼠纯合子脾脏内,可检测到表达人源化IL-6R蛋白(图22D),但未检测到表达鼠IL-6R蛋白(图22B)的细胞;而在野生型C57BL/6小鼠的脾脏内只能检测到表达鼠IL-6R蛋白(图22A),未检测到表达人或人源化IL-6R蛋白的细胞(图22C)。
实施例7利用双基因人源化小鼠体内进行药效评估
利用实施例6制得的双重人源化IL-6/IL-6R小鼠纯合子构建了实验性关节炎动物模型(CIA)并进行了抗人IL-6R抗体(为使用常规方法免疫小鼠得到,参见Janeway'sImmunobiology(9th Edition))的药效评估。具体实验过程为,用4mg/mL的鸡二型胶原(美国Sigma公司)与4mg/mL弗氏完全佐剂(美国Sigma公司)等体积混合,冰上研磨至油包水状态的混合液供后续使用;对每只双重人源化IL-6/IL-6R小鼠纯合子的尾根部、背部多点(2-3点)皮内注射0.1mL的上述混合液,在第一次免疫后的第21天对每只人源化鼠再次多点(2-3点)皮下注射0.1mL的上述混合液;对照组注射等体积PBS。
在第二次免疫后每周两次对各组小鼠的体重、足趾和关节炎指数情况进行监测,测量爪厚并记录每只小鼠的关节炎评分,共记录12次。其中,关节炎评分采用4级评分法,0、正常;1、一种关节类型(A、B、C)发红和肿胀;2、二种关节类型(A、B、C)发红和肿胀;3、三种关节类型(A、B、C)发红和肿胀;4、整个爪子最大的发红和肿胀;其中关节类型:A:趾间关节B:掌指关节C:腕和跗骨关节。免疫后第28天时,将评分不低于1分的小鼠进行分组入组,每组5只,具体分组和给药方案如表8所示。初步检测结果表明实验过程中,从30天起,CIA造模组G2、G3体重开始下降且与对照组G1相比有显著性;而与平均爪厚度和评分结果,都表明抗人IL-6R抗体具有抑制CIA模型小鼠发病的作用,而使用hIgG1/kappa则没有明显抑制CIA模型小鼠发病的作用。
表8分组和给药方案
分组 造模试剂 药物 剂量/给药方式/频率
G1 PBS / /
G2 CII hIgG1/kappa 8mg/kg;腹腔注射;每周给药2次,共给药6次
G3 CII 人IL-6R抗体 8mg/kg;腹腔注射;每周给药2次,共给药6次
以上研究表明本方法可用于评估人特异性IL-6/IL-6R信号通路的调节剂与IL-6/IL-6R信号通路调节剂联用的药效、药代动力学及在类风湿关节炎自身免疫病模型和本领域已知的各种疾病模型中的体内治疗功效。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
序列表
<110> 百奥赛图江苏基因生物技术有限公司
北京百奥赛图基因生物技术有限公司
<120> 一种人源化细胞因子动物模型、制备方法及应用
<160> 86
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1141
<212> DNA/RNA
<213> 小鼠(Mouse)
<400> 1
aaatatgaga ctggggatgt ctgtagctca ttctgctctg gagcccacca agaacgatag 60
tcaattccag aaaccgctat gaagttcctc tctgcaagag acttccatcc agttgccttc 120
ttgggactga tgctggtgac aaccacggcc ttccctactt cacaagtccg gagaggagac 180
ttcacagagg ataccactcc caacagacct gtctatacca cttcacaagt cggaggctta 240
attacacatg ttctctggga aatcgtggaa atgagaaaag agttgtgcaa tggcaattct 300
gattgtatga acaacgatga tgcacttgca gaaaacaatc tgaaacttcc agagatacaa 360
agaaatgatg gatgctacca aactggatat aatcaggaaa tttgcctatt gaaaatttcc 420
tctggtcttc tggagtacca tagctacctg gagtacatga agaacaactt aaaagataac 480
aagaaagaca aagccagagt ccttcagaga gatacagaaa ctctaattca tatcttcaac 540
caagaggtaa aagatttaca taaaatagtc cttcctaccc caatttccaa tgctctccta 600
acagataagc tggagtcaca gaaggagtgg ctaaggacca agaccatcca attcatcttg 660
aaatcacttg aagaatttct aaaagtcact ttgagatcta ctcggcaaac ctagtgcgtt 720
atgcctaagc atatcagttt gtggacattc ctcactgtgg tcagaaaata tatcctgttg 780
tcaggtatct gacttatgtt gttctctacg aagaactgac aatatgaatg ttgggacact 840
attttaatta tttttaattt attgataatt taaataagta aactttaagt taatttatga 900
ttgatattta ttatttttat gaagtgtcac ttgaaatgtt atatgttata gttttgaaat 960
gataacctaa aaatctattt gatataaata ttctgttacc tagccagatg gtttcttgga 1020
atgtataagt ttacctcaat gaattgctaa tttaaatatg tttttaaaga aatctttgtg 1080
atgtattttt ataatgttta gactgtcttc aaacaaataa attatattat atttaaaaac 1140
c 1141
<210> 2
<211> 211
<212> PRT
<213> 小鼠(Mouse)
<400> 2
Met Lys Phe Leu Ser Ala Arg Asp Phe His Pro Val Ala Phe Leu Gly
1 5 10 15
Leu Met Leu Val Thr Thr Thr Ala Phe Pro Thr Ser Gln Val Arg Arg
20 25 30
Gly Asp Phe Thr Glu Asp Thr Thr Pro Asn Arg Pro Val Tyr Thr Thr
35 40 45
Ser Gln Val Gly Gly Leu Ile Thr His Val Leu Trp Glu Ile Val Glu
50 55 60
Met Arg Lys Glu Leu Cys Asn Gly Asn Ser Asp Cys Met Asn Asn Asp
65 70 75 80
Asp Ala Leu Ala Glu Asn Asn Leu Lys Leu Pro Glu Ile Gln Arg Asn
85 90 95
Asp Gly Cys Tyr Gln Thr Gly Tyr Asn Gln Glu Ile Cys Leu Leu Lys
100 105 110
Ile Ser Ser Gly Leu Leu Glu Tyr His Ser Tyr Leu Glu Tyr Met Lys
115 120 125
Asn Asn Leu Lys Asp Asn Lys Lys Asp Lys Ala Arg Val Leu Gln Arg
130 135 140
Asp Thr Glu Thr Leu Ile His Ile Phe Asn Gln Glu Val Lys Asp Leu
145 150 155 160
His Lys Ile Val Leu Pro Thr Pro Ile Ser Asn Ala Leu Leu Thr Asp
165 170 175
Lys Leu Glu Ser Gln Lys Glu Trp Leu Arg Thr Lys Thr Ile Gln Phe
180 185 190
Ile Leu Lys Ser Leu Glu Glu Phe Leu Lys Val Thr Leu Arg Ser Thr
195 200 205
Arg Gln Thr
210
<210> 3
<211> 1083
<212> DNA/RNA
<213> 小鼠(Mouse)
<400> 3
aaatatgaga ctggggatgt ctgtagctca ttctgctctg gagcccacca agaacgatag 60
tcaattccag aaaccgctat gaagttcctc tctgcaagag acttccatcc agttgccttc 120
ttgggactga tgctggtgac aaccacggcc ttccctactt cacaagtccg gagaggagac 180
ttcacagagg ataccactcc caacagacct gtctatacca cttcacaagt cggaggctta 240
attacacatg ttctctggga aatcgtggaa atgagaaaag agttgtgcaa tggcaattct 300
gattgtatga acaacgatga tgcacttgca gaaaacaatc tgaaacttcc agagatacaa 360
agaaatgatg gatgctacca aactggatat aatcaggaaa tttgcctatt gaaaatttcc 420
tctggtcttc tggagtacca tagctacctg gagtacatga agaacaactt aaaagataac 480
aagaaagaca aagccagagt ccttcagaga gatacagaaa ctctaattca tatcttcaac 540
caagagataa gctggagtca cagaaggagt ggctaaggac caagaccatc caattcatct 600
tgaaatcact tgaagaattt ctaaaagtca ctttgagatc tactcggcaa acctagtgcg 660
ttatgcctaa gcatatcagt ttgtggacat tcctcactgt ggtcagaaaa tatatcctgt 720
tgtcaggtat ctgacttatg ttgttctcta cgaagaactg acaatatgaa tgttgggaca 780
ctattttaat tatttttaat ttattgataa tttaaataag taaactttaa gttaatttat 840
gattgatatt tattattttt atgaagtgtc acttgaaatg ttatatgtta tagttttgaa 900
atgataacct aaaaatctat ttgatataaa tattctgtta cctagccaga tggtttcttg 960
gaatgtataa gtttacctca atgaattgct aatttaaata tgtttttaaa gaaatctttg 1020
tgatgtattt ttataatgtt tagactgtct tcaaacaaat aaattatatt atatttaaaa 1080
acc 1083
<210> 4
<211> 165
<212> PRT
<213> 小鼠(Mouse)
<400> 4
Met Lys Phe Leu Ser Ala Arg Asp Phe His Pro Val Ala Phe Leu Gly
1 5 10 15
Leu Met Leu Val Thr Thr Thr Ala Phe Pro Thr Ser Gln Val Arg Arg
20 25 30
Gly Asp Phe Thr Glu Asp Thr Thr Pro Asn Arg Pro Val Tyr Thr Thr
35 40 45
Ser Gln Val Gly Gly Leu Ile Thr His Val Leu Trp Glu Ile Val Glu
50 55 60
Met Arg Lys Glu Leu Cys Asn Gly Asn Ser Asp Cys Met Asn Asn Asp
65 70 75 80
Asp Ala Leu Ala Glu Asn Asn Leu Lys Leu Pro Glu Ile Gln Arg Asn
85 90 95
Asp Gly Cys Tyr Gln Thr Gly Tyr Asn Gln Glu Ile Cys Leu Leu Lys
100 105 110
Ile Ser Ser Gly Leu Leu Glu Tyr His Ser Tyr Leu Glu Tyr Met Lys
115 120 125
Asn Asn Leu Lys Asp Asn Lys Lys Asp Lys Ala Arg Val Leu Gln Arg
130 135 140
Asp Thr Glu Thr Leu Ile His Ile Phe Asn Gln Glu Ile Ser Trp Ser
145 150 155 160
His Arg Arg Ser Gly
165
<210> 5
<211> 1197
<212> DNA/RNA
<213> 人(human)
<400> 5
gtctcaatat tagagtctca acccccaata aatataggac tggagatgtc tgaggctcat 60
tctgccctcg agcccaccgg gaacgaaaga gaagctctat ctcccctcca ggagcccagc 120
tatgaactcc ttctccacaa gcgccttcgg tccagttgcc ttctccctgg ggctgctcct 180
ggtgttgcct gctgccttcc ctgccccagt acccccagga gaagattcca aagatgtagc 240
cgccccacac agacagccac tcacctcttc agaacgaatt gacaaacaaa ttcggtacat 300
cctcgacggc atctcagccc tgagaaagga gacatgtaac aagagtaaca tgtgtgaaag 360
cagcaaagag gcactggcag aaaacaacct gaaccttcca aagatggctg aaaaagatgg 420
atgcttccaa tctggattca atgaggagac ttgcctggtg aaaatcatca ctggtctttt 480
ggagtttgag gtatacctag agtacctcca gaacagattt gagagtagtg aggaacaagc 540
cagagctgtg cagatgagta caaaagtcct gatccagttc ctgcagaaaa aggcaaagaa 600
tctagatgca ataaccaccc ctgacccaac cacaaatgcc agcctgctga cgaagctgca 660
ggcacagaac cagtggctgc aggacatgac aactcatctc attctgcgca gctttaagga 720
gttcctgcag tccagcctga gggctcttcg gcaaatgtag catgggcacc tcagattgtt 780
gttgttaatg ggcattcctt cttctggtca gaaacctgtc cactgggcac agaacttatg 840
ttgttctcta tggagaacta aaagtatgag cgttaggaca ctattttaat tatttttaat 900
ttattaatat ttaaatatgt gaagctgagt taatttatgt aagtcatatt tatattttta 960
agaagtacca cttgaaacat tttatgtatt agttttgaaa taataatgga aagtggctat 1020
gcagtttgaa tatcctttgt ttcagagcca gatcatttct tggaaagtgt aggcttacct 1080
caaataaatg gctaacttat acatattttt aaagaaatat ttatattgta tttatataat 1140
gtataaatgg tttttatacc aataaatggc attttaaaaa attcagcaaa aaaaaaa 1197
<210> 6
<211> 212
<212> PRT
<213> 人(human)
<400> 6
Met Asn Ser Phe Ser Thr Ser Ala Phe Gly Pro Val Ala Phe Ser Leu
1 5 10 15
Gly Leu Leu Leu Val Leu Pro Ala Ala Phe Pro Ala Pro Val Pro Pro
20 25 30
Gly Glu Asp Ser Lys Asp Val Ala Ala Pro His Arg Gln Pro Leu Thr
35 40 45
Ser Ser Glu Arg Ile Asp Lys Gln Ile Arg Tyr Ile Leu Asp Gly Ile
50 55 60
Ser Ala Leu Arg Lys Glu Thr Cys Asn Lys Ser Asn Met Cys Glu Ser
65 70 75 80
Ser Lys Glu Ala Leu Ala Glu Asn Asn Leu Asn Leu Pro Lys Met Ala
85 90 95
Glu Lys Asp Gly Cys Phe Gln Ser Gly Phe Asn Glu Glu Thr Cys Leu
100 105 110
Val Lys Ile Ile Thr Gly Leu Leu Glu Phe Glu Val Tyr Leu Glu Tyr
115 120 125
Leu Gln Asn Arg Phe Glu Ser Ser Glu Glu Gln Ala Arg Ala Val Gln
130 135 140
Met Ser Thr Lys Val Leu Ile Gln Phe Leu Gln Lys Lys Ala Lys Asn
145 150 155 160
Leu Asp Ala Ile Thr Thr Pro Asp Pro Thr Thr Asn Ala Ser Leu Leu
165 170 175
Thr Lys Leu Gln Ala Gln Asn Gln Trp Leu Gln Asp Met Thr Thr His
180 185 190
Leu Ile Leu Arg Ser Phe Lys Glu Phe Leu Gln Ser Ser Leu Arg Ala
195 200 205
Leu Arg Gln Met
210
<210> 7
<211> 1006
<212> DNA/RNA
<213> 人(human)
<400> 7
gtctcaatat tagagtctca acccccaata aatataggac tggagatgtc tgaggctcat 60
tctgccctcg agcccaccgg gaacgaaaga gaagctctat ctcccctcca ggagcccagc 120
tatgaactcc ttctccacaa acatgtaaca agagtaacat gtgtgaaagc agcaaagagg 180
cactggcaga aaacaacctg aaccttccaa agatggctga aaaagatgga tgcttccaat 240
ctggattcaa tgaggagact tgcctggtga aaatcatcac tggtcttttg gagtttgagg 300
tatacctaga gtacctccag aacagatttg agagtagtga ggaacaagcc agagctgtgc 360
agatgagtac aaaagtcctg atccagttcc tgcagaaaaa ggcaaagaat ctagatgcaa 420
taaccacccc tgacccaacc acaaatgcca gcctgctgac gaagctgcag gcacagaacc 480
agtggctgca ggacatgaca actcatctca ttctgcgcag ctttaaggag ttcctgcagt 540
ccagcctgag ggctcttcgg caaatgtagc atgggcacct cagattgttg ttgttaatgg 600
gcattccttc ttctggtcag aaacctgtcc actgggcaca gaacttatgt tgttctctat 660
ggagaactaa aagtatgagc gttaggacac tattttaatt atttttaatt tattaatatt 720
taaatatgtg aagctgagtt aatttatgta agtcatattt atatttttaa gaagtaccac 780
ttgaaacatt ttatgtatta gttttgaaat aataatggaa agtggctatg cagtttgaat 840
atcctttgtt tcagagccag atcatttctt ggaaagtgta ggcttacctc aaataaatgg 900
ctaacttata catattttta aagaaatatt tatattgtat ttatataatg tataaatggt 960
ttttatacca ataaatggca ttttaaaaaa ttcagcaaaa aaaaaa 1006
<210> 8
<211> 136
<212> PRT
<213> 人(human)
<400> 8
Met Cys Glu Ser Ser Lys Glu Ala Leu Ala Glu Asn Asn Leu Asn Leu
1 5 10 15
Pro Lys Met Ala Glu Lys Asp Gly Cys Phe Gln Ser Gly Phe Asn Glu
20 25 30
Glu Thr Cys Leu Val Lys Ile Ile Thr Gly Leu Leu Glu Phe Glu Val
35 40 45
Tyr Leu Glu Tyr Leu Gln Asn Arg Phe Glu Ser Ser Glu Glu Gln Ala
50 55 60
Arg Ala Val Gln Met Ser Thr Lys Val Leu Ile Gln Phe Leu Gln Lys
65 70 75 80
Lys Ala Lys Asn Leu Asp Ala Ile Thr Thr Pro Asp Pro Thr Thr Asn
85 90 95
Ala Ser Leu Leu Thr Lys Leu Gln Ala Gln Asn Gln Trp Leu Gln Asp
100 105 110
Met Thr Thr His Leu Ile Leu Arg Ser Phe Lys Glu Phe Leu Gln Ser
115 120 125
Ser Leu Arg Ala Leu Arg Gln Met
130 135
<210> 9
<211> 5483
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
aggtcttctc gtgacttcag aaagcatatc aaactatcac aactggtaca tataactgta 60
tcttttaaag gattttaaat cttagtattt gctgaaatac ttagtgttta ctatttcagc 120
atctcatctg agttccgaga agttgtggat tctctcctta tccacatcag ccccgcctcc 180
cccacggtca gctccttgct gcctgcttgt gatagttctt actatcaaga tacgcagttt 240
ctcttgcaca agcaagacta tcatactagg taacttagtc ccctgggaag atacaaccag 300
atcttaagta aaaagagaga aacacttcaa tggtaatatc cttttatcaa taatccattt 360
gtcaccttgt gaaacaggcc ccagtaatga atttcaagat gaagtaatgt gacatatgaa 420
aagaagagtg ataaggtcag cctttgtcca tgaaaatgat ctatacatct tgccatccct 480
gaataccaat tagctactaa tgcccactgc gagtccaatc aggactagtc tgtgttccag 540
accagctgaa aagcaaatat caagtcaagc tgcaaaatgt gcatggtgtc aaacaaccag 600
cataacttaa taatttagag atgccattac tgcatgaaca aacaataagt taacctttgg 660
gaaatcagtg attattttca atgtgtatta tcaatactaa gctatgaata cattccctgt 720
gctttgtgaa cagtgagcat ctatatactt cacttgatgc ttcccttctg aactccaact 780
agtttatatt cagagagtta ctctgtgttg tatatgcaga gaaatacaag aaagaaagaa 840
aagccaagcc aggtctggtg gcatgaattt gtaattctaa cttttcagaa agctgagaat 900
cactactaac aatctgaaag aacaagaacc accaacaata attactaaga aatgtgctat 960
tttattgcac tggcatgttt tcacacagac tctaacttct tgaatttgtt tattttgcct 1020
gaggccacca agatcctgga catgtaaaaa tggaaagcat cctaaacagc tgaaattagt 1080
ttactgaatt ttctttgggt atgagcaaga tgatggcatc agactttcaa gataacattc 1140
aagagttatt tctcaattct gaggacatat caggcaacag cccatgatga gtagattttg 1200
gggtgttgag tggagagctg tagaatcaca cagtgtggac agactgttgg agcagggaaa 1260
gaaattggaa agtgtaatat gtggagggct taggtaggaa aacactgtgc tctgacaccc 1320
tcctgttagt catcatctca atgtttgaat ctgaaaacag ttgtactact aaaatacaac 1380
ccacggattt agtaatgtag aaagaaaagc gaacaaacaa ggacaattta gggaaactct 1440
ccattcagcc aaaagatttg caacctcatt ctgtctgaaa tctgcattcc attcagtaag 1500
gctattcaga tcttcacaaa tctagacaaa agaacagcta cataatacct gggcctgagt 1560
ctccttctaa atacaacttg cccaagacta catacctggg tcccagagta gcttccctag 1620
agctgcaatg aataaactag tcatagagga atatttatcc tgtatttaca gagccatgag 1680
agaatctgat gcagccagca gctgttgctt aggcaccaaa cctccaaaca gatcttttgc 1740
catttccagg cactgtgatc ccttgtaaag ctgactagtg ggaaagtcag gcctgctctc 1800
tggtcactca ctaccttgag ttcctgaatt ttacctacat ggaagaaatc tggtttcctg 1860
gatacggaat ctcaataagt catcccacaa gagcccagac cttcaccaat atggaggagt 1920
cacaggccct gtcagaatag tgacagcaga cagatagccc tggctctttg aatacttcaa 1980
ggttatccag cacagaaggg acagcattgt agagatgtga caatagtagg tctgtgggtc 2040
aaggaatctc tctctcccct gctgtaccac cctaccccac cacatatcac atatacacag 2100
agcaagtcac acacacacac acatacacgg gagggatggg agagaaagag agagagagag 2160
agagagagag agagagagag agagagagag agagagagag agaggagaga gagagagaga 2220
gagaatattc agcaatttca atgtatcacc tgtaaatttt ttttttggcc ttaacttgct 2280
taccaggatc tgaattcttc tgtaacactt taaatcaatc caggtagatc tgcgatgaag 2340
caactagacc tagtgtctca gatgtggaga gtgtttcaca catccaaagt tttttgtgga 2400
aatggttcaa tatgaagatt aggcctttcc taccttcatg aatccagctt gcaagactac 2460
agcagagact ttattcagag gaactaagac attagcaaat aactgataaa aaggaaggga 2520
ggtaaaatac atcacagtca ggccaaaaga atcccctggt tttgacacaa catgtgatgc 2580
tttcaactag ttcctactac cttaatttta agggaaaatt gatactttgc atgcttagtt 2640
tctgctcatg gctctgaacc gagagaactg agatctttgg agaagccaaa gtggtttaag 2700
tgacttacca gaataaatga gctggtttct cttagctgag gtttcctaat ggtgaagcac 2760
aagtagcagc cactgaaaat caaccccaca gagagaggca agcacagaaa gtcagcccaa 2820
gggatcttcc cggaccgggg agagttcagg atatcaactc gatgtcttat caccaaccag 2880
ctcggagagg ccatcttatc gacacttagg gatcagagca ctctcattaa gataagacag 2940
aaatgtgtag caggtcctta ggcagggaga ctgttccttg ctatccatag agccactcct 3000
aaaatgcctg ggagtttcta gttttctagg gataagatat ctccatgcat agcaaaataa 3060
caagagcaaa gaagagatga aatcataggg cagatttgaa ttaaacttag catagaagat 3120
ctaggtttag ccctgttgca ggttggaaaa atctaaaact gggtcaagaa gttgttaggt 3180
actacactga gcaacactga ggctgtaagg ccagaactga aactgaactg tctggcagct 3240
atcaagaggt tagggcaatt agcctggctc tcctttaaaa ttagccagtg ccttccaaat 3300
aaacacagca cccttctccc taacagtcgc tctccaaata acaacaatac gttttctcac 3360
tacaagacat tttctagagc ctctctccca gaagaagctg ttaaattaac cattgtttca 3420
ctttgcaaac atcttctgcc ttggtgacaa atgaaactac gttctaaaat caactgcaag 3480
ttctctagta ccagtaactt ctcttttctc tttgagatac gctttttagt taaattgcag 3540
acctagtcat ctccaacccc agccaaagag cacatcaccc aagcctgaga gtgtggaaag 3600
catttctctt ctagagaggt aaatgtcctt cttccactta cctgaaatgt actaataaac 3660
tctggaatcc atcagcacat agaaaagtgc atgtgagtag taattcagag ggatacaatc 3720
agccccatac aaaagaagag aactgtgata cacacattct atccctgatc tcttgatttg 3780
catctagctt agcatcagga gatctaggtg tagccctgtt tcaggttgga aaatctaggc 3840
tgggtcgaga agttgtgaat gcaacttctt gcaatgctga agtcctcaaa tttttagtta 3900
gtaatgacaa tgtatactag cctttcttgt ttattaaaac atactaaaat atgaatgaga 3960
tttggggtta agtaagtgca gctaaggaaa tgtgtgcctc aagttttgct gtgatcttaa 4020
aactgcagaa aaaagtgtac gtacacacac acacacacac acacacacac acacacacga 4080
ggagtttttc aaatgggaaa cccatcaaga tacagagaaa agaatctgtg atggtagaaa 4140
cagagtttag agttactgtg ctaatatttt ggtttaggaa gagtcttttt ctcccataat 4200
caaatgccaa tcaaaggcag tggtactaac aaagatctat gctggtggca tacaaaggga 4260
caacacagaa tcaccctacc ttccaaccct tgaatatctg actagtagaa gctcaagctc 4320
tggggttgtc aaggccattt atgcctgaga atcatactca gaaacttgaa ggatagcgtt 4380
atgttgtagg ctgtaacttc tcacataaaa acacttaaca gaaggcttcg gggagagtct 4440
aggagtaaag cacagctggg taattactaa gtaagggacg tagtttgagc atggtttttt 4500
ttctgcacgt gtgaaggtgc agtgtcattc tgtatattca gtgccaactg aggctataag 4560
agggcatcag aaccccagga acaagagtca cagaaggttt aaaaccacca tgtagaaact 4620
gaacccacaa cctcttcaaa gagcagtaaa tgcaatcgga agttatagag ttggagctta 4680
tactttctta gtcatcttca tggcagctcc gtatgatgat ctattattat tctcatgtta 4740
aagagtaaat aaacaagaac acagatcttg agctaactta gccattgtca aacagctagc 4800
aatggagttg ggcttctaat tcaaattgtt actcaaaggc tatggtctcc acgtgtaccc 4860
ttggaaagct agatagacag catccagacc attaacatac agtgtgtacc tctatgtata 4920
aatatgtatt tttacacaca tttatgtatg aaatgtatat gtataaatat atgagctgag 4980
aaagcctctt ccagatgagg ctgacaagag ttccactaaa actaccgggg tttaggcatc 5040
tcctgtggga ccattcttct gatgtcttgt ttaaacattt ttatcatgga tgtatgctcc 5100
cgacttaaaa agcacctttt ttaaaaaact aaaaacagaa atctgaatgt tgtagtaagt 5160
gtaacaatct taagtttatt cagtaattta aaaaaattgt taagcggaga aaagaaactc 5220
tgtactaaca gaggcctgag aaagcacacg gcagggaata ggggaaatgg cttccttcat 5280
tgctggacac agactgagct ccaggctgtt tcagctgcct ttttaaggct caagggcact 5340
aaaagtaaaa ccatcctgct tcctctcccc attttcattt tcacctaaaa tcccctagtc 5400
cctttgtgaa gaccagggct tcacacggtg aaagaatggt ggactcactt ctttcaatag 5460
gctgacctag tatgtacact aag 5483
<210> 10
<211> 4770
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
cttacccaac atgagcaagg tcctaagtta catccaaaca tcctccccca aatcaataat 60
taagcacttt ttatgacatg taaagttaaa taagaagtga aagctgcaga tggtgagtga 120
gagatgccat gagaaagcat tgcatatacc acattagtta atttcaggtc ttgtacattc 180
ttttctggac atgagagagt aagggatcta actaagccac cttttggaaa cataaaacat 240
aatctctgat ttgaattcaa gtctacctcc ctctaggtcc atttttaact tttagttgta 300
atttgaagac agatatagaa aaatctcaaa acattttaat atgaattata cacttagagt 360
tgatgtcaca gattctgaga ccatgggact acttagataa gatatagctc caaaagataa 420
aagcgccaaa ataatatcca gaagttctgc ctccctcgtc tggagtctcc atgcactgca 480
tacctcctat tagtgtctgc cattatatat cataccttaa aactgaagga gctttctatc 540
caactagcat atgggtccct caagaaagca gactctagtg ttttaacctt ttcgtgctat 600
atataggtaa ggagcctgaa caaaggagac ccctataagt atttgctgaa tgaaaagaga 660
atagttaatc acagtataac aaaagtcagt tcttggtaaa tacagagcat ttgggtgaca 720
ttacagtgat gtgttattgt cttttaaaaa aagtagaaaa gaatggaaat gaaacatttt 780
aaggatttct aaataagggg cagatacaag agtattttgg gttttagccc agactatact 840
gtagggggaa agcctgtctc aactttatcc caatttcata tatgtatgtc catatatgtg 900
catgtatgtg cacatgcaca catgggtgtg tatgtgtgtg tgtatggtga ttatgatgat 960
gatgaagaga tgatgtctat aacttaatgt ggttcttcct atttctgtac aaaactgaga 1020
atttggtgcc aattctctct ctctctctct ctctctctct ctctctctct ctctctctct 1080
ctctctctct ctctctctct ttttcttctt cttcttcttc ttcttcttct tcttcttctt 1140
cttcttcttc ttcttcttct tcttcttctt cttcttcttc ttcttcttct tcttcttctt 1200
ctttttatta ttattttatg tacattccag ccattgcccc caggatcccc tcccacagtt 1260
cctcatccca ttcctctttc cccttgcctc cgagagggtg ctccccccta ccagacctcc 1320
ctcttccctg gggtctcaag tctcttgagg attaggtgca ccttctccca ctgaagccag 1380
accagacagt cctctgctac atatgtgcct gtggccctca gaccagcccg tgtatgctgc 1440
ctcattggtg gctcagtctc tgggagttcc ctggggtcca ggttagttga gacttctgat 1500
cttcctatgg ggtagccctt cccttcagct tcttcaatcc ttcccataat tcaaccatag 1560
gggtttccaa cttcagtcca atgattgggt ttaagtgtct atttatgtct cagtcagctt 1620
cggattgggt ctgaggacag ccattttaca ctcttgtctg taagcacatc atagcatcag 1680
taatagtgtc aggccttgaa caccctccag ccccctgtca tgagatggat cccaatatgg 1740
gctagtcatt ggaccaactt tccttcagtt tcttctccat ttttgtccct gcagttcttt 1800
tagacaggaa caattttggg tcagaaattt tgactatggg ttactaatcc agtccctcta 1860
cttgtggtcc tgtctatcta ctggaggtgg actctctgag ttccctctcc ccattgttga 1920
gcatattggc taaggtcacc ccccccccat tgagtcctga gagtctctca cctcctgggt 1980
ctctggtact ttctagaggg ttcccctacc cctcaccatc caaggctgca tatttccatt 2040
cattctcctg gccctttggt cttctctcct gtccaacccc aatctaatct tgttcccttt 2100
cccctttcac tcccctctct cacccaggtc ccttcttccc tctgcctctc atgattattt 2160
tattccatat ctaagtggga ttaaagcatc cccacttggg tctttctgct tgttacactt 2220
cttatggtct gtgggttgta tcctacatat tctgtacttc ttggctaata tctatttatc 2280
agtgagtata taccatgcat gtccttttgg gtctgggtta cctcacttag gatgatattt 2340
tctacttcca tccatttgcc tgtaaaattt gtgatatcct catttttaat agcttaataa 2400
tattccattg tgtaaatgaa ccacattttc tgtaactatt ctttggttga gggactgccg 2460
tggactggac ttagtcggtc cctcaaccca caagaaacca gagtttcagt actcatgtgg 2520
gcaaggagat ggcaaaaaaa tgacagacac tgacacacag agagtgctgt atctgaatat 2580
aatttctcaa agcgagcatc agacttatat tacagaagaa aacaaataag ttatgtgaca 2640
cataagccaa ggtacattga agttatctga cacaaaacag aaaaattcat aaagactgac 2700
aggaaccagg cagtggttgc aactgagata aaaggcagcc ctttctaaag tcagccatta 2760
ggaagccagg tgaggatttc acaccctagt tacaatttat gctattccac tgagccttgt 2820
gaaagcttgt accaaggggg ttcagctctt gcttatgaat aatgcaatac tgtagttcca 2880
ccttaaacca catccctcct tcttcctagg ccattgtaaa ttcctgcata tgagagtgac 2940
cggctgtaat tctaagctta ctttgtagaa cttgccctga gatttttagc tcttatccag 3000
taaaatactg caagaaagca tgcaaaaccc tccacactaa ctcagggaca aatctggtta 3060
tggggggggc tggtgagatg gctcagtggg taagagcacc cgactgctct tccgaaggtc 3120
cgaagttcaa atcccagcaa ccacatggtg gctcacaacc acccgtaatg agatctgatg 3180
ccctcttctg gtgcgtctga agacagctac agtgtactta catataataa ataaataaat 3240
ctttaaaaaa aaaaaaaaaa aaaagattta aaaaaaaaaa aataaaaata aaaaaaaaaa 3300
atctggttat ggggcaccag agactctcca ggagacaagt ttctgtgaaa ctttttgcct 3360
caggactgtg tccaagcttt tgggcttgcc acgcagactt cactggagtg ggtgtggcaa 3420
gagacatctg agttgtttcc agatttgttt ctggctatta caaataaggc tgctatgaga 3480
atagtggagt acgtgtcctt gtgatatggt ggggcatctt ttgggtatat gcccaagagt 3540
ggtatagctg ggtctcctag tagtactatg tccagttctc tgaggaacct ccagattgat 3600
ttccagagtg gttgtaccag tttgcaatcc caccagcaat ggaggagtgt tcctctttct 3660
ccacatcttc accagcatct gctgtctcct gagtttttta tcttagccat tctgattgat 3720
gaaaggtgaa atctcagggt agttttgatt tgcatttccc tgatgaataa ggatgttgaa 3780
catttcttta agtgcttctt ggcttctgat atccttctgt tatgaattct ctgtttaact 3840
ctgtacccca tgttttaaag aattttttat tatatatata tatatttgag acagggtttc 3900
tctgtatagc cctggctgtc ctggaactca ctttgtagac caggctggcc tcaaatctgc 3960
ctgcctctgc ctcccaagtg ctgggattaa aggcgtgtgc caccacgcac tgcttattat 4020
atatttttta cagtccagtc actgccccct ttccagtctg ctctcccaca gttcttcatc 4080
ccattcctct tcccccctgt cttcaagggg atgttctcta gaacccctgc taggcctccc 4140
cactcccaga ggcctcaagt ctctaaggtt gggtacctgt tctcccactg aagccagacc 4200
aggcagttgt atcccatttt taaattgggt tatttgtttt gttttttgga ggttaacttc 4260
ttgagctctt tatatatttt agatattagc actctttcgg atgtaaggtt agtaaagttt 4320
tttcccccaa tctgtaggtt gccaatttat cctattgatg gtgtcttttg ttttacagaa 4380
gctttttggt ttcatgaggt cctatttgtc agttgttgat cttagagcct gagccattgg 4440
tgttccttac gatcaagaaa atttcccctg tgccaatgag ttcaaagctc cttcccactt 4500
tctcttctat tagattcaat gtatctggtt ttatgttgag gtccttgatc cacttagact 4560
tgaactttgt gcaaagtgat aaatatgggt ctattttcat tgttctgcat acatacatac 4620
atacatacat acatacatac ataaatacat acatagttat accagcacca tttattgaag 4680
atgttttctt ttttccactg catgattttg gcttctttgt caaagattaa gtgtacatag 4740
gtgtgtgggt ttatgtctgg gtctttgatt 4770
<210> 11
<211> 12726
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
actagcttca gagaagtttg caatcagggc actctcttcc aagcctagag acccagggaa 60
aggggtacgg gggtgtccca aggcaaagag aatctacact ttttgccccc ggagaggcta 120
cttccctccc aagatgcctg ggattttcca cttcagcagg gggaaggtaa gtcacatagc 180
aaaataatga gggcacagaa cagatgacct ccctatagag ttttgaatga gaaacacagc 240
agggcagatg tgccccttct ctagtctagg aggagctagg tccagcccct gaacatcctc 300
cccctcagaa aagctgaggc cagactaaga attcaccaga ccaaggagct acaacaggac 360
atcagagctg aggctgcaaa gccaggactg agaccagacc aggcaggaaa ctgtcaagag 420
ctttggtcac caggcctggc tgccctccaa catcagctgg ctctttctaa attgacacac 480
cacatgtccc taaaattctc tcttcaagta ataccaccat caaagcagga catttcccag 540
agccttagag cctggtgtct gctcagtggg actcaacccc agaagaagct gttaaatcac 600
ccactgtttc agtttacaaa cttcttacga cttggcaaca agtgaaacta cattctggca 660
gcaactgcaa gttccctagt acccaggact tcccgttttt tcttgctgta ctccctcctg 720
ttaaatcaca gactcatcca tctccaaccc ccagaatata gagaaagagc acaacactac 780
atcttaactc ctgagacgtg gagaacactt ctcctcctga gagcttaagt accaaatgga 840
agctactttt cccccttggt ctcaaatgta ttactagatt ctgaactgga ctccaccatc 900
acgtaagaaa gcagtcatgg gcagtaattc tgggagatcc agataggaca tgccagcccc 960
acactggtgg cataggaagc caagttgctg cttcctccct gtgcactccc atttgtctgg 1020
cctctcttga tctcagctgg cgctcacttc acatcagcta tgatgcaatc cagcaactaa 1080
agtattagtt aataaatgct gacagcacag ccttttctgg tcacgtattc atactaaaat 1140
acgggggaga gttgggggga gagggggata tatgggaaat ctctgtacct tcctctccat 1200
tttgctatga cctaaagctg ccctttaaaa aatacaaggg gctgggcaca gtggttcacg 1260
cctgtaaacc cagcactttg ggaggccgag gcgcgtggat cacctgaggt caggagttca 1320
agacccgcct ggccaacatg gcaaaacccc gtttctacta aaaatacaaa aagtagctgg 1380
gcgtggtcgc atgcatctgt agtcccagct actcaggagg ctgaggcaag agaattgctt 1440
gaacctggga ggcggcggtt gaagtgagcc aagatcatgc cattgccctc cagcctgggc 1500
aacagagcaa gactccttct caagagaaaa aacaaaacaa aacaagaaaa aacaaagaat 1560
gagctctcca cgcgaaaaat ccattgagat gcaaaggaag gaagctatca ttgtggaatt 1620
gcacatgtca gttacattaa cgtttttgga gcaaggtaga gctcatctct cccacaagca 1680
aattccagcc caaagcattg atactaataa agtgccatgc tgcgatgtgc agggggcaga 1740
cagtgtctcc aagctcccta cacacatgcc ttcccacagt ttgccctttc ttgaccccag 1800
aagcatcagg ccccttcacc ctcgagggcc actatcagga gtttgaatta atggcaatca 1860
ccatgcacag ggaaggctgt ggaattctga cataaaaaca cttagtggag ggcttggaaa 1920
aagtctagta ggagcaagac gcaagctgga ctaattatct aaaacaagag acctggtttg 1980
gggatcttaa tgttctcaaa aaagaaaatt attattattt ttcattttgc actttgtgcc 2040
ataaaacatt ttcaacaaaa catagaatct catttctttt gagggaaaat gattgggaga 2100
ccagctcatt gctggcacag aggcctggtt cattcataat tccttcatag gcaagacacc 2160
aggtgaaccg atatagccga gctggaagag ctctccaagg cagagactct gagccaagga 2220
atgttcaaag agctagcatg tattgtggga ttactatgcg ccaggaattt tttacactgc 2280
atcacgttcc atcttcacaa cagccctaga aaggaagaac tattattacc cccgttttat 2340
aggtgaataa acaagggcac aggtccttga tgtaacagcc aggatcaaac agctgggaag 2400
acgagaaaac ctttcccagg ctaggataac agaggatttg gttgaaaata caggcaatta 2460
ggtgctacct ctgggaaaag gggccaggag aggaaggaga cacttttccc tgcatgccct 2520
gatgtcctat ttgaacattt tatcatgaac acgaacttcc tatttaaaaa acacttttta 2580
ttgaaaagat aaatctgtgt gttgtattgt gtcactcagt tcaagtactt gaaatttatt 2640
gaattgtatt ttctaaaaaa tagatagttg agtaaaagca agctcacatt acatagacgg 2700
atcacagtgc acggctgcgg agctgggagc agtggcttcg tttcatgcag gaaagagaac 2760
ttggttcagg agtgtctacg ttgcttaaga caggagagca ctaaaaatga aaccatccag 2820
ccatcctccc ccattttcat tttcacacca aagaatccca ccgcggcaga ggaccaccgt 2880
ctctgtttag acaatcggtg aagaatggat gacctcactt tccccaacag gcgggtcctg 2940
aaatgttatg cacgaaacaa aacttgagta aatgcccaac agaggtcact gttttatcga 3000
tcttgaagag atctcttctt agcaaagcaa agaaaccgat tgtgaaggta acaccatgtt 3060
tggtaaataa gtgttttggt gttgtgcaag ggtctggttt cagcctgaag ccatctcaga 3120
gctgtctggg tctctggaga ctggagggac aacctagtct agagcccatt tgcatgagac 3180
caaggatcct cctgcaagag acaccatcct gagggaagag ggcttctgaa ccagcttgac 3240
ccaataagaa attcttgggt gccgacgcgg aagcagattc agagcctaga gccgtgcctg 3300
cgtccgtagt ttccttctag cttcttttga tttcaaatca agacttacag ggagagggag 3360
cgataaacac aaactctgca agatgccaca aggtcctcct ttgacatccc caacaaagag 3420
gtgagtagta ttctccccct ttctgccctg aaccaagtgg gcttcagtaa tttcagggct 3480
ccaggagacc tggggcccat gcaggtgccc cagtgaaaca gtggtgaaga gactcagtgg 3540
caatggggag agcactggca gcacaaggca aacctctggc acagagagca aagtcctcac 3600
tgggaggatt cccaaggggt cacttgggag agggcagggc agcagccaac ctcctctaag 3660
tgggctgaag caggtgaaga aagtggcaga agccacgcgg tggcaaaaag gagtcacaca 3720
ctccacctgg agacgccttg aagtaactgc acgaaatttg aggatggcca ggcagttcta 3780
caacagccgc tcacagggag agccagaaca cagaagaact cagatgactg gtagtattac 3840
cttcttcata atcccaggct tggggggctg cgatggagtc agaggaaact cagttcagaa 3900
catctttggt ttttacaaat acaaattaac tggaacgcta aattctagcc tgttaatctg 3960
gtcactgaaa aaaaattttt tttttttcaa aaaacatagc tttagcttat tttttttctc 4020
tttgtaaaac ttcgtgcatg acttcagctt tactctttgt caagacatgc caaagtgctg 4080
agtcactaat aaaagaaaaa aagaaagtaa aggaagagtg gttctgcttc ttagcgctag 4140
cctcaatgac gacctaagct gcacttttcc ccctagttgt gtcttgccat gctaaaggac 4200
gtcacattgc acaatcttaa taaggtttcc aatcagcccc acccgctctg gccccaccct 4260
caccctccaa caaagattta tcaaatgtgg gattttccca tgagtctcaa tattagagtc 4320
tcaaccccca ataaatatag gactggagat gtctgaggct cattctgccc tcgagcccac 4380
cgggaacgaa agagaagctc tatctcccct ccaggagccc agctatgaac tccttctcca 4440
caagtaagtg caggaaatcc ttagccctgg aactgccagc ggcggtcgag ccctgtgtga 4500
gggaggggtg tgtggcccag ggagggctgg cgggcggcca gcagcagagg caggctccca 4560
gctgtgctgt cagctcaccc ctgcgctcgc tcccctccgg cacaggcgcc ttcggtccag 4620
ttgccttctc cctggggctg ctcctggtgt tgcctgctgc cttccctgcc ccagtacccc 4680
caggagaaga ttccaaagat gtagccgccc cacacagaca gccactcacc tcttcagaac 4740
gaattgacaa acaaattcgg tacatcctcg acggcatctc agccctgaga aaggaggtgg 4800
gtaggcttgg cgatggggtt gaagggcccg gtgcgcatgc gttccccttg cccctgcgtg 4860
tggccggggg ctgcctgcat taggaggtct ttgctgggtt ctagagcact gtagatttga 4920
ggccaacggg gccgactaga ctgacttctg tatttatcct ttgctggtgt caggaagttc 4980
ctttcctttc tggaaaatgc agaatgggtc tgaaatccat gcccaccttt ggcatgagct 5040
gagggttatt gcttctcagg gcttcctttt ccctttccaa aaaattaggt ctgtgaagct 5100
cctttttgtc ccccgggctt tggaaggact agaaaagtgc cacctgaaag gcatgttcag 5160
cttctcagag cagttgcagt actttttggt tatgtaaact caatggctag gattcctcaa 5220
agccattcca gctaagattc atacctcaga gcccaccaaa gtggcaaatc ataaataggt 5280
taaagcatct ccccactttc aatgcaaggt attttggtcc tgtttggtag aaagaaaaga 5340
acacaggagg ggagattggg agcccacact cgaattctgg ttctgccaaa ccagccttgt 5400
gatcttgggt aaattcccta ccacctctgg actccatcag taaaattggg cgtggactag 5460
gtgatctcat agatccttcc tgctggaaca ttctatggct tgaattatat tctcctaatt 5520
attgtcaaaa ttgctgttat taagtatcta ctgtgtgcca ggcactttaa ataaatattg 5580
tgtctaatct tcaaaacaaa tttgcaagga aggtttttgg agataaggaa actgagactc 5640
aggattaagt aacacaccta aagtcacagg tgagcttgga actgaaccca agtgtgcccc 5700
cactccactg gaatttgctt gccaggatgc caatgagttg tagcttcatt tttcttagag 5760
actttcctgg ctgtggttga acaatgaaaa ggccctctag tggtgtttgt tttagggaca 5820
cttaggtgat aacaattctg gtattctttc ccagacatgt aacaagagta acatgtgtga 5880
aagcagcaaa gaggcactgg cagaaaacaa cctgaacctt ccaaagatgg ctgaaaaaga 5940
tggatgcttc caatctggat tcaatgaggt accaacttgt cgcactcact tttcactatt 6000
ccttaggcaa aacttctccc tcttgcatgc agtgcctgta tacatataga tccaggcagc 6060
aacaaaaagt gggtaaatgt aaagaatgtt atgtaaattt catgaggagg ccaacttcaa 6120
gcttttttaa aggcagttta ttcttggaca ggtatggcca gagatggtgc cactgtggtg 6180
agattttaac aactgtcaaa tgtttaaaac tcccacaggt ttaattagtt catcctggga 6240
aaggtactct cagggccttt tccctctctg gctgcccctg gcagggtcca ggtctgccct 6300
ccctccctgc ccagctcatt ctccacagtg agataacctg cactgtcttc tgattatttt 6360
ataaaaggag gttccagccc agcattaaca agggcaagag tgcaggaaga acatcaaggg 6420
ggacaatcag agaaggatcc ccattgccac attctagcat ctgttgggct ttggataaaa 6480
ctaattacat ggggcctctg attgtccagt tatttaaaat ggtgctgtcc aatgtcccaa 6540
aacatgctgc ctaagaggta cttgaagttc tctagaggag cagagggaaa agatgtcgaa 6600
ctgtggcaat tttaactttt caaattgatt ctatctcctg gcgataacca attttcccac 6660
catctttcct cttaggagac ttgcctggtg aaaatcatca ctggtctttt ggagtttgag 6720
gtatacctag agtacctcca gaacagattt gagagtagtg aggaacaagc cagagctgtg 6780
cagatgagta caaaagtcct gatccagttc ctgcagaaaa aggtgggtgt gtcctcattc 6840
cctcaacttg gtgtggggga agacaggctc aaagacagtg tcctggacaa ctcagggatg 6900
caatgccact tccaaaagag aaggctacac gtaaacaaaa gagtctgaga aatagtttct 6960
gattgttatt gttaaatctt tttttgtttg tttggttggt tggctctctt ctgcaaagga 7020
catcaataac tgtattttaa actatatatt aactgaggtg gattttaaca tcaattttta 7080
atagtgcaag agatttaaaa ccaaaggcgg gggggcgggc agaaaaaagt gcatccaact 7140
ccagccagtg atccacagaa acaaagacca aggagcacaa aatgatttta agattttagt 7200
cattgccaag tgacattctt ctcactgtgg ttgtttcaat tctttttcct accttttacc 7260
agagagttag ttcagagaaa tggtcagaga ctcaagggtg gaaagaggta ccaaaggctt 7320
tggccaccag tagctggcta ttcagacagc agggagtaga cttgctggct agcatgtgga 7380
ggagccaaag ctcaataaga aggggcctag aatgaaaccc ttggtgctga tcctgcctct 7440
gccatttcta cttaagccag ggtttctcat atgttaacat gcatgggaat tccctgggca 7500
tcttcttgtg gtgtggagtc tgacttagca agcctcgggt gggtttgagg gtcaaatttc 7560
taccaggctt atatccctgg tgatgctgca gaattccagg accacacttg gaggtttaag 7620
gccttccaca agttacttat cccatatggt gggtctatgg aaaggtgttt cccagtcctc 7680
tttacaccac cggatcagtg gtctttcaac agatcctaaa gggatggtga gagggaaact 7740
ggagaaaagt atcagattta gaggccactg aagaacccat attaaaatgc ctttaagtat 7800
gggctcttca ttcatatact aaatatgaac tatgtgccag gcattatttc atatgacaga 7860
atacaaacaa ataagatagt gatgctggtc aggcttggtg gctcatgcct gtattcccta 7920
aactttggga gcctaaggtg agaactcctt gaactcctaa ggccaggagt tcaagaccag 7980
cctggataac atagcaagac cccatctcta caaaaaacca aaaccaaaca aacaaaaatg 8040
atagtggtgc ttccctcagg atgcttgtgg tctaatggga gacagaacag caaagggatg 8100
attagaagtt ggttgctgtg agccaggcac agtgctgata taatcccagc gctatgggag 8160
gctgaggtgg gtggatcatt tgaggccagg agtttaagac cagcctggtc aacatggtaa 8220
aaccccatct ctacttaaaa atacaaaaaa gttagccagg catggtggca tacacctgta 8280
acccagctac tcaggaggct gaggcacatg aatcacttga acccaggagg cagaggttgc 8340
tgtgcaccac tgcactccag cctgggtgac agaacgagac cttgactcaa aaaaaaaaaa 8400
aagaagtttg ttgctatgga agggtcctac tcagagcagg caccccagtt aatctcattc 8460
accccacatt tcacatttga acatcatccc atagcccaga gcatccctcc actgcaaagg 8520
atttattcaa catttaaaca atccttttta ctttcatttt ccttcaggca aagaatctag 8580
atgcaataac cacccctgac ccaaccacaa atgccagcct gctgacgaag ctgcaggcac 8640
agaaccagtg gctgcaggac atgacaactc atctcattct gcgcagcttt aaggagttcc 8700
tgcagtccag cctgagggct cttcggcaaa tgtagcatgg gcacctcaga ttgttgttgt 8760
taatgggcat tccttcttct ggtcagaaac ctgtccactg ggcacagaac ttatgttgtt 8820
ctctatggag aactaaaagt atgagcgtta ggacactatt ttaattattt ttaatttatt 8880
aatatttaaa tatgtgaagc tgagttaatt tatgtaagtc atatttatat ttttaagaag 8940
taccacttga aacattttat gtattagttt tgaaataata atggaaagtg gctatgcagt 9000
ttgaatatcc tttgtttcag agccagatca tttcttggaa agtgtaggct tacctcaaat 9060
aaatggctaa cttatacata tttttaaaga aatatttata ttgtatttat ataatgtata 9120
aatggttttt ataccaataa atggcatttt aaaaaattca gcaactttga gtgtgtcacg 9180
tgaagcttaa tataaacaag tttcttgtca ctgccaccac cacgaccaaa aaaagctaat 9240
caatcactat atataataca tatatatact atatataata aatatatata ctatatataa 9300
tacatatata cactatatat aatacatata tactatatat acacatatat actatatata 9360
cacatatata ttatgaatgt atatatatag tatatatagt atatatacta tgtatgtata 9420
tatatagtat atatagtata tatactatgt atgtgtatat atagtatata tagtatatat 9480
agtatatata ctatgtatgt atatatatag tatatatagt atatatactg tgtatgtata 9540
tatatagtat atatatacta tatatgcata catagtatat atgcatatat actatatata 9600
ctatatattt atatatacta tatactatat atactatata ctgtatatat actatatatg 9660
tatgtatacg atatatatat atactatata tgtacacaca cacatatata tatacatata 9720
agcacctact acatgccagg catcattaaa tgtgttgcat ccatcacgtc atttaacccc 9780
agcacttgca cactcctttc tggttgtgga agactaagta atttatctaa gtcacccagc 9840
tggaaggtca ggcagggacc cagatttgaa atccaagtct acctacctac aggtccccta 9900
ctcttaacct gtaggtccca ctgcctaccc aggaactgag ggatgatgta gaaaatccca 9960
aaacatgtta atatagggaa tacctataaa catgcaatca aagtctttgg gactatacaa 10020
ccactgtata aagcataaca atgtacaagc ttccaaacaa taactagaag ttctgcctcc 10080
ctcttctggg ttcctaaagc actgcaccta tctacctgtc aaagcatcta ccacattgta 10140
ccacacctta aaatcaatgg tttttttctt ctcagccagc atgtggatgc ctcaataaag 10200
cagactcctt tcatgaccta aaactaattt caggggggaa aaaaagacga gctgggcgca 10260
gtggctcacg cctataatcc cagcactttg ggaggctgag gcgggaggat cacttgaggt 10320
cagaagacca gcctggccaa catggcaaaa ccccgtctct actaaaaata caaaaattag 10380
ctgggcgtgg tggcgcacct ataatcccag ctactcagga agctgagaca tgataatcgc 10440
ttgagcctgg gaggtagagc ctggggctgc actccatcct gggcaacaga gggagattct 10500
gtctcaaaaa ataataataa taatataaat aaataaataa tttttttaaa aaaagactct 10560
ttcctatatt aatctttgca tcctgtgccc atggccccaa acctgaccaa tgaaggcccc 10620
agtaaatatt ttttgaacaa aagaaaatat agatgatcaa agataagaaa gataagaaga 10680
cacctcaatt cttgtaggca tatagtggta ggggaaatca ctaattctgt gtgtttatgt 10740
atcttcatct tcaggaaaaa tagcaagaat tagaaagaaa cactcaaagg acttccagag 10800
aaggcaatga atagccagtg catgtacacc tacctccatt tcctttgcca ctggcaataa 10860
tcttcatctg ccctctcccc tccccgacct aaagtggtag tgagagaggc aatctggaca 10920
acttaacatg gcctcgttta tccatctcaa cacgacactg ggaatttggt gcagatttcc 10980
cctttctaac ccctgcaata taaaagttct gtctccttat aaagcttttc cccattctac 11040
ccgctacaga cttcttcctc caggggagga gttcttctgg gtaagggaaa gtccacagag 11100
gtcaaaaacc gagaggagct gagccagaaa agagccacat actctgattt ctagaaacca 11160
cgcatcacaa gtgggcttcc caaaactagg gtcaagtcaa agaacaaaga gaaattgcga 11220
tcaactgatg ctttcattct tcaaacaaaa atgggttgag tttcatagat aagtcaggga 11280
aagctcctga gaaagaggtg aaagggtaga catgatccct gccctcttgt gtagcacact 11340
atggaaggga aaatagacat taaataaaga ctataaatgt gataaggttt ccaaaaagaa 11400
atgtgggctg tgctgagaac ccatactaga ggcacggata atctaagtga accctggttt 11460
ggctgctcac cactcgaaag ccagacatga gagacaaggt tggtgggagg aaaagccagt 11520
tcatcagaaa gccagtaaac caagaagatg gtgagctagt attttaaagt accatcttga 11580
attttaaaat ttatcacagt agtttttaaa gagaaacttg gtatgggaga tacgtgggag 11640
tggtgcgtgg tgtagggtct gtgtgtcttg ttctgatggc tatctcaggt aaccgcctgt 11700
ccggaggtct gtttgggatc atcttaactt cagctagatg atggattcat tgttcatgat 11760
tccttctaac caggaggatt ctgcaatggg ggctccttgc ctcgtttgtt taaagatcag 11820
cctctgggat ttttaaagca agagtataat tagataagca tacattgcca gaggggagtg 11880
tctagagagg gaaggaatga agaggtgaga ggaaagaaaa ggaagaaaaa gaaagtgggt 11940
aagaggcaga gcaagatggc agaatagaaa gctccaccaa tggaccccct ggcaaggata 12000
caaagttaac aactatctgc acagaaaaac aaacaaacaa aaaacacctt cataagaatc 12060
agaactcagg tgagcacaca tagtacctgg ttttaacttc atatcactga aacaggcact 12120
gaagaaatta aaaaacagtc ctgaatcaca atgctacccc tcccctatcc acagcagcag 12180
tggtgtggtg cggagaatgt ctctgggtgc tgggagaagg agaacacatc aattgtgggg 12240
cactgaactc agtactgtcc tgttagagga gaaaggaaaa ccagactaaa cttagctgat 12300
gtccactcac agagggagca tttaaaccat ccctagccca agaggaattg tcaatcccca 12360
gcagtccaaa cttgagtagc cgcaaaactc tccactgagg gccaaacttg aaaggcagtc 12420
taggccataa ggactgcaac tcttaggcaa gtactagggc tcaacaaggc ccggagacct 12480
agtggactga ggggacatgt gacataccga gataccagct gaggcagcca agggagtatt 12540
ggcttcaccc ctctcctaat cctaggctgc acaagtcata gcttcaaaag agactttttc 12600
tttctgcttg aggagagaag acagaagagt ggggaggact tggccttacc tcttggatac 12660
cagctcagct acagcaggat agggcactag tcagagtcat aaggcccgta ttccagaccc 12720
aagctc 12726
<210> 12
<211> 108
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aggcccgtat tccagaccca agctcgtcga cctgcagcca agctatcgaa ttcctgcagc 60
ccaattccga tcatattcaa taacccttaa tataacttcg tataatgt 108
<210> 13
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ctatacgaag ttattaggtc cctcgagggg atccactagt cttacccaac atgagcaagg 60
tcctaagtta catccaaaca 80
<210> 14
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
tgcatcgcat tgtctgagta gg 22
<210> 15
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
acttaggacc ttgctcatgt tgg 23
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gctcgactag agcttgcgga 20
<210> 17
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
cagaagcctg atatcttagt gtc 23
<210> 18
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ccatggaagg agttacagag a 21
<210> 19
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
gtactgaggc atataaagtt tgc 23
<210> 20
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gggaccacta tggttgaat 19
<210> 21
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
cagaagcctg atatcttagt gtc 23
<210> 22
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
agtctcaata gctccgccag agg 23
<210> 23
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
gtctatacca cttcacaagt cgg 23
<210> 24
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gggcgcctgc tgctagctga tgg 23
<210> 25
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
tgctggccaa cccacaatgc tgg 23
<210> 26
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
agtctcctgc gtggagaaaa ggg 23
<210> 27
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
tgtgctatct gctcacttgc cgg 23
<210> 28
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gccttcactt acttgcagag agg 23
<210> 29
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
atgcttaggc ataacgcact agg 23
<210> 30
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
gtccacaaac tgatatgctt agg 23
<210> 31
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
tgcctaagca tatcagtttg tgg 23
<210> 32
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
aagtcacttt gagatctact cgg 23
<210> 33
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
taagtcagat acctgacaac agg 23
<210> 34
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
tattctgtta cctagccaga tgg 23
<210> 35
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
ttccaagaaa ccatctggct agg 23
<210> 36
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
gaactgacaa tatgaatgtt ggg 23
<210> 37
<211> 132
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
gaattctaat acgactcact atagggggtc ttcgagaaga cctgttttag agctagaaat 60
agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120
tttaaaggat cc 132
<210> 38
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
agtctcctgc gtggagaaaa 20
<210> 39
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
taggagtctc ctgcgtggag aaaa 24
<210> 40
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
ttttctccac gcaggagact 20
<210> 41
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
aaacttttct ccacgcagga gact 24
<210> 42
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
tattctgtta cctagccaga 20
<210> 43
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
taggtattct gttacctagc caga 24
<210> 44
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
tctggctagg taacagaata 20
<210> 45
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
aaactctggc taggtaacag aata 24
<210> 46
<211> 1573
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
aatctactct aatcgcctgt gtgtttacac tgggttacat tctttagagt gtacttatat 60
tctccttttg cattctcaat ataaattaat ctgctagata taaagctgtt ctctttattt 120
tagtgtaatt tttttcttca cattgaattc taggagaaac tatgctagtg atatataatt 180
cttgaactat taaacatggg agcataagaa aacaagaatc ttaaggcaat ctgcagagtg 240
aagaagctga ttgtgatcct gagagtgtgt tttgtaaatg gttttggatt ttatgtacag 300
agcctacttt cagcctggaa tcattctgaa tgctagctag atatctggag acaggtggac 360
agaaaaccag gaactagtct gaaaaagaaa ctaaccaaag ggaagaagtc tgtttaagtt 420
tgacccagcc tagaagactt gagcattgga ggggttattc agagtgagac gtaccacctt 480
cagattcaaa tcctgtcatc cagtagaagg gagcttcaaa cacaagctag ctaagataca 540
atgaggtcct tcttcgatat ctttatcttc catataccat gaatcaaaga aacttcaaca 600
acatgaggac tgcaacagac cttcaagcct ccttgcatga cctggaaatg ttttggggtg 660
tcctggcagc agtgggatca gcactaacag ataagggcaa ctctcacaga gactaaaggt 720
cttaactaag aagatagcca agagaccact ggggagaatg cagagaatag gcttggactt 780
ggaagccaag attgcttgac aacagacaga agatatttct gtacttcacc cactttaccc 840
acctggcaac tcctggaaac aactgcacaa aatttggagg tgaacaaacc attagaaaca 900
actggtcctg acaagacaca ggaaaaacaa gcaatatgca acattactgt ctgttgtcca 960
ggttgggtgc tgggggtggg agagggagtg tgtgtctttg tatgatctga aaaaactcag 1020
gtcagaacat ctgtagatcc ttacagacat acaaaagaat cctagcctct tattcatgtg 1080
tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtatgtgtg tgtcgtctgt 1140
catgcgcgcg tgcctgcgtt taaataacat cagctttagc ttctctttct ccttataaaa 1200
cattgtgaat ttcagttttc tttcccatca agacatgctc aagtgctgag tcacttttaa 1260
agaaaaaaaa gaagagtgct catgcttctt agggctagcc tcaaggatga cttaagcaca 1320
ctttcccctt cctagttgtg attctttcga tgctaaacga cgtcacattg tgcaatctta 1380
ataaggtttc caatcagccc cacccactct ggccccaccc ccaccctcca acaaagattt 1440
ttatcaaatg tgggattttc ccatgagtct caaaattaga gagttgactc ctaataaata 1500
tgagactggg gatgtctgta gctcattctg ctctggagcc caccaagaac gatagtcaat 1560
tccagaaacc gct 1573
<210> 47
<211> 1328
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
agtgactgaa agacgcatct cagctggtaa agttcttacc caacatgagc aaggtcctaa 60
gttacatcca aacatcctcc cccaaatcaa taattaagca ctttttatga catgtaaagt 120
taaataagaa gtgaaagctg cagatggtga gtgagagatg ccatgagaaa gcattgcata 180
taccacatta gttaatttca ggtcttgtac attcttttct ggacatgaga gagtaaggga 240
tctaactaag ccaccttttg gaaacataaa acataatctc tgatttgaat tcaagtctac 300
ctccctctag gtccattttt aacttttagt tgtaatttga agacagatat agaaaaatct 360
caaaacattt taatatgaat tatacactta gagttgatgt cacagattct gagaccatgg 420
gactacttag ataagatata gctccaaaag ataaaagcgc caaaataata tccagaagtt 480
ctgcctccct cgtctggagt ctccatgcac tgcatacctc ctattagtgt ctgccattat 540
atatcatacc ttaaaactga aggagctttc tatccaacta gcatatgggt ccctcaagaa 600
agcagactct agtgttttaa ccttttcgtg ctatatatag gtaaggagcc tgaacaaagg 660
agacccctat aagtatttgc tgaatgaaaa gagaatagtt aatcacagta taacaaaagt 720
cagttcttgg taaatacaga gcatttgggt gacattacag tgatgtgtta ttgtctttta 780
aaaaaagtag aaaagaatgg aaatgaaaca ttttaaggat ttctaaataa ggggcagata 840
caagagtatt ttgggtttta gcccagacta tactgtaggg ggaaagcctg tctcaacttt 900
atcccaattt catatatgta tgtccatata tgtgcatgta tgtgcacatg cacacatggg 960
tgtgtatgtg tgtgtgtatg gtgattatga tgatgatgaa gagatgatgt ctataactta 1020
atgtggttct tcctatttct gtacaaaact gagaatttgg tgccaattct ctctctctct 1080
ctctctctct ctctctctct ctctctctct ctctctctct ctctctctct ctctttttct 1140
tcttcttctt cttcttcttc ttcttcttct tcttcttctt cttcttcttc ttcttcttct 1200
tcttcttctt cttcttcttc ttcttcttct tcttcttttt attattattt tatgtacatt 1260
ccagccattg cccccaggat cccctcccac agttcctcat cccattcctc tttccccttg 1320
cctccgag 1328
<210> 48
<211> 4756
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
atgaactcct tctccacaag taagtgcagg aaatccttag ccctggaact gccagcggcg 60
gtcgagccct gtgtgaggga ggggtgtgtg gcccagggag ggctggcggg cggccagcag 120
cagaggcagg ctcccagctg tgctgtcagc tcacccctgc gctcgctccc ctccggcaca 180
ggcgccttcg gtccagttgc cttctccctg gggctgctcc tggtgttgcc tgctgccttc 240
cctgccccag tacccccagg agaagattcc aaagatgtag ccgccccaca cagacagcca 300
ctcacctctt cagaacgaat tgacaaacaa attcggtaca tcctcgacgg catctcagcc 360
ctgagaaagg aggtgggtag gcttggcgat ggggttgaag ggcccggtgc gcatgcgttc 420
cccttgcccc tgcgtgtggc cgggggctgc ctgcattagg aggtctttgc tgggttctag 480
agcactgtag atttgaggcc aacggggccg actagactga cttctgtatt tatcctttgc 540
tggtgtcagg aagttccttt cctttctgga aaatgcagaa tgggtctgaa atccatgccc 600
acctttggca tgagctgagg gttattgctt ctcagggctt ccttttccct ttccaaaaaa 660
ttaggtctgt gaagctcctt tttgtccccc gggctttgga aggactagaa aagtgccacc 720
tgaaaggcat gttcagcttc tcagagcagt tgcagtactt tttggttatg taaactcaat 780
ggctaggatt cctcaaagcc attccagcta agattcatac ctcagagccc accaaagtgg 840
caaatcataa ataggttaaa gcatctcccc actttcaatg caaggtattt tggtcctgtt 900
tggtagaaag aaaagaacac aggaggggag attgggagcc cacactcgaa ttctggttct 960
gccaaaccag ccttgtgatc ttgggtaaat tccctaccac ctctggactc catcagtaaa 1020
attgggcgtg gactaggtga tctcatagat ccttcctgct ggaacattct atggcttgaa 1080
ttatattctc ctaattattg tcaaaattgc tgttattaag tatctactgt gtgccaggca 1140
ctttaaataa atattgtgtc taatcttcaa aacaaatttg caaggaaggt ttttggagat 1200
aaggaaactg agactcagga ttaagtaaca cacctaaagt cacaggtgag cttggaactg 1260
aacccaagtg tgcccccact ccactggaat ttgcttgcca ggatgccaat gagttgtagc 1320
ttcatttttc ttagagactt tcctggctgt ggttgaacaa tgaaaaggcc ctctagtggt 1380
gtttgtttta gggacactta ggtgataaca attctggtat tctttcccag acatgtaaca 1440
agagtaacat gtgtgaaagc agcaaagagg cactggcaga aaacaacctg aaccttccaa 1500
agatggctga aaaagatgga tgcttccaat ctggattcaa tgaggtacca acttgtcgca 1560
ctcacttttc actattcctt aggcaaaact tctccctctt gcatgcagtg cctgtataca 1620
tatagatcca ggcagcaaca aaaagtgggt aaatgtaaag aatgttatgt aaatttcatg 1680
aggaggccaa cttcaagctt ttttaaaggc agtttattct tggacaggta tggccagaga 1740
tggtgccact gtggtgagat tttaacaact gtcaaatgtt taaaactccc acaggtttaa 1800
ttagttcatc ctgggaaagg tactctcagg gccttttccc tctctggctg cccctggcag 1860
ggtccaggtc tgccctccct ccctgcccag ctcattctcc acagtgagat aacctgcact 1920
gtcttctgat tattttataa aaggaggttc cagcccagca ttaacaaggg caagagtgca 1980
ggaagaacat caagggggac aatcagagaa ggatccccat tgccacattc tagcatctgt 2040
tgggctttgg ataaaactaa ttacatgggg cctctgattg tccagttatt taaaatggtg 2100
ctgtccaatg tcccaaaaca tgctgcctaa gaggtacttg aagttctcta gaggagcaga 2160
gggaaaagat gtcgaactgt ggcaatttta acttttcaaa ttgattctat ctcctggcga 2220
taaccaattt tcccaccatc tttcctctta ggagacttgc ctggtgaaaa tcatcactgg 2280
tcttttggag tttgaggtat acctagagta cctccagaac agatttgaga gtagtgagga 2340
acaagccaga gctgtgcaga tgagtacaaa agtcctgatc cagttcctgc agaaaaaggt 2400
gggtgtgtcc tcattccctc aacttggtgt gggggaagac aggctcaaag acagtgtcct 2460
ggacaactca gggatgcaat gccacttcca aaagagaagg ctacacgtaa acaaaagagt 2520
ctgagaaata gtttctgatt gttattgtta aatctttttt tgtttgtttg gttggttggc 2580
tctcttctgc aaaggacatc aataactgta ttttaaacta tatattaact gaggtggatt 2640
ttaacatcaa tttttaatag tgcaagagat ttaaaaccaa aggcgggggg gcgggcagaa 2700
aaaagtgcat ccaactccag ccagtgatcc acagaaacaa agaccaagga gcacaaaatg 2760
attttaagat tttagtcatt gccaagtgac attcttctca ctgtggttgt ttcaattctt 2820
tttcctacct tttaccagag agttagttca gagaaatggt cagagactca agggtggaaa 2880
gaggtaccaa aggctttggc caccagtagc tggctattca gacagcaggg agtagacttg 2940
ctggctagca tgtggaggag ccaaagctca ataagaaggg gcctagaatg aaacccttgg 3000
tgctgatcct gcctctgcca tttctactta agccagggtt tctcatatgt taacatgcat 3060
gggaattccc tgggcatctt cttgtggtgt ggagtctgac ttagcaagcc tcgggtgggt 3120
ttgagggtca aatttctacc aggcttatat ccctggtgat gctgcagaat tccaggacca 3180
cacttggagg tttaaggcct tccacaagtt acttatccca tatggtgggt ctatggaaag 3240
gtgtttccca gtcctcttta caccaccgga tcagtggtct ttcaacagat cctaaaggga 3300
tggtgagagg gaaactggag aaaagtatca gatttagagg ccactgaaga acccatatta 3360
aaatgccttt aagtatgggc tcttcattca tatactaaat atgaactatg tgccaggcat 3420
tatttcatat gacagaatac aaacaaataa gatagtgatg ctggtcaggc ttggtggctc 3480
atgcctgtat tccctaaact ttgggagcct aaggtgagaa ctccttgaac tcctaaggcc 3540
aggagttcaa gaccagcctg gataacatag caagacccca tctctacaaa aaaccaaaac 3600
caaacaaaca aaaatgatag tggtgcttcc ctcaggatgc ttgtggtcta atgggagaca 3660
gaacagcaaa gggatgatta gaagttggtt gctgtgagcc aggcacagtg ctgatataat 3720
cccagcgcta tgggaggctg aggtgggtgg atcatttgag gccaggagtt taagaccagc 3780
ctggtcaaca tggtaaaacc ccatctctac ttaaaaatac aaaaaagtta gccaggcatg 3840
gtggcataca cctgtaaccc agctactcag gaggctgagg cacatgaatc acttgaaccc 3900
aggaggcaga ggttgctgtg caccactgca ctccagcctg ggtgacagaa cgagaccttg 3960
actcaaaaaa aaaaaaaaga agtttgttgc tatggaaggg tcctactcag agcaggcacc 4020
ccagttaatc tcattcaccc cacatttcac atttgaacat catcccatag cccagagcat 4080
ccctccactg caaaggattt attcaacatt taaacaatcc tttttacttt cattttcctt 4140
caggcaaaga atctagatgc aataaccacc cctgacccaa ccacaaatgc cagcctgctg 4200
acgaagctgc aggcacagaa ccagtggctg caggacatga caactcatct cattctgcgc 4260
agctttaagg agttcctgca gtccagcctg agggctcttc ggcaaatgta gcatgggcac 4320
ctcagattgt tgttgttaat gggcattcct tcttctggtc agaaacctgt ccactgggca 4380
cagaacttat gttgttctct atggagaact aaaagtatga gcgttaggac actattttaa 4440
ttatttttaa tttattaata tttaaatatg tgaagctgag ttaatttatg taagtcatat 4500
ttatattttt aagaagtacc acttgaaaca ttttatgtat tagttttgaa ataataatgg 4560
aaagtggcta tgcagtttga atatcctttg tttcagagcc agatcatttc ttggaaagtg 4620
taggcttacc tcaaataaat ggctaactta tacatatttt taaagaaata tttatattgt 4680
atttatataa tgtataaatg gtttttatac caataaatgg cattttaaaa aattcagcaa 4740
ctttgagtgt gtcacg 4756
<210> 49
<211> 1154
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 49
aaatatgaga ctggggatgt ctgtagctca ttctgctctg gagcccacca agaacgatag 60
tcaattccag aaaccgctat gaactccttc tccacaagcg ccttcggtcc agttgccttc 120
tccctggggc tgctcctggt gttgcctgct gccttccctg ccccagtacc cccaggagaa 180
gattccaaag atgtagccgc cccacacaga cagccactca cctcttcaga acgaattgac 240
aaacaaattc ggtacatcct cgacggcatc tcagccctga gaaaggagac atgtaacaag 300
agtaacatgt gtgaaagcag caaagaggca ctggcagaaa acaacctgaa ccttccaaag 360
atggctgaaa aagatggatg cttccaatct ggattcaatg aggagacttg cctggtgaaa 420
atcatcactg gtcttttgga gtttgaggta tacctagagt acctccagaa cagatttgag 480
agtagtgagg aacaagccag agctgtgcag atgagtacaa aagtcctgat ccagttcctg 540
cagaaaaagg caaagaatct agatgcaata accacccctg acccaaccac aaatgccagc 600
ctgctgacga agctgcaggc acagaaccag tggctgcagg acatgacaac tcatctcatt 660
ctgcgcagct ttaaggagtt cctgcagtcc agcctgaggg ctcttcggca aatgtagcat 720
gggcacctca gattgttgtt gttaatgggc attccttctt ctggtcagaa acctgtccac 780
tgggcacaga acttatgttg ttctctatgg agaactaaaa gtatgagcgt taggacacta 840
ttttaattat ttttaattta ttaatattta aatatgtgaa gctgagttaa tttatgtaag 900
tcatatttat atttttaaga agtaccactt gaaacatttt atgtattagt tttgaaataa 960
taatggaaag tggctatgca gtttgaatat cctttgtttc agagccagat catttcttgg 1020
aaagtgtagg cttacctcaa ataaatggct aacttataca tatttttaaa gaaatattta 1080
tattgtattt atataatgta taaatggttt ttataccaat aaatggcatt ttaaaaaatt 1140
cagcaaaaaa aaaa 1154
<210> 50
<211> 926
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 50
aaatatgaga ctggggatgt ctgtagctca ttctgctctg gagcccacca agaacgatag 60
tcaattccag aaaccgctat gtgtgaaagc agcaaagagg cactggcaga aaacaacctg 120
aaccttccaa agatggctga aaaagatgga tgcttccaat ctggattcaa tgaggagact 180
tgcctggtga aaatcatcac tggtcttttg gagtttgagg tatacctaga gtacctccag 240
aacagatttg agagtagtga ggaacaagcc agagctgtgc agatgagtac aaaagtcctg 300
atccagttcc tgcagaaaaa ggcaaagaat ctagatgcaa taaccacccc tgacccaacc 360
acaaatgcca gcctgctgac gaagctgcag gcacagaacc agtggctgca ggacatgaca 420
actcatctca ttctgcgcag ctttaaggag ttcctgcagt ccagcctgag ggctcttcgg 480
caaatgtagc atgggcacct cagattgttg ttgttaatgg gcattccttc ttctggtcag 540
aaacctgtcc actgggcaca gaacttatgt tgttctctat ggagaactaa aagtatgagc 600
gttaggacac tattttaatt atttttaatt tattaatatt taaatatgtg aagctgagtt 660
aatttatgta agtcatattt atatttttaa gaagtaccac ttgaaacatt ttatgtatta 720
gttttgaaat aataatggaa agtggctatg cagtttgaat atcctttgtt tcagagccag 780
atcatttctt ggaaagtgta ggcttacctc aaataaatgg ctaacttata catattttta 840
aagaaatatt tatattgtat ttatataatg tataaatggt ttttatacca ataaatggca 900
ttttaaaaaa ttcagcaaaa aaaaaa 926
<210> 51
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
cggtgaaaga atggtggact cacttc 26
<210> 52
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
tgcagaagag agccaaccaa ccaaa 25
<210> 53
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
ccctgcccag ctcattctcc acag 24
<210> 54
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
ccagagactg agccaccaat gagg 24
<210> 55
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
aacagctagc aatggagttg ggctt 25
<210> 56
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
aaaggtgctt tttaagtcgg gagca 25
<210> 57
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
aggtgagctt ggaactgaac ccaag 25
<210> 58
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
tacccacttt ttgttgctgc ctgga 25
<210> 59
<211> 3377
<212> DNA/RNA
<213> 小鼠(Mouse)
<400> 59
cacaccgatc tgagccacgc cggggcgagc gctcgcagtg cgagctgagt gtggagcccg 60
aggccgaggg cgactgctct cgctgcccca gtctgccggc cgcccggccc cggctgcgga 120
gccgctctgc cgcccgccgt cccgcgtaga aggaagcatg ctgaccgtcg gctgcacgct 180
gttggtcgcc ctgctggccg cgcccgcggt cgcgctggtc ctcgggagct gccgcgcgct 240
ggaggtggca aatggcacag tgacaagcct gccaggggcc accgttaccc tgatttgccc 300
cgggaaggaa gcagcaggca atgttaccat tcactgggtg tactctggct cacaaaacag 360
agaatggact accacaggaa acacactggt tctgagggac gtgcagctca gcgacactgg 420
ggactattta tgctccctga atgatcacct ggtggggact gtgcccttgc tggtggatgt 480
tcccccagag gagcccaagc tctcctgctt ccggaagaac ccccttgtca acgccatctg 540
tgagtggcgt ccgagcagca ccccctctcc aaccacgaag gctgtgctgt ttgcaaagaa 600
aatcaacacc accaacggga agagtgactt ccaggtgccc tgtcagtatt ctcagcagct 660
gaaaagcttc tcctgccagg tggagatcct ggagggtgac aaagtatacc acatagtgtc 720
actgtgcgtt gcaaacagtg tgggaagcaa gtccagccac aacgaagcgt ttcacagctt 780
aaaaatggtg cagccggatc cacctgccaa ccttgtggta tcagccatac ctggaaggcc 840
gcgctggctc aaagtcagct ggcagcaccc tgagacctgg gacccgagtt actacttgct 900
gcagttccag cttcgatacc gacctgtatg gtcaaaggag ttcacggtgt tgctgctccc 960
ggtggcccag taccaatgcg tcatccatga tgccttgcga ggagtgaagc acgtggtcca 1020
ggtccgtggg aaggaggagc ttgaccttgg ccagtggagc gaatggtccc cagaggtcac 1080
gggcactcct tggatagcag agcccaggac caccccggca ggaatcctct ggaaccccac 1140
acaggtctct gttgaagact ctgccaacca cgaggatcag tacgaaagtt ctacagaagc 1200
aacgagtgtc ctcgccccag tgcaagaatc ctcgtccatg tccctgccca cattcctggt 1260
agctggagga agcttggcgt ttgggttgct tctctgtgtc ttcatcatcc tgagactcaa 1320
gcagaaatgg aagtcagagg ctgagaagga aagcaagacg acctctcctc cacccccacc 1380
gtattccttg ggcccactga agccgacctt ccttctggtt cctctcctca ccccacacag 1440
ctctgggtct gacaataccg taaaccacag ctgcctgggt gtcagggacg cacagagccc 1500
ttatgacaac agcaacagag actacttatt ccccagataa tcatctggat ggtacctggc 1560
agctggcagg gcaccacgag atcagcacac aagtttctca tgcgggtccc atccacctgg 1620
ggtggggtgg ggcgggcggg gctgcagctt cactaaccca caagagctct gcacaggttc 1680
tgagtaggtg cagctggtgc tgcataggct ctgaaggaag gaaggggctg tgaggaacac 1740
aggccattgt gaagacagct tgtgatgact gaatagagat gcccgtcagc tccacatctg 1800
atagtggctc acaagctgca ccctcaggag gcctcagaaa ggggctccaa aggctgcccc 1860
agctgcctcg ctctgcctca ctgccccaag ccacctttta gctctcgaac tcctaaagtc 1920
caagcacttt gccattctct ttccgaggcc actgaggccg ggtggaagct tggttccgat 1980
ttccttctca acatctggaa agcagctggg cccggtggtg gtgactaata tctcagggcc 2040
tgatggttta cgcgagtgac aatttctcac aagcagtttt taaatgtgaa tgatgacccc 2100
aggcactgct ggctgcggag gcttcatttt cctcttcgat ctcaggactt caggcgaaaa 2160
gcggagtgga agtagagagc ggatgggtgt ccaccgtcct catggtactt gcgggaggta 2220
cagcctggaa aacacgtttc ctgtccccct actctcccag gagagggatg atggtagggg 2280
gtgcctcttc cagggcggag agaactactt taccccagcc ttgcccattc tgatttcaac 2340
tggactggag ctactaggaa agtcgacatt catgcaaaaa gaaaaaacgt taactagcaa 2400
gaatgcactt tcattttggt ttttagagaa ctgttgcctg tttctctcaa gagtctggaa 2460
gaggccgctc actgcacact actgtatgaa ccctcactgc ccaccctgga ggaccaagtg 2520
cagtaacggt agcccaaaca ccaagtcaag tgaaaatcga gggaaaaaaa aaacaaacaa 2580
gcaacaaaaa aaaaaaacca aaactaaact aaaaaacaaa tcaccccccc aaaaaaaaac 2640
aaaaccaaaa accaaaaaaa acaaaaaaac aaaacaacaa caacaaaaaa aacccaaacc 2700
aacccgctgt ttcctataac agaaaagcct ttggtttcat tttttatttt gatttttttg 2760
tcttaaaaag tataaaaata gcctgtccat gctctgcttc agggaatgag cctgtgaaca 2820
ctcccaggcg caggcaggaa gggtgtctgc ttcctgctac acctcactgc caccttggcc 2880
ttccttgctt tacgtttgac tgagtggcct cagatgcttt cccctggggc tttgaggaat 2940
ccagtgatgt tagtggtcac cgaggagacc acagagccac agtgtggtgc ttagattaaa 3000
gtgacttctg caaccacagc accccacacc tgccgtctta ctgaactatg ccagtaactt 3060
gccttttctg ccaccaccac gagacgagac gggcagagct cggaagctgt caccccatgc 3120
cctctgcttg tccgctctag gggccactga cctaagcatt agttatttta ttttatttta 3180
tttttttgtg ggttttgtac attttaggtc ctgttgctgt cttagaaaag gctctgtagg 3240
ttgacagaaa atcaggccaa gtattcatgt tttgtttttt ttttttttcc ttctttcctc 3300
ctttgctaag tttttgggac tcaagggtag caaaactgct gtgaaaggga aatttattaa 3360
aaatgttaca gatcgtg 3377
<210> 60
<211> 460
<212> PRT
<213> 小鼠(Mouse)
<400> 60
Met Leu Thr Val Gly Cys Thr Leu Leu Val Ala Leu Leu Ala Ala Pro
1 5 10 15
Ala Val Ala Leu Val Leu Gly Ser Cys Arg Ala Leu Glu Val Ala Asn
20 25 30
Gly Thr Val Thr Ser Leu Pro Gly Ala Thr Val Thr Leu Ile Cys Pro
35 40 45
Gly Lys Glu Ala Ala Gly Asn Val Thr Ile His Trp Val Tyr Ser Gly
50 55 60
Ser Gln Asn Arg Glu Trp Thr Thr Thr Gly Asn Thr Leu Val Leu Arg
65 70 75 80
Asp Val Gln Leu Ser Asp Thr Gly Asp Tyr Leu Cys Ser Leu Asn Asp
85 90 95
His Leu Val Gly Thr Val Pro Leu Leu Val Asp Val Pro Pro Glu Glu
100 105 110
Pro Lys Leu Ser Cys Phe Arg Lys Asn Pro Leu Val Asn Ala Ile Cys
115 120 125
Glu Trp Arg Pro Ser Ser Thr Pro Ser Pro Thr Thr Lys Ala Val Leu
130 135 140
Phe Ala Lys Lys Ile Asn Thr Thr Asn Gly Lys Ser Asp Phe Gln Val
145 150 155 160
Pro Cys Gln Tyr Ser Gln Gln Leu Lys Ser Phe Ser Cys Gln Val Glu
165 170 175
Ile Leu Glu Gly Asp Lys Val Tyr His Ile Val Ser Leu Cys Val Ala
180 185 190
Asn Ser Val Gly Ser Lys Ser Ser His Asn Glu Ala Phe His Ser Leu
195 200 205
Lys Met Val Gln Pro Asp Pro Pro Ala Asn Leu Val Val Ser Ala Ile
210 215 220
Pro Gly Arg Pro Arg Trp Leu Lys Val Ser Trp Gln His Pro Glu Thr
225 230 235 240
Trp Asp Pro Ser Tyr Tyr Leu Leu Gln Phe Gln Leu Arg Tyr Arg Pro
245 250 255
Val Trp Ser Lys Glu Phe Thr Val Leu Leu Leu Pro Val Ala Gln Tyr
260 265 270
Gln Cys Val Ile His Asp Ala Leu Arg Gly Val Lys His Val Val Gln
275 280 285
Val Arg Gly Lys Glu Glu Leu Asp Leu Gly Gln Trp Ser Glu Trp Ser
290 295 300
Pro Glu Val Thr Gly Thr Pro Trp Ile Ala Glu Pro Arg Thr Thr Pro
305 310 315 320
Ala Gly Ile Leu Trp Asn Pro Thr Gln Val Ser Val Glu Asp Ser Ala
325 330 335
Asn His Glu Asp Gln Tyr Glu Ser Ser Thr Glu Ala Thr Ser Val Leu
340 345 350
Ala Pro Val Gln Glu Ser Ser Ser Met Ser Leu Pro Thr Phe Leu Val
355 360 365
Ala Gly Gly Ser Leu Ala Phe Gly Leu Leu Leu Cys Val Phe Ile Ile
370 375 380
Leu Arg Leu Lys Gln Lys Trp Lys Ser Glu Ala Glu Lys Glu Ser Lys
385 390 395 400
Thr Thr Ser Pro Pro Pro Pro Pro Tyr Ser Leu Gly Pro Leu Lys Pro
405 410 415
Thr Phe Leu Leu Val Pro Leu Leu Thr Pro His Ser Ser Gly Ser Asp
420 425 430
Asn Thr Val Asn His Ser Cys Leu Gly Val Arg Asp Ala Gln Ser Pro
435 440 445
Tyr Asp Asn Ser Asn Arg Asp Tyr Leu Phe Pro Arg
450 455 460
<210> 61
<211> 5928
<212> DNA/RNA
<213> 人(human)
<400> 61
ggcggtcccc tgttctcccc gctcaggtgc ggcgctgtgg caggaagcca ccccctcggt 60
cggccggtgc gcggggctgt tgcgccatcc gctccggctt tcgtaaccgc accctgggac 120
ggcccagaga cgctccagcg cgagttcctc aaatgttttc ctgcgttgcc aggaccgtcc 180
gccgctctga gtcatgtgcg agtgggaagt cgcactgaca ctgagccggg ccagagggag 240
aggagccgag cgcggcgcgg ggccgaggga ctcgcagtgt gtgtagagag ccgggctcct 300
gcggatgggg gctgcccccg gggcctgagc ccgcctgccc gcccaccgcc ccgccccgcc 360
cctgccaccc ctgccgcccg gttcccatta gcctgtccgc ctctgcggga ccatggagtg 420
gtagccgagg aggaagcatg ctggccgtcg gctgcgcgct gctggctgcc ctgctggccg 480
cgccgggagc ggcgctggcc ccaaggcgct gccctgcgca ggaggtggcg agaggcgtgc 540
tgaccagtct gccaggagac agcgtgactc tgacctgccc gggggtagag ccggaagaca 600
atgccactgt tcactgggtg ctcaggaagc cggctgcagg ctcccacccc agcagatggg 660
ctggcatggg aaggaggctg ctgctgaggt cggtgcagct ccacgactct ggaaactatt 720
catgctaccg ggccggccgc ccagctggga ctgtgcactt gctggtggat gttccccccg 780
aggagcccca gctctcctgc ttccggaaga gccccctcag caatgttgtt tgtgagtggg 840
gtcctcggag caccccatcc ctgacgacaa aggctgtgct cttggtgagg aagtttcaga 900
acagtccggc cgaagacttc caggagccgt gccagtattc ccaggagtcc cagaagttct 960
cctgccagtt agcagtcccg gagggagaca gctctttcta catagtgtcc atgtgcgtcg 1020
ccagtagtgt cgggagcaag ttcagcaaaa ctcaaacctt tcagggttgt ggaatcttgc 1080
agcctgatcc gcctgccaac atcacagtca ctgccgtggc cagaaacccc cgctggctca 1140
gtgtcacctg gcaagacccc cactcctgga actcatcttt ctacagacta cggtttgagc 1200
tcagatatcg ggctgaacgg tcaaagacat tcacaacatg gatggtcaag gacctccagc 1260
atcactgtgt catccacgac gcctggagcg gcctgaggca cgtggtgcag cttcgtgccc 1320
aggaggagtt cgggcaaggc gagtggagcg agtggagccc ggaggccatg ggcacgcctt 1380
ggacagaatc caggagtcct ccagctgaga acgaggtgtc cacccccatg caggcactta 1440
ctactaataa agacgatgat aatattctct tcagagattc tgcaaatgcg acaagcctcc 1500
cagtgcaaga ttcttcttca gtaccactgc ccacattcct ggttgctgga gggagcctgg 1560
ccttcggaac gctcctctgc attgccattg ttctgaggtt caagaagacg tggaagctgc 1620
gggctctgaa ggaaggcaag acaagcatgc atccgccgta ctctttgggg cagctggtcc 1680
cggagaggcc tcgacccacc ccagtgcttg ttcctctcat ctccccaccg gtgtccccca 1740
gcagcctggg gtctgacaat acctcgagcc acaaccgacc agatgccagg gacccacgga 1800
gcccttatga catcagcaat acagactact tcttccccag atagctggct gggtggcacc 1860
agcagcctgg accctgtgga tgataaaaca caaacgggct cagcaaaaga tgcttctcac 1920
tgccatgcca gcttatctca ggggtgtgcg gcctttggct tcacggaaga gccttgcgga 1980
aggttctacg ccaggggaaa atcagcctgc tccagctgtt cagctggttg aggtttcaaa 2040
cctccctttc caaatgccca gcttaaaggg gctagagtga acttgggcca ctgtgaagag 2100
aaccatatca agactctttg gacactcaca cggacactca aaagctgggc aggttggtgg 2160
gggcctcggt gtggagaagc ggctggcagc ccacccctca acacctctgc acaagctgca 2220
ccctcaggca ggtgggatgg atttccagcc aaagcctcct ccagccgcca tgctcctggc 2280
ccactgcatc gtttcatctt ccaactcaaa ctcttaaaac ccaagtgcct tagcaaattc 2340
tgtttttcta ggcctgggga cggcttttac ttaaaccgcc aaggctgggg gaagaagctc 2400
tctcctccct ttcttcccta cagttgaaaa acagctgagg gtgagtgggt gaataataca 2460
gtatctcagg gcctggtcgt tttcaacaga attataatta gttcctcatt agcattttgc 2520
taaatgtgaa tgatgatcct aggcatttgc tgaatacaga ggcaactgca ttggctttgg 2580
gttgcaggac ctcaggtgag aagcagagga aggagaggag aggggcacag ggtctctacc 2640
atcccctgta gagtgggagc tgagtggggg atcacagcct ctgaaaacca atgttctctc 2700
ttctccacct cccacaaagg agagctagca gcagggaggg cttctgccat ttctgagatc 2760
aaaacggttt tactgcagct ttgtttgttg tcagctgaac ctgggtaact agggaagata 2820
atattaagga agacaatgtg aaaagaaaaa tgagcctggc aagaatgtgt ttaaacttgg 2880
tttttaaaaa actgctgact gttttctctt gagagggtgg aatatccaat attcgctgtg 2940
tcagcataga agtaacttac ttaggtgtgg gggaagcacc ataactttgt ttagcccaaa 3000
accaagtcaa gtgaaaaagg aggaagagaa aaaatatttt cctgccaggc atggtggccc 3060
acgcacttcg ggaggtcgag gcaggaggat cacttgagtc cagaagtttg agatcagcct 3120
gggcaatgtg ataaaacccc atctctacaa aaagcataaa aattagccaa gtgtggtaga 3180
gtgtgcctga agtcccagat acttgggggg ctgaggtggg aggatctctt gagcctggga 3240
ggtcaaggct gcagtgagcc gagattgcac cactgcactc cagcctgggt gacagagcaa 3300
gtgagaccct gtctcaaaaa aagaaaaaga aaaagaaaaa atattttccc tattagagaa 3360
gagattgtgg tttcattctg tattttgttt ttgtcttaaa aagtggaaaa atagcctgcc 3420
tcttctctac tctagggaaa aaccagcgtg tgactactcc cccaggtggt tatggagagg 3480
gtgtccggtc cctgtcccag tgccgagaag gaagcctccc acgactgccc ggcagggtcc 3540
tagaaattcc ccaccctgaa agccctgagc tttctgctat caaagaggtt ttaaaaaaat 3600
cccatttaaa aaaaatccct tacctcggtg ccttcctctt tttatttagt tccttgagtt 3660
gattcagctc tgcaagaatt gaagcaggac taaatgtcta gttgtaacac catgattaac 3720
cacttcagct gacttttctg tccgagcttt gaaaattcag tggtgttagt ggttacccag 3780
ttagctctca agttatcagg gtattccaga gtggggatat gatttaaatc agccgtgtaa 3840
ccatggaccc aatatttacc agaccacaaa acttttctaa tactctaccc tcttagaaaa 3900
accaccacca tcaccagaca ggtgcgaaag gatgaaagtg accatgtttt gtttacggtt 3960
ttccaggttt aagctgttac tgtcttcagt aagccgtgat tttcattgct gggcttgtct 4020
gtagatttta gaccctattg ctgcttgagg caactcatct taggttggca aaaaggcagg 4080
atggccgggc gcggtggctc acgcctgtaa tcctagcact ttgggaggcc aaggtgggag 4140
gattgcttga gctcaggagt ttgagaccaa cctgggtaac atagtgagac accatctcta 4200
ttatgaacaa taacagttaa gaaaaaaaaa ggcaggcagg cggttatggt ggttccctcc 4260
catcccacca cataaagttt ctgagacttg agaacagcaa aatgctgtta aagggaaata 4320
ttaagaatga gaatctgcag taagggtgat tctgtgccca cagttcttca attctttata 4380
ccgttttacc cacatgtggt gttaccaaag ccgggcagaa ccatgctagc ggaagatgtg 4440
aaatccagat agctcattat tgccaagagc taggcagctt tgatctccaa attgttattg 4500
ctttcatttt tattgtaatg gaattgcttt gttttgtttt tttgtttttg tattgaagag 4560
ggttgttttc cctttatttt tcataagcta atgtaaatga agaaaaaatg tcttctctgg 4620
gctgtaggcc tggctcagcg tacacaggta tacatcctaa gctctctatg ttctctaatc 4680
tgtggtgact gaacatgtgt ctcaatgcac ggggcatttc tacctgtgtt tctgcagcac 4740
ccccactgcc ttgagtcccc agcagtgctg ttatttgcct aacacctgta gccatctgcc 4800
acgcagccag acgtgaaacg ctgagacaga gaccatttag gttaaatacg acagcttatc 4860
ctgctgggtg gggaaagtaa aaaatatgct ggttcaaggc ctaaagtaaa atgatcaata 4920
atgtttgtag cattaatgaa atattttcaa gaaatgtgtc caggggtagc actggctatg 4980
ttgacgaggc ctttggtaac tcagagagct cttggccctg atggggactt gcccttacgc 5040
tttctttatc aggctctgag ttcacacgga gcctctggca cttccctgct gtcttgggag 5100
aaaggaaact ggttgccgcg gcaggttgtg gaatctgttg ctggaaccag gctggaagcc 5160
cacctggtag tgaacagggc ccagtggggc aggctgggca tgttgtggtc tatgggtttg 5220
tttcctggag aatgttcagg aatgtcttcc cagctgcttt ggtgctgagc tctattatct 5280
cacagcacgt ccagaaggct aacccaggtg gggaggatgc tgacaccagc tccaggtgga 5340
gttggtggtc ttaatttgga gatgcagggg caacctgtga ccctttgagg caagagccct 5400
gcacccagct gtcccgtgca gccgtgggca ggggctgcac acggaggggc aggcgggcca 5460
gttcagggtc cgtgccaggc cctcctcagt gccctgtgaa ggcctcctgt cctccgtgcg 5520
gctgggcacc agcaccaggg agtttctatg gcaaccttag tgattattaa ggaacactgt 5580
cagttttatg aacatatgct caaatgaaat tctactttag gaggaaagga ttggaacagc 5640
atgtcacaag gctgttaatt aacagagaga ccttattgga tggagatcac atctgttaaa 5700
tagaatacct caactctacg ttgttttctt ggagataaat aatagtttca agtttttgtt 5760
tgtttgtttt acctaattac ctgaaagcaa ataccaaagg ctgatgtctg tatatggggc 5820
aaagggtcag tatatttttc agtgtttttt tttctaccag ctattttgca tttaaagtga 5880
acattgtgtt tggaataaat actcttaaaa aataaaaaaa aaaaaaaa 5928
<210> 62
<211> 468
<212> PRT
<213> 人(human)
<400> 62
Met Leu Ala Val Gly Cys Ala Leu Leu Ala Ala Leu Leu Ala Ala Pro
1 5 10 15
Gly Ala Ala Leu Ala Pro Arg Arg Cys Pro Ala Gln Glu Val Ala Arg
20 25 30
Gly Val Leu Thr Ser Leu Pro Gly Asp Ser Val Thr Leu Thr Cys Pro
35 40 45
Gly Val Glu Pro Glu Asp Asn Ala Thr Val His Trp Val Leu Arg Lys
50 55 60
Pro Ala Ala Gly Ser His Pro Ser Arg Trp Ala Gly Met Gly Arg Arg
65 70 75 80
Leu Leu Leu Arg Ser Val Gln Leu His Asp Ser Gly Asn Tyr Ser Cys
85 90 95
Tyr Arg Ala Gly Arg Pro Ala Gly Thr Val His Leu Leu Val Asp Val
100 105 110
Pro Pro Glu Glu Pro Gln Leu Ser Cys Phe Arg Lys Ser Pro Leu Ser
115 120 125
Asn Val Val Cys Glu Trp Gly Pro Arg Ser Thr Pro Ser Leu Thr Thr
130 135 140
Lys Ala Val Leu Leu Val Arg Lys Phe Gln Asn Ser Pro Ala Glu Asp
145 150 155 160
Phe Gln Glu Pro Cys Gln Tyr Ser Gln Glu Ser Gln Lys Phe Ser Cys
165 170 175
Gln Leu Ala Val Pro Glu Gly Asp Ser Ser Phe Tyr Ile Val Ser Met
180 185 190
Cys Val Ala Ser Ser Val Gly Ser Lys Phe Ser Lys Thr Gln Thr Phe
195 200 205
Gln Gly Cys Gly Ile Leu Gln Pro Asp Pro Pro Ala Asn Ile Thr Val
210 215 220
Thr Ala Val Ala Arg Asn Pro Arg Trp Leu Ser Val Thr Trp Gln Asp
225 230 235 240
Pro His Ser Trp Asn Ser Ser Phe Tyr Arg Leu Arg Phe Glu Leu Arg
245 250 255
Tyr Arg Ala Glu Arg Ser Lys Thr Phe Thr Thr Trp Met Val Lys Asp
260 265 270
Leu Gln His His Cys Val Ile His Asp Ala Trp Ser Gly Leu Arg His
275 280 285
Val Val Gln Leu Arg Ala Gln Glu Glu Phe Gly Gln Gly Glu Trp Ser
290 295 300
Glu Trp Ser Pro Glu Ala Met Gly Thr Pro Trp Thr Glu Ser Arg Ser
305 310 315 320
Pro Pro Ala Glu Asn Glu Val Ser Thr Pro Met Gln Ala Leu Thr Thr
325 330 335
Asn Lys Asp Asp Asp Asn Ile Leu Phe Arg Asp Ser Ala Asn Ala Thr
340 345 350
Ser Leu Pro Val Gln Asp Ser Ser Ser Val Pro Leu Pro Thr Phe Leu
355 360 365
Val Ala Gly Gly Ser Leu Ala Phe Gly Thr Leu Leu Cys Ile Ala Ile
370 375 380
Val Leu Arg Phe Lys Lys Thr Trp Lys Leu Arg Ala Leu Lys Glu Gly
385 390 395 400
Lys Thr Ser Met His Pro Pro Tyr Ser Leu Gly Gln Leu Val Pro Glu
405 410 415
Arg Pro Arg Pro Thr Pro Val Leu Val Pro Leu Ile Ser Pro Pro Val
420 425 430
Ser Pro Ser Ser Leu Gly Ser Asp Asn Thr Ser Ser His Asn Arg Pro
435 440 445
Asp Ala Arg Asp Pro Arg Ser Pro Tyr Asp Ile Ser Asn Thr Asp Tyr
450 455 460
Phe Phe Pro Arg
465
<210> 63
<211> 4133
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
gtgaagtcct gtgttccttt gctgcagtca cacgggcttg tctgaattcc ctgcacaggg 60
tactttagcc tcacctgccg ttcatttctg cttcctggag gccagatgtc tccattccca 120
agttgagatt tatctgatac actgttacac caataggagg gtcttttcct ggagttggca 180
ggcacccagg aggggctggt aactcctggg gacaggtagc aggagtctga cttggggtgg 240
gaggttcatg gggtgggggt tgtcagcaaa gctcatacac acaggtttga tttctctcct 300
ccttaacagt gttgtcgtaa caacctggaa tgttggctgg aaaactgaac ttccactaag 360
tgtagagttc agacagcctc caaggaggaa agagactgct cagagccctg aggaatgtct 420
ttccttacct tagatagaga tcttcagtat gtgttgggcc cttcagcagg agatgcagag 480
atgagttctt cagggtgaca gggaaggcag ggtggtaaac aaagtcacat ggcatttggg 540
aggaacacag gactctggca cccaagctaa ccagtggatg acagctttct tggaattgag 600
gaaagagacc attgagtttt ctgaaaaaga cagccaagtc caggtttggc tttttttttt 660
tttttttttt ttttttaact tgtggattac gttgggccca cacttggggt aattttatct 720
ttccttcctg gatactgagg atacatgtgt tcacagctat gcttggcttt tttttttttt 780
aatagggtct tgtccagcgt ggccagaacc ttgccacgtt tcccccttag cctcttcagt 840
gccagaatta caatcatcca ccaccgtgcc tgtcagagac gagtgtgagg gcagagtagg 900
gtgtaagact aaaggaaagg aaggcctggc cagaggataa gcttgaacaa ggcatgcaga 960
ttagaaacca cggacatcat tgtagaaact tacctacacg caaggctctg gtacaggaaa 1020
gagggtggga aagtgaaggt ggactctctg tgtagccctg gatgacctgg aactcactct 1080
gtggaccagg ctggccttaa actcacagag atatgcctgc ttctgcctcc caagtgctgg 1140
gattaaaggc aggagccatc ataccaggac ttgaagcaca acactaatac tttgtatatt 1200
ataaattctt accacacaaa tcagtaaaaa aggctctgag atgaagtaga aacttgagtt 1260
ctttggaaag tcagttgtgt ggcatggtat tttgctgggg caaacatgtg acatgaagga 1320
gtattttcct gaagcagaca caaggtaaaa ggatgttttg ctaaagcaga cccgtgaaag 1380
gacccatgat gtaggattct tctctaacta catgcaagga tcagttcacc ttacatttca 1440
ttgttgagct ccatttgttg tgactccata gagagaaaca tactggaaac gtttctagtg 1500
gtgttctggt ggcttcttgc tgcttccatg gactcgggca gagtgatgtc agctgataca 1560
gactcaagtg gagttttgct aagacagact cacatactga ggcgagaccc atttgagaac 1620
acgttatgtt tggagagcgg ataactaaga ctcaatggac agtgggaaag ggcttgcttg 1680
catagctagc tttgcaatgc ttcctggtct tcttcgctga tcttcacttt gttaagagaa 1740
gtaaggcaaa gaacttctcc aggcctaatc actcctgcta actcatgcag attcggccga 1800
ggcctggctg tttctgctag gttgtgccaa cactgctgtt gatttgtgtt tgttatcctg 1860
acactaccga cctggactgc tgctatattc atcaagtatt tgcaagtgga tgggatttgc 1920
tccaaagaac aatttctaga cagatccacc tcctaatatc ctaactacct aattcctgta 1980
tcctaataac tttccatttc cactgcctct aggagggagg ttaaagtgtt taaaaaccat 2040
cattaaaatt agggttgaga aatatctaaa caacacagag aaattaacta taacttgccc 2100
aaatcctaca gctatcaagc agtagacctg ggatgggaac taaactcatc tgactatgga 2160
acaccccccc ccccacactc caggatcaaa acggggtgga tggggggaag ccacttggcc 2220
agggttgccg ggtcgtgtct gagatgtctg ctcttgcctt caacattcct tctatctgag 2280
ctggcagcct tctgtagcct tcctgtttca ggccagcaac ttgtctctct gcaattattt 2340
tcaggtctct gtttaccaca gaaaggaagg aggcagcaca atgagagtct gttggaaatt 2400
aattatattt ttaagatagg gcaagttcca ctatgcttgc ctcgaactct ggatcttcct 2460
gcctcagcct ccagagtttt gggattacag gtgtgtacta ccacatcctc ttgctattta 2520
atcccatttt aaatagcagg agaaaaaaat atgtattttt tttagacagg gccttagact 2580
cacagctatt cacctgcttc tgcttcccaa atgcctgccc caccacaggg agagagaaca 2640
accatgcctt tctctccgac ttatagcgtg gctgaggaag tgccatcaaa accaatccca 2700
ttgtcctggg tacaggtttg gttctgacat ccacagagag cggtggatgc ctaggtctga 2760
ggccagcatg ttgcttaaat aaggtcatgt cttatttagg ggttcagcca gcacacacac 2820
attccagttg ccccatggac tctaatcagc tgaaccctga aatggaagaa tacattaaaa 2880
catactggtg taggtccagg gctccccatc tacattttct tttctttctt ttttttttct 2940
tatcccttcc cttctccctc ttgctccggc ccggctcgct caggcccata ggttttattt 3000
gtttctcatt acagatggtt gtgagctacc atgttgctgg gatttgaact catgatctcc 3060
ggaagtcagt cagtgcgttt aaccgctgag ccatctcacc agccctaaat tttcttttca 3120
gtgtgtttct ttccctctgc atttgcatgg gaagctgccc tgtagcttca agctctgtag 3180
cttggaaggg aaccttggtg gagtctggta aatagcaaac gccggttcct ttgtgtccag 3240
tcaagtcatg atgggtaatc aaagccctac tccttgttga gcagttaggc tccaggtaca 3300
tcgacagtgt ttccaggaat ctttatcatg ggcttaaaaa tacatctcta ataggtgaga 3360
aaactgagac ttccggatcg ggatagcaat cttgaggagg gtaacacatg tgtctctggg 3420
ccagactcaa aagcgcacac tggtttcgtt gcctctgcag tagccttcaa agagctgctc 3480
ctccactgga agatgagagg aaatcttttt ctcaggttat ggacgcctaa gttttccttc 3540
agaccaatta aatcacaatc tctgggctcg aagcagacat cggtgtcttt tcggattccc 3600
tgtttgattc ccgtaagcac ccaggacact gacctgcctt ctactttaac agccagagcc 3660
actggctggc gctcatgaaa gcaaaactca agcggaggcg cggatggaag gaaggagggg 3720
gatatttctc cttatctcag cgtcaaaacc tggggagggg ccctggtggg ggtccctggg 3780
ggctcaggtg tggcgcggct gcaggaagta accccctccg gtggcccgga gcgctggccg 3840
attgcgccat cctactgggc tttcgtaacc gcgagccggg gctgccaaga ggagcttcag 3900
caccggttcc tcaaatgttt cactgttgcc aggacggccg gctgctgtgt gtcacgtgca 3960
tgtgggaagt cgcgcccaca ccgatctgag ccacgccggg gcgagcgctc gcagtgcgag 4020
ctgagtgtgg agcccgaggc cgagggcgac tgctctcgct gccccagtct gccggccgcc 4080
cggccccggc tgcggagccg ctctgccgcc cgccgtcccg cgtagaagga agc 4133
<210> 64
<211> 4727
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
gctgcacgct gttggtcgcc ctgctggccg cgcccgcggt cgcgctggtc ctcgggagct 60
gccgcgcgct gggtaagagg aacccggagc gggcgtgggg aatgtgacac tgtctggttc 120
cgttcgcaga gtgagccccg ccggtaccgg ctgctagcct gggctgactc acctgtgctg 180
acgcggtgga ggttcgcgcg ccccctgttg cgtctagcgc ctataactgc gtgctcctgt 240
ctgtgtctgg ccagttacct caagtctgag tacaggacag tgtgttttcc tgaaacctga 300
ctctggtgtc tggttcccag tgttcccagt cttactcaac tgcatcccgg gtcgctccaa 360
aaagagatac ccagagggcg cgccctagtg gaacagtagt agtcccttct ggagagtcct 420
ttatgccact ggctctctct gctttagttg tggcacctcg cgtggctttc cttagttcta 480
ctacattcca tgtcgtgtgt aatgacagtg acccgacggt gaagggtctg acatcatggg 540
ctctgagtca tgggtgttcc cgcctcacaa acttactcct ttagccaact agccctagca 600
tgcagaatgc caacacccac atccatccca atcctgtgag tttgacagca aaggatgtgg 660
gacctcttgg aactgtgcct ccgccccctg ccccagccct ccctgattag caggtggacc 720
aggcggaggg tagggtaggg gcactgtgtt taccttcctt gcactctgcc ttgtaggtct 780
aggcctctct gtgggctctg gcttcaggcc cagcagcctg cctggtctct tctggaggaa 840
ctgggagact gcttctctac aggttatttt aggggctgag ggcttattca acaacataga 900
aagagccaaa ggacatgggg gagatttatc ctgtgctggt cgtggggaca gtggcttcca 960
ggctttcttt ctgcctggaa ggtagaattc ctcaagcttg gtttgttacc cctacctata 1020
ttttctttat atatatatat ataaagaaaa tatatatata tattagacag gctctcccat 1080
aacccaggct ggcctcaaac ttgtgcctct tctgcctcta tctcttgagt gctgggattt 1140
caggtattaa cccaccctgt attttacacg tttttaatcc tctacaggat tgacataaag 1200
ctttgggagg agcctgaggt tcagagagat gcaatgggaa gcatcaggcc cctccgtgtc 1260
tcagtgttct cctgtgggta cagctgaggg cgtctggggt aggctgagca ccactatcat 1320
ctggtgggat tctgggggag aagacactga tgaaagagaa gatccccgct tagctgttca 1380
tggtgccagg caggactgag gtcctctctt ccatcttggg agagcaggac tgggcctctc 1440
tgcctgtctc agttactact caacataccc cagcgccccc accaccactt ccctttgttc 1500
ctaaggagct gcaaggcact tcggagacag cgagttctgt tttcctgtgg ttcagaaagg 1560
acacccaagg gtgggggtgt cttctgaccc aaacagcctt tagaaggcag aactgggagt 1620
ctggggagga agtgaaagcc ctgccagttt agaaggaaga ggcagagaag tccccagccc 1680
atctcccaca cccacacttg cacagctaca aactggagag tgacaatcaa gaaacaagca 1740
ccaaacagga agtgtggagc aaatgactga gatgtttggc tttagagaag tgaggccaga 1800
tggagatggc tctctggggg ggaacccatg ggtggaagat atacataaac atatatatat 1860
gggcaggcga gatagctcag cacacgcaca cacacacaca cacacacaca cacacacact 1920
ctcctccatc catcatcctt agtgggtttt tgccttcatg tattcatgtc tgtgtgaggg 1980
ttccaaatcc tatggaactg gagttacagt tgtgagctgc catgtggtgc agggattgaa 2040
cctgggtcct ctggaagaac agccagtgtt cttaactgct gagccatcac tccagcacca 2100
acaggtggga ttttcatagt ctgcccctcc agggcctgct aggactcctg tgtcttcttc 2160
cacctggggc ccaggaccag ctgggactga ggcttctgcc aggtcaaact ttctaggcgc 2220
tgctgactga ggacaggctg ggcatgggtg gcttcagtcc ccctttcctt ctgtaaggca 2280
agaaaacacg cagcagcacc gatgcctatg tatctaaatc tcctcctgac ttctgaattc 2340
cctctgggac aacctctttc ggtctacaaa acctacctgt attcctagcc tcaccctgaa 2400
tcagtatttt tctgaaggat atatttttta tctagcatca aatttcggct aggaaggata 2460
gatctttgta aaaaaaaaat cacaattttt aaaacattag ggtttgtggg ttttttgttt 2520
gtttgttttt tttttttttt tgatattttg agacaggtgt ttctttgtgt agccctggct 2580
gccctggaac tcactctgta gaccaggttg gccttgaact tagaggtctt tgcctcctga 2640
gtgctgggat caaaggccac ggtacccaac caaaaatgac aattcttgac ccctggccac 2700
tcattaaaca tgtatcagaa gagcagagag tgaggtctac actttgaaaa aaaacaaatt 2760
gttccttgtg gcccctgggc actggcttga ggacatttgc ctaatggtca ggatgagtaa 2820
aagaccttct tcccctgcca ggttccctgt gaccagaagc ctctccccgc cttggctctg 2880
cccctcccct tgtttattcg ttgcaacaca tatttatgta ttccctgtaa agcccttggg 2940
gaccaagtgg gatccgtcat gcacactcca ccctataaag gatcctgaat gtggccaaaa 3000
gcaaatcctg agacagagcc agttcagtct ctctgacctg acactgggta ccaactctcc 3060
agggacagat tgtctcagca gtcagctaga cagaggaacc cttctgactg ggaccctaaa 3120
gcaacaggag cctgcctgtt ctctacccca tctgactggc atcaaactgt gcaggcgcaa 3180
gtgtggccat agctgggtta tgtaaacaaa gtaacttcag agcttctggc ttcaaacaga 3240
tgtctccttc agcaagcttt ccatctgccc ctgcaggcct gagtgccacc actcagtcat 3300
cagcttgaat ccagggctaa agctatctca gatgagccag taagtgagtt taagctatta 3360
aaccttaaat taatagaaaa agtaaaatgg gcacatgaga tggctcagca gataaaaaaa 3420
ggcatttgct gccgacaggg ctgatgagct agggacccgg cggggggggg gggtgcgggg 3480
ggggggggag gtgttactcc caagggtttc tgtttctctg gcctctacat atgtactgtg 3540
gctagtgcat gcacataaac aaacaaacaa ataaatgtaa ttaaaacaaa agctgtgtat 3600
ggtggcacat gcccttagtg ccagaatctc tgtgagtttg tggtcagcct ggtctccaca 3660
gcaagttcaa gaaagaggaa aaaagggtga tttctagatg tgcttgatgg tgtaactcat 3720
atgggaactt gatgcagggg gattgcaagc tctaggttag cctaagctac agagacaggg 3780
ttggggtggg ggtggggagt aggggaaccc tcaaaaaaaa acacaaacaa acaaacaaaa 3840
accaggacaa atctctgtcc ttcatcacgc ctgtcacttg cagtgcgcag tggctagctg 3900
tggctggtgt ggctgtgcat gtctgctcat ggggctttcc catagcggag gggaagtgtg 3960
tcgggtgagg ggctagagag ctatgcggtg tcttccagac acctgttcca cctgtatgca 4020
tggtgctctg agggggcatt ggagcctctg gaactggagt tacagatggt tgtgagctgt 4080
cttgtgggtg ctggggatca aatcctgctt cattgaaaga actctctctt tttggagaca 4140
aagtctcacc acgtagccct ggctggcttg gaactctctg tgtagaacag gctggccccg 4200
aatgcacaga gagcctcccg cctctgtctc tcaagtgatg gaactaaagg tgtgggctca 4260
ggaggtcatc agtgacggtt tatcagtgag ctgtcatctt tctagtccca gagctgacgc 4320
tttacctgaa cctcagcagc tttcaccatt gcgcttgtct cttgccagct ctgtctgcag 4380
gtttctagca cagggtgctc ctgaggcccc aacccaggag cccgttctct gactcacttc 4440
tctccctacc tccttccaga aaatcattct ttgggcttcc ctttctgtgg tggttacagt 4500
aactgtggct ctgagtatca acttcatttg aaaaattgtg tcagaccctt ggcacaacag 4560
tgcagctttg ggtgagtggg gtgccagccc gctcttggct ggacagggta gctacaggac 4620
agcaggtggg gttggatgag tgatcagagg ccattctggg gcatgtggga actgagacat 4680
ctatagcaca accaagaaag gatgctaaat caggtctggt ggactgc 4727
<210> 65
<211> 4098
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
atgctggccg tcggctgcgc gctgctggct gccctgctgg ccgcgccggg agcggcgctg 60
gccccaaggc gctgccctgc gcaggaggtg gcgagaggcg tgctgaccag tctgccagga 120
gacagcgtga ctctgacctg cccgggggta gagccggaag acaatgccac tgttcactgg 180
gtgctcagga agccggctgc aggctcccac cccagcagat gggctggcat gggaaggagg 240
ctgctgctga ggtcggtgca gctccacgac tctggaaact attcatgcta ccgggccggc 300
cgcccagctg ggactgtgca cttgctggtg gatgttcccc ccgaggagcc ccagctctcc 360
tgcttccgga agagccccct cagcaatgtt gtttgtgagt ggggtcctcg gagcacccca 420
tccctgacga caaaggctgt gctcttggtg aggaagtttc agaacagtcc ggccgaagac 480
ttccaggagc cgtgccagta ttcccaggag tcccagaagt tctcctgcca gttagcagtc 540
ccggagggag acagctcttt ctacatagtg tccatgtgcg tcgccagtag tgtcgggagc 600
aagttcagca aaactcaaac ctttcagggt tgtggaatct tgcagcctga tccgcctgcc 660
aacatcacag tcactgccgt ggccagaaac ccccgctggc tcagtgtcac ctggcaagac 720
ccccactcct ggaactcatc tttctacaga ctacggtttg agctcagata tcgggctgaa 780
cggtcaaaga cattcacaac atggatggtc aaggacctcc agcatcactg tgtcatccac 840
gacgcctgga gcggcctgag gcacgtggtg cagcttcgtg cccaggagga gttcgggcaa 900
ggcgagtgga gcgagtggag cccggaggcc atgggcacgc cttggacaga atccaggagt 960
cctccagctg agaacgaggt gtccaccccc atgcaggcac ttactactaa taaagacgat 1020
gataatattc tcttcagaga ttctgcaaat gcgacaagcc tcccagtgca agattcttct 1080
tcagtaccac tgcccacatt cctggttgct ggagggagcc tggccttcgg aacgctcctc 1140
tgcattgcca ttgttctgag gttcaagaag acgtggaagc tgcgggctct gaaggaaggc 1200
aagacaagca tgcatccgcc gtactctttg gggcagctgg tcccggagag gcctcgaccc 1260
accccagtgc ttgttcctct catctcccca ccggtgtccc ccagcagcct ggggtctgac 1320
aatacctcga gccacaaccg accagatgcc agggacccac ggagccctta tgacatcagc 1380
aatacagact acttcttccc cagatagaga tctaatcaac ctctggatta caaaatttgt 1440
gaaagattga ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct 1500
ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat 1560
aaatcctggt tgctgtctct ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg 1620
gtgtgcactg tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag 1680
ctcctttccg ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc 1740
tgccttgccc gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg 1800
tcggggaaat catcgtcctt tccttggctg ctcgcctgtg ttgccacctg gattctgcgc 1860
gggacgtcct tctgctacgt cccttcggcc ctcaatccag cggaccttcc ttcccgcggc 1920
ctgctgccgg ctctgcggcc tcttccgcgt cttcgccttc gccctcagac gagtcggatc 1980
tccctttggg ccgcctcccc gcatcgatac cgtcgacctc gactgtgcct tctagttgcc 2040
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 2100
ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta 2160
ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc 2220
atgctgggga gaattccgaa gttcctattc tctagaaagt ataggaactt caggtctgaa 2280
gaggagttta cgtccagcca agctagcttg gctgcaggtc gtcgaaattc taccgggtag 2340
gggaggcgct tttcccaagg cagtctggag catgcgcttt agcagccccg ctgggcactt 2400
ggcgctacac aagtggcctc tggcctcgca cacattccac atccaccggt aggcgccaac 2460
cggctccgtt ctttggtggc cccttcgcgc caccttctac tcctccccta gtcaggaagt 2520
tcccccccgc cccgcagctc gcgtcgtgca ggacgtgaca aatggaagta gcacgtctca 2580
ctagtctcgt gcagatggac agcaccgctg agcaatggaa gcgggtaggc ctttggggca 2640
gcggccaata gcagctttgc tccttcgctt tctgggctca gaggctggga aggggtgggt 2700
ccgggggcgg gctcaggggc gggctcaggg gcggggcggg cgcccgaagg tcctccggag 2760
gcccggcatt ctgcacgctt caaaagcgca cgtctgccgc gctgttctcc tcttcctcat 2820
ctccgggcct ttcgacctgc agcctgttga caattaatca tcggcatagt atatcggcat 2880
agtataatac gacaaggtga ggaactaaac catgggatcg gccattgaac aagatggatt 2940
gcacgcaggt tctccggccg cttgggtgga gaggctattc ggctatgact gggcacaaca 3000
gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct 3060
ttttgtcaag accgacctgt ccggtgccct gaatgaactg caggacgagg cagcgcggct 3120
atcgtggctg gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc 3180
gggaagggac tggctgctat tgggcgaagt gccggggcag gatctcctgt catctcacct 3240
tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg cggcggctgc atacgcttga 3300
tccggctacc tgcccattcg accaccaagc gaaacatcgc atcgagcgag cacgtactcg 3360
gatggaagcc ggtcttgtcg atcaggatga tctggacgaa gagcatcagg ggctcgcgcc 3420
agccgaactg ttcgccaggc tcaaggcgcg catgcccgac ggcgatgatc tcgtcgtgac 3480
ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt ctggattcat 3540
cgactgtggc cggctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga 3600
tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc 3660
cgctcccgat tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgagggga 3720
tcaattctct agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt 3780
tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc 3840
ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg 3900
tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga 3960
tgcggtgggc tctatggctt ctgaggcgga aagaaccagc tggggctcga ctagagcttg 4020
cggaaccctt cgaagttcct attctctaga aagtatagga acttcatcag tcaggtacat 4080
aatggtggat ccagtact 4098
<210> 66
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
gggggaggat tgggaagaca atagcaggca tgctggggag aattccgaag ttcctattct 60
ctagaaagta taggaacttc 80
<210> 67
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
tctctagaaa gtataggaac ttcatcagtc aggtacataa tggtggatcc agtactgctg 60
cacgctgttg gtcgccctgc 80
<210> 68
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
ataaggtttc caatcagccc caccc 25
<210> 69
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
acttaggacc ttgctcatgt tgggt 25
<210> 70
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
agcgcacgtc tgccgcgctg ttc 23
<210> 71
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
tgcctgtagg tgactctcaa gtcca 25
<210> 72
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
ctgggattcc acatctgttg tccac 25
<210> 73
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
acagtggcat tgtcttccgg ctcta 25
<210> 74
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
ctgggattcc acatctgttg tccac 25
<210> 75
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
tgcagctacc gttcatgtcc cc 22
<210> 76
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
gtcaacaagc acaactcttc caggg 25
<210> 77
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
ccagaggctt ctaaacccta aagc 24
<210> 78
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
ggatcggcca ttgaacaaga t 21
<210> 79
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
cagaagaact cgtcaagaag gc 22
<210> 80
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
aaatgtttca ctgttgccag gacgg 25
<210> 81
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
gacacagaca ggagcacgca gttat 25
<210> 82
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
cagtggcatt gtcttccggc tctac 25
<210> 83
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
gcatcgatac cgtcgacctc gac 23
<210> 84
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
gacacagaca ggagcacgca gttat 25
<210> 85
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
gacaagcgtt agtaggcaca tatac 25
<210> 86
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
gctccaattt cccacaacat tagt 24

Claims (26)

1.一种包含IL-6R基因修饰的人源化非人动物的构建方法,其特征在于,所述的构建方法包括在内源非人动物IL-6R基因的外显子1中插入SEQ ID NO:65所示核苷酸序列,该人源化非人动物体内表达人IL-6R蛋白,所述的人IL-6R蛋白的氨基酸序列如SEQ ID NO:62所示,所述的非人动物为小鼠。
2.一种包含IL-6基因修饰的人源化非人动物的构建方法,其特征在于,所述的构建方法包括将SEQ ID NO:11或SEQ ID NO:48所示核苷酸序列替换非人动物IL-6基因的相应区域,该人源化非人动物表达人IL-6蛋白,所述的人IL-6蛋白的氨基酸序列如SEQ ID NO:6或SEQ ID NO:8所示,所述的非人动物为小鼠。
3.一种包含IL-6R和IL-6基因修饰的人源化非人动物的构建方法,其特征在于,所述的构建方法包括在内源非人动物IL-6R基因的外显子1中插入SEQ ID NO:65所示核苷酸序列,所述的构建方法包括将SEQ ID NO:11或SEQ ID NO:48所示核苷酸序列替换非人动物IL-6基因的相应区域;该人源化非人动物体内表达人IL-6R和IL-6蛋白,所述的人IL-6R蛋白的氨基酸序列如SEQ ID NO:62所示,所述的人IL-6蛋白的氨基酸序列如SEQ ID NO:6或SEQID NO:8所示,所述的非人动物为小鼠。
4.根据权利要求1或3所述的构建方法,其特征在于,所述的人IL-6R基因通过内源性调控元件调控。
5.根据权利要求2或3所述的构建方法,其特征在于,所述的人IL-6基因通过内源性调控元件调控。
6.根据权利要求4所述的构建方法,其特征在于,内源性IL-6R基因不表达或表达降低。
7.根据权利要求1或3所述的构建方法,其特征在于,插入的编码人或人源化IL-6R蛋白的核苷酸序列后还包括辅助序列,所述的辅助序列为WPRE和/或polyA。
8.根据权利要求1、3和6任一所述的构建方法,其特征在于,所述的构建方法包括使用靶向载体将编码人IL-6R蛋白的核苷酸序列和辅助序列的连接序列插入非人动物IL-6R基因的外显子1中;所述的靶向载体包含插入的供体DNA序列,其编码供体转换区,所述的插入的供体DNA序列包含人IL-6R基因的核苷酸序列。
9.根据权利要求1或3所述的构建方法,其特征在于,所述的人源化非人动物的基因组中包括嵌合IL-6R基因,所述的嵌合IL-6R基因编码人IL-6R蛋白,所述的嵌合IL-6R基因的核苷酸序列选自以下任一种:
a)如SEQ ID NO:65所示的核苷酸序列;
b)来源于人IL-6R基因的部分包括SEQ ID NO:65第1-1407位所示的核苷酸序列;
c)来源于人IL-6R基因的部分包括SEQ ID NO:61所示的核苷酸序列;
d)来源于人IL-6R基因的部分包括SEQ ID NO:61第438-1844位所示的序列。
10.根据权利要求2-3任一所述的构建方法,其特征在于,所述的构建方法包括将人IL-6基因的从外显子1的起始密码子至外显子5的终止密码子的核苷酸序列替换非人动物IL-6基因的相应区域。
11.根据权利要求10所述的构建方法,其特征在于,所述的构建方法包括利用基因编辑技术,使用靶向载体将人IL-6基因的从外显子1的起始密码子至外显子5的终止密码子的核苷酸序列替换非人动物IL-6基因的相应区域;所述的靶向载体包含替换的供体DNA序列,其编码供体转换区,所述的替换的供体DNA序列包含人IL-6基因的从外显子1的起始密码子至外显子5的终止密码子的序列。
12.根据权利要求11所述的构建方法,其特征在于,所述的构建方法包括基于CRISPR/Cas9技术,使用sgRNA靶向序列将人IL-6基因的从外显子1的起始密码子至外显子5的终止密码子的核苷酸序列替换非人动物IL-6基因的相应区域;所述的sgRNA靶向的5’端靶位点序列如SEQ ID NO:22-28任一项所示,和3’端靶位点序列如SEQ ID NO:29-36任一项所示。
13.根据权利要求12所述的构建方法,其特征在于,使用的sgRNA靶位点序列为SEQ IDNO:26和SEQ ID NO:34。
14.根据权利要求2或3所述的构建方法,其特征在于,所述的人源化非人动物的基因组中包含嵌合IL-6基因,所述的嵌合IL-6基因编码人IL-6蛋白,所述的嵌合IL-6基因的核苷酸序列选自以下任一种:
a)转录的mRNA序列包括SEQ ID NO:49或SEQ ID NO:50所示的核苷酸序列;
b)来源于人IL-6基因的部分包括SEQ ID NO:5或SEQ ID NO:7或SEQ ID NO:11或SEQID NO:48所示的核苷酸序列。
15.一种包含IL-6R基因的人源化细胞株,其特征在于,所述的人源化细胞株在内源非人动物细胞株IL-6R基因的外显子1中插入SEQ ID NO:65所示的人IL-6R基因的核苷酸序列,该人源化细胞株表达人IL-6R蛋白,所述的人IL-6R蛋白的氨基酸序列如SEQ ID NO:62所示,所述的细胞株不能发育为动物个体,所述的非人动物为小鼠。
16.一种包含IL-6基因的人源化细胞株,其特征在于,所述的人源化细胞株将SEQ IDNO:11或SEQ ID NO:48所示的人IL-6基因的核苷酸序列替换非人动物细胞株IL-6基因的相应区域,该人源化细胞株表达人IL-6蛋白,所述的人IL-6蛋白的氨基酸序列如SEQ ID NO:6或SEQ ID NO:8所示,所述的细胞株不能发育为动物个体,所述的非人动物为小鼠。
17.一种包含IL-6基因人源化和IL-6R基因人源化的非人动物的制备方法,其特征在于,所述的方法包括将权利要求1、4、6-9任一所述的构建方法制备的IL-6R基因人源化非人动物与权利要求2、5、10-14任一所述的构建方法制备的IL-6基因人源化非人动物交配、体外授精或直接进行基因编辑,并进行筛选,得到包含IL-6R基因人源化和IL-6基因人源化的非人动物。
18.一种制备多基因人源化非人动物的方法,其特征在于,包括如下步骤:
(a)采用权利要求1-14任一所述的构建方法制备人源化非人动物或权利要求17所述的制备方法制备非人动物;
(b)将步骤(a)制备获得的非人动物与其他基因人源化动物交配、体外授精或直接进行基因编辑,并进行筛选,得到多基因人源化非人动物。
19.根据权利要求18所述的方法,其特征在于,所述的其他基因人源化动物选自基因IL3、GM-CSF、M-SCF、TPO、PD-1、PD-L1、CTLA-4、LAG-3、BTLA、CD27、CD28、CD47、CD137、CD154、OX40、SIRPα、TIGIT、TIM-3或GITR人源化动物中的一种或两种以上的组合。
20.一种荷瘤或炎症的动物模型的制备方法,其特征在于,所述的制备方法包括通过权利要求1-14任一所述的构建方法、权利要求17所述的制备方法、权利要求18-19任一所述的方法制备非人动物。
21.一种免疫系统重建的方法,其特征在于,所述的方法包括如下步骤:
A)权利要求1-14任一所述的构建方法获得人源化非人动物、权利要求17所述的制备方法获得包含IL-6基因人源化和IL-6R基因人源化的非人动物、权利要求18-19任一所述的方法获得的多基因人源化非人动物;
B)向步骤A)获得的任一人源化非人动物移植人免疫细胞,获得人免疫系统重建的人源化非人动物。
22.一种自身免疫疾病动物模型的构建方法,其特征在于,所述的方法包括如下步骤:
(1)权利要求1-14任一所述的构建方法获得人源化非人动物、权利要求17所述的制备方法获得包含IL-6基因人源化和IL-6R基因人源化的非人动物、权利要求18-19任一所述的方法获得的多基因人源化非人动物;
(2)用免疫诱导剂免疫步骤(1)所述的非人动物,构建所述自身免疫疾病动物模型。
23.来源于权利要求1-14任一所述的构建方法获得的人源化非人动物、权利要求17所述的制备方法获得的包含IL-6基因人源化和IL-6R基因人源化的非人动物、权利要求18-19任一所述的方法获得的多基因人源化非人动物、权利要求20所述的制备方法获得的荷瘤或炎症的动物模型、权利要求21所述的方法获得的人免疫系统重建的人源化非人动物或者权利要求22所述的构建方法获得的自身免疫疾病动物模型在需要涉及人类细胞的免疫过程的产品开发,制造人类抗体,或者作为免疫学、微生物学和医学研究的模型系统中的应用,所述的应用为非疾病的诊断和治疗目的。
24.根据权利要求23所述的应用,其特征在于,所述的医学为药理学。
25.根据权利要求23所述的应用,其特征在于,所述的应用包括在筛选、验证、评价或研究IL-6R和/或IL-6基因功能、IL-6R和/或IL-6抗体、针对IL-6R和/或IL-6靶位点的药物、药效研究,免疫相关疾病药物以及抗肿瘤药物的药效评价的用途。
26.根据权利要求25所述的应用,其特征在于,所述的免疫相关疾病药物为抗炎症药物。
CN201911300689.9A 2019-12-17 2019-12-17 一种人源化细胞因子动物模型、制备方法及应用 Active CN111304246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911300689.9A CN111304246B (zh) 2019-12-17 2019-12-17 一种人源化细胞因子动物模型、制备方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911300689.9A CN111304246B (zh) 2019-12-17 2019-12-17 一种人源化细胞因子动物模型、制备方法及应用

Publications (2)

Publication Number Publication Date
CN111304246A CN111304246A (zh) 2020-06-19
CN111304246B true CN111304246B (zh) 2021-05-04

Family

ID=71154461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911300689.9A Active CN111304246B (zh) 2019-12-17 2019-12-17 一种人源化细胞因子动物模型、制备方法及应用

Country Status (1)

Country Link
CN (1) CN111304246B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113930446A (zh) * 2020-07-13 2022-01-14 黄菁 对非人动物基因改造的方法及构建的免疫缺陷动物模型
CN111808882B (zh) * 2020-09-01 2020-12-29 北京百奥赛图基因生物技术有限公司 Il7r基因人源化改造的动物模型的构建方法及其应用
CN112048522A (zh) * 2020-09-02 2020-12-08 北京百奥赛图基因生物技术有限公司 Tmem173基因人源化改造的动物模型的构建方法及其应用
CN112301056B (zh) * 2020-12-21 2021-03-16 澎立生物医药技术(上海)有限公司 一种针对人源化免疫系统小鼠的基因编辑方法及其用途
CN112501203B (zh) * 2021-02-05 2021-06-04 百奥赛图(北京)医药科技股份有限公司 Il17rb基因人源化的非人动物的构建方法及应用
CN113999873B (zh) * 2021-12-31 2022-05-20 北京市疾病预防控制中心 一种基因修饰的非人动物的构建方法及其应用
WO2024067796A1 (zh) * 2022-09-28 2024-04-04 百奥赛图(北京)医药科技股份有限公司 一种il5和/或il5ra基因人源化修饰的非人动物

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7098374B2 (en) * 2001-02-09 2006-08-29 University Of Florida Research Foundation, Inc. Human disease modeling using somatic gene transfer
US8062866B2 (en) * 2008-11-13 2011-11-22 Femta Pharmaceuticals, Inc. Humanized anti-IL-6 antibodies
MY172726A (en) * 2011-10-28 2019-12-11 Regeneron Pharma Humanized il-6 and il-6 receptor
JP6282591B2 (ja) * 2012-09-13 2018-02-21 中外製薬株式会社 遺伝子ノックイン非ヒト動物
WO2014071397A2 (en) * 2012-11-05 2014-05-08 Regeneron Pharmaceuticals Genetically modified non-human animals and methods of use thereof
WO2019051355A1 (en) * 2017-09-08 2019-03-14 Ohio State Innovation Foundation NEW MICROARN INHIBITOR THERAPY FOR SYSTEMIC LUPUS ERYTHEMATOSUS
CN109666701B (zh) * 2017-10-13 2021-08-24 百奥赛图(北京)医药科技股份有限公司 一种pd-1基因修饰人源化动物模型的构建方法及其应用
WO2020125639A1 (en) * 2018-12-17 2020-06-25 Biocytogen Jiangsu Co., Ltd. Genetically modified non-human animal with human or chimeric genes
CN111118019B (zh) * 2018-12-25 2021-03-16 百奥赛图江苏基因生物技术有限公司 人源化细胞因子il3基因改造非人动物的构建方法及应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Homo sapiens interleukin 6 (IL6),transcript variant 1, mRNA;Lara-Gomez RE等;《GenBank》;20190528;Accession No.NM_001318095.1 *
Tseng HC等.Homo sapiens interleukin 6 (IL6),transcript variant 1, mRNA.《GenBank》.2018, *

Also Published As

Publication number Publication date
CN111304246A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN111304246B (zh) 一种人源化细胞因子动物模型、制备方法及应用
CN111837036A (zh) 具有人或嵌合基因的基因修饰的非人动物
CN111057721B (zh) 人源化IL-4和/或IL-4Rα改造动物模型的制备方法及应用
CN108424928B (zh) 人源化基因改造动物模型的制备方法及应用
CN109913493B (zh) 人源化cd3基因改造动物模型的制备方法及应用
CN112779285B (zh) 人源化il-10和il-10ra基因改造动物的构建方法和应用
CN111218425B (zh) 人源化转基因动物
CN111793646B (zh) Il1r1基因人源化改造的非人动物的构建方法及其应用
CN114277055A (zh) Il1b和il1a基因人源化的非人动物及其构建方法和应用
CN112300265B (zh) Il33基因人源化的非人动物的构建方法和应用
CN113429486A (zh) 基因修饰非人动物的构建方法及应用
CN112501205B (zh) Ceacam1基因人源化非人动物的构建方法及应用
CN113881681B (zh) Ccr8基因人源化非人动物及其构建方法和应用
CN113355355B (zh) Il23a和/或il12b基因人源化非人动物的构建方法及应用
CN112553252B (zh) Tnfr2基因人源化的非人动物的构建方法和应用
CN115011606A (zh) Cd37基因人源化非人动物的构建方法及应用
CN114316026A (zh) 一种il17ra和/或il17rc基因人源化非人动物及其构建方法和应用
CN111304247B (zh) 人源化lag-3基因改造动物模型的制备方法及应用
CN112501204B (zh) Il21r基因人源化非人动物及其构建方法和应用
CN112481303B (zh) Il15ra基因人源化非人动物及其构建方法和应用
CN114853871B (zh) Csf1和/或csf1r基因人源化的非人动物及其构建方法和应用
CN113388640B (zh) Ccr4基因人源化的非人动物及其构建方法和应用
CN112501203B (zh) Il17rb基因人源化的非人动物的构建方法及应用
CN115260303A (zh) Cd70基因人源化非人动物的构建方法及应用
CN114621971A (zh) 经遗传修饰的非人动物及其构建方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Building B10, biomedical science and Technology Innovation Park, Linjiang New District, Haimen City, Nantong City, Jiangsu Province

Applicant after: BIOCYTOGEN JIANGSU GENE BIOTECHNOLOGY Co.,Ltd.

Applicant after: Baccetus (Beijing) Pharmaceutical Technology Co.,Ltd.

Address before: Building B10, biomedical science and Technology Innovation Park, Linjiang New District, Haimen City, Nantong City, Jiangsu Province

Applicant before: BIOCYTOGEN JIANGSU GENE BIOTECHNOLOGY Co.,Ltd.

Applicant before: BEIJING BIOCYTOGEN Co.,Ltd.

GR01 Patent grant
GR01 Patent grant