CN114128676A - 具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途 - Google Patents

具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途 Download PDF

Info

Publication number
CN114128676A
CN114128676A CN202111210808.9A CN202111210808A CN114128676A CN 114128676 A CN114128676 A CN 114128676A CN 202111210808 A CN202111210808 A CN 202111210808A CN 114128676 A CN114128676 A CN 114128676A
Authority
CN
China
Prior art keywords
sequence
human
seq
heavy chain
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111210808.9A
Other languages
English (en)
Inventor
L·麦克唐纳
J·麦克沃克
A·J·莫菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=58010373&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN114128676(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Publication of CN114128676A publication Critical patent/CN114128676A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/715Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons
    • C07K14/7158Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons for chemokines
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/46Hybrid immunoglobulins
    • C07K16/461Igs containing Ig-regions, -domains or -residues form different species
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/46Hybrid immunoglobulins
    • C07K16/461Igs containing Ig-regions, -domains or -residues form different species
    • C07K16/462Igs containing a variable region (Fv) from one specie and a constant region (Fc) from another
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/15Animals comprising multiple alterations of the genome, by transgenesis or homologous recombination, e.g. obtained by cross-breeding
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/01Animal expressing industrially exogenous proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/10Immunoglobulins specific features characterized by their source of isolation or production
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/21Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/24Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/51Complete heavy chain or Fd fragment, i.e. VH + CH1
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/52Constant or Fc region; Isotype
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/565Complementarity determining region [CDR]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/567Framework region [FR]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/70Immunoglobulins specific features characterized by effect upon binding to a cell or to an antigen
    • C07K2317/76Antagonist effect on antigen, e.g. neutralization or inhibition of binding
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/90Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
    • C07K2317/92Affinity (KD), association rate (Ka), dissociation rate (Kd) or EC50 value
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2318/00Antibody mimetics or scaffolds
    • C07K2318/10Immunoglobulin or domain(s) thereof as scaffolds for inserted non-Ig peptide sequences, e.g. for vaccination purposes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • C12N2015/8518Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic expressing industrially exogenous proteins, e.g. for pharmaceutical use, human insulin, blood factors, immunoglobulins, pseudoparticles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/04Immortalised cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Environmental Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Veterinary Medicine (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Husbandry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Cell Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Nitrogen And Oxygen Or Sulfur-Condensed Heterocyclic Ring Systems (AREA)
  • Battery Electrode And Active Subsutance (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了非人动物以及用于制备和使用非人动物的方法和组合物,其中所述非人动物具有包含在免疫球蛋白重链可变区内的经改造的或重组多样性簇的基因组,所述经改造的或重组多样性簇包含目的非免疫球蛋白多肽的一个或多个编码序列的插入。本文所述的非人动物表达特征在于互补决定区(CDR),特别是具有指导与特定抗原的结合的多样性的CDR3的抗体。本发明还提供了用于从非人动物产生抗体的方法,所述抗体含有人可变区和小鼠恒定区。

Description

具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动 物及其用途
本申请是申请号为201780014326.1、申请日为2017年1月12日、发明名称为“具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途”的中国发明专利申请的分案申请,原申请为国际申请号为PCT/US2017/013247的国家阶段申请,该国际申请要求申请日为2016年1月13日,申请号为62/278,127的美国申请的优先权。
背景技术
基于抗体的治疗剂为多种疾病的治疗提供了显著前景。正在开发各种形式,包括单克隆、鼠、嵌合、人源化的、人、全长、Fab、聚乙二醇化、放射性标记的、药物缀合的、多特异性等(参见例如Reichert,J.M.,2012,mAbs 4:3,413-415;Nixon,A.E.等人,2014,mAbs 6:1,73-85;以引用的方式并入本文)。已在美国或欧洲获得上市许可的超过40种治疗性抗体试剂中,全部都用依赖通过体外(例如噬菌体展示)或体内(例如经遗传改造的动物)系统的、来自人和/或非人(例如小鼠)源的传统抗体基因的装配的技术生成。然而,结合顽固性靶的特别有效的抗体试剂的开发仍然是个挑战。
发明内容
本文公开了以下认识:期望改造非人动物以允许用于鉴定和开发基于抗体的新治疗剂的改进体内系统,并且在一些实施例中,可用于治疗特征在于顽固性疾病靶的各种疾病的抗体试剂(例如单克隆抗体和/或其片段)。进一步地,本文公开了以下认识:期望在免疫球蛋白重链可变区(例如异源免疫球蛋白重链可变区)内具有经改造的重链多样性(DH)簇/区,特别是经改造的DH簇(或DH区)的非人动物,所述重链多样性簇/区含有并非天然存在于免疫球蛋白重链可变区内的核苷酸编码序列,和/或以其它方式表达、含有或产生含有互补决定区(CDR)的抗体,所述互补决定区的特征在于指导与特定抗原结合的多样性,例如用于鉴定和开发基于抗体的治疗剂,其可靶向例如跨膜多肽或细胞质多肽。在一些实施例中,本文公开的非人动物是用于开发用于施用于人的抗体和/或基于抗体的治疗剂的体内系统。
在一些实施例中,提供了非人动物,其基因组(例如种系基因组)包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的DH区,其中所述经改造的DH区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分。
在另一个方面,其基因组例如种系基因组被修饰以包含免疫球蛋白重链可变区(其包括经改造的DH区)的非人动物,可被进一步修饰以表达单一重排轻链,例如共同轻链(ULC),其中所述经改造的DH区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分。
可操作地连接到轻链恒定区(也称为共同或通用轻链(ULC))的单个重排的轻链可变基因序列,可由包含单个重排的VL:JL基因序列的轻链基因座编码。在一些实施例中,轻链基因座包含单个重排的VL:JL基因序列,其中VL序列是Vκ基因序列。在一些方面,Vκ序列选自Vκ1-39或Vκ3-20。在一些方面,JL序列是Jκ基因序列,例如Jκ1序列、Jκ2序列、Jκ3序列、Jκ4序列或Jκ5序列等。在一些实施例中,轻链基因座包含选自Vκ1-39Jκ5和Vκ3 20Jκ1的单个重排的Vκ:Jκ序列。在一个实施例中,轻链基因座包含Vκ1-39Jκ5的单个重排的Vκ:Jκ序列。在另一个实施例中,轻链基因座包含Vκ3-20Jκ1的单个重排的Vκ:Jκ序列。在一些实施例中,单个重排的可变基因序列可操作地连接至非人轻链恒定区基因,例如内源性非人轻链恒定区基因。在另一个实施例中,单个重排的可变基因序列可操作地连接至人轻链恒定区基因。在一些方面,单个重排的可变基因序列是插入内源性免疫球蛋白轻链基因座的人V:J序列,使得所得到的非人动物在一个或多个轻链基因座中不包含功能性未重排的V和/或J基因区段。
在一些实施例中,提供了分离的非人细胞或组织,其基因组包含包括经改造的DH区的免疫球蛋白重链可变区以及任选的共同或通用轻链,其中所述经改造的DH区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分。在一些实施例中,细胞来自淋巴或骨髓谱系。在一些实施例中,细胞为淋巴细胞。在一些实施例中,细胞选自B细胞、树突状细胞、巨噬细胞、单核细胞和T细胞。在一些实施例中,组织选自脂肪、膀胱、大脑、乳房、骨髓、眼、心、肠、肾、肝、肺、淋巴结、肌肉、胰腺、血浆、血清、皮肤、脾、胃、胸腺、睾丸、卵子以及它们的组合。
在一些实施例中,提供了如本文所述的由分离的非人细胞制备的永生化细胞。
在一些实施例中,提供了非人胚胎干(ES)细胞,其基因组包含包括经改造的DH区的免疫球蛋白重链可变区以及任选的共同轻链,其中所述经改造的DH区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分。在一些实施例中,非人胚胎干细胞是啮齿类动物胚胎干细胞。在某些实施例中,啮齿类动物胚胎干细胞是小鼠胚胎干细胞并且来自129品系、C57BL品系或它们的混合物。在某些实施例中,啮齿类动物胚胎干细胞是小鼠胚胎干细胞并且是129和C57BL品系的混合物。
在一些实施例中,提供了非人生殖细胞,其基因组包含包括经改造的DH区的免疫球蛋白重链可变区以及任选的共同轻链,其中所述经改造的DH区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分。在一些实施例中,非人生殖细胞是啮齿类动物生殖细胞。在一些特定实施例中,啮齿类动物生殖细胞是小鼠生殖细胞,并且来自129品系、C57BL品系或其混合物。在一些特定实施例中,啮齿类动物生殖细胞是小鼠生殖细胞,并且是129和C57BL品系的混合物。
在一些实施例中,提供了如本文所述的非人胚胎干细胞或生殖细胞制备非人动物的用途。在一些特定实施例中,非人胚胎干细胞或生殖细胞是小鼠胚胎干细胞或生殖细胞,并且用于制备如本文所述包含包括经改造的DH区的免疫球蛋白重链可变区以及任选的共同轻链的小鼠。在一些特定实施例中,非人胚胎干细胞或生殖细胞是大鼠胚胎干细胞或生殖细胞,并且用于制备如本文所述包含包括经改造的DH区的免疫球蛋白重链可变区以及任选的共同轻链的大鼠。
在一些实施例中,提供了包含本文所述的非人胚胎干细胞、由其制备、由其获得或由其产生的非人胚胎。在某些实施例中,非人胚胎为啮齿类动物胚胎;在一些实施例中,为小鼠胚胎;在一些实施例中,为大鼠胚胎。
在一些实施例中,提供了本文描述的非人胚胎用于制备非人动物的用途。在一些特定实施例中,非人胚胎是小鼠胚胎,并且用于制备如本文所述包含包括经改造的DH区的免疫球蛋白重链可变区以及任选的共同轻链基因座的小鼠。在一些特定实施例中,非人胚胎是大鼠胚胎,并且用于制备如本文所述包含包括经改造的DH区的免疫球蛋白重链可变区以及任选的共同轻链基因座的大鼠。
在一些实施例中,提供了试剂盒,其包含如本文所述的分离的非人细胞或组织、如本文所述的永生化细胞、如本文所述的非人胚胎干细胞、如本文所述的非人胚胎、或如本文所述的非人动物。
在一些实施例中,提供了如本文所述的试剂盒,用于制造和/或开发用于治疗或诊断的药物(例如,抗体或其抗原结合片段)。
在一些实施例中,提供了如本文所述的试剂盒,用于制备和/或开发用于治疗、预防或改善疾病、病症或状况的药物(例如,抗体或其抗原结合片段)。
在一些实施例中,提供了本文所述的转基因、核酸构建体、DNA构建体或靶向载体。在一些特定实施例中,转基因、核酸构建体、DNA构建体或靶向载体包含如本文所述的经改造的DH区。在一些特定实施例中,转基因、核酸构建体、DNA构建体或靶向载体包含DNA片段,其包括本文所述的一个或多个核苷酸编码序列。在一些实施例中,转基因、核酸构建体、DNA构建体或靶向载体包含经改造的DH区,其包含选自表3或表4的一个或多个核苷酸编码序列,其中一个或多个核苷酸编码序列各自侧翼为选自图2的重组信号序列。在某些实施例中,转基因、核酸构建体、DNA构建体或靶向载体还包含一个或多个选择性标记。在一些特定实施例中,转基因、核酸构建体、DNA构建体或靶向载体还包含一个或多个位点特异性重组位点(例如lox、Frt或其组合)。在一些特定实施例中,转基因、核酸构建体、DNA构建体或靶向载体在图3A、3B、4A、4B、7A、7B、8A和8B中的任何一个中描绘。
在一些实施例中,提供了本文所述的转基因、核酸构建体、DNA构建体或靶向载体用于制备非人胚胎干细胞、非人细胞、非人胚胎和/或非人动物的用途。
在一些实施例中,目的非免疫球蛋白多肽是趋化因子受体。在一些实施例中,趋化因子受体选自CC-趋化因子受体(或β-趋化因子受体)、CXC-趋化因子受体、CX3C-趋化因子受体和XC-趋化因子受体。在一些实施例中,趋化因子受体是非典型趋化因子受体(ACKR)。在一些实施例中,ACKR选自ACKR1、ACKR2、ACKR3和ACKR4。在一些特定实施例中,ACKR是ACKR2或D6趋化因子诱饵受体。
在一些实施例中,目的非免疫球蛋白多肽是毒素。在一些实施例中,毒素是在狼蛛、蜘蛛、蝎子或海葵的毒液中发现的毒素。
在一些实施例中,目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。在一些实施例中,芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。在一些特定实施例中,芋螺毒素是μ-芋螺毒素。在一些特定实施例中,狼蛛毒素是ProTxI、ProTxII、虎纹捕鸟蛛毒素-IV(HWTX-IV)或其组合。
在一些实施例中,经改造的DH区包含5、10、15、20、25个或更多个核苷酸序列,其各自编码D6趋化因子诱饵受体的细胞外部分,或各自编码芋螺毒素(例如μ-芋螺毒素)的一部分,或各自编码狼蛛毒素(例如ProTxI、ProTxII等)的一部分或其组合。
在一些实施例中,经改造的DH区包括各自编码D6趋化因子诱饵受体的细胞外部分的25个核苷酸序列,或包括各自编码芋螺毒素(例如μ-芋螺毒素)和/或狼蛛毒素(例如ProTxI、ProTxII等)的一部分的26个核苷酸序列。
在一些实施例中,D6趋化因子诱饵受体的细胞外部分选自N末端区域、细胞外环及其组合。
在一些实施例中,如本文所述的芋螺毒素的一部分包括包含一个或多个二硫键的序列。在一些实施例中,如本文所述的芋螺毒素的一部分包括与自然界中出现的芋螺毒素序列(例如参考或亲本芋螺毒素序列)相比,缺乏一个或多个二硫键的序列。在一些实施例中,如本文所述的芋螺毒素的一部分包括与自然界中出现的芋螺毒素序列(例如参考或亲本芋螺毒素序列)相比,显示出相同或不同的二硫键数目和/或模式的序列。
在一些实施例中,如本文所述的狼蛛毒素的一部分包括包含半胱氨酸结基序的序列,所述半胱氨酸结基序在自然界中发现的狼蛛毒素序列中出现。在一些实施例中,如本文所述的狼蛛毒素的一部分包含其为或包含半胱氨酸结肽的序列。在一些实施例中,如本文所述的狼蛛毒素的一部分包括与自然界出现的狼蛛毒素序列(例如参考或亲本狼蛛毒素序列)相比,缺乏一个或多个二硫键的序列。在一些实施例中,如本文所述的狼蛛毒素的一部分包括与自然界出现的狼蛛毒素序列(例如参考或亲本狼蛛毒素序列)相比,显示出相同或不同的二硫键数目和/或模式的序列。
在一些实施例中,经改造的DH区包含25或26个核苷酸序列,其与表3或表4中出现的核苷酸序列至少50%、60%、70%、80%、90%、95%或至少98%相同,和/或编码表3或表4中出现的氨基酸序列。在一些实施例中,经改造的DH区包含25或26个核苷酸序列,其各自编码与表3或表4中出现的氨基酸序列基本上相同或相同的氨基酸序列,或者具有与表3或4中出现的氨基酸序列相同的功能。
在一些实施例中,一个或多个核苷酸序列包含增加一个或多个核苷酸序列的体细胞超突变的一个或多个核苷酸取代。
在一些实施例中,经改造的DH区还包括侧接一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。在一些特定实施例中,第一重组信号序列包含与图2中出现的第一重组信号序列至少50%、60%、70%、80%、90%、95%或至少98%相同的序列。在一些特定实施例中,第一重组信号序列包含与图2中出现的第一重组信号序列基本上相同或相同的序列。在一些特定实施例中,第二重组信号序列包含与图2中出现的第二重组信号序列至少50%、60%、70%、80%、90%、95%或至少98%相同的序列。在一些特定实施例中,第二重组信号序列包含与图2中出现的第二重组信号序列基本上相同或相同的序列。在一些实施例中,第一重组信号序列和第二重组信号序列选自图2。
在一些实施例中,所提供的非人动物的基因组缺少一个或多个野生型内源性DH基因区段。在一些特定实施例中,所提供的非人动物的基因组缺少全部或基本上全部野生型内源性DH基因区段。在一些实施例中,所提供的非人动物的基因组缺少一个或多个野生型内源性重组信号序列。
在一些实施例中,经改造的DH区包含一个或多个野生型人DH基因区段。在一些特定实施例中,经改造的DH区包含人DH6-25基因区段。在一些特定实施例中,经改造的DH区缺少人DH6-25基因区段。
在一些实施例中,免疫球蛋白重链可变区可操作地连接至免疫球蛋白重链恒定区。
在一些实施例中,免疫球蛋白重链恒定区是内源性免疫球蛋白重链恒定区。
在一些实施例中,免疫球蛋白重链可变区是未重排的人免疫球蛋白重链可变区,例如包含侧接经改造的(e)DH区的至少一个人(h)未重排的VH基因区段和/或至少一个人(h)未重排的JH基因区段。在一些实施例中,免疫球蛋白重链可变区包含侧接经改造的(e)DH区的多个人(h)未重排的VH基因区段和/或多个人(h)未重排的JH基因区段。在一些实施例中,未重排的人免疫球蛋白重链可变区例如在内源性非人重链基因座处可操作地连接至免疫球蛋白重链恒定区,例如非人免疫球蛋白重链恒定区。
在一些实施例中,人免疫球蛋白重链可变区包含重排的人免疫球蛋白重链可变区,其中所述重排的人免疫球蛋白重链包含与经改造的(e)DH区重组的至少一个人(h)未重排的VH基因区段和/或至少一个人(h)未重排的JH基因区段,以形成重排的(h)VH/(e)DH/(h)JH基因序列,其可与重链恒定区可操作地连接。在一些实施例中,这种重组在B细胞发育期间在B细胞中发生。
相应地,本文所述的非人动物可包含
(i)包含未重排的人重链可变区的生殖细胞,
(a)至少一个或多个人(h)未重排的VH基因区段,
(b)至少一个或多个人(h)未重排的JH基因区段,和
(c)侧翼为(a)和(b)的经改造的(e)DH区,其中(a)、(b)和(c)重组以形成重排的人重链可变区hVH/eDH/hJH序列;和
(ii)包含重排的人hVH/eDH/hJH基因序列的体细胞,例如B细胞,其中所述重排的hVH/eDH/hJH基因序列包含含有一个或多个核苷酸序列的CDR3编码序列,所述一个或多个核苷酸序列编码目的非免疫球蛋白多肽或其一部分、或其体细胞超突变的变体。在一些实施例中,人未重排或重排的人重链可变区例如在非人内源性重链基因座处可操作地连接至重链恒定区,其可为非人重链恒定区。在一些实施例中,免疫球蛋白重链可变区是人免疫球蛋白重链可变区。在一些实施例中,B细胞还将与重链恒定区可操作地连接的重排的hVH/eDH/hJH基因序列表达为包含CDR3的免疫球蛋白重链样多肽,所述CDR3包含含有目的非免疫球蛋白多肽、其一部分或其体细胞超突变的变体。
在一些实施例中,如本文所述的非人动物还包含人源化轻链基因座。在一些实施例中,如本文公开的非人动物包含
(i)在生殖细胞中:
(a)包含未重排的免疫球蛋白重链可变区和免疫球蛋白重链恒定区的免疫球蛋白重链基因座,其中所述未重排的免疫球蛋白重链可变区包含至少一个未重排的VH基因区段(其可为人未重排的VH基因区段,例如hVH)、经改造的DH区(其可包括人DH基因区段和/或经改造的DH基因区段,例如hDH)和至少一个未重排的,任选地人JH基因区段,其中所述VH基因区段、经改造的DH区和JH基因区段可操作地连接,使得它们可例如在B细胞发育过程中在B细胞中重组,以形成与免疫球蛋白重链恒定区可操作地连接的重排的免疫球蛋白重链hVH/eDH/hJH可变区基因序列,和
(b)包含人VL和/或JL基因区段并且可编码(人)共同轻链的免疫球蛋白轻链基因座;和
(ii)在体细胞例如B细胞中,
(a)与免疫球蛋白重链恒定区可操作地连接的重排的免疫球蛋白重链hVH/eDH/hJH可变区基因序列,其中所述经改造的DH区包含编码目的非免疫球蛋白多肽或一其部分的序列,并且其中重排的hVH/eDH/hJH基因序列包含含有一个或多个核苷酸序列的CDR3编码序列,所述一个或多个核苷酸序列编码目的非免疫球蛋白多肽、或其一部分或其体外超突变的变体,和
(b)人源化和/或共同的免疫球蛋白轻链基因座或其体细胞超突变的变体。在一些实施例中,人未重排或重排的人重链可变区例如在非人内源性重链基因座处可操作地连接至重链恒定区,其可为非人重链恒定区。在一些实施例中,免疫球蛋白重链可变区是人免疫球蛋白重链可变区。在一些实施例中,B细胞还将与重链恒定区可操作地连接的重排的hVH/eDH/hJH基因序列表达为包含CDR3的免疫球蛋白重链样多肽,其包含目的非免疫球蛋白多肽、其一部分或其体外超突变的变体,并且将人(源化)和/或共同轻链表达为四聚体免疫球蛋白样抗原结合蛋白,其中所述四聚体包含免疫球蛋白重链样多肽的二聚体,其各自共价结合至人(源化)和/或共同轻链。
在一些实施例中,提供了制备其基因组含有免疫球蛋白重链可变区的非人动物的方法,所述免疫球蛋白重链可变区包括经改造的DH区,所述方法包括(a)将DNA片段插入非人胚胎干细胞内,所述DNA片段包含一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分;(b)获得(a)中生成的非人胚胎干细胞;并且(c)使用(b)的胚胎干细胞产生非人。
在一个实施例中,如本文公开的制备非人动物的方法包括(a)获得其基因组含有免疫球蛋白重链可变区的第一非人动物,所述免疫球蛋白重链可变区包括如本文所公开的经改造的DH区,并且(b)用第二非人动物交配(a)的第一非人动物,所述第二非人动物在一个方面可为与第一非人动物不同的品系,其中所述第二非人动物表达通用轻链,并且其中所述交配导致后代,所述后代产生(例如包含)例如在CDR3中包含非免疫球蛋白蛋白质(或其一部分)的氨基酸序列的经遗传改造的重链、以及经遗传改造的重排的轻链(单一重排的轻链;ULC)。
在一些实施例中,DNA片段包括5、10、15、20、25个或更多个核苷酸序列,其各自编码D6趋化因子诱饵受体的细胞外部分,或者各自编码芋螺毒素(例如μ-芋螺毒素)的一部分、狼蛛毒素或其组合。在一些特定实施例中,DNA片段包括各自编码D6趋化因子诱饵受体的细胞外部分的25个核苷酸序列,或包括各自编码芋螺毒素(例如μ-芋螺毒素)和/或狼蛛毒素(例如ProTxI、ProTxII等)的一部分的26个核苷酸序列。在一些特定实施例中,DNA片段还包含侧接25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。
在一些实施例中,提供了制备其基因组含有免疫球蛋白重链可变区的非人动物的方法,所述免疫球蛋白重链可变区包括经改造的DH区,所述方法包括修饰非人动物的基因组,使得它包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的DH区,所述经改造的DH区包含一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分,由此制备所述非人动物。
在一些实施例中,非人动物的基因组被修饰为包括5、10、15、20、25个或更多个核苷酸序列,其各自编码D6趋化因子诱饵受体的细胞外部分,或者各自编码芋螺毒素(例如μ-芋螺毒素)的一部分、狼蛛毒素或其组合。在一些特定实施例中,非人动物的基因组被修饰为包括各自编码D6趋化因子诱饵受体的细胞外部分的25个核苷酸序列,或被修饰为包括各自编码芋螺毒素(例如μ-芋螺毒素)和/或狼蛛毒素(例如ProTxI、ProTxII等)的一部分的26个核苷酸序列。在一些特定实施例中,非人动物的基因组被修饰为还包括侧接25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。
在一些实施例中,提供了在非人动物中产生抗体的方法,所述方法包括以下步骤:(a)用抗原免疫非人动物,所述非人动物具有包含免疫球蛋白重链可变区的基因组,所述免疫球蛋白重链可变区包括经改造的DH区,其中所述经改造的DH区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分;(b)将所述非人动物维持在足以使所述非人动物对抗原产生免疫应答的条件下;并且(c)从非人动物或非人动物细胞中回收结合抗原的抗体。在一些特定实施例中,非人细胞是B细胞。在一些特定实施例中,非人细胞是杂交瘤。
在一些实施例中,提供了非人动物,其生殖细胞基因组包含(a)人免疫球蛋白重链可变区,其包含一个或多个未重排的人VH基因区段、经改造的DH区和一个或多个未重排的人JH基因区段,所述经改造的DH区包括(i)各自编码非典型趋化因子受体(ACKR)的细胞外部分的一个或多个核苷酸序列;和(ii)侧接(i)的一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列,使得所述一个或多个未重排的人VH基因区段、经改造的DH区和一个或多个未重排的人JH基因区段例如在B细胞中重组,使得所述非人动物包含B细胞基因组,所述B细胞基因组包含含有重排的hVH/eDH/hJH基因序列的人免疫球蛋白重链可变区;其中所述人免疫球蛋白重链可变区可操作地连接至一个或多个内源性免疫球蛋白重链恒定区基因,使得所述非人动物的特征在于当它用抗原免疫时,与免疫球蛋白重链恒定区基因可操作地连接的所述重排的hVH/eDH/hJH基因序列编码抗体,所述抗体包含由人VH基因区段之一(或其一部分)编码的人重链可变结构域、经改造的DH区(或其一部分)、以及由一个或多个内源性免疫球蛋白恒定区基因编码的与非人动物重链恒定结构域可操作地连接的人JH基因区段之一(或其一部分),并且其中所述抗体显示与抗原的特异性结合。在一些实施例中,非人动物的生殖细胞和例如B细胞还包含编码共同轻链的免疫球蛋白轻链基因座,使得该抗体还包含共同轻链。
在一些实施例中,提供了非人动物,其生殖细胞基因组包含人免疫球蛋白重链可变区,其包含一个或多个未重排的人(h)VH基因区段、经改造的(e)DH区和一个或多个(h)人JH基因区段,所述经改造的DH区包括(i)各自编码毒素(例如,μ-芋螺毒素、狼蛛毒素或其组合)的一部分的一个或多个核苷酸序列;和(ii)侧接(i)的一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列,使得所述一个或多个未重排的人VH基因区段、经改造的DH区和一个或多个未重排的人JH基因区段例如在B细胞中重组,使得所述非人动物包含B细胞基因组,所述B细胞基因组包含含有重排的hVH/eDH/hJH基因序列的人免疫球蛋白重链可变区;其中所述人免疫球蛋白重链可变区可操作地连接至一个或多个内源性免疫球蛋白重链恒定区基因,使得所述非人动物的特征在于当它用抗原免疫时,与免疫球蛋白重链恒定区基因可操作地连接的所述重排的hVH/eDH/hJH基因序列编码抗体,所述抗体包含由人VH基因区段之一(或其一部分)编码的人重链可变结构域、经改造的DH区(或其一部分)、以及由一个或多个内源性免疫球蛋白恒定区基因编码的与一个或多个重链恒定结构域可操作地连接的人JH基因区段之一(或其一部分),并且其中所述抗体显示与抗原的特异性结合。在一些实施例中,非人动物的生殖细胞和例如B细胞还包含编码共同轻链的免疫球蛋白轻链基因座,使得该抗体还包含共同轻链。
在一些实施例中,所提供的非人动物还包含将一个或多个人VL基因区段和一个或多个人JL基因区段插入内源性轻链基因座内。在一些实施例中,人VL和JL区段是Vκ和Jκ基因区段,并且插入内源性κ轻链基因座内。在一些实施例中,人Vκ和Jκ基因区段与啮齿类动物Cκ基因(例如小鼠或大鼠Cκ基因)可操作地连接。在一些实施例中,人VL和JL区段是Vλ和Jλ基因区段,并且插入内源性λ轻链基因座内。在一些实施例中,人Vλ和Jλ基因区段与啮齿类动物Cλ基因(例如小鼠或大鼠Cλ基因)可操作地连接。在一些实施例中,单个重排的人轻链可变区基因序列可操作地连接至内源非人轻链恒定区基因。在一些实施例中,单个重排的人Vκ/Jκ基因序列可操作地连接至内源性Cκ基因(例如小鼠或大鼠Cκ基因)。在一些实施例中,单个重排的Vλ/Jλ基因序列可操作地连接至内源Cλ基因。
在一些实施例中,所提供的非人动物对于如本文所述的经改造的DH区是纯合的、杂合的或半合子的。在一些实施例中,所提供的非人动物对于如本文所述的经改造的DH区是转基因的。
本文还公开了细胞,例如B细胞或通过与骨髓瘤细胞融合由其衍生的杂交瘤,所述细胞各自包含重排的(h)VH/eDH/(h)JH序列,其可以可操作地连接至包含一个或多个重链恒定区基因的人或非人重链恒定区。这样的细胞例如B细胞可从如本文所述的非人动物,例如啮齿类动物(例如大鼠、小鼠等)中分离。
本文还描述了包含重排的可变(h)VH/eDH/(h)JH序列的核苷酸序列,其可以可操作地连接至包含一个或多个重链恒定区基因的人或非人重链恒定区。这样的核苷酸序列可从如本文所述的非人动物,例如啮齿类动物(例如大鼠、小鼠等)或非人细胞中分离。
在一些实施例中,提供了如本文所述的非人动物在制造和/或开发用于医学中的药物或疫苗中,例如用作药剂的用途。
在一些实施例中,提供了如本文所述的非人动物在制造用于治疗疾病、病症或状况的药剂中的用途。
在一些实施例中,提供了如本文所述的非人动物在制造和/或开发抗体中的用途,所述抗体结合趋化因子或电压-门控钠(NaV)通道。
在一些实施例中,提供了如本文所述的非人动物在制造用于治疗或检测疾病的药剂中的用途,所述疾病的特征在于趋化因子或电压门控钠(NaV)通道表达或功能(例如,异常表达或功能)。
在一些实施例中,提供了如本文所述的非人动物用于制造和/或开发用于治疗或诊断的药物。
在一些实施例中,提供了如本文所述的非人动物用于制造用于治疗、预防或改善疾病、病症或状况的药物。
在一些实施例中,提供了如本文所述的非人动物用于制造和/或开发结合趋化因子或电压门控钠(NaV)通道的抗体。
在一些实施例中,疾病、病症或状况是炎性疾病、病症或状况。在一些实施例中,疾病、病症或状况的特征在于趋化因子表达或功能(例如,异常趋化因子表达或功能)。
在一些实施例中,疾病、病症或状况是疼痛疾病、病症或状况。在一些实施例中,疾病、病症或状况的特征在于离子通道表达或功能(例如,异常NaV通道表达或功能)。
在许多实施例中,本文提供的非人动物是啮齿类动物;在一些实施例中,是小鼠;在一些实施例中,是大鼠。
如本申请中所用,术语"约"和"大约"可等同使用。本申请中与或不与约/大约一起使用的任何数字意在涵盖由相关领域普通技术人员所理解的任何正常波动。
本文公开的非人动物、细胞、核酸和组合物的其它特点、目的和优点在下述某些实施例的详细描述中是显而易见的。然而,应该理解,尽管指出了某些实施例,但详细描述仅作为说明而不是限制给出。
附图说明
本文中包括的由以下各图组成的附图仅用于举例说明目的而非用于限制。
图1A-1D显示了所选择的D6趋化因子诱饵受体编码序列的示例性优化,以包括体细胞超突变热点。图1A:具有天然(虚线填充)和人工(对角线填充)RGYW活化诱导胞苷脱氨酶(AID)热点位置的D6趋化因子诱饵受体的优化的Nterm结构域;图1B:具有天然(虚线填充)和人工(对角线填充)RGYW活化诱导胞苷脱氨酶(AID)热点位置的D6趋化因子诱饵受体的优化的EC1结构域;图1C:具有天然(虚线填充)和人工(对角线填充)RGYW AID热点位置的D6趋化因子诱饵受体的优化的EC2结构域;图1D:具有天然(虚线填充)和人工(对角线填充)RGYW AID热点位置的D6趋化因子诱饵受体的优化的EC3结构域。
图2显示了针对每个核苷酸编码序列设计的示例性优化的5'和3'重组信号序列(RSS)的表,以允许在V(D)J重组期间核苷酸编码序列的有效重组频率和相等使用。总体RSS共有序列5’RSS(SEQ ID NO:51);总体RSS共有序列3’RSS(SEQ ID NO:52);人DH共有序列5’RSS(SEQ ID NO:53);人DH共有序列3’RSS(SEQ ID NO:54);小鼠DH共有序列5’RSS(SEQ IDNO:55);小鼠DH共有序列3’RSS(SEQ ID NO:56);优化的RSS 5’RSS(SEQ ID NO:57);优化的RSS 3’RSS(SEQ ID NO:58);1-1 opt 5’RSS(SEQ ID NO:59);1-1 opt 3’RSS(SEQ ID NO:60);1-7 opt 5’RSS(SEQ ID NO:61);1-7 opt 3’RSS(SEQ ID NO:62);1-14 ORF opt 5’RSS(SEQ ID NO:63);1-14 ORF opt 3’RSS(SEQ ID NO:64);1-20 opt 5’RSS(SEQ ID NO:65);1-20 opt 3’RSS(SEQ ID NO:66);1-26 opt 5’RSS(SEQ ID NO:67);1-26 opt 3’RSS(SEQ ID NO:68);2-2*02 opt 5’RSS(SEQ ID NO:69);2-2*02 opt 3’RSS(SEQ ID NO:70);2-8*01 opt 5’RSS(SEQ ID NO:71);2-8*01 opt 3’RSS(SEQ ID NO:72);2-15 opt 5’RSS(SEQ ID NO:73);2-15 opt 3’RSS(SEQ ID NO:74);2-21*02 opt 5’RSS(SEQ ID NO:75);2-21*02 opt 3’RSS(SEQ ID NO:76);3-3*01 opt 5’RSS(SEQ ID NO:77);3-3*01 opt 3’RSS(SEQ ID NO:78);3-9 opt 5’RSS(SEQ ID NO:79);3-9 opt 3’RSS(SEQ ID NO:80);3-10*01 opt 5’RSS(SEQ ID NO:81);3-10*01 opt 3’RSS(SEQ ID NO:82);3-16*02 opt 5’RSS(SEQ ID NO:83);3-16*02 opt 3’RSS(SEQ ID NO:84);3-22 opt 5’RSS(SEQ ID NO:85);3-22 opt 3’RSS(SEQ ID NO:86);4-4 opt 5’RSS(SEQ ID NO:87);4-4 opt 3’RSS(SEQ ID NO:88);4-11 ORF opt 5’RSS(SEQ ID NO:89);4-11 ORF opt 3’RSS(SEQ ID NO:90);4-17 opt 5’RSS(SEQ ID NO:91);4-17 opt 3’RSS(SEQ ID NO:92);4-23 ORF opt 5’RSS(SEQ ID NO:93);4-23 ORF opt 3’RSS(SEQ ID NO:94);5-5 opt 5’RSS(SEQ ID NO:95);5-5 opt 3’RSS(SEQ ID NO:96);5-12 opt 5’RSS(SEQ ID NO:97);5-12 opt 3’RSS(SEQ ID NO:98);5-18 opt 5’RSS(SEQ ID NO:99);5-18 opt 3’RSS(SEQ ID NO:100);5-24 ORF opt 5’RSS(SEQ ID NO:101);5-24 ORF opt 3’RSS(SEQ ID NO:102);6-6 opt 5’RSS(SEQ ID NO:103);6-6 opt 3’RSS(SEQ ID NO:104);6-13 opt 5’RSS(SEQ ID NO:105);6-13 opt 3’RSS(SEQ ID NO:106);6-19 opt 5’RSS(SEQ ID NO:107);6-19 opt 3’RSS(SEQ ID NO:108);6-25(未优化的)5’RSS(SEQ ID NO:109);6-25(未优化的)3’RSS(SEQID NO:110);7-27(未优化的)5’RSS(SEQ ID NO:111);7-27(未优化的)3’RSS(SEQ ID NO:112)。用于总体RSS共有序列以及7-27的粗体和斜体字体指示基于来自免疫球蛋白和T细胞受体V、D和J基因区段的啮齿类动物和人RSS与总体RSS共有序列的匹配;用于小鼠DH共有序列的粗体字体指示与小鼠免疫球蛋白DH共有序列的匹配;用于人DH共有序列、优化的RSS和所有剩余的RSS(例如,1-1 opt、1-7 opt、1-20 opt等)的粗体字体指示与人免疫球蛋白DH共有序列的匹配。
图3A-3B显示了用于构建靶向载体的示例性策略的不按照比例的图示,所述靶向载体用于整合到啮齿类动物胚胎干(ES)细胞内,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述免疫球蛋白重链可变区包括经改造的多样性簇(即DH区),所述多样性簇包括各自编码非免疫球蛋白多肽的一部分(例如D6趋化因子诱饵受体的细胞外部分)的一个或多个核苷酸序列。图3A:突出显示了四个初始步骤(1)D6编码序列的从头合成,(2)选择盒(例如新霉素)和D6 DNA片段的AgeI/EcoRI消化和连接,(3)D6 DNA片段的SnaBI消化和BAC载体(pBacE3.6)的NotI/AscI消化,和(4)消化的DNA片段的一步等温装配,以产生D6趋化因子诱饵受体编码序列的连续经改造的多样性簇代替传统DH区段;图3B:用于产生用于整合到啮齿类动物ES细胞的基因组内的靶向载体的另外步骤,(5)25个合成的D6趋化因子诱饵受体编码序列的PI-SceI/I-CeuI消化和连接到BAC克隆内,以悬挂分别含有人免疫球蛋白VH DN A和JH DNA的5'和3'同源臂。对于每个描绘的DNA片段指出了各种限制酶识别位点。lp:loxP位点;neo:由泛素启动子驱动的新霉素选择盒;cm:氯霉素选择盒;frt:翻转酶识别靶序列;hyg:潮霉素选择盒;Ei:鼠重链内含子增强子;IgM:鼠免疫球蛋白M恒定区基因;lox:pBACe3.6载体的loxP位点序列。
图4A-4B显示了通过顺序连接用于构建靶向载体,以装配D6趋化因子诱饵受体编码序列的替代示例性策略的不按照比例的图示,所述靶向载体用于整合到啮齿类动物胚胎干(ES)细胞内,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述免疫球蛋白重链可变区包括经改造的多样性簇(即经改造的DH区),所述多样性簇包括各自编码D6趋化因子诱饵受体的细胞外部分的一个或多个核苷酸序列。图4A:突出显示了四个初始步骤(1)D6编码序列的从头合成,(2)选择盒(例如新霉素)和D6DNA片段的AgeI/EcoRI消化和连接,(3)D6 DNA片段的NotI/AscI消化和连接到BAC载体(pBacE3.6)内,和(4)D6片段的PacI/Nsi消化和连接到BAC载体主链内;图4B:用于产生用于整合到啮齿类动物ES细胞的基因组内的靶向载体的两个另外步骤,(5)另外的D6 DNA片段的PI-SceI/I-CeuI消化和连接到BAC载体主链内,和(6)最终的D6 DNA片段的NsiI/I-CeuI消化和连接,以产生在BAC载体主链内的25个合成的D6趋化因子诱饵受体编码序列。对于每个描绘的DNA片段指出了各种限制酶识别位点;lp:loxP位点序列;neo:由泛素启动子驱动的新霉素选择盒;cm:氯霉素选择盒。
图5显示了通过
Figure BDA0003308863620000131
筛选的电穿孔和核型分析后,使用抗药性克隆的遗传材料的示例性筛选策略。各种引物/探针组(参见表7)的名称和大致位置(由椭圆形包围的线)(不按照比例)在显示的各种等位基因下方指出。hyg:由泛素启动子驱动的潮霉素选择盒;neo:由泛素启动子驱动的新霉素选择盒;L:loxP位点序列;Frt:翻转酶识别靶序列。
图6A-6L显示了所选择的μ-芋螺毒素和狼蛛毒素编码序列的示例性优化,以包括体细胞超突变热点。图6A:具有人工(对角线填充)RGYW活化诱导胞苷脱氨酶(AID)热点位置的μ-芋螺毒素的优化的KIIIA fl;图6B:具有人工(对角线填充)RGYW活化诱导胞苷脱氨酶(AID)热点位置的μ-芋螺毒素的优化的KIIIA mini(上)和KIIIA midi(下);图6C:具有人工(对角线填充)RGYW AID热点位置的μ-芋螺毒素的优化的PIIIA fl;图6D:具有人工(对角线填充)RGYW AID热点位置的μ-芋螺毒素的优化的PIIIA mini(上)和PIIIA midi(下);图6E:具有人工(对角线填充)RGYW AID热点位置的μ-芋螺毒素的优化的SMIIIA fl;图6F:具有人工(对角线填充)RGYW AID热点位置的μ-芋螺毒素的优化的SmIIIA mini(上)和SmIIIAmidi(下);图6G:具有人工(对角线填充)RGYW AID热点位置的优化的ProTxII狼蛛毒素;图6H:具有人工(对角线填充)RGYW AID热点位置的优化的狼蛛毒素Pro TxII C1SC4S(上)、ProTxII C2SC5S(中)和ProTxII C3SC6S(下);图6I:具有人工(对角线填充)RGYW AID热点位置的μ-芋螺毒素的优化的SmIIIA SSRW环(左)、SmIIIA SSKW环(中)和PIIIA RSRQ环(右);图6J:具有人工(对角线填充)RGYW AID热点位置的DH3区段位置中,μ-芋螺毒素的优化的KIIIA或SmIIIA mini/midi;图6K:具有人工(对角线填充)RGYW AID热点位置的DH3或DH1区段位置中,μ-芋螺毒素的优化的SmIIIA或PIIIA mini/midi;图6L:具有人工(对角线填充)RGYW AID热点位置的DH2区段位置中,μ-芋螺毒素的优化的SSRW或RSRQ环。
图7A-7B显示了用于构建靶向载体的示例性策略的不按照比例的图示,所述靶向载体用于整合到啮齿类动物胚胎干(ES)细胞内,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述包括免疫球蛋白重链可变区经改造的多样性簇(即经改造的DH区),所述多样性簇包括各自编码非免疫球蛋白多肽的一部分(例如,μ-芋螺毒素和/或狼蛛毒素的一部分)的一个或多个核苷酸序列。图7A:突出显示了四个初始步骤(1)毒素编码序列的从头合成,(2)选择盒(例如新霉素)和毒素DNA片段(TX-DH1166)的AgeI/EcoRI消化和连接,(3)毒素DNA片段的SnaBI消化和BAC载体(pBac E3.6)的NotI/AscI消化,和(4)消化的DNA片段的一步等温装配,以产生经改造的多样性簇,所述经改造的多样性簇包含连续毒素编码序列代替一个或多个和任选地,所有功能性DH基因区段;图7B:用于产生用于整合到啮齿类动物ES细胞的基因组内的靶向载体的另外步骤,(5)26个合成毒素编码序列的PI-SceI/I-CeuI消化和连接到BAC克隆内,以悬挂分别含有人免疫球蛋白VH DNA和JH DNA的5'和3'同源臂。对于每个描绘的DNA片段指出了各种限制酶识别位点;lp:loxP位点;neo:由泛素启动子驱动的新霉素选择盒;cm:氯霉素选择盒;frt:翻转酶识别靶序列;hyg:潮霉素选择盒;Ei:鼠重链内含子增强子;IgM:鼠免疫球蛋白M恒定区基因;lox:pBA Ce3.6载体的loxP。
图8A-8B显示了通过顺序连接用于构建靶向载体,以装配毒素(例如,μ-芋螺毒素和狼蛛毒素)的编码序列的替代示例性策略的不按照比例的图示,所述靶向载体用于整合到啮齿类动物胚胎干(ES)细胞内,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述免疫球蛋白重链可变区包括经改造的多样性簇(即DH区),所述多样性簇包括各自编码毒素肽(例如,μ-芋螺毒素和狼蛛毒素ProTxII)的一部分的一个或多个核苷酸序列。图8A:突出显示了四个初始步骤(1)毒素编码序列的从头合成,(2)选择盒(例如新霉素)和毒素DNA片段(TX-DH1166)的AgeI/EcoRI消化和连接,(3)毒素DNA片段的NotI/AscI消化和连接到BAC载体(pBacE3.6)内,和(4)毒素DNA片段的PacI/Nsi消化和连接到BAC载体主链内;图8B:用于产生用于整合到啮齿类动物ES细胞的基因组内的靶向载体的两个另外步骤,(5)另外的毒素DNA片段的PI-SceI/I-CeuI消化和连接到BAC载体主链内,和(6)最终的毒素DNA片段的NsiI/I-CeuI消化和连接,以产生在BAC载体主链内的26个合成的毒素编码序列。对于每个描绘的DNA片段指出了各种限制酶识别位点;lp:loxP位点;neo:由泛素启动子驱动的新霉素选择盒;cm:氯霉素选择盒。
图9A-9D显示了从
Figure BDA0003308863620000151
(VI)和小鼠中收获,并且就各种细胞标记物的细胞表面表达染色的脾中的淋巴细胞的代表性等高线图,所述小鼠对于含有毒素编码序列的经改造的DH区是纯合的(6579ho/1293ho,“TX-DH ho”;具有基因组的啮齿类动物品系,所述基因组包含纯合的免疫球蛋白重链基因座,其含有多个人VH、包括毒素编码序列代替传统DH区段的经改造的DH区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的JH区段,并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940];以及纯合的免疫球蛋白κ轻链基因座,其含有与包括啮齿类动物κ轻链增强子的啮齿类动物Cκ区基因可操作地连接的人Vκ和Jκ基因区段)。图9A:对于单峰门控的来自脾的淋巴细胞的代表性等高线图,示出了CD19(y轴)和CD3(x轴)的表达。图9B:对于CD19+门控的来自脾单峰的淋巴细胞的代表性等高线图,示出了免疫球蛋白D(IgD,y轴)和免疫球蛋白M(IgM,x轴)的表达;在每个点图上指出了成熟(CD19+IgD+IgMint)和过渡(CD19+IgDint IgM)B细胞。图9C:对于CD19+门控的来自脾单峰的淋巴细胞的代表性等高线图,示出了Igλ(y轴)或Igκ(x轴)轻链的表达。图9D:显示了B细胞成熟的代表性等高线图,示出了对于CD19+门控的来自脾单峰的淋巴细胞,并且显示了CD93(y轴)和B220(x轴)、IgM(y轴)和CD23(x轴);CD21/35(y轴)和IgM(x轴)、B220(y轴)和CD23(x轴)、以及IgD(y轴)和IgM(x轴)[从左到右]的表达。顶部行:
Figure BDA0003308863620000152
小鼠;底部行:TX-DH ho(6579ho/1293ho)小鼠。每个点图上指出了特异性B细胞群体:未成熟(CD19+CD93+B220+)、成熟(CD19+CD93-B220+)、T1(CD19+CD93+B220+IgM+CD23-)、T2(CD19+CD93+B220+IgM+CD23+)、T3(CD19+CD93+B220+IgMint CD23+)、MZ(CD19+CD93-B220+CD21/35+IgM+CD23-)、MZ前体(CD19+CD93-B220+CD21/35+IgM+CD23+)、Fol I(CD19+CD93-B220+CD21/35intIgMint IgD+)、以及Fol II(CD19+CD93-B220+CD21/35int IgM+IgD+)
图10A-10D显示了从
Figure BDA0003308863620000161
(VI)和小鼠中收获,并且就各种细胞标记物的细胞表面表达染色的骨髓中的淋巴细胞的代表性等高线图,所述小鼠对于含有毒素编码序列的经改造的DH区是纯合的(6579ho/1293ho,“TX-DH ho”;具有基因组的啮齿类动物品系,所述基因组包含纯合的免疫球蛋白重链基因座,其含有多个人VH、包括毒素编码序列代替传统DH区段的经改造的DH区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的JH区段,并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940];以及纯合的免疫球蛋白κ轻链基因座,其含有与包括啮齿类动物κ轻链增强子的啮齿类动物Cκ区基因可操作地连接的人Vκ和Jκ基因区段)。图10A:对于单峰门控的来自骨髓的淋巴细胞的代表性等高线图,示出了CD19(y轴)和CD3(x轴)的表达。图10B:对于CD19+IgM-/lowIgD门控的来自骨髓的淋巴细胞的代表性等高线图,示出了c-kit(y轴)和CD43(x轴)的表达;在每个点图上指出了前(c-kit-CD43-)和原B(c-kit+CD43+)细胞。图10C:对于单峰门控的来自骨髓的淋巴细胞的代表性等高线图,示出了IgM(y轴)和B220(x轴)的表达;在每个点图上指出了未成熟(IgMint to+B220int)和成熟(IgMint to+B220+)B细胞。图10D:对于CD19+IgMint to+B220int(顶部行)和CD19+IgMint/+B220+(底部行)门控的来自骨髓的淋巴细胞的代表性等高线图,示出了Igλ(y轴)或Igκ(x轴)轻链的表达。
图11A-11D显示了从
Figure BDA0003308863620000162
(VI)和小鼠中收获,并且就各种细胞标记物的细胞表面表达染色的脾中的淋巴细胞的代表性等高线图,所述小鼠对于含有D6编码序列的经改造的DH区是杂合的(6590het,“D6-DH het”;具有基因组的啮齿类动物品系,所述基因组包含杂合的免疫球蛋白重链基因座,其含有多个人VH、包括D6趋化因子诱饵受体编码序列代替传统DH区段的经改造的DH区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的JH区段,并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940])。图11A:对于单峰门控的来自脾的淋巴细胞的代表性等高线图,示出了CD19(y轴)和CD3(x轴)的表达。图11B:对于CD19+单峰门控的来自脾的淋巴细胞的代表性等高线图,示出了IgD(y轴)和IgM(x轴)的表达;在每个点图上指出了成熟(CD19+IgD+IgMint)和过渡(CD19+IgDint IgM+)B细胞。图11C:对于CD19+单峰门控的来自脾的淋巴细胞的代表性等高线图,示出了Igλ(y轴)或Igκ(x轴)轻链的表达。图11D:显示了B细胞成熟的代表性等高线图,示出了对于CD19+单峰门控的来自脾的淋巴细胞,并且显示了CD93(y轴)和B220(x轴)、IgM(y轴)和CD23(x轴);CD21/35(y轴)和IgM(x轴)、B220(y轴)和CD23(x轴)、以及IgD(y轴)和IgM(x轴)[从左到右]的表达。顶部行:
Figure BDA0003308863620000171
小鼠;底部行:D6-DH het(6590het)小鼠。每个点图上指出了特异性B细胞群体:未成熟(CD19+CD93+B220+)、成熟(CD19+CD93-B220+)、T1(CD19+CD93+B220+IgM+CD23-)、T2(CD19+CD93+B220+IgM+CD23+)、T3(CD19+CD93+B220+IgMint CD23+)、MZ(CD19+CD93-B220+CD21/35+IgM+CD23-)、MZ前体(CD19+CD93-B220+CD21/35+IgM+CD23+)、Fol I(CD19+CD93-B220+CD21/35int IgMint IgD+)、以及Fol II(CD19+CD93-B220+CD21/35int IgM+IgD+)
图12Α-12D显示了从
Figure BDA0003308863620000172
(VI)和小鼠中收获,并且就各种细胞标记物的细胞表面表达染色的骨髓中的淋巴细胞的代表性等高线图,所述小鼠对于含有D6编码序列的经改造的DH区是杂合的(6590het,“D6-DH het”;具有基因组的啮齿类动物品系,所述基因组包含杂合的免疫球蛋白重链基因座,其含有多个人VH、包括D6趋化因子诱饵受体编码序列代替传统DH区段的经改造的DH区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的JH区段,并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940])。图12A:对于单峰门控的来自骨髓的淋巴细胞的代表性等高线图,示出了CD19(y轴)和CD3(x轴)的表达。图12B:对于CD19+IgΜ-to low IgD门控的来自骨髓的淋巴细胞的代表性等高线图,示出了c-kit(y轴)和CD43(x轴)的表达;在每个点图上指出了前B(c-kit-CD43-)和原B(c-kit+CD43+)细胞。图12C:对于CD19+门控的来自骨髓的淋巴细胞的代表性等高线图,示出了IgM(y轴)和B220(x轴)的表达;在每个点图上指出了未成熟(IgMint to+B220int)和成熟(IgMint to+B220+)B细胞、前和原B细胞(IgΜ-to low B220int)。图12D:对于CD19+IgMint to+B220int(顶部行)和CD19+IgMint to+B220+(底部行)门控的来自骨髓的淋巴细胞的代表性等高线图,示出了Igλ(y轴)或Igκ(x轴)轻链的表达。
图13Α-13D显示了从
Figure BDA0003308863620000173
(VI)和小鼠中收获,并且就各种细胞标记物的细胞表面表达染色的脾中的淋巴细胞的代表性等高线图,所述小鼠对于含有D6编码序列的经改造的DH区是纯合的(6590ho/1293ho,“D6-DH ho”;具有基因组的啮齿类动物品系,所述基因组包含纯合的免疫球蛋白重链基因座,其含有多个人VH、包括D6趋化因子诱饵受体编码序列代替传统DH区段的经改造的DH区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的JH区段,并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940];以及纯合的免疫球蛋白κ轻链基因座,其含有与包括啮齿类动物κ轻链增强子的啮齿类动物Cκ区基因可操作地连接的人Vκ和Jκ基因区段)。图13A:对于单峰门控的来自脾的淋巴细胞的代表性等高线图,示出了CD19(y轴)和CD3(x轴)的表达。图13B:对于CD19+门控的来自脾的淋巴细胞的代表性等高线图,示出了IgD(y轴)和IgM(x轴)的表达;在每个点图上指出了成熟(CD19+IgD+IgMint)和过渡(CD19+IgDint IgM+)B细胞。图13C:对于CD19+门控的来自脾的淋巴细胞的代表性等高线图,示出了Igλ(y轴)或Igκ(x轴)轻链的表达。图13D:显示了B细胞成熟的代表性等高线图,示出了对于CD19+单峰门控的来自脾的淋巴细胞,并且显示了CD93(y轴)和B220(x轴)、IgM(y轴)和CD23(x轴);CD21/35(y轴)和IgM(x轴)、B220(y轴)和CD23(x轴)、以及IgD(y轴)和IgM(x轴)[从左到右]的表达。顶部行:
Figure BDA0003308863620000181
小鼠;底部行:D6-DH ho(6590ho)小鼠。每个点图上指出了特异性B细胞群体:未成熟(CD19+CD93+B220+)、成熟(CD19+CD93-B220+)、T1(CD19+CD93+B220+IgM+CD23-)、T2(CD19+CD93+B220+IgM+CD23+)、T3(CD19+CD93+B220+IgMint CD23+)、MZ(CD19+CD93-B220+CD21/35+IgM+CD23-)、MZ前体(CD19+CD93-B220+CD21/35+IgM+CD23+)、Fol I(CD19+CD93-B220+CD21/35int IgMint IgD+)、以及FolII(CD19+CD93-B220+CD21/35int IgM+IgD+)
图14Α-14D显示了从
Figure BDA0003308863620000182
(VI)和小鼠中收获,并且就各种细胞标记物的细胞表面表达染色的骨髓中的淋巴细胞的代表性等高线图,所述小鼠对于含有D6编码序列的经改造的DDH区是杂合的(6590ho/1293ho,“D6-DDH ho”;具有基因组的啮齿类动物品系,所述基因组包含纯合的免疫球蛋白重链基因座,其含有多个人VDH、包括D6趋化因子诱饵受体编码序列代替传统DDH区段的经改造的DDH区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的JDH区段,并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940];以及纯合的免疫球蛋白κ轻链基因座,其含有与包括啮齿类动物κ轻链增强子的啮齿类动物Cκ区基因可操作地连接的人Vκ和Jκ基因区段)。图14A:对于单峰门控的来自骨髓的淋巴细胞的代表性等高线图,示出了C D19(y轴)和CD3(x轴)的表达。图14B:对于CD19+IgΜ-to lowIgD门控的来自骨髓的淋巴细胞的代表性等高线图,示出了c-kit(y轴)和CD43(x轴)的表达;在每个点图上指出了前B(c-kit-CD43-)和原B(c-kit+CD43+)细胞。图14C:对于CD19+门控的来自骨髓的淋巴细胞的代表性等高线图,示出了IgM(y轴)和B220(x轴)的表达;在每个点图上指出了未成熟(IgMint to+B220int)和成熟(IgMint to+B220+)B细胞、前和原B细胞(IgΜ-to lowB220int)。图14D:对于CD19+IgMint to+B220int(顶部行)和CD19+IgMint to+B220+(底部行)门控的来自骨髓的淋巴细胞的代表性等高线图,示出了Igλ(y轴)或Igκ(x轴)轻链的表达。
图15显示了来自三只6579ho/1293ho小鼠(“TX-DH ho”,同上)的脾和骨髓(组合的所有VH家族,不反映定量VH使用)的扩增RNA中的经改造的DH区中的毒素编码序列的代表性使用频率。y轴指出了经改造的DH区内每个毒素编码序列的名称。x轴指出了在分析的序列读数中每个毒素编码序列的频率(序列的百分比)。
图16显示了来自三只6579ho/1293ho小鼠(“TX-DH ho”,同上)的脾和骨髓(组合的所有VH家族,不反映定量VH使用)的扩增RNA中的人VH基因区段的代表性百分比使用。x轴指出了人源化的重链可变区内的每个人VH基因区段的名称。
图17显示了来自三只6579ho/1293ho小鼠(“TX-DH ho”,同上)的脾和骨髓(组合的所有VH家族,不反映定量JH使用)的扩增RNA中的人JH基因区段的代表性百分比使用。x轴指出了在人源化的重链可变区内的每个人JH基因区段的名称。
图18显示了来自三只6590het小鼠(“D6-DH het”,同上)的脾和骨髓(组合的所有VH家族,不反映定量VH使用)的扩增RNA中的经改造的DH区中所选择的D6编码序列的代表性使用频率。y轴指出了经改造的DH区内所选择的D6编码序列的名称。x轴指出了在分析的序列读数中D6编码序列的频率(序列的百分比)。BM:骨髓。
图19显示了来自三只6590het小鼠(“D6-DH het”,同上)的脾和骨髓(组合的所有VH家族,不反映定量VH使用)的扩增RNA中的人VH基因区段的代表性百分比使用。x轴指出了人源化的重链可变区内的每个人VH基因区段的名称。BM:骨髓。
图20显示了来自三只6590het小鼠(“D6-DH het”,同上)的脾和骨髓(组合的所有VH家族,不反映定量JH使用)的扩增RNA中的人JH基因区段的代表性百分比使用。x轴指出了在人源化的重链可变区内的每个人JH基因区段的名称。BM:骨髓。
图21显示了用经改造的可溶形式的细胞表面蛋白免疫后,来自对照和6579HO/1634动物(x轴)的超过本底的滴度(y轴)。
定义
阅读本公开内容的本领域技术人员将意识到可能与这些所描述的实施例等价或另外在本公开内容的范围内的各种修改。一般而言,除非另外明确说明,否则本文使用的术语根据其在本领域中理解的含义。本文和下文提供了某些术语的明确定义;这些和其它术语在说明书自始至终在特定情况下的含义根据上下文对于本领域技术人员是明确的。下述术语和其它术语的另外定义在说明书各处阐述。本说明书中引用的参考文献或其相关部分以引用的方式并入本文。
施用:指将组合物施用于受试者或系统(例如细胞、器官、组织、生物、或相关组分或其组分组)。本领域普通技术人员将了解,施用途径可根据例如组合物待施用于其的受试者或系统、组合物的性质、施用目的等而变化。例如,在一些实施例中,对动物受试者(例如人或啮齿类动物)的施用可为支气管(包括通过支气管滴注)、颊、肠、皮间(interdermal)、动脉内、皮内、胃内、髓内、肌内、鼻内、腹膜内、鞘内、静脉内、心室内、粘膜、鼻腔、口腔、直肠、皮下、舌下、局部、气管(包括通过气管内滴注)、透皮、阴道和/或玻璃体。在一些实施例中,施用可涉及间歇给药。在一些实施例中,施用可涉及连续给药(例如,灌注)至少所选择的时间段。
术语“抗体”包括通常的免疫球蛋白分子,其包含四条多肽链,通过二硫键互连的两条重链(H)(其各自可包含由经改造的DH簇编码的氨基酸序列)和两条轻链(L)(其可为共同轻链)。该术语还包括对抗原或其片段具有反应性的免疫球蛋白。合适的抗体包括但不限于人抗体、灵长类化抗体、嵌合抗体、单克隆抗体、单特异性抗体、多克隆抗体、多特异性抗体、非特异性抗体、双特异性抗体、多重特异性抗体、人源化抗体、合成抗体、重组抗体、杂交抗体、突变抗体、移植缀合抗体(即与其它蛋白质、放射性标记、细胞毒素缀合或融合的抗体)和体外生成的抗体。技术人员将容易地识别常见抗体同种型,例如具有选自IgG、IgA、IgM、IgD和IgE及其任何亚类(例如IgG1、IgG2、IgG3和IgG4)的重链恒定区的抗体)。
大约:当应用于一个或多个目的值时,指与所述参考值相似的值。在某些实施例中,除非另有所指或根据上下文明显不同,否则术语“大约”或“约”是指在任一方向(大于或小于)上落在所述参考值的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小内的值的范围(除了这样的数字将超过可能值的100%的情况外)。
生物学活性:指在生物系统中、在体外或体内(例如在生物中)具有活性的任何试剂的特征。例如,当存在于生物中时,在该生物内具有生物效应的试剂视为生物活性的。在特定实施例,当蛋白质或多肽具有生物活性时,所述该蛋白质或多肽的共享所述蛋白质或多肽的至少一种生物活性的部分通常被称为“生物活性”部分。
可比较的:指两个或更多个试剂、实体、情况、条件组等,其可彼此不相同,但足够相似以允许在其间的比较,使得可基于观察到的差异或相似性合理地得出结论。本领域普通技术人员在上下文中将理解,在任何给定的情况下,对于两种或更多种这样的药剂、实体、情形、条件组等需要多大程度的同一性来被认为是可比较的。
短语“互补决定区”或术语“CDR”包括由生物的免疫球蛋白基因的核酸序列编码的氨基酸序列,其通常(即在野生型动物中)出现在免疫球蛋白分子(例如抗体或T细胞受体)的轻链或重链的可变区中的两个构架区之间。CDR可由例如种系序列或者重排或未重排序列,以及例如天然或成熟的B细胞或T细胞编码。CDR可为体细胞突变的(例如,不同于动物的种系中编码的序列)、人源化的和/或用氨基酸取代、添加或缺失修饰的。在一些情况下(例如对于CDR3),CDR可由两个或更多个序列(例如,种系序列)编码,所述两个或更多个序列是不邻接的(例如,未重排的核酸序列中),但在B细胞核酸序列中是邻接的,例如由于剪接或连接序列(例如,V-D-J重组以形成重链CDR3)。
保守:提及保守氨基酸取代,指氨基酸残基由具有含有相似化学性质(例如电荷或疏水性)的侧链R基团的另一个氨基酸残基的取代。一般来讲,保守氨基酸取代基本上不会改变蛋白质的所关注的功能性质,例如,受体结合配体的能力。具有含有相似化学性质的侧链的氨基酸组的例子包括:脂肪族侧链如甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;脂肪族-羟基侧链如丝氨酸和苏氨酸;含酰胺侧链如天冬酰胺和谷氨酰胺;芳香族侧链如苯丙氨酸、酪氨酸和色氨酸;碱性侧链如赖氨酸、精氨酸和组氨酸;酸性侧链如天冬氨酸和谷氨酸;以及含硫侧链如半胱氨酸和甲硫氨酸。保守氨基酸取代组包括例如缬氨酸/亮氨酸/异亮氨酸、苯丙氨酸/酪氨酸、赖氨酸/精氨酸、丙氨酸/缬氨酸、谷氨酸/天冬氨酸以及天冬酰胺/谷氨酰胺。在一些实施例中,保守氨基酸取代可为丙氨酸对蛋白质中的任何天然残基的取代,如例如丙氨酸扫描诱变中所使用的。在一些实施例中,制备保守取代,其在Gonnet,G.H.等人,1992,Science 256:1443-1445中公开的PAM250对数似然矩阵中具有正值,所述参考文献以引用的方式并入本文。在一些实施例中,取代是中等保守取代,其中所述取代在PAM250对数似然矩阵中具有非负值。
对照:指“对照”是结果针对其进行比较的标准的本领域理解的含义。通常,对照通过分离变量以得出有关此类变量的结论而用于增进实验完整性。在一些实施例中,对照是与测试反应或测定同时进行以提供对比物的反应或测定。“对照”可指“对照动物”。“对照动物”可具有如本文所述的修饰,与本文所述的修饰不同的修饰或不具有修饰(即,野生型动物)。在一个实验中,应用"测试"(即,待测试的变量)。在第二个实验中,不应用“对照”,待测试的变量。在一些实施例中,对照是历史对照(即,此前进行的测试或测定,或此前已知的量或结果)。在一些实施例中,对照是或包括印刷或以其他方式保存的记录。对照可为阳性对照或阴性对照。
破坏:指与DNA分子(例如,与内源同源序列如基因或基因基因座)的同源重组事件的结果。在一些实施例中,破坏可实现或代表插入、缺失、取代、替换、错义突变或DNA序列移码或它们的组合。插入可包括插入整个基因、基因片段例如外显子(其可具有除内源序列外的起源(例如,异源序列))、或者从特定目的基因衍生或分离的编码序列。在一些实施例中,破坏可提高基因或基因产物的(例如由基因编码的蛋白质的)表达和/或活性。在一些实施例中,破坏可降低基因或基因产物的表达和/或活性。在一些实施例中,破坏可改变基因或编码的基因产物(例如编码的蛋白质)的序列。在一些实施例中,破坏可截短基因或编码的基因产物(例如编码的蛋白质)或使其片段化。在一些实施例中,破坏可延伸基因或编码的基因产物。在一些这样的实施例中,破坏可实现融合蛋白的装配。在一些实施例中,破坏可影响基因或基因产物的水平,但不影响其活性。在一些实施例中,破坏可影响基因或基因产物的活性,但不影响其水平。在一些实施例中,破坏可对基因或基因产物的水平没有显著影响。在一些实施例中,破坏可对基因或基因产物的活性没有显著影响。在一些实施例中,破坏可对基因或基因产物的水平或活性都没有显著影响。
确定、测量、评估、评价、测定和分析:可互换使用以指任何形式的测量,并且包括确定元素是否存在。这些术语包括定量和/或定性测定。测定可为相对的或绝对的。“测定...的存在”包括确定存在的某物的量和/或确定其是否存在。
内源性基因座或内源性基因:指在引入如本文所述的改变、破坏、缺失、插入、修饰、取代或替换之前,在亲本或参考生物中发现的遗传基因座。在一些实施例中,内源基因座全部或部分包含在自然界中发现的序列。在一些实施例中,内源性基因座为野生型基因座。在一些实施例中,参考生物是野生型生物。在一些实施例中,参考生物是经改造的生物。在一些实施例中,参考生物是实验室繁殖的生物(无论是野生型还是经改造的)。
内源启动子指例如在野生型生物中与内源基因天然相关的启动子。
经改造的:一般而言,指已通过人为操纵的方面。例如,在一些实施例中,当不以自然界中的顺序连接在一起的两个或更多个序列通过人为操纵而在经改造的多核苷酸中直接彼此连接时,多核苷酸可被视为“经改造的”。在一些具体的此类实施例中,经改造的多核苷酸可以包含自然界中存在的与第一编码序列可操作地结合但不与第二编码序列可操作地结合的调控序列,该调控序列通过人为连接而使得其与第二编码序列可操作地结合。可替代地或另外地,在一些实施例中,各自编码在自然界中彼此不连接的多肽元件或结构域的第一核酸序列和第二核酸序列可在单个经改造的多核苷酸中彼此连接。相比之下,在一些实施例中,如果细胞或生物已被操纵而使得其遗传信息被改变(例如,先前不存在的新遗传物质已经被引入,或者先前存在的遗传物质已被改变或移除),则该细胞或生物可以被视为“经改造的”。如通常实践并且由本领域的技术人员所理解的,即使实际的操作是对先前的实体进行的,经改造的多核苷酸或细胞的子代通常仍然被称为“经改造的”。此外,本领域的技术人员将认识到,可以通过多种可用的方法来实现本文所述的“改造”。例如,在一些实施例中,“改造”可以涉及通过使用计算机系统进行选择或设计(例如,核酸序列、多肽序列、细胞、组织和/或生物),所述计算机系统经编程以执行分析或比较,或者分析、推荐和/或选择序列、改变等)。可替代地或另外地,在一些实施例中,“改造”可涉及使用体外化学合成方法和/或重组核酸技术,例如核酸扩增(例如,经由聚合酶链反应)、杂交、突变、转化、转染等、和/或各种受控交配方法中的任一种。如本领域技术人员了解的,各种已建立的此类技术(例如用于重组DNA、寡核苷酸合成和组织培养和转化(例如电穿孔、脂转染等)是本领域众所周知的,并且在本说明书自始至终引用和/或讨论的各种一般和更具体的参考文献中描述。参见例如Sambrook等人,Molecular Cloning:A La boratory Manual(第2版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989)。
基因:指编码产物(例如,RNA产物和/或多肽产物)的染色体中的DNA序列。在一些实施例中,基因包括编码序列(即,编码特定产物的序列)。在一些实施例中,基因包括非编码序列。在一些特定实施例中,基因可以包括编码(例如,外显子)和非编码(例如,内含子)序列二者。在一些实施例中,基因可包括一个或多个调控序列(例如启动子、增强子等)和/或内含子序列,其例如可控制或影响基因表达的一个或多个方面(例如细胞类型特异性表达、诱导型表达等)。为了清楚起见,我们注意到,如在本专利申请中使用的,术语“基因”一般指编码多肽的核酸的一部分;该术语可任选涵盖调控序列,如根据上下文对于本领域的普通技术人员将明确的。该定义并非预期排除将术语“基因”应用于非蛋白质编码表达单元,而是为了阐明在大多数情况下,如本文件中使用的该术语指编码多肽的核酸。
短语“基因区段”或“区段”包括提及V(轻或重)或者D或J(轻或重)免疫球蛋白基因区段,其包括在免疫球蛋白基因座处(例如在人和小鼠中)的未重排序列,所述未重排序列可参与重排(由例如内源性重组酶介导的),以形成重排的V/J(轻)或V/D/J(重)序列。除非另有说明,否则V、D和J区段包含允许根据12/23规则的V/J重组或V/D/J重组的重组信号序列(RSS)。除非另有说明,否则区段还包含它们在自然界中与之结合的序列或其功能等价物(例如,对于V区段,启动子和前导序列)。
提及免疫球蛋白核酸序列的术语“种系”包括可传递给后代的核酸序列,例如可在生殖细胞中发现的种系基因组。
短语“重链”或“免疫球蛋白重链”包括来自任何生物的免疫球蛋白重链序列,包括免疫球蛋白重链恒定区序列。除非另有说明,否则重链可变结构域包括三个重链互补决定区(CDR)和四个FR区。重链片段包括CDR、CDR和FR及其组合。典型的重链在可变结构域之后具有(从N末端到C末端)CH1结构域、铰链、CH2结构域、CH3结构域和CH-4结构域(在IgM或IgE的情况下)。重链的功能片段包括能够特异性识别表位(例如,以在微摩尔、纳摩尔或皮摩尔范围内的KD识别表位)的片段,其能够由细胞表达且分泌,以及包含至少一个CDR。重链可变结构域由可变区基因序列编码,所述可变区基因序列一般包含源自存在于种系中的VH、DH和JH区段储库的VH、DH和JH区段。可在www.imgt.org处发现的国际免疫遗传学信息系统(International Immunogenetics Information System)(IMGT)网站上查看各种生物的V、D和J重链区段的序列、位置和命名。
短语“轻链”包括来自任何生物的免疫球蛋白轻链序列,并且除非另有说明,否则包括人κ和λ轻链和VpreB以及替代轻链。除非另有说明,否则轻链可变结构域通常包括三个轻链互补决定区(CDR)和四个构架(FR)区。一般地,全长轻链从氨基末端到羧基末端包括可变结构域和轻链恒定区,所述可变结构域包括FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4。轻链可变结构域由轻链可变区基因序列编码,所述轻链可变区基因序列一般包含源自种系中存在的VL和JL基因区段储库的VL和JL基因区段。可在ww w.imgt.org处发现的国际免疫遗传学信息系统(IMGT)网站上查看各种生物的V和J轻链区段的序列、位置和命名。轻链包括例如不选择性结合由它们在其中出现的表位结合蛋白选择性结合的第一表位或第二表位的那些轻链。轻链还包括结合并识别、或帮助重链结合并识别由它们在其中出现的表位结合蛋白选择性结合的一个或多个表位的那些轻链。短语轻链包括“共同轻链”,也被称为“通用轻链”(ULC)。
共同或通用轻链(ULC)包括源自免疫球蛋白轻链基因座的那些,所述免疫球蛋白轻链基因座包含与轻链恒定区可操作地连接的单个重排的免疫球蛋白轻链可变区编码序列,其中所述免疫球蛋白轻链基因座的表达仅产生源自可操作性连接至轻链恒定区的单个重排的免疫球蛋白轻链可变区的轻链,不管在免疫球蛋白轻链基因座中是否包括其它核酸序列,例如其它轻链基因区段。通用轻链包括人Vκ1-39Jκ基因(例如Vκ1-39Jκ5基因)或人Vκ3-20Jκ基因(例如Vκ3-20Jκ1基因),并且包括其体细胞突变的(例如,亲和力成熟的)形式。
异源的:指来自不同来源的试剂或实体。例如,当用于提及存在于特定细胞或生物中的多肽、基因或基因产物时,该术语阐明相关多肽或其片段、基因或其片段、或者基因产物或其片段:1)被人为改造;2)被人为(例如,经由遗传改造)引入细胞或生物(或其前体)中;和/或3)是由相关细胞或生物(例如,相关细胞类型或生物类型)非天然地产生或非天然地存在于所述细胞或生物中。如本文使用的,术语“异源”还包括这样的多肽或其片段、基因或其片段、或者基因产物或其片段,其通常存在于特定天然细胞或生物中,但已例如通过突变或置于非天然结合以及在一些实施例中非内源性调节元件(例如启动子)的控制下进行修饰。
宿主细胞:指异源(例如外源)核酸或蛋白质已引入其内的细胞。本领域技术人员在阅读本公开内容后将理解,此类术语不仅指特定的主题细胞,而且还用于指该细胞的子代。因为某些修饰可因突变或环境影响而在后续世代中发生,所以这样的子代事实上可不等同于亲本细胞,但仍包括在如本文中使用的术语“宿主细胞”的范围内。在一些实施例中,宿主细胞为原核或真核细胞或包含原核或真核细胞。一般来讲,宿主细胞是适于接受和/或产生异源核酸或蛋白质的任何细胞,而与所述细胞被指定所属的生命界无关。示例性细胞包括原核生物和真核生物(单细胞或多细胞)的那些、细菌细胞(例如大肠杆菌(Escherichia coli)、芽孢杆菌属物种(Bacillus spp.)、链霉菌属物种(Streptomycesspp.)等的菌株)、分枝杆菌细胞、真菌细胞、酵母细胞(例如酿酒酵母(Saccharomycescerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichiapastoris)、甲醇毕赤酵母(Pichia methanolica)等)、植物细胞、昆虫细胞(例如SF-9、SF-21、杆状病毒感染的昆虫细胞、粉纹夜蛾(Trichoplusia ni)等)、非人动物细胞、人细胞或细胞融合物,例如杂交瘤或四源杂交瘤。在一些实施例中,细胞为人、猴、猿、仓鼠、大鼠或小鼠细胞。在一些实施例中,细胞为真核细胞并且选自以下细胞:CHO(例如CHO K1、DXB-11CHO、Veggie-CHO)、COS(例如COS-7)、视网膜细胞、Vero、CV1、肾(例如HEK293、293EBNA、MSR 293、MDCK、HaK、BHK)、HeLa、HepG2、WI38、MRC 5、Colo205、HB 8065、HL-60、(例如BHK21)、Jurkat、Daudi、A431(表皮的)、CV-1、U937、3T3、L细胞、C127细胞、SP2/0、NS-0、MMT060562、Sertoli细胞、BRL 3A细胞、HT1080细胞、骨髓瘤细胞、肿瘤细胞和来源于前述细胞的细胞系。在一些实施例中,细胞包含一个或多个病毒基因,例如表达病毒基因的视网膜细胞(例如PER.
Figure BDA0003308863620000251
细胞)。在一些实施例中,宿主细胞为分离的细胞或包含分离的细胞。在一些实施例中,宿主细胞为组织的一部分。在一些实施例中,宿主细胞为生物的一部分。
同一性:与序列比较结合使用指如通过本领域已知的可用于测量核苷酸和/或氨基酸序列同一性的多种不同算法确定的同一性。在一些实施例中,使用ClustalW v.1.83(慢)比对(利用10.0的开放缺口罚分、0.1的延伸缺口罚分)和使用Gonnet相似性矩阵(MACVECTORTM10.0.2,MacVector Inc.,2008)来确定本文所述的同一性。
在体外:指在人工环境中,例如在试管或反应容器中,在细胞培养等中,而不是在多细胞生物内发生的事件。
在体内:指在多细胞生物例如人和非人动物内发生的事件。在基于细胞的系统的背景下,该术语可用于指在活细胞内(与例如体外系统相反)发生的事件。
分离的:指在最初生产时(无论在自然界中和/或在实验环境中),已(1)与它结合的至少一些组分分开,和/或(2)通过人为设计、产生、制备和/或制造的物质和/或实体。分离的物质和/或实体可与约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或超过约99%的最初与其关联的其他组分分离。在一些实施例中,分离的药剂为约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或超过约99%纯的。如本文所用,如果物质基本上不含其他组分,则其是“纯的”。在一些实施例中,如将被本领域技术人员所理解的,物质在与某些其他组分例如一种或多种载体或赋形剂(例如,缓冲液、溶剂、水等)组合后,仍可被认为是“分离的”或甚至“纯的”;在此类实施例中,计算物质在不包括此类载体或赋形剂情况下的分离百分比或纯度。只是给出一个实例,在一些实施例中,天然存在的生物聚合物诸如多肽或多核苷酸a)在因其衍生的起源或来源而不与在其天然状态下天然伴随其的一些或全部组分关联时;b)在其基本上不含与天然产生其的物种相同的物种的其他多肽或核酸时;c)当由不是天然产生其的物种的细胞或其他表达系统表达或以其他方式与来自所述细胞或其他表达系统的组分关联时,被认为是“分离的”。因此,例如,在一些实施例中,化学合成的或在与天然产生其的细胞系统不同的细胞系统中合成的多肽被认为是"分离的"多肽。可替代地或另外地,在一些实施例中,已历经一种或多种纯化技术的多肽在其已与a)在自然界中与其关联的;和/或b)当最初产生时与其关联的其他组分分离的程度上可被认为是“分离的”多肽。
非人动物:指并非人的任何脊椎动物生物。在一些实施例中,非人动物为圆口纲脊椎动物、硬骨鱼、软骨鱼(例如,鲨鱼或鳐)、两栖动物、爬行动物、哺乳动物或鸟。在一些实施例中,非人哺乳动物为灵长类动物、山羊、绵羊、猪、狗、牛或啮齿类动物。在一些实施例中,非人动物为诸如大鼠或小鼠的啮齿动物。
核酸:在其最广泛的意义上,指掺入或可掺入寡核苷酸链内的任何化合物和/或物质。在一些实施例中,“核酸”是通过磷酸二酯键联被掺入到或可被掺入到寡核苷酸链中的化合物和/或物质。从上下文可以看出,在一些实施例中,“核酸”是指单个核酸残基(例如核苷酸和/或核苷);在一些实施例中,“核酸”是指含有含单个核酸残基的寡核苷酸链。在一些实施例中,“核酸”为RNA或包含RNA;在一些实施例中,“核酸”为DNA或包含DNA。在一些实施例中,“核酸”为一个或多个天然核酸残基、包含一个或多个天然核酸残基或由一个或多个天然核酸残基组成。在一些实施例中,“核酸”为一个或多个核酸类似物、包含一个或多个核酸类似物或由一个或多个核酸类似物组成。在一些实施例中,核酸类似物与“核酸”的差别在于其不利用磷酸二酯主链。例如,在一些实施例中,“核酸”为一个或多个“肽核酸”、包含一个或多个肽核酸、或者由一个或多个“肽核酸”组成,所述“肽核酸”是本领域已知的,并且在主链中具有肽键代替磷酸二酯键。可替代地或另外地,在一些实施例中,“核酸”具有一个或多个硫代磷酸酯和/或5’-N-亚磷酰胺键而不是磷酸二酯键。在一些实施例中,“核酸”为一个或多个天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)、包含一个或多个天然核苷、或由一个或多个天然核苷组成。在一些实施例中,“核酸”为一个或多个核苷类似物(例如,2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、O(6)-甲基鸟嘌呤、2-硫代胞苷、甲基化碱基、插入型碱基及其组合)、包含一个或多个核苷类似物或由一个或多个核苷类似物组成。在一些实施例中,与天然核酸中的糖相比,“核酸”包含一个或多个经修饰的糖(例如,2'-氟核糖、核糖、2’-脱氧核糖、阿拉伯糖和己糖)。在一些实施例中,“核酸”具有编码功能性基因产物诸如RNA或蛋白质的核苷酸序列。在一些实施例中,“核酸”具有编码多肽片段(例如肽)的核苷酸序列。在一些实施例中,“核酸”包括一个或多个内含子。在一些实施例中,“核酸”包括一个或多个外显子。在一些实施例中,“核酸”包括一个或多个编码序列。在一些实施例中,“核酸”通过下述方式中的一种或多种来制备:从天然来源分离、通过基于互补模板的聚合(体内或体外)进行的酶促合成、在重组细胞或系统中的复制、化学合成及其组合。在一些实施例中,“核酸”的长度为至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000个或更多个残基。在一些实施例中,“核酸”为单链的;在一些实施例中,“核酸”为双链的。在一些实施例中,“核酸”具有包含至少一个元件的核苷酸序列,所述至少一个元件编码多肽或其片段,或者是编码多肽或其片段的序列的互补体。在一些实施例中,“核酸”具有酶促活性。
可操作地连接:指其中所述组分处于允许它们以其预期方式起作用的关系中的并列。与编码序列"可操作地连接"的控制序列以这样的方式连接,使得在与控制序列相容的条件下获得编码序列的表达。"可操作地连接"序列包括与所关注的基因相邻的表达控制序列和以反式方式作用或远距离作用以控制所关注的基因的表达控制序列。如本文使用的,术语“表达控制序列”指多核苷酸序列,其是影响它们与之连接的编码序列的表达和加工所必要的多核苷酸序列。“表达控制序列”包括合适的转录起始、终止、启动子和增强子序列;有效的RNA加工信号例如剪接和多聚腺苷酸化信号;使细胞质mRNA稳定的序列;增强翻译效率的序列(即Kozak共有序列);增强蛋白稳质定性的序列;以及当需要时,增强蛋白分质泌的序列。这种控制序列的性质取决于宿主生物而不同。例如,在原核生物中,这种控制序列一般包括启动子、核糖体结合位点和转录终止序列,而在真核生物中,通常地,这种控制序列包括启动子和转录终止序列。术语"控制序列"旨在包括其存在对于表达和加工来说是必需的组分,并且还可包括额外的组分,其存在是有利的,例如,前导序列和融合配偶体序列。
生理条件:包括细胞或生物在其下生存和/或繁殖的其领域理解含义的参考条件。在一些实施例中,该术语指对于生物或细胞系统在自然界可发生的外部或内部环境的条件。在一些实施例中,生理条件是存在于人或非人动物体内的那些条件,尤其是存在于手术部位处和/或手术部位内的那些条件。生理条件通常包括例如20-40℃的温度范围、大气压力1、pH 6-8、1-20mM的葡萄糖浓度、以大气水平的氧浓度和如它在地球上遇到的重力。在一些实施例中,实验室中的条件在生理条件下操纵和/或维持。在一些实施例中,生理条件在生物(例如,非人动物)中遇到。
多肽:指氨基酸的任何聚合链。在一些实施例中,多肽具有天然存在的氨基酸序列。在一些实施例中,多肽具有非天然存在的氨基酸序列。在一些实施例中,多肽具有氨基酸序列,其包含彼此单独天然存在的部分(即,来自两种或更多种不同的生物,例如,人和非人部分)。在一些实施例中,多肽具有通过人为行为进行设计和/或产生的被改造的氨基酸序列。在一些实施例中,多肽可包含多个片段或由多个片段组成,所述片段各自相对于彼此以与目的多肽中发现的那种不同的空间排列在相同亲本多肽中发现(例如在亲本中直接连接的片段可在目的多肽中在空间上分开,或反之亦然,和/或片段可在目的多肽中以与在亲本中不同的次序存在),使得目的多肽是其亲本多肽的衍生物。
重组体:指通过重组手段设计、改造、制备、表达、产生或分离的多肽,例如使用转染到宿主细胞内的重组表达载体表达的多肽,从重组组合的人多肽文库分离的多肽(Hoogenboom H.R.,1997 TIB Tech.15:62-70;Hoogenboom H.和Chames P.,2000,Immunology Today 21:371-378;Azzazy H.和Highsmith W.E.,2002,Clin.Biochem.35:425-445;Gavilondo J.V.和Larrick J.W.,2002,BioTechniques 29:128-145),从对于人免疫球蛋白基因是转基因的动物(例如小鼠)中分离的抗体(参见例如Taylor,L.D.等人,1992,Nucl.Acids Res.20:6287-6295;Little M.等人,2000,Im munology Today 21:364-370;Kellermann S.A.和Green L.L.,2002,Current Opini on in Biotechnology 13:593-597;Murphy,A.J.等人,2014,Proc.Natl.Acad.Sci.U.S.A.111(14):5153-5158),或者通过涉及将所选序列元件彼此剪接的任何其它手段制备、表达、产生或分离的多肽。在一些实施例中,此类选定的序列元件中的一个或多个是天然存在的。在一些实施例中,此类选定的序列元件中的一个或多个是在计算机芯片上(in silico)设计的。在一些实施例中,一个或多个此类选定的序列元件由已知序列元件的诱变(例如体内或体外)产生,所述已知序列元件例如来自天然来源或合成来源。例如,在一些实施例中,重组多肽包含在目的源生物(例如人、小鼠等)的基因组(或多肽)中发现的序列。在一些实施例中,重组多肽包含在两种不同生物(例如人和非人生物)中,在自然界中彼此分开存在的序列(即,来自两种或更多种不同生物,例如人和非人部分)。在一些实施例中,重组多肽具有来源于诱变(例如在体外或体内,例如在非人动物中)的氨基酸序列,使得重组多肽的氨基酸序列是这样的序列,其虽然源于多肽序列且与多肽序列相关,但可能并非天然存在于非人动物体内的基因组内。
参考:预期描述试剂、动物、群组、个体、群体、样品、序列或目的值针对其进行比较的标准或对照试剂、动物、群组、个体、群体、样品、序列或值。在一些实施例中,参考试剂、动物、群组、个体、群体、样品、序列或值与试剂、动物、群组、个体、群体、样品、序列或目的值的测试或确定基本上同时进行测试和/或确定。在一些实施例中,参考试剂、动物、群组、个体、群体、样品、序列或值是历史参考,任选在有形介质中体现。在一些实施例中,参考可指对照。如本文所用,“参考”可以指“参考动物”。“参考动物”可具有如本文所述的修饰,与本文所述的修饰不同的修饰或不具有修饰(即,野生型动物)。通常,本领域内的技术人员将理解,参考药剂、动物、群组、个体、群体、样品、序列或值一定的条件下进行测定或表征,所述条件与用来测定或表征所关注的药剂、动物(例如哺乳动物)、群组、个体、群体、样品、序列或值的条件类似。
免疫球蛋白参与称为体细胞超突变的细胞机制,其产生特征在于对其靶的高亲和力的亲和力成熟的抗体变体。尽管体细胞超突变在很大程度上在抗体可变区的CDR内发生,但突变优先靶向称为热点的某些序列基序,例如RGYW活化诱导胞苷脱氨酶(AID)热点(参见例如Li,Z.等人,2004,Genes Dev.18:1-11;Teng,G.和F.N.Papavasiliou,2007,Annu.Rev.Genet.41:107-20;在此以引用的方式并入)。本文公开的可用于生成经改造的DH区的目的非免疫球蛋白肽或其一部分可包含一个或多个天然和/或人工热点。短语“体细胞突变的”包括对来自已经历类别转换的B细胞的核酸序列的提及,其中所述类别转换的B细胞中的免疫球蛋白可变区的核酸序列(例如,编码重链可变结构域或者包括重链CDR或FR序列的核苷酸序列)与类别转换之前的B细胞中的核酸序列不同,例如没有经历类别转换的B细胞和已经历类别转换的B细胞之间的CDR或构架核酸序列中的差异。“体细胞突变的”包括对来自亲和力成熟的B细胞的核酸序列的提及,所述核酸序列与并非亲和力成熟的B细胞中的相应免疫球蛋白可变区序列(即,种系细胞的基因组中的序列)不同。短语“体细胞突变的”还包括对B细胞暴露于目的表位之后来自B细胞的免疫球蛋白可变区核酸序列的提及,其中所述核酸序列不同于B细胞暴露于目的表位之前的相应核酸序列。短语“体细胞突变的”指来自结合蛋白的序列,所述结合蛋白响应免疫原攻击在动物(例如,具有人免疫球蛋白可变区核酸序列的小鼠)中生成,并且来源于在此类动物中固有地运转的选择过程。
基本上:指显示出目的特征或性质的总体或接近总体程度或范围的定性条件。生物学领域的普通技术人员将理解,生物和化学现象很少(如果有的话)进行至完成和/或进行至完全,或实现或避免绝对的结果。因此术语“基本上”用于捕捉潜在的在许多生物和化学现象中固有的完全性的缺乏。
基本同源性:指氨基酸或核酸序列之间的比较。如本领域普通技术人员将理解的,如果两个序列在对应的位置上含有同源残基,则它们通常被认为是“基本上同源的”。同源残基可为相同的残基。可替代地,同源残基可为具有适当相似的结构和/或功能特征的非相同的残基。例如,如由本领域的普通技术人员所熟知的,某些氨基酸通常被归类为“疏水性”或“亲水性”氨基酸,和/或归类为具有“极性”或“非极性”侧链。一个氨基酸对另一个相同类型的氨基酸的取代可通常被认为是“同源”取代。通常的氨基酸分类在下文概括。
Figure BDA0003308863620000301
Figure BDA0003308863620000311
如本领域中所熟知的,氨基酸或核酸序列可使用多种算法中的任意算法来进行比较,所述算法包括商业计算机程序中可获得的那些算法如用于核苷酸序列的BLASTN以及用于氨基酸序列的BLASTP、空位BLAST和PSI-BLAST。示例性的这种程序在以下中描述:Altschul,S.F.等人,1990,J.Mol.Biol.,215(3):403-410;Altschul,S.F.等人,1997,Methods in Enzymology;Altschul,S.F.等人,1997,Nucleic Acids Res.,25:3389-3402;Baxevanis,A.D.和B.F.F.Ouellette(编辑)Bioinformatics:A Pract ical Guide to theAnalysis of Genes and Proteins,Wiley,1998;以及Misener等人(编辑)BioinformaticsMethods and Protocols(Methods in Molecular Biology,第132卷),Humana Press,1998。除了鉴定同源序列以外,上文提及的程序通常还提供同源性程度的指示。在一些实施例中,如果两个序列的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的相应残基在相关的残基序列段(stretch)上是同源的,则这两个序列被认为是基本上同源的。在一些实施例中,相关序列段为完全序列。在一些实施例中,相关序列段为至少9个、10个、11个、12个、13个、14个、15个、16个、17个或更多个残基。在一些实施例中,相关序列段包括沿着完全序列的连续残基。在一些实施例中,相关序列段包括沿着完全序列的不连续残基,例如通过多肽或其一部分的折叠构象结合在一起的非连续残基。在一些实施例中,相关序列段为至少10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个残基。
基本同一性:指氨基酸或核酸序列之间的比较。如本领域普通技术人员将理解的,如果两个序列在对应的位置上含有相同残基,则它们通常被认为是“基本上相同的”。如本领域中所熟知的,氨基酸或核酸序列可使用多种算法中的任意算法来进行比较,所述算法包括商业计算机程序中可获得的那些算法如用于核苷酸序列的BLASTN以及用于氨基酸序列的BLASTP、空位BLAST和PSI-BLAST。示例性的这种程序在以下中描述:Altschul,S.F.等人,1990,J.Mol.Biol.,215(3):403-410;Altschul,S.F.等人,1997,Methods inEnzymology;Altschul,S.F.等人,1997,Nucleic Acids Res.,25:3389-3402;Baxevanis,A.D.和B.F.F.Ouellette(编辑)Bioinformatics:A Pract ical Guide to the Analysisof Genes and Proteins,Wiley,1998;以及Misener等人(编辑)Bioinformatics Methodsand Protocols(Methods in Molecular Biology,第132卷),Humana Press,1998。除了鉴定相同的序列以外,上文提及的程序通常还提供同一性程度的指示。在一些实施例中,如果两个序列的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的相应残基在相关的残基序列段上是相同的,则这两个序列被认为是基本上相同的。在一些实施例中,相关序列段为完全序列。在一些实施例中,相关序列段为至少10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个残基。
转化:指通过其将外源DNA引入宿主细胞内的任何过程。转化可使用本领域众所周知的各种方法在天然或人工条件下发生。转化可依赖用于将外源核酸序列插入原核或真核宿主细胞内的任何已知方法。在一些实施例中,特定的转化方法基于待转化的宿主细胞选择,并且可包括但不限于病毒感染、电穿孔、交配、脂转染。在一些实施例中,“经转化的”细胞被稳定转化,因为插入的DNA能够作为自主复制质粒或作为宿主染色体的部分复制。在一些实施例中,经转化的细胞瞬时表达引入的核酸有限的时间段。
靶向载体或靶向构建体:指包含靶向区域的多核苷酸分子。靶向区域包含与靶细胞、组织或动物中的序列相同或基本上相同并且提供靶向构建体经由同源重组至所述细胞、组织或动物的基因组内的位置中的整合的序列。还包括使用位点特异性重组酶识别位点(例如,loxP或Frt位点)靶向的靶向区域。在一些实施例中,如本文所述的靶向构建体还包含特定目的核酸序列或基因、可选择标记物、对照和/或调控序列、以及允许通过外源添加蛋白质介导的重组的其它核酸序列,所述蛋白质帮助或促进涉及此类序列的重组。在一些实施例中,靶向构建体还包含全部或部分的目的基因,其中所述目的基因是编码全部或部分多肽的异源基因,所述多肽具有与由内源序列编码的蛋白质相似的功能。在一些实施例中,靶向构建体还包含全部或部分的目的人源化基因,其中所述目的人源化基因编码全部或部分多肽,所述多肽具有与由内源序列编码的多肽相似的功能。在一些实施例中,靶向构建体(或靶向载体)可包含由人为操纵的核酸序列。例如,在一些实施例中,可构建靶向构建体(或靶向载体),以包含含有两个或更多个序列的经改造的或重组多核苷酸,所述两个或更多个序列在自然界中未以该次序连接在一起,而是由人为操纵在经改造的或重组多核苷酸中彼此直接相互连接。
转基因或转基因构建体:指例如通过本文所述的方法由人为引入细胞内的核酸序列(编码例如全部或部分目的多肽)。转基因对于它引入其内的转基因动物或细胞可为部分或完全异源的,即外源的。转基因可包括一个或多个转录调控序列和任何其它核酸,如内含子或启动子,这对于所选择的核酸序列的表达可能是必要的。
转基因动物、转基因非人动物或Tg+:可互换使用,并且指任何非天然存在的非人动物,其中非人动物的一种或多种细胞含有全部或部分异源核酸和/或编码目的多肽的基因。在一些实施例中,通过有意的遗传操纵,例如通过显微注射或通过用重组病毒感染,通过引入前体细胞内,将异源核酸和/或基因直接或间接地引入细胞内。术语遗传操作不包括经典育种技术,而是针对重组DNA分子的引入。该分子可整合到染色体内,或者它可为染色体外复制的DNA。术语“Tg+”包括对于异源核酸和/或基因为杂合或纯合的动物,和/或具有异源核酸和/或基因的单拷贝或多拷贝的动物。
变体:指这样的实体,其显示与参考实体显著的结构同一性,但与参考实体相比在一种或多种化学部分的存在或水平下在结构上参考实体。在许多实施例中,“变体”还在功能上与其参考实体不同。一般来讲,特定实体是否被适当地认为是参考实体的“变体”是基于其与参考实体的结构同一性的程度。如本领域技术人员将理解的,任何生物或化学参考实体具有某些特征性结构元件。根据定义,“变体”是共享一个或多个此类特征性结构元件的不同的化学实体。只是给出一些实例,小分子可具有特征性核结构元件(例如,大环核)和/或一个或多个特征性侧链部分,以使得小分子的变体是共享核结构元件和特征性侧链部分,但在其他侧链部分上和/或在存在于核内的键的类型(单键相对于双键,E相对于Z,等)上不同的分子,多肽可具有包含在线性或三维空间中相对于彼此具有指定的位置和/或促成特定生物功能的多个氨基酸的特征性序列元件,核酸可具有包含在线性或三维空间中相对于彼此具有指定的位置的多个核苷酸残基的特征性序列元件。例如,“变体多肽”可由于氨基酸序列中的一个或多个差异和/或共价附接于多肽主链的化学部分(例如,碳水化合物、脂质等)中的一个或多个差异而与参考多肽不同。在一些实施例中,“变体多肽”显示出与参考多肽具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%的总体序列同一性。替代地或另外地,在一些实施例中,“变体多肽”不与参考多肽共享至少一个特征性序列元件。在一些实施例中,参考多肽具有一种或多种生物活性。在一些实施例中,“变体多肽”共享参考多肽的一种或多种生物活性。在一些实施例中,“变体多肽”缺乏参考多肽的一种或多种生物活性。在一些实施例中,“变体多肽”显示出相较于参考多肽降低水平的一种或多种生物活性。在许多实施例中,如果所关注的多肽具有与亲代的氨基酸序列相同但在特定位置上具有少数序列改变的氨基酸序列,则所关注的多肽被认为是亲代或参考多肽的“变体”。通常,与亲本相比,变体中少于20%、15%、10%、9%、8%、7%、6%、5%、4%、3%或2%的残基被取代。在一些实施例中,“变体”变体相较于亲代具有10个、9个、8个、7个、6个、5个、4个、3个、2个或1个取代的残基。通常,“变体”具有极少数目(例如,少于5个、4个、3个、2个或1个)的取代的功能残基(即,参与特定生物活性的残基)。此外,相较于亲代,“变体”通常具有不超过5个、4个、3个、2个或1个添加或缺失,并且通常不具有添加或缺失。此外,任何添加或缺失通常少于约25个、约20个、约19个、约18个、约17个、约16个、约15个、约14个、约13个、约10个、约9个、约8个、约7个、约6个残基,并且通常少于约5个、约4个、约3个或约2个残基。在一些实施例中,亲代或参考多肽是天然发现的多肽。如将由本领域普通技术人员所理解的,所关注的特定多肽的多个变体通常可为天然存在的,特别是当所关注的多肽为传染原多肽时。
载体:指能够转运它与之结合的另一种核酸的核酸分子。在一些实施例中,载体能够在宿主细胞诸如真核和/或原核细胞中进行染色体外复制和/或表达与它们连接的核酸。能够指导可操作地连接的基因表达的载体在本文中被称为“表达载体”。
野生型:包括其领域理解的含义,其指具有如在自然界中在“正常”(与突变体、患病的、改变的等相比)状态或背景下发现的结构和/或活性的实体。本领域普通技术人员将了解,野生型基因和多肽经常以多种不同的形式(例如,等位基因)存在。
具体实施方式
本文尤其公开了具有编码目的多肽的一个或多个部分(功能片段、结合部分等)的异源遗传材料的转基因非人动物,所述异源遗传材料被插入免疫球蛋白重链可变区的多样性簇(即DH区)内,使得异源遗传材料与重链可变(VHH)和连接(JH)区段可操作地连接。考虑此类非人动物证实生成针对难治性疾病靶的抗体的能力。还考虑此类非人动物证实这样的抗体群体,其特征在于与具有由传统免疫球蛋白DH基因区段(或自然界中出现的免疫球蛋白DH基因区段)生成的免疫球蛋白重链可变CDR3多样性的抗体群体相比,具有CDR3多样性中的增加的重链可变区。因此,本文所述的非人动物可用于开发基于抗体的治疗剂,其结合特定抗原,特别是与低免疫原性和/或弱免疫原性有关的抗原。特别地,本文公开的是将示例性核苷酸编码序列引入免疫球蛋白重链可变区的DH区内,所述核苷酸编码序列各自编码目的多肽的一部分(例如,非典型趋化因子受体的细胞外部分、芋螺毒素的一部分或狼毒毒素的一部分),导致具有由涉及插入的核苷酸编码序列的V(D)J重组生成的重链可变区,且特别是CDR3区的抗体的表达。在一些实施例中,目的多肽(例如非典型趋化因子受体(ACKR)、芋螺毒素、狼蛛毒素或其组合)的插入的核苷酸编码序列替换在如本文所述的免疫球蛋白重链多样性簇(即,DH区)内的全部或基本上全部的传统DH区段(即野生型DH区段)。在一些实施例中,目的多肽(例如非典型趋化因子受体(ACKR)、芋螺毒素、狼蛛毒素或其组合)的插入的核苷酸编码序列部分替换在如本文所述的免疫球蛋白重链多样性簇(即DH区)内的一个或多个传统DH区段。在一些实施例中,目的多肽(例如非典型趋化因子受体(ACKR)、芋螺毒素、狼蛛毒素或其组合)的核苷酸编码序列插入如本文所述的免疫球蛋白重链多样性簇(即DH区)内的一个或多个传统DH区段内,使得所述核苷酸编码序列侧翼为在一个或多个传统DH区段通常或天然发现、或者与一个或多个传统DH区段结合的序列。在一些实施例中,一个或多个传统DH区段在如本文所述的免疫球蛋白重链多样性簇内保持完整。在一些实施例中,一个或多个传统DH区段从如本文所述的免疫球蛋白重链多样性簇中缺失、去除或以其它方式致使无功能。在一些特定实施例中,如本文所述的免疫球蛋白重链多样性簇缺乏全部或基本上全部的传统DH区段。在一些特定实施例中,如本文所述的免疫球蛋白重链多样性簇包含使用本文所述的核苷酸编码序列制备或生成的合成DH区段。这种转基因非人动物提供了用于鉴定和开发抗体和/或基于抗体的治疗剂的体内系统,所述抗体和/或基于抗体的治疗剂结合疾病靶超出已建立的药物发现技术的靶向能力。此外,此类转基因非人动物提供了用于开发抗体和/或基于抗体的治疗剂的有用动物模型系统,所述抗体和/或基于抗体的治疗剂集中于或设计用于破坏对于影响人的各种疾病和/或疾病病理学关键的蛋白质-蛋白质相互作用。
在一些实施例中,本文所述的非人动物包含免疫球蛋白重链可变区,其含有经改造的多样性簇(即经改造的DH区),其特征在于对应于目的多肽的一部分的一个或多个核苷酸编码序列的存在,所述目的多肽例如ACKR(例如D6趋化因子诱饵受体)的细胞外结构域、毒素(例如离子通道阻断剂,例如芋螺毒素、蜘蛛毒素、狼蛛毒素、海葵毒素或蝎毒素)、G蛋白偶联受体、选择抗体的长重链CDR(例如结合病毒包括例如HIV、HCV、HPV、流感等的中和抗体)、胰高血糖素样肽1受体激动剂(例如艾塞那肽、利拉鲁肽、利西拉肽、阿必鲁肽、杜拉鲁肽(dulaglutide)、他司鲁泰等)、来自非人物种(例如鸟、鸡、牛、兔、猪等)的重链多样性(DH)基因区段等。在这样的实施例中,含有由涉及这种核苷酸编码序列的重组生成的CDR3的抗体可表征为具有增加的多样性,以指导与特定抗原(例如跨膜多肽)的结合。在一些实施例中,由本文所述的非人动物产生的抗体具有免疫球蛋白重链可变区序列,其含有对应于由一个或多个核苷酸编码序列编码的肽的CDR3区。在一些实施例中,本文所述的非人动物包含与一个或多个核苷酸编码序列可操作地连接的重链可变(VH)和连接(JH)基因区段,使得V(D)J重组发生在所述VH、JH和一个或多个核苷酸编码序列之间,以产生结合目的抗原的重链可变区。在一些实施例中,本文所述的非人动物包含在非人动物的基因组中的免疫球蛋白重链可变区处,与5、10、15、20、25个或更多个(例如多个)核苷酸编码序列可操作地连接的多个VH和JH基因区段。在许多实施例中,VH和JH区段是人VH和人JH基因区段。在一些实施例中,本文所述的非人动物还包含人或人源化的免疫球蛋白轻链基因座(例如κ和/或λ),使得非人动物产生包含人可变区(即重和轻)的抗体和非人恒定区的抗体。在一些特定实施例中,所述人或人源化的免疫球蛋白轻链基因座包含与啮齿类动物轻链恒定区(例如啮齿类动物Cκ或Cλ)可操作地连接的人VL和JL基因区段。在一些实施例中,本文所述的非人动物还包含如以下中描述的免疫球蛋白轻链基因座:美国专利申请公开号2011-0195454 A1、2012-0021409 A1、2012-0192300 A1、2013-0045492 A1、2013-0185821 A1、2013-0198880A1、2013-0302836 A1、2015-0059009 A1;国际专利申请公开号WO 2011/097603、WO 2012/148873、WO 2013/134263、WO 2013/184761、WO 2014/160179、WO 2014/160202;所有这些在此以引用的方式并入)。
下述节段中详细描述组合物和方法的各个方面。节段的使用不意味着限制任何实施例。每个节段可应用于具体描述的任何实施例。在本申请中,除非另有说明,"或"的使用意指"和/或"。
V(D)J重组
涉及几种遗传组分的一系列重组事件作用于从基因区段(例如V、D和J)的有序排列装配免疫球蛋白。已知基因区段的这种装配是不精确的,并且因此,通过组合不同基因区段和经由不精确连接形成独特连接两者实现免疫球蛋白多样性。通过称为体细胞超突变的过程生成进一步的多样性,其中改变所述免疫球蛋白的可变区序列,以增加对于抗原的亲和力和特异性。免疫球蛋白是由两个相同的重链和两个相同的轻链组成的Y形多肽,所述链各自具有两个结构组分:一个可变结构域和一个恒定结构域。它是由基因区段装配形成的重链和轻链的可变结构域,而恒定结构域通过RNA剪接与可变结构域融合。尽管装配(或连接)基因区段的机制对于重链和轻链是相似的,但轻链只需要一个连接事件(即V与J),而重链需要两个连接事件(即D与J和V与DJ)。
用于重链和轻链可变区的基因区段的装配由保守的非编码DNA序列引导,所述非编码DNA序列侧接每个基因区段,称为重组信号序列(RSS),其确保在相对于V、D和J编码序列的精确位置处的DNA重排(参见例如Ramsden,D.A.等人,1994,Nuc.Acids Res.22(10):1785-96)。每个RSS由以下组成:与编码序列(例如V区段)邻接的七个核苷酸(七聚体)的保守嵌段,随后为保守间隔物(12或23bp)和九个核苷酸(九聚体)的第二保守嵌段。尽管个体中相当大的序列趋异是耐受的,但这些序列的长度通常不改变。免疫球蛋白基因区段之间的重组遵循通常称为12/23规则的规则,其中侧翼为具有12bp间隔物的RSS的基因区段通常连接至侧翼为23bp间隔物的基因区段(参见例如Hiom,K.和M.Gellert,1998,Mol.Cell.1(7):1011-9)。RSS的序列已报道影响与特定基因区段重组的效率和/或频率(参见例如Ramsden,D.A和G.E.Wu,1991,Proc.Natl.Acad.Sci.U.S.A.88:10721-5;Boubnov,N.V.等人,1995,Nuc.Acids Res.23:1060-7;Ezekiel,U.R.等人,1995,Immunity 2:381-9;Sadofsky,M.等人,1995,Genes Dev.9:2193-9;Cuomo,C.A.等人,1996,Mol.Cell Biol.16:5683-90;Ramsden,D.A.等人,1996,EMBO J 15:3197-3206)。事实上,许多报告指出个体中的基因区段,特别是DH区段的高度偏差和可变的使用。
在一些实施例中,本文所述的非人动物包含一个或多个RSS侧接编码序列,其对于与V和/或J基因区段重组进行优化。在各种实施例中,将编码序列插入免疫球蛋白重链基因座内的传统DH基因区段(或自然界中出现的DH基因区段)的位置中。可使用本领域已知的标准技术来实现RSS的优化,所述标准技术例如已知RSS序列的定点诱变、或合成的RSS序列的计算机芯片生成随后为从头合成。仅举一个例子,通过与和高或最佳重组效率和/或频率相关的RSS比较,可优化与低或弱重组效率和/或频率相关的RSS。在一些实施例中,重组效率和/或频率可通过抗体序列群体中基因区段的使用频率来确定(例如来自个体或个体组;参见例如Arnaout,R.等人,2011,PLoS One 6(8):e22365;Glanville,J.等人,2011,Proc.Natl.Acad.Sci.U.S.A.108(50):20066-71)。因此,在一些实施例中,本文所述的非人动物可包含一个或多个优化的RSS侧接编码序列(或基因区段),使得编码序列(或基因区段)的重组以相等或大约相等的频率发生。示例性的优化RSS在图2中阐述。
基因区段装配以形成重链和轻链可变区导致形成免疫球蛋白的抗原结合区(或位点)。这样的抗原结合区部分特征在于高变区的存在,所述高变区通常被称为互补决定区(CDR)。对于重链和轻链两者存在三个CDR(即总共六个CDR),其中CDR1和CDR2两者完全由V基因区段编码。然而,CDR3由来源于对于轻链的V和J区段,以及对于重链的V、D和J区段连接的序列编码。因此,在重组期间采用的另外的基因区段以形成重链可变区编码序列显著增加了重链的抗原结合位点的多样性。
趋化因子和趋化因子受体
免疫和炎症应答是涉及几种类型的免疫细胞和分子组分的复杂生物学过程。白细胞迁移已报道为免疫和炎症应答起始、维持和解决中的重要因素,其中一些通过趋化因子及其受体的作用来实现。事实上,已报道了几种趋化因子和相应的受体。趋化因子受体具有特征在于七次跨膜结构域的结构,所述七次跨膜结构域与G蛋白偶联用于在细胞内区室中的信号转导,并且分成对应于它们结合的趋化因子亚组的多个不同家族:CC-趋化因子受体(β-趋化因子受体)、CXC-趋化因子受体、CX3C-趋化因子受体和XC-趋化因子受体。除这些传统的趋化因子受体之外,已报道了其它趋化因子受体(称为非典型趋化因子受体或ACKR),其共享相似结构,但缺乏响应配体结合而起始信号传导的能力)(参见例如Bonecchi,R.等人,2010,Curr.Top.Microbiol.Immuno l.341:15-36;Nibbs,R.J.B.和G.J.Graham,2013,Nature Rev.13:815-29)。
在ACKR中,ACKR2(也称为CCBP2和D6趋化因子诱饵受体)是与其它G蛋白偶联受体相似,且由CCBP2基因编码的七次跨膜蛋白受体(Nibbs,R.J.B.等人,1997,J.Biol.Chem.272(51):32078-83)。与其它趋化因子受体相反,ACKR2在第二个细胞内环中含有DKYLEIV基序代替经典DRYLAIV基序,并且不能通过Gαi蛋白质信号传导。ACKR2在皮肤、肠和肺的淋巴管内皮细胞以及B细胞和树突状细胞上表达。ACKR是许多促炎β-趋化因子(CC-趋化因子)的混杂受体,但不结合组成性CCL趋化因子。已提出ACKR2是清道夫受体,其内化CC-趋化因子并靶向其用于溶酶体降解,从而经由CC-趋化因子的清除来限制炎症应答(Jamieson,T.等人,2005,Nature Immunol.6(4):403-11;Bonecchi,R.等人,同上;Hansell,C.A.H.等人,2011,Immunol.Cell Biol.89(2):197-206;Nibbs,R.J.B.和G.J.Graham,同上)。
肽毒素
毒素是在植物和动物中发现的可对人有毒的天然存在的物质。例如,芋螺在其毒液中产生称为芋螺毒素的神经毒性肽,其调节人中各种受体的活性。特别地,几种芋螺毒素已显示调节离子通道(例如NaV通道)。通常,芋螺毒素是长度10至30个氨基酸的肽,其包括一个或多个二硫键,并且基于它们作用于其的靶来表征:α-芋螺毒素(乙酰胆碱受体)、δ-芋螺毒素(电压门控钠通道)、κ-芋螺毒素(钾通道)、μ-芋螺毒素(电压门控钠通道)和ω-芋螺毒素(电压门控钙通道)。已知芋螺毒素在蜗牛物种中是高度多态性的,并且因此编码它们的基因不是保守的(参见例如Terlau,H.和B.M.Olivera,2004,Physiol.Rev.84(1):41-68;Biggs,J.S.等人,2010,Mol.Phylogenet.Evol.56(1):1-12;Olivera,B.M.等人,2012,Ann.N.Y.Acad.Sci.1267(1):61-70;Wong,E.S.和K.Belov,2012,Gene 496(1):1-7)。
在芋螺毒素中,μ-芋螺毒素已报道具有两种类型的半胱氨酸模式,并作用于肌肉组织中的电压门控钠通道(Cruz,L.J.等人,1985,J.Biol.Chem.260(16):9280-8;Zeikus,R.D.等人,1985,J.Biol.Chem.260(16):9280-8;McIntosh,J.M.和R.M.Jones,2001,Toxicon.39(10):1447-51;Nielsen,K.J.等人,2002,J.Biol.Chem.277(30):27247-55;Floresca,C.Z.,2003,Toxicol.Appl.Pharmacol.190(2):95-101;Priest,B.T.等人,2007,Toxicon.49(2):194-201;Schmalhofer,W.A.等人,2008,Mol.Pharmacol.74(5):1476-84;Ekberg,J.等人,2008,Int.J.Biochem.Cell Biol.40(11):2363-8)。实际上,μ-芋螺毒素已因其潜在药理学用途而成为研究对象(参见例如Olivera,B.M.和R.W.Teichert,2007,Mol.Interv.7(5):251-60;Stevens,M.等人,2012,J.Biol.Chem.287(37):31382-92)。尽管已进行了几项研究来阐明各种μ-芋螺毒素的作用机制,但许多仍是未知的。
毒素的其它例子包括海葵、蝎子、蜘蛛和狼蛛的毒液,其已报道通过抑制活化并阻断神经元传递而作用于离子通道。事实上,已鉴定了几种蝎毒素并分辨了它们的结构(参见例如Rochat,H.和J.Gregoire,1983,Toxicon.21(1):153-62;Zhou,X.H.等人,1989,Biochem.J.257(2):509-17;Granier,C.等人,1990,FEBS Lett.261(2):423-6)。此外,使用来自蝎子毒液的毒素已开发了用于钾通道的基于神经毒素的文库(参见例如Takacs,Z.等人,2009,Proc.Natl.Acad.Sci.U.S.A.106(52):22211-6)。再举另外一个例子,来自狼蛛毒液的肽已报道特别作用于电压门控钠通道如NaV1.5和NaV1.7(参见例如Priest,B.T.等人,2007,Toxicon.49(2):194-201;Xiao,Y.等人,2010,Mol.Pharmacol.78(6):1124-34)。本文描述了以下发现:用于构建经改造的DH区的特别有用的一组核苷酸编码序列是或包含来自狼蛛毒素和μ-芋螺毒素序列的核苷酸编码序列(参见例如表4)。本文公开了作用于电压门控钠通道(例如,NaV1.7)的毒素编码序列用于构建经改造的DH区的用途。根据需要,本文所述的方法可用于利用源自任何所需毒素肽的编码序列的任何集合、或来自多重(即二、三、四、五等)毒素肽的毒素肽(或毒素肽序列片段)的组合。
提供体内系统
本文描述了以下认识:特定抗原与低免疫原性和/或弱免疫原性相关,并且因此是基于抗体的治疗剂的弱靶。事实上,许多疾病靶(例如跨膜蛋白)已表征为难治性或不可成药的。因此,本文公开了用于开发抗体和基于抗体的治疗剂的体内系统的产生,其克服了与已建立的药物发现技术相关的缺陷。本公开内容具体证实了其基因组包含免疫球蛋白重链可变区的转基因啮齿类动物的构建,所述免疫球蛋白重链可变区包括经改造的DH区,所述经改造的DH区包括一个或多个异源核苷酸编码序列,其各自编码目的异源多肽或肽的一部分(例如细胞外部分、结合部分、功能片段等)。本文所述的方法可适于采用一组异源核苷酸编码序列,其各自编码任何目的多肽或肽(例如跨膜蛋白、毒素、G蛋白偶联受体等)的一部分用于产生经改造的DH区。一旦整合到免疫球蛋白重链可变区(即置于与V和J基因区段和/或一个或多个恒定区可操作地连接)内,经改造的DH区就提供了基因区段(即V和J)与一个或多个异源核苷酸编码序列的重组,以生成特征在于具有增加的多样性(即CDR3多样性)以指导与特定抗原结合的重链的抗体。
本文描述了以下认识:由其设计一组核苷酸编码序列(或核苷酸编码序列的组合)用于构建如本文所述的经改造的DH区的特别有用的目的异源多肽包括趋化因子受体、芋螺毒素、狼蛛毒素和/或其组合。
在一些实施例中,趋化因子受体包括CC-趋化因子受体、CXC-趋化因子受体、CX3C-趋化因子受体、XC-趋化因子受体及其组合。
在一些实施例中,CC-趋化因子受体(也称为β-趋化因子受体)包括CCR1、CCR2、CCR3、CCR4、CCR5、CCR6、CCR7、CCR8、CCR9、CCR10和CCR11。
在一些实施例中,CXC-趋化因子受体包括CXCR1、CXCR2、CXCR3、CXCR4、CXCR5、CXCR6和CXCR7。
在一些实施例中,CX3C-趋化因子受体包括CX3CR1。
在一些实施例中,XC-趋化因子受体包括XCR1。
在一些实施例中,芋螺毒素包括α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。
在一些实施例中,芋螺毒素是或包含μ-芋螺毒素。
在一些实施例中,狼蛛毒素包括ProTxI、ProTxII、虎纹捕鸟蛛毒素-IV(HWTX-IV)及其组合。
不希望受任何特定理论束缚,我们注意到,本文提供的数据证实,在一些实施例中,其基因组包含包括经改造的DH区的免疫球蛋白重链可变基因座的啮齿类动物,特征在于包括源自异源非典型趋化因子受体(例如ACKR2,也称为D6趋化因子诱饵受体)的细胞外部分的一个或多个异源核苷酸编码序列,有效地生成免疫球蛋白重链可变区基因座,其产生特征在于具有增加的多样性以结合异源非典型趋化因子受体(例如异源D6趋化因子诱饵受体)的配体的CDR3的抗体。我们还注意到,本文提供的数据证实,在一些实施例中,其基因组包含包括经改造的DH区的免疫球蛋白重链可变基因座的啮齿类动物,特征在于包括源自一种或多种毒素(例如μ-芋螺毒素和/或ProTxII)的一部分的一个或多个异源核苷酸编码序列,有效地生成免疫球蛋白重链可变区基因座,其产生特征在于具有增加的多样性以结合异源电压门控钠通道(例如,异源NaV通道)的CDR3的抗体。
特别地,本公开内容尤其具体证实来自人非典型趋化因子受体(ACKR),例如ACKR2(即,D6趋化因子诱饵受体)的示例性核苷酸编码序列,可特别用于整合到免疫球蛋白重链基因座的DH区内,用于生成特征在于具有多样性的CDR3的抗体,所述多样性来源于核苷酸编码序列与VH和JH区段的重组,并且阻断几种炎性细胞因子(例如,CCL2、CCL3、CCL4、CCL5、CCL7、CCL8、CCL11、CCL12、CCL13、CCL14、CCL17、CCL22和CCL3L1)。本公开内容还证实来自芋螺毒素(例如μ-芋螺毒素)和狼蛛毒素(例如ProTxII)的示例性核苷酸编码序列,可特别用于整合到免疫球蛋白重链基因座的DH区内,用于生成特征在于具有多样性的CDR3的抗体,所述多样性来源于核苷酸编码序列与VH和JH区段的重组,并且阻断和/或抑制电压门控钠通道(例如NaV1.7)的激活和/或功能。因此,在至少一些实施例中,本公开内容包括开发体内系统用于生成针对治疗难治性疾病靶的抗体和/或基于抗体的治疗剂。
示例性人ACKR(连同其相关配体)在表1中阐述(参见例如Nibbs,R.J.B.和G.J.Graham,2013,Nature Reviews 13:815-29)。示例性毒素(连同其相关靶)在表2中阐述(参见例如Terlau,H.和B.M.Olivera,2004,Physiol.Rev.84(1):41-68)。
表1
Figure BDA0003308863620000411
Figure BDA0003308863620000421
表2
Figure BDA0003308863620000422
ACKR2(D6趋化因子诱饵受体)编码序列
表3中阐述了用于构建如本文所述的经改造的DH区的人ACKR2(D6趋化因子诱饵受体)的示例性核苷酸编码序列(DNA和氨基酸(AA))。表3中阐述的人ACKR2核苷酸编码序列组的特征在于四个细胞外结构域、具有Cys至Ser取代以去除二硫键的四个细胞外结构域、四个Cys交换(Nterm-EC3、EC3-Nterm、EC1-EC2、EC2-EC1)、具有Cys至Ser取代以去除二硫键的四个Cys交换、两个环融合(具有Cys保留;Nterm+EC3,EC1+EC2)和七个部分结构域。
表3
Figure BDA0003308863620000431
Figure BDA0003308863620000441
Figure BDA0003308863620000451
Figure BDA0003308863620000461
Figure BDA0003308863620000471
Figure BDA0003308863620000481
Figure BDA0003308863620000491
下文提供了用于构建经改造的DH区、含有人ACKR2(D6趋化因子诱饵受体)核苷酸编码序列的示例性DNA片段。
D6-DH1166(SEQ ID NO:131)包括在对应于DH1-1至DH6-6的位置中插入的D6编码序列:
TACGTAGCCGTTTCGATCCTCCCGAATTGACTAGTGGGTAGGCCTGGCGGCCGCTGCCATTTCATTACCTCTTTCTCCGCACCCGACATAGATACCGGTGGATTCGAATTCTCCCCGTTGAAGCTGACCTGCCCAGAGGGGCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTACAGGCCCCGGTCTCTGTGGGTGTTCCGCTAACTGGGGCTCCCAGTGCTCACCCCACAACTAAAGCGAGCCCCAGCCTCCAGAGCCCCCGAAGGAGATGCCGCCCACAAGCCCAGCCCCCATCCAGGAGGCCCCAGAGCTCAGGGCGCCGGGGCGGATTTTGTACAGCCCCGAGTCACTGTGCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCACAGTGAGAAAAACTGTGTCAAAAACCGTCTCCTGGCCCCTGCTGGAGGCCGCGCCAGAGAGGGGAGCAGCCGCCCCGAACCTAGGTCCTGCTCAGCTCACACGACCCCCAGCACCCAGAGCACAACGGAGTCCCCATTGAATGGTGAGGACGGGGACCAGGGCTCCAGGGGGTCATGGAAGGGGCTGGACCCCATCCTACTGCTATGGTCCCAGTGCTCCTGGCCAGAACTGACCCTACCACCGACAAGAGTCCCTCAGGGAAACGGGGGTCACTGGCACCTCCCAGCATCAACCCCAGGCAGCACAGGCATAAACCCCACATCCAGAGCCGACTCCAGGAGCAGAGACACCCCAGTACCCTGGGGGACACCGACCCTGATGACTCCCCACTGGAATCCACCCCAGAGTCCACCAGGACCAAAGACCCCGCCCCTGTCTCTGTCCCTCACTCAGGACCTGCTGCGGGGCGGGCCATGAGACCAGACTCGGGCTTAGGGAACACCACTGTGGCCCCAACCTCGACCAGGCCACAGGCCCTTCCTTCCTGCCCTGCGGCAGCACAGACTTTGGGGTCTGTGCAGAGAGGAATCACAGAGGCCCCAGGCTGAGGTGGTGGGGGTGGAAGACCCCCAGGAGGTGGCCCACTTCCCTTCCTCCCAGCTGGAACCCACCATGACCTTCTTAAGATAGGGGTGTCATCCGAGGCAGGTCCTCCATGGAGCTCCCTTCAGGCTCCTCCCCGGTCCTCACTAGGCCTCAGTCCCGGCTGCGGGAATGCAGCCACCACAGGCACACCAGGCAGCCCAGACCCAGCCAGCCTGCAGTGCCCAAGCCCACATTCTGGAGCAGAGCAGGCTGTGTCTGGGAGAGTCTGGGCTCCCCACCGCCCCCCCGCACACCCCACCCACCCCTGTCCAGGCCCTATGCAGGAGGGTCAGAGCCCCCCATGGGGTATGGACTTAGGGTCTCACTCACGTGGCTCCCCTCCTGGGTGAAGGGGTCTCATGCCCAGATCCCCACAGCAGAGCTGGTCAAAGGTGGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGACCCTCAGGCTCCTCTAGCCCTGGCTGCCCTGCTGTCCCTGGGAGGCCTGGACTCCACCAGACCACAGGTCCAGGGCACCGCCCATAGGTGCTGCCCACACTCAGTTCACAGGAAGAAGATAAGCTCCAGACCCCCAAGACTGGGACCTGCCTTCCTGCCACCGCTTGTAGCTCCAGACCTCCGTGCCTCCCCCGACCACTTACACACGGGCCAGGGAGCTGTTCCACAAAGATCAACCCCAAACCGGGACCGCCTGGCACTCGGGCCGCTGCCACTTCCCTCTCCATTTGTTCCCAGCACCTCTGTGCTCCCTCCCTCCTCCCTCCTTCAGGGGAACAGCCTGTGCAGCCCCTCCCTGCACCCCACACCCTGGGGAGGCCCAACCCTGCCTCCAGCCCTTTCTCCCCCGCTGCTCTTCCTGCCCATCCAGACAACCCTGGGGTCCCATCCCTGCAGCCTACACCCTGGTCTCCACCCAGACCCCTGTCTCTCCCTCCAGACACCCCTCCCAGGCCAACCCTGCACATGCAGGCCCTCCCCTTTTCTGCTGCCAGAGCCTCAGTTTCTACCCTCTGTGCCTACCCCCTGCCTCCTCCTGCCCACAACTCGAGCTCTTCCTCTCCTGGGGCCCCTGAGCCATGGCACTGACCGTGCACTCCCACCCCCACACTGCCCATGCCCTCACCTTCCTCCTGGACACTCTGACCCCGCTCCCCTCTTGGACCCAGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTCCCCATGCAGGCCCTTGCCCTCACTGCCCGGTTACACGGCAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCACCCTGATGCACGTCCGCCTGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCGGCACTCCCTGTAAAGACGAGGGATCCAGGCAGCAACATCATGGGAGAATGCAGGGCTCCCAGACAGCCCAGCCCTCTCGCAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACTGAACAGCCACGGAGCCCGCTGGATAGTAACTGAGTCAGTGACCGACCTGGAGGGCAGGGGAGCAGTGAACCGGAGCCCAGACCATAGGGACAGAGACCAGCCGCTGACATCCCGAGCCCCTCACTGGCGGCCCCAGAACACCGCGTGGAAACAGAACAGACCCACATTCCCACCTGGAACAGGGCAGACACTGCTGAGCCCCCAGCACCAGCCCTGAGAAACACCAGGCAACGGCATCAGAGGGGGCTCCTGAGAAAGAAAGGAGGGGAGGTCTCCTTCACCAGCAAGTACTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTGTACAGCACTGGGCTCAGAGTCCTCTCCCACACACCCTGAGTTTCAGACAAAAACCCCCTGGAAATCATAGTATCAGCAGGAGAACTAGCCAGAGACAGCAAGAGGGGACTCAGTGACTCCCGCGGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACTGTGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGACACAGCCCCATTCAAAAACCCCTGCTGTAAACGCTTCCACTTCTGGAGCTGAGGGGCTGGGGGGAGCGTCTGGGAAGTAGGGCCTAGGGGTGGCCATCAATGCCCAAAACGCACCAGACTCCCCCCCAGACATCACCCCACTGGCCAGTGAGCAGAGTAAACAGAAAATGAGAAGCAGCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGCAAGAGGGGATGCGGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGATAGTTCCATAAACTGGTGTTCAAGATCGATGGCTGGGAGTGAGCCCAGGAGGACAGTGTGGGAAGGGCACAGGGAAGGAGAAGCAGCCGCTATCCTACACTGTCATCTTTCAAGAGTTTGCCCTGTGCCCACAATGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAAATGGATTTGCAGCACAGATCTGAATAAATTCTCCAGAATGTGGAGCCACACAGAAGCAAGCACAAGGAAAGTGCCTGATGCAAGGGCAAAGTACAGTGTGTACCTTCAGGCTGGGCACAGACACTCTGAAAAGCCTTGGCAGGAACTCCCTGCAACAAAGCAGAGCCCTGCAGGCAATGCCAGCTCCAGAGCCCTCCCTGAGAGCCTCATGGGCAAAGATGTGCACAACAGGTGTTTCTCATAGCCCCAAACTGAGAATGAAGCAAACAGCCATCTGAAGGAAAACAGGCAAATAAACGATGGCAGGTTCATGAAATGCAAACCCAGACAGCCAGAAGGACAACAGTGAGGGTTACAGGTGACTCTGTGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAAAGGAAAGTCCAAAAAATACTTTCAATGTGATTTCTTCTAAATAAAATTTACAGCCGGCAAAATGAACTATCTTCTTAAGGGATAAACTTTCCACTAGGAAAACTATAAGGAAAATCAAGAAAAGGATGATCACATAAACACAGTGGTCGTTACTTCTACTGGGGAAGGAAGAGGGTATGAACTGAGACACACAGGGTTGGCAAGTCTCCTAACAAGAACAGAACAAATACATTACAGTACCTTGAAAACAGCAGTTAAAATTCTAAATTGCAAGAAGAGGAAAATGCACACAGCTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAACGATGACACAGGCAATTGCACAATGATACAGACATACATTCAGTATATGAGACATTGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATATGTGGTGGCACTCACCTCCCTGGGCATCCCCGGACAGGCTGCAGGCACACTGTGTGGCAGGGCAGGCTGGTACCTGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAGGCACAGAGCCGTATCCCCCCGAGGACATATACCCCCAAGGACGGCACAGTTGGTACATTCCGGAGACAAGCAACTCAGCCACACTCCCAGGCCAGAGCCCGAGAGGGACGCCCATGCACAGGGAGGCAGAGCCCAGCTCCTCCACAGCCAGCAGCACCCGTGCAGGGGCCGCCATCTGGCAGGCACAGAGCATGGGCTGGGAGGAGGGGCAGGGACACCAGGCAGGGTTGGCACCAACTGAAAATTACAGAAGTCTCATACATCTACCTCAGCCTTGCCTGACCTGGGCCTCACCTGACCTGGACCTCACCTGGCCTGGACCTCACCTGGCCTAGACCTCACCTCTGGGCTTCACCTGAGCTCGGCCTCACCTGACTTGGACCTTGCCTGTCCTGAGCTCACATGATCTGGGCCTCACCTGACCTGGGTTTCACCTGACCTGGGCTTCACCTGACCTGGGCCTCATCTGACCTGGGCCTCACTGGCCTGGACCTCACCTGGCCTGGGCTTCACCTGGCCTCAGGCCTCATCTGCACCTGCTCCAGGTCTTGCTGGAACCTCAGTAGCACTGAGGCTGCAGGGGCTCATCCAGGGTTGCAGAATGACTCTAGAACCTCCCACATCTCAGCTTTCTGGGTGGAGGCACCTGGTGGCCCAGGGAATATAAAAAGCCTGAATGATGCCTGCGTGATTTGGGGGCAATTTATAAACCCAAAAGGACATGGCCATGCAGCGGGTAGGGACAATACAGACAGATATCAGCCTGAAATGGAGCCTCAGGGCACAGGTGGGCACGGACACTGTCCACCTAAGCCAGGGGCAGACCCGAGTGTCCCCGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGTGCCCTGCTACCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCTGCCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCACAGTGTCACAGAGTCCATCAAAAACCCATCCCTGGGAACCTTCTGCCACAGCCCTCCCTGTGGGGCACCGCCGCGTGCCATGTTAGGATTTTGACTGAGGACACAGCACCATGGGTATGGTGGCTACCGCAGCAGTGCAGCCCGTGACCCAAACACACAGGGCAGCAGGCACAACAGACAAGCCCACAAGTGACCACCCTGAGCTCCTGCCTGCCAGCCCTGGAGACCATGAAACAGATGGCCAGGATTATCCCATAGGTCAGCCAGACCTCAGTCCAACAGGTCTGCATCGCTGCTGCCCTCCAATACCAGTCCGGATGGGGACAGGGCTGGCCCACATTACCATTTGCTGCCATCCGGCCAACAGTCCCAGAAGCCCCTCCCTCAAGGCTGGGCCACATGTGTGGACCCTGAGAGCCCCCCATGTCTGAGTAGGGGCACCAGGAAGGTGGGGCTGGCCCTGTGCACTGTCCCTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGGGCCTCTCCTGGGTCATTTCCAAGACAGAAGACATTCCCAGGACAGCTGGAGCTGGGAGTCCATCATCCTGCCTGGCCGTCCTGAGTCCTGCGCCTTTCCAAACCTCACCCGGGAAGCCAACAGAGGAATCACCTCCCACAGGCAGAGACAAAGACCTTCCAGAAATCTCTGTCTCTCTCCCCAGTGGGCACCCTCTTCCAGGGCAGTCCTCAGTGATATCACAGTGGGAACCCACATCTGGATCGGGACTGCCCCCAGAACACAAGATGGCCCACAGGGACAGCCCCACAGCCCAGCCCTTCCCAGACCCCTAAAAGGCGTCCCACCCCCTGCATCTGCCCCAGGGCTCAAACTCCAGGAGGACTGACTCCTGCACACCCTCCTGCCAGACATCACCTCAGCCCCTCCTGGAAGGGACAGGAGCGCGCAAGGGTGAGTCAGACCCTCCTGCCCTCGATGGCAGGCGGAGAAGATTCAGAAAGGTCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGCGTGGGAAAGGCCTCTGGGCACACTCAGGGGGATTTTGTGAAGGGTCCTCCCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCTGCCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACTGTGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGATGAACCCAGCATCAAAAACCGACCGGACTCCCAAGGTTTATGCACACTTCTCCGCTCAGAGCTCTCCAGGATCAGAAGAGCCGGGCCCAAGGGTTTCTGCCCAGACCCTCGGCCTCTAGGGACATCTTGGCCATGACAGCCCATGGGCTGGTGCCCCACACATCGTCTGCCTTCAAACAAGGGCTTCAGAGGGCTCTGAGGTGACCTCACTGATGACCACAGGTGCCCTGGCCCCTTCCCCACCAGCTGCACCAGACCCCGTCATGACAGATGCCCCGATTCCAACAGCCAATTCCTGGGGCCAGGAATCGCTGTAGACACCAGCCTCCTTCCAACACCTCCTGCCAATTGCCTGGATTCCCATCCCGGTTGGAATCAAGAGGACAGCATCCCCCAGGCTCCCAACAGGCAGGACTCCCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGTAGGGCCAGGCTGCAGACAGTCCCCCTCACCTGCCACTAGACAAATGCCTGCTGTAGATGTCCCCACCTGGAAAATACCACTCATGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGAGTCTCTGAGGCCCCTAAGAAGTAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCTGACAGGAGTGGACGCTGGAGCTGGGCCCATACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACTGTGCATGTCTGGTCCCTGAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCTCTATTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGTCACACTGTGCAGCTTCTTGTGCAAGCACAGTGGTGCTGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGTGCAGCCCCAGGCCTCCAGCTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTTTTCTGCACTCTCCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGATCTGTTCTCAACATCCCACGGCCTCATTCCTGCAAGGAAGGCCAATGGATGGGCAACCTCACATGCCGCGGCTAAGATAGGGTGGGCAGCCTGGCGGGGACAGGACATCCTGCTGGGGTATCTGTCACTGTGCCTAGTGGGGCACTGGCTCCCAAACAACGCAGTCCTTGCCAAAATCCCCACGGCCTCCCCCGCTAGGGGCTGGCCTGATCTCCTGCAGTCCTAGGAGGCTGCTGACCTCCAGAATGGCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCCGGCTGCAGACTGGGAGGCCACCCCCTCCTTCCCAGGGTTCACTGCAGGTGACCAGGGCAGGAAATGGCCTGAACACAGGGATAACCGGGCCATCCCCCAACAGAGTCCACCCCCTCCTGCTCTGTACCCCGCACCCCCCAGGCCAGCCCATGACATCCGACAACCCCACACCAGAGTCACTGCCCGGTGCTGCCCTAGGGAGGACCCCTCAGCCCCCACCCTGTCTAGAGGACTGGGGAGGACAGGACACGCCCTCTCCTTATGGTTCCCCCACCTGGCTCTGGCTGGGACCCTTGGGGTGTGGACAGAAAGGACGCTTGCCTGATTGGCCCCCAGGAGCCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACCCCATGGGAATCCAGAATCCCCAGGAAGCCATCAGGAAGGGCTGAGGGAGGAAGTGGGGCCACTGCACCACCAGGCAGGAGGCTCTGTCTTTGTGAACCCAGGGAGGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTATGGCTCCCACAGTGGCAGGCTGCAGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCCGCGGGTGCTCCATCTTGGATGAGCCTATCTCTCTCACCCACGGACTCGCCCACCTCCTCTTCACCCTGGCCACACGTCGTCCACACCATCCTAAGTCCCACCTACACCAGAGCCGGCACAGCCAGTGCAGACAGAGGCTGGGGTGCAGGGGGGCCGACTGGGCAGCTTCGGGGAGGGAGGAATGGAGGAAGGGGAGTTCAGTGAAGAGGCCCCCCTCCCCTGGGTCCAGGATCCTCCTCTGGGACCCCCGGATCCCATCCCCTCCAGGCTCTGGGAGGAGAAGCAGGATGGGAGAATCTGTGCGGGACCCTCTCACAGTGGAATACCTCCACAGCGGCTCAGGCCAGATACAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTGCTGGGCCTGGGGGCAGCCGCTCCCACACAGGATGAACCCAGCACCCCGAGGATGTCCTGCCAGGGGGAGCTCAGAGCCATGAAGGAGCAGGATATGGGACCCCCGATACAGGCACAGACCTCAGCTCCATTCAGGACTGCCACGTCCTGCCCTGGGAGGAACCCCTTTCTCTAGTCCCTGCAGGCCAGGAGGCAGCTGACTCCTGACTTGGACGCCTATTCCAGACACCAGACAGAGGGGCAGGCCCCCCAGAACCAGGGATGAGGACGCCCCGTCAAGGCCAGAAAAGACCAAGTTGCGCTGAGCCCAGCAAGGGAAGGTCCCCAAACAAACCAGGAGGATTTTGTAGGTGTCTGTGTCACTGTGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACTGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGACACTCGCCAGGTCAAAAACCCCATCCCAAGTCAGCGGAATGCAGAGAGAGCAGGGAGGACATGTTTAGGATCTGAGGCCGCACCTGACACCCAGGCCAGCAGACGTCTCCTGTCCACGGCACCCTGCCATGTCCTGCATTTCTGGAAGAACAAGGGCAGGCTGAAGGGGGTCCAGGACCAGGAGATGGGTCCGCTCTACCCAGAGAAGGAGCCAGGCAGGACACAAGCCCCCACGCGTGGGCTCGTAGTTTGACGTGCGTGAAGTGTGGGTAAGAAAGTACGTA
D6-D17613(SEQ ID NO:132)包括在对应于DH1-7至DH6-13的位置中插入的D6编码序列:
GCGGCCGCTGCCATTTCATTACCTCTTTCTCCGCACCCGACATAGATTACGTAACGCGTGGGCTCGTAGTTTGACGTGCGTGAAGTGTGGGTAAGAAAGTCCCCATTGAGGCTGACCTGCCCAGAGGGTCCTGGGCCCACCCAACACACCGGGGCGGAATGTGTGCAGGCCTCGGTCTCTGTGGGTGTTCCGCTAGCTGGGGCTCACAGTGCTCACCCCACACCTAAAACGAGCCACAGCCTCCGGAGCCCCTGAAGGAGACCCCGCCCACAAGCCCAGCCCCCACCCAGGAGGCCCCAGAGCACAGGGCGCCCCGTCGGATTTTGTACAGCCCCGAGTCACTGTGCAGCTTCTTGCACAGTGAGAAAAGCTTCGTCAAAAACCGTCTCCTGGCCACAGTCGGAGGCCCCGCCAGAGAGGGGAGCAGCCACCCCAAACCCATGTTCTGCCGGCTCCCATGACCCCGTGCACCTGGAGCCCCACGGTGTCCCCACTGGATGGGAGGACAAGGGCCGGGGGCTCCGGCGGGTCGGGGCAGGGGCTTGATGGCTTCCTTCTGCCGTGGCCCCATTGCCCCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAGAGTCAGGGATCAGTGGCACCTCCCAACATCAACCCCACGCAGCCCAGGCACAAACCCCACATCCAGGGCCAACTCCAGGAACAGAGACACCCCAATACCCTGGGGGACCCCGACCCTGATGACTCCCGTCCCATCTCTGTCCCTCACTTGGGGCCTGCTGCGGGGCGAGCACTTGGGAGCAAACTCAGGCTTAGGGGACACCACTGTGGGCCTGACCTCGAGCAGGCCACAGACCCTTCCCTCCTGCCCTGGTGCAGCACAGACTTTGGGGTCTGGGCAGGGAGGAACTTCTGGCAGGTCACCAAGCACAGAGCCCCCAGGCTGAGGTGGCCCCAGGGGGAACCCCAGCAGGTGGCCCACTACCCTTCCTCCCAGCTGGACCCCATGTCTTCCCCAAGATAGGGGTGCCATCCAAGGCAGGTCCTCCATGGAGCCCCCTTCAGGCTCCTCTCCAGACCCCACTGGGCCTCAGTCCCCACTCTAGGAATGCAGCCACCACGGGCACACCAGGCAGCCCAGGCCCAGCCACCCTGCAGTGCCCAAGCCCACACCCTGGAGGAGAGCAGGGTGCGTCTGGGAGGGGCTGGGCTCCCCACCCCCACCCCCACCTGCACACCCCACCCACCCTTGCCCGGGCCCCCTGCAGGAGGGTCAGAGCCCCCATGGGATATGGACTTAGGGTCTCACTCACGCACCTCCCCTCCTGGGAGAAGGGGTCTCATGCCCAGATCCCCCCAGCAGCGCTGGTCACAGGTAGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGCCCCTCAGGCTCCTCTAGCCCTGGCTGCCCTGCTGTCCCTGGGAGGCCTGGGCTCCACCAGACCACAGGTCTAGGGCACCGCCCACACTGGGGCCGCCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCCAGGCCCGGGACCTGCCTTGCTGCTACGACTTCCTGCCCCAGACCTCGTTGCCCTCCCCCGTCCACTTACACACAGGCCAGGAAGCTGTTCCCACACAGACCAACCCCAGACGGGGACCACCTGGCACTCAGGTCACTGCCATTTCCTTCTCCATTCACTTCCAATGCCTCTGTGCTTCCTCCCTCCTCCTTCCTTCGGGGGAGCACCCTGTGCAGCTCCTCCCTGCAGTCCACACCCTGGGGAGACCCGACCCTGCAGCCCACACCCTGGGGAGACCTGACCCTCCTCCAGCCCTTTCTCCCCCGCTGCTCTTGCCACCCACCAAGACAGCCCTGGGGTCCTGTCCCTACAGCCCCCACCCAGTTCTCTACCTAGACCCGTCTTCCTCCCTCTAAACACCTCTCCCAGGCCAACCCTACACCTGCAGGCCCTCCCCTCCACTGCCAAAGACCCTCAGTTTCTCCTGCCTGTGCCCACCCCCGTGCTCCTCCTGCCCACAGCTCGAGCTCTTCCTCTCCTAGGGCCCCTGAGGGATGGCATTGACCGTGCCCTCGCACCCACACACTGCCCATGCCCTCACATTCCTCCTGGCCACTCCAGCCCCACTCCCCTCTCAGGCCTGGCTCTGGTATTTCTGGGACAAAGCCTTACCCAAGTCTTTCCCATGCAGGCCTGGGCCCTTACCCTCACTGCCCGGTTACAGGGCAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCGCCTTGACACACGTCTGCCTGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCGGCACTCCCTCTAAAGACGAGGGATCCAGGCAGCAGCATCACAGGAGAATGCAGGGCTACCAGACATCCCAGTCCTCTCACAGGCCTCTCCTGGGAAGAGACCTGAAGACGCCCAGTCAACGGAGTCTAACACCAAACCTCCCTGGAGGCCGATGGGTAGTAACGGAGTCATTGCCAGACCTGGAGGCAGGGGAGCAGTGAGCCCGAGCCCACACCATAGGGCCAGAGGACAGCCACTGACATCCCAAGCCACTCACTGGTGGTCCCACAACACCCCATGGAAAGAGGACAGACCCACAGTCCCACCTGGACCAGGGCAGAGACTGCTGAGACCCAGCACCAGAACCAACCAAGAAACACCAGGCAACAGCATCAGAGGGGGCTCTGGCAGAACAGAGGAGGGGAGGTCTCCTTCACCAGCAGGCGCTTCCCTTGACCGAAGACAGGATCCATGCAACTCCCCCAGGACAAAGGAGGAGCCCCTTGTTCAGCACTGGGCTCAGAGTCCTCTCCAAGACACCCAGAGTTTCAGACAAAAACCCCCTGGAATGCACAGTCTCAGCAGGAGAGCCAGCCAGAGCCAGCAAGATGGGGCTCAGTGACACCCGCAGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACAGTGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGACACAGCCCCATTCAAAAACCCCTACTGCAAACGCATTCCACTTCTGGGGCTGAGGGGCTGGGGGAGCGTCTGGGAAATAGGGCTCAGGGGTGTCCATCAATGCCCAAAACGCACCAGACTCCCCTCCATACATCACACCCACCAGCCAGCGAGCAGAGTAAACAGAAAATGAGAAGCAAGCTGGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGTAAGAGGGGATGCGGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTGTTCGAGATCAATGGCTGGGAGTGAGCCCAGGAGGACAGCGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTCGAAAGTTTGCCTTGTGCCCACACTGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAGATGGATTTGCAGCACAGATCTGAATAAATTCTCCAGAATGTGGAGCAGCACAGAAGCAAGCACACAGAAAGTGCCTGATGCAAGGACAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCCCTGGCAGGAACTCCCTGTGACAAAGCAGAACCCTCAGGCAATGCCAGCCCCAGAGCCCTCCCTGAGAGCCTCATGGGCAAAGATGTGCACAACAGGTGTTTCTCATAGCCCCAAACTGAGAGCAAAGCAAACGTCCATCTGAAGGAGAACAGGCAAATAAACGATGGCAGGTTCATGAAATGCAAACCCAGACAGCCACAAGCACAAAAGTACAGGGTTATAAGCGACTCTGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAAAGTAAACTCCAAAAAATACTTTCAATGTGATTTCTTCTAAATAAAATTTACACCCTGCAAAATGAACTGTCTTCTTAAGGGATACATTTCCCAGTTAGAAAACCATAAAGAAAACCAAGAAAAGGATGATCACATAAACACAGTGGTGGTTACTTCTGCTGGGGAAGGAAGAGGGTATGAACTGAGATACACAGGGTGGGCAAGTCTCCTAACAAGAACAGAACGAATACATTACAGTACCTTGAAAACAGCAGTTAAACTTCTAAATTGCAAGAAGAGGAAAATGCACACAGTTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTCGGATAAATAAGCGATGACACAGGCAATTGCACAATGATACAGACATATATTTAGTATATGAGACATCGATGATGTATCCCCAAATAAACGACTTTAAAGAGATAAAGGGCTGATGTGTGGTGGCATTCACCTCCCTGGGATCCCCGGACAGGTTGCAGGCTCACTGTGCAGCAGGGCAGGCGGGTACCTGCTGGCAGTTCCTGGGGCCTGATGTGGAGCAAGCGCAGGGCCATATATCCCGGAGGACGGCACAGTCAGTGAATTCCAGAGAGAAGCAACTCAGCCACACTCCCCAGGCAGAGCCCGAGAGGGACGCCCACGCACAGGGAGGCAGAGCCCAGCACCTCCGCAGCCAGCACCACCTGCGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGACGCCTCACACATCCACCTCAGCCTCCCCTGACCTGGACCTCACTGGCCTGGGCCTCACTTAACCTGGGCTTCACCTGACCTTGGCCTCACCTGACTTGGACCTCGCCTGTCCCAAGCTTTACCTGACCTGGGCCTCAACTCACCTGAACGTCTCCTGACCTGGGTTTAACCTGTCCTGGAACTCACCTGGCCTTGGCTTCCCCTGACCTGGACCTCATCTGGCCTGGGCTTCACCTGGCCTGGGCCTCACCTGACCTGGACCTCATCTGGCCTGGACCTCACCTGGCCTGGACTTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCGGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAGCCTGAGTAGCACTGAGGGTGCAGAAGCTCATCCAGGGTTGGGGAATGACTCTAGAAGTCTCCCACATCTGACCTTTCTGGGTGGAGGCAGCTGGTGGCCCTGGGAATATAAAAATCTCCAGAATGATGACTCTGTGATTTGTGGGCAACTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACATAGGGACAGATGCCAGCCTGAGGTGGAGCCTCAGGACACAGGTGGGCACGGACACTATCCACATAAGCGAGGGATAGACCCGAGTGTCCCCACAGCAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCAGAGCCCTGCTGCCTCCTCCGGTCAGCCCTGGACATCCCAGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCCACAGTGTCACAGAGTCCATCAAAAACCCATGCCTGGAAGCTTCCCGCCACAGCCCTCCCCATGGGGCCCTGCTGCCTCCTCAGGTCAGCCCCGGACATCCCGGGTTTCCCCAGGCTGGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCCAAACCCATGAAAACCCCAAGGGAGTTTGGAACAGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCCACAGTGTCACAGAGTCCATCAAAAACCCATCCCTGGGAGCCTCCCGCCACAGCCCTCCCTGCAGGGGACCGGTACGTGCCATGTTAGGATTTTGATCGAGGAGACAGCACCATGGGTATGGTGGCTACCACAGCAGTGCAGCCTGTGACCCAAACCCGCAGGGCAGCAGGCACGATGGACAGGCCCGTGACTGACCACGCTGGGCTCCAGCCTGCCAGCCCTGGAGATCATGAAACAGATGGCCAAGGTCACCCTACAGGTCATCCAGATCTGGCTCCGAGGGGTCTGCATCGCTGCTGCCCTCCCAACGCCAGTCCAAATGGGACAGGGACGGCCTCACAGCACCATCTGCTGCCATCAGGCCAGCGATCCCAGAAGCCCCTCCCTCAAGGCTGGGCACATGTGTGGACACTGAGAGCCCTCATATCTGAGTAGGGGCACCAGGAGGGAGGGGCTGGCCCTGTGCACTGTCCCTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGAGCCTCTCCTGGGTCATTTCCAAGACAGAAGACATTCCTGGGGACAGCCGGAGCTGGGCGTCGCTCATCCTGCCCGGCCGTCCTGAGTCCTGCTCATTTCCAGACCTCACCGGGGAAGCCAACAGAGGACTCGCCTCCCACATTCAGAGACAAAGAACCTTCCAGAAATCCCTGCCTCTCTCCCCAGTGGACACCCTCTTCCAGGACAGTCCTCAGTGGCATCACAGCGGCCTGAGATCCCCAGGACGCAGCACCGCTGTCAATAGGGGCCCCAAATGCCTGGACCAGGGCCTGCGTGGGAAAGGCCTCTGGCCACACTCGGGGATTTTGTGAAGGGCCCTCCCACTGTGCCAGCTTCTTGAGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGATGAACCCAGTGTCAAAAACCGGCTGGAAACCCAGGGGCTGTGTGCACGCCTCAGCTTGGAGCTCTCCAGGAGCACAAGAGCCGGGCCCAAGGATTTGTGCCCAGACCCTCAGCCTCTAGGGACACCTGGGTCATCTCAGCCTGGGCTGGTGCCCTGCACACCATCTTCCTCCAAATAGGGGCTTCAGAGGGCTCTGAGGTGACCTCACTCATGACCACAGGTGACCTGGCCCTTCCCTGCCAGCTATACCAGACCCTGTCTTGACAGATGCCCCGATTCCAACAGCCAATTCCTGGGACCCTGAATAGCTGTAGACACCAGCCTCATTCCAGTACCTCCTGCCAATTGCCTGGATTCCCATCCTGGCTGGAATCAAGAAGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCGCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCCTGGACAGTTCCCCTCACCTGCCACTAGAGAAACACCTGCCATTGTCGTCCCCACCTGGAAAAGACCACTCGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGACAGTCCTCGAGGCCCCTAAGAAGGAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACGCTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGAGACACTGTGCATGTCTGGTACCTAAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCTCAGCTGTCTGGGCCCTCCCTGCTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGCGATGTCACACTGTGCAGCTTCTTGAGCAAGCACAGTGGTGCCGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGCGCAGCCCCAGGCATCCACTTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTCTGTCCTCTGGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTGCTCCAGGGCAGGGATGATTGAGATAGAAATCAAAGGCTGGCAGGGAAAGGCAGCTTCCCGCCCTGAGAGGTGCAGGCAGCACCACGGAGCCACGGAGTCACAGAGCCACGGAGCCCCCATTGTGGGCATTTGAGAGTGCTGTGCCCCCGGCAGGCCCAGCCCTGATGGGGAAGCCTGTCCCATCCCACAGCCCGGGTCCCACGGGCAGCGGGCACAGAAGCTGCCAGGTTGTCCTCTATGATCCTCATCCCTCCAGCAGCATCCCCTCCACAGTGGGGAAACTGAGGCTTGGAGCACCACCCGGCCCCCTGGAAATGAGGCTGTGAGCCCAGACAGTGGGCCCAGAGCACTGTGAGTACCCCGGCAGTACCTGGCTGCAGGGATCAGCCAGAGATGCCAAACCCTGAGTGACCAGCCTACAGGAGGATCCGGCCCCACCCAGGCCACTCGATTAATGCTCAACCCCCTGCCCTGGAGACCTCTTCCAGTACCACCAGCAGCTCAGCTTCTCAGGGCCTCATCCCTGCAAGGAAGGTCAAGGGCTGGGCCTGCCAGAAACACAGCACCCTCCCTAGCCCTGGCTAAGACAGGGTGGGCAGACGGCTGTGGACGGGACATATTGCTGGGGCATTTCTCACTGTCACTTCTGGGTGGTAGCTCTGACAAAAACGCAGACCCTGCCAAAATCCCCACTGCCTCCCGCTAGGGGCTGGCCTGGAATCCTGCTGTCCTAGGAGGCTGCTGACCTCCAGGATGGCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCAGGCTGTAGGCTGGGAGGCCACCCCTGCCCTTGCCGGGGTTGAATGCAGGTGCCCAAGGCAGGAAATGGCATGAGCACAGGGATGACCGGGACATGCCCCACCAGAGTGCGCCCCTTCCTGCTCTGCACCCTGCACCCCCCAGGCCAGCCCACGACGTCCAACAACTGGGCCTGGGTGGCAGCCCCACCCAGACAGGACAGACCCAGCACCCTGAGGAGGTCCTGCCAGGGGGAGCTAAGAGCCATGAAGGAGCAAGATATGGGGCCCCCGATACAGGCACAGATGTCAGCTCCATCCAGGACCACCCAGCCCACACCCTGAGAGGAACGTCTGTCTCCAGCCTCTGCAGGTCGGGAGGCAGCTGACCCCTGACTTGGACCCCTATTCCAGACACCAGACAGAGGCGCAGGCCCCCCAGAACCAGGGTTGAGGGACGCCCCGTCAAAGCCAGACAAAACCAAGGGGTGTTGAGCCCAGCAAGGGAAGGCCCCCAAACAGACCAGGAGGATTTTGTAGGTGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCAGCCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCCACAGTGACACTCACCCAGTCAAAAACCCCATTCCAAGTCAGCGGAAGCAGAGAGAGCAGGGAGGACACGTTTAGGATCTGAGACTGCACCTGACACCCAGGCCAGCAGACGTCTCCCCTCCAGGGCACCCCACCCTGTCCTGCATTTCTGCAAGATCAGGGGCGGCCTGAGGGGGGGTCTAGGGTGAGGAGATGGGTCCCCTGTACACCAAGGAGGAGTTAGGCAGGTCCCGAGCACTCTTAATTAAACGACGCCTCGAATGGAACTACTACAACGAATGGTTGCTCTACGTAATGCATTCGCTACCTTAGGACCGTTATAGTTAGGCGCGCC
D6-DH114619(SEQ ID NO:133)包括在对应于DH1-14至DH6-19的位置中插入的D6编码序列:
TACGTATTAATTAAACGACGCCTCGAATGGAACTACTACAACGAATGGTTGCTCTCCCCATTGAGGCTGACCTGCCCAGAGAGTCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTGCAGGCCTCGGTCTCTGTGGGTGTTCCGCTAGCTGGGGCTCACAGTGCTCACCCCACACCTAAAATGAGCCACAGCCTCCGGAGCCCCCGCAGGAGACCCCGCCCACAAGCCCAGCCCCCACCCAGGAGGCCCCAGAGCTCAGGGCGCCCCGTCGGATTTTGTACAGCCCCGAGTCACTGTGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACCACAGTGAGAATAGCTACGTCAAAAACCGTCCAGTGGCCACTGCCGGAGGCCCCGCCAGAGAGGGCAGCAGCCACTCTGATCCCATGTCCTGCCGGCTCCCATGACCCCCAGCACGCGGAGCCCCACAGTGTCCCCACTGGATGGGAGGACAAGAGCTGGGGATTCCGGCGGGTCGGGGCAGGGGCTTGATCGCATCCTTCTGCCGTGGCTCCAGTGCCCCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAGAGACAGGCATCACCGGCGCCTCCCAACATCAACCCCAGGCAGCACAGGCACAAACCCCACATCCAGAGCCAACTCCAGGAGCAGAGACACCCCAATACCCTGGGGGACCCCGACCCTGATGACTTCCCACTGGAATTCGCCGTAGAGTCCACCAGGACCAAAGACCCTGCCTCTGCCTCTGTCCCTCACTCAGGACCTGCTGCCGGGCGAGGCCTTGGGAGCAGACTTGGGCTTAGGGGACACCAGTGTGACCCCGACCTTGACCAGGACGCAGACCTTTCCTTCCTTTCCTGGGGCAGCACAGACTTTGGGGTCTGGGCCAGGAGGAACTTCTGGCAGGTCGCCAAGCACAGAGGCCACAGGCTGAGGTGGCCCTGGAAAGACCTCCAGGAGGTGGCCACTCCCCTTCCTCCCAGCTGGACCCCATGTCCTCCCCAAGATAAGGGTGCCATCCAAGGCAGGTGCTCCTTGGAGCCCCATTCAGACTCCTCCCTGGACCCCACTGGGCCTCAGTCCCAGCTCTGGGGATGAAGCCACCACAAGCACACCAGGCAGCCCAGGCCCAGCCACCCTGCAGTGCCCAAGCACACACTCTGGAGCAGAGCAGGGTGCCTCTGGGAGGGGCTGAGCTCCCCACCCCACCCCCACCTGCACACCCCACCCACCCCTGCCCAGCGGCTCTGCAGGAGGGTCAGAGCCCCACATGGGGTATGGACTTAGGGTCTCACTCACGTGGCTCCCATCATGAGTGAAGGGGCCTCAAGCCCAGGTTCCCACAGCAGCGCCTGTCGCAAGTGGAGGCAGAGGCCCGAGGGCCACCCTGACCTGGTCCCTGAGGTTCCTGCAGCCCAGGCTGCCCTGCTGTCCCTGGGAGGCCTGGGCTCCACCAGACCACAGGTCCAGGGCACCGGGTGCAGGAGCCACCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCCAGGGCCAGAACCTGCCTTCCTGCTACTGCTTCCTGCCCCAGACCTGGGCGCCCTCCCCCGTCCACTTACACACAGGCCAGGAAGCTGTTCCCACACAGAACAACCCCAAACCAGGACCGCCTGGCACTCAGGTGGCTGCCATTTCCTTCTCCATTTGCTCCCAGCGCCTCTGTCCTCCCTGGTTCCTCCTTCGGGGGAACAGCCTGTGCAGCCAGTCCCTGCAGCCCACACCCTGGGGAGACCCAACCCTGCCTGGGGCCCTTCCAACCCTGCTGCTCTTACTGCCCACCCAGAAAACTCTGGGGTCCTGTCCCTGCAGTCCCTACCCTGGTCTCCACCCAGACCCCTGTGTATCACTCCAGACACCCCTCCCAGGCAAACCCTGCACCTGCAGGCCCTGTCCTCTTCTGTCGCTAGAGCCTCAGTTTCTCCCCCCTGTGCCCACACCCTACCTCCTCCTGCCCACAACTCTAACTCTTCTTCTCCTGGAGCCCCTGAGCCATGGCATTGACCCTGCCCTCCCACCACCCACAGCCCATGCCCTCACCTTCCTCCTGGCCACTCCGACCCCGCCCCCTCTCAGGCCAAGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTTCCCAGGCAGGCCTGGGCTCTTGCCCTCACTTCCCGGTTACACGGGAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCACCTTGACACACGTCCGCCCGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCCGCACTCCCTCTAAAGACAAGGGATCCAGGCAGCAGCATCACGGGAGAATGCAGGGCTCCCAGACATCCCAGTCCTCTCACAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACCAAACAGCCACAGAGGCTGCTGGATAGTAACTGAGTCAATGACCGACCTGGAGGGCAGGGGAGCAGTGAGCCGGAGCCCATACCATAGGGACAGAGACCAGCCGCTGACATCCCGAGCTCCTCAATGGTGGCCCCATAACACACCTAGGAAACATAACACACCCACAGCCCCACCTGGAACAGGGCAGAGACTGCTGAGCCCCCAGCACCAGCCCCAAGAAACACCAGGCAACAGTATCAGAGGGGGCTCCCGAGAAAGAGAGGAGGGGAGATCTCCTTCACCATCAAATGCTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTATACAGCACTGGGCTCAGAGTCCTCTCTGAGACACCCTGAGTTTCAGACAACAACCCGCTGGAATGCACAGTCTCAGCAGGAGAACAGACCAAAGCCAGCAAAAGGGACCTCGGTGACACCAGTAGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACTGCAAGCACAGTGACACAGACCCATTCAAAAACCCCTACTGCAAACACACCCACTCCTGGGGCTGAGGGGCTGGGGGAGCGTCTGGGAAGTAGGGTCCAGGGGTGTCTATCAATGTCCAAAATGCACCAGACTCCCCGCCAAACACCACCCCACCAGCCAGCGAGCAGGGTAAACAGAAAATGAGAGGCTCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGCAAGAGGGGATGCAGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTGTTCAAGATCAGTGGCTGGGAATGAGCCCAGGAGGGCAGTCTGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTCAAAAGTTTGCCTTGTGACCACACTATTGCATCATGGGATGCTTAAGAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAGATGAATTTGCAGCATAGATCTGAATAAACTCTCCAGAATGTGGAGCAGTACAGAAGCAAACACACAGAAAGTGCCTGATGCAAGGACAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCCTTGGCAGGATCTCCCTGCGACAAAGCAGAACCCTCAGGCAATGCCAGCCCCAGAGCCCTCCCTGAGAGCGTCATGGGGAAAGATGTGCAGAACAGCTGATTATCATAGACTCAAACTGAGAACAGAGCAAACGTCCATCTGAAGAACAGTCAAATAAGCAATGGTAGGTTCATGCAATGCAAACCCAGACAGCCAGGGGACAACAGTAGAGGGCTACAGGCGGCTTTGCGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAGAGGAAAGCCCAAAAAATACTTTTAATGTGATTTCTTCTAAATAAAATTTACACCAGGCAAAATGAACTGTCTTCTTAAGGGATAAACTTTCCCCTGGAAAAACTACAAGGAAAATTAAGAAAACGATGATCACATAAACACAGTTGTGGTTACTTCTACTGGGGAAGGAAGAGGGTATGAGCTGAGACACACAGAGTCGGCAAGTCTCCAAGCAAGCACAGAACGAATACATTACAGTACCTTGAATACAGCAGTTAAACTTCTAAATCGCAAGAACAGGAAAATGCACACAGCTGTGTTTAGAAAATTCTCAGTCCAGCACTATTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAATGATGACACAGGCAATTGCACAATGATACAGACATACATTTAGTACATGAGACATCGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATGTGTGGTGGCACTCACCTCCCTGGGATCCCCGGACAGGTTGCAGGCACACTGTGTGGCAGGGCAGGCTGGTACATGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAAGCGCAGGGCTGTATACCCCCAAGGATGGCACAGTCAGTGAATTCCAGAGAGAAGCAGCTCAGCCACACTGCCCAGGCAGAGCCCGAGAGGGACGCCCACGTACAGGGAGGCAGAGCCCAGCTCCTCCACAGCCACCACCACCTGTGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGAAGCCTCACACATCCACCTCAGCCTCCCCTGACCTGGACCTCACCTGGTCTGGACCTCACCTGGCCTGGGCCTCACCTGACCTGGACCTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCCGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAACCTGAGTAGCACTGAGGCTGCAGAAGCTCATCCAGGGTTGGGGAATGACTCTGGAACTCTCCCACATCTGACCTTTCTGGGTGGAGGCATCTGGTGGCCCTGGGAATATAAAAAGCCCCAGAATGGTGCCTGCGTGATTTGGGGGCAATTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACATAGGGACAGATGCCAGCCTGAGGTGGAGCCTCAGGACACAGTTGGACGCGGACACTATCCACATAAGCGAGGGACAGACCCGAGTGTTCCTGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGTGCCCTGCTGCCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCAGATGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCTGCGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGTCACACGGTCCATCAAAAACCCATGCCACAGCCCTCCCCGCAGGGGACCGCCGCGTGCCATGTTACGATTTTGATCGAGGACACAGCGCCATGGGTATGGTGGCTACCACAGCAGTGCAGCCCATGACCCAAACACACAGGGCAGCAGGCACAATGGACAGGCCTGTGAGTGACCATGCTGGGCTCCAGCCCGCCAGCCCCGGAGACCATGAAACAGATGGCCAAGGTCACCCCACAGTTCAGCCAGACATGGCTCCGTGGGGTCTGCATCGCTGCTGCCCTCTAACACCAGCCCAGATGGGGACAAGGCCAACCCCACATTACCATCTCCTGCTGTCCACCCAGTGGTCCCAGAAGCCCCTCCCTCATGGCTGAGCCACATGTGTGAACCCTGAGAGCACCCCATGTCAGAGTAGGGGCAGCAGAAGGGCGGGGCTGGCCCTGTGCACTGTCCCTGCACCCATGGTCCCTCGCCTGCCTGGCCCTGACACCTGAGCCTCTTCTGAGTCATTTCTAAGATAGAAGACATTCCCGGGGACAGCCGGAGCTGGGCGTCGCTCATCCCGCCCGGCCGTCCTGAGTCCTGCTTGTTTCCAGACCTCACCAGGGAAGCCAACAGAGGACTCACCTCACACAGTCAGAGACAAAGAACCTTCCAGAAATCCCTGTCTCACTCCCCAGTGGGCACCTTCTTCCAGGACATTCCTCGGTCGCATCACAGCAGGCACCCACATCTGGATCAGGACGGCCCCCAGAACACAAGATGGCCCATGGGGACAGCCCCACAACCCAGGCCTTCCCAGACCCCTAAAAGGCGTCCCACCCCCTGCACCTGCCCCAGGGCTAAAAATCCAGGAGGCTTGACTCCCGCATACCCTCCAGCCAGACATCACCTCAGCCCCCTCCTGGAGGGGACAGGAGCCCGGGAGGGTGAGTCAGACCCACCTGCCCTCGATGGCAGGCGGGGAAGATTCAGAAAGGCCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGCGTGGGAAAGGCCGCTGGGCACACTCAGGGGGATTTTGTGAAGGCCCCTCCCACTGTGCAGCTTCTTGTGCAAGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACTGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGATGAAACTAGCATCAAAAACCGGCCGGACACCCAGGGACCATGCACACTTCTCAGCTTGGAGCTCTCCAGGACCAGAAGAGTCAGGTCTGAGGGTTTGTAGCCAGACCCTCGGCCTCTAGGGACACCCTGGCCATCACAGCGGATGGGCTGGTGCCCCACATGCCATCTGCTCCAAACAGGGGCTTCAGAGGGCTCTGAGGTGACTTCACTCATGACCACAGGTGCCCTGGCCCCTTCCCCGCCAGCTACACCGAACCCTGTCCCAACAGCTGCCCCAGTTCCAACAGCCAATTCCTGGGGCCCAGAATTGCTGTAGACACCAGCCTCGTTCCAGCACCTCCTGCCAATTGCCTGGATTCACATCCTGGCTGGAATCAAGAGGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCGCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCCTGGACAGTTCCCCTCACCTGCCACTAGAGAAACACCTGCCATTGTCGTCCCCACCTGGAAAAGACCACTCGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGACTCCCCGAGGGATCTAAGAAGGAGCCATGCGCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACACTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACTGTGCATGTCTGGTCCCTGAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCCCTGTTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGTCACACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACTGTCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCACAGTGGTGCTGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGTGCAGCCCCAGGCCTCCACTTCACCTGCTTCTCCTGGGGCTCTCAAGGTCACTGTTGTCTGTACTCTGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTTCTCAACATCCCAGGGCCTCATGTCTGCACGGAAGGCCAATGGATGGGCAACCTCACATGCCGCGGCTAAGATAGGGTGGGCAGCCTGGCGGGGGACAGTACATACTGCTGGGGTGTCTGTCACTGTGCCTAGTGGGGCACTGGCTCCCAAACAACGCAGTCCTCGCCAAAATCCCCACAGCCTCCCCTGCTAGGGGCTGGCCTGATCTCCTGCAGTCCTAGGAGGCTGCTGACCTCCAGAATGTCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCCGGCTGCAGACTGGGAGGCCACCCCCTCCTTCCCAGGGTTCACTGGAGGTGACCAAGGTAGGAAATGGCCTTAACACAGGGATGACTGCGCCATCCCCCAACAGAGTCAGCCCCCTCCTGCTCTGTACCCCGCACCCCCCAGGCCAGTCCACGAAAACCAGGGCCCCACATCAGAGTCACTGCCTGGCCCGGCCCTGGGGCGGACCCCTCAGCCCCCACCCTGTCTAGAGGACTTGGGGGGACAGGACACAGGCCCTCTCCTTATGGTTCCCCCACCTGCCTCCGGCCGGGACCCTTGGGGTGTGGACAGAAAGGACACCTGCCTAATTGGCCCCCAGGAACCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACCCCATGGGAATCCGGTATCCCCAGGAAGCCATCAGGAAGGGCTGAAGGAGGAAGCGGGGCCGTGCACCACCGGGCAGGAGGCTCCGTCTTCGTGAACCCAGGGAAGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTGGGGCTCCCACCGTGGCAGGCTGCGGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCTGCGGGTGCTCCTCCATCTTCGGTGAGCCTCCCCCTTCACCCACCGTCCCGCCCACCTCCTCTCCACCCTGGCTGCACGTCTTCCACACCATCCTGAGTCCTACCTACACCAGAGCCAGCAAAGCCAGTGCAGACAAAGGCTGGGGTGCAGGGGGGCTGCCAGGGCAGCTTCGGGGAGGGAAGGATGGAGGGAGGGGAGGTCAGTGAAGAGGCCCCCTTCCCCTGGGTCCAGGATCCTCCTCTGGGACCCCCGGATCCCATCCCCTCCTGGCTCTGGGAGGAGAAGCAGGATGGGAGAATCTGTGCGGGACCCTCTCACAGTGGAATATCCCCACAGCGGCTCAGGCCAGACCCAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTCCTGGGCCTGGGTAGCAGCCCCTCCCACAGAGGACAGACCCAGCACCCCGAAGAAGTCCTGCCAGGGGGAGCTCAGAGCCATGAAAGAGCAGGATATGGGGTCCCCGATACAGGCACAGACCTCAGCTCCATCCAGGCCCACCGGGACCCACCATGGGAGGAACACCTGTCTCCGGGTTGTGAGGTAGCTGGCCTCTGTCTCGGACCCCACTCCAGACACCAGACAGAGGGGCAGGCCCCCCAAAACCAGGGTTGAGGGATGATCCGTCAAGGCAGACAAGACCAAGGGGCACTGACCCCAGCAAGGGAAGGCTCCCAAACAGACGAGGAGGATTTTGTAGCTGTCTGTATCACTGTGCAGCTTCTTGTGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGACACTCGCCAGGTCAAAAACCCCGTCCCAAGTCAGCGGAAGCAGAGAGAGCAGGGAGGACACGTTTAGGATCTGAGGCCGCACCTGACACCCAGGGCAGCAGACGTCTCCCCTCCAGGGCACCCTCCACCGTCCTGCGTTTCTTCAAGAATAGGGGCGGCCTGAGGGGGTCCAGGGCCAGGCGATAGGTCCCCTCTACCCCAAGGAGGAGCCAGGCAGGACCCGAGCACCGATGCATCTAACGCAGTCATGTAATGCTGGGTGACAGTCAGTTCGCCTACGTA
D6-DH120126(SEQ ID NO:134)包括在对应于DH1-20至DH1-26的位置中插入的D6编码序列:
TACGTAATGCATCTAACGCAGTCATGTAATGCTGGGTGACAGTCAGTTCGCCTCCCCATTGAGGCTGACCTGCCCAGACGGGCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTGCAGGCCCCAGTCTCTGTGGGTGTTCCGCTAGCTGGGGCCCCCAGTGCTCACCCCACACCTAAAGCGAGCCCCAGCCTCCAGAGCCCCCTAAGCATTCCCCGCCCAGCAGCCCAGCCCCTGCCCCCACCCAGGAGGCCCCAGAGCTCAGGGCGCCTGGTCGGATTTTGTACAGCCCCGAGTCACTGTGCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGAGAAAAACTGTGTCAAAAACCGACTCCTGGCAGCAGTCGGAGGCCCCGCCAGAGAGGGGAGCAGCCGGCCTGAACCCATGTCCTGCCGGTTCCCATGACCCCCAGCACCCAGAGCCCCACGGTGTCCCCGTTGGATAATGAGGACAAGGGCTGGGGGCTCCGGTGGTTTGCGGCAGGGACTTGATCACATCCTTCTGCTGTGGCCCCATTGCCTCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAAAGACAGGGATCACCGGCACCTCCCAATATCAACCCCAGGCAGCACAGACACAAACCCCACATCCAGAGCCAACTCCAGGAGCAGAGACACCCCAACACTCTGGGGGACCCCAACCGTGATAACTCCCCACTGGAATCCGCCCCAGAGTCTACCAGGACCAAAGGCCCTGCCCTGTCTCTGTCCCTCACTCAGGGCCTCCTGCAGGGCGAGCGCTTGGGAGCAGACTCGGTCTTAGGGGACACCACTGTGGGCCCCAACTTTGATGAGGCCACTGACCCTTCCTTCCTTTCCTGGGGCAGCACAGACTTTGGGGTCTGGGCAGGGAAGAACTACTGGCTGGTGGCCAATCACAGAGCCCCCAGGCCGAGGTGGCCCCAAGAAGGCCCTCAGGAGGTGGCCACTCCACTTCCTCCCAGCTGGACCCCAGGTCCTCCCCAAGATAGGGGTGCCATCCAAGGCAGGTCCTCCATGGAGCCCCCTTCAGACTCCTCCCGGGACCCCACTGGACCTCAGTCCCTGCTCTGGGAATGCAGCCACCACAAGCACACCAGGAAGCCCAGGCCCAGCCACCCTGCAGTGGGCAAGCCCACACTCTGGAGCAGAGCAGGGTGCGTCTGGGAGGGGCTAACCTCCCCACCCCCCACCCCCCATCTGCACACAGCCACCTACCACTGCCCAGACCCTCTGCAGGAGGGCCAAGCCACCATGGGGTATGGACTTAGGGTCTCACTCACGTGCCTCCCCTCCTGGGAGAAGGGGCCTCATGCCCAGATCCCTGCAGCACTAGACACAGCTGGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGCATCTAAGGCTGCTCCAGCCCAGACAGCACTGCCGTTCCTGGGAAGCCTGGGCTCCACCAGACCACAGGTCCAGGGCACAGCCCACAGGAGCCACCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCAGGGCGGGACCTGCCTTCCTGCCACCACTTACACACAGGCCAGGGAGCTGTTCCCACACAGATCAACCCCAAACCGGGACTGCCTGGCACTAGGGTCACTGCCATTTCCCTCTCCATTCCCTCCCAGTGCCTCTGTGCTCCCTCCTTCTGGGGAACACCCTGTGCAGCCCCTCCCTGCAGCCCACACGCTGGGGAGACCCCACCCTGCCTCGGGCCTTTTCTACCTGCTGCACTTGCCGCCCACCCAAACAACCCTGGGTACGTGACCCTGCAGTCCTCACCCTGATCTGCAACCAGACCCCTGTCCCTCCCTCTAAACACCCCTCCCAGGCCAACTCTGCACCTGCAGGCCCTCCGCTCTTCTGCCACAAGAGCCTCAGGTTTTCCTACCTGTGCCCACCCCCTAACCCCTCCTGCCCACAACTTGAGTTCTTCCTCTCCTGGAGCCCTTGAGCCATGGCACTGACCCTACACTCCCACCCACACACTGCCCATGCCATCACCTTCCTCCTGGACACTCTGACCCCGCTCCCCTCCCTCTCAGACCCGGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTCCCCATGCAGGCCCTTGCCCTCACTGCCTGGTTACACGGGAGCCTCCTGTGCGCAGAAGCAGGGAGCTCAGCTCTTCCACAGGCAGAAGGCACTGAAAGAAATCAGCCTCCAGTGCCTTGACACACGTCCGCCTGTGTCTCTCACTGCCTGCACCTGCAGGGAGGCTCCGCACTCCCTCTAAAGATGAGGGATCCAGGCAGCAACATCACGGGAGAATGCAGGGCTCCCAGACAGCCCAGCCCTCTCGCAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACTGAACAGCCACGGAGGTCGCTGGATAGTAACCGAGTCAGTGACCGACCTGGAGGGCAGGGGAGCAGTGAACCGGAGCCCATACCATAGGGACAGAGACCAGCCGCTAACATCCCGAGCCCCTCACTGGCGGCCCCAGAACACCCCGTGGAAAGAGAACAGACCCACAGTCCCACCTGGAACAGGGCAGACACTGCTGAGCCCCCAGCACCAGCCCCAAGAAACACTAGGCAACAGCATCAGAGGGGGCTCCTGAGAAAGAGAGGAGGGGAGGTCTCCTTCACCATCAAATGCTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTGTACAGCACTGGGCTCAGAGTCCTCTCTGAGACAGGCTCAGTTTCAGACAACAACCCGCTGGAATGCACAGTCTCAGCAGGAGAGCCAGGCCAGAGCCAGCAAGAGGAGACTCGGTGACACCAGTCTCCTGTAGGGACAGGAGGATTTTGTGGGGGTTCGTGTCACTGTGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACAGCAAGCACAGTGACACAACCCCATTCAAAAACCCCTACTGCAAACGCACCCACTCCTGGGACTGAGGGGCTGGGGGAGCGTCTGGGAAGTATGGCCTAGGGGTGTCCATCAATGCCCAAAATGCACCAGACTCTCCCCAAGACATCACCCCACCAGCCAGTGAGCAGAGTAAACAGAAAATGAGAAGCAGCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCAGGTGTGCAAGAGGGGATGTGGGCAGAGCCTCAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTATTCAAGATCAATGGCTGGGAGTGAGCCCAGGAGGACAGTGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTTGAAAGTTTGCCCTGTGCCCACAATGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAAATGGATTTGCAGCACAGATCTGAATAAATCCTCCAGAATGTGGAGCAGCACAGAAGCAAGCACACAGAAAGTGCCTGATGCCAAGGCAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCACTGGCAGGAACTGCCTGTGACAAAGCAGAACCCTCAGGCAATGCCAGCCCTAGAGCCCTTCCTGAGAACCTCATGGGCAAAGATGTGCAGAACAGCTGTTTGTCATAGCCCCAAACTATGGGGCTGGACAAAGCAAACGTCCATCTGAAGGAGAACAGACAAATAAACGATGGCAGGTTCATGAAATGCAAACTAGGACAGCCAGAGGACAACAGTAGAGAGCTACAGGCGGCTTTGCGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAGAGGAAAGCCCAAAAAATACTTTTAATGTGATTTCTTCTAAATAAAATTTACACCCGGCAAAATGAACTATCTTCTTAAGGGATAAACTTTCCCCTGGAAAAACTATAAGGAAAATCAAGAAAACGATGATCACATAAACACAGTGGTGGTTACTTCTACTGGGGAAGGAAGAGGGTATGAGCTGAGACACACAGAGTCGGCAAGTCTCCTAACAAGAACAGAACAAATACATTACAGTACCTTGAAAACAGCAGTTAAACTTCTAAATCGCAAGAAGAGGAAAATGCACACACCTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAGCGATGACACAGGCAATTGCACAATGATACAGACATACATTCAGTATATGAGACATCGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATGTGTGGTGGCAATCACCTCCCTGGGCATCCCCGGACAGGCTGCAGGCTCACTGTGTGGCAGGGCAGGCAGGCACCTGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAGGCACAGAGCTGTATATCCCCAAGGAAGGTACAGTCAGTGCATTCCAGAGAGAAGCAACTCAGCCACACTCCCTGGCCAGAACCCAAGATGCACACCCATGCACAGGGAGGCAGAGCCCAGCACCTCCGCAGCCACCACCACCTGCGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGAAGCCTCACACATCCCTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCGGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAGCCTGAGTAGCACTGAGGCTGTAGGGACTCATCCAGGGTTGGGGAATGACTCTGCAACTCTCCCACATCTGACCTTTCTGGGTGGAGGCACCTGGTGGCCCAGGGAATATAAAAAGCCCCAGAATGATGCCTGTGTGATTTGGGGGCAATTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACAGTAGGGACAGATGTCAGCCTGAGGTGAAGCCTCAGGACACAGGTGGGCATGGACAGTGTCCACCTAAGCGAGGGACAGACCCGAGTGTCCCTGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGGGCCCTGCTGCCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCAGCGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGTCACAGAGTCCATCAAAAACCCATGCCTGGGAGCCTCCCACCACAGCCCTCCCTGCGGGGGACCGCTGCATGCCGTGTTAGGATTTTGATCGAGGACACGGCGCCATGGGTATGGTGGCTACCACAGCAGTGCAGCCCATGACCCAAACACACGGGGCAGCAGAAACAATGGACAGGCCCACAAGTGACCATGATGGGCTCCAGCCCACCAGCCCCAGAGACCATGAAACAGATGGCCAAGGTCACCCTACAGGTCATCCAGATCTGGCTCCAAGGGGTCTGCATCGCTGCTGCCCTCCCAACGCCAAACCAGATGGAGACAGGGCCGGCCCCATAGCACCATCTGCTGCCGTCCACCCAGCAGTCCCGGAAGCCCCTCCCTGAACGCTGGGCCACGTGTGTGAACCCTGCGAGCCCCCCATGTCAGAGTAGGGGCAGCAGGAGGGCGGGGCTGGCCCTGTGCACTGTCACTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGAGCCTCTCCTGGGTCATTTCCAAGACATTCCCAGGGACAGCCGGAGCTGGGAGTCGCTCATCCTGCCTGGCTGTCCTGAGTCCTGCTCATTTCCAGACCTCACCAGGGAAGCCAACAGAGGACTCACCTCACACAGTCAGAGACAACGAACCTTCCAGAAATCCCTGTTTCTCTCCCCAGTGAGAGAAACCCTCTTCCAGGGTTTCTCTTCTCTCCCACCCTCTTCCAGGACAGTCCTCAGCAGCATCACAGCGGGAACGCACATCTGGATCAGGACGGCCCCCAGAACACGCGATGGCCCATGGGGACAGCCCAGCCCTTCCCAGACCCCTAAAAGGTATCCCCACCTTGCACCTGCCCCAGGGCTCAAACTCCAGGAGGCCTGACTCCTGCACACCCTCCTGCCAGATATCACCTCAGCCCCCTCCTGGAGGGGACAGGAGCCCGGGAGGGTGAGTCAGACCCACCTGCCCTCAATGGCAGGCGGGGAAGATTCAGAAAGGCCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGTGTGGGAAAGGCCTCTGGCCACACTCAGGGGGATTTTGTGAAGGGCCCTCCCACTGTGGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGATGAAACCAGCATCAAAAACCGACCGGACTCGCAGGGTTTATGCACACTTCTCGGCTCGGAGCTCTCCAGGAGCACAAGAGCCAGGCCCGAGGGTTTGTGCCCAGACCCTCGGCCTCTAGGGACACCCGGGCCATCTTAGCCGATGGGCTGATGCCCTGCACACCGTGTGCTGCCAAACAGGGGCTTCAGAGGGCTCTGAGGTGACTTCACTCATGACCACAGGTGCCCTGGTCCCTTCACTGCCAGCTGCACCAGACCCTGTTCCGAGAGATGCCCCAGTTCCAAAAGCCAATTCCTGGGGCCGGGAATTACTGTAGACACCAGCCTCATTCCAGTACCTCCTGCCAATTGCCTGGATTCCCATCCTGGCTGGAATCAAGAGGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCACACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCGCAGACAGTTCCCCTCACCTGCCCATGTAGAAACACCTGCCATTGTCGTCCCCACCTGGCAAAGACCACTTGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGAGTCCTCGAGGCCCCTAAGAAGGAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACGCTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGACCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACAGTGCATGTCTGGTCCCTGAGCAGCCCCCAGGCTCTCTAGCACTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCCCTGTTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGCCACACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACAGTCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCACAGTGGTGCCGCCCATATCAAAAACCAGGCCAAGTAGACAGACCCCTGCCACGCAGCCCCAGGCCTCCAGCTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTCTGCCCTCTGGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTGCTCCAGGGCAGGGATGACTGAGATAGAAATCAAAGGCTGGCAGGGAAAGGCAGCTTCCCGCCCTGAGAGGTGCAGGCAGCACCACAGAGCCATGGAGTCACAGAGCCACGGAGCCCCCAGTGTGGGCGTGTGAGGGTGCTGGGCTCCCGGCAGGCCCAGCCCTGATGGGGAAGCCTGCCCCGTCCCACAGCCCAGGTCCCCAGGGGCAGCAGGCACAGAAGCTGCCAAGCTGTGCTCTACGATCCTCATCCCTCCAGCAGCATCCACTCCACAGTGGGGAAACTGAGCCTTGGAGAACCACCCAGCCCCCTGGAAACAAGGCGGGGAGCCCAGACAGTGGGCCCAGAGCACTGTGTGTATCCTGGCACTAGGTGCAGGGACCACCCGGAGATCCCCATCACTGAGTGGCCAGCCTGCAGAAGGACCCAACCCCAACCAGGCCGCTTGATTAAGCTCCATCCCCCTGTCCTGGGAACCTCTTCCCAGCGCCACCAACAGCTCGGCTTCCCAGGCCCTCATCCCTCCAAGGAAGGCCAAAGGCTGGGCCTGCCAGGGGCACAGTACCCTCCCTTGCCCTGGCTAAGACAGGGTGGGCAGACGGCTGCAGATAGGACATATTGCTGGGGCATCTTGCTCTGTGACTACTGGGTACTGGCTCTCAACGCAGACCCTACCAAAATCCCCACTGCCTCCCCTGCTAGGGGCTGGCCTGGTCTCCTCCTGCTGTCCTAGGAGGCTGCTGACCTCCAGGATGGCTTCTGTCCCCAGTTCTAGGGCCAGAGCAGATCCCAGGCAGGCTGTAGGCTGGGAGGCCACCCCTGTCCTTGCCGAGGTTCAGTGCAGGCACCCAGGACAGGAAATGGCCTGAACACAGGGATGACTGTGCCATGCCCTACCTAAGTCCGCCCCTTTCTACTCTGCAACCCCCACTCCCCAGGTCAGCCCATGACGACCAACAACCCAACACCAGAGTCACTGCCTGGCCCTGCCCTGGGGAGGACCCCTCAGCCCCCACCCTGTCTAGAGGAGTTGGGGGGACAGGACACAGGCTCTCTCCTTATGGTTCCCCCACCTGGCTCCTGCCGGGACCCTTGGGGTGTGGACAGAAAGGACGCCTGCCTAATTGGCCCCCAGGAACCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACTCCATGGGAATCCAGAATCCCCAGGAAGCCATCAGGAAGGGCTGAAGGAGGAAGCGGGGCCGCTGCACCACCGGGCAGGAGGCTCCGTCTTCGTGAACCCAGGGAAGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTGGGGCTCCCACCGTGGCAGGCTGCGGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCTGCAGGTGCTCCATCTTGGATGAGCCCATCCCTCTCACCCACCGACCCGCCCACCTCCTCTCCACCCTGGCCACACGTCGTCCACACCATCCTGAGTCCCACCTACACCAGAGCCAGCAGAGCCAGTGCAGACAGAGGCTGGGGTGCAGGGGGGCCGCCAGGGCAGCTTTGGGGAGGGAGGAATGGAGGAAGGGGAGGTCAGTGAAGAGGCCCCCCTCCCCTGGGTCTAGGATCCACCTTTGGGACCCCCGGATCCCATCCCCTCCAGGCTCTGGGAGGAGAAGCAGGATGGGAGATTCTGTGCAGGACCCTCTCACAGTGGAATACCTCCACAGCGGCTCAGGCCAGATACAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTGCAGGGCCTGGGGGCAGCCCCTCCCACAGAGGACAGACCCAGCACCCCGAAGAAGTCCTGCCAGGGGGAGCTCAGAGCCATGAAGGAGCAAGATATGGGGACCCCAATACTGGCACAGACCTCAGCTCCATCCAGGCCCACCAGGACCCACCATGGGTGGAACACCTGTCTCCGGCCCCTGCTGGCTGTGAGGCAGCTGGCCTCTGTCTCGGACCCCCATTCCAGACACCAGACAGAGGGACAGGCCCCCCAGAACCAGTGTTGAGGGACACCCCTGTCCAGGGCAGCCAAGTCCAAGAGGCGCGCTGAGCCCAGCAAGGGAAGGCCCCCAAACAAACCAGGAGGTTTCTGAAGCTGTCTGTGTCACAGTCGGGCATAGCCACGGCTACCACAATGACACTGGGCAGGACAGAAACCCCATCCCAAGTCAGCCGAAGGCAGAGAGAGCAGGCAGGACACATTTAGGATCTGAGGCCACACCTGACACTCAAGCCAACAGATGTCTCCCCTCCAGGGCGCCCTGCCCTGTTCAGTGTTCCTGAGAAAACAGGGGCAGCCTGAGGGGATCCAGGGCCAGGAGATGGGTCCCCTCTACCCCGAGGAGGAGCCAGGCGGGAATCCCAGCCCCCTCCCCATTGAGGCCATCCTGCCCAGAGGGGCCCGGACCCACCCCACACACCCAGGCAGAATGTGTGCAGGCCTCAGGCTCTGTGGGTGCCGCTAGCTGGGGCTGCCAGTCCTCACCCCACACCTAAGGTGAGCCACAGCCGCCAGAGCCTCCACAGGAGACCCCACCCAGCAGCCCAGCCCCTACCCAGGAGGCCCCAGAGCTCAGGGCGCCTGGGTGGATTTTGTACAGCCCCGAGTCACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACCACAGTGAGAAAAGCTATGTCAAAAACCGTCTCCCGGCCACTGCTGGAGGCCCAGCCAGAGAAGGGACCAGCCGCCCGAACATACGACCTTCCCAGACCTCATGACCCCCAGCACTTGGAGCTCCACAGTGTCCCCATTGGATGGTGAGGATGGGGGCCGGGGCCATCTGCACCTCCCAACATCACCCCCAGGCAGCACAGGCACAAACCCCAAATCCAGAGCCGACACCAGGAACACAGACACCCCAATACCCTGGGGGACCCTGGCCCTGGTGACTTCCCACTGGGATCCACCCCCGTGTCCACCTGGATCAAAGACCCCACCGCTGTCTCTGTCCCTCACTCAGGGCCTGCTGAGGGGCGGGTGCTTTGGAGCAGACTCAGGTTTAGGGGCCACCATTGTGGGGCCCAACCTCGACCAGGACACAGATTTTTCTTTCCTGCCCTGGGGCAACACAGACTTTGGGGTCTGTGCAGGGAGGACCTTCTGGAAAGTCACCAAGCACAGAGCCCTGACTGAGGTGGTCTCAGGAAGACCCCCAGGAGGGGGCTTGTGCCCCTTCCTCTCATGTGGACCCCATGCCCCCCAAGATAGGGGCATCATGCAGGGCAGGTCCTCCATGCAGCCACCACTAGGCAACTCCCTGGCGCCGGTCCCCACTGCGCCTCCATCCCGGCTCTGGGGATGCAGCCACCATGGCCACACCAGGCAGCCCGGGTCCAGCAACCCTGCAGTGCCCAAGCCCTTGGCAGGATTCCCAGAGGCTGGAGCCCACCCCTCCTCATCCCCCCACACCTGCACACACACACCTACCCCCTGCCCAGTCCCCCTCCAGGAGGGTTGGAGCCGCCCATAGGGTGGGGGCTCCAGGTCTCACTCACTCGCTTCCCTTCCTGGGCAAAGGAGCCTCGTGCCCCGGTCCCCCCTGACGGCGCTGGGCACAGGTGTGGGTACTGGGCCCCAGGGCTCCTCCAGCCCCAGCTGCCCTGCTCTCCCTGGGAGGCCTGGGCACCACCAGACCACCAGTCCAGGGCACAGCCCCAGGGAGCCGCCCACTGCCAGCTCACAGGAAGAAGATAAGCTTCAGACCCTCAGGGCCGGGAGCTGCCTTCCTGCCACCCCTTCCTGCCCCAGACCTCCATGCCCTCCCCCAACCACTTACACACAAGCCAGGGAGCTGTTTCCACACAGTTCAACCCCAAACCAGGACGGCCTGGCACTCGGGTCACTGCCATTTCTGTCTGCATTCGCTCCCAGCGCCCCTGTGTTCCCTCCCTCCTCCCTCCTTCCTTTCTTCCTGCATTGGGTTCATGCCGCAGAGTGCCAGGTGCAGGTCAGCCCTGAGCTTGGGGTCACCTCCTCACTGAAGGCAGCCTCAGGGTGCCCAGGGGCAGGCAGGGTGGGGGTGAGGCTTCCAGCTCCAACCGCTTCGCTACCTTAGGACCGTTATAGTTAGGCGCGCCGTCGACCAATTCTCATGTTTGACAGCTTATCATCGAATTTCTACGTA
毒素编码序列
表4中阐述了用于构建如本文所述的经改造的DH区的毒素(例如μ-芋螺毒素和狼蛛毒素ProTxII)的示例性核苷酸编码序列(DNA和氨基酸(AA))。
表4
Figure BDA0003308863620000731
Figure BDA0003308863620000741
Figure BDA0003308863620000751
Figure BDA0003308863620000761
Figure BDA0003308863620000771
Figure BDA0003308863620000781
Figure BDA0003308863620000791
下文提供了用于构建经改造的DH区、包含毒素核苷酸编码序列的示例性DNA片段。
TX-DH1166(SEQ ID NO:232)包括在对应于DH1-1至DH6-6的位置中插入的毒素编码序列:
TACGTAGCCGTTTCGATCCTCCCGAATTGACTAGTGGGTAGGCCTGGCGGCCGCTGCCATTTCATTACCTCTTTCTCCGCACCCGACATAGATACCGGTGGATTCGAATTCTCCCCGTTGAAGCTGACCTGCCCAGAGGGGCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTACAGGCCCCGGTCTCTGTGGGTGTTCCGCTAACTGGGGCTCCCAGTGCTCACCCCACAACTAAAGCGAGCCCCAGCCTCCAGAGCCCCCGAAGGAGATGCCGCCCACAAGCCCAGCCCCCATCCAGGAGGCCCCAGAGCTCAGGGCGCCGGGGCGGATTTTGTACAGCCCCGAGTCACTGTGGAGAGAAGCTGCAATGGCAGACGCGGCTGCAGCAGCAGATGGAGCCGCGATCATAGCAGGTGCTGCCACAGTGAGAAAAACTGTGTCAAAAACCGTCTCCTGGCCCCTGCTGGAGGCCGCGCCAGAGAGGGGAGCAGCCGCCCCGAACCTAGGTCCTGCTCAGCTCACACGACCCCCAGCACCCAGAGCACAACGGAGTCCCCATTGAATGGTGAGGACGGGGACCAGGGCTCCAGGGGGTCATGGAAGGGGCTGGACCCCATCCTACTGCTATGGTCCCAGTGCTCCTGGCCAGAACTGACCCTACCACCGACAAGAGTCCCTCAGGGAAACGGGGGTCACTGGCACCTCCCAGCATCAACCCCAGGCAGCACAGGCATAAACCCCACATCCAGAGCCGACTCCAGGAGCAGAGACACCCCAGTACCCTGGGGGACACCGACCCTGATGACTCCCCACTGGAATCCACCCCAGAGTCCACCAGGACCAAAGACCCCGCCCCTGTCTCTGTCCCTCACTCAGGACCTGCTGCGGGGCGGGCCATGAGACCAGACTCGGGCTTAGGGAACACCACTGTGGCCCCAACCTCGACCAGGCCACAGGCCCTTCCTTCCTGCCCTGCGGCAGCACAGACTTTGGGGTCTGTGCAGAGAGGAATCACAGAGGCCCCAGGCTGAGGTGGTGGGGGTGGAAGACCCCCAGGAGGTGGCCCACTTCCCTTCCTCCCAGCTGGAACCCACCATGACCTTCTTAAGATAGGGGTGTCATCCGAGGCAGGTCCTCCATGGAGCTCCCTTCAGGCTCCTCCCCGGTCCTCACTAGGCCTCAGTCCCGGCTGCGGGAATGCAGCCACCACAGGCACACCAGGCAGCCCAGACCCAGCCAGCCTGCAGTGCCCAAGCCCACATTCTGGAGCAGAGCAGGCTGTGTCTGGGAGAGTCTGGGCTCCCCACCGCCCCCCCGCACACCCCACCCACCCCTGTCCAGGCCCTATGCAGGAGGGTCAGAGCCCCCCATGGGGTATGGACTTAGGGTCTCACTCACGTGGCTCCCCTCCTGGGTGAAGGGGTCTCATGCCCAGATCCCCACAGCAGAGCTGGTCAAAGGTGGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGACCCTCAGGCTCCTCTAGCCCTGGCTGCCCTGCTGTCCCTGGGAGGCCTGGACTCCACCAGACCACAGGTCCAGGGCACCGCCCATAGGTGCTGCCCACACTCAGTTCACAGGAAGAAGATAAGCTCCAGACCCCCAAGACTGGGACCTGCCTTCCTGCCACCGCTTGTAGCTCCAGACCTCCGTGCCTCCCCCGACCACTTACACACGGGCCAGGGAGCTGTTCCACAAAGATCAACCCCAAACCGGGACCGCCTGGCACTCGGGCCGCTGCCACTTCCCTCTCCATTTGTTCCCAGCACCTCTGTGCTCCCTCCCTCCTCCCTCCTTCAGGGGAACAGCCTGTGCAGCCCCTCCCTGCACCCCACACCCTGGGGAGGCCCAACCCTGCCTCCAGCCCTTTCTCCCCCGCTGCTCTTCCTGCCCATCCAGACAACCCTGGGGTCCCATCCCTGCAGCCTACACCCTGGTCTCCACCCAGACCCCTGTCTCTCCCTCCAGACACCCCTCCCAGGCCAACCCTGCACATGCAGGCCCTCCCCTTTTCTGCTGCCAGAGCCTCAGTTTCTACCCTCTGTGCCTACCCCCTGCCTCCTCCTGCCCACAACTCGAGCTCTTCCTCTCCTGGGGCCCCTGAGCCATGGCACTGACCGTGCACTCCCACCCCCACACTGCCCATGCCCTCACCTTCCTCCTGGACACTCTGACCCCGCTCCCCTCTTGGACCCAGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTCCCCATGCAGGCCCTTGCCCTCACTGCCCGGTTACACGGCAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCACCCTGATGCACGTCCGCCTGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCGGCACTCCCTGTAAAGACGAGGGATCCAGGCAGCAACATCATGGGAGAATGCAGGGCTCCCAGACAGCCCAGCCCTCTCGCAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACTGAACAGCCACGGAGCCCGCTGGATAGTAACTGAGTCAGTGACCGACCTGGAGGGCAGGGGAGCAGTGAACCGGAGCCCAGACCATAGGGACAGAGACCAGCCGCTGACATCCCGAGCCCCTCACTGGCGGCCCCAGAACACCGCGTGGAAACAGAACAGACCCACATTCCCACCTGGAACAGGGCAGACACTGCTGAGCCCCCAGCACCAGCCCTGAGAAACACCAGGCAACGGCATCAGAGGGGGCTCCTGAGAAAGAAAGGAGGGGAGGTCTCCTTCACCAGCAAGTACTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTGTACAGCACTGGGCTCAGAGTCCTCTCCCACACACCCTGAGTTTCAGACAAAAACCCCCTGGAAATCATAGTATCAGCAGGAGAACTAGCCAGAGACAGCAAGAGGGGACTCAGTGACTCCCGCGGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGAGGATATTGTAGCAGCAGATGGTGCTATACCCACAGTGACACAGCCCCATTCAAAAACCCCTGCTGTAAACGCTTCCACTTCTGGAGCTGAGGGGCTGGGGGGAGCGTCTGGGAAGTAGGGCCTAGGGGTGGCCATCAATGCCCAAAACGCACCAGACTCCCCCCCAGACATCACCCCACTGGCCAGTGAGCAGAGTAAACAGAAAATGAGAAGCAGCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGCAAGAGGGGATGCGGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGATAGTTCCATAAACTGGTGTTCAAGATCGATGGCTGGGAGTGAGCCCAGGAGGACAGTGTGGGAAGGGCACAGGGAAGGAGAAGCAGCCGCTATCCTACACTGTCATCTTTCAAGAGTTTGCCCTGTGCCCACAATGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAAATGGATTTGCAGCACAGATCTGAATAAATTCTCCAGAATGTGGAGCCACACAGAAGCAAGCACAAGGAAAGTGCCTGATGCAAGGGCAAAGTACAGTGTGTACCTTCAGGCTGGGCACAGACACTCTGAAAAGCCTTGGCAGGAACTCCCTGCAACAAAGCAGAGCCCTGCAGGCAATGCCAGCTCCAGAGCCCTCCCTGAGAGCCTCATGGGCAAAGATGTGCACAACAGGTGTTTCTCATAGCCCCAAACTGAGAATGAAGCAAACAGCCATCTGAAGGAAAACAGGCAAATAAACGATGGCAGGTTCATGAAATGCAAACCCAGACAGCCAGAAGGACAACAGTGAGGGTTACAGGTGACTCTGTGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAAAGGAAAGTCCAAAAAATACTTTCAATGTGATTTCTTCTAAATAAAATTTACAGCCGGCAAAATGAACTATCTTCTTAAGGGATAAACTTTCCACTAGGAAAACTATAAGGAAAATCAAGAAAAGGATGATCACATAAACACAGTGGTCGTTACTTCTACTGGGGAAGGAAGAGGGTATGAACTGAGACACACAGGGTTGGCAAGTCTCCTAACAAGAACAGAACAAATACATTACAGTACCTTGAAAACAGCAGTTAAAATTCTAAATTGCAAGAAGAGGAAAATGCACACAGCTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAACGATGACACAGGCAATTGCACAATGATACAGACATACATTCAGTATATGAGACATTGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATATGTGGTGGCACTCACCTCCCTGGGCATCCCCGGACAGGCTGCAGGCACACTGTGTGGCAGGGCAGGCTGGTACCTGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAGGCACAGAGCCGTATCCCCCCGAGGACATATACCCCCAAGGACGGCACAGTTGGTACATTCCGGAGACAAGCAACTCAGCCACACTCCCAGGCCAGAGCCCGAGAGGGACGCCCATGCACAGGGAGGCAGAGCCCAGCTCCTCCACAGCCAGCAGCACCCGTGCAGGGGCCGCCATCTGGCAGGCACAGAGCATGGGCTGGGAGGAGGGGCAGGGACACCAGGCAGGGTTGGCACCAACTGAAAATTACAGAAGTCTCATACATCTACCTCAGCCTTGCCTGACCTGGGCCTCACCTGACCTGGACCTCACCTGGCCTGGACCTCACCTGGCCTAGACCTCACCTCTGGGCTTCACCTGAGCTCGGCCTCACCTGACTTGGACCTTGCCTGTCCTGAGCTCACATGATCTGGGCCTCACCTGACCTGGGTTTCACCTGACCTGGGCTTCACCTGACCTGGGCCTCATCTGACCTGGGCCTCACTGGCCTGGACCTCACCTGGCCTGGGCTTCACCTGGCCTCAGGCCTCATCTGCACCTGCTCCAGGTCTTGCTGGAACCTCAGTAGCACTGAGGCTGCAGGGGCTCATCCAGGGTTGCAGAATGACTCTAGAACCTCCCACATCTCAGCTTTCTGGGTGGAGGCACCTGGTGGCCCAGGGAATATAAAAAGCCTGAATGATGCCTGCGTGATTTGGGGGCAATTTATAAACCCAAAAGGACATGGCCATGCAGCGGGTAGGGACAATACAGACAGATATCAGCCTGAAATGGAGCCTCAGGGCACAGGTGGGCACGGACACTGTCCACCTAAGCCAGGGGCAGACCCGAGTGTCCCCGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGTGCCCTGCTACCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTACGATTGCAACTGCAGCAGATGGCGCGACCATAGCAGGTGCTGCTATTATACCCACAGTGTCACAGAGTCCATCAAAAACCCATCCCTGGGAACCTTCTGCCACAGCCCTCCCTGTGGGGCACCGCCGCGTGCCATGTTAGGATTTTGACTGAGGACACAGCACCATGGGTATGGTGGCTACCGCAGCAGTGCAGCCCGTGACCCAAACACACAGGGCAGCAGGCACAACAGACAAGCCCACAAGTGACCACCCTGAGCTCCTGCCTGCCAGCCCTGGAGACCATGAAACAGATGGCCAGGATTATCCCATAGGTCAGCCAGACCTCAGTCCAACAGGTCTGCATCGCTGCTGCCCTCCAATACCAGTCCGGATGGGGACAGGGCTGGCCCACATTACCATTTGCTGCCATCCGGCCAACAGTCCCAGAAGCCCCTCCCTCAAGGCTGGGCCACATGTGTGGACCCTGAGAGCCCCCCATGTCTGAGTAGGGGCACCAGGAAGGTGGGGCTGGCCCTGTGCACTGTCCCTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGGGCCTCTCCTGGGTCATTTCCAAGACAGAAGACATTCCCAGGACAGCTGGAGCTGGGAGTCCATCATCCTGCCTGGCCGTCCTGAGTCCTGCGCCTTTCCAAACCTCACCCGGGAAGCCAACAGAGGAATCACCTCCCACAGGCAGAGACAAAGACCTTCCAGAAATCTCTGTCTCTCTCCCCAGTGGGCACCCTCTTCCAGGGCAGTCCTCAGTGATATCACAGTGGGAACCCACATCTGGATCGGGACTGCCCCCAGAACACAAGATGGCCCACAGGGACAGCCCCACAGCCCAGCCCTTCCCAGACCCCTAAAAGGCGTCCCACCCCCTGCATCTGCCCCAGGGCTCAAACTCCAGGAGGACTGACTCCTGCACACCCTCCTGCCAGACATCACCTCAGCCCCTCCTGGAAGGGACAGGAGCGCGCAAGGGTGAGTCAGACCCTCCTGCCCTCGATGGCAGGCGGAGAAGATTCAGAAAGGTCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGCGTGGGAAAGGCCTCTGGGCACACTCAGGGGGATTTTGTGAAGGGTCCTCCCACTGTGGAGAGGCTTAGCTGTGGCTTCCCTAAGAGCTGCCGCAGCAGGCAAAGCAAGCCTCACAGATGCTGCCACAGTGATGAACCCAGCATCAAAAACCGACCGGACTCCCAAGGTTTATGCACACTTCTCCGCTCAGAGCTCTCCAGGATCAGAAGAGCCGGGCCCAAGGGTTTCTGCCCAGACCCTCGGCCTCTAGGGACATCTTGGCCATGACAGCCCATGGGCTGGTGCCCCACACATCGTCTGCCTTCAAACAAGGGCTTCAGAGGGCTCTGAGGTGACCTCACTGATGACCACAGGTGCCCTGGCCCCTTCCCCACCAGCTGCACCAGACCCCGTCATGACAGATGCCCCGATTCCAACAGCCAATTCCTGGGGCCAGGAATCGCTGTAGACACCAGCCTCCTTCCAACACCTCCTGCCAATTGCCTGGATTCCCATCCCGGTTGGAATCAAGAGGACAGCATCCCCCAGGCTCCCAACAGGCAGGACTCCCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGTAGGGCCAGGCTGCAGACAGTCCCCCTCACCTGCCACTAGACAAATGCCTGCTGTAGATGTCCCCACCTGGAAAATACCACTCATGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGAGTCTCTGAGGCCCCTAAGAAGTAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCTGACAGGAGTGGACGCTGGAGCTGGGCCCATACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACTGTGCATGTCTGGTCCCTGAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCTCTATTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGTCACACTGTGTACAGCCAGAAGTGGATGTGGACTTGCGATAGTGAGAGGAAGTGCAGTGAGGGTATGGTATGCCGGCTGTGGTGTAAGAAGAAGCTCTGGCACAGTGGTGCTGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGTGCAGCCCCAGGCCTCCAGCTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTTTTCTGCACTCTCCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGATCTGTTCTCAACATCCCACGGCCTCATTCCTGCAAGGAAGGCCAATGGATGGGCAACCTCACATGCCGCGGCTAAGATAGGGTGGGCAGCCTGGCGGGGACAGGACATCCTGCTGGGGTATCTGTCACTGTGCCTAGTGGGGCACTGGCTCCCAAACAACGCAGTCCTTGCCAAAATCCCCACGGCCTCCCCCGCTAGGGGCTGGCCTGATCTCCTGCAGTCCTAGGAGGCTGCTGACCTCCAGAATGGCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCCGGCTGCAGACTGGGAGGCCACCCCCTCCTTCCCAGGGTTCACTGCAGGTGACCAGGGCAGGAAATGGCCTGAACACAGGGATAACCGGGCCATCCCCCAACAGAGTCCACCCCCTCCTGCTCTGTACCCCGCACCCCCCAGGCCAGCCCATGACATCCGACAACCCCACACCAGAGTCACTGCCCGGTGCTGCCCTAGGGAGGACCCCTCAGCCCCCACCCTGTCTAGAGGACTGGGGAGGACAGGACACGCCCTCTCCTTATGGTTCCCCCACCTGGCTCTGGCTGGGACCCTTGGGGTGTGGACAGAAAGGACGCTTGCCTGATTGGCCCCCAGGAGCCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACCCCATGGGAATCCAGAATCCCCAGGAAGCCATCAGGAAGGGCTGAGGGAGGAAGTGGGGCCACTGCACCACCAGGCAGGAGGCTCTGTCTTTGTGAACCCAGGGAGGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTATGGCTCCCACAGTGGCAGGCTGCAGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCCGCGGGTGCTCCATCTTGGATGAGCCTATCTCTCTCACCCACGGACTCGCCCACCTCCTCTTCACCCTGGCCACACGTCGTCCACACCATCCTAAGTCCCACCTACACCAGAGCCGGCACAGCCAGTGCAGACAGAGGCTGGGGTGCAGGGGGGCCGACTGGGCAGCTTCGGGGAGGGAGGAATGGAGGAAGGGGAGTTCAGTGAAGAGGCCCCCCTCCCCTGGGTCCAGGATCCTCCTCTGGGACCCCCGGATCCCATCCCCTCCAGGCTCTGGGAGGAGAAGCAGGATGGGAGAATCTGTGCGGGACCCTCTCACAGTGGAATACCTCCACAGCGGCTCAGGCCAGATACAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTGCTGGGCCTGGGGGCAGCCGCTCCCACACAGGATGAACCCAGCACCCCGAGGATGTCCTGCCAGGGGGAGCTCAGAGCCATGAAGGAGCAGGATATGGGACCCCCGATACAGGCACAGACCTCAGCTCCATTCAGGACTGCCACGTCCTGCCCTGGGAGGAACCCCTTTCTCTAGTCCCTGCAGGCCAGGAGGCAGCTGACTCCTGACTTGGACGCCTATTCCAGACACCAGACAGAGGGGCAGGCCCCCCAGAACCAGGGATGAGGACGCCCCGTCAAGGCCAGAAAAGACCAAGTTGCGCTGAGCCCAGCAAGGGAAGGTCCCCAAACAAACCAGGAGGATTTTGTAGGTGTCTGTGTCACTGTGAGCTGCAACTGCAGCAGCAAATGGAGCCGCGACCATAGCAGGTGCTGCCACAGTGACACTCGCCAGGTCAAAAACCCCATCCCAAGTCAGCGGAATGCAGAGAGAGCAGGGAGGACATGTTTAGGATCTGAGGCCGCACCTGACACCCAGGCCAGCAGACGTCTCCTGTCCACGGCACCCTGCCATGTCCTGCATTTCTGGAAGAACAAGGGCAGGCTGAAGGGGGTCCAGGACCAGGAGATGGGTCCGCTCTACCCAGAGAAGGAGCCAGGCAGGACACAAGCCCCCACGCGTGGGCTCGTAGTTTGACGTGCGTGAAGTGTGGGTAAGAAAGTACGTA
TX-DH17613(SEQ ID NO:233)包括在对应于DH1-7至DH6-13的位置中插入的毒素编码序列:
GCGGCCGCTGCCATTTCATTACCTCTTTCTCCGCACCCGACATAGATTACGTAACGCGTGGGCTCGTAGTTTGACGTGCGTGAAGTGTGGGTAAGAAAGTCCCCATTGAGGCTGACCTGCCCAGAGGGTCCTGGGCCCACCCAACACACCGGGGCGGAATGTGTGCAGGCCTCGGTCTCTGTGGGTGTTCCGCTAGCTGGGGCTCACAGTGCTCACCCCACACCTAAAACGAGCCACAGCCTCCGGAGCCCCTGAAGGAGACCCCGCCCACAAGCCCAGCCCCCACCCAGGAGGCCCCAGAGCACAGGGCGCCCCGTCGGATTTTGTACAGCCCCGAGTCACTGTGGAGAGATGCAATGGCAGACGCGGCTGCAGCAGATGGCGCGATCATAGCAGGTGCTGCCACAGTGAGAAAAGCTTCGTCAAAAACCGTCTCCTGGCCACAGTCGGAGGCCCCGCCAGAGAGGGGAGCAGCCACCCCAAACCCATGTTCTGCCGGCTCCCATGACCCCGTGCACCTGGAGCCCCACGGTGTCCCCACTGGATGGGAGGACAAGGGCCGGGGGCTCCGGCGGGTCGGGGCAGGGGCTTGATGGCTTCCTTCTGCCGTGGCCCCATTGCCCCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAGAGTCAGGGATCAGTGGCACCTCCCAACATCAACCCCACGCAGCCCAGGCACAAACCCCACATCCAGGGCCAACTCCAGGAACAGAGACACCCCAATACCCTGGGGGACCCCGACCCTGATGACTCCCGTCCCATCTCTGTCCCTCACTTGGGGCCTGCTGCGGGGCGAGCACTTGGGAGCAAACTCAGGCTTAGGGGACACCACTGTGGGCCTGACCTCGAGCAGGCCACAGACCCTTCCCTCCTGCCCTGGTGCAGCACAGACTTTGGGGTCTGGGCAGGGAGGAACTTCTGGCAGGTCACCAAGCACAGAGCCCCCAGGCTGAGGTGGCCCCAGGGGGAACCCCAGCAGGTGGCCCACTACCCTTCCTCCCAGCTGGACCCCATGTCTTCCCCAAGATAGGGGTGCCATCCAAGGCAGGTCCTCCATGGAGCCCCCTTCAGGCTCCTCTCCAGACCCCACTGGGCCTCAGTCCCCACTCTAGGAATGCAGCCACCACGGGCACACCAGGCAGCCCAGGCCCAGCCACCCTGCAGTGCCCAAGCCCACACCCTGGAGGAGAGCAGGGTGCGTCTGGGAGGGGCTGGGCTCCCCACCCCCACCCCCACCTGCACACCCCACCCACCCTTGCCCGGGCCCCCTGCAGGAGGGTCAGAGCCCCCATGGGATATGGACTTAGGGTCTCACTCACGCACCTCCCCTCCTGGGAGAAGGGGTCTCATGCCCAGATCCCCCCAGCAGCGCTGGTCACAGGTAGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGCCCCTCAGGCTCCTCTAGCCCTGGCTGCCCTGCTGTCCCTGGGAGGCCTGGGCTCCACCAGACCACAGGTCTAGGGCACCGCCCACACTGGGGCCGCCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCCAGGCCCGGGACCTGCCTTGCTGCTACGACTTCCTGCCCCAGACCTCGTTGCCCTCCCCCGTCCACTTACACACAGGCCAGGAAGCTGTTCCCACACAGACCAACCCCAGACGGGGACCACCTGGCACTCAGGTCACTGCCATTTCCTTCTCCATTCACTTCCAATGCCTCTGTGCTTCCTCCCTCCTCCTTCCTTCGGGGGAGCACCCTGTGCAGCTCCTCCCTGCAGTCCACACCCTGGGGAGACCCGACCCTGCAGCCCACACCCTGGGGAGACCTGACCCTCCTCCAGCCCTTTCTCCCCCGCTGCTCTTGCCACCCACCAAGACAGCCCTGGGGTCCTGTCCCTACAGCCCCCACCCAGTTCTCTACCTAGACCCGTCTTCCTCCCTCTAAACACCTCTCCCAGGCCAACCCTACACCTGCAGGCCCTCCCCTCCACTGCCAAAGACCCTCAGTTTCTCCTGCCTGTGCCCACCCCCGTGCTCCTCCTGCCCACAGCTCGAGCTCTTCCTCTCCTAGGGCCCCTGAGGGATGGCATTGACCGTGCCCTCGCACCCACACACTGCCCATGCCCTCACATTCCTCCTGGCCACTCCAGCCCCACTCCCCTCTCAGGCCTGGCTCTGGTATTTCTGGGACAAAGCCTTACCCAAGTCTTTCCCATGCAGGCCTGGGCCCTTACCCTCACTGCCCGGTTACAGGGCAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCGCCTTGACACACGTCTGCCTGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCGGCACTCCCTCTAAAGACGAGGGATCCAGGCAGCAGCATCACAGGAGAATGCAGGGCTACCAGACATCCCAGTCCTCTCACAGGCCTCTCCTGGGAAGAGACCTGAAGACGCCCAGTCAACGGAGTCTAACACCAAACCTCCCTGGAGGCCGATGGGTAGTAACGGAGTCATTGCCAGACCTGGAGGCAGGGGAGCAGTGAGCCCGAGCCCACACCATAGGGCCAGAGGACAGCCACTGACATCCCAAGCCACTCACTGGTGGTCCCACAACACCCCATGGAAAGAGGACAGACCCACAGTCCCACCTGGACCAGGGCAGAGACTGCTGAGACCCAGCACCAGAACCAACCAAGAAACACCAGGCAACAGCATCAGAGGGGGCTCTGGCAGAACAGAGGAGGGGAGGTCTCCTTCACCAGCAGGCGCTTCCCTTGACCGAAGACAGGATCCATGCAACTCCCCCAGGACAAAGGAGGAGCCCCTTGTTCAGCACTGGGCTCAGAGTCCTCTCCAAGACACCCAGAGTTTCAGACAAAAACCCCCTGGAATGCACAGTCTCAGCAGGAGAGCCAGCCAGAGCCAGCAAGATGGGGCTCAGTGACACCCGCAGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGAGGATATTGTACTAATCGGAGCAGGCAGGGTGTATGCTATACCCACAGTGACACAGCCCCATTCAAAAACCCCTACTGCAAACGCATTCCACTTCTGGGGCTGAGGGGCTGGGGGAGCGTCTGGGAAATAGGGCTCAGGGGTGTCCATCAATGCCCAAAACGCACCAGACTCCCCTCCATACATCACACCCACCAGCCAGCGAGCAGAGTAAACAGAAAATGAGAAGCAAGCTGGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGTAAGAGGGGATGCGGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTGTTCGAGATCAATGGCTGGGAGTGAGCCCAGGAGGACAGCGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTCGAAAGTTTGCCTTGTGCCCACACTGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAGATGGATTTGCAGCACAGATCTGAATAAATTCTCCAGAATGTGGAGCAGCACAGAAGCAAGCACACAGAAAGTGCCTGATGCAAGGACAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCCCTGGCAGGAACTCCCTGTGACAAAGCAGAACCCTCAGGCAATGCCAGCCCCAGAGCCCTCCCTGAGAGCCTCATGGGCAAAGATGTGCACAACAGGTGTTTCTCATAGCCCCAAACTGAGAGCAAAGCAAACGTCCATCTGAAGGAGAACAGGCAAATAAACGATGGCAGGTTCATGAAATGCAAACCCAGACAGCCACAAGCACAAAAGTACAGGGTTATAAGCGACTCTGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAAAGTAAACTCCAAAAAATACTTTCAATGTGATTTCTTCTAAATAAAATTTACACCCTGCAAAATGAACTGTCTTCTTAAGGGATACATTTCCCAGTTAGAAAACCATAAAGAAAACCAAGAAAAGGATGATCACATAAACACAGTGGTGGTTACTTCTGCTGGGGAAGGAAGAGGGTATGAACTGAGATACACAGGGTGGGCAAGTCTCCTAACAAGAACAGAACGAATACATTACAGTACCTTGAAAACAGCAGTTAAACTTCTAAATTGCAAGAAGAGGAAAATGCACACAGTTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTCGGATAAATAAGCGATGACACAGGCAATTGCACAATGATACAGACATATATTTAGTATATGAGACATCGATGATGTATCCCCAAATAAACGACTTTAAAGAGATAAAGGGCTGATGTGTGGTGGCATTCACCTCCCTGGGATCCCCGGACAGGTTGCAGGCTCACTGTGCAGCAGGGCAGGCGGGTACCTGCTGGCAGTTCCTGGGGCCTGATGTGGAGCAAGCGCAGGGCCATATATCCCGGAGGACGGCACAGTCAGTGAATTCCAGAGAGAAGCAACTCAGCCACACTCCCCAGGCAGAGCCCGAGAGGGACGCCCACGCACAGGGAGGCAGAGCCCAGCACCTCCGCAGCCAGCACCACCTGCGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGACGCCTCACACATCCACCTCAGCCTCCCCTGACCTGGACCTCACTGGCCTGGGCCTCACTTAACCTGGGCTTCACCTGACCTTGGCCTCACCTGACTTGGACCTCGCCTGTCCCAAGCTTTACCTGACCTGGGCCTCAACTCACCTGAACGTCTCCTGACCTGGGTTTAACCTGTCCTGGAACTCACCTGGCCTTGGCTTCCCCTGACCTGGACCTCATCTGGCCTGGGCTTCACCTGGCCTGGGCCTCACCTGACCTGGACCTCATCTGGCCTGGACCTCACCTGGCCTGGACTTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCGGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAGCCTGAGTAGCACTGAGGGTGCAGAAGCTCATCCAGGGTTGGGGAATGACTCTAGAAGTCTCCCACATCTGACCTTTCTGGGTGGAGGCAGCTGGTGGCCCTGGGAATATAAAAATCTCCAGAATGATGACTCTGTGATTTGTGGGCAACTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACATAGGGACAGATGCCAGCCTGAGGTGGAGCCTCAGGACACAGGTGGGCACGGACACTATCCACATAAGCGAGGGATAGACCCGAGTGTCCCCACAGCAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCAGAGCCCTGCTGCCTCCTCCGGTCAGCCCTGGACATCCCAGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTACGATTGCAACTGCAGCAGATGGGCTCGCGACCATAGCAGGTGCTGCTATTATAACCACAGTGTCACAGAGTCCATCAAAAACCCATGCCTGGAAGCTTCCCGCCACAGCCCTCCCCATGGGGCCCTGCTGCCTCCTCAGGTCAGCCCCGGACATCCCGGGTTTCCCCAGGCTGGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTACTATGAGAGATGCAATGGCAGACGCGGCTGCAGCAGATGGCGCGATCATAGCAGGTGCTGCTATTATAACCACAGTGTCACAGAGTCCATCAAAAACCCATCCCTGGGAGCCTCCCGCCACAGCCCTCCCTGCAGGGGACCGGTACGTGCCATGTTAGGATTTTGATCGAGGAGACAGCACCATGGGTATGGTGGCTACCACAGCAGTGCAGCCTGTGACCCAAACCCGCAGGGCAGCAGGCACGATGGACAGGCCCGTGACTGACCACGCTGGGCTCCAGCCTGCCAGCCCTGGAGATCATGAAACAGATGGCCAAGGTCACCCTACAGGTCATCCAGATCTGGCTCCGAGGGGTCTGCATCGCTGCTGCCCTCCCAACGCCAGTCCAAATGGGACAGGGACGGCCTCACAGCACCATCTGCTGCCATCAGGCCAGCGATCCCAGAAGCCCCTCCCTCAAGGCTGGGCACATGTGTGGACACTGAGAGCCCTCATATCTGAGTAGGGGCACCAGGAGGGAGGGGCTGGCCCTGTGCACTGTCCCTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGAGCCTCTCCTGGGTCATTTCCAAGACAGAAGACATTCCTGGGGACAGCCGGAGCTGGGCGTCGCTCATCCTGCCCGGCCGTCCTGAGTCCTGCTCATTTCCAGACCTCACCGGGGAAGCCAACAGAGGACTCGCCTCCCACATTCAGAGACAAAGAACCTTCCAGAAATCCCTGCCTCTCTCCCCAGTGGACACCCTCTTCCAGGACAGTCCTCAGTGGCATCACAGCGGCCTGAGATCCCCAGGACGCAGCACCGCTGTCAATAGGGGCCCCAAATGCCTGGACCAGGGCCTGCGTGGGAAAGGCCTCTGGCCACACTCGGGGATTTTGTGAAGGGCCCTCCCACTGTGGAGAGGCTTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAAAGCCTCACAGATGCTGCCACAGTGATGAACCCAGTGTCAAAAACCGGCTGGAAACCCAGGGGCTGTGTGCACGCCTCAGCTTGGAGCTCTCCAGGAGCACAAGAGCCGGGCCCAAGGATTTGTGCCCAGACCCTCAGCCTCTAGGGACACCTGGGTCATCTCAGCCTGGGCTGGTGCCCTGCACACCATCTTCCTCCAAATAGGGGCTTCAGAGGGCTCTGAGGTGACCTCACTCATGACCACAGGTGACCTGGCCCTTCCCTGCCAGCTATACCAGACCCTGTCTTGACAGATGCCCCGATTCCAACAGCCAATTCCTGGGACCCTGAATAGCTGTAGACACCAGCCTCATTCCAGTACCTCCTGCCAATTGCCTGGATTCCCATCCTGGCTGGAATCAAGAAGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCGCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCCTGGACAGTTCCCCTCACCTGCCACTAGAGAAACACCTGCCATTGTCGTCCCCACCTGGAAAAGACCACTCGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGACAGTCCTCGAGGCCCCTAAGAAGGAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACGCTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGAGACACTGTGCATGTCTGGTACCTAAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCTCAGCTGTCTGGGCCCTCCCTGCTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGCGATGTCACACTGTGTACTGCCAGAAGTGGATGTGGACTAGCGATAGTGAGAGGAAGTGCTGTGAGGGTATGGTAAGCCGGCTGTGGTGTAAGAAGAAGCTCTGGCACAGTGGTGCCGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGCGCAGCCCCAGGCATCCACTTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTCTGTCCTCTGGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTGCTCCAGGGCAGGGATGATTGAGATAGAAATCAAAGGCTGGCAGGGAAAGGCAGCTTCCCGCCCTGAGAGGTGCAGGCAGCACCACGGAGCCACGGAGTCACAGAGCCACGGAGCCCCCATTGTGGGCATTTGAGAGTGCTGTGCCCCCGGCAGGCCCAGCCCTGATGGGGAAGCCTGTCCCATCCCACAGCCCGGGTCCCACGGGCAGCGGGCACAGAAGCTGCCAGGTTGTCCTCTATGATCCTCATCCCTCCAGCAGCATCCCCTCCACAGTGGGGAAACTGAGGCTTGGAGCACCACCCGGCCCCCTGGAAATGAGGCTGTGAGCCCAGACAGTGGGCCCAGAGCACTGTGAGTACCCCGGCAGTACCTGGCTGCAGGGATCAGCCAGAGATGCCAAACCCTGAGTGACCAGCCTACAGGAGGATCCGGCCCCACCCAGGCCACTCGATTAATGCTCAACCCCCTGCCCTGGAGACCTCTTCCAGTACCACCAGCAGCTCAGCTTCTCAGGGCCTCATCCCTGCAAGGAAGGTCAAGGGCTGGGCCTGCCAGAAACACAGCACCCTCCCTAGCCCTGGCTAAGACAGGGTGGGCAGACGGCTGTGGACGGGACATATTGCTGGGGCATTTCTCACTGTCACTTCTGGGTGGTAGCTCTGACAAAAACGCAGACCCTGCCAAAATCCCCACTGCCTCCCGCTAGGGGCTGGCCTGGAATCCTGCTGTCCTAGGAGGCTGCTGACCTCCAGGATGGCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCAGGCTGTAGGCTGGGAGGCCACCCCTGCCCTTGCCGGGGTTGAATGCAGGTGCCCAAGGCAGGAAATGGCATGAGCACAGGGATGACCGGGACATGCCCCACCAGAGTGCGCCCCTTCCTGCTCTGCACCCTGCACCCCCCAGGCCAGCCCACGACGTCCAACAACTGGGCCTGGGTGGCAGCCCCACCCAGACAGGACAGACCCAGCACCCTGAGGAGGTCCTGCCAGGGGGAGCTAAGAGCCATGAAGGAGCAAGATATGGGGCCCCCGATACAGGCACAGATGTCAGCTCCATCCAGGACCACCCAGCCCACACCCTGAGAGGAACGTCTGTCTCCAGCCTCTGCAGGTCGGGAGGCAGCTGACCCCTGACTTGGACCCCTATTCCAGACACCAGACAGAGGCGCAGGCCCCCCAGAACCAGGGTTGAGGGACGCCCCGTCAAAGCCAGACAAAACCAAGGGGTGTTGAGCCCAGCAAGGGAAGGCCCCCAAACAGACCAGGAGGATTTTGTAGGTGTCTGTGTCACTGTGTGCAACTGCAGCAGATGGCGCGACCATAGCAGGTGCTGCCACAGTGACACTCACCCAGTCAAAAACCCCATTCCAAGTCAGCGGAAGCAGAGAGAGCAGGGAGGACACGTTTAGGATCTGAGACTGCACCTGACACCCAGGCCAGCAGACGTCTCCCCTCCAGGGCACCCCACCCTGTCCTGCATTTCTGCAAGATCAGGGGCGGCCTGAGGGGGGGTCTAGGGTGAGGAGATGGGTCCCCTGTACACCAAGGAGGAGTTAGGCAGGTCCCGAGCACTCTTAATTAAACGACGCCTCGAATGGAACTACTACAACGAATGGTTGCTCTACGTAATGCATTCGCTACCTTAGGACCGTTATAGTTAGGCGCGCC
TX-DH114619(SEQ ID NO:234)包括在对应于DH1-14至DH6-19的位置中插入的毒素编码序列:
TACGTATTAATTAAACGACGCCTCGAATGGAACTACTACAACGAATGGTTGCTCTCCCCATTGAGGCTGACCTGCCCAGAGAGTCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTGCAGGCCTCGGTCTCTGTGGGTGTTCCGCTAGCTGGGGCTCACAGTGCTCACCCCACACCTAAAATGAGCCACAGCCTCCGGAGCCCCCGCAGGAGACCCCGCCCACAAGCCCAGCCCCCACCCAGGAGGCCCCAGAGCTCAGGGCGCCCCGTCGGATTTTGTACAGCCCCGAGTCACTGTGGAGAGATGCTGCAATGGCAGACGCGGCTGCAGCAGCAGATGGTGCCGCGATCATAGCAGGTGCTGCCACAGTGAGAATAGCTACGTCAAAAACCGTCCAGTGGCCACTGCCGGAGGCCCCGCCAGAGAGGGCAGCAGCCACTCTGATCCCATGTCCTGCCGGCTCCCATGACCCCCAGCACGCGGAGCCCCACAGTGTCCCCACTGGATGGGAGGACAAGAGCTGGGGATTCCGGCGGGTCGGGGCAGGGGCTTGATCGCATCCTTCTGCCGTGGCTCCAGTGCCCCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAGAGACAGGCATCACCGGCGCCTCCCAACATCAACCCCAGGCAGCACAGGCACAAACCCCACATCCAGAGCCAACTCCAGGAGCAGAGACACCCCAATACCCTGGGGGACCCCGACCCTGATGACTTCCCACTGGAATTCGCCGTAGAGTCCACCAGGACCAAAGACCCTGCCTCTGCCTCTGTCCCTCACTCAGGACCTGCTGCCGGGCGAGGCCTTGGGAGCAGACTTGGGCTTAGGGGACACCAGTGTGACCCCGACCTTGACCAGGACGCAGACCTTTCCTTCCTTTCCTGGGGCAGCACAGACTTTGGGGTCTGGGCCAGGAGGAACTTCTGGCAGGTCGCCAAGCACAGAGGCCACAGGCTGAGGTGGCCCTGGAAAGACCTCCAGGAGGTGGCCACTCCCCTTCCTCCCAGCTGGACCCCATGTCCTCCCCAAGATAAGGGTGCCATCCAAGGCAGGTGCTCCTTGGAGCCCCATTCAGACTCCTCCCTGGACCCCACTGGGCCTCAGTCCCAGCTCTGGGGATGAAGCCACCACAAGCACACCAGGCAGCCCAGGCCCAGCCACCCTGCAGTGCCCAAGCACACACTCTGGAGCAGAGCAGGGTGCCTCTGGGAGGGGCTGAGCTCCCCACCCCACCCCCACCTGCACACCCCACCCACCCCTGCCCAGCGGCTCTGCAGGAGGGTCAGAGCCCCACATGGGGTATGGACTTAGGGTCTCACTCACGTGGCTCCCATCATGAGTGAAGGGGCCTCAAGCCCAGGTTCCCACAGCAGCGCCTGTCGCAAGTGGAGGCAGAGGCCCGAGGGCCACCCTGACCTGGTCCCTGAGGTTCCTGCAGCCCAGGCTGCCCTGCTGTCCCTGGGAGGCCTGGGCTCCACCAGACCACAGGTCCAGGGCACCGGGTGCAGGAGCCACCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCCAGGGCCAGAACCTGCCTTCCTGCTACTGCTTCCTGCCCCAGACCTGGGCGCCCTCCCCCGTCCACTTACACACAGGCCAGGAAGCTGTTCCCACACAGAACAACCCCAAACCAGGACCGCCTGGCACTCAGGTGGCTGCCATTTCCTTCTCCATTTGCTCCCAGCGCCTCTGTCCTCCCTGGTTCCTCCTTCGGGGGAACAGCCTGTGCAGCCAGTCCCTGCAGCCCACACCCTGGGGAGACCCAACCCTGCCTGGGGCCCTTCCAACCCTGCTGCTCTTACTGCCCACCCAGAAAACTCTGGGGTCCTGTCCCTGCAGTCCCTACCCTGGTCTCCACCCAGACCCCTGTGTATCACTCCAGACACCCCTCCCAGGCAAACCCTGCACCTGCAGGCCCTGTCCTCTTCTGTCGCTAGAGCCTCAGTTTCTCCCCCCTGTGCCCACACCCTACCTCCTCCTGCCCACAACTCTAACTCTTCTTCTCCTGGAGCCCCTGAGCCATGGCATTGACCCTGCCCTCCCACCACCCACAGCCCATGCCCTCACCTTCCTCCTGGCCACTCCGACCCCGCCCCCTCTCAGGCCAAGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTTCCCAGGCAGGCCTGGGCTCTTGCCCTCACTTCCCGGTTACACGGGAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCACCTTGACACACGTCCGCCCGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCCGCACTCCCTCTAAAGACAAGGGATCCAGGCAGCAGCATCACGGGAGAATGCAGGGCTCCCAGACATCCCAGTCCTCTCACAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACCAAACAGCCACAGAGGCTGCTGGATAGTAACTGAGTCAATGACCGACCTGGAGGGCAGGGGAGCAGTGAGCCGGAGCCCATACCATAGGGACAGAGACCAGCCGCTGACATCCCGAGCTCCTCAATGGTGGCCCCATAACACACCTAGGAAACATAACACACCCACAGCCCCACCTGGAACAGGGCAGAGACTGCTGAGCCCCCAGCACCAGCCCCAAGAAACACCAGGCAACAGTATCAGAGGGGGCTCCCGAGAAAGAGAGGAGGGGAGATCTCCTTCACCATCAAATGCTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTATACAGCACTGGGCTCAGAGTCCTCTCTGAGACACCCTGAGTTTCAGACAACAACCCGCTGGAATGCACAGTCTCAGCAGGAGAACAGACCAAAGCCAGCAAAAGGGACCTCGGTGACACCAGTAGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGAGGATATTGTAGTGGTAGCAGCAGATGGGGTAGCTGCTACTCCCACAGTGACACAGACCCATTCAAAAACCCCTACTGCAAACACACCCACTCCTGGGGCTGAGGGGCTGGGGGAGCGTCTGGGAAGTAGGGTCCAGGGGTGTCTATCAATGTCCAAAATGCACCAGACTCCCCGCCAAACACCACCCCACCAGCCAGCGAGCAGGGTAAACAGAAAATGAGAGGCTCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGCAAGAGGGGATGCAGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTGTTCAAGATCAGTGGCTGGGAATGAGCCCAGGAGGGCAGTCTGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTCAAAAGTTTGCCTTGTGACCACACTATTGCATCATGGGATGCTTAAGAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAGATGAATTTGCAGCATAGATCTGAATAAACTCTCCAGAATGTGGAGCAGTACAGAAGCAAACACACAGAAAGTGCCTGATGCAAGGACAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCCTTGGCAGGATCTCCCTGCGACAAAGCAGAACCCTCAGGCAATGCCAGCCCCAGAGCCCTCCCTGAGAGCGTCATGGGGAAAGATGTGCAGAACAGCTGATTATCATAGACTCAAACTGAGAACAGAGCAAACGTCCATCTGAAGAACAGTCAAATAAGCAATGGTAGGTTCATGCAATGCAAACCCAGACAGCCAGGGGACAACAGTAGAGGGCTACAGGCGGCTTTGCGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAGAGGAAAGCCCAAAAAATACTTTTAATGTGATTTCTTCTAAATAAAATTTACACCAGGCAAAATGAACTGTCTTCTTAAGGGATAAACTTTCCCCTGGAAAAACTACAAGGAAAATTAAGAAAACGATGATCACATAAACACAGTTGTGGTTACTTCTACTGGGGAAGGAAGAGGGTATGAGCTGAGACACACAGAGTCGGCAAGTCTCCAAGCAAGCACAGAACGAATACATTACAGTACCTTGAATACAGCAGTTAAACTTCTAAATCGCAAGAACAGGAAAATGCACACAGCTGTGTTTAGAAAATTCTCAGTCCAGCACTATTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAATGATGACACAGGCAATTGCACAATGATACAGACATACATTTAGTACATGAGACATCGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATGTGTGGTGGCACTCACCTCCCTGGGATCCCCGGACAGGTTGCAGGCACACTGTGTGGCAGGGCAGGCTGGTACATGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAAGCGCAGGGCTGTATACCCCCAAGGATGGCACAGTCAGTGAATTCCAGAGAGAAGCAGCTCAGCCACACTGCCCAGGCAGAGCCCGAGAGGGACGCCCACGTACAGGGAGGCAGAGCCCAGCTCCTCCACAGCCACCACCACCTGTGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGAAGCCTCACACATCCACCTCAGCCTCCCCTGACCTGGACCTCACCTGGTCTGGACCTCACCTGGCCTGGGCCTCACCTGACCTGGACCTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCCGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAACCTGAGTAGCACTGAGGCTGCAGAAGCTCATCCAGGGTTGGGGAATGACTCTGGAACTCTCCCACATCTGACCTTTCTGGGTGGAGGCATCTGGTGGCCCTGGGAATATAAAAAGCCCCAGAATGGTGCCTGCGTGATTTGGGGGCAATTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACATAGGGACAGATGCCAGCCTGAGGTGGAGCCTCAGGACACAGTTGGACGCGGACACTATCCACATAAGCGAGGGACAGACCCGAGTGTTCCTGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGTGCCCTGCTGCCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCAGATGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTATGATTACGAGAGAGCTTGCAATGGCAGACGCGGCTGCAGCAGATGGGCTCGCGATCATAGCAGGTGCTGCTATCGTTATACCCACAGTGTCACACGGTCCATCAAAAACCCATGCCACAGCCCTCCCCGCAGGGGACCGCCGCGTGCCATGTTACGATTTTGATCGAGGACACAGCGCCATGGGTATGGTGGCTACCACAGCAGTGCAGCCCATGACCCAAACACACAGGGCAGCAGGCACAATGGACAGGCCTGTGAGTGACCATGCTGGGCTCCAGCCCGCCAGCCCCGGAGACCATGAAACAGATGGCCAAGGTCACCCCACAGTTCAGCCAGACATGGCTCCGTGGGGTCTGCATCGCTGCTGCCCTCTAACACCAGCCCAGATGGGGACAAGGCCAACCCCACATTACCATCTCCTGCTGTCCACCCAGTGGTCCCAGAAGCCCCTCCCTCATGGCTGAGCCACATGTGTGAACCCTGAGAGCACCCCATGTCAGAGTAGGGGCAGCAGAAGGGCGGGGCTGGCCCTGTGCACTGTCCCTGCACCCATGGTCCCTCGCCTGCCTGGCCCTGACACCTGAGCCTCTTCTGAGTCATTTCTAAGATAGAAGACATTCCCGGGGACAGCCGGAGCTGGGCGTCGCTCATCCCGCCCGGCCGTCCTGAGTCCTGCTTGTTTCCAGACCTCACCAGGGAAGCCAACAGAGGACTCACCTCACACAGTCAGAGACAAAGAACCTTCCAGAAATCCCTGTCTCACTCCCCAGTGGGCACCTTCTTCCAGGACATTCCTCGGTCGCATCACAGCAGGCACCCACATCTGGATCAGGACGGCCCCCAGAACACAAGATGGCCCATGGGGACAGCCCCACAACCCAGGCCTTCCCAGACCCCTAAAAGGCGTCCCACCCCCTGCACCTGCCCCAGGGCTAAAAATCCAGGAGGCTTGACTCCCGCATACCCTCCAGCCAGACATCACCTCAGCCCCCTCCTGGAGGGGACAGGAGCCCGGGAGGGTGAGTCAGACCCACCTGCCCTCGATGGCAGGCGGGGAAGATTCAGAAAGGCCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGCGTGGGAAAGGCCGCTGGGCACACTCAGGGGGATTTTGTGAAGGCCCCTCCCACTGTGGAGAGGCTTGCTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAGCTAAGCCTCACAGATGCTGCCACAGTGATGAAACTAGCATCAAAAACCGGCCGGACACCCAGGGACCATGCACACTTCTCAGCTTGGAGCTCTCCAGGACCAGAAGAGTCAGGTCTGAGGGTTTGTAGCCAGACCCTCGGCCTCTAGGGACACCCTGGCCATCACAGCGGATGGGCTGGTGCCCCACATGCCATCTGCTCCAAACAGGGGCTTCAGAGGGCTCTGAGGTGACTTCACTCATGACCACAGGTGCCCTGGCCCCTTCCCCGCCAGCTACACCGAACCCTGTCCCAACAGCTGCCCCAGTTCCAACAGCCAATTCCTGGGGCCCAGAATTGCTGTAGACACCAGCCTCGTTCCAGCACCTCCTGCCAATTGCCTGGATTCACATCCTGGCTGGAATCAAGAGGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCGCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCCTGGACAGTTCCCCTCACCTGCCACTAGAGAAACACCTGCCATTGTCGTCCCCACCTGGAAAAGACCACTCGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGACTCCCCGAGGGATCTAAGAAGGAGCCATGCGCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACACTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACTGTGCATGTCTGGTCCCTGAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCCCTGTTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGTCACACTGTGTACTGCCAGAAGTGGATGTGGACTTGCGATAGTGAGAGGAAGAGCTGTGAGGGTATGGTATGCCGGCTGTGGAGTAAGAAGAAGCTCTGGCACAGTGGTGCTGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGTGCAGCCCCAGGCCTCCACTTCACCTGCTTCTCCTGGGGCTCTCAAGGTCACTGTTGTCTGTACTCTGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTTCTCAACATCCCAGGGCCTCATGTCTGCACGGAAGGCCAATGGATGGGCAACCTCACATGCCGCGGCTAAGATAGGGTGGGCAGCCTGGCGGGGGACAGTACATACTGCTGGGGTGTCTGTCACTGTGCCTAGTGGGGCACTGGCTCCCAAACAACGCAGTCCTCGCCAAAATCCCCACAGCCTCCCCTGCTAGGGGCTGGCCTGATCTCCTGCAGTCCTAGGAGGCTGCTGACCTCCAGAATGTCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCCGGCTGCAGACTGGGAGGCCACCCCCTCCTTCCCAGGGTTCACTGGAGGTGACCAAGGTAGGAAATGGCCTTAACACAGGGATGACTGCGCCATCCCCCAACAGAGTCAGCCCCCTCCTGCTCTGTACCCCGCACCCCCCAGGCCAGTCCACGAAAACCAGGGCCCCACATCAGAGTCACTGCCTGGCCCGGCCCTGGGGCGGACCCCTCAGCCCCCACCCTGTCTAGAGGACTTGGGGGGACAGGACACAGGCCCTCTCCTTATGGTTCCCCCACCTGCCTCCGGCCGGGACCCTTGGGGTGTGGACAGAAAGGACACCTGCCTAATTGGCCCCCAGGAACCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACCCCATGGGAATCCGGTATCCCCAGGAAGCCATCAGGAAGGGCTGAAGGAGGAAGCGGGGCCGTGCACCACCGGGCAGGAGGCTCCGTCTTCGTGAACCCAGGGAAGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTGGGGCTCCCACCGTGGCAGGCTGCGGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCTGCGGGTGCTCCTCCATCTTCGGTGAGCCTCCCCCTTCACCCACCGTCCCGCCCACCTCCTCTCCACCCTGGCTGCACGTCTTCCACACCATCCTGAGTCCTACCTACACCAGAGCCAGCAAAGCCAGTGCAGACAAAGGCTGGGGTGCAGGGGGGCTGCCAGGGCAGCTTCGGGGAGGGAAGGATGGAGGGAGGGGAGGTCAGTGAAGAGGCCCCCTTCCCCTGGGTCCAGGATCCTCCTCTGGGACCCCCGGATCCCATCCCCTCCTGGCTCTGGGAGGAGAAGCAGGATGGGAGAATCTGTGCGGGACCCTCTCACAGTGGAATATCCCCACAGCGGCTCAGGCCAGACCCAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTCCTGGGCCTGGGTAGCAGCCCCTCCCACAGAGGACAGACCCAGCACCCCGAAGAAGTCCTGCCAGGGGGAGCTCAGAGCCATGAAAGAGCAGGATATGGGGTCCCCGATACAGGCACAGACCTCAGCTCCATCCAGGCCCACCGGGACCCACCATGGGAGGAACACCTGTCTCCGGGTTGTGAGGTAGCTGGCCTCTGTCTCGGACCCCACTCCAGACACCAGACAGAGGGGCAGGCCCCCCAAAACCAGGGTTGAGGGATGATCCGTCAAGGCAGACAAGACCAAGGGGCACTGACCCCAGCAAGGGAAGGCTCCCAAACAGACGAGGAGGATTTTGTAGCTGTCTGTATCACTGTGTGCAACTGCAGCAGATGGGCTCGCGACCATAGCAGGTGCTGCCACAGTGACACTCGCCAGGTCAAAAACCCCGTCCCAAGTCAGCGGAAGCAGAGAGAGCAGGGAGGACACGTTTAGGATCTGAGGCCGCACCTGACACCCAGGGCAGCAGACGTCTCCCCTCCAGGGCACCCTCCACCGTCCTGCGTTTCTTCAAGAATAGGGGCGGCCTGAGGGGGTCCAGGGCCAGGCGATAGGTCCCCTCTACCCCAAGGAGGAGCCAGGCAGGACCCGAGCACCGATGCATCTAACGCAGTCATGTAATGCTGGGTGACAGTCAGTTCGCCTACGTA
TX-DH120126(SEQ ID NO:235)包括在对应于DH1-20至DH1-26的位置中插入的毒素编码序列:
TACGTAATGCATCTAACGCAGTCATGTAATGCTGGGTGACAGTCAGTTCGCCTCCCCATTGAGGCTGACCTGCCCAGACGGGCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTGCAGGCCCCAGTCTCTGTGGGTGTTCCGCTAGCTGGGGCCCCCAGTGCTCACCCCACACCTAAAGCGAGCCCCAGCCTCCAGAGCCCCCTAAGCATTCCCCGCCCAGCAGCCCAGCCCCTGCCCCCACCCAGGAGGCCCCAGAGCTCAGGGCGCCTGGTCGGATTTTGTACAGCCCCGAGTCACTGTGGAGAGAGCTTGCAATGGCAGACGCGGCTGCAGCAGATGGGCTCGCGATCATAGCAGGTGCTGCCACAGTGAGAAAAACTGTGTCAAAAACCGACTCCTGGCAGCAGTCGGAGGCCCCGCCAGAGAGGGGAGCAGCCGGCCTGAACCCATGTCCTGCCGGTTCCCATGACCCCCAGCACCCAGAGCCCCACGGTGTCCCCGTTGGATAATGAGGACAAGGGCTGGGGGCTCCGGTGGTTTGCGGCAGGGACTTGATCACATCCTTCTGCTGTGGCCCCATTGCCTCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAAAGACAGGGATCACCGGCACCTCCCAATATCAACCCCAGGCAGCACAGACACAAACCCCACATCCAGAGCCAACTCCAGGAGCAGAGACACCCCAACACTCTGGGGGACCCCAACCGTGATAACTCCCCACTGGAATCCGCCCCAGAGTCTACCAGGACCAAAGGCCCTGCCCTGTCTCTGTCCCTCACTCAGGGCCTCCTGCAGGGCGAGCGCTTGGGAGCAGACTCGGTCTTAGGGGACACCACTGTGGGCCCCAACTTTGATGAGGCCACTGACCCTTCCTTCCTTTCCTGGGGCAGCACAGACTTTGGGGTCTGGGCAGGGAAGAACTACTGGCTGGTGGCCAATCACAGAGCCCCCAGGCCGAGGTGGCCCCAAGAAGGCCCTCAGGAGGTGGCCACTCCACTTCCTCCCAGCTGGACCCCAGGTCCTCCCCAAGATAGGGGTGCCATCCAAGGCAGGTCCTCCATGGAGCCCCCTTCAGACTCCTCCCGGGACCCCACTGGACCTCAGTCCCTGCTCTGGGAATGCAGCCACCACAAGCACACCAGGAAGCCCAGGCCCAGCCACCCTGCAGTGGGCAAGCCCACACTCTGGAGCAGAGCAGGGTGCGTCTGGGAGGGGCTAACCTCCCCACCCCCCACCCCCCATCTGCACACAGCCACCTACCACTGCCCAGACCCTCTGCAGGAGGGCCAAGCCACCATGGGGTATGGACTTAGGGTCTCACTCACGTGCCTCCCCTCCTGGGAGAAGGGGCCTCATGCCCAGATCCCTGCAGCACTAGACACAGCTGGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGCATCTAAGGCTGCTCCAGCCCAGACAGCACTGCCGTTCCTGGGAAGCCTGGGCTCCACCAGACCACAGGTCCAGGGCACAGCCCACAGGAGCCACCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCAGGGCGGGACCTGCCTTCCTGCCACCACTTACACACAGGCCAGGGAGCTGTTCCCACACAGATCAACCCCAAACCGGGACTGCCTGGCACTAGGGTCACTGCCATTTCCCTCTCCATTCCCTCCCAGTGCCTCTGTGCTCCCTCCTTCTGGGGAACACCCTGTGCAGCCCCTCCCTGCAGCCCACACGCTGGGGAGACCCCACCCTGCCTCGGGCCTTTTCTACCTGCTGCACTTGCCGCCCACCCAAACAACCCTGGGTACGTGACCCTGCAGTCCTCACCCTGATCTGCAACCAGACCCCTGTCCCTCCCTCTAAACACCCCTCCCAGGCCAACTCTGCACCTGCAGGCCCTCCGCTCTTCTGCCACAAGAGCCTCAGGTTTTCCTACCTGTGCCCACCCCCTAACCCCTCCTGCCCACAACTTGAGTTCTTCCTCTCCTGGAGCCCTTGAGCCATGGCACTGACCCTACACTCCCACCCACACACTGCCCATGCCATCACCTTCCTCCTGGACACTCTGACCCCGCTCCCCTCCCTCTCAGACCCGGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTCCCCATGCAGGCCCTTGCCCTCACTGCCTGGTTACACGGGAGCCTCCTGTGCGCAGAAGCAGGGAGCTCAGCTCTTCCACAGGCAGAAGGCACTGAAAGAAATCAGCCTCCAGTGCCTTGACACACGTCCGCCTGTGTCTCTCACTGCCTGCACCTGCAGGGAGGCTCCGCACTCCCTCTAAAGATGAGGGATCCAGGCAGCAACATCACGGGAGAATGCAGGGCTCCCAGACAGCCCAGCCCTCTCGCAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACTGAACAGCCACGGAGGTCGCTGGATAGTAACCGAGTCAGTGACCGACCTGGAGGGCAGGGGAGCAGTGAACCGGAGCCCATACCATAGGGACAGAGACCAGCCGCTAACATCCCGAGCCCCTCACTGGCGGCCCCAGAACACCCCGTGGAAAGAGAACAGACCCACAGTCCCACCTGGAACAGGGCAGACACTGCTGAGCCCCCAGCACCAGCCCCAAGAAACACTAGGCAACAGCATCAGAGGGGGCTCCTGAGAAAGAGAGGAGGGGAGGTCTCCTTCACCATCAAATGCTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTGTACAGCACTGGGCTCAGAGTCCTCTCTGAGACAGGCTCAGTTTCAGACAACAACCCGCTGGAATGCACAGTCTCAGCAGGAGAGCCAGGCCAGAGCCAGCAAGAGGAGACTCGGTGACACCAGTCTCCTGTAGGGACAGGAGGATTTTGTGGGGGTTCGTGTCACTGTGAGCATATTGTCGGAGCAGGCAGTGCTATTCCCACAGTGACACAACCCCATTCAAAAACCCCTACTGCAAACGCACCCACTCCTGGGACTGAGGGGCTGGGGGAGCGTCTGGGAAGTATGGCCTAGGGGTGTCCATCAATGCCCAAAATGCACCAGACTCTCCCCAAGACATCACCCCACCAGCCAGTGAGCAGAGTAAACAGAAAATGAGAAGCAGCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCAGGTGTGCAAGAGGGGATGTGGGCAGAGCCTCAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTATTCAAGATCAATGGCTGGGAGTGAGCCCAGGAGGACAGTGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTTGAAAGTTTGCCCTGTGCCCACAATGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAAATGGATTTGCAGCACAGATCTGAATAAATCCTCCAGAATGTGGAGCAGCACAGAAGCAAGCACACAGAAAGTGCCTGATGCCAAGGCAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCACTGGCAGGAACTGCCTGTGACAAAGCAGAACCCTCAGGCAATGCCAGCCCTAGAGCCCTTCCTGAGAACCTCATGGGCAAAGATGTGCAGAACAGCTGTTTGTCATAGCCCCAAACTATGGGGCTGGACAAAGCAAACGTCCATCTGAAGGAGAACAGACAAATAAACGATGGCAGGTTCATGAAATGCAAACTAGGACAGCCAGAGGACAACAGTAGAGAGCTACAGGCGGCTTTGCGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAGAGGAAAGCCCAAAAAATACTTTTAATGTGATTTCTTCTAAATAAAATTTACACCCGGCAAAATGAACTATCTTCTTAAGGGATAAACTTTCCCCTGGAAAAACTATAAGGAAAATCAAGAAAACGATGATCACATAAACACAGTGGTGGTTACTTCTACTGGGGAAGGAAGAGGGTATGAGCTGAGACACACAGAGTCGGCAAGTCTCCTAACAAGAACAGAACAAATACATTACAGTACCTTGAAAACAGCAGTTAAACTTCTAAATCGCAAGAAGAGGAAAATGCACACACCTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAGCGATGACACAGGCAATTGCACAATGATACAGACATACATTCAGTATATGAGACATCGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATGTGTGGTGGCAATCACCTCCCTGGGCATCCCCGGACAGGCTGCAGGCTCACTGTGTGGCAGGGCAGGCAGGCACCTGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAGGCACAGAGCTGTATATCCCCAAGGAAGGTACAGTCAGTGCATTCCAGAGAGAAGCAACTCAGCCACACTCCCTGGCCAGAACCCAAGATGCACACCCATGCACAGGGAGGCAGAGCCCAGCACCTCCGCAGCCACCACCACCTGCGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGAAGCCTCACACATCCCTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCGGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAGCCTGAGTAGCACTGAGGCTGTAGGGACTCATCCAGGGTTGGGGAATGACTCTGCAACTCTCCCACATCTGACCTTTCTGGGTGGAGGCACCTGGTGGCCCAGGGAATATAAAAAGCCCCAGAATGATGCCTGTGTGATTTGGGGGCAATTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACAGTAGGGACAGATGTCAGCCTGAGGTGAAGCCTCAGGACACAGGTGGGCATGGACAGTGTCCACCTAAGCGAGGGACAGACCCGAGTGTCCCTGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGGGCCCTGCTGCCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTACTATGAGAGGCTTGCTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAGCTAAGCCTCACAGATGCTGCTATTACTACCACAGTGTCACAGAGTCCATCAAAAACCCATGCCTGGGAGCCTCCCACCACAGCCCTCCCTGCGGGGGACCGCTGCATGCCGTGTTAGGATTTTGATCGAGGACACGGCGCCATGGGTATGGTGGCTACCACAGCAGTGCAGCCCATGACCCAAACACACGGGGCAGCAGAAACAATGGACAGGCCCACAAGTGACCATGATGGGCTCCAGCCCACCAGCCCCAGAGACCATGAAACAGATGGCCAAGGTCACCCTACAGGTCATCCAGATCTGGCTCCAAGGGGTCTGCATCGCTGCTGCCCTCCCAACGCCAAACCAGATGGAGACAGGGCCGGCCCCATAGCACCATCTGCTGCCGTCCACCCAGCAGTCCCGGAAGCCCCTCCCTGAACGCTGGGCCACGTGTGTGAACCCTGCGAGCCCCCCATGTCAGAGTAGGGGCAGCAGGAGGGCGGGGCTGGCCCTGTGCACTGTCACTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGAGCCTCTCCTGGGTCATTTCCAAGACATTCCCAGGGACAGCCGGAGCTGGGAGTCGCTCATCCTGCCTGGCTGTCCTGAGTCCTGCTCATTTCCAGACCTCACCAGGGAAGCCAACAGAGGACTCACCTCACACAGTCAGAGACAACGAACCTTCCAGAAATCCCTGTTTCTCTCCCCAGTGAGAGAAACCCTCTTCCAGGGTTTCTCTTCTCTCCCACCCTCTTCCAGGACAGTCCTCAGCAGCATCACAGCGGGAACGCACATCTGGATCAGGACGGCCCCCAGAACACGCGATGGCCCATGGGGACAGCCCAGCCCTTCCCAGACCCCTAAAAGGTATCCCCACCTTGCACCTGCCCCAGGGCTCAAACTCCAGGAGGCCTGACTCCTGCACACCCTCCTGCCAGATATCACCTCAGCCCCCTCCTGGAGGGGACAGGAGCCCGGGAGGGTGAGTCAGACCCACCTGCCCTCAATGGCAGGCGGGGAAGATTCAGAAAGGCCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGTGTGGGAAAGGCCTCTGGCCACACTCAGGGGGATTTTGTGAAGGGCCCTCCCACTGTGGAGAGGCTTTGCTGTGGCTTCCCTAAGAGCTGCCGCAGCAGGCAATGCAAGCCTCACAGATGCTGCCACAGTGATGAAACCAGCATCAAAAACCGACCGGACTCGCAGGGTTTATGCACACTTCTCGGCTCGGAGCTCTCCAGGAGCACAAGAGCCAGGCCCGAGGGTTTGTGCCCAGACCCTCGGCCTCTAGGGACACCCGGGCCATCTTAGCCGATGGGCTGATGCCCTGCACACCGTGTGCTGCCAAACAGGGGCTTCAGAGGGCTCTGAGGTGACTTCACTCATGACCACAGGTGCCCTGGTCCCTTCACTGCCAGCTGCACCAGACCCTGTTCCGAGAGATGCCCCAGTTCCAAAAGCCAATTCCTGGGGCCGGGAATTACTGTAGACACCAGCCTCATTCCAGTACCTCCTGCCAATTGCCTGGATTCCCATCCTGGCTGGAATCAAGAGGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCACACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCGCAGACAGTTCCCCTCACCTGCCCATGTAGAAACACCTGCCATTGTCGTCCCCACCTGGCAAAGACCACTTGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGAGTCCTCGAGGCCCCTAAGAAGGAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACGCTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGACCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACAGTGCATGTCTGGTCCCTGAGCAGCCCCCAGGCTCTCTAGCACTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCCCTGTTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGCCACACTGTGTACTGCCAGAAGTGGATGTGGACTTGCGATAGTGAGAGGAAGTGCTGTGAGGGTATGGTATGCCGGCTGTGGTGTAAGAAGAAGCTCTGGCACAGTGGTGCCGCCCATATCAAAAACCAGGCCAAGTAGACAGACCCCTGCCACGCAGCCCCAGGCCTCCAGCTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTCTGCCCTCTGGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTGCTCCAGGGCAGGGATGACTGAGATAGAAATCAAAGGCTGGCAGGGAAAGGCAGCTTCCCGCCCTGAGAGGTGCAGGCAGCACCACAGAGCCATGGAGTCACAGAGCCACGGAGCCCCCAGTGTGGGCGTGTGAGGGTGCTGGGCTCCCGGCAGGCCCAGCCCTGATGGGGAAGCCTGCCCCGTCCCACAGCCCAGGTCCCCAGGGGCAGCAGGCACAGAAGCTGCCAAGCTGTGCTCTACGATCCTCATCCCTCCAGCAGCATCCACTCCACAGTGGGGAAACTGAGCCTTGGAGAACCACCCAGCCCCCTGGAAACAAGGCGGGGAGCCCAGACAGTGGGCCCAGAGCACTGTGTGTATCCTGGCACTAGGTGCAGGGACCACCCGGAGATCCCCATCACTGAGTGGCCAGCCTGCAGAAGGACCCAACCCCAACCAGGCCGCTTGATTAAGCTCCATCCCCCTGTCCTGGGAACCTCTTCCCAGCGCCACCAACAGCTCGGCTTCCCAGGCCCTCATCCCTCCAAGGAAGGCCAAAGGCTGGGCCTGCCAGGGGCACAGTACCCTCCCTTGCCCTGGCTAAGACAGGGTGGGCAGACGGCTGCAGATAGGACATATTGCTGGGGCATCTTGCTCTGTGACTACTGGGTACTGGCTCTCAACGCAGACCCTACCAAAATCCCCACTGCCTCCCCTGCTAGGGGCTGGCCTGGTCTCCTCCTGCTGTCCTAGGAGGCTGCTGACCTCCAGGATGGCTTCTGTCCCCAGTTCTAGGGCCAGAGCAGATCCCAGGCAGGCTGTAGGCTGGGAGGCCACCCCTGTCCTTGCCGAGGTTCAGTGCAGGCACCCAGGACAGGAAATGGCCTGAACACAGGGATGACTGTGCCATGCCCTACCTAAGTCCGCCCCTTTCTACTCTGCAACCCCCACTCCCCAGGTCAGCCCATGACGACCAACAACCCAACACCAGAGTCACTGCCTGGCCCTGCCCTGGGGAGGACCCCTCAGCCCCCACCCTGTCTAGAGGAGTTGGGGGGACAGGACACAGGCTCTCTCCTTATGGTTCCCCCACCTGGCTCCTGCCGGGACCCTTGGGGTGTGGACAGAAAGGACGCCTGCCTAATTGGCCCCCAGGAACCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACTCCATGGGAATCCAGAATCCCCAGGAAGCCATCAGGAAGGGCTGAAGGAGGAAGCGGGGCCGCTGCACCACCGGGCAGGAGGCTCCGTCTTCGTGAACCCAGGGAAGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTGGGGCTCCCACCGTGGCAGGCTGCGGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCTGCAGGTGCTCCATCTTGGATGAGCCCATCCCTCTCACCCACCGACCCGCCCACCTCCTCTCCACCCTGGCCACACGTCGTCCACACCATCCTGAGTCCCACCTACACCAGAGCCAGCAGAGCCAGTGCAGACAGAGGCTGGGGTGCAGGGGGGCCGCCAGGGCAGCTTTGGGGAGGGAGGAATGGAGGAAGGGGAGGTCAGTGAAGAGGCCCCCCTCCCCTGGGTCTAGGATCCACCTTTGGGACCCCCGGATCCCATCCCCTCCAGGCTCTGGGAGGAGAAGCAGGATGGGAGATTCTGTGCAGGACCCTCTCACAGTGGAATACCTCCACAGCGGCTCAGGCCAGATACAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTGCAGGGCCTGGGGGCAGCCCCTCCCACAGAGGACAGACCCAGCACCCCGAAGAAGTCCTGCCAGGGGGAGCTCAGAGCCATGAAGGAGCAAGATATGGGGACCCCAATACTGGCACAGACCTCAGCTCCATCCAGGCCCACCAGGACCCACCATGGGTGGAACACCTGTCTCCGGCCCCTGCTGGCTGTGAGGCAGCTGGCCTCTGTCTCGGACCCCCATTCCAGACACCAGACAGAGGGACAGGCCCCCCAGAACCAGTGTTGAGGGACACCCCTGTCCAGGGCAGCCAAGTCCAAGAGGCGCGCTGAGCCCAGCAAGGGAAGGCCCCCAAACAAACCAGGAGGTTTCTGAAGCTGTCTGTGTCACAGTCTGCTGCAACTGCAGCAGCAAATGGTGCCGCGACCATAGCAGGTGCTGCCACAATGACACTGGGCAGGACAGAAACCCCATCCCAAGTCAGCCGAAGGCAGAGAGAGCAGGCAGGACACATTTAGGATCTGAGGCCACACCTGACACTCAAGCCAACAGATGTCTCCCCTCCAGGGCGCCCTGCCCTGTTCAGTGTTCCTGAGAAAACAGGGGCAGCCTGAGGGGATCCAGGGCCAGGAGATGGGTCCCCTCTACCCCGAGGAGGAGCCAGGCGGGAATCCCAGCCCCCTCCCCATTGAGGCCATCCTGCCCAGAGGGGCCCGGACCCACCCCACACACCCAGGCAGAATGTGTGCAGGCCTCAGGCTCTGTGGGTGCCGCTAGCTGGGGCTGCCAGTCCTCACCCCACACCTAAGGTGAGCCACAGCCGCCAGAGCCTCCACAGGAGACCCCACCCAGCAGCCCAGCCCCTACCCAGGAGGCCCCAGAGCTCAGGGCGCCTGGGTGGATTTTGTACAGCCCCGAGTCACTGTGGGTATAGTGGGGAGAGGCTTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAAAGCCTCACAGATGCTGCAGCTACTACCACAGTGAGAAAAGCTATGTCAAAAACCGTCTCCCGGCCACTGCTGGAGGCCCAGCCAGAGAAGGGACCAGCCGCCCGAACATACGACCTTCCCAGACCTCATGACCCCCAGCACTTGGAGCTCCACAGTGTCCCCATTGGATGGTGAGGATGGGGGCCGGGGCCATCTGCACCTCCCAACATCACCCCCAGGCAGCACAGGCACAAACCCCAAATCCAGAGCCGACACCAGGAACACAGACACCCCAATACCCTGGGGGACCCTGGCCCTGGTGACTTCCCACTGGGATCCACCCCCGTGTCCACCTGGATCAAAGACCCCACCGCTGTCTCTGTCCCTCACTCAGGGCCTGCTGAGGGGCGGGTGCTTTGGAGCAGACTCAGGTTTAGGGGCCACCATTGTGGGGCCCAACCTCGACCAGGACACAGATTTTTCTTTCCTGCCCTGGGGCAACACAGACTTTGGGGTCTGTGCAGGGAGGACCTTCTGGAAAGTCACCAAGCACAGAGCCCTGACTGAGGTGGTCTCAGGAAGACCCCCAGGAGGGGGCTTGTGCCCCTTCCTCTCATGTGGACCCCATGCCCCCCAAGATAGGGGCATCATGCAGGGCAGGTCCTCCATGCAGCCACCACTAGGCAACTCCCTGGCGCCGGTCCCCACTGCGCCTCCATCCCGGCTCTGGGGATGCAGCCACCATGGCCACACCAGGCAGCCCGGGTCCAGCAACCCTGCAGTGCCCAAGCCCTTGGCAGGATTCCCAGAGGCTGGAGCCCACCCCTCCTCATCCCCCCACACCTGCACACACACACCTACCCCCTGCCCAGTCCCCCTCCAGGAGGGTTGGAGCCGCCCATAGGGTGGGGGCTCCAGGTCTCACTCACTCGCTTCCCTTCCTGGGCAAAGGAGCCTCGTGCCCCGGTCCCCCCTGACGGCGCTGGGCACAGGTGTGGGTACTGGGCCCCAGGGCTCCTCCAGCCCCAGCTGCCCTGCTCTCCCTGGGAGGCCTGGGCACCACCAGACCACCAGTCCAGGGCACAGCCCCAGGGAGCCGCCCACTGCCAGCTCACAGGAAGAAGATAAGCTTCAGACCCTCAGGGCCGGGAGCTGCCTTCCTGCCACCCCTTCCTGCCCCAGACCTCCATGCCCTCCCCCAACCACTTACACACAAGCCAGGGAGCTGTTTCCACACAGTTCAACCCCAAACCAGGACGGCCTGGCACTCGGGTCACTGCCATTTCTGTCTGCATTCGCTCCCAGCGCCCCTGTGTTCCCTCCCTCCTCCCTCCTTCCTTTCTTCCTGCATTGGGTTCATGCCGCAGAGTGCCAGGTGCAGGTCAGCCCTGAGCTTGGGGTCACCTCCTCACTGAAGGCAGCCTCAGGGTGCCCAGGGGCAGGCAGGGTGGGGGTGAGGCTTCCAGCTCCAACCGCTTCGCTACCTTAGGACCGTTATAGTTAGGCGCGCCGTCGACCAATTCTCATGTTTGACAGCTTATCATCGAATTTCTACGTA
DNA构建体
通常,将含有一个或多个核苷酸编码序列(其各自编码目的非免疫球蛋白多肽或其一部分(例如,ACKR2多肽的细胞外部分或毒素肽的一部分))的多核苷酸分子插入载体,优选DNA载体内,以便在合适的宿主细胞中复制多核苷酸分子。
由于其大小,一个或多个核苷酸编码序列可直接由可得自商业供应商的cDNA源克隆,或基于可得自GenBank的公开序列在计算机芯片上设计。可替代地,细菌人工染色体(BAC)文库可提供来自目的基因(例如,异源ACKR2基因或毒素编码序列)的异源核苷酸编码序列。BAC文库含有100-150kb的平均插入片段大小,并且能够携带高达300kb的插入片段(Shizuya等人,1992,Proc.Natl.Acad.Sci.,USA 89:8794-8797;Swiatek等人,1993,Genesand Development 7:2071-2084;Kim等人,1996,Genomics 34 213-218;以引用的方式并入本文)。例如,已构建人和小鼠基因组BAC文库,并且这些文库可商购获得(例如,Invitrogen,Carlsbad Calif.)。基因组BAC文库也可充当异源编码序列以及转录控制区域源。
可替代地,可从酵母人染色体(YAC)分离、克隆和/或转移异源核苷酸编码序列。整个异源基因或基因座可以被克隆并包含在一个或几个YAC内。如果使用多个YAC并且它们含有重叠同源性区域,则它们可以在酵母宿主菌株内重组以产生代表整个基因座的单一构建体。YAC臂可以通过改造用哺乳动物选择盒进一步修饰,以帮助通过本领域已知的和/或本文所述的方法将构建体引入胚胎干细胞或胚胎。
如上所述,用于构建免疫球蛋白重链基因座的经改造的DH区的示例性DNA和氨基酸序列分别在表3和4中提供。其它异源核苷酸编码序列也可在GenBank数据库或本领域已知的其它序列数据库中找到。例如,人ACKR2的mRNA和氨基酸序列可分别在GenBank登录号NM_001296.4和NP_001287.2处找到,并且在此以引用的方式并入。另外,例如,α-芋螺毒素的DNA和氨基酸序列可分别在GenBank登录号JX177132.1和AFR68318.1处找到;δ-芋螺毒素的DNA和氨基酸序列可分别在GenBank登录号KR013220.1和AKD43185.1处找到;κ-芋螺毒素的DNA和氨基酸序列可分别在GenBank登录号DQ311073.1和ABD33865.1处找到;μ-芋螺毒素的DNA和氨基酸序列可分别在GenBank登录号AY207469.1和AAO48588.1处找到;和/或ω-芋螺毒素的DNA和氨基酸序列可分别在GenBank登录号M84612.1和AAA81590.1处找到;所有这些在此以引用的方式并入。进一步地,例如,来自狼蛛(智利捕鸟蛛(GrammostolaSpatulata))的毒素的序列可在GenBank登录号1TYK_A和1LUP_A处找到,SGTX-I的序列可在GenBank登录号1LA4_A处找到,虎纹捕鸟蛛毒素-IV(HWTX-IV)的序列可在GenBank登录号P83303.2处找到,原毒素-I(ProTxI)的序列可在GenBank登录号2M9L_A处找到,原毒素-2(ProTxII)的序列可在GenBank登录号P83476.1处找到;所有这些在此以引用的方式并入。
在一些实施例中,含有如本文所述的一个或多个核苷酸编码序列的DNA构建体包含与重组信号序列(RSS,即侧翼为5'RSS和3’RSS)可操作地连接的人ACKR2DNA序列,所述人ACKR2 DNA序列编码人ACKR2多肽的细胞外部分,用于在转基因非人动物中与免疫球蛋白基因区段(例如VH和JH)重组。在一些实施例中,含有如本文所述的一个或多个核苷酸编码序列的DNA构建体包含与重组信号序列(RSS,即侧翼为5'RSS和3’RSS)可操作地连接的毒素DNA序列,所述毒素DNA序列编码μ-芋螺毒素和/或狼蛛毒素肽的一部分,用于在转基因非人动物中与免疫球蛋白基因区段(例如VH和JH)重组。重组信号序列可与自然界(例如基因组)中发现的重组信号序列相同或基本上相同,或者可通过人为改造(例如优化)。在一些实施例中,RSS在起源中是基因组的,并且包括在自然界中发现的免疫球蛋白重链基因座(例如人或啮齿类动物免疫球蛋白重链基因座)中发现的一个或多个序列。例如,DNA构建体可包括位于核苷酸编码序列的5'-侧翼区和/或3'-侧翼区中的重组信号序列,所述核苷酸编码序列编码目的非免疫球蛋白多肽或其一部分(例如,异源ACKR2多肽的细胞外部分或毒素肽的一部分),以能够将核苷酸编码序列与VH和/或JH基因区段重组的方式可操作地连接至核苷酸编码序列。在一些实施例中,重组信号序列包含与传统DH基因区段(即,自然界中发现的RSS)天然结合的序列。在一些实施例中,重组信号序列包含与传统DH基因区段天然不结合的序列。在一些实施例中,重组信号序列包含对于与VH和JH基因区段重组而优化的序列。在一些实施例中,与一个或多个核苷酸编码序列(其各自编码目的非免疫球蛋白多肽或其一部分(例如,ACKR2多肽的细胞外部分或毒素肽的一部分))可操作地连接的重组信号序列提供处于与由其获得该序列的动物中的重组水平相似、或更高或更低的水平的重组。如果另外的侧翼序列可用于优化一个或多个核苷酸编码序列的重组,则可使用现有序列作为探针来克隆此类序列。取决于所需结果,可从基因组序列或其它源获得用于使含有非免疫球蛋白多肽(例如,ACKR2或毒素)的核苷酸编码序列的重链可变区的重组和/或表达最大化所需的另外序列。
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自通过优化的RSS侧接5'和/或3'。可使用的示例性的优化RSS在图2中提供并且在实例1中描述。
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自由优化的RSS 5'侧接,所述优化的RSS具有与图2中出现的5’RSS至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自由优化的RSS 5'侧接,所述优化的RSS具有与图2中出现的5’RSS基本上相同或相同的序列。
在各种实施例中,一个或多个核苷酸编码序列各自由优化的RSS 3’侧接,所述优化的RSS具有与图2中出现的3’RSS至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自由优化的RSS 3’侧接,所述优化的RSS具有与图2中出现的5’RSS基本上相同或相同的序列。
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自由优化的RSS 5’和3’侧接,每个5’和3’RSS具有与图2中出现的5’和3’RSS至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自由优化的RSS 5’和3’侧接,每个5’和3’RSS具有与图2中出现的5’和3’RSS基本上相同或相同的序列。
在各种实施例中,如本文所述的一个或多个核苷酸编码序列各自由选自图2的5’和3’RSS侧接。
DNA构建体可以使用本领域已知的方法制备。例如,DNA构建体可以制备为较大质粒的一部分。这种制备允许以本领域已知的有效方式克隆和选择正确的构建体。含有本文所述的一个或多个核苷酸编码序列的DNA片段可以定位于质粒上的简便限制性位点之间,使得它们可易于从其余的质粒序列分离,以掺入所需的动物。
本领域已知用于制备质粒和转化宿主生物的各种方法。对于用于原核和真核细胞二者的其他合适的表达系统,以及一般重组步骤,参见Molecular Cloning:A LaboratoryManual,第2版,Sambrook,J.等人编,Cold Spring Harbor Laboratory Press:1989。
具有经改造的DH区的非人动物的生产
本发明提供了非人动物,其表达特征在于重链CDR3多样性的抗体,所述重链CDR3多样性指导与特定抗原的结合,来源于一个或多个核苷酸编码序列的整合,各自编码目的非免疫球蛋白多肽或其一部分(例如非典型趋化因子受体例如ACKR2的细胞外部分、或毒素肽的一部分)的所述一个或多个核苷酸编码序列整合到非人动物的基因组中的免疫球蛋白重链可变区内。本文描述的合适的实例包括啮齿类动物,具体地讲,小鼠。
在一些实施例中,一个或多个异源核苷酸编码序列包含来自异源物种(例如人、蜘蛛、蝎子、蜗牛、狼蛛、海葵等)的遗传材料,其中所述异源核苷酸编码序列各自编码目的非免疫球蛋白多肽或其一部分(例如,ACKR多肽的细胞外部分或毒素肽的一部分),其包含来自异源物种的遗传材料的编码部分。在一些实施例中,本文所述的异源核苷酸编码序列包含编码目的非免疫球蛋白多肽或其一部分(例如,异源ACKR多肽的细胞外部分或毒素肽的一部分)的异源物种的核苷酸编码序列,目的非免疫球蛋白多肽的所述部分出现在免疫球蛋白重链,特别是重链CDR3中,其由如本文所述的非人动物的B细胞表达。还提供了非人动物、胚胎、用于制备非人动物的细胞和靶向构建体、非人胚胎和含有所述异源核苷酸编码序列的细胞。
在各种实施例中,将一个或多个异源核苷酸编码序列插入非人动物的基因组内的免疫球蛋白重链可变区的DH区内。在一些实施例中,免疫球蛋白重链可变区的DH区(或其一部分)不是缺失的(即完整的)。{在一些实施例中,免疫球蛋白重链可变区的DH区(或其一部分)被改变、破坏、缺失或替换为一个或多个异源核苷酸编码序列(例如,一个或多个异源ACKR2或者一个或多个异源毒素核苷酸编码序列)。在一些实施例中,全部或基本上全部DH区被替换为一个或多个异源核苷酸编码序列;在一些特定实施例中,一个或多个传统DH基因区段在免疫球蛋白重链可变区的DH区中不被缺失或替换。在一些实施例中,如本文所述的DH区是合成DH区,所述合成DH区包含如本文所述的一个或多个异源核苷酸编码序列。在一些实施例中,DH区是人DH区。在一些实施例中,DH区是鼠DH区。在一些实施例中,将如本文所述的经改造的DH区(或其一部分)插入免疫球蛋白重链可变区内,使得所述经改造的DH区(或其一部分)与一个或多个VH基因区段和/或一个或多个JH基因区段可操作地连接。在一些实施例中,将一个或多个异源核苷酸编码序列插入免疫球蛋白重链可变区的两个拷贝之一内,产生就一个或多个异源核苷酸编码序列(即,经改造的DH区)而言是杂合的非人动物。在一些实施例中,提供了对于一个或多个异源核苷酸编码序列(即,经改造的DH区)是纯合的非人动物。在一些实施例中,提供了对于一个或多个异源核苷酸编码序列(即,经改造的DH区)是杂合的非人动物。
在一些实施例中,本文所述的非人动物含有人免疫球蛋白重链可变区,其包括在其基因组中含有(例如随机整合)一个或多个异源核苷酸编码序列的H区。因此,此类非人动物可被描述为具有含有经改造的DH区的人免疫球蛋白重链转基因。可使用各种方法检测经改造的DH区,所述方法包括例如PCR、蛋白质印迹、RNA印迹、限制性片段长度多态性(RFLP)、或者等位基因获得或丧失测定。在一些实施例中,本文所述的非人动物就如本文所述的经改造的DH区而言是杂合的。在一些实施例中,本文所述的非人动物就如本文所述的经改造的DH区而言是纯合的。在一些实施例中,本文所述的非人动物就如本文所述的经改造的DH区而言是半合子的。在一些实施例中,本文所述的非人动物含有如本文所述的经改造的DH区的一个或多个拷贝。
在一些实施例中,本文公开的一个或多个异源ACKR核苷酸编码序列是异源ACKR2核苷酸编码序列。在一些实施例中,一个或多个异源ACKR2核苷酸编码序列是人。
在一些实施例中,本文所述的一个或多个异源毒素核苷酸编码序列是异源μ-芋螺毒素核苷酸编码序列、异源狼蛛毒素核苷酸编码序列和/或其组合。
在各种实施例中,本文所述的一个或多个异源核苷酸编码序列包括一个或多个核苷酸编码序列,其各自具有与表3或表4中出现的一个或多个核苷酸编码序列至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
在各种实施例中,本文所述的一个或多个异源核苷酸编码序列包括一个或多个核苷酸编码序列,其各自具有与表3或表4中出现的一个或多个核苷酸编码序列基本上相同或相同的序列。
在各种实施例中,本文所述的一个或多个异源核苷酸编码序列选自表3和/或表4。
在各种实施例中,本文所述的经改造的DH区包含一个或多个异源核苷酸编码序列,其各自具有与表3或表4中出现的一个或多个核苷酸编码序列至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
在各种实施例中,本文所述的经改造的DH区包含一个或多个异源核苷酸编码序列,其各自具有与表3或表4中出现的一个或多个核苷酸编码序列基本上相同或相同的序列。
在各种实施例中,本文所述的经改造的DH区包含5、10、15、20或25个异源ACKR2核苷酸编码序列,其各自具有与表3中出现的5、10、15、20或25个ACKR2核苷酸编码序列相同的序列。
在各种实施例中,本文所述的经改造的DH区包含5、10、15、20、25或26个异源毒素核苷酸编码序列,其各自具有与表4中出现的5、10、15、20、25或26个毒素核苷酸编码序列相同的序列。
在各种实施例中,本文所述的经改造的DH区包含一个或多个异源核苷酸编码序列,其各自侧翼为5'重组信号序列(5’RSS)和3'重组信号序列(3’RSS),所述5’RSS和3’RSS各自具有与图2中出现的5’RSS和3’RSS至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
在各种实施例中,本文所述的经改造的DH区包含一个或多个异源核苷酸编码序列,其各自侧翼为5'重组信号序列(5’RSS)和3'重组信号序列(3’RSS),所述5’RSS和3’RSS各自具有与图2中出现的5’RSS和3’RSS基本上相同或相同的序列。
在各种实施例中,本文所述的经改造的DH区包含一个或多个异源核苷酸编码序列,其各自侧翼为5'重组信号序列(5’RSS)和3'重组信号序列(3’RSS),所述5’RSS和3’RSS选自图2。
在各种实施例中,本文所述的经改造的DH区包含
(a)由SEQ ID NO:59 5'侧接且由SEQ ID NO:60 3'侧接的SEQ ID NO:39;
(b)由SEQ ID NO:69 5'侧接且由SEQ ID NO:70 3'侧接的SEQ ID NO:7;
(c)由SEQ ID NO:77 5'侧接且由SEQ ID NO:78 3'侧接的SEQ ID NO:1;
(d)由SEQ ID NO:87 5'侧接且由SEQ ID NO:88 3'侧接的SEQ ID NO:33;
(e)由SEQ ID NO:95 5'侧接且由SEQ ID NO:96 3'侧接的SEQ ID NO:3;和
(f)由SEQ ID NO:103 5'侧接且由SEQ ID NO:104 3'侧接的SEQ ID NO:5。
在各种实施例中,本文所述的经改造的DH区包含
(a)由SEQ ID NO:61 5'侧接且由SEQ ID NO:62 3'侧接的SEQ ID NO:41;
(b)由SEQ ID NO:71 5'侧接且由SEQ ID NO:72 3'侧接的SEQ ID NO:15;
(c)由SEQ ID NO:79 5'侧接且由SEQ ID NO:80 3'侧接的SEQ ID NO:37;
(d)由SEQ ID NO:81 5'侧接且由SEQ ID NO:82 3'侧接的SEQ ID NO:13;
(e)由SEQ ID NO:89 5'侧接且由SEQ ID NO:90 3'侧接的SEQ ID NO:29;
(f)由SEQ ID NO:97 5'侧接且由SEQ ID NO:98 3'侧接的SEQ ID NO:11;和
(g)由SEQ ID NO:105 5'侧接且由SEQ ID NO:106 3'侧接的SEQ ID NO:9;
在各种实施例中,本文所述的经改造的DH区包含
(a)由SEQ ID NO:63 5'侧接且由SEQ ID NO:64 3'侧接的SEQ ID NO:43;
(b)由SEQ ID NO:73 5'侧接且由SEQ ID NO:74 3'侧接的SEQ ID NO:23;
(c)由SEQ ID NO:83 5'侧接且由SEQ ID NO:84 3'侧接的SEQ ID NO:17;
(d)由SEQ ID NO:91 5'侧接且由SEQ ID NO:92 3'侧接的SEQ ID NO:35;
(e)由SEQ ID NO:99 5'侧接且由SEQ ID NO:100 3'侧接的SEQ ID NO:19;和
(f)由SEQ ID NO:107 5'侧接且由SEQ ID NO:108 3'侧接的SEQ ID NO:21。
在各种实施例中,本文所述的经改造的DH区包含
(a)由SEQ ID NO:65 5'侧接且由SEQ ID NO:66 3'侧接的SEQ ID NO:45;
(b)由SEQ ID NO:75 5'侧接且由SEQ ID NO:76 3'侧接的SEQ ID NO:31;
(c)由SEQ ID NO:85 5'侧接且由SEQ ID NO:86 3'侧接的SEQ ID NO:25;
(d)由SEQ ID NO:93 5'侧接且由SEQ ID NO:94 3'侧接的SEQ ID NO:49;
(e)由SEQ ID NO:101 5'侧接且由SEQ ID NO:102 3'侧接的SEQ ID NO:27;和
(f)由SEQ ID NO:67 5'侧接且由SEQ ID NO:68 3'侧接的SEQ ID NO:47。
在各种实施例中,本文所述的经改造的DH区包含一个或多个DNA片段,其各自具有与选自SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134及其组合的DNA片段至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
在各种实施例中,本文所述的经改造的DH区包含一个或多个DNA片段,其各自具有与选自SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134及其组合的DNA片段基本上相同或相同的序列。
在各种实施例中,本文所述的经改造的DH区包含SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133和SEQ ID NO:134中的任何一个。
在各种实施例中,本文所述的经改造的DH区包含SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133和SEQ ID NO:134。在一些特定实施例中,本文所述的经改造的DH区从5'到3'包含SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133和SEQ ID NO:134。
在各种实施例中,本文所述的经改造的DH区包含
(a)由SEQ ID NO:59 5'侧接且由SEQ ID NO:60 3'侧接的SEQ ID NO:180;
(b)由SEQ ID NO:69 5'侧接且由SEQ ID NO:70 3'侧接的SEQ ID NO:182;
(c)由SEQ ID NO:77 5'侧接且由SEQ ID NO:78 3'侧接的SEQ ID NO:184;
(d)由SEQ ID NO:87 5'侧接且由SEQ ID NO:88 3'侧接的SEQ ID NO:186;
(e)由SEQ ID NO:95 5'侧接且由SEQ ID NO:96 3'侧接的SEQ ID NO:188;和
(f)由SEQ ID NO:103 5'侧接且由SEQ ID NO:104 3'侧接的SEQ ID NO:190。
在各种实施例中,本文所述的经改造的DH区包含
(a)由SEQ ID NO:61 5'侧接且由SEQ ID NO:62 3'侧接的SEQ ID NO:192;
(b)由SEQ ID NO:71 5'侧接且由SEQ ID NO:72 3'侧接的SEQ ID NO:194;
(c)由SEQ ID NO:79 5'侧接且由SEQ ID NO:80 3'侧接的SEQ ID NO:196;
(d)由SEQ ID NO:81 5'侧接且由SEQ ID NO:82 3'侧接的SEQ ID NO:198;
(e)由SEQ ID NO:89 5'侧接且由SEQ ID NO:90 3'侧接的SEQ ID NO:200;
(f)由SEQ ID NO:97 5'侧接且由SEQ ID NO:98 3'侧接的SEQ ID NO:202;和
(g)由SEQ ID NO:105 5'侧接且由SEQ ID NO:106 3'侧接的SEQ ID NO:204;
在各种实施例中,本文所述的经改造的DH区包含
(a)由SEQ ID NO:63 5'侧接且由SEQ ID NO:64 3'侧接的SEQ ID NO:206;
(b)由SEQ ID NO:73 5'侧接且由SEQ ID NO:74 3'侧接的SEQ ID NO:208;
(c)由SEQ ID NO:83 5'侧接且由SEQ ID NO:84 3'侧接的SEQ ID NO:210;
(d)由SEQ ID NO:91 5'侧接且由SEQ ID NO:92 3'侧接的SEQ ID NO:212;
(e)由SEQ ID NO:99 5'侧接且由SEQ ID NO:100 3'侧接的SEQ ID NO:214;和
(f)由SEQ ID NO:107 5'侧接且由SEQ ID NO:108 3'侧接的SEQ ID NO:216。
在各种实施例中,本文所述的经改造的DH区包含
(a)由SEQ ID NO:65 5'侧接且由SEQ ID NO:66 3'侧接的SEQ ID NO:218;
(b)由SEQ ID NO:75 5'侧接且由SEQ ID NO:76 3'侧接的SEQ ID NO:220;
(c)由SEQ ID NO:85 5'侧接且由SEQ ID NO:86 3'侧接的SEQ ID NO:222;
(d)由SEQ ID NO:93 5'侧接且由SEQ ID NO:94 3'侧接的SEQ ID NO:224;
(e)由SEQ ID NO:101 5'侧接且由SEQ ID NO:102 3'侧接的SEQ ID NO:226;
(f)由SEQ ID NO:109 5'侧接且由SEQ ID NO:110 3'侧接的SEQ ID NO:228;和
(g)由SEQ ID NO:67 5'侧接且由SEQ ID NO:68 3'侧接的SEQ ID NO:230。
在各种实施例中,本文所述的经改造的DH区包含一个或多个DNA片段,其各自具有与选自SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234、SEQ ID NO:235及其组合的DNA片段至少50%(例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的序列。
在各种实施例中,本文所述的经改造的DH区包含一个或多个DNA片段,其各自具有与选自SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234、SEQ ID NO:235及其组合的DNA片段基本上相同或相同的序列。
在各种实施例中,本文所述的经改造的DH区包含SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234和SEQ ID NO:235中的任何一个。
在各种实施例中,本文所述的经改造的DH区包含SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234和SEQ ID NO:235。在一些特定实施例中,本文所述的经改造的DH区从5'到3'包含SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234和SEQ ID NO:235。
在各种实施例中,由本文所述的非人动物产生的抗体包含重链可变区,所述重链可变区包括具有氨基酸序列的CDR3,所述氨基酸序列是或包含与表3或表4中出现的氨基酸序列至少50%(例如,50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同的氨基酸序列。
在各种实施例中,由本文所述的非人动物产生的抗体包含重链可变区,所述重链可变区包括具有氨基酸序列的CDR3,所述氨基酸序列是或包含与表3或表4中出现的氨基酸序列基本上相同或相同的氨基酸序列。
在各种实施例中,由本文所述的非人动物产生的抗体包含重链可变区,所述重链可变区包括具有氨基酸序列的CDR3,所述氨基酸序列是氨基酸序列的变体(即,其体细胞突变的变体),所述氨基酸序列是或包含表3或表4中出现的氨基酸序列。
本发明提供了用于制备其基因组包含免疫球蛋白重链可变区的非人动物的组合物和方法,所述免疫球蛋白重链可变区包括经改造的DH区,其中所述经改造的DH区包括一个或多个核苷酸编码序列,其各自编码目的多肽的一部分,包括目的多肽的特定多态性形式的核苷酸编码序列、目的多肽的等位基因变体(例如单个氨基酸差异)或目的多肽的可变剪接同种型,包括用于制备表达包含重链可变区的抗体的非人动物的组合物和方法,所述重链可变区包括CDR3,所述CDR3具有由来自免疫球蛋白重链基因座的此类核苷酸编码序列编码的氨基酸序列,所述免疫球蛋白重链基因座含有与一个或多个非人重链恒定区基因可操作地连接的人VH和JH基因区段。在一些实施例中,还提供了用于制备处于内源增强子和/或内源调控序列的控制下,表达此类抗体的非人动物的组合物和方法。在一些实施例中,还提供了用于制备处于异源增强子和/或异源调节序列的控制下,表达此类抗体的非人动物的组合物和方法。方法包括将一个或多个核苷酸编码序列(其各自编码目的多肽的一部分)或一个或多个DNA片段(其各自含有多个核苷酸编码序列,所述多个核苷酸编码序列各自编码目的多肽的一部分)插入非人动物的基因组中,使得包括目的多肽的所述部分的抗体被表达。
在一些实施例中,方法包括插入约10,050bp的DNA(其包括对应于异源ACKR2多肽的细胞外部分的六个核苷酸编码序列)、约9,768bp的DNA(其包括对应于异源ACKR2的细胞外部分的七个核苷酸编码序列)、约9,788bp的DNA(其包括对应于异源ACKR2多肽的细胞外部分的六个核苷酸编码序列)、和/或约11,906bp的DNA(其包括对应于异源ACKR2多肽的细胞外部分的六个核苷酸编码序列)。总之,这种DNA包括对应于异源ACKR2多肽的细胞外部分的25个编码序列。在一些实施例中,方法包括插入还包含重组信号序列的DNA,所述重组信号序列侧接对应于异源ACKR2多肽的细胞外部分的每个核苷酸编码序列。包括对应于异源ACKR2多肽的细胞外部分的核苷酸编码序列和上述侧翼重组信号序列的遗传材料可插入非人动物的基因组内,从而产生具有经改造的DH区的非人动物,所述经改造的DH区含有对应于异源ACKR2多肽的细胞外部分的核苷酸编码序列和必要的重组信号序列,以允许与相邻的VH和JH基因区段的重组。
在一些实施例中,方法包括插入约9,812bp的DNA(其包括对应于一种或多种毒素(例如μ-芋螺毒素和/或狼蛛毒素)的一部分的六个核苷酸编码序列)、约9,512bp的DNA(其包括对应于一种或多种毒素(例如μ-芋螺毒素和/或狼蛛毒素)的一部分的七个核苷酸编码序列、约9,691bp的DNA(其包括对应于一种或多种毒素(例如μ-芋螺毒素和/或狼蛛毒素)的一部分的六个核苷酸编码序列)、和/或约11,896bp的DNA(其包括对应于一种或多种毒素(例如μ-芋螺毒素和/或狼蛛毒素)的一部分的七个核苷酸编码序列)。总之,这种DNA包括对应于一种或多种毒素肽的一部分的26个编码序列。在一些实施例中,方法包括插入还包含重组信号序列的DNA,所述重组信号序列侧接对应于一种或多种毒素肽的一部分的每个核苷酸编码序列。包括对应于一种或多种毒素肽的一部分的核苷酸编码序列和上述侧翼重组信号序列的遗传材料可插入非人动物的基因组内,从而产生具有经改造的DH区的非人动物,所述经改造的DH区含有对应于一种或多种毒素肽的一部分的核苷酸编码序列和必要的重组信号序列,以允许与相邻的VH和JH基因区段的重组。
适当时,对应于目的异源多肽的一部分的核苷酸编码序列可被修饰,以包括对于在非人动物中的表达进行优化的密码子(例如参见美国专利号5,670,356和5,874,304)。密码子优化的序列是合成序列,并且优选编码由非密码子优化的亲本多核苷酸编码的相同多肽(或具有与全长多肽基本上相同的活性的全长多肽的生物活性片段)。在一些实施例中,对应于目的异源多肽的一部分的核苷酸编码序列可包括改变的序列,以优化对于特定细胞类型(例如啮齿类动物细胞)的密码子使用。例如,对应于待插入非人动物(例如啮齿类动物)的基因组内的目的异源多肽的异部分的核苷酸编码序列的密码子可被优化用于在非人动物的细胞中表达。此序列可描述为密码子优化序列。
将对应于目的异源多肽的一部分的核苷酸编码序列插入DH区内使得所述核苷酸编码序列可操作地连接至VH和JH基因区段(例如,多个VH和JH基因区段),采用基因组的相对最低限度的修饰,并且导致包含特征在于CDR3的重链的抗体在非人动物中的表达,所述CDR3具有对应于目的异源多肽的一部分的氨基酸序列。
用于产生转基因非人动物的方法,包括敲除和敲入,是本领域熟知的(参见例如Gene Targeting:A Practical Approach,Joyner编,Oxford University Press,Inc.(2000))。例如,转基因啮齿类动物的生成可任选地涉及破坏一种或多种内源性啮齿类动物基因(或基因区段)的基因座,并且将一种或多种异源基因(或基因区段或核苷酸编码序列)引入啮齿类动物基因组内,在一些实施例中,在与内源性啮齿类动物基因(或基因区段)相同的位置处。在一些实施例中,将对应于目的异源多肽的一部分的核苷酸编码序列引入啮齿类动物的基因组中随机插入的免疫球蛋白重链基因座的DH区内。在一些实施例中,将对应于目的异源多肽的一部分的核苷酸编码序列引入啮齿类动物的基因组中的内源性免疫球蛋白重链基因座的DH区内;在一些实施例中,内源性免疫球蛋白重链基因座被改变、修饰或改造,以含有与一个或多个恒定区基因(例如人或鼠)可操作地连接的人基因区段(例如V和/或J)。
图3A和3B中提供了用于构建靶向载体的示例性策略的示意图(不按照比例),所述靶向载体用于整合到啮齿类动物胚胎干(ES)细胞内,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述免疫球蛋白重链可变区包括经改造的多样性簇(即DH区),所述多样性簇包括各自编码异源ACKR2多肽的一部分(例如D6趋化因子诱饵受体的细胞外部分)的一个或多个核苷酸编码序列,或图7A和7B中提供了各自编码毒素肽的一部分(例如,μ-芋螺毒素和/或狼蛛毒素肽的一部分)。如所示的,各自含有各种数目的核苷酸编码序列的DNA片段使用等温装配连同侧翼为位点特异性重组识别位点(例如loxP)的选择盒(例如新霉素)装配在一起,所述核苷酸编码序列各自编码异源ACKR2多肽的细胞外部分(图3A-3B),或各自编码毒素肽的一部分(图7A-7B)。图4A和4B(对于ACKR2核苷酸编码序列)以及8A和8B(对于毒素核苷酸编码序列)中分别示出了采用DNA片段的序贯连接的替代策略。DNA片段包括重组信号序列,其侧接(5'和3')每个核苷酸编码序列,以允许一旦整合到免疫球蛋白重链基因座内,就与VH和JH基因区段重组。重组信号序列可从基因组源获得,或者可替代地,它们可如本文所述进行优化,以提供核苷酸编码序列与可操作地连接的VH和JH基因区段的有效重组。核苷酸编码序列本身可被优化,使得在抗体序列的亲和力成熟过程中的体细胞超突变发生的水平为、接近或高于在野生型非人动物(其包含包括传统DH基因区段的免疫球蛋白重链基因座)或非人动物(其对于包括传统人DH基因区段的人免疫球蛋白重(和/或轻链)基因座是转基因的)中观察到的体细胞超突变的水平。一旦装配,就将装配的DNA片段(即,经改造的DH区)连接到BAC载体内,所述BAC载体含有基因组重链可变区DNA(例如人),以产生用于整合到免疫球蛋白重链基因座内的靶向载体。执行连接使得经改造的DH区由VH基因组DNA 5'侧接,且由JH基因组DNA和非人(例如啮齿类动物)基因组重链恒定区DNA(例如内含子增强子和IgM恒定区基因)3'侧接。用于掺入非人细胞(例如啮齿类动物胚胎干细胞)的基因组内的最终靶向载体含有VH基因组DNA(例如,含有一个或多个VH基因区段)、经改造的DH区、3'JH基因组DNA和非人(例如啮齿类动物)基因组重链恒定区DNA,所有这些都可操作地连接,以允许一旦整合到非人动物的基因组内,VH基因区段、经改造的DH区内的核苷酸编码序列和JH基因区段之间的重组。
将靶向载体引入啮齿类动物(例如小鼠)胚胎干细胞内,使得靶向载体中所含的序列(即,经改造的DH区)导致非人细胞或非人动物(例如小鼠)表达含有CDR3的抗体的能力,所述CDR3具有由插入的核苷酸编码序列编码的氨基酸。
如本文所述,当经改造的DH区已引入啮齿类动物基因组的内源性免疫球蛋白重链基因座(例如,经改造以含有人可变区基因区段的内源性免疫球蛋白重链基因座)内时,生成转基因啮齿类动物。免疫球蛋白在鼠细胞上表达,所述免疫球蛋白具有含有氨基酸的CDR3,所述氨基酸由来自经改造的DH区的核苷酸编码序列编码。免疫球蛋白还包含鼠恒定区,并且因此为啮齿类动物的免疫系统中的各种免疫细胞提供必要的效应子功能。当啮齿类动物基因组的内源性免疫球蛋白重链基因座不被靶向载体靶向时,优选将经改造的DH区插入免疫球蛋白重链基因座内的除内源性鼠免疫球蛋白重链基因座外的位置处(例如,随机插入)。在这种情况下,内源性鼠免疫球蛋白重链基因座可被缺失或以其它方式致使无功能(例如通过靶向缺失、插入、倒转等),使得由非人动物产生的抗体利用来自含有插入的经改造的DH区的免疫球蛋白重链基因座的基因区段和序列。
在一些实施例中,本文所述的非人动物的基因组还包含一种或多种人免疫球蛋白重链和/或轻链基因(参见例如美国专利号8,502,018;美国专利号8,642,835;美国专利号8,697,940;美国专利号:8,791,323;以及美国专利申请公开号2013/0096287 A1;以引用的方式并入本文)。可替代地,可将经改造的DH区引入不同修饰的品系,例如
Figure BDA0003308863620001151
品系(参见例如美国专利号8,502,018或美国专利号8,642,835;以引用的方式并入本文)的胚胎干细胞内。在一些实施例中,可将经改造的DH区引入修饰品系的胚胎干细胞内,如美国专利号8,697,940和8,642,835中所述;以引用的方式并入本文。
在一些实施例中,本文所述的非人动物的基因组还包含(例如,经由交叉育种或多重靶向策略)一种或多种人免疫球蛋白轻链基因或基因座(例如转基因的、内源的等),如美国专利申请公开号2011-0195454 A1、2012-0021409 A1、2012-0192300 A1、2013-0045492A1、2013-0185821 A1、2013-0198880 A1、2013-0302836 A1、2015-0059009 A1国际专利申请公开号WO 2011/097603、WO 2012/148873、WO 2013/134263、WO 2013/184761、WO 2014/160179、WO 2014/160202中所述;所有这些在此以引用的方式并入。
已描述了单个重排轻链,例如包含重排轻链可变区的轻链的遗传改造。例如,在这些小鼠中生成包含单个重排的可变基因序列VL:JL的通用轻链小鼠(ULC)和生成抗原特异性抗体在例如美国专利申请号13/022,759、13/093,156、13/412,936、13/488,628、13/798,310和13/948,818(分别为公开号2011/0195454、2012/0021409、2012/0192300、2013/0045492、US20130185821和US20130302836)中描述,所述专利各自以引用的方式并入本文。美国申请公开号2011/0195454、2012/0021409、2012/0192300和2013/0045492中描述的经改造的共同轻链小鼠包含的核酸序列编码轻链选项的有限储库,例如共同或通用轻链“ULC”,其包含不超过两个VL基因区段或单个重排的人免疫球蛋白轻链可变区序列。为了实现这种有限储库,将小鼠改造成使其制备或重排天然小鼠轻链可变结构域的能力无功能或基本上无功能。在一个方面,这例如通过缺失小鼠的轻链可变区基因区段来实现。如先前所述,内源性小鼠基因座然后可通过选择的外源性合适的轻链可变区基因区段(优选人轻链可变区基因区段)修饰,任选可操作地连接至内源性小鼠轻链恒定区,其方式使得外源性可变区基因区段可与内源性小鼠轻链恒定区基因组合,并形成重排的反向嵌合轻链基因(人可变,小鼠恒定)。在各种实施例中,轻链可变区能够体细胞突变。在各种实施例中,为了使轻链可变区获得体细胞突变的能力最大化,适当的增强子保留在小鼠中。在一个方面,在用人κ轻链基因区段修饰小鼠κ轻链基因座以替换内源性小鼠κ轻链基因区段中,小鼠κ内含子增强子和小鼠κ3'增强子在功能上得到维持或未被破坏。
因此,本发明提供了经遗传改造的小鼠,其表达与包含由如本文所述的经遗传改造的DH区(或其一部分)编码的氨基酸的反向嵌合(人可变,小鼠恒定)重链多样性相关的反向嵌合(人可变,小鼠恒定)轻链的有限储库。在各种实施例中,缺失内源性小鼠κ轻链基因区段,并且替换为与内源性小鼠Cκ基因可操作地连接的单个(或两个)重排的人轻链区。在用于使重排的人轻链区的体细胞超突变最大化的实施例中,维持小鼠κ内含子增强子和小鼠κ3'增强子。在各种实施例中,小鼠还包含无功能的κ轻链基因座或其缺失、或致使基因座不能制备κ轻链的缺失。
因此,在一个实施例中,本文提供了非人动物(例如啮齿类动物,例如小鼠或大鼠),其在其基因组中例如在其种系中包含来自优选人轻链可变基因区段的有限储库的优选人轻链可变区、或单个重排的人轻链可变区的有限储库,其中所述非人动物在其基因组中例如在其种系中还包含免疫球蛋白重链可变区,其包括经改造的DH区,其中所述经改造的DH区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分。
本发明提供了经遗传改造的动物,其从人轻链可变区基因序列的有限储库表达人轻链可变结构域或单个人轻链可变结构域的有限储库。在一个实施例中,单个重排的V/J人轻链序列选自Vκ1-39Jκ和Vκ3-20Jκ,例如Vκ1-39Jκ5和Vκ3-20Jκ1。在一些实施例中,如本文公开的非人动物包含经修饰的轻链基因座,所述经修饰的轻链基因座包含所有内源性功能VL和所有内源性功能JL基因区段由单个重排的V/J轻链序列的替换,其中所述单个重排的V/J轻链序列可操作地连接至内源性轻链恒定区基因。在一些实施例中,经修饰的轻链基因座位于非人动物的种系基因组中。在一个实施例中,非人动物在其种系基因组中包含与轻链恒定区基因序列可操作地连接的单个重排的轻链可变区基因序列,其中所述单个重排的轻链可变区基因序列包含人种系VL和人种系JL基因区段,例如人种系Vκ1-39和人种系Jκ5或人种系Vκ3-20和Jκ1。在一些实施例中,如本文公开的非人动物包含B细胞,例如仍未经历类别转换的B细胞,其在其基因组中包含与内源性轻链恒定区可操作地连接的单个重排的V/J轻链序列,其中与非人动物的种系基因组中发现的可操作地连接至内源性轻链恒定区基因的单个重排的V/J轻链序列相比,单个重排的V/J轻链不包含体细胞突变。在其它实施例中,如本文公开的非人动物包含B细胞,例如已经历类别转换的B细胞,其在其基因组中包含与内源性轻链恒定区可操作地连接的单个重排的V/J轻链序列,其中与非人动物的种系基因组中发现的可操作地连接至内源性轻链恒定区基因的单个重排的V/J轻链序列相比,单个重排的V/J轻链包含体细胞突变。
因此,本发明提供了经遗传修饰的非人动物,连同用于制备该动物的方法和组合物,其中所述遗传修饰包含经改造的DH区和单个重排的轻链基因座,并且其中所述动物还表达经遗传改造的单个重排轻链,例如经改造的共同轻链(ULC),其可与非人动物的组织或细胞中含有由经改造的DH区编码的氨基酸的重链结合。
基于在其基因组中经改造的DH区的存在和/或非人动物的组织或细胞中含有由核苷酸编码序列编码的氨基酸的抗体的表达,可鉴定转基因建立者非人动物。转基因建立者非人动物然后可用于育种携带经改造的DH区的另外非人动物,从而产生各自携带经改造的DH区的一个或多个拷贝的一系列非人动物。此外,根据需要,携带经改造的DH区的转基因非人动物还可与携带其它转基因(例如人免疫球蛋白基因)的其它转基因非人动物育种。
还可产生转基因非人动物,以含有允许转基因的调控或定向表达的选择系统。示例性系统包括细菌噬菌体P1的Cre/loxP重组酶系统(参见例如Lakso,M.等人,1992,Proc.Natl.Acad.Sci.USA 89:6232-6236)、以及酿酒酵母的FLP/Frt重组酶系统(O’Gorman,S.等人,1991,Science 251:1351-1355)。可通过构建“双重”转基因动物来提供此类动物,例如通过使两种转基因动物交配,一种含有包含选择修饰(例如经改造的DH区)的转基因,并且另一种含有编码重组酶(例如Cre重组酶)的转基因。
本文所述的非人动物可如上所述或使用本领域已知的方法制备,以包含另外的人或人源化基因,经常取决于非人动物的预期用途。此类另外的人或人源化基因的遗传物质可通过进一步改变具有上述遗传修饰的细胞(例如,胚胎干细胞)的基因组,或通过本领域已知的繁育技术利用所需的其他基因修饰品系引入。在一些实施例中,制备本文所述的非人动物以进一步包含转基因人免疫球蛋白重链和轻链基因(参见例如Murphy,A.J.等人,(2014)Proc.Natl.Acad.Sci.U.S.A.111(14):5153-5158;美国专利号8,502,018;美国专利号8,642,835;美国专利号8,697,940;美国专利号:8,791,323;和美国专利申请公开号2013/0096287 A1;以引用的方式并入本文)。在一些实施例中,制备本文所述的非人动物,以进一步包含一个或多个人免疫球蛋白轻链基因或基因座(例如,转基因的、内源的等),如美国专利申请公开号2011-0195454 A1、2012-0021409 A1、2012-0192300 A1、2013-0045492 A1、2013-0185821 A1、2013-0198880 A1、2013-0302836 A1、2015-0059009 A1;国际专利申请公开号WO 2011/097603、WO 2012/148873、WO 2013/134263、WO 2013/184761、WO 2014/160179、WO 2014/160202中所述;所有这些专利在此以引用的方式并入。
在一些实施例中,本文所述的非人动物可通过将如本文所述的靶向载体引入来自经修饰的品系的细胞内来制备。仅举一个例子,如上所述的靶向载体可引入VELOCI
Figure BDA0003308863620001181
小鼠内。
Figure BDA0003308863620001182
小鼠表达具有完全人可变区和小鼠恒定区的抗体。在一些实施例中,制备本文所述的非人动物,以进一步包含人免疫球蛋白基因(可变区和/或恒定区基因)。在一些实施例中,本文所述的非人动物包含如本文所述的经改造的DH区和来自异源物种(例如人)的遗传材料,其中所述遗传材料全部或部分编码一个或多个人重链和/或轻链可变区。
例如,如本文所述,包含经改造的DH区的非人动物还可包含(例如,经由交叉育种或多重基因靶向策略)一种或多种修饰,如Murphy,A.J.等人,(2014)Proc.Natl.Acad.Sci.U.S.A.111(14):5153-5158;美国专利号8,502,018;美国专利号8,642,835;美国专利号8,697,940;美国专利号:8,791,323;美国专利申请公开号2011-0195454 A1、2012-0021409 A1、2012-0192300 A1、2013-0045492 A1、2013-0096287 A1、2013-0185821A1、2013-0198880 A1、2013-0302836 A1、2015-0059009 A1;国际专利申请公开号WO 2011/097603、WO 2012/148873、WO 2013/134263、WO 2013/184761、WO 2014/160179或WO 2014/160202中所述,所有这些申请以引用的方式全文并入本文。在一些实施例中,将包含如本文所述的经改造的DH区的啮齿类动物与包含人源化的免疫球蛋白重链和/或轻链可变区基因座的啮齿类动物杂交(参见例如美国专利号8,502,018或美国专利号8,642,835;以引用的方式并入本文)。在一些实施例中,将如本文所述的包含经改造的DH区的啮齿类动物与包含人源化的免疫球蛋白轻链基因或基因座的啮齿类动物杂交,如美国专利申请公开号2011-0195454 A1、2012-0021409 A1、2012-0192300 A1、2013-0045492 A1、2013-0185821 A1、2013-0198880 A1、2013-0302836 A1、2015-0059009 A1;国际专利申请公开号WO 2011/097603、WO 2012/148873、WO 2013/134263、WO 2013/184761、WO 2014/160179、WO 2014/160202中所述;所有这些专利在此以引用的方式并入。
尽管本文广泛讨论了在小鼠中使用经改造的DH区的实施例(即,具有与人VH和JH基因区段可操作地连接的经改造的DH区的小鼠,所有这些与一个或多个鼠重链恒定区基因可操作地连接),但还提供了包含经改造的DH区的其它非人动物。在一些实施例中,此类非人动物包含与内源性VH和JH基因区段可操作地连接的经改造的DH区。在一些实施例中,此类非人动物包含与人源化的VH和JH基因区段可操作地连接的经改造的DH区。此类非人动物包括可被遗传修饰以表达具有CDR3的抗体的那些中的任一种,所述CDR3包括由对应于如本文公开的目的多肽的一部分的核苷酸编码序列编码的氨基酸,所述非人动物包括例如哺乳动物,例如小鼠、大鼠、兔、猪、牛族动物(例如奶牛、公牛、水牛)、鹿、绵羊、山羊、鸡、猫、狗、雪貂、灵长类动物(例如、绒猴、恒河猴)等。例如,对于那些适当的可经遗传修饰的ES细胞不容易获得的非人动物,采用其他方法来制备包含遗传修饰的非人动物。此类方法包括例如修饰非ES细胞基因组(例如成纤维细胞或诱导的多能细胞)并利用体细胞核转移(SCNT)来将遗传修饰的基因组转移至合适的细胞,例如去核卵母细胞,以及在适于形成胚胎的条件下在非人动物中孕育所述修饰的细胞(例如修饰的卵母细胞)。
用于修饰非人动物基因组(例如,猪、奶牛、啮齿类动物、鸡等)的方法包括例如采用锌指核酸酶(ZFN)、转录激活物样效应物核酸酶(TALEN)或Cas蛋白(即CRISPR/Cas系统)修饰基因组,以包括如本文所述的经改造的DH区。用于修饰非人动物的种系基因组的方法的指导可在例如美国专利申请公开号2015-0376628 A1、US 2016-0145646 A1和US 2016-0177339 A1中找到;所述专利以引用的方式并入本文。
在一些实施例中,本文所述的非人动物是哺乳动物。在一些实施例中,本文所述的非人动物是小型哺乳动物,例如跳鼠总科(Dipodoidea)或鼠总科(Muroidea)的小型哺乳动物。在一些实施例中,本文所述的经遗传修饰的动物是啮齿类动物。在一些实施例中,本文所述的啮齿类动物选自小鼠、大鼠和仓鼠。在一些实施例中,本文所述的啮齿类动物选自鼠总科。在一些实施例中,本文所述的经遗传修饰的动物来自选自以下的科:丽仓鼠科(Calomyscidae)(例如,鼠样仓鼠)、仓鼠科(Cricetidae)(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠科(Muridae)(真小鼠和大鼠、沙鼠、棘鼠、冠鼠)、马岛鼠科(Nesomyidae)(攀鼠、岩鼠、具尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(Platacanthomyidae)(例如多刺睡鼠)和鼹形鼠科(Spalacidae)(例如鼹鼠、竹鼠和鼢鼠)。在一些特定实施例中,本文所述的经遗传修饰的啮齿类动物选自真小鼠或大鼠(鼠科)、沙鼠、棘鼠和冠鼠。在一些特定实施例中,本文所述的经遗传修饰的小鼠来自鼠科成员。在一些实施例中,本文所述的非人动物是啮齿类动物。在一些特定实施例中,本文所述的啮齿类动物选自小鼠和大鼠。在一些实施例中,本文所述的非人动物是小鼠。
在一些实施例中,本文所述的非人动物是啮齿类动物,其为选自C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL品系的小鼠。在一些特定实施例中,本文所述的小鼠是选自其为129P1、129P2、129P3、129X1、129S1(例如129S1/SV、129S1/SvIm)、129S2、129S4、129S5、129S9/SvEvH、129/Sv Jae、129S6(129/SvEvTac)、129S7、129S8、129T1、129T2(参见例如Festing等人,1999,Mammalian Genome 10:836;Auerbach,W.等人,2000,Biotechniques 29(5):1024-1028,1030,1032)品系的129品系。在一些特定实施例中,本文所述的经遗传修饰的小鼠是前述129品系和前述C57BL/6品系的混合物。在一些特定实施例中,本文所述的小鼠是前述129品系的混合物、或前述BL/6品系的混合物。在某些实施例中,如本文所述的混合物的129品系为129S6(129/SvEvTac)品系。在一些实施例中,本文所述的小鼠是BALB品系,例如BALB/c品系。在一些实施例中,本文所述的小鼠是BALB品系和另一种前述品系的混合物。
在一些实施例中,本文所述的非人动物是大鼠。在一些特定实施例中,本文所述的大鼠选自Wistar大鼠、LEA品系、Sprague Dawley品系、Fischer品系、F344、F6和DarkAgouti。在某些实施例中,本文所述的大鼠品系为选自Wistar、LEA、Sprague Dawley、Fischer、F344、F6和Dark Agouti的两个或更多个品系的混合物。
采用具有经改造的多样性簇的非人动物的方法
已开发了用于生产基于抗体的治疗剂的几种体外和体内技术。特别地,体内技术的特征在于产生含有人免疫球蛋白基因的转基因动物(即啮齿类动物),所述人免疫球蛋白基因随机掺入动物的基因组内(例如参见美国专利号5,569,825)或精确地置于内源性免疫球蛋白基因座处,与动物的内源性免疫球蛋白恒定区可操作地连接(例如参见美国专利号8,502,018;8,642,835;8,697,940;和8,791,323)。这两种方法在生产用于人中使用的有希望的抗体治疗候选物方面均具有成效。进一步地,这两种方法均具有超过体外方法的优点,因为抗体候选物选自体内生成的抗体储库,其包括在宿主的免疫系统的内部环境内对于抗原的亲和力和特异性选择。以这种方式,抗体结合天然存在的抗原(在相关生物表位和表面内),而不是可伴随体外技术的人工环境或计算机芯片预测。尽管从体内技术产生的强大的抗体储库,但针对复合物(例如跨膜多肽)或细胞质抗原的抗体仍是困难的。进一步地,由于免疫耐受性,生成针对在物种(例如,人和小鼠)之间共享高度序列同一性的多肽的抗体仍是挑战。
因此,本文尤其描述了以下认识:使用各自编码目的多肽的一部分的一个或多个核苷酸编码序列(即,合成序列)可制备体内系统的构建,所述体内系统的特征在于产生在CDR中具有增加的多样性的抗体,特别是由非传统序列生成的CDR3(即不是传统DH基因区段或自然界中出现的DH基因区段)。这种增加的多样性可指导与特定抗原(例如跨膜多肽)的结合。例如,如本文所述,可通过改造为含有免疫球蛋白重链基因座的非人动物生成阻断一种或多种炎性细胞因子(例如β-趋化因子)的抗体,所述免疫球蛋白重链基因座含有经改造的DH区,所述经改造的DH区包括一个或多个核苷酸编码序列,其各自编码细胞因子受体(例如β-趋化因子受体)的细胞外部分。本文还描述了可通过改造为含有免疫球蛋白重链基因座的非人动物生成阻断或抑制离子通道(例如,NaV通道)的活性和/或功能的抗体,所述免疫球蛋白重链基因座含有经改造的DH区,所述经改造的DH区包括一个或多个核苷酸编码序列,其各自编码毒素(例如,μ-芋螺毒素和/或狼蛛毒素)的一部分。在VH基因区段、核苷酸编码序列和JH基因区段重组后,形成重链可变编码序列,其含有具有部分由核苷酸编码序列编码的序列的CDR3区,并且由此指导与核苷酸编码序列相关的特定抗原的结合。
本文所述的非人动物可用于制备人抗体,所述人抗体包含源自通过如本文所述的非人动物细胞的遗传材料编码的一个或多个可变区核酸序列的可变结构域。例如,本文所述的非人动物用β-趋化因子(或NaV通道多肽,全部或部分)在一定条件下免疫一段时间,所述时间足以使非人动物发展针对所述β-趋化因子(或NaV通道多肽,全部或部分)的免疫应答。从非人动物(或者一个或多个细胞,例如一个或多个B细胞)中分离抗体,并且使用各种测定进行表征,所述测定测量例如亲和力、特异性、表位作图、阻断配体-受体相互作用的能力、抑制性受体活化等。在各种实施例中,由本文所述的非人动物产生的抗体包含一个或多个人可变结构域,其源自从非人动物中分离的一个或多个人可变区核苷酸序列。在一些实施例中,抗药物抗体(例如抗独特型抗体)可在本文所述的非人动物中产生。
本文所述的非人动物提供了用于产生可用于各种测定的人抗体的改进的体内系统和生物材料(例如细胞)源。在各种实施例中,本文所述的非人动物用于开发靶向一种或多种细胞因子和/或调节细胞因子活性和/或调节与其它结合配偶体(例如细胞因子受体)的细胞因子相互作用的治疗剂。在各种实施例中,本文所述的非人动物用于开发靶向一种或多种离子通道和/或调节离子通道活性和/或调节与其它结合配偶体的离子通道相互作用的治疗剂。在各种实施例中,本文所述的非人动物用于鉴定、筛选和/或开发候选治疗剂(例如抗体、siRNA等),所述候选治疗剂结合一种或多种人细胞因子多肽或离子通道(例如钾通道、钙通道或钠通道)。在各种实施例中,本文所述的非人动物用于筛选和开发候选治疗剂(例如抗体、siRNA等),所述候选治疗剂阻断一种或多种人β-趋化因子多肽的活性或者阻断一种或多种人电压门控钠(NaV)通道的活性。在各种实施例中,本文所述的非人动物用于确定一种或多种人β-趋化因子多肽或者一种或多种人NaV通道的拮抗剂和/或激动剂的结合概况。在一些实施例中,本文所述的非人动物用于确定一种或多种候选治疗性抗体的一个或多个表位,所述一种或多种候选治疗性抗体结合一种或多种人β-趋化因子多肽或者结合一种或多种人NaV通道。
在各种实施例中,本文所述的非人动物用于确定抗β-趋化因子或抗NaV抗体的药代动力学概况。在各种实施例中,本文所述的一种或多种非人动物和一种或多种对照或参考非人动物各自暴露于以各种剂量(例如0.1mg/kg、0.2mg/kg、0.3mg/kg、0.4mg/kg、0.5mg/kg、1mg/kg、2mg/kg、3mg/kg、4mg/kg、5mg/mg、7.5mg/kg、10mg/kg、15mg/kg、20mg/kg、25mg/kg、30mg/kg、40mg/kg、或50mg/kg或更多)的一种或多种候选治疗性抗β-趋化因子或抗NaV抗体。候选治疗性抗体可经由各种所需的施用途径(包括肠胃外和非肠胃外施用途径)来给药。肠胃外途径包括例如静脉内、动脉内、门静脉内、肌内、皮下、腹膜内、脊柱内、鞘内、脑室内、颅内、胸膜内或其他注射途径。非肠胃外途径包括例如经服、经鼻、经皮、经肺、经直肠、经颊面、经阴道、经眼。施用还可通过连续输注、局部施用、从植入物(凝胶、膜等)持续释放和/或静脉内注射来进行。在多个时间点(例如0hr、6hr、1天、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天或最多30或更多天)从非人动物(人源化和对照组)分离血液。可使用得自如文中所述的非人动物的样品进行各种测定以确定施用的候选治疗性抗体的药代动力学性质,包括但不限于总IgG、抗-治疗性抗体应答、凝集等。
在各种实施例中,本文所述的非人动物用于测量阻断或调节β-趋化因子活性(或β-趋化因子信号转导、或β-趋化因子介导的相互作用)的疗效,以及对基因表达的作用,由于如本文所述的非人动物的细胞变化或细胞的β-趋化因子受体密度。在各种实施例中,本文所述的非人动物或由其分离的细胞暴露于结合人β-趋化因子多肽(或人β-趋化因子多肽的一部分)的候选治疗剂,并且在随后的一段时间后,分析对β-趋化因子依赖性过程(或相互作用),例如配体-受体相互作用或β-趋化因子信号传导的作用。
在各种实施例中,本文所述的非人动物用于测量阻断或调节NaV通道活性(或NaV通道信号传导、或NaV介导的相互作用或NaV通道动作电位)的疗效,以及对基因表达的作用,由于如本文所述的非人动物的细胞变化或细胞的NaV通道密度。在各种实施例中,本文所述的非人动物或由其分离的细胞暴露于结合人NaV通道(或人NaV通道的一部分)的候选治疗剂,并且在随后的一段时间后,分析对NaV通道依赖性过程(或相互作用),例如配体-受体相互作用或NaV通道动作电位的作用。
在各种实施例中,本文所述的非人动物可用于制备作用于电压门控钠通道(例如NaV1.7)的人抗体。此类人抗体可在非人动物中进行测试和/或开发,所述非人动物具有不同于本文所述那种的修饰,例如如美国专利号8,871,996和8,486,647中描述的修饰,所述专利以引用的方式并入本文。
本文所述的非人动物表达结合一种或多种β-趋化因子(或NaV通道)的抗体,因此可生成细胞、细胞系和细胞培养物,以充当用于结合和功能测定中的抗β-趋化因子(或抗NaV)抗体源,例如以测定人β-趋化因子(或NaV通道)拮抗剂或激动剂的结合或功能,特别是当拮抗剂或激动剂对于人β-趋化因子序列(或人NaV通道序列)或表位特异性,或者可替代地,对于在配体-受体相互作用(结合)中起作用的人β-趋化因子序列(或人NaV通道序列)或表位特异性时。在各种实施例中,可使用从本文所述的非人动物中分离的细胞来测定由候选治疗性抗体或siRNA结合的β-趋化因子表位(或NaV通道表位)。
来自本文所述的非人动物的细胞可分离并且在特定目的基础上使用,或者可在培养中维持许多代。在各种实施例中,来自本文所述的非人动物的细胞永生化(例如,经由病毒的使用),并且在培养中(例如,在连续培养中)无限期地维持。
本文所述的非人动物提供了用于生成抗体变体的体内系统,所述抗体结合一种或多种β-趋化因子多肽(或NaV通道)。此类变体包括具有所需功能性、特异性、与由两种或更多种β-趋化因子多肽(或NaV通道)共享的共同表位的低交叉反应性的抗体。在一些实施例中,本文所述的非人动物用于生成抗体实验对象组,以生成筛选所需或改进功能性的一系列变体抗体。
本文所述的非人动物提供了用于生成抗β-趋化因子(或抗NaV)抗体文库的体内系统。此类文库提供了重链和轻链可变区序列源,其可基于所需效应子功能移植到不同的Fc区上和/或使用本领域已知的技术(例如定点诱变、易错PCR等)用作可变区序列的亲和力成熟的来源。
本文所述的非人动物提供了用于分析和测试药物或疫苗的体内系统。在各种实施例中,可将候选药物或疫苗递送至本文所述的一种或多种非人动物,随后监测非人动物,以确定对药物或疫苗的免疫应答、药物或疫苗的安全性概况、或者对疾病或状况和/或疾病或状况的一种或多种症状的作用中的一种或多种。用于确定安全性概况的示例性方法包括测量毒性、最佳剂量浓度、抗体(即抗药物)应答、药物或疫苗的功效以及可能的危险因素。此类药物或疫苗可在此类非人动物中进行改进和/或开发。
疫苗功效可以多种方式确定。简言之,使用本领域已知的方法疫苗接种本文所述的非人动物,然后用疫苗攻击或将疫苗施用于已经感染的非人动物。非人动物对疫苗的应答可通过监测人动物(或由其分离的细胞)和/或对非人动物(或由其分离的细胞)执行一种或多种测定来测量,以确定疫苗的功效。然后使用本领域已知的和/或本文所述的一种或多种测量,将非人动物对疫苗的应答与对照动物进行比较。
疫苗功效还可通过病毒中和测定来确定。简言之,免疫本文所述的非人动物,并且在免疫后的不同日收集血清。连续稀释的血清与病毒预温育,在此期间血清中对于病毒特异性的抗体将与其结合。然后将病毒/血清混合物加入允许细胞中,以通过噬斑测定或微量中和测定来确定感染性。如果血清中的抗体中和病毒,则存在与对照组相比较少的噬斑或较低的相对荧光素酶单位。
本文所述的非人动物提供了用于开发和表征基于抗体的治疗剂的改进的体内系统,所述基于抗体的治疗剂用于癌症和/或炎性疾病中。炎症长期以来已与癌症相关(例如在Grivennikov,S.I.等人,2010,Cell 140:883-99;Rakoff-Nahoum,S.,2006,YaleJ.Biol.Med.79:123-30中综述)。事实上,发展中的肿瘤环境的特征部分在于各种炎症介质的浸润。此外,持续的炎症可导致发展中的癌症的更高概率。因此,在一些实施例中,本文所述的非人动物提供了用于开发和/或鉴定抗癌和/或抗炎治疗剂的体内系统。在各种实施例中,可用肿瘤(或肿瘤细胞)植入本文所述的非人动物或对照非人动物(例如,具有不同于本文所述的遗传修饰或不具有遗传修饰,即野生型),随后施用一种或多种候选治疗剂。在一些实施例中,候选治疗剂可包括多特异性抗体(例如双特异性抗体)或抗体混合物。在一些实施例中,候选治疗剂包括组合疗法,例如,序贯或同时给药的两种或更多种单特异性抗体的施用。在一种或多种候选治疗剂施用之前,可允许肿瘤在非人动物内的一个或多个位置中建立足够的时间。可在施用候选治疗之前和之后测量肿瘤细胞增殖、生长、存活等。也可根据需要在非人动物中测量候选治疗剂的细胞毒性。
本文所述的非人动物提供了用于开发和表征基于抗体的治疗剂的改进的体内系统,所述基于抗体的治疗剂用于治疗疼痛(例如,神经性)或用作止痛剂。在一些实施例中,本文所述的非人动物提供了用于开发和/或鉴定抗疼痛治疗剂的体内系统。在各种实施例中,本文所述的非人动物或对照非人动物(例如具有不同于本文所述的遗传修饰[例如,如美国专利号8,871,996和8,486,647中所述的修饰;所述专利以引用的方式并入本文]或不具有遗传修饰,即野生型)可经受疼痛刺激(例如切口、化学诱导等;参见例如Recognitionand Alleviation of Pain in Laboratory Animals.Washingto n D.C.:NationalAcademies Press,2009.Print),随后施用一种或多种候选治疗剂。在一些实施例中,候选治疗剂可包括多特异性抗体(例如双特异性抗体)或抗体混合物。在一些实施例中,候选治疗剂包括组合疗法,例如,序贯或同时给药的两种或更多种单特异性抗体的施用。在一种或多种候选治疗剂施用之前,可允许足够的时间段。可在用候选治疗剂施用之前和用候选治疗剂施用之后,记录通常与疼痛管理和/或疼痛治疗效果评价相关的各种测量和/或测试。
试剂盒
本文还描述了包含一个或多个容器的包装或试剂盒,所述一个或多个容器填充有如本文所述的至少一种非人动物、非人细胞、DNA片段和/或靶向载体。试剂盒可以用于任何适用的方法(例如,研究方法)。任选地与一个或多个此类容器相关的可以是由政府机构规定形式的注意事项,该注意事项规定药物或生物产品的制造、使用或销售,该注意事项反映了(a)机构关于用于人类施用的制造、使用或销售的批准,(b)使用说明或它们二者,或管理两个或更多个实体之间的材料和/或生物产品(例如,本文所述的非人动物或非人细胞)的转移的合约。
所述实施例的其它特点将在示例性实施例的下述描述的过程中将变得显而易见,所述示例性实施例为了说明而给出,并且不预期是其限制。
其他实施例如下:
1.一种啮齿类动物,其基因组包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的DH区,其中所述经改造的DH区包括一个或多个核苷酸序列,所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分。
2.根据权利要求1所述的啮齿类动物,其中所述免疫球蛋白重链可变区是人免疫球蛋白重链可变区。
3.根据权利要求1或2所述的啮齿类动物,其中所述免疫球蛋白重链可变区可操作地连接至免疫球蛋白重链恒定区。
4.根据权利要求3所述的啮齿类动物,其中所述免疫球蛋白重链恒定区是内源性免疫球蛋白重链恒定区。
5.根据前述权利要求中任一项所述的啮齿类动物,其中所述目的非免疫球蛋白多肽是趋化因子受体。
6.根据权利要求5所述的啮齿类动物,其中所述趋化因子受体是非典型趋化因子受体(ACKR)。
7.根据权利要求6所述的啮齿类动物,其中所述ACKR是D6趋化因子诱饵受体。
8.根据权利要求7所述的啮齿类动物,其中所述经改造的DH区包括5、10、15、20、25个或更多个核苷酸序列,所述核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。
9.根据权利要求8所述的啮齿类动物,其中所述经改造的DH区包括25个核苷酸序列,所述核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。
10.根据权利要求8或9所述的啮齿类动物,其中所述D6趋化因子诱饵受体的细胞外部分选自N末端区域、细胞外环及其组合。
11.根据权利要求9所述的啮齿类动物,其中所述25个核苷酸序列各自编码与表3中出现的序列至少95%相同的序列。
12.根据权利要求9所述的啮齿类动物,其中所述25个核苷酸序列各自编码与表3中出现的序列基本上相同的序列。
13.根据权利要求9所述的啮齿类动物,其中所述25个核苷酸序列各自编码与表3中出现的序列相同的序列。
14.根据前述权利要求中任一项所述的啮齿类动物,其中所述一个或多个核苷酸序列包含增加所述一个或多个核苷酸序列的体细胞超突变的一个或多个核苷酸取代。
15.根据权利要求1-4中任一项所述的啮齿类动物,其中所述目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。
16.根据权利要求15所述的啮齿类动物,其中所述芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。
17.根据权利要求16所述的啮齿类动物,其中所述芋螺毒素是μ-芋螺毒素。
18.根据权利要求17所述的啮齿类动物,其中所述经改造的DH区包括5、10、15、20、25个或更多个核苷酸序列,其各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。
19.根据权利要求18所述的啮齿类动物,其中所述经改造的DH区包括26个核苷酸序列,其各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。
20.根据权利要求19所述的啮齿类动物,其中所述26个核苷酸序列各自编码与表4中出现的序列至少95%相同的序列。
21.根据权利要求19所述的啮齿类动物,其中所述26个核苷酸序列各自编码与表4中出现的序列基本上相同的序列。
22.根据权利要求19所述的啮齿类动物,其中所述26个核苷酸序列各自编码与表4中出现的序列相同的序列。
23.根据权利要求15-22中任一项所述的啮齿类动物,其中所述一个或多个核苷酸序列包含增加所述一个或多个核苷酸序列的体细胞超突变的一个或多个核苷酸取代。
24.根据前述权利要求中任一项所述的啮齿类动物,其中所述经改造的DH区还包括侧接所述一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。
25.根据权利要求24所述的啮齿类动物,其中所述第一重组信号序列包含与图2中出现的第一重组信号序列至少95%相同的序列。
26.根据权利要求24所述的啮齿类动物,其中所述第一重组信号序列包含与图2中出现的第一重组信号序列基本上相同的序列。
27.根据权利要求24所述的啮齿类动物,其中所述第一重组信号序列包含与图2中出现的第一重组信号序列相同的序列。
28.根据权利要求24所述的啮齿类动物,其中所述第二重组信号序列包含与图2中出现的第二重组信号序列至少95%相同的序列。
29.根据权利要求24所述的啮齿类动物,其中所述第二重组信号序列包含与图2中出现的第二重组信号序列基本上相同的序列。
30.根据权利要求24所述的啮齿类动物,其中所述第二重组信号序列包含与图2中出现的第二重组信号序列相同的序列。
31.根据权利要求24所述的啮齿类动物,其中所述第一重组信号序列和第二重组信号序列选自图2。
32.根据前述权利要求中任一项所述的啮齿类动物,其中所述啮齿类动物的基因组缺乏一个或多个野生型内源性DH基因区段。
33.根据前述权利要求中任一项所述的啮齿类动物,其中所述啮齿类动物的基因组缺乏一个或多个野生型内源性重组信号序列。
34.根据权利要求1-33中任一项所述的啮齿类动物,其中所述啮齿类动物是大鼠或小鼠。
35.一种分离的啮齿类动物细胞或组织,其基因组包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的DH区,其中所述经改造的DH区包括一个或多个核苷酸序列,所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分。
36.一种永生化细胞,其由根据权利要求35所述的分离的啮齿类动物细胞制备。
37.一种啮齿类动物胚胎干细胞,其基因组包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的DH区,其中所述经改造的DH区包括一个或多个核苷酸序列,所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分。
38.一种啮齿类动物胚胎,其由根据权利要求37所述的啮齿类动物胚胎干细胞生成。
39.一种制备啮齿类动物的方法,所述啮齿类动物的基因组含有免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的DH区,所述方法包括
(a)将DNA片段插入啮齿类动物胚胎干细胞内,所述DNA片段包含一个或多个核苷酸序列,所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分;
(b)获得(a)中生成的所述啮齿类动物胚胎干细胞;和
(c)使用(b)的胚胎干细胞产生啮齿类动物。
40.根据权利要求39所述的方法,其中所述目的非免疫球蛋白多肽是趋化因子受体。
41.根据权利要求40所述的方法,其中所述趋化因子受体是非典型趋化因子受体(ACKR)。
42.根据权利要求41所述的方法,其中所述ACKR是D6趋化因子诱饵受体。
43.根据权利要求42所述的方法,其中所述DNA片段包括5、10、15、20、25个或更多个核苷酸序列,所述核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。
44.根据权利要求43所述的方法,其中所述DNA片段包括25个核苷酸序列,所述25个核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。
45.根据权利要求43或44所述的方法,其中所述D6趋化因子诱饵受体的细胞外部分选自N末端区域、细胞外环及其组合。
46.根据权利要求39所述的方法,其中所述目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。
47.根据权利要求46所述的方法,其中所述芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。
48.根据权利要求47所述的方法,其中所述芋螺毒素是μ-芋螺毒素。
49.根据权利要求48所述的方法,其中所述DNA片段包括5、10、15、20、25个或更多个核苷酸序列,所述核苷酸序列各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。
50.根据权利要求49所述的方法,其中所述DNA片段包括26个核苷酸序列,所述26个核苷酸序列各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。
51.根据权利要求44或50所述的方法,其中所述DNA片段还包含侧接所述25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。
52.一种制备啮齿类动物的方法,所述啮齿类动物的基因组含有免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的DH区,所述方法包括
修饰所述啮齿类动物的基因组,使得它包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的DH区,所述经改造的DH区包含一个或多个核苷酸序列,所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分,由此制备所述啮齿类动物。
53.根据权利要求52所述的方法,其中所述目的非免疫球蛋白多肽是趋化因子受体。
54.根据权利要求53所述的方法,其中所述趋化因子受体是非典型趋化因子受体(ACKR)。
55.根据权利要求54所述的方法,其中所述ACKR是D6趋化因子诱饵受体。
56.根据权利要求55所述的方法,其中所述啮齿类动物的基因组被修饰为包括5、10、15、20、25个或更多个核苷酸序列,所述核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。
57.根据权利要求56所述的方法,其中所述啮齿类动物的基因组被修饰为包括25个核苷酸序列,所述25个核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。
58.根据权利要求56或57所述的方法,其中所述D6趋化因子诱饵受体的细胞外部分选自N末端区域、细胞外环及其组合。
59.根据权利要求52所述的方法,其中所述目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。
60.根据权利要求59所述的方法,其中所述芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。
61.根据权利要求60所述的方法,其中所述芋螺毒素是μ-芋螺毒素。
62.根据权利要求61所述的方法,其中所述啮齿类动物的基因组被修饰为包括5、10、15、20、25个或更多个核苷酸序列,其各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。
63.根据权利要求62所述的方法,其中所述啮齿类动物的基因组被修饰为包括26个核苷酸序列,其各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。
64.根据权利要求57或63所述的方法,其中所述啮齿类动物的基因组被修饰为还包括侧接所述25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。
65.根据权利要求39-64中任一项所述的方法,其中所述免疫球蛋白重链可变区是人免疫球蛋白重链可变区。
66.根据权利要求39-64中任一项所述的方法,其中所述免疫球蛋白重链可变区可操作地连接至免疫球蛋白重链恒定区。
67.根据权利要求66所述的方法,其中所述免疫球蛋白重链恒定区是内源性免疫球蛋白重链恒定区。
68.一种在啮齿类动物中产生抗体的方法,所述方法包括以下步骤:
(a)用抗原免疫啮齿类动物,所述啮齿类动物具有包含免疫球蛋白重链可变区的基因组,所述免疫球蛋白重链可变区包括经改造的DH区,其中所述经改造的DH区包括一个或多个核苷酸序列,其各自编码目的非免疫球蛋白多肽或其一部分;
(b)将所述啮齿类动物维持在足以使所述啮齿类动物对所述抗原产生免疫应答的条件下;和
(c)从所述啮齿类动物或啮齿类动物细胞中回收结合所述抗原的抗体。
69.根据权利要求68所述的方法,其中所述啮齿类动物细胞是B细胞。
70.根据权利要求68所述的方法,其中所述啮齿类动物细胞是杂交瘤。
71.根据权利要求68-70中任一项所述的方法,其中所述目的非免疫球蛋白多肽是趋化因子受体。
72.根据权利要求71所述的方法,其中所述趋化因子受体是非典型趋化因子受体(ACKR)。
73.根据权利要求72所述的方法,其中所述ACKR是D6趋化因子诱饵受体。
74.根据权利要求73所述的方法,其中所述经改造的DH区包括5、10、15、20、25个或更多个核苷酸序列,其各自编码D6趋化因子诱饵受体的细胞外部分。
75.根据权利要求74所述的方法,其中所述经改造的DH区包括25个核苷酸序列,其各自编码D6趋化因子诱饵受体的细胞外部分。
76.根据权利要求74或75所述的方法,其中所述D6趋化因子诱饵受体的细胞外部分选自N末端区域、细胞外环及其组合。
77.根据权利要求68-70中任一项所述的方法,其中所述目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。
78.根据权利要求77所述的方法,其中所述芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。
79.根据权利要求78所述的方法,其中所述芋螺毒素是μ-芋螺毒素。
80.根据权利要求79所述的方法,其中所述经改造的DH区包括5、10、15、20、25个或更多个核苷酸序列,其各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。
81.根据权利要求80所述的方法,其中所述经改造的DH区包括26个核苷酸序列,其各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。
82.根据权利要求75或81所述的方法,其中所述经改造的DH区还包含侧接所述25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。
83.根据权利要求68-82中任一项所述的方法,其中所述免疫球蛋白重链可变区是人免疫球蛋白重链可变区。
84.根据权利要求68-83中任一项所述的方法,其中所述免疫球蛋白重链可变区可操作地连接至免疫球蛋白重链恒定区。
85.根据权利要求84所述的方法,其中所述免疫球蛋白重链恒定区是内源性免疫球蛋白重链恒定区。
86.根据权利要求39-85中任一项所述的方法,其中所述啮齿类动物是大鼠或小鼠。
87.一种啮齿类动物,其基因组包含
人免疫球蛋白重链可变区,所述人免疫球蛋白重链可变区包含一个或多个人VH基因区段、经改造的DH区和一个或多个人JH基因区段,所述经改造的DH区包括
(i)各自编码非典型趋化因子受体(ACKR)的细胞外部分的一个或多个核苷酸序列;和
(ii)侧接(i)的一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列;
其中所述人免疫球蛋白重链可变区可操作地连接至一个或多个内源性免疫球蛋白恒定区基因,使得所述啮齿类动物的特征在于当它用抗原免疫时,它生成的抗体包含由所述一个或多个人VH基因区段编码的人重链可变结构域、经改造的DH区、以及可操作地连接至由一个或多个内源性免疫球蛋白恒定区基因编码的啮齿类动物重链恒定结构域的一个或多个人JH基因区段,并且其中所述抗体显示与所述抗原的特异性结合。
88.根据权利要求87所述的啮齿类动物,其中所述ACKR是D6趋化因子诱饵受体。
89.根据权利要求88所述的啮齿类动物,其中所述经改造的DH区包括25个核苷酸序列,所述核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。
90.根据权利要求89所述的啮齿类动物,其中所述D6趋化因子诱饵受体的细胞外部分选自N末端区域、细胞外环及其组合。
91.一种啮齿类动物,其基因组包含
人免疫球蛋白重链可变区,所述人免疫球蛋白重链可变区包含一个或多个人VH基因区段、经改造的DH区和一个或多个人JH基因区段,所述经改造的DH区包括
(i)各自编码毒素的一部分的一个或多个核苷酸序列;和
(ii)侧接(i)的一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列;
其中所述人免疫球蛋白重链可变区可操作地连接至一个或多个内源性免疫球蛋白恒定区基因,使得所述啮齿类动物的特征在于当它用抗原免疫时,它生成的抗体包含由所述一个或多个人VH基因区段编码的人重链可变结构域、经改造的DH区、以及可操作地连接至由一个或多个内源性免疫球蛋白恒定区基因编码的啮齿类动物重链恒定结构域的一个或多个人JH基因区段,并且其中所述抗体显示与所述抗原的特异性结合。
92.根据权利要求91所述的啮齿类动物,其中所述一个或多个核苷酸序列各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。
93.根据权利要求92所述的啮齿类动物,其中所述经改造的DH区包括26个核苷酸序列,其各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。
94.根据权利要求87或91所述的啮齿类动物,其中所述一个或多个核苷酸序列包含增加所述一个或多个核苷酸序列的体细胞超突变的一个或多个核苷酸取代。
95.根据权利要求87-94中任一项所述的啮齿类动物,其还包含将一个或多个人VL基因区段和一个或多个人JL基因区段插入内源性轻链基因座内。
96.根据权利要求95所述的啮齿类动物,其中所述人VL和JL区段是Vκ和Jκ基因区段,并且插入内源性κ轻链基因座内。
97.根据权利要求96所述的啮齿类动物,其中所述人Vκ和Jκ基因区段与啮齿类动物Cκ基因可操作地连接。
98.根据权利要求95所述的啮齿类动物,其中所述人VL和JL区段是Vλ和Jλ基因区段,并且插入内源性λ轻链基因座内。
99.根据权利要求98所述的啮齿类动物,其中所述人Vλ和Jλ基因区段与啮齿类动物Cλ基因可操作地连接。
100.根据权利要求87-99中任一项所述的啮齿类动物,其中所述啮齿类动物是大鼠或小鼠。
实例
提供下述实例以便向本领域普通技术人员描述如何制备和使用本文公开的方法和组合物,并且不预期限制发明人视为其发明的范围。除非另外指明,否则所给出的温度为摄氏度,压力是大气压或接近大气压。
实例1.经改造的多样性簇的构建,所述经改造的多样性簇包括在免疫球蛋白重链可变区内的D6趋化因子诱饵受体的核苷酸编码序列
本实例示出了构建用于插入非人动物如啮齿类动物(例如小鼠)的基因组内的靶向载体的示例性方法。特别地,本实例中描述的方法证实了用于插入啮齿类动物(例如小鼠)胚胎干(ES)细胞的基因组内的靶向载体的产生,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述免疫球蛋白重链可变区包括经改造的重链多样性(DH)区,所述经改造的DH区包括各自编码非免疫球蛋白多肽或其一部分的一个或多个核苷酸序列。在本实例中,非典型趋化因子受体(ACKR)例如D6趋化因子诱饵受体的细胞外结构域的编码序列,用于构建用于整合到免疫球蛋白重链可变区内的靶向载体。如下所述,将编码序列置于与重链可变(VH)和重链连接(JH)区段的可操作地连接中,代替传统DH基因区段,使得在VDJ重组后,表达具有由编码序列生成的VH CDR3的抗体。
使用
Figure BDA0003308863620001331
技术(参见例如美国专利号6,586,251和Valenzuela等人,2003,Nature Biotech.21(6):652-659;以引用的方式并入本文)和本领域已知的分子生物学技术,产生含有来自D6趋化因子诱饵受体的细胞外结构域的编码序列的靶向载体,所述编码序列用于插入免疫球蛋白重链可变区内。根据需要,本实例中描述的方法可用于利用源自任何所需多肽的编码序列的任何集合、或编码序列(或编码序列片段)的组合。在图3和4中阐述了使用来自D6趋化因子诱饵受体的细胞外结构域的编码序列,用于构建靶向载体的可替代和非限制性的示例性策略。
简言之,通过从头DDNA合成制备一系列四种DNA片段(D6-DH1116、D6-DH17613、D6-DH114619和D6DH120126),所述DNA片段各自含有几个D6编码序列(表5;Blue HeronBiotech,Bothell,WA))。在每种DNA片段的末端处包括各种限制性酶位点和/或重叠区(~40bp,其包括多重限制性酶位点),以允许随后的串联克隆(参见下文)。单个人DH区段(即DH6-25)在DH区中保持完整,所述DH区改造为含有对应于D6诱饵趋化因子受体的细胞外结构域一部分的核苷酸编码序列。在一些实施例中,免疫球蛋白基因区段(例如DH区段)可与亚最佳或缺陷的重组信号序列(例如七聚体和/或九聚体序列)结合,使得此类DH区段的使用基本上小于与表征为野生型、正常和/或无缺陷的重组信号序列结合的DH区段的使用。因此,当改造DH区以含有各自编码目的非免疫球蛋白多肽或其一部分(例如,D6趋化因子诱饵受体)的核苷酸编码序列时,此类DH区段(例如图2中显示的DH6-25,RSS序列)可保持完整或缺失。
免疫球蛋白参与称为体细胞超突变的细胞机制,其产生特征在于对其靶的高亲和力的亲和力成熟的抗体变体。尽管体细胞超突变在很大程度上在抗体可变区的CDR内发生,但突变优先靶向称为热点的某些序列基序,例如RGYW活化诱导胞苷脱氨酶(AID)热点(参见例如Li,Z.等人,2004,Genes Dev.18:1-11;Teng,G.和F.N.Papavasiliou,2007,Annu.Rev.Genet.41:107-20;在此以引用的方式并入)。每个D6编码序列的核酸序列天然含有此类热点序列,然而,将人工热点引入选择的D6编码序列内,以优化在B细胞受体的克隆选择期间的体细胞超突变的潜力。在从头合成之前,将用于SHM的人工热点引入计算机芯片上的D6编码序列内。图1阐述了本文所述的D6编码序列中采用的天然和人工热点的示例性分析。
V(D)J重组由称为重组信号序列(RSS)的侧翼DNA序列引导,所述侧翼DNA序列确保在相对于V、D和J编码序列的精确位置处的DNA重排。每个RSS由以下组成:与编码序列邻接的七个核苷酸(七聚体)的保守嵌段,随后为非保守的间隔物(12或23bp)和九个核苷酸(九聚体)的第二保守嵌段。每个D6编码序列都设计有优化的RSS,以允许更好的重组频率和相等的使用。简言之,DH RSS序列中的所有七聚体和九聚体都替换为共有序列(图2)。修复非功能性“仅ORF”DH区段的RSS序列,以允许与D6编码序列一起使用。如本文所述,“仅ORF”是包括编码序列的DH区段,所述编码序列可在至少一个开放读码框中翻译,但具有至少一个非功能性RSS序列(不被RAG重组酶识别)。本发明人认识到,优化的七聚体和九聚体无法确保所有的D6编码序列都以相等的频率使用,至少部分是由于来自间隔物、编码末端序列、侧翼基因间序列等的不可预测的影响。如上文对于体细胞超突变热点所述,在D6 DNA片段的从头合成之前,在计算机芯片上设计优化的RSS。
制备D6 DNA片段用于串联装配在一起,采用设计到每个片段内的限制性酶位点和重叠区。通过使用AgeI和EcoRI的限制性消化,制备D6-DH1166片段和携带新霉素盒的质粒用于连接(图3A,上)。根据制造商的说明书,使用DNA连接酶将AgeI/EcoRI消化的质粒和D6-DH1166片段连接在一起。用SnaBI消化连接产物和剩余的D6DNA片段。将BAC载体(pBACE3.6)分别用NotI和AscI消化,以接受D6 DNA片段(图3A,中)。如先前所述,使用一步等温装配来装配D6-DH1166/新霉素盒连接产物和剩余的D6 DNA片段(图3A,下;Barnes,W.M.,1994,Proc.Natl.Acad.Sci.91(6):2216-20;Gibson,D.G.等人,2009,Nat.Methods 6(5):343-5;Gibson,D.G.等人,2010,Nat.Methods 7(11):901-3)。然后将装配的D6 DNA片段(图3B,上)用PI-SceI和I-CeuI消化,并且经由相容性末端,与含有5'和3'同源臂的BAC克隆连接在一起,所述5'和3'同源臂分别含有~50kb的人可变区基因组DNA和人JH簇(图3B,中)。最终的靶向载体从5'到3'含有~50kb的5'同源臂(其含有人可变区DNA)、新霉素盒、含有D6趋化因子诱饵受体的25个细胞外编码序列的~41kb DNA片段、人JH簇、小鼠重链内含子增强子(Ei)、小鼠IgM恒定区基因和lox位点(图3B,下)。
可替代地,上述D6 DNA片段可通过使用分子技术来装配,所述分子技术不同于上述那些,仍为本领域已知的。例如,因为D6 DNA片段串联排列,所以根据需要通过使用设计到片段末端内的不同限制性位点/重叠区,可实现各种不同的设计(例如编码序列的次序)。图4A和4B中阐述了通过序贯连接装配上述D6 DNA片段的示例性替代方法。
将上述D6-DH靶向载体引入小鼠胚胎干(ES)细胞内,用于产生含有免疫球蛋白重链基因座的经修饰的ES细胞,所述免疫球蛋白重链基因座含有经改造的多样性簇,例如经改造的DH区。
表5
Figure BDA0003308863620001351
Figure BDA0003308863620001361
实例2.具有经改造的多样性簇的啮齿类动物的生成,所述经改造的多样性簇包括在免疫球蛋白重链可变区内的D6趋化因子诱饵受体的核苷酸编码序列
本实例证实了其基因组包含免疫球蛋白重链可变区的非人动物(例如啮齿类动物)的产生,所述免疫球蛋白重链可变区包括经改造的重链多样性(DH)区,其中所述经改造的DH区包括一个或多个核苷酸序列,其各自编码非免疫球蛋白多肽的一部分,特别是非典型趋化因子受体(ACKR),例如D6趋化因子诱饵受体的细胞外部分。
通过使用表6中阐述的引物的测序和在靶向载体的构建自始至终的聚合酶链反应,证实了实例1中描述的D6-DH靶向载体的正确装配和D6 DNA片段靶向插入BAC DNA的多样性簇内。然后经由电穿孔,将通过聚合酶链反应证实的靶向BAC DNA引入F1杂种(129S6SvEvTac/C57BL6NTac)小鼠胚胎干(ES)细胞内,随后为在选择培养基中的培养。用于电穿孔的ES细胞具有基因组,其包括与啮齿类动物免疫球蛋白重链恒定区(例如IgM)可操作地连接的人VH和JH基因区段,缺少人DH区的全部或部分(即缺失),并且含有编码一种或多种鼠Adam6基因的插入序列(参见例如美国专利号8,642,835和8,697,940)。如先前所述(Valenzuela等人,同上;Frendewey,D.等人,2010,Methods Enzymol.476:295-307),使用检测D6编码序列正确整合到免疫球蛋白可变区的多样性簇内的引物/探针组(表7[F:正向引物,P:探针,R:反向引物]和图5),在电穿孔后10天挑选抗药性集落,并且通过
Figure BDA0003308863620001371
和核型分型筛选正确靶向。
使用
Figure BDA0003308863620001372
方法(DeChiara,T.M.等人,2010,Methods Enzymol.476:285-294;Dechiara,T.M.,2009,Methods Mol.Biol.530:311-324;Poueymirou等人,2007,Nat.Biotechnol.25:91-99),其中将靶向ES细胞注射到未压实的8细胞期Swiss Webster胚胎内,以产生健康的完全ES细胞来源的F0代小鼠,其对于经改造的DH区是杂合的并且表达含有重链可变区的抗体,所述重链可变区包括由D6编码序列的重组生成的CDR3区。将F0代杂合子雄性与C57Bl6/NTac雌性杂交,以生成F1杂合体,所述F1杂合体互交,以产生F2代纯合体和野生型小鼠用于表型分析。
药物选择盒可任选通过随后添加重组酶(例如通过Cre处理)或通过与Cre缺失者小鼠品系育种(参见例如国际专利申请公开号WO 2009/114400)来去除,以便去除通过靶向构建体引入的任何loxed选择的盒,所述loxed选择的盒例如在ES细胞期时或在胚胎中未被去除。任选地,选择盒保留在小鼠中。
总之,本实例示出了其基因组包含免疫球蛋白重链可变区的啮齿类动物(例如小鼠)的生成,所述免疫球蛋白重链可变区包括经改造的重链多样性(DH)区,所述经改造的DH区的特征在于包括一个或多个核苷酸序列,其各自编码非典型趋化因子受体(ACKR),例如D6趋化因子诱饵受体的细胞外部分。本文所述的用于将D6编码序列插入传统DH区段内的策略使得能够构建表达多种抗体的啮齿类动物,所述抗体各自包含由D6编码序列的重组生成的重链CDR3。利用人VH和JH区段的存在,本文所述的啮齿类动物提供了用于产生基于人抗体的治疗剂的体内系统,所述基于人抗体的治疗剂的特征在于结合一种或多种CCL的多样性,并且在一些实施例中,提供了用于人使用的基于抗体的消炎药。
表6
Figure BDA0003308863620001381
Figure BDA0003308863620001391
表7
Figure BDA0003308863620001392
Figure BDA0003308863620001401
Figure BDA0003308863620001411
Figure BDA0003308863620001421
实例3.经改造的多样性簇的构建,所述经改造的多样性簇包括在免疫球蛋白重链可变区内的一种或多种毒素肽的核苷酸编码序列
本实例示出了构建用于插入非人动物如啮齿类动物(例如小鼠)的基因组内的靶向载体的示例性方法。特别地,本实例中描述的方法证实了用于插入啮齿类动物(例如小鼠)胚胎干(ES)细胞的基因组内的靶向载体的产生,以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物,所述免疫球蛋白重链可变区包括经改造的重链多样性(DH)区,所述经改造的DH区包括各自编码非免疫球蛋白多肽的一部分的一个或多个核苷酸序列。在本实例中,两种毒素(例如芋螺毒素,例如μ-芋螺毒素和狼蛛毒素,例如ProTxII)的编码序列,用于构建用于整合到免疫球蛋白重链可变区内的靶向载体。如下所述,将编码序列置于与重链可变(VH)和重链连接(JH)区段的可操作地连接中,代替传统DH基因区段,使得在VDJ重组后,表达具有由编码序列生成的CDR3的抗体。
如上文实例1中所述,产生含有来自μ-芋螺毒素和狼蛛毒素(例如ProTxII)的编码序列的靶向载体,所述编码序列用于插入免疫球蛋白重链可变区内。根据需要,本文所述的方法可用于利用源自任何所需芋螺毒素(例如α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素和/或ω-芋螺毒素)、狼蛛毒素(例如ProTxI、ProTxII、虎纹捕鸟蛛毒素-IV[HWTX-IV]等)的编码序列的任何集合、或编码序列(或编码序列片段)的组合。在图7A和7B中阐述了使用来自μ-芋螺毒素和狼蛛毒素的编码序列用于构建靶向载体的示例性策略。
简言之,通过从头DNA合成制备一系列四种DNA片段,所述DNA片段各自含有几个μ-芋螺毒素(μCTX)和狼蛛毒素(ProTxII)编码序列(表8;Blue Heron Biotech,Bothell,WA)。实例1中所述,在每种DNA片段的末端处包括各种限制性酶位点和/或重叠区,以允许随后的串联克隆。总共26个毒素编码序列用于构建经改造的DH区,其包括整个DH编码序列的替换和插入DH编码序列内(即,仅部分替换DH)。用相应的毒素编码序列在DH位置1-26、2-2、2-8、2-15、2-21、3-3、3-9、3-10、3-16和3-22处进行毒素编码序列的插入,而用毒素编码序列替换DH序列在DH位置1-1、1-7、1-14、1-20、4-4、4-11、4-17、4-23、5-5、5-12、5-18、5-24、6-6、6-13、6-19和6-25处进行(参见表8)。在插入的情况下,将毒素序列插入开放读码框二(ORF2)中,并且侧翼为DH共有序列(例如参见图2)。保留天然侧翼DH序列提供天然的柔性接头序列和/或使用DH2区段中的二硫键来环化编码的毒素肽。与实例1中描述的使用D6编码序列构建的经改造的DH区相比,在构建包括毒素编码序列的DH区中,DH6-25被替换为全长μCTXKIIIA(μCTX-KIIIA fl;SEQ ID NO:228,参见表8)。
如实例1中所述,每个毒素编码序列的核酸序列天然含有此类热点序列,然而,在从头合成之前,在计算机芯片上将人工热点引入选择的毒素编码序列内,以优化在B细胞受体的克隆选择期间的体细胞超突变的潜力(参见图6A-6L)。进一步地,在从头合成之前,每个毒素编码序列在计算机芯片上设计有优化的RSS,以允许更好的重组频率和相等的使用(图2)。如实例1所述制备毒素DNA片段的装配(参见图7A和7B)。
可替代地,上述毒素DNA片段可通过使用分子技术来装配,所述分子技术不同于上述那些,仍为本领域已知的。例如,因为毒素DNA片段串联排列,所以根据需要通过使用设计到片段末端内的不同限制性位点/重叠区,可实现各种不同的设计(例如编码序列的次序)。图8A和8B中阐述了通过序贯连接装配上述毒素DNA片段的示例性替代方法。
将上述TX-DH靶向载体引入小鼠胚胎干(ES)细胞内,用于产生含有免疫球蛋白重链基因座的经修饰的ES细胞,所述免疫球蛋白重链基因座含有经改造的多样性簇。
表8
Figure BDA0003308863620001431
Figure BDA0003308863620001441
Figure BDA0003308863620001451
实例4.具有经改造的多样性簇的啮齿类动物的生成,所述经改造的多样性簇包括在免疫球蛋白重链可变区内的一种或多种毒素肽的核苷酸编码序列
本实例证实了其基因组包含免疫球蛋白重链可变区的非人动物(例如啮齿类动物)的产生,所述免疫球蛋白重链可变区包括经改造的重链多样性(H)区,其中所述经改造的H区包括一个或多个核苷酸序列,其各自编码非免疫球蛋白多肽的一部分,特别是毒素,例如芋螺毒素(例如μ-芋螺毒素)、狼蛛毒素(例如ProTxII)或其组合。
通过使用表6中阐述的引物的测序和在靶向载体的构建自始至终的聚合酶链反应,证实了实例3中描述的TX-DH靶向载体的正确装配和毒素DNA片段靶向插入BAC DNA的多样性簇内。然后经由电穿孔,将通过聚合酶链反应证实的靶向BAC DNA引入F1杂种(129S6SvEvTac/C57BL6NTac)小鼠胚胎干(ES)细胞内,随后为在选择培养基中的培养。用于电穿孔的ES细胞具有基因组,其包括与啮齿类动物免疫球蛋白重链恒定区(例如IgM)可操作地连接的人VH和JH基因区段,缺少人DH区(即缺失),并且含有编码一种或多种鼠Adam6基因的插入序列(参见例如美国专利号8,642,835和8,697,940)。如先前所述(Valenzuela等人,同上;Frendewey,D.等人,2010,Methods Enzymol.476:295-307),使用检测毒素编码序列正确整合到免疫球蛋白可变区的多样性簇内的引物/探针组(表7和图5),在电穿孔后10天挑选抗药性集落,并且通过
Figure BDA0003308863620001452
和核型分型筛选正确靶向。
使用
Figure BDA0003308863620001453
方法(DeChiara,T.M.等人,2010,Methods Enzymol.476:285-294;Dechiara,T.M.,2009,Methods Mol.Biol.530:311-324;Poueymirou等人,2007,Nat.Biotechnol.25:91-99),其中将靶向ES细胞注射到未压实的8细胞期Swiss Webster胚胎内,以产生健康的完全ES细胞来源的F0代小鼠,其对于经改造的DH区是杂合的并且表达含有重链可变区的抗体,所述重链可变区包括由毒素编码序列的重组生成的CDR3区。将F0代杂合子雄性与C57Bl6/NTac雌性杂交,以生成F1杂合体,所述F1杂合体互交,以产生F2代纯合体和野生型小鼠用于表型分析。
药物选择盒可任选通过随后添加重组酶(例如通过Cre处理)或通过与Cre缺失者小鼠品系育种(参见例如国际专利申请公开号WO 2009/114400)来去除,以便去除通过靶向构建体引入的任何loxed选择的盒,所述loxed选择的盒例如在ES细胞期时或在胚胎中未被去除。任选地,选择盒保留在小鼠中。
总之,本实例示出了其基因组包含免疫球蛋白重链可变区的啮齿类动物(例如小鼠)的生成,所述免疫球蛋白重链可变区包括经改造的重链多样性(DH)区,所述经改造的DH区的特征在于包括一个或多个核苷酸序列,其各自编码毒素肽的一部分,例如μ-芋螺毒素、ProTxII或其组合。本文所述的用于将毒素编码序列插入传统DH区段内的策略使得能够构建表达抗体的啮齿类动物,所述抗体被配置为使得它们含有由毒素编码序列的重组生成的重链CDR3。利用人VH和JH区段的存在,本文所述的啮齿类动物提供了用于产生基于人抗体的治疗剂的体内系统,所述基于人抗体的治疗剂的特征在于指导与离子通道(例如电压门控钠通道,例如NaV1.7)结合的多样性,并且在一些实施例中,提供了用于人使用的基于抗体的抗疼痛药物。
实例5.具有经改造的多样性簇的啮齿类动物的表型评价
本实例证实了其基因组包含免疫球蛋白重链可变区的啮齿类动物(例如小鼠)中的各种免疫细胞群的表征,所述免疫球蛋白重链可变区包括经改造的重链多样性(DH)区,其中所述经改造的DH区包括一个或多个核苷酸序列,其各自编码非免疫球蛋白多肽的一部分。在本实例中,如实例3中所述的对于包括毒素编码序列(例如μ-芋螺毒素和狼蛛毒素)的经改造的DH区纯合的啮齿类动物,通过流式细胞术进行分析,用于鉴定在收获的脾和骨髓中的免疫细胞,使用几种荧光标记的抗体。本实例还证实了对于经改造的DH区杂合的小鼠所收获的脾和骨髓中的免疫细胞的鉴定,所述经改造的DH区如实例1中所述包括ACKR2(也称为D6趋化因子诱饵受体)的细胞外部分的编码序列。如下文所述,与对照经改造的小鼠相比,如本文所述含有经改造的DH区的小鼠证实在脾和骨髓区室中相似水平的B细胞。重要的是,本实例还证实,如本文所述的含有经改造的DH区的小鼠证实B细胞的发育和成熟不含B细胞免疫应答中的任何缺陷或不足,并且产生含有由插入的编码序列重排生成的CDR3区和相邻的免疫球蛋白基因区段(即人VH和JH)的抗体。
简言之,从
Figure BDA0003308863620001461
小鼠(n=3,26%C57BL/6 22%129S6/SvEvTac50%Balb/cAnNTac;参见例如美国专利号8,502,018和8,642,835)和6579ho/1293ho小鼠(“TX-DH ho”,n=3;38%C57BL/6NTac 36%129S6/SvEvTac 25%Balb/cAn NTac;对于免疫球蛋白重链基因座纯合的小鼠,所述免疫球蛋白重链基因座含有多个人VH,代替传统DH区段的包括毒素编码序列的经改造的DH区段,以及可操作地连接至包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区的JH区段,并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940];并且对于免疫球蛋白κ轻链基因座纯合,所述免疫球蛋白κ轻链基因座含有可操作地连接至包括啮齿类动物κ轻链增强子的啮齿类动物Cκ区基因的人Vκ和Jκ基因区段)中收获脾和股骨。通过离心从股骨中收集骨髓。用ACK裂解缓冲液(Gibco)裂解来自脾和骨髓制备物的红血细胞,随后用含2%FBS的1xPBS洗涤。将分离的细胞(1x106)与选择的抗体混合物在+4℃下温育30分钟:染色1:大鼠抗小鼠CD43-FITC(Biolegend 121206,克隆1B11),大鼠抗小鼠c-kit-PE(Biolegend 105808,克隆2B8),大鼠抗小鼠IgM-PeCy(eBiosciences 25-5790-82,克隆II/41),大鼠抗小鼠IgD-PerCP-Cy5.5(Biolegend 405710,克隆11-26c.2a),大鼠抗小鼠CD3-PB(Biolegend 100214,克隆17-A2),大鼠抗小鼠B220-APC(eBiosciences 17-0452-82,克隆RA3-6B2),以及大鼠抗小鼠CD19-APC-H7(BD 560143克隆1D3)。染色2:大鼠抗小鼠κ-FITC(BD 550003,克隆187.1),大鼠抗小鼠λ-PE(Biolegend 407308,克隆RML-42),大鼠抗小鼠IgM-PeCy(eBiosciences 25-5790-82,克隆II/41),大鼠抗小鼠IgD-PerCP-Cy5.5(Biolegend 405710,克隆11-26c.2a),大鼠抗小鼠CD3-PB(Biolegend 100214,克隆17-A2),大鼠抗小鼠B220-APC(eBiosciences 17-0452-82,克隆RA3-6B2),以及大鼠抗小鼠CD19-APC-H7(BD 560143克隆1D3)。染色3:大鼠抗小鼠CD23-FITC(Biolegend 101606克隆B3B4),大鼠抗小鼠CD93(Biolegend136504,克隆AA4.1),大鼠抗小鼠IgM-PeCy(eBiosciences 25-5790-82,克隆II/41),大鼠抗小鼠IgD-PerCP-Cy5.5(Biolegend405710,克隆11-26c.2a),大鼠抗小鼠CD19-V450(BD 560375,克隆1D3),大鼠抗小鼠CD21/35-APC(BD 558658,克隆7G6),以及大鼠抗小鼠B220-APC-eFl780(eBioscences 47-0452-82,克隆RA3-6B2)。在染色后,将细胞洗涤并在2%甲醛中固定。数据采集在BD
Figure BDA0003308863620001471
流式细胞仪上执行,并且用
Figure BDA0003308863620001472
软件进行分析。代表性结果在图9A-9D和图10A-10D中阐述。
在类似的实验中,从
Figure BDA0003308863620001474
小鼠(n=3,26%C57BL/6 23%129SvEvTac 51%Balb/cAnNTac;参见例如美国专利号8,502,018和8,642,835)和6590het小鼠(“D6-DH het”,n=3;75%C57BL/6 25%129SvEvTac;对于免疫球蛋白重链基因座杂合的小鼠,所述免疫球蛋白重链基因座含有多个人VH,代替传统DH区段的包括D6趋化因子诱饵受体编码序列的经改造的DH区段,以及可操作地连接至包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区的JH区段,并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940]中收获脾和股骨;并且通过流式细胞术分析(如上所述)。代表性结果在图11A-11D和图12A-12D中阐述。
在另一个类似的实验中,从
Figure BDA0003308863620001473
小鼠(n=3,38%C57BL/6 36%129SvEvTac 25%Balb/cAnNTac;参见例如美国专利号8,502,018和8,642,835)和6590ho/1293ho小鼠(“D6-DH ho”,n=3;38%C57BL/6 36%129SvEvTac 25%Balb/c AnNTac)中收获脾和股骨,所述6590ho/1293ho小鼠是对于免疫球蛋白重链基因座纯合的小鼠,所述免疫球蛋白重链基因座含有多个人VH,代替一个或多个传统DH区段的包括D6趋化因子诱饵受体编码序列的经改造的DH区段,以及可操作地连接至包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区的JH区段,并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940];并且对于免疫球蛋白κ轻链基因座纯合,所述免疫球蛋白κ轻链基因座含有可操作地连接至包括啮齿类动物κ轻链增强子的啮齿类动物Cκ区基因的人Vκ和Jκ基因区段),并且通过流式细胞术分析(如上所述)。代表性结果在图13A-13D和图14A-14D中阐述。
结果显示与对照经改造的小鼠相比,TX-DH ho小鼠证实在脾和骨髓区室中相似百分比的B细胞。对于一些TX-DH ho小鼠,观察到更高百分比的Igλ阳性细胞(例如参见图9C和图10D)。总的来说,与对照经改造的小鼠相比,脾中的B细胞成熟证实在TX-DH ho小鼠中的正常进展。
D6-DH het小鼠也证实脾和骨髓区室两者中相似的B细胞百分比(图11A-12D)。与对照小鼠相比,D6-DH het小鼠看起来也具有相似的轻链比率(图11C和12D)。D6-DH也证实了B细胞的总体正常发育和成熟。
实例6.经改造的DH区中的人基因使用和编码序列的重排
本实例使用下一代测序(NGS)-抗体储库分析来证实如本文所述的含有经改造的DH区的啮齿类动物中的人V(D)J基因区段使用。特别地,对从小鼠(其对于含有毒素编码序列的经改造的DH区纯合)和小鼠(其对于含有ACKR2编码序列的经改造的DH区杂合)的分选的脾和未分选的骨髓中分离的RNA进行RT-PCR测序。如下所述,在来自具有经改造的DH区的小鼠的分析序列中观察到所有经改造的DH区段,所述经改造的DH区含有毒素编码序列代替传统DH区段。还在下文中描述,在来自具有经改造的DH区的小鼠的分析序列中观察到大部分(即25个中的16个)经改造的DH区段,所述经改造的DH区含有ACKR2(D6趋化因子诱饵受体)的细胞外部分的编码序列。
简言之,从6579ho/1293ho小鼠(“TX-DH ho”,n=3;同上)中收获脾和骨髓,并且通过使用小鼠抗CD19磁珠和
Figure BDA0003308863620001481
柱(Miltenyi Biotech)的磁性细胞分选,从总脾细胞中积极富集B细胞。根据制造商的说明书,使用RNeasy Plus RNA分离试剂盒(Qiagen),从分选的脾细胞和未分选的总骨髓中的富集B细胞中分离总RNA。然后根据制造商的说明书,使用SuperScript III逆转录酶(Thermo Fisher Scientific)和小鼠IgM恒定区引物(表9,IgMRT),从总RNA合成免疫球蛋白重链(μ链,IgM)cDNA。使用多路PCR策略扩增IgM cDNA,所述多路PCR策略采用设计为与VH前导序列退火的VH家族特异性引物(表9,VH多-1、2、3、4、5和6)的混合物和设计为与IgM恒定区退火的引物(表9,IgM PCR1)。使用Pippin Prep(SAGEScience)分离范围为~450-800bp的PCR产物,然后执行使用PCR2引物(表9,PCR2-F和PCR2-R,“XXXXXX”是6nt指数,以区分测序文库且允许同时测序多重文库)的第二PCR,以附着测序衔接子和指数。在加载到MiSeq测序仪(Illumina)上用于使用MiSeq Reagent Kits v3(2x300个循环)测序之前,将范围为~490bp-800bp的PCR产物分离,纯化且通过使用KAPALibrary Quantification Kit(KAPA Biosystems)的qPCR定量。表9阐述了用于储库文库构建的所选引物的序列。
对于生物信息学分析,将Raw Illumina序列去多路化,并且基于质量、长度以及与相应的恒定区基因引物的匹配来过滤。使用定制的内部管道合并且分析重叠的配对末端读数。该管道使用IgBLAST(NCBI,v2.2.25+)的本地安装,以将重排的轻链序列与人种系VH和JH基因区段数据库进行比对,并且指示生产性和非生产性连接连同终止密码子的存在。使用如国际免疫遗传学信息系统(IMGT)中定义的边界,提取CDR3序列和预期的非模板核苷酸。代表性结果在表10(使用每种VH家族特异性引物混合物在序列读数中与毒素编码序列的总匹配)和图15-17中阐述。
结果证实大部分分析的序列含有在VH区序列的CDR3区内的毒素序列。特别地,在具有经改造的DH区的小鼠中对应于生产性重排的约87%序列含有在CDR3区内的毒素氨基酸序列,所述经改造的DH区含有多重毒素编码序列代替传统DH区段。另外,在这些小鼠中位于传统DH区段的位置内的所有26个毒素编码序列以各种频率检测到。观察到的最高度利用的毒素编码序列是短的μCTX四(4)-氨基酸环SmIIIa(DH位置DH2-15)、μCTX-SmIIIA midi插入片段(DH位置DH3-16)和μCTX-PIIIA midi(DH位置DH3-22)。
在类似的实验中,使用如上所述的下一代测序(NGS)-抗体储库分析,在6590het小鼠(“D6-DH het”,n=3;同上)中分析人VH、经改造的DH和人JH区段使用。使用如上所述的多路PCR策略,对从分选的脾和未分选的骨髓中分离的RNA进行RT-PCR测序。代表性结果在表11中(由骨髓和脾扩增的RNA中的核苷酸(NT)序列读数中的框内氨基酸(AA)序列的数目)、表12(来自脾和骨髓的扩增RNA中的选择D6编码序列的百分比[合并所有VH家族,不反映定量VH使用])和图18-20中阐述。
结果证实从骨髓和脾扩增的RNA中使用的大部分D6编码序列长度为约30至40个核苷酸。特别地,在从D6-DH het小鼠分析的序列中最初没有观察到最长(例如Nterm+EC3(216nt))和最短(例如EC1-N(9nt))的D6编码序列。当评价来自经改造的DH区的D6编码序列的使用时,本发明人观察到某些限制。例如,本发明人注意到,由于凝胶大小选择步骤(参见上文),含有全长(或长于全长)更长的D6编码序列(例如,D6 Nterm+EC3,DH位置DH4-4;SEQID NO:33)的IgM序列可能从序列中排除,并且由于修整选择步骤,较短的D6编码序列(例如,D6EC1,DH位置DH5-5;SEQ ID NO:3)可能被排除。然而,对于较短的D6编码序列,序列的手动检查指示这些D6编码序列事实上存在于从扩增的RNA获得的序列中。进一步地,由于所选JH区段(例如,JH1)和D6编码序列之间的相似性,在与数据库比较时,本发明人观察到序列的不正确比对。此类序列相似性导致了较短DH序列的鉴定以及通过某些数据库的模糊注释的可能性。因此,几个序列需要使用人为进行的比对的个别分析。在从D6-DH het小鼠分析的所有序列中,约50-60%的氨基酸序列在框内,并且利用在扩增重链的CDR3区内的D6编码序列。进一步地,在来自RNA的扩增序列中检测到25个D6经改造的DH区段中的16个(表12),而D6 Nterm(DH3-3)、D6 Nterm+EC3(DH4-4)、D6 EC1(DH5-5)、D6 EC1-N(DH1-7)、D6 EC1-S(DH5-12)、D6 Nterm-S(DH6-13)、D6 Nterm-EC3(DH3-16)、D6 EC1+EC2(DH4-17)和D6 EC3-C(DH4-23)在分析的序列中未检测到。如上所述,这些D6编码序列中的一些,特别是较长的D6编码序列的使用在所分析的序列集合中无法被证实。总的来说,并未观察到在骨髓和脾来源的样品之间D6编码序列的使用中的重大差异。此外,在分析的序列中,看起来不存在针对D6编码序列的重排的负选择偏倚。
总之,本实例证实了具有经改造的免疫球蛋白重链基因座的小鼠,特征在于含有非免疫球蛋白多肽(例如,D6趋化因子诱饵受体或者一种或多种毒素)的编码序列代替传统DH区段的经改造的DH区的存在,能够将经改造的编码序列与相邻的人VH和JH区段重排,以形成功能性重链。进一步地,所提供的经改造的小鼠证实利用在几个人VH和JH区段家族的背景下改造到合成DH区内的多重编码序列的强大抗体储库。
表9
Figure BDA0003308863620001502
Figure BDA0003308863620001511
表10
Figure BDA0003308863620001512
表11
Figure BDA0003308863620001513
Figure BDA0003308863620001521
表12
Figure BDA0003308863620001522
Figure BDA0003308863620001531
实例7.在含有经改造的DH区的啮齿类动物中的抗体生产
本实例证实了其基因组中包含免疫球蛋白重链可变区的啮齿类动物中的抗体生产,所述免疫球蛋白重链可变区包括如本文所述的经改造的DH区。根据需要,本实例中描述的方法和/或本领域众所周知的免疫方法,可用于用多肽或其片段(例如,源自所需表位的肽)或者多肽或其片段的组合免疫含有如本文所述的经改造的DH区的啮齿类动物。
简言之,使用本领域已知的免疫方法,用目的抗原攻击包括如本文所述的经改造的DH区的小鼠群组。通过ELISA免疫测定(即血清滴度)监测抗体免疫应答。
包含单个重排的可变基因序列V:J的共同轻链小鼠(也称为通用轻链或ULC小鼠)(例如,Vκ1-39Jκ5或Vκ3-20Jκ1共同轻链小鼠)的生成、以及这些小鼠中抗原特异性抗体的生成,在例如美国专利申请号13/022,759、13/093,156、13/412,936、13/488,628、13/798,310和13/948,818(分别为公开号2011/0195454、2012/0021409、2012/0192300、2013/0045492、US20130185821和US20130302836)中描述,所述专利各自以引用的方式全文并入本文。具体地,制备在其种系中表达经遗传改造的Vκ1-39Jκ5κ轻链(1633HO或1634HO)或经遗传改造的Vκ3-20Jκ1κ轻链(1635HO或1636HO)的小鼠。
将含有单个重排的人种系轻链区(ULC Vκ1-39Jκ5;1633或1634)或(ULC Vκ3-20Jκ1;1635或1636)的
Figure BDA0003308863620001532
小鼠与携带经修饰的IgG恒定区的小鼠育种。具体地,将此类ULC小鼠与具有包含纯合的免疫球蛋白重链基因座的基因组的小鼠育种,所述纯合的免疫球蛋白重链基因座含有多个人VH、包括毒素编码序列代替传统DH区段的经改造的DH区段、以及与包括小鼠重链增强子和调控区的小鼠免疫球蛋白重链恒定区可操作地连接的JH区段,并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940],以获得对于包含毒素编码序列的重链基因座杂合或纯合,并且对于通用轻链杂合或纯合的后代小鼠。如图21中所示,对于含有毒素编码序列的经改造的DH区纯合并且对于通用轻链纯合的小鼠(6579HO/1634HO),在用可溶性蛋白质免疫后具有与对照动物(1460/1634)可比较的抗体应答。
实例8.分离表达和/或编码在含有经改造的DH区的啮齿类动物中产生的抗体的核酸的细胞
当获得所需免疫应答时,收获脾细胞(和/或其它淋巴组织)并且与小鼠骨髓瘤细胞融合,以保存其活力并形成永生的杂交瘤细胞系。杂交瘤细胞系进行筛选(例如通过ELISA测定)并选择,以鉴定产生抗原特异性抗体的杂交瘤细胞系。可根据需要进一步表征杂交瘤的相对结合亲和力和同种型。使用这种技术,获得几种抗原特异性嵌合抗体(即,具有人可变结构域和啮齿类动物恒定结构域的抗体)。
编码重链和轻链可变区的DNA可被分离并连接至重链和轻链的期望同种型(恒定区),用于制备全人抗体。此类抗体蛋白质可在细胞例如CHO细胞中产生。全人抗体然后就目的抗原的相对结合亲和力和/或中和活性进行表征。
编码抗原特异性嵌合抗体或轻链和重链的可变结构域的DNA可直接从抗原特异性淋巴细胞中分离。最初,分离具有人可变区和啮齿类动物恒定区的高亲和力嵌合抗体,并且针对期望特征(包括亲和力、选择性、表位等)进行表征且选择。用所需人恒定区替换啮齿类动物恒定区,以生成全人抗体。尽管所选恒定区可根据具体用途而变化,但高亲和力抗原结合和靶特异性特征存在于可变区中。还从抗原阳性B细胞(来自免疫小鼠)中直接分离抗原特异性抗体,而不融合至骨髓瘤细胞,如例如美国专利号7,582,298中所述,所述专利特别以引用的方式全文并入本文。使用这种方法,制备了几种全人抗原特异性抗体(即,具有人可变结构域和人恒定结构域的抗体)。
等同物
在如此地描述了本发明的至少一个实施例的若干方面后,本领域技术人员将理解,各种改变、修改和改进对于本领域技术人员来说将是容易进行的。此类改变、修改和改进旨在是本公开内容的一部分,并且旨在处于本发明的精神和范围之内。因此,上述描述和附图仅仅作为举例的方式,并且本发明通过下面的权利要求进行详细描述。
在权利要求中使用序数术语如"第一"、"第二"、"第三"等来修饰权利要求元素,其本身并不意味着一个权利要求要素相对于另一个要素的任何优先性、优先级或顺序或者其中执行方法行为的时间顺序,而是仅用作区分具有某一名称的一个权利要求元素与具有同一名称的另一个元素(但使用序数术语)的标记,以区分权利要求元素。
除非明确指出相反,否则说明书和权利要求书中的冠词“一个”和“一种”应该理解为包括复数指示物。在组的一个或多个成员之间包括"或"的权利要求或描述应当被视为是满足以下情况,即组成员中的一个、多于一个或全部存在于、被应用于给定的产品或方法中,或以其他方式与给定的产品或方法相关,除非指出相反或根据上下文明显不同。本发明包括这样的实施例,其中组中的一个确切成员存在于、被应用于给定的产品或方法中,或以其他方式与给定的产品或方法相关。本发明还包括这样的实施例,其中多于一个组成员或全部组成员存在于、被应用于给定的产品或方法中,或以其他方式与给定的产品或方法相关。此外,应当理解,本发明包括涵盖所有的变型、组合和取代,其中来自一条或多条所列权利要求的一个或多个限制、要素、子句、描述性用语被引入从属于同一基础权利要求的另一个权利要求(或者相关的任何其他权利要求)中,除非另外指出或除非对于本领域普通技术人员来说明显会引起矛盾或不一致。当要素以列表的形式(例如以马库什组或类似形式)呈现时,应当理解这些要素的每个亚组也被公开,并且任何要素可从该组中去除。应当理解,通常,当本发明或本发明的方面被称为包含特定的要素、特征等时,本发明的某些实施例或本发明的方面由此类要素、特征等组成或基本上由它们组成。为了简化的目的,这些实施例并不是在每种情况下都明确用本文陈述的那么多用词来具体描述。应当理解,本发明的任何实施例或方面可明确地从权利要求排除,不管在说明书中是否描述了此类具体排除。
本领域技术人员将理解可归因于本文中所述的测定或其他方法中获得的值的典型标准偏差或误差。
本文引用的用以描述本发明背景以及用以提供与其实施有关的其他细节的出版物、网站和其他参考材料均据此以引用方式并入。
序列表
<110> 瑞泽恩制药公司
<120> 具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途
<130> 017283.1066/10150WO01
<140> TBD
<141> 2017-01-12
<150> US 62/278,127
<151> 2016-01-13
<160> 245
<170> PatentIn version 3.5
<210> 1
<211> 150
<212> DNA
<213> 智人
<400> 1
atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60
agcttctact actatgacta cctggatgaa gtagctttca tgctctgccg gaaggatgct 120
gtggttagct ttggcaaagt tttcctgcca 150
<210> 2
<211> 50
<212> PRT
<213> 智人
<400> 2
Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp
1 5 10 15
Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala
20 25 30
Phe Met Leu Cys Arg Lys Asp Ala Val Val Ser Phe Gly Lys Val Phe
35 40 45
Leu Pro
50
<210> 3
<211> 15
<212> DNA
<213> 智人
<400> 3
agcttcttgt gcaag 15
<210> 4
<211> 5
<212> PRT
<213> 智人
<400> 4
Ser Phe Leu Cys Lys
1 5
<210> 5
<211> 102
<212> DNA
<213> 智人
<400> 5
caaacccatg aaaaccccaa gggagtttgg aactgccatg ccgatttcgg cgggcatggc 60
accatttgga agctcttcct ccggttccag cagaacctgc ta 102
<210> 6
<211> 34
<212> PRT
<213> 智人
<400> 6
Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn Cys His Ala Asp Phe
1 5 10 15
Gly Gly His Gly Thr Ile Trp Lys Leu Phe Leu Arg Phe Gln Gln Asn
20 25 30
Leu Leu
<210> 7
<211> 66
<212> DNA
<213> 智人
<400> 7
ctgcataccc tgctggacct gcaagtattc ggcaactgtg aggttagcca gcatctagac 60
tatgcc 66
<210> 8
<211> 22
<212> PRT
<213> 智人
<400> 8
Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Cys Glu Val Ser
1 5 10 15
Gln His Leu Asp Tyr Ala
20
<210> 9
<211> 150
<212> DNA
<213> 智人
<400> 9
atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60
agcttctact actatgacta cctggatgaa gtagctttca tgctcagccg gaaggatgct 120
gtggttagct ttggcaaagt tttcctgcca 150
<210> 10
<211> 50
<212> PRT
<213> 智人
<400> 10
Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp
1 5 10 15
Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala
20 25 30
Phe Met Leu Ser Arg Lys Asp Ala Val Val Ser Phe Gly Lys Val Phe
35 40 45
Leu Pro
50
<210> 11
<211> 15
<212> DNA
<213> 智人
<400> 11
agcttcttga gcaag 15
<210> 12
<211> 5
<212> PRT
<213> 智人
<400> 12
Ser Phe Leu Ser Lys
1 5
<210> 13
<211> 102
<212> DNA
<213> 智人
<400> 13
caaacccatg aaaaccccaa gggagtttgg aacagccatg ccgatttcgg cgggcatggc 60
accatttgga agctcttcct ccggttccag cagaacctgc ta 102
<210> 14
<211> 34
<212> PRT
<213> 智人
<400> 14
Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn Ser His Ala Asp Phe
1 5 10 15
Gly Gly His Gly Thr Ile Trp Lys Leu Phe Leu Arg Phe Gln Gln Asn
20 25 30
Leu Leu
<210> 15
<211> 66
<212> DNA
<213> 智人
<400> 15
ctgcataccc tgctggacct gcaagtattc ggcaacagtg aggttagcca gcatctagac 60
tatgcc 66
<210> 16
<211> 22
<212> PRT
<213> 智人
<400> 16
Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Ser Glu Val Ser
1 5 10 15
Gln His Leu Asp Tyr Ala
20
<210> 17
<211> 135
<212> DNA
<213> 智人
<400> 17
atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60
agcttctact actatgacta cctggatgaa gtagctttca tgctctgcga ggttagccag 120
catctagact atgcc 135
<210> 18
<211> 45
<212> PRT
<213> 智人
<400> 18
Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp
1 5 10 15
Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala
20 25 30
Phe Met Leu Cys Glu Val Ser Gln His Leu Asp Tyr Ala
35 40 45
<210> 19
<211> 81
<212> DNA
<213> 智人
<400> 19
ctgcataccc tgctggacct gcaagtattc ggcaactgtc ggaaggatgc tgtggttagc 60
tttggcaaag ttttcctgcc a 81
<210> 20
<211> 27
<212> PRT
<213> 智人
<400> 20
Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Cys Arg Lys Asp
1 5 10 15
Ala Val Val Ser Phe Gly Lys Val Phe Leu Pro
20 25
<210> 21
<211> 78
<212> DNA
<213> 智人
<400> 21
agcttcttgt gccatgccga tttcggcggg catggcacca tttggaagct cttcctccgg 60
ttccagcaga acctgcta 78
<210> 22
<211> 26
<212> PRT
<213> 智人
<400> 22
Ser Phe Leu Cys His Ala Asp Phe Gly Gly His Gly Thr Ile Trp Lys
1 5 10 15
Leu Phe Leu Arg Phe Gln Gln Asn Leu Leu
20 25
<210> 23
<211> 39
<212> DNA
<213> 智人
<400> 23
caaacccatg aaaaccccaa gggagtttgg aactgcaag 39
<210> 24
<211> 13
<212> PRT
<213> 智人
<400> 24
Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn Cys Lys
1 5 10
<210> 25
<211> 135
<212> DNA
<213> 智人
<400> 25
atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60
agcttctact actatgacta cctggatgaa gtagctttca tgctcagcga ggttagccag 120
catctagact atgcc 135
<210> 26
<211> 45
<212> PRT
<213> 智人
<400> 26
Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp
1 5 10 15
Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala
20 25 30
Phe Met Leu Ser Glu Val Ser Gln His Leu Asp Tyr Ala
35 40 45
<210> 27
<211> 81
<212> DNA
<213> 智人
<400> 27
ctgcataccc tgctggacct gcaagtattc ggcaacagtc ggaaggatgc tgtggttagc 60
tttggcaaag ttttcctgcc a 81
<210> 28
<211> 27
<212> PRT
<213> 智人
<400> 28
Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Ser Arg Lys Asp
1 5 10 15
Ala Val Val Ser Phe Gly Lys Val Phe Leu Pro
20 25
<210> 29
<211> 78
<212> DNA
<213> 智人
<400> 29
agcttcttga gccatgccga tttcggcggg catggcacca tttggaagct cttcctccgg 60
ttccagcaga acctgcta 78
<210> 30
<211> 26
<212> PRT
<213> 智人
<400> 30
Ser Phe Leu Ser His Ala Asp Phe Gly Gly His Gly Thr Ile Trp Lys
1 5 10 15
Leu Phe Leu Arg Phe Gln Gln Asn Leu Leu
20 25
<210> 31
<211> 39
<212> DNA
<213> 智人
<400> 31
caaacccatg aaaaccccaa gggagtttgg aacagcaag 39
<210> 32
<211> 13
<212> PRT
<213> 智人
<400> 32
Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn Ser Lys
1 5 10
<210> 33
<211> 216
<212> DNA
<213> 智人
<400> 33
atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60
agcttctact actatgacta cctggatgaa gtagctttca tgctctgccg gaaggatgct 120
gtggttagct ttggcaaagt tttcctgcca ctgcataccc tgctggacct gcaagtattc 180
ggcaactgtg aggttagcca gcatctagac tatgcc 216
<210> 34
<211> 72
<212> PRT
<213> 智人
<400> 34
Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp
1 5 10 15
Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala
20 25 30
Phe Met Leu Cys Arg Lys Asp Ala Val Val Ser Phe Gly Lys Val Phe
35 40 45
Leu Pro Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Cys Glu
50 55 60
Val Ser Gln His Leu Asp Tyr Ala
65 70
<210> 35
<211> 117
<212> DNA
<213> 智人
<400> 35
agcttcttgt gcaagcaaac ccatgaaaac cccaagggag tttggaactg ccatgccgat 60
ttcggcgggc atggcaccat ttggaagctc ttcctccggt tccagcagaa cctgcta 117
<210> 36
<211> 39
<212> PRT
<213> 智人
<400> 36
Ser Phe Leu Cys Lys Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn
1 5 10 15
Cys His Ala Asp Phe Gly Gly His Gly Thr Ile Trp Lys Leu Phe Leu
20 25 30
Arg Phe Gln Gln Asn Leu Leu
35
<210> 37
<211> 105
<212> DNA
<213> 智人
<400> 37
atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60
agcttctact actatgacta cctggatgaa gtagctttca tgctc 105
<210> 38
<211> 35
<212> PRT
<213> 智人
<400> 38
Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp
1 5 10 15
Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala
20 25 30
Phe Met Leu
35
<210> 39
<211> 42
<212> DNA
<213> 智人
<400> 39
cggaaggatg ctgtggttag ctttggcaaa gttttcctgc ca 42
<210> 40
<211> 14
<212> PRT
<213> 智人
<400> 40
Arg Lys Asp Ala Val Val Ser Phe Gly Lys Val Phe Leu Pro
1 5 10
<210> 41
<211> 9
<212> DNA
<213> 智人
<400> 41
agcttcttg 9
<210> 42
<211> 3
<212> PRT
<213> 智人
<400> 42
Ser Phe Leu
1
<210> 43
<211> 33
<212> DNA
<213> 智人
<400> 43
caaacccatg aaaaccccaa gggagtttgg aac 33
<210> 44
<211> 11
<212> PRT
<213> 智人
<400> 44
Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn
1 5 10
<210> 45
<211> 66
<212> DNA
<213> 智人
<400> 45
catgccgatt tcggcgggca tggcaccatt tggaagctct tcctccggtt ccagcagaac 60
ctgcta 66
<210> 46
<211> 22
<212> PRT
<213> 智人
<400> 46
His Ala Asp Phe Gly Gly His Gly Thr Ile Trp Lys Leu Phe Leu Arg
1 5 10 15
Phe Gln Gln Asn Leu Leu
20
<210> 47
<211> 36
<212> DNA
<213> 智人
<400> 47
ctgcataccc tgctggacct gcaagtattc ggcaac 36
<210> 48
<211> 12
<212> PRT
<213> 智人
<400> 48
Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn
1 5 10
<210> 49
<211> 27
<212> DNA
<213> 智人
<400> 49
gaggttagcc agcatctaga ctatgcc 27
<210> 50
<211> 9
<212> PRT
<213> 智人
<400> 50
Glu Val Ser Gln His Leu Asp Tyr Ala
1 5
<210> 51
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<220>
<221> misc_feature
<222> (10)..(21)
<223> n是a、c、g或t
<400> 51
acaaaaaccn nnnnnnnnnn ncacagtg 28
<210> 52
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<220>
<221> misc_feature
<222> (8)..(19)
<223> n是a、c、g或t
<400> 52
cacagtgnnn nnnnnnnnna caaaaacc 28
<210> 53
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<220>
<221> misc_feature
<222> (10)..(21)
<223> n是a、c、g或t
<400> 53
ggwtwytgwn nnnnnnnnnn ncactgtg 28
<210> 54
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<220>
<221> misc_feature
<222> (8)..(19)
<223> n是a、c、g或t
<400> 54
cacagtgnnn nnnnnnnnnb cmrmaacy 28
<210> 55
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<220>
<221> misc_feature
<222> (10)..(21)
<223> n是a、c、g或t
<400> 55
gatttttgtn nnnnnnnnnn ntactgtg 28
<210> 56
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<220>
<221> misc_feature
<222> (8)..(19)
<223> n是a、c、g或t
<400> 56
cacagtgnnn nnnnnnnnna caaaaacc 28
<210> 57
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<220>
<221> misc_feature
<222> (10)..(21)
<223> n是a、c、g或t
<400> 57
ggattttgtn nnnnnnnnnn ncactgtg 28
<210> 58
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<220>
<221> misc_feature
<222> (8)..(19)
<223> n是a、c、g或t
<400> 58
cacagtgnnn nnnnnnnnnt caaaaacc 28
<210> 59
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 59
ggattttgta cagccccgag tcactgtg 28
<210> 60
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 60
cacagtgaga aaaactgtgt caaaaacc 28
<210> 61
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 61
ggattttgta cagccccgag tcactgtg 28
<210> 62
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 62
cacagtgaga aaagcttcgt caaaaacc 28
<210> 63
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 63
ggattttgta cagccccgag tcactgtg 28
<210> 64
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 64
cacagtgaga atagctacgt caaaaacc 28
<210> 65
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 65
ggattttgta cagccccgag tcactgtg 28
<210> 66
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 66
cacagtgaga aaaactgtgt caaaaacc 28
<210> 67
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 67
ggattttgta cagccccgag tcactgtg 28
<210> 68
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 68
cacagtgaga aaagctatgt caaaaacc 28
<210> 69
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 69
ggattttgtg ggggctcgtg tcactgtg 28
<210> 70
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 70
cacagtgaca cagccccatt caaaaacc 28
<210> 71
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 71
ggattttgtg ggggctcgtg tcactgtg 28
<210> 72
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> optimized RSS
<400> 72
cacagtgaca cagccccatt caaaaacc 28
<210> 73
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 73
ggattttgtg ggggctcgtg tcactgtg 28
<210> 74
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 74
cacagtgaca cagacccatt caaaaacc 28
<210> 75
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 75
ggattttgtg ggggttcgtg tcactgtg 28
<210> 76
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 76
cacagtgaca caaccccatt caaaaacc 28
<210> 77
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 77
ggattttgtt gaggtctgtg tcactgtg 28
<210> 78
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 78
cacagtgtca cagagtccat caaaaacc 28
<210> 79
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 79
ggattttgtt gaggtctgtg tcactgtg 28
<210> 80
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 80
cacagtgtca cagagtccat caaaaacc 28
<210> 81
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 81
ggattttgtt gaggtctgtg tcactgtg 28
<210> 82
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 82
cacagtgtca cagagtccat caaaaacc 28
<210> 83
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 83
ggattttgtt gaggtctgtg tcactgtg 28
<210> 84
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 84
cacagtgtca cacggtccat caaaaacc 28
<210> 85
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 85
ggattttgtt gaggtctgtg tcactgtg 28
<210> 86
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 86
cacagtgtca cagagtccat caaaaacc 28
<210> 87
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 87
ggattttgtg aagggtcctc ccactgtg 28
<210> 88
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 88
cacagtgatg aacccagcat caaaaacc 28
<210> 89
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 89
ggattttgtg aagggccctc ccactgtg 28
<210> 90
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 90
cacagtgatg aacccagtgt caaaaacc 28
<210> 91
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 91
ggattttgtg aaggcccctc ccactgtg 28
<210> 92
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 92
cacagtgatg aaactagcat caaaaacc 28
<210> 93
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 93
ggattttgtg aagggccctc ccactgtg 28
<210> 94
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 94
cacagtgatg aaaccagcat caaaaacc 28
<210> 95
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 95
ggattttgtc agggggtgtc acactgtg 28
<210> 96
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 96
cacagtggtg ctgcccatat caaaaacc 28
<210> 97
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 97
ggattttgtc aggcgatgtc acactgtg 28
<210> 98
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 98
cacagtggtg ccgcccatat caaaaacc 28
<210> 99
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 99
ggattttgtc agggggtgtc acactgtg 28
<210> 100
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 100
cacagtggtg ctgcccatat caaaaacc 28
<210> 101
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 101
ggattttgtc agggggtgcc acactgtg 28
<210> 102
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 102
cacagtggtg ccgcccatat caaaaacc 28
<210> 103
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 103
ggattttgta ggtgtctgtg tcactgtg 28
<210> 104
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 104
cacagtgaca ctcgccaggt caaaaacc 28
<210> 105
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 105
ggattttgta ggtgtctgtg tcactgtg 28
<210> 106
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 106
cacagtgaca ctcacccagt caaaaacc 28
<210> 107
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 107
ggattttgta gctgtctgta tcactgtg 28
<210> 108
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 108
cacagtgaca ctcgccaggt caaaaacc 28
<210> 109
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 109
ggtttctgaa gctgtctgtg tcacagtc 28
<210> 110
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 110
cacaatgaca ctgggcagga cagaaacc 28
<210> 111
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 111
gggtttggct gagctgagaa ccactgtg 28
<210> 112
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 优化的RSS
<400> 112
cacagtgatt ggcagctcta caaaaacc 28
<210> 113
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 113
cacaggaaac agctatgacc 20
<210> 114
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 114
ccagtgccct agagtcaccc a 21
<210> 115
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 115
ctcccactca tgatctatag a 21
<210> 116
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 116
ctggggctcg ctttagttg 19
<210> 117
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 117
tgatagccgt tgtattcagc 20
<210> 118
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 118
ccagtgccct agagtcaccc a 21
<210> 119
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 119
gccatttctg tctgcattcg 20
<210> 120
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 120
ggttcatcat gccgtttgtg a 21
<210> 121
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 121
tgggctcgta gtttgacgtg 20
<210> 122
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 122
ttacccacac ttcacgcacg 20
<210> 123
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 123
ttaaacgacg cctcgaatg 19
<210> 124
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 124
gcaaccattc gttgtagtag 20
<210> 125
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 125
ctaacgcagt catgtaatgc 20
<210> 126
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 126
gactgtcacc cagcattac 19
<210> 127
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 127
cgtcgcctct acgggaaatc 20
<210> 128
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 128
ccagtgccct agagtcaccc a 21
<210> 129
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 129
gccatttctg tctgcattcg 20
<210> 130
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 130
aaacaccacg taggatttac gc 22
<210> 131
<211> 10213
<212> DNA
<213> 人工序列
<220>
<223> D6-DH1166
<400> 131
tacgtagccg tttcgatcct cccgaattga ctagtgggta ggcctggcgg ccgctgccat 60
ttcattacct ctttctccgc acccgacata gataccggtg gattcgaatt ctccccgttg 120
aagctgacct gcccagaggg gcctgggccc accccacaca ccggggcgga atgtgtacag 180
gccccggtct ctgtgggtgt tccgctaact ggggctccca gtgctcaccc cacaactaaa 240
gcgagcccca gcctccagag cccccgaagg agatgccgcc cacaagccca gcccccatcc 300
aggaggcccc agagctcagg gcgccggggc ggattttgta cagccccgag tcactgtgcg 360
gaaggatgct gtggttagct ttggcaaagt tttcctgcca ccacagtgag aaaaactgtg 420
tcaaaaaccg tctcctggcc cctgctggag gccgcgccag agaggggagc agccgccccg 480
aacctaggtc ctgctcagct cacacgaccc ccagcaccca gagcacaacg gagtccccat 540
tgaatggtga ggacggggac cagggctcca gggggtcatg gaaggggctg gaccccatcc 600
tactgctatg gtcccagtgc tcctggccag aactgaccct accaccgaca agagtccctc 660
agggaaacgg gggtcactgg cacctcccag catcaacccc aggcagcaca ggcataaacc 720
ccacatccag agccgactcc aggagcagag acaccccagt accctggggg acaccgaccc 780
tgatgactcc ccactggaat ccaccccaga gtccaccagg accaaagacc ccgcccctgt 840
ctctgtccct cactcaggac ctgctgcggg gcgggccatg agaccagact cgggcttagg 900
gaacaccact gtggccccaa cctcgaccag gccacaggcc cttccttcct gccctgcggc 960
agcacagact ttggggtctg tgcagagagg aatcacagag gccccaggct gaggtggtgg 1020
gggtggaaga cccccaggag gtggcccact tcccttcctc ccagctggaa cccaccatga 1080
ccttcttaag ataggggtgt catccgaggc aggtcctcca tggagctccc ttcaggctcc 1140
tccccggtcc tcactaggcc tcagtcccgg ctgcgggaat gcagccacca caggcacacc 1200
aggcagccca gacccagcca gcctgcagtg cccaagccca cattctggag cagagcaggc 1260
tgtgtctggg agagtctggg ctccccaccg cccccccgca caccccaccc acccctgtcc 1320
aggccctatg caggagggtc agagcccccc atggggtatg gacttagggt ctcactcacg 1380
tggctcccct cctgggtgaa ggggtctcat gcccagatcc ccacagcaga gctggtcaaa 1440
ggtggaggca gtggccccag ggccaccctg acctggaccc tcaggctcct ctagccctgg 1500
ctgccctgct gtccctggga ggcctggact ccaccagacc acaggtccag ggcaccgccc 1560
ataggtgctg cccacactca gttcacagga agaagataag ctccagaccc ccaagactgg 1620
gacctgcctt cctgccaccg cttgtagctc cagacctccg tgcctccccc gaccacttac 1680
acacgggcca gggagctgtt ccacaaagat caaccccaaa ccgggaccgc ctggcactcg 1740
ggccgctgcc acttccctct ccatttgttc ccagcacctc tgtgctccct ccctcctccc 1800
tccttcaggg gaacagcctg tgcagcccct ccctgcaccc cacaccctgg ggaggcccaa 1860
ccctgcctcc agccctttct cccccgctgc tcttcctgcc catccagaca accctggggt 1920
cccatccctg cagcctacac cctggtctcc acccagaccc ctgtctctcc ctccagacac 1980
ccctcccagg ccaaccctgc acatgcaggc cctccccttt tctgctgcca gagcctcagt 2040
ttctaccctc tgtgcctacc ccctgcctcc tcctgcccac aactcgagct cttcctctcc 2100
tggggcccct gagccatggc actgaccgtg cactcccacc cccacactgc ccatgccctc 2160
accttcctcc tggacactct gaccccgctc ccctcttgga cccagccctg gtatttccag 2220
gacaaaggct cacccaagtc ttccccatgc aggcccttgc cctcactgcc cggttacacg 2280
gcagcctcct gtgcacagaa gcagggagct cagcccttcc acaggcagaa ggcactgaaa 2340
gaaatcggcc tccagcaccc tgatgcacgt ccgcctgtgt ctctcactgc ccgcacctgc 2400
agggaggctc ggcactccct gtaaagacga gggatccagg cagcaacatc atgggagaat 2460
gcagggctcc cagacagccc agccctctcg caggcctctc ctgggaagag acctgcagcc 2520
accactgaac agccacggag cccgctggat agtaactgag tcagtgaccg acctggaggg 2580
caggggagca gtgaaccgga gcccagacca tagggacaga gaccagccgc tgacatcccg 2640
agcccctcac tggcggcccc agaacaccgc gtggaaacag aacagaccca cattcccacc 2700
tggaacaggg cagacactgc tgagccccca gcaccagccc tgagaaacac caggcaacgg 2760
catcagaggg ggctcctgag aaagaaagga ggggaggtct ccttcaccag caagtacttc 2820
ccttgaccaa aaacagggtc cacgcaactc ccccaggaca aaggaggagc cccctgtaca 2880
gcactgggct cagagtcctc tcccacacac cctgagtttc agacaaaaac cccctggaaa 2940
tcatagtatc agcaggagaa ctagccagag acagcaagag gggactcagt gactcccgcg 3000
gggacaggag gattttgtgg gggctcgtgt cactgtgctg cataccctgc tggacctgca 3060
agtattcggc aactgtgagg ttagccagca tctagactat gcccacagtg acacagcccc 3120
attcaaaaac ccctgctgta aacgcttcca cttctggagc tgaggggctg gggggagcgt 3180
ctgggaagta gggcctaggg gtggccatca atgcccaaaa cgcaccagac tcccccccag 3240
acatcacccc actggccagt gagcagagta aacagaaaat gagaagcagc tgggaagctt 3300
gcacaggccc caaggaaaga gctttggcgg gtgtgcaaga ggggatgcgg gcagagcctg 3360
agcagggcct tttgctgttt ctgctttcct gtgcagatag ttccataaac tggtgttcaa 3420
gatcgatggc tgggagtgag cccaggagga cagtgtggga agggcacagg gaaggagaag 3480
cagccgctat cctacactgt catctttcaa gagtttgccc tgtgcccaca atgctgcatc 3540
atgggatgct taacagctga tgtagacaca gctaaagaga gaatcagtga aatggatttg 3600
cagcacagat ctgaataaat tctccagaat gtggagccac acagaagcaa gcacaaggaa 3660
agtgcctgat gcaagggcaa agtacagtgt gtaccttcag gctgggcaca gacactctga 3720
aaagccttgg caggaactcc ctgcaacaaa gcagagccct gcaggcaatg ccagctccag 3780
agccctccct gagagcctca tgggcaaaga tgtgcacaac aggtgtttct catagcccca 3840
aactgagaat gaagcaaaca gccatctgaa ggaaaacagg caaataaacg atggcaggtt 3900
catgaaatgc aaacccagac agccagaagg acaacagtga gggttacagg tgactctgtg 3960
gttgagttca tgacaatgct gagtaattgg agtaacaaag gaaagtccaa aaaatacttt 4020
caatgtgatt tcttctaaat aaaatttaca gccggcaaaa tgaactatct tcttaaggga 4080
taaactttcc actaggaaaa ctataaggaa aatcaagaaa aggatgatca cataaacaca 4140
gtggtcgtta cttctactgg ggaaggaaga gggtatgaac tgagacacac agggttggca 4200
agtctcctaa caagaacaga acaaatacat tacagtacct tgaaaacagc agttaaaatt 4260
ctaaattgca agaagaggaa aatgcacaca gctgtgttta gaaaattctc agtccagcac 4320
tgttcataat agcaaagaca ttaacccagg ttggataaat aaacgatgac acaggcaatt 4380
gcacaatgat acagacatac attcagtata tgagacattg atgatgtatc cccaaagaaa 4440
tgactttaaa gagaaaaggc ctgatatgtg gtggcactca cctccctggg catccccgga 4500
caggctgcag gcacactgtg tggcagggca ggctggtacc tgctggcagc tcctggggcc 4560
tgatgtggag caggcacaga gccgtatccc cccgaggaca tataccccca aggacggcac 4620
agttggtaca ttccggagac aagcaactca gccacactcc caggccagag cccgagaggg 4680
acgcccatgc acagggaggc agagcccagc tcctccacag ccagcagcac ccgtgcaggg 4740
gccgccatct ggcaggcaca gagcatgggc tgggaggagg ggcagggaca ccaggcaggg 4800
ttggcaccaa ctgaaaatta cagaagtctc atacatctac ctcagccttg cctgacctgg 4860
gcctcacctg acctggacct cacctggcct ggacctcacc tggcctagac ctcacctctg 4920
ggcttcacct gagctcggcc tcacctgact tggaccttgc ctgtcctgag ctcacatgat 4980
ctgggcctca cctgacctgg gtttcacctg acctgggctt cacctgacct gggcctcatc 5040
tgacctgggc ctcactggcc tggacctcac ctggcctggg cttcacctgg cctcaggcct 5100
catctgcacc tgctccaggt cttgctggaa cctcagtagc actgaggctg caggggctca 5160
tccagggttg cagaatgact ctagaacctc ccacatctca gctttctggg tggaggcacc 5220
tggtggccca gggaatataa aaagcctgaa tgatgcctgc gtgatttggg ggcaatttat 5280
aaacccaaaa ggacatggcc atgcagcggg tagggacaat acagacagat atcagcctga 5340
aatggagcct cagggcacag gtgggcacgg acactgtcca cctaagccag gggcagaccc 5400
gagtgtcccc gcagtagacc tgagagcgct gggcccacag cctcccctcg gtgccctgct 5460
acctcctcag gtcagccctg gacatcccgg gtttccccag gcctggcggt aggattttgt 5520
tgaggtctgt gtcactgtgc atggcagcta ctgccagccc gcagccactg gctactgagg 5580
atgccgattc tgagaatagc agcttctact actatgacta cctggatgaa gtagctttca 5640
tgctctgccg gaaggatgct gtggttagct ttggcaaagt tttcctgcca ccacagtgtc 5700
acagagtcca tcaaaaaccc atccctggga accttctgcc acagccctcc ctgtggggca 5760
ccgccgcgtg ccatgttagg attttgactg aggacacagc accatgggta tggtggctac 5820
cgcagcagtg cagcccgtga cccaaacaca cagggcagca ggcacaacag acaagcccac 5880
aagtgaccac cctgagctcc tgcctgccag ccctggagac catgaaacag atggccagga 5940
ttatcccata ggtcagccag acctcagtcc aacaggtctg catcgctgct gccctccaat 6000
accagtccgg atggggacag ggctggccca cattaccatt tgctgccatc cggccaacag 6060
tcccagaagc ccctccctca aggctgggcc acatgtgtgg accctgagag ccccccatgt 6120
ctgagtaggg gcaccaggaa ggtggggctg gccctgtgca ctgtccctgc ccctgtggtc 6180
cctggcctgc ctggccctga cacctgggcc tctcctgggt catttccaag acagaagaca 6240
ttcccaggac agctggagct gggagtccat catcctgcct ggccgtcctg agtcctgcgc 6300
ctttccaaac ctcacccggg aagccaacag aggaatcacc tcccacaggc agagacaaag 6360
accttccaga aatctctgtc tctctcccca gtgggcaccc tcttccaggg cagtcctcag 6420
tgatatcaca gtgggaaccc acatctggat cgggactgcc cccagaacac aagatggccc 6480
acagggacag ccccacagcc cagcccttcc cagaccccta aaaggcgtcc caccccctgc 6540
atctgcccca gggctcaaac tccaggagga ctgactcctg cacaccctcc tgccagacat 6600
cacctcagcc cctcctggaa gggacaggag cgcgcaaggg tgagtcagac cctcctgccc 6660
tcgatggcag gcggagaaga ttcagaaagg tctgagatcc ccaggacgca gcaccactgt 6720
caatgggggc cccagacgcc tggaccaggg cctgcgtggg aaaggcctct gggcacactc 6780
agggggattt tgtgaagggt cctcccactg tgcatggcag ctactgccag cccgcagcca 6840
ctggctactg aggatgccga ttctgagaat agcagcttct actactatga ctacctggat 6900
gaagtagctt tcatgctctg ccggaaggat gctgtggtta gctttggcaa agttttcctg 6960
ccactgcata ccctgctgga cctgcaagta ttcggcaact gtgaggttag ccagcatcta 7020
gactatgccc acagtgatga acccagcatc aaaaaccgac cggactccca aggtttatgc 7080
acacttctcc gctcagagct ctccaggatc agaagagccg ggcccaaggg tttctgccca 7140
gaccctcggc ctctagggac atcttggcca tgacagccca tgggctggtg ccccacacat 7200
cgtctgcctt caaacaaggg cttcagaggg ctctgaggtg acctcactga tgaccacagg 7260
tgccctggcc ccttccccac cagctgcacc agaccccgtc atgacagatg ccccgattcc 7320
aacagccaat tcctggggcc aggaatcgct gtagacacca gcctccttcc aacacctcct 7380
gccaattgcc tggattccca tcccggttgg aatcaagagg acagcatccc ccaggctccc 7440
aacaggcagg actcccacac cctcctctga gaggccgctg tgttccgtag ggccaggctg 7500
cagacagtcc ccctcacctg ccactagaca aatgcctgct gtagatgtcc ccacctggaa 7560
aataccactc atggagcccc cagccccagg tacagctgta gagagagtct ctgaggcccc 7620
taagaagtag ccatgcccag ttctgccggg accctcggcc aggctgacag gagtggacgc 7680
tggagctggg cccatactgg gccacatagg agctcaccag tgagggcagg agagcacatg 7740
ccggggagca cccagcctcc tgctgaccag aggcccgtcc cagagcccag gaggctgcag 7800
aggcctctcc agggggacac tgtgcatgtc tggtccctga gcagcccccc acgtccccag 7860
tcctgggggc ccctggcaca gctgtctgga ccctctctat tccctgggaa gctcctcctg 7920
acagccccgc ctccagttcc aggtgtggat tttgtcaggg ggtgtcacac tgtgcagctt 7980
cttgtgcaag cacagtggtg ctgcccatat caaaaaccag gccaagtaga caggcccctg 8040
ctgtgcagcc ccaggcctcc agctcacctg cttctcctgg ggctctcaag gctgctgttt 8100
tctgcactct cccctctgtg gggagggttc cctcagtggg agatctgttc tcaacatccc 8160
acggcctcat tcctgcaagg aaggccaatg gatgggcaac ctcacatgcc gcggctaaga 8220
tagggtgggc agcctggcgg ggacaggaca tcctgctggg gtatctgtca ctgtgcctag 8280
tggggcactg gctcccaaac aacgcagtcc ttgccaaaat ccccacggcc tcccccgcta 8340
ggggctggcc tgatctcctg cagtcctagg aggctgctga cctccagaat ggctccgtcc 8400
ccagttccag ggcgagagca gatcccaggc cggctgcaga ctgggaggcc accccctcct 8460
tcccagggtt cactgcaggt gaccagggca ggaaatggcc tgaacacagg gataaccggg 8520
ccatccccca acagagtcca ccccctcctg ctctgtaccc cgcacccccc aggccagccc 8580
atgacatccg acaaccccac accagagtca ctgcccggtg ctgccctagg gaggacccct 8640
cagcccccac cctgtctaga ggactgggga ggacaggaca cgccctctcc ttatggttcc 8700
cccacctggc tctggctggg acccttgggg tgtggacaga aaggacgctt gcctgattgg 8760
cccccaggag cccagaactt ctctccaggg accccagccc gagcaccccc ttacccagga 8820
cccagccctg cccctcctcc cctctgctct cctctcatca ccccatggga atccagaatc 8880
cccaggaagc catcaggaag ggctgaggga ggaagtgggg ccactgcacc accaggcagg 8940
aggctctgtc tttgtgaacc cagggaggtg ccagcctcct agagggtatg gtccaccctg 9000
cctatggctc ccacagtggc aggctgcagg gaaggaccag ggacggtgtg ggggagggct 9060
cagggccccg cgggtgctcc atcttggatg agcctatctc tctcacccac ggactcgccc 9120
acctcctctt caccctggcc acacgtcgtc cacaccatcc taagtcccac ctacaccaga 9180
gccggcacag ccagtgcaga cagaggctgg ggtgcagggg ggccgactgg gcagcttcgg 9240
ggagggagga atggaggaag gggagttcag tgaagaggcc cccctcccct gggtccagga 9300
tcctcctctg ggacccccgg atcccatccc ctccaggctc tgggaggaga agcaggatgg 9360
gagaatctgt gcgggaccct ctcacagtgg aatacctcca cagcggctca ggccagatac 9420
aaaagcccct cagtgagccc tccactgcag tgctgggcct gggggcagcc gctcccacac 9480
aggatgaacc cagcaccccg aggatgtcct gccaggggga gctcagagcc atgaaggagc 9540
aggatatggg acccccgata caggcacaga cctcagctcc attcaggact gccacgtcct 9600
gccctgggag gaaccccttt ctctagtccc tgcaggccag gaggcagctg actcctgact 9660
tggacgccta ttccagacac cagacagagg ggcaggcccc ccagaaccag ggatgaggac 9720
gccccgtcaa ggccagaaaa gaccaagttg cgctgagccc agcaagggaa ggtccccaaa 9780
caaaccagga ggattttgta ggtgtctgtg tcactgtgca aacccatgaa aaccccaagg 9840
gagtttggaa ctgccatgcc gatttcggcg ggcatggcac catttggaag ctcttcctcc 9900
ggttccagca gaacctgcta ccacagtgac actcgccagg tcaaaaaccc catcccaagt 9960
cagcggaatg cagagagagc agggaggaca tgtttaggat ctgaggccgc acctgacacc 10020
caggccagca gacgtctcct gtccacggca ccctgccatg tcctgcattt ctggaagaac 10080
aagggcaggc tgaagggggt ccaggaccag gagatgggtc cgctctaccc agagaaggag 10140
ccaggcagga cacaagcccc cacgcgtggg ctcgtagttt gacgtgcgtg aagtgtgggt 10200
aagaaagtac gta 10213
<210> 132
<211> 9828
<212> DNA
<213> 人工序列
<220>
<223> D6-D17613
<400> 132
gcggccgctg ccatttcatt acctctttct ccgcacccga catagattac gtaacgcgtg 60
ggctcgtagt ttgacgtgcg tgaagtgtgg gtaagaaagt ccccattgag gctgacctgc 120
ccagagggtc ctgggcccac ccaacacacc ggggcggaat gtgtgcaggc ctcggtctct 180
gtgggtgttc cgctagctgg ggctcacagt gctcacccca cacctaaaac gagccacagc 240
ctccggagcc cctgaaggag accccgccca caagcccagc ccccacccag gaggccccag 300
agcacagggc gccccgtcgg attttgtaca gccccgagtc actgtgcagc ttcttgcaca 360
gtgagaaaag cttcgtcaaa aaccgtctcc tggccacagt cggaggcccc gccagagagg 420
ggagcagcca ccccaaaccc atgttctgcc ggctcccatg accccgtgca cctggagccc 480
cacggtgtcc ccactggatg ggaggacaag ggccgggggc tccggcgggt cggggcaggg 540
gcttgatggc ttccttctgc cgtggcccca ttgcccctgg ctggagttga cccttctgac 600
aagtgtcctc agagagtcag ggatcagtgg cacctcccaa catcaacccc acgcagccca 660
ggcacaaacc ccacatccag ggccaactcc aggaacagag acaccccaat accctggggg 720
accccgaccc tgatgactcc cgtcccatct ctgtccctca cttggggcct gctgcggggc 780
gagcacttgg gagcaaactc aggcttaggg gacaccactg tgggcctgac ctcgagcagg 840
ccacagaccc ttccctcctg ccctggtgca gcacagactt tggggtctgg gcagggagga 900
acttctggca ggtcaccaag cacagagccc ccaggctgag gtggccccag ggggaacccc 960
agcaggtggc ccactaccct tcctcccagc tggaccccat gtcttcccca agataggggt 1020
gccatccaag gcaggtcctc catggagccc ccttcaggct cctctccaga ccccactggg 1080
cctcagtccc cactctagga atgcagccac cacgggcaca ccaggcagcc caggcccagc 1140
caccctgcag tgcccaagcc cacaccctgg aggagagcag ggtgcgtctg ggaggggctg 1200
ggctccccac ccccaccccc acctgcacac cccacccacc cttgcccggg ccccctgcag 1260
gagggtcaga gcccccatgg gatatggact tagggtctca ctcacgcacc tcccctcctg 1320
ggagaagggg tctcatgccc agatcccccc agcagcgctg gtcacaggta gaggcagtgg 1380
ccccagggcc accctgacct ggcccctcag gctcctctag ccctggctgc cctgctgtcc 1440
ctgggaggcc tgggctccac cagaccacag gtctagggca ccgcccacac tggggccgcc 1500
cacacacagc tcacaggaag aagataagct ccagaccccc aggcccggga cctgccttgc 1560
tgctacgact tcctgcccca gacctcgttg ccctcccccg tccacttaca cacaggccag 1620
gaagctgttc ccacacagac caaccccaga cggggaccac ctggcactca ggtcactgcc 1680
atttccttct ccattcactt ccaatgcctc tgtgcttcct ccctcctcct tccttcgggg 1740
gagcaccctg tgcagctcct ccctgcagtc cacaccctgg ggagacccga ccctgcagcc 1800
cacaccctgg ggagacctga ccctcctcca gccctttctc ccccgctgct cttgccaccc 1860
accaagacag ccctggggtc ctgtccctac agcccccacc cagttctcta cctagacccg 1920
tcttcctccc tctaaacacc tctcccaggc caaccctaca cctgcaggcc ctcccctcca 1980
ctgccaaaga ccctcagttt ctcctgcctg tgcccacccc cgtgctcctc ctgcccacag 2040
ctcgagctct tcctctccta gggcccctga gggatggcat tgaccgtgcc ctcgcaccca 2100
cacactgccc atgccctcac attcctcctg gccactccag ccccactccc ctctcaggcc 2160
tggctctggt atttctggga caaagcctta cccaagtctt tcccatgcag gcctgggccc 2220
ttaccctcac tgcccggtta cagggcagcc tcctgtgcac agaagcaggg agctcagccc 2280
ttccacaggc agaaggcact gaaagaaatc ggcctccagc gccttgacac acgtctgcct 2340
gtgtctctca ctgcccgcac ctgcagggag gctcggcact ccctctaaag acgagggatc 2400
caggcagcag catcacagga gaatgcaggg ctaccagaca tcccagtcct ctcacaggcc 2460
tctcctggga agagacctga agacgcccag tcaacggagt ctaacaccaa acctccctgg 2520
aggccgatgg gtagtaacgg agtcattgcc agacctggag gcaggggagc agtgagcccg 2580
agcccacacc atagggccag aggacagcca ctgacatccc aagccactca ctggtggtcc 2640
cacaacaccc catggaaaga ggacagaccc acagtcccac ctggaccagg gcagagactg 2700
ctgagaccca gcaccagaac caaccaagaa acaccaggca acagcatcag agggggctct 2760
ggcagaacag aggaggggag gtctccttca ccagcaggcg cttcccttga ccgaagacag 2820
gatccatgca actcccccag gacaaaggag gagccccttg ttcagcactg ggctcagagt 2880
cctctccaag acacccagag tttcagacaa aaaccccctg gaatgcacag tctcagcagg 2940
agagccagcc agagccagca agatggggct cagtgacacc cgcagggaca ggaggatttt 3000
gtgggggctc gtgtcactgt gctgcatacc ctgctggacc tgcaagtatt cggcaacagt 3060
gaggttagcc agcatctaga ctatgcccac agtgacacag ccccattcaa aaacccctac 3120
tgcaaacgca ttccacttct ggggctgagg ggctggggga gcgtctggga aatagggctc 3180
aggggtgtcc atcaatgccc aaaacgcacc agactcccct ccatacatca cacccaccag 3240
ccagcgagca gagtaaacag aaaatgagaa gcaagctggg gaagcttgca caggccccaa 3300
ggaaagagct ttggcgggtg tgtaagaggg gatgcgggca gagcctgagc agggcctttt 3360
gctgtttctg ctttcctgtg cagagagttc cataaactgg tgttcgagat caatggctgg 3420
gagtgagccc aggaggacag cgtgggaaga gcacagggaa ggaggagcag ccgctatcct 3480
acactgtcat ctttcgaaag tttgccttgt gcccacactg ctgcatcatg ggatgcttaa 3540
cagctgatgt agacacagct aaagagagaa tcagtgagat ggatttgcag cacagatctg 3600
aataaattct ccagaatgtg gagcagcaca gaagcaagca cacagaaagt gcctgatgca 3660
aggacaaagt tcagtgggca ccttcaggca ttgctgctgg gcacagacac tctgaaaagc 3720
cctggcagga actccctgtg acaaagcaga accctcaggc aatgccagcc ccagagccct 3780
ccctgagagc ctcatgggca aagatgtgca caacaggtgt ttctcatagc cccaaactga 3840
gagcaaagca aacgtccatc tgaaggagaa caggcaaata aacgatggca ggttcatgaa 3900
atgcaaaccc agacagccac aagcacaaaa gtacagggtt ataagcgact ctggttgagt 3960
tcatgacaat gctgagtaat tggagtaaca aagtaaactc caaaaaatac tttcaatgtg 4020
atttcttcta aataaaattt acaccctgca aaatgaactg tcttcttaag ggatacattt 4080
cccagttaga aaaccataaa gaaaaccaag aaaaggatga tcacataaac acagtggtgg 4140
ttacttctgc tggggaagga agagggtatg aactgagata cacagggtgg gcaagtctcc 4200
taacaagaac agaacgaata cattacagta ccttgaaaac agcagttaaa cttctaaatt 4260
gcaagaagag gaaaatgcac acagttgtgt ttagaaaatt ctcagtccag cactgttcat 4320
aatagcaaag acattaaccc aggtcggata aataagcgat gacacaggca attgcacaat 4380
gatacagaca tatatttagt atatgagaca tcgatgatgt atccccaaat aaacgacttt 4440
aaagagataa agggctgatg tgtggtggca ttcacctccc tgggatcccc ggacaggttg 4500
caggctcact gtgcagcagg gcaggcgggt acctgctggc agttcctggg gcctgatgtg 4560
gagcaagcgc agggccatat atcccggagg acggcacagt cagtgaattc cagagagaag 4620
caactcagcc acactcccca ggcagagccc gagagggacg cccacgcaca gggaggcaga 4680
gcccagcacc tccgcagcca gcaccacctg cgcacgggcc accaccttgc aggcacagag 4740
tgggtgctga gaggaggggc agggacacca ggcagggtga gcacccagag aaaactgcag 4800
acgcctcaca catccacctc agcctcccct gacctggacc tcactggcct gggcctcact 4860
taacctgggc ttcacctgac cttggcctca cctgacttgg acctcgcctg tcccaagctt 4920
tacctgacct gggcctcaac tcacctgaac gtctcctgac ctgggtttaa cctgtcctgg 4980
aactcacctg gccttggctt cccctgacct ggacctcatc tggcctgggc ttcacctggc 5040
ctgggcctca cctgacctgg acctcatctg gcctggacct cacctggcct ggacttcacc 5100
tggcctgggc ttcacctgac ctggacctca cctggcctcg ggcctcacct gcacctgctc 5160
caggtcttgc tggagcctga gtagcactga gggtgcagaa gctcatccag ggttggggaa 5220
tgactctaga agtctcccac atctgacctt tctgggtgga ggcagctggt ggccctggga 5280
atataaaaat ctccagaatg atgactctgt gatttgtggg caacttatga acccgaaagg 5340
acatggccat ggggtgggta gggacatagg gacagatgcc agcctgaggt ggagcctcag 5400
gacacaggtg ggcacggaca ctatccacat aagcgaggga tagacccgag tgtccccaca 5460
gcagacctga gagcgctggg cccacagcct cccctcagag ccctgctgcc tcctccggtc 5520
agccctggac atcccaggtt tccccaggcc tggcggtagg attttgttga ggtctgtgtc 5580
actgtgcatg gcagctactg ccagcccgca gccactggct actgaggatg ccgattctga 5640
gaatagcagc ttctactact atgactacct ggatgaagta gctttcatgc tccacagtgt 5700
cacagagtcc atcaaaaacc catgcctgga agcttcccgc cacagccctc cccatggggc 5760
cctgctgcct cctcaggtca gccccggaca tcccgggttt ccccaggctg ggcggtagga 5820
ttttgttgag gtctgtgtca ctgtgccaaa cccatgaaaa ccccaaggga gtttggaaca 5880
gccatgccga tttcggcggg catggcacca tttggaagct cttcctccgg ttccagcaga 5940
acctgctacc cacagtgtca cagagtccat caaaaaccca tccctgggag cctcccgcca 6000
cagccctccc tgcaggggac cggtacgtgc catgttagga ttttgatcga ggagacagca 6060
ccatgggtat ggtggctacc acagcagtgc agcctgtgac ccaaacccgc agggcagcag 6120
gcacgatgga caggcccgtg actgaccacg ctgggctcca gcctgccagc cctggagatc 6180
atgaaacaga tggccaaggt caccctacag gtcatccaga tctggctccg aggggtctgc 6240
atcgctgctg ccctcccaac gccagtccaa atgggacagg gacggcctca cagcaccatc 6300
tgctgccatc aggccagcga tcccagaagc ccctccctca aggctgggca catgtgtgga 6360
cactgagagc cctcatatct gagtaggggc accaggaggg aggggctggc cctgtgcact 6420
gtccctgccc ctgtggtccc tggcctgcct ggccctgaca cctgagcctc tcctgggtca 6480
tttccaagac agaagacatt cctggggaca gccggagctg ggcgtcgctc atcctgcccg 6540
gccgtcctga gtcctgctca tttccagacc tcaccgggga agccaacaga ggactcgcct 6600
cccacattca gagacaaaga accttccaga aatccctgcc tctctcccca gtggacaccc 6660
tcttccagga cagtcctcag tggcatcaca gcggcctgag atccccagga cgcagcaccg 6720
ctgtcaatag gggccccaaa tgcctggacc agggcctgcg tgggaaaggc ctctggccac 6780
actcggggat tttgtgaagg gccctcccac tgtgccagct tcttgagcca tgccgatttc 6840
ggcgggcatg gcaccatttg gaagctcttc ctccggttcc agcagaacct gctaccacag 6900
tgatgaaccc agtgtcaaaa accggctgga aacccagggg ctgtgtgcac gcctcagctt 6960
ggagctctcc aggagcacaa gagccgggcc caaggatttg tgcccagacc ctcagcctct 7020
agggacacct gggtcatctc agcctgggct ggtgccctgc acaccatctt cctccaaata 7080
ggggcttcag agggctctga ggtgacctca ctcatgacca caggtgacct ggcccttccc 7140
tgccagctat accagaccct gtcttgacag atgccccgat tccaacagcc aattcctggg 7200
accctgaata gctgtagaca ccagcctcat tccagtacct cctgccaatt gcctggattc 7260
ccatcctggc tggaatcaag aaggcagcat ccgccaggct cccaacaggc aggactcccg 7320
cacaccctcc tctgagaggc cgctgtgttc cgcagggcca ggccctggac agttcccctc 7380
acctgccact agagaaacac ctgccattgt cgtccccacc tggaaaagac cactcgtgga 7440
gcccccagcc ccaggtacag ctgtagagac agtcctcgag gcccctaaga aggagccatg 7500
cccagttctg ccgggaccct cggccaggcc gacaggagtg gacgctggag ctgggcccac 7560
actgggccac ataggagctc accagtgagg gcaggagagc acatgccggg gagcacccag 7620
cctcctgctg accagaggcc cgtcccagag cccaggaggc tgcagaggcc tctccaggga 7680
gacactgtgc atgtctggta cctaagcagc cccccacgtc cccagtcctg ggggcccctg 7740
gctcagctgt ctgggccctc cctgctccct gggaagctcc tcctgacagc cccgcctcca 7800
gttccaggtg tggattttgt caggcgatgt cacactgtgc agcttcttga gcaagcacag 7860
tggtgccgcc catatcaaaa accaggccaa gtagacaggc ccctgctgcg cagccccagg 7920
catccacttc acctgcttct cctggggctc tcaaggctgc tgtctgtcct ctggccctct 7980
gtggggaggg ttccctcagt gggaggtctg tgctccaggg cagggatgat tgagatagaa 8040
atcaaaggct ggcagggaaa ggcagcttcc cgccctgaga ggtgcaggca gcaccacgga 8100
gccacggagt cacagagcca cggagccccc attgtgggca tttgagagtg ctgtgccccc 8160
ggcaggccca gccctgatgg ggaagcctgt cccatcccac agcccgggtc ccacgggcag 8220
cgggcacaga agctgccagg ttgtcctcta tgatcctcat ccctccagca gcatcccctc 8280
cacagtgggg aaactgaggc ttggagcacc acccggcccc ctggaaatga ggctgtgagc 8340
ccagacagtg ggcccagagc actgtgagta ccccggcagt acctggctgc agggatcagc 8400
cagagatgcc aaaccctgag tgaccagcct acaggaggat ccggccccac ccaggccact 8460
cgattaatgc tcaaccccct gccctggaga cctcttccag taccaccagc agctcagctt 8520
ctcagggcct catccctgca aggaaggtca agggctgggc ctgccagaaa cacagcaccc 8580
tccctagccc tggctaagac agggtgggca gacggctgtg gacgggacat attgctgggg 8640
catttctcac tgtcacttct gggtggtagc tctgacaaaa acgcagaccc tgccaaaatc 8700
cccactgcct cccgctaggg gctggcctgg aatcctgctg tcctaggagg ctgctgacct 8760
ccaggatggc tccgtcccca gttccagggc gagagcagat cccaggcagg ctgtaggctg 8820
ggaggccacc cctgcccttg ccggggttga atgcaggtgc ccaaggcagg aaatggcatg 8880
agcacaggga tgaccgggac atgccccacc agagtgcgcc ccttcctgct ctgcaccctg 8940
caccccccag gccagcccac gacgtccaac aactgggcct gggtggcagc cccacccaga 9000
caggacagac ccagcaccct gaggaggtcc tgccaggggg agctaagagc catgaaggag 9060
caagatatgg ggcccccgat acaggcacag atgtcagctc catccaggac cacccagccc 9120
acaccctgag aggaacgtct gtctccagcc tctgcaggtc gggaggcagc tgacccctga 9180
cttggacccc tattccagac accagacaga ggcgcaggcc ccccagaacc agggttgagg 9240
gacgccccgt caaagccaga caaaaccaag gggtgttgag cccagcaagg gaaggccccc 9300
aaacagacca ggaggatttt gtaggtgtct gtgtcactgt gcatggcagc tactgccagc 9360
ccgcagccac tggctactga ggatgccgat tctgagaata gcagcttcta ctactatgac 9420
tacctggatg aagtagcttt catgctcagc cggaaggatg ctgtggttag ctttggcaaa 9480
gttttcctgc cacccacagt gacactcacc cagtcaaaaa ccccattcca agtcagcgga 9540
agcagagaga gcagggagga cacgtttagg atctgagact gcacctgaca cccaggccag 9600
cagacgtctc ccctccaggg caccccaccc tgtcctgcat ttctgcaaga tcaggggcgg 9660
cctgaggggg ggtctagggt gaggagatgg gtcccctgta caccaaggag gagttaggca 9720
ggtcccgagc actcttaatt aaacgacgcc tcgaatggaa ctactacaac gaatggttgc 9780
tctacgtaat gcattcgcta ccttaggacc gttatagtta ggcgcgcc 9828
<210> 133
<211> 9894
<212> DNA
<213> 人工序列
<220>
<223> D6-DH114619
<400> 133
tacgtattaa ttaaacgacg cctcgaatgg aactactaca acgaatggtt gctctcccca 60
ttgaggctga cctgcccaga gagtcctggg cccaccccac acaccggggc ggaatgtgtg 120
caggcctcgg tctctgtggg tgttccgcta gctggggctc acagtgctca ccccacacct 180
aaaatgagcc acagcctccg gagcccccgc aggagacccc gcccacaagc ccagccccca 240
cccaggaggc cccagagctc agggcgcccc gtcggatttt gtacagcccc gagtcactgt 300
gcaaacccat gaaaacccca agggagtttg gaaccacagt gagaatagct acgtcaaaaa 360
ccgtccagtg gccactgccg gaggccccgc cagagagggc agcagccact ctgatcccat 420
gtcctgccgg ctcccatgac ccccagcacg cggagcccca cagtgtcccc actggatggg 480
aggacaagag ctggggattc cggcgggtcg gggcaggggc ttgatcgcat ccttctgccg 540
tggctccagt gcccctggct ggagttgacc cttctgacaa gtgtcctcag agagacaggc 600
atcaccggcg cctcccaaca tcaaccccag gcagcacagg cacaaacccc acatccagag 660
ccaactccag gagcagagac accccaatac cctgggggac cccgaccctg atgacttccc 720
actggaattc gccgtagagt ccaccaggac caaagaccct gcctctgcct ctgtccctca 780
ctcaggacct gctgccgggc gaggccttgg gagcagactt gggcttaggg gacaccagtg 840
tgaccccgac cttgaccagg acgcagacct ttccttcctt tcctggggca gcacagactt 900
tggggtctgg gccaggagga acttctggca ggtcgccaag cacagaggcc acaggctgag 960
gtggccctgg aaagacctcc aggaggtggc cactcccctt cctcccagct ggaccccatg 1020
tcctccccaa gataagggtg ccatccaagg caggtgctcc ttggagcccc attcagactc 1080
ctccctggac cccactgggc ctcagtccca gctctgggga tgaagccacc acaagcacac 1140
caggcagccc aggcccagcc accctgcagt gcccaagcac acactctgga gcagagcagg 1200
gtgcctctgg gaggggctga gctccccacc ccacccccac ctgcacaccc cacccacccc 1260
tgcccagcgg ctctgcagga gggtcagagc cccacatggg gtatggactt agggtctcac 1320
tcacgtggct cccatcatga gtgaaggggc ctcaagccca ggttcccaca gcagcgcctg 1380
tcgcaagtgg aggcagaggc ccgagggcca ccctgacctg gtccctgagg ttcctgcagc 1440
ccaggctgcc ctgctgtccc tgggaggcct gggctccacc agaccacagg tccagggcac 1500
cgggtgcagg agccacccac acacagctca caggaagaag ataagctcca gacccccagg 1560
gccagaacct gccttcctgc tactgcttcc tgccccagac ctgggcgccc tcccccgtcc 1620
acttacacac aggccaggaa gctgttccca cacagaacaa ccccaaacca ggaccgcctg 1680
gcactcaggt ggctgccatt tccttctcca tttgctccca gcgcctctgt cctccctggt 1740
tcctccttcg ggggaacagc ctgtgcagcc agtccctgca gcccacaccc tggggagacc 1800
caaccctgcc tggggccctt ccaaccctgc tgctcttact gcccacccag aaaactctgg 1860
ggtcctgtcc ctgcagtccc taccctggtc tccacccaga cccctgtgta tcactccaga 1920
cacccctccc aggcaaaccc tgcacctgca ggccctgtcc tcttctgtcg ctagagcctc 1980
agtttctccc ccctgtgccc acaccctacc tcctcctgcc cacaactcta actcttcttc 2040
tcctggagcc cctgagccat ggcattgacc ctgccctccc accacccaca gcccatgccc 2100
tcaccttcct cctggccact ccgaccccgc cccctctcag gccaagccct ggtatttcca 2160
ggacaaaggc tcacccaagt ctttcccagg caggcctggg ctcttgccct cacttcccgg 2220
ttacacggga gcctcctgtg cacagaagca gggagctcag cccttccaca ggcagaaggc 2280
actgaaagaa atcggcctcc agcaccttga cacacgtccg cccgtgtctc tcactgcccg 2340
cacctgcagg gaggctccgc actccctcta aagacaaggg atccaggcag cagcatcacg 2400
ggagaatgca gggctcccag acatcccagt cctctcacag gcctctcctg ggaagagacc 2460
tgcagccacc accaaacagc cacagaggct gctggatagt aactgagtca atgaccgacc 2520
tggagggcag gggagcagtg agccggagcc cataccatag ggacagagac cagccgctga 2580
catcccgagc tcctcaatgg tggccccata acacacctag gaaacataac acacccacag 2640
ccccacctgg aacagggcag agactgctga gcccccagca ccagccccaa gaaacaccag 2700
gcaacagtat cagagggggc tcccgagaaa gagaggaggg gagatctcct tcaccatcaa 2760
atgcttccct tgaccaaaaa cagggtccac gcaactcccc caggacaaag gaggagcccc 2820
ctatacagca ctgggctcag agtcctctct gagacaccct gagtttcaga caacaacccg 2880
ctggaatgca cagtctcagc aggagaacag accaaagcca gcaaaaggga cctcggtgac 2940
accagtaggg acaggaggat tttgtggggg ctcgtgtcac tgtgcaaacc catgaaaacc 3000
ccaagggagt ttggaactgc aagcacagtg acacagaccc attcaaaaac ccctactgca 3060
aacacaccca ctcctggggc tgaggggctg ggggagcgtc tgggaagtag ggtccagggg 3120
tgtctatcaa tgtccaaaat gcaccagact ccccgccaaa caccacccca ccagccagcg 3180
agcagggtaa acagaaaatg agaggctctg ggaagcttgc acaggcccca aggaaagagc 3240
tttggcgggt gtgcaagagg ggatgcaggc agagcctgag cagggccttt tgctgtttct 3300
gctttcctgt gcagagagtt ccataaactg gtgttcaaga tcagtggctg ggaatgagcc 3360
caggagggca gtctgtggga agagcacagg gaaggaggag cagccgctat cctacactgt 3420
catctttcaa aagtttgcct tgtgaccaca ctattgcatc atgggatgct taagagctga 3480
tgtagacaca gctaaagaga gaatcagtga gatgaatttg cagcatagat ctgaataaac 3540
tctccagaat gtggagcagt acagaagcaa acacacagaa agtgcctgat gcaaggacaa 3600
agttcagtgg gcaccttcag gcattgctgc tgggcacaga cactctgaaa agccttggca 3660
ggatctccct gcgacaaagc agaaccctca ggcaatgcca gccccagagc cctccctgag 3720
agcgtcatgg ggaaagatgt gcagaacagc tgattatcat agactcaaac tgagaacaga 3780
gcaaacgtcc atctgaagaa cagtcaaata agcaatggta ggttcatgca atgcaaaccc 3840
agacagccag gggacaacag tagagggcta caggcggctt tgcggttgag ttcatgacaa 3900
tgctgagtaa ttggagtaac agaggaaagc ccaaaaaata cttttaatgt gatttcttct 3960
aaataaaatt tacaccaggc aaaatgaact gtcttcttaa gggataaact ttcccctgga 4020
aaaactacaa ggaaaattaa gaaaacgatg atcacataaa cacagttgtg gttacttcta 4080
ctggggaagg aagagggtat gagctgagac acacagagtc ggcaagtctc caagcaagca 4140
cagaacgaat acattacagt accttgaata cagcagttaa acttctaaat cgcaagaaca 4200
ggaaaatgca cacagctgtg tttagaaaat tctcagtcca gcactattca taatagcaaa 4260
gacattaacc caggttggat aaataaatga tgacacaggc aattgcacaa tgatacagac 4320
atacatttag tacatgagac atcgatgatg tatccccaaa gaaatgactt taaagagaaa 4380
aggcctgatg tgtggtggca ctcacctccc tgggatcccc ggacaggttg caggcacact 4440
gtgtggcagg gcaggctggt acatgctggc agctcctggg gcctgatgtg gagcaagcgc 4500
agggctgtat acccccaagg atggcacagt cagtgaattc cagagagaag cagctcagcc 4560
acactgccca ggcagagccc gagagggacg cccacgtaca gggaggcaga gcccagctcc 4620
tccacagcca ccaccacctg tgcacgggcc accaccttgc aggcacagag tgggtgctga 4680
gaggaggggc agggacacca ggcagggtga gcacccagag aaaactgcag aagcctcaca 4740
catccacctc agcctcccct gacctggacc tcacctggtc tggacctcac ctggcctggg 4800
cctcacctga cctggacctc acctggcctg ggcttcacct gacctggacc tcacctggcc 4860
tccggcctca cctgcacctg ctccaggtct tgctggaacc tgagtagcac tgaggctgca 4920
gaagctcatc cagggttggg gaatgactct ggaactctcc cacatctgac ctttctgggt 4980
ggaggcatct ggtggccctg ggaatataaa aagccccaga atggtgcctg cgtgatttgg 5040
gggcaattta tgaacccgaa aggacatggc catggggtgg gtagggacat agggacagat 5100
gccagcctga ggtggagcct caggacacag ttggacgcgg acactatcca cataagcgag 5160
ggacagaccc gagtgttcct gcagtagacc tgagagcgct gggcccacag cctcccctcg 5220
gtgccctgct gcctcctcag gtcagccctg gacatcccgg gtttccccag gccagatggt 5280
aggattttgt tgaggtctgt gtcactgtgc atggcagcta ctgccagccc gcagccactg 5340
gctactgagg atgccgattc tgagaatagc agcttctact actatgacta cctggatgaa 5400
gtagctttca tgctctgcga ggttagccag catctagact atgcccacag tgtcacacgg 5460
tccatcaaaa acccatgcca cagccctccc cgcaggggac cgccgcgtgc catgttacga 5520
ttttgatcga ggacacagcg ccatgggtat ggtggctacc acagcagtgc agcccatgac 5580
ccaaacacac agggcagcag gcacaatgga caggcctgtg agtgaccatg ctgggctcca 5640
gcccgccagc cccggagacc atgaaacaga tggccaaggt caccccacag ttcagccaga 5700
catggctccg tggggtctgc atcgctgctg ccctctaaca ccagcccaga tggggacaag 5760
gccaacccca cattaccatc tcctgctgtc cacccagtgg tcccagaagc ccctccctca 5820
tggctgagcc acatgtgtga accctgagag caccccatgt cagagtaggg gcagcagaag 5880
ggcggggctg gccctgtgca ctgtccctgc acccatggtc cctcgcctgc ctggccctga 5940
cacctgagcc tcttctgagt catttctaag atagaagaca ttcccgggga cagccggagc 6000
tgggcgtcgc tcatcccgcc cggccgtcct gagtcctgct tgtttccaga cctcaccagg 6060
gaagccaaca gaggactcac ctcacacagt cagagacaaa gaaccttcca gaaatccctg 6120
tctcactccc cagtgggcac cttcttccag gacattcctc ggtcgcatca cagcaggcac 6180
ccacatctgg atcaggacgg cccccagaac acaagatggc ccatggggac agccccacaa 6240
cccaggcctt cccagacccc taaaaggcgt cccaccccct gcacctgccc cagggctaaa 6300
aatccaggag gcttgactcc cgcataccct ccagccagac atcacctcag ccccctcctg 6360
gaggggacag gagcccggga gggtgagtca gacccacctg ccctcgatgg caggcgggga 6420
agattcagaa aggcctgaga tccccaggac gcagcaccac tgtcaatggg ggccccagac 6480
gcctggacca gggcctgcgt gggaaaggcc gctgggcaca ctcaggggga ttttgtgaag 6540
gcccctccca ctgtgcagct tcttgtgcaa gcaaacccat gaaaacccca agggagtttg 6600
gaactgccat gccgatttcg gcgggcatgg caccatttgg aagctcttcc tccggttcca 6660
gcagaacctg ctaccacagt gatgaaacta gcatcaaaaa ccggccggac acccagggac 6720
catgcacact tctcagcttg gagctctcca ggaccagaag agtcaggtct gagggtttgt 6780
agccagaccc tcggcctcta gggacaccct ggccatcaca gcggatgggc tggtgcccca 6840
catgccatct gctccaaaca ggggcttcag agggctctga ggtgacttca ctcatgacca 6900
caggtgccct ggccccttcc ccgccagcta caccgaaccc tgtcccaaca gctgccccag 6960
ttccaacagc caattcctgg ggcccagaat tgctgtagac accagcctcg ttccagcacc 7020
tcctgccaat tgcctggatt cacatcctgg ctggaatcaa gagggcagca tccgccaggc 7080
tcccaacagg caggactccc gcacaccctc ctctgagagg ccgctgtgtt ccgcagggcc 7140
aggccctgga cagttcccct cacctgccac tagagaaaca cctgccattg tcgtccccac 7200
ctggaaaaga ccactcgtgg agcccccagc cccaggtaca gctgtagaga gactccccga 7260
gggatctaag aaggagccat gcgcagttct gccgggaccc tcggccaggc cgacaggagt 7320
ggacactgga gctgggccca cactgggcca cataggagct caccagtgag ggcaggagag 7380
cacatgccgg ggagcaccca gcctcctgct gaccagaggc ccgtcccaga gcccaggagg 7440
ctgcagaggc ctctccaggg ggacactgtg catgtctggt ccctgagcag ccccccacgt 7500
ccccagtcct gggggcccct ggcacagctg tctggaccct ccctgttccc tgggaagctc 7560
ctcctgacag ccccgcctcc agttccaggt gtggattttg tcagggggtg tcacactgtg 7620
ctgcataccc tgctggacct gcaagtattc ggcaactgtc ggaaggatgc tgtggttagc 7680
tttggcaaag ttttcctgcc accacagtgg tgctgcccat atcaaaaacc aggccaagta 7740
gacaggcccc tgctgtgcag ccccaggcct ccacttcacc tgcttctcct ggggctctca 7800
aggtcactgt tgtctgtact ctgccctctg tggggagggt tccctcagtg ggaggtctgt 7860
tctcaacatc ccagggcctc atgtctgcac ggaaggccaa tggatgggca acctcacatg 7920
ccgcggctaa gatagggtgg gcagcctggc gggggacagt acatactgct ggggtgtctg 7980
tcactgtgcc tagtggggca ctggctccca aacaacgcag tcctcgccaa aatccccaca 8040
gcctcccctg ctaggggctg gcctgatctc ctgcagtcct aggaggctgc tgacctccag 8100
aatgtctccg tccccagttc cagggcgaga gcagatccca ggccggctgc agactgggag 8160
gccaccccct ccttcccagg gttcactgga ggtgaccaag gtaggaaatg gccttaacac 8220
agggatgact gcgccatccc ccaacagagt cagccccctc ctgctctgta ccccgcaccc 8280
cccaggccag tccacgaaaa ccagggcccc acatcagagt cactgcctgg cccggccctg 8340
gggcggaccc ctcagccccc accctgtcta gaggacttgg ggggacagga cacaggccct 8400
ctccttatgg ttcccccacc tgcctccggc cgggaccctt ggggtgtgga cagaaaggac 8460
acctgcctaa ttggccccca ggaacccaga acttctctcc agggacccca gcccgagcac 8520
ccccttaccc aggacccagc cctgcccctc ctcccctctg ctctcctctc atcaccccat 8580
gggaatccgg tatccccagg aagccatcag gaagggctga aggaggaagc ggggccgtgc 8640
accaccgggc aggaggctcc gtcttcgtga acccagggaa gtgccagcct cctagagggt 8700
atggtccacc ctgcctgggg ctcccaccgt ggcaggctgc ggggaaggac cagggacggt 8760
gtgggggagg gctcagggcc ctgcgggtgc tcctccatct tcggtgagcc tcccccttca 8820
cccaccgtcc cgcccacctc ctctccaccc tggctgcacg tcttccacac catcctgagt 8880
cctacctaca ccagagccag caaagccagt gcagacaaag gctggggtgc aggggggctg 8940
ccagggcagc ttcggggagg gaaggatgga gggaggggag gtcagtgaag aggccccctt 9000
cccctgggtc caggatcctc ctctgggacc cccggatccc atcccctcct ggctctggga 9060
ggagaagcag gatgggagaa tctgtgcggg accctctcac agtggaatat ccccacagcg 9120
gctcaggcca gacccaaaag cccctcagtg agccctccac tgcagtcctg ggcctgggta 9180
gcagcccctc ccacagagga cagacccagc accccgaaga agtcctgcca gggggagctc 9240
agagccatga aagagcagga tatggggtcc ccgatacagg cacagacctc agctccatcc 9300
aggcccaccg ggacccacca tgggaggaac acctgtctcc gggttgtgag gtagctggcc 9360
tctgtctcgg accccactcc agacaccaga cagaggggca ggccccccaa aaccagggtt 9420
gagggatgat ccgtcaaggc agacaagacc aaggggcact gaccccagca agggaaggct 9480
cccaaacaga cgaggaggat tttgtagctg tctgtatcac tgtgcagctt cttgtgccat 9540
gccgatttcg gcgggcatgg caccatttgg aagctcttcc tccggttcca gcagaacctg 9600
ctaccacagt gacactcgcc aggtcaaaaa ccccgtccca agtcagcgga agcagagaga 9660
gcagggagga cacgtttagg atctgaggcc gcacctgaca cccagggcag cagacgtctc 9720
ccctccaggg caccctccac cgtcctgcgt ttcttcaaga ataggggcgg cctgaggggg 9780
tccagggcca ggcgataggt cccctctacc ccaaggagga gccaggcagg acccgagcac 9840
cgatgcatct aacgcagtca tgtaatgctg ggtgacagtc agttcgccta cgta 9894
<210> 134
<211> 11977
<212> DNA
<213> 人工序列
<220>
<223> D6-DH120126
<400> 134
tacgtaatgc atctaacgca gtcatgtaat gctgggtgac agtcagttcg cctccccatt 60
gaggctgacc tgcccagacg ggcctgggcc caccccacac accggggcgg aatgtgtgca 120
ggccccagtc tctgtgggtg ttccgctagc tggggccccc agtgctcacc ccacacctaa 180
agcgagcccc agcctccaga gccccctaag cattccccgc ccagcagccc agcccctgcc 240
cccacccagg aggccccaga gctcagggcg cctggtcgga ttttgtacag ccccgagtca 300
ctgtgcatgc cgatttcggc gggcatggca ccatttggaa gctcttcctc cggttccagc 360
agaacctgct accacagtga gaaaaactgt gtcaaaaacc gactcctggc agcagtcgga 420
ggccccgcca gagaggggag cagccggcct gaacccatgt cctgccggtt cccatgaccc 480
ccagcaccca gagccccacg gtgtccccgt tggataatga ggacaagggc tgggggctcc 540
ggtggtttgc ggcagggact tgatcacatc cttctgctgt ggccccattg cctctggctg 600
gagttgaccc ttctgacaag tgtcctcaga aagacaggga tcaccggcac ctcccaatat 660
caaccccagg cagcacagac acaaacccca catccagagc caactccagg agcagagaca 720
ccccaacact ctgggggacc ccaaccgtga taactcccca ctggaatccg ccccagagtc 780
taccaggacc aaaggccctg ccctgtctct gtccctcact cagggcctcc tgcagggcga 840
gcgcttggga gcagactcgg tcttagggga caccactgtg ggccccaact ttgatgaggc 900
cactgaccct tccttccttt cctggggcag cacagacttt ggggtctggg cagggaagaa 960
ctactggctg gtggccaatc acagagcccc caggccgagg tggccccaag aaggccctca 1020
ggaggtggcc actccacttc ctcccagctg gaccccaggt cctccccaag ataggggtgc 1080
catccaaggc aggtcctcca tggagccccc ttcagactcc tcccgggacc ccactggacc 1140
tcagtccctg ctctgggaat gcagccacca caagcacacc aggaagccca ggcccagcca 1200
ccctgcagtg ggcaagccca cactctggag cagagcaggg tgcgtctggg aggggctaac 1260
ctccccaccc cccacccccc atctgcacac agccacctac cactgcccag accctctgca 1320
ggagggccaa gccaccatgg ggtatggact tagggtctca ctcacgtgcc tcccctcctg 1380
ggagaagggg cctcatgccc agatccctgc agcactagac acagctggag gcagtggccc 1440
cagggccacc ctgacctggc atctaaggct gctccagccc agacagcact gccgttcctg 1500
ggaagcctgg gctccaccag accacaggtc cagggcacag cccacaggag ccacccacac 1560
acagctcaca ggaagaagat aagctccaga ccccagggcg ggacctgcct tcctgccacc 1620
acttacacac aggccaggga gctgttccca cacagatcaa ccccaaaccg ggactgcctg 1680
gcactagggt cactgccatt tccctctcca ttccctccca gtgcctctgt gctccctcct 1740
tctggggaac accctgtgca gcccctccct gcagcccaca cgctggggag accccaccct 1800
gcctcgggcc ttttctacct gctgcacttg ccgcccaccc aaacaaccct gggtacgtga 1860
ccctgcagtc ctcaccctga tctgcaacca gacccctgtc cctccctcta aacacccctc 1920
ccaggccaac tctgcacctg caggccctcc gctcttctgc cacaagagcc tcaggttttc 1980
ctacctgtgc ccacccccta acccctcctg cccacaactt gagttcttcc tctcctggag 2040
cccttgagcc atggcactga ccctacactc ccacccacac actgcccatg ccatcacctt 2100
cctcctggac actctgaccc cgctcccctc cctctcagac ccggccctgg tatttccagg 2160
acaaaggctc acccaagtct tccccatgca ggcccttgcc ctcactgcct ggttacacgg 2220
gagcctcctg tgcgcagaag cagggagctc agctcttcca caggcagaag gcactgaaag 2280
aaatcagcct ccagtgcctt gacacacgtc cgcctgtgtc tctcactgcc tgcacctgca 2340
gggaggctcc gcactccctc taaagatgag ggatccaggc agcaacatca cgggagaatg 2400
cagggctccc agacagccca gccctctcgc aggcctctcc tgggaagaga cctgcagcca 2460
ccactgaaca gccacggagg tcgctggata gtaaccgagt cagtgaccga cctggagggc 2520
aggggagcag tgaaccggag cccataccat agggacagag accagccgct aacatcccga 2580
gcccctcact ggcggcccca gaacaccccg tggaaagaga acagacccac agtcccacct 2640
ggaacagggc agacactgct gagcccccag caccagcccc aagaaacact aggcaacagc 2700
atcagagggg gctcctgaga aagagaggag gggaggtctc cttcaccatc aaatgcttcc 2760
cttgaccaaa aacagggtcc acgcaactcc cccaggacaa aggaggagcc ccctgtacag 2820
cactgggctc agagtcctct ctgagacagg ctcagtttca gacaacaacc cgctggaatg 2880
cacagtctca gcaggagagc caggccagag ccagcaagag gagactcggt gacaccagtc 2940
tcctgtaggg acaggaggat tttgtggggg ttcgtgtcac tgtgcaaacc catgaaaacc 3000
ccaagggagt ttggaacagc aagcacagtg acacaacccc attcaaaaac ccctactgca 3060
aacgcaccca ctcctgggac tgaggggctg ggggagcgtc tgggaagtat ggcctagggg 3120
tgtccatcaa tgcccaaaat gcaccagact ctccccaaga catcacccca ccagccagtg 3180
agcagagtaa acagaaaatg agaagcagct gggaagcttg cacaggcccc aaggaaagag 3240
ctttggcagg tgtgcaagag gggatgtggg cagagcctca gcagggcctt ttgctgtttc 3300
tgctttcctg tgcagagagt tccataaact ggtattcaag atcaatggct gggagtgagc 3360
ccaggaggac agtgtgggaa gagcacaggg aaggaggagc agccgctatc ctacactgtc 3420
atcttttgaa agtttgccct gtgcccacaa tgctgcatca tgggatgctt aacagctgat 3480
gtagacacag ctaaagagag aatcagtgaa atggatttgc agcacagatc tgaataaatc 3540
ctccagaatg tggagcagca cagaagcaag cacacagaaa gtgcctgatg ccaaggcaaa 3600
gttcagtggg caccttcagg cattgctgct gggcacagac actctgaaaa gcactggcag 3660
gaactgcctg tgacaaagca gaaccctcag gcaatgccag ccctagagcc cttcctgaga 3720
acctcatggg caaagatgtg cagaacagct gtttgtcata gccccaaact atggggctgg 3780
acaaagcaaa cgtccatctg aaggagaaca gacaaataaa cgatggcagg ttcatgaaat 3840
gcaaactagg acagccagag gacaacagta gagagctaca ggcggctttg cggttgagtt 3900
catgacaatg ctgagtaatt ggagtaacag aggaaagccc aaaaaatact tttaatgtga 3960
tttcttctaa ataaaattta cacccggcaa aatgaactat cttcttaagg gataaacttt 4020
cccctggaaa aactataagg aaaatcaaga aaacgatgat cacataaaca cagtggtggt 4080
tacttctact ggggaaggaa gagggtatga gctgagacac acagagtcgg caagtctcct 4140
aacaagaaca gaacaaatac attacagtac cttgaaaaca gcagttaaac ttctaaatcg 4200
caagaagagg aaaatgcaca cacctgtgtt tagaaaattc tcagtccagc actgttcata 4260
atagcaaaga cattaaccca ggttggataa ataagcgatg acacaggcaa ttgcacaatg 4320
atacagacat acattcagta tatgagacat cgatgatgta tccccaaaga aatgacttta 4380
aagagaaaag gcctgatgtg tggtggcaat cacctccctg ggcatccccg gacaggctgc 4440
aggctcactg tgtggcaggg caggcaggca cctgctggca gctcctgggg cctgatgtgg 4500
agcaggcaca gagctgtata tccccaagga aggtacagtc agtgcattcc agagagaagc 4560
aactcagcca cactccctgg ccagaaccca agatgcacac ccatgcacag ggaggcagag 4620
cccagcacct ccgcagccac caccacctgc gcacgggcca ccaccttgca ggcacagagt 4680
gggtgctgag aggaggggca gggacaccag gcagggtgag cacccagaga aaactgcaga 4740
agcctcacac atccctcacc tggcctgggc ttcacctgac ctggacctca cctggcctcg 4800
ggcctcacct gcacctgctc caggtcttgc tggagcctga gtagcactga ggctgtaggg 4860
actcatccag ggttggggaa tgactctgca actctcccac atctgacctt tctgggtgga 4920
ggcacctggt ggcccaggga atataaaaag ccccagaatg atgcctgtgt gatttggggg 4980
caatttatga acccgaaagg acatggccat ggggtgggta gggacagtag ggacagatgt 5040
cagcctgagg tgaagcctca ggacacaggt gggcatggac agtgtccacc taagcgaggg 5100
acagacccga gtgtccctgc agtagacctg agagcgctgg gcccacagcc tcccctcggg 5160
gccctgctgc ctcctcaggt cagccctgga catcccgggt ttccccaggc ctggcggtag 5220
gattttgttg aggtctgtgt cactgtgcat ggcagctact gccagcccgc agccactggc 5280
tactgaggat gccgattctg agaatagcag cttctactac tatgactacc tggatgaagt 5340
agctttcatg ctcagcgagg ttagccagca tctagactat gcccacagtg tcacagagtc 5400
catcaaaaac ccatgcctgg gagcctccca ccacagccct ccctgcgggg gaccgctgca 5460
tgccgtgtta ggattttgat cgaggacacg gcgccatggg tatggtggct accacagcag 5520
tgcagcccat gacccaaaca cacggggcag cagaaacaat ggacaggccc acaagtgacc 5580
atgatgggct ccagcccacc agccccagag accatgaaac agatggccaa ggtcacccta 5640
caggtcatcc agatctggct ccaaggggtc tgcatcgctg ctgccctccc aacgccaaac 5700
cagatggaga cagggccggc cccatagcac catctgctgc cgtccaccca gcagtcccgg 5760
aagcccctcc ctgaacgctg ggccacgtgt gtgaaccctg cgagcccccc atgtcagagt 5820
aggggcagca ggagggcggg gctggccctg tgcactgtca ctgcccctgt ggtccctggc 5880
ctgcctggcc ctgacacctg agcctctcct gggtcatttc caagacattc ccagggacag 5940
ccggagctgg gagtcgctca tcctgcctgg ctgtcctgag tcctgctcat ttccagacct 6000
caccagggaa gccaacagag gactcacctc acacagtcag agacaacgaa ccttccagaa 6060
atccctgttt ctctccccag tgagagaaac cctcttccag ggtttctctt ctctcccacc 6120
ctcttccagg acagtcctca gcagcatcac agcgggaacg cacatctgga tcaggacggc 6180
ccccagaaca cgcgatggcc catggggaca gcccagccct tcccagaccc ctaaaaggta 6240
tccccacctt gcacctgccc cagggctcaa actccaggag gcctgactcc tgcacaccct 6300
cctgccagat atcacctcag ccccctcctg gaggggacag gagcccggga gggtgagtca 6360
gacccacctg ccctcaatgg caggcgggga agattcagaa aggcctgaga tccccaggac 6420
gcagcaccac tgtcaatggg ggccccagac gcctggacca gggcctgtgt gggaaaggcc 6480
tctggccaca ctcaggggga ttttgtgaag ggccctccca ctgtggaggt tagccagcat 6540
ctagactatg cccacagtga tgaaaccagc atcaaaaacc gaccggactc gcagggttta 6600
tgcacacttc tcggctcgga gctctccagg agcacaagag ccaggcccga gggtttgtgc 6660
ccagaccctc ggcctctagg gacacccggg ccatcttagc cgatgggctg atgccctgca 6720
caccgtgtgc tgccaaacag gggcttcaga gggctctgag gtgacttcac tcatgaccac 6780
aggtgccctg gtcccttcac tgccagctgc accagaccct gttccgagag atgccccagt 6840
tccaaaagcc aattcctggg gccgggaatt actgtagaca ccagcctcat tccagtacct 6900
cctgccaatt gcctggattc ccatcctggc tggaatcaag agggcagcat ccgccaggct 6960
cccaacaggc aggactccca cacaccctcc tctgagaggc cgctgtgttc cgcagggcca 7020
ggccgcagac agttcccctc acctgcccat gtagaaacac ctgccattgt cgtccccacc 7080
tggcaaagac cacttgtgga gcccccagcc ccaggtacag ctgtagagag agtcctcgag 7140
gcccctaaga aggagccatg cccagttctg ccgggaccct cggccaggcc gacaggagtg 7200
gacgctggag ctgggcccac actgggccac ataggagctc accagtgagg gcaggagagc 7260
acatgccggg gagcacccag cctcctgctg accagagacc cgtcccagag cccaggaggc 7320
tgcagaggcc tctccagggg gacacagtgc atgtctggtc cctgagcagc ccccaggctc 7380
tctagcactg ggggcccctg gcacagctgt ctggaccctc cctgttccct gggaagctcc 7440
tcctgacagc cccgcctcca gttccaggtg tggattttgt cagggggtgc cacactgtgc 7500
tgcataccct gctggacctg caagtattcg gcaacagtcg gaaggatgct gtggttagct 7560
ttggcaaagt tttcctgcca ccacagtggt gccgcccata tcaaaaacca ggccaagtag 7620
acagacccct gccacgcagc cccaggcctc cagctcacct gcttctcctg gggctctcaa 7680
ggctgctgtc tgccctctgg ccctctgtgg ggagggttcc ctcagtggga ggtctgtgct 7740
ccagggcagg gatgactgag atagaaatca aaggctggca gggaaaggca gcttcccgcc 7800
ctgagaggtg caggcagcac cacagagcca tggagtcaca gagccacgga gcccccagtg 7860
tgggcgtgtg agggtgctgg gctcccggca ggcccagccc tgatggggaa gcctgccccg 7920
tcccacagcc caggtcccca ggggcagcag gcacagaagc tgccaagctg tgctctacga 7980
tcctcatccc tccagcagca tccactccac agtggggaaa ctgagccttg gagaaccacc 8040
cagccccctg gaaacaaggc ggggagccca gacagtgggc ccagagcact gtgtgtatcc 8100
tggcactagg tgcagggacc acccggagat ccccatcact gagtggccag cctgcagaag 8160
gacccaaccc caaccaggcc gcttgattaa gctccatccc cctgtcctgg gaacctcttc 8220
ccagcgccac caacagctcg gcttcccagg ccctcatccc tccaaggaag gccaaaggct 8280
gggcctgcca ggggcacagt accctccctt gccctggcta agacagggtg ggcagacggc 8340
tgcagatagg acatattgct ggggcatctt gctctgtgac tactgggtac tggctctcaa 8400
cgcagaccct accaaaatcc ccactgcctc ccctgctagg ggctggcctg gtctcctcct 8460
gctgtcctag gaggctgctg acctccagga tggcttctgt ccccagttct agggccagag 8520
cagatcccag gcaggctgta ggctgggagg ccacccctgt ccttgccgag gttcagtgca 8580
ggcacccagg acaggaaatg gcctgaacac agggatgact gtgccatgcc ctacctaagt 8640
ccgccccttt ctactctgca acccccactc cccaggtcag cccatgacga ccaacaaccc 8700
aacaccagag tcactgcctg gccctgccct ggggaggacc cctcagcccc caccctgtct 8760
agaggagttg gggggacagg acacaggctc tctccttatg gttcccccac ctggctcctg 8820
ccgggaccct tggggtgtgg acagaaagga cgcctgccta attggccccc aggaacccag 8880
aacttctctc cagggacccc agcccgagca cccccttacc caggacccag ccctgcccct 8940
cctcccctct gctctcctct catcactcca tgggaatcca gaatccccag gaagccatca 9000
ggaagggctg aaggaggaag cggggccgct gcaccaccgg gcaggaggct ccgtcttcgt 9060
gaacccaggg aagtgccagc ctcctagagg gtatggtcca ccctgcctgg ggctcccacc 9120
gtggcaggct gcggggaagg accagggacg gtgtggggga gggctcaggg ccctgcaggt 9180
gctccatctt ggatgagccc atccctctca cccaccgacc cgcccacctc ctctccaccc 9240
tggccacacg tcgtccacac catcctgagt cccacctaca ccagagccag cagagccagt 9300
gcagacagag gctggggtgc aggggggccg ccagggcagc tttggggagg gaggaatgga 9360
ggaaggggag gtcagtgaag aggcccccct cccctgggtc taggatccac ctttgggacc 9420
cccggatccc atcccctcca ggctctggga ggagaagcag gatgggagat tctgtgcagg 9480
accctctcac agtggaatac ctccacagcg gctcaggcca gatacaaaag cccctcagtg 9540
agccctccac tgcagtgcag ggcctggggg cagcccctcc cacagaggac agacccagca 9600
ccccgaagaa gtcctgccag ggggagctca gagccatgaa ggagcaagat atggggaccc 9660
caatactggc acagacctca gctccatcca ggcccaccag gacccaccat gggtggaaca 9720
cctgtctccg gcccctgctg gctgtgaggc agctggcctc tgtctcggac ccccattcca 9780
gacaccagac agagggacag gccccccaga accagtgttg agggacaccc ctgtccaggg 9840
cagccaagtc caagaggcgc gctgagccca gcaagggaag gcccccaaac aaaccaggag 9900
gtttctgaag ctgtctgtgt cacagtcggg catagccacg gctaccacaa tgacactggg 9960
caggacagaa accccatccc aagtcagccg aaggcagaga gagcaggcag gacacattta 10020
ggatctgagg ccacacctga cactcaagcc aacagatgtc tcccctccag ggcgccctgc 10080
cctgttcagt gttcctgaga aaacaggggc agcctgaggg gatccagggc caggagatgg 10140
gtcccctcta ccccgaggag gagccaggcg ggaatcccag ccccctcccc attgaggcca 10200
tcctgcccag aggggcccgg acccacccca cacacccagg cagaatgtgt gcaggcctca 10260
ggctctgtgg gtgccgctag ctggggctgc cagtcctcac cccacaccta aggtgagcca 10320
cagccgccag agcctccaca ggagacccca cccagcagcc cagcccctac ccaggaggcc 10380
ccagagctca gggcgcctgg gtggattttg tacagccccg agtcactgtg ctgcataccc 10440
tgctggacct gcaagtattc ggcaaccaca gtgagaaaag ctatgtcaaa aaccgtctcc 10500
cggccactgc tggaggccca gccagagaag ggaccagccg cccgaacata cgaccttccc 10560
agacctcatg acccccagca cttggagctc cacagtgtcc ccattggatg gtgaggatgg 10620
gggccggggc catctgcacc tcccaacatc acccccaggc agcacaggca caaaccccaa 10680
atccagagcc gacaccagga acacagacac cccaataccc tgggggaccc tggccctggt 10740
gacttcccac tgggatccac ccccgtgtcc acctggatca aagaccccac cgctgtctct 10800
gtccctcact cagggcctgc tgaggggcgg gtgctttgga gcagactcag gtttaggggc 10860
caccattgtg gggcccaacc tcgaccagga cacagatttt tctttcctgc cctggggcaa 10920
cacagacttt ggggtctgtg cagggaggac cttctggaaa gtcaccaagc acagagccct 10980
gactgaggtg gtctcaggaa gacccccagg agggggcttg tgccccttcc tctcatgtgg 11040
accccatgcc ccccaagata ggggcatcat gcagggcagg tcctccatgc agccaccact 11100
aggcaactcc ctggcgccgg tccccactgc gcctccatcc cggctctggg gatgcagcca 11160
ccatggccac accaggcagc ccgggtccag caaccctgca gtgcccaagc ccttggcagg 11220
attcccagag gctggagccc acccctcctc atccccccac acctgcacac acacacctac 11280
cccctgccca gtccccctcc aggagggttg gagccgccca tagggtgggg gctccaggtc 11340
tcactcactc gcttcccttc ctgggcaaag gagcctcgtg ccccggtccc ccctgacggc 11400
gctgggcaca ggtgtgggta ctgggcccca gggctcctcc agccccagct gccctgctct 11460
ccctgggagg cctgggcacc accagaccac cagtccaggg cacagcccca gggagccgcc 11520
cactgccagc tcacaggaag aagataagct tcagaccctc agggccggga gctgccttcc 11580
tgccacccct tcctgcccca gacctccatg ccctccccca accacttaca cacaagccag 11640
ggagctgttt ccacacagtt caaccccaaa ccaggacggc ctggcactcg ggtcactgcc 11700
atttctgtct gcattcgctc ccagcgcccc tgtgttccct ccctcctccc tccttccttt 11760
cttcctgcat tgggttcatg ccgcagagtg ccaggtgcag gtcagccctg agcttggggt 11820
cacctcctca ctgaaggcag cctcagggtg cccaggggca ggcagggtgg gggtgaggct 11880
tccagctcca accgcttcgc taccttagga ccgttatagt taggcgcgcc gtcgaccaat 11940
tctcatgttt gacagcttat catcgaattt ctacgta 11977
<210> 135
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 135
tgcggccgat cttagcc 17
<210> 136
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 136
acgagcgggt tcggcccatt c 21
<210> 137
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 137
ttgaccgatt ccttgcgg 18
<210> 138
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 138
cgggtcactg ccatttctg 19
<210> 139
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 139
tctgcattcg ctcccagcgc 20
<210> 140
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 140
tctgcggcat gaacccaat 19
<210> 141
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 141
tggccagaac tgaccctac 19
<210> 142
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 142
accgacaaga gtccctcagg 20
<210> 143
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 143
ggagtcggct ctggatgtg 19
<210> 144
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 144
ggagccaggc aggacaca 18
<210> 145
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 145
tgggctcgta gtttgacgt 19
<210> 146
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 146
gggactttct tacccacact tca 23
<210> 147
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 147
ggtcccgagc actcttaatt aaac 24
<210> 148
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 148
cctcgaatgg aactac 16
<210> 149
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 149
gggagagcaa ccattcgttg t 21
<210> 150
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 150
ccgagcaccg atgcatcta 19
<210> 151
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 151
cgcagtcatg taatgc 16
<210> 152
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 152
gggaggcgaa ctgactgtca 20
<210> 153
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 153
ggtggagagg ctattcggc 19
<210> 154
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 154
tgggcacaac agacaatcgg ctg 23
<210> 155
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 155
gaacacggcg gcatcag 17
<210> 156
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 156
cagtcccgtt gatccagcc 19
<210> 157
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 157
cccatcaggg attttgtatc tctgtggacg 30
<210> 158
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 158
ggatatgcag cactgtgcca c 21
<210> 159
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 159
tcctccaacg acaggtccc 19
<210> 160
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 160
tccctggaac tctgccccga caca 24
<210> 161
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 161
gatgaactga cgggcacagg 20
<210> 162
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 162
atcacactca tcccatcccc 20
<210> 163
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 163
cccttcccta agtaccacag agtgggctc 29
<210> 164
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 164
cacagggaag caggaactgc 20
<210> 165
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 165
gccatgcaag gccaagc 17
<210> 166
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 166
ccaggaaaat gctgccagag cctg 24
<210> 167
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 167
agttcttgag ccttagggtg ctag 24
<210> 168
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 168
ccccacagca aatcacaacc 20
<210> 169
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 169
atgcagttgt cacccttgag gccattc 27
<210> 170
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 170
tgtttcccag gcgtcactg 19
<210> 171
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 171
ctcagtgatt ctggccctgc 20
<210> 172
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 172
tgctccacag ctacaaaccc cttcctataa tg 32
<210> 173
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 173
ggatgatggc tcagcacaga g 21
<210> 174
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 174
tggtcacctc caggagcctc 20
<210> 175
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 175
agtctctgct tcccccttgt ggctatgagc 30
<210> 176
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 176
gctgcagggt gtatcaggtg c 21
<210> 177
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 177
gtgtcacagt cgggcata 18
<210> 178
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 178
ccacggctac cacaatgaca ctgg 24
<210> 179
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 179
ccttcggctg acttgggatg 20
<210> 180
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 180
gagagaagct gcaatggcag acgcggctgc agcagcagat ggagccgcga tcatagcagg 60
tgctgc 66
<210> 181
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 181
Glu Arg Ser Cys Asn Gly Arg Arg Gly Cys Ser Ser Arg Trp Ser Arg
1 5 10 15
Asp His Ser Arg Cys Cys
20
<210> 182
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 182
aggatattgt agcagcagat ggtgctatac c 31
<210> 183
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 183
Gly Tyr Cys Ser Ser Arg Trp Cys Tyr Thr
1 5 10
<210> 184
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 184
gtattacgat tgcaactgca gcagatggcg cgaccatagc aggtgctgct attatacc 58
<210> 185
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 185
Tyr Tyr Asp Cys Asn Cys Ser Arg Trp Arg Asp His Ser Arg Cys Cys
1 5 10 15
Tyr Tyr Thr
<210> 186
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 186
gagaggctta gctgtggctt ccctaagagc tgccgcagca ggcaaagcaa gcctcacaga 60
tgctgc 66
<210> 187
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 187
Glu Arg Leu Ser Cys Gly Phe Pro Lys Ser Cys Arg Ser Arg Gln Ser
1 5 10 15
Lys Pro His Arg Cys Cys
20
<210> 188
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 188
tacagccaga agtggatgtg gacttgcgat agtgagagga agtgcagtga gggtatggta 60
tgccggctgt ggtgtaagaa gaagctctgg 90
<210> 189
<211> 30
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 189
Tyr Ser Gln Lys Trp Met Trp Thr Cys Asp Ser Glu Arg Lys Cys Ser
1 5 10 15
Glu Gly Met Val Cys Arg Leu Trp Cys Lys Lys Lys Leu Trp
20 25 30
<210> 190
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 190
agctgcaact gcagcagcaa atggagccgc gaccatagca ggtgctgc 48
<210> 191
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 191
Ser Cys Asn Cys Ser Ser Lys Trp Ser Arg Asp His Ser Arg Cys Cys
1 5 10 15
<210> 192
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 192
gagagatgca atggcagacg cggctgcagc agatggcgcg atcatagcag gtgctgc 57
<210> 193
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 193
Glu Arg Cys Asn Gly Arg Arg Gly Cys Ser Arg Trp Arg Asp His Ser
1 5 10 15
Arg Cys Cys
<210> 194
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 194
aggatattgt actaatcgga gcaggcaggg tgtatgctat acc 43
<210> 195
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 195
Gly Tyr Cys Thr Asn Arg Ser Arg Gln Gly Val Cys Tyr Thr
1 5 10
<210> 196
<211> 61
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 196
gtattacgat tgcaactgca gcagatgggc tcgcgaccat agcaggtgct gctattataa 60
c 61
<210> 197
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 197
Tyr Tyr Asp Cys Asn Cys Ser Arg Trp Ala Arg Asp His Ser Arg Cys
1 5 10 15
Cys Tyr Tyr Asn
20
<210> 198
<211> 76
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 198
gtattactat gagagatgca atggcagacg cggctgcagc agatggcgcg atcatagcag 60
gtgctgctat tataac 76
<210> 199
<211> 25
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 199
Tyr Tyr Tyr Glu Arg Cys Asn Gly Arg Arg Gly Cys Ser Arg Trp Arg
1 5 10 15
Asp His Ser Arg Cys Cys Tyr Tyr Asn
20 25
<210> 200
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 200
gagaggcttt gtggcttccc taagagctgc agcaggcaaa agcctcacag atgctgc 57
<210> 201
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 201
Glu Arg Leu Cys Gly Phe Pro Lys Ser Cys Ser Arg Gln Lys Pro His
1 5 10 15
Arg Cys Cys
<210> 202
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 202
tactgccaga agtggatgtg gactagcgat agtgagagga agtgctgtga gggtatggta 60
agccggctgt ggtgtaagaa gaagctctgg 90
<210> 203
<211> 30
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 203
Tyr Cys Gln Lys Trp Met Trp Thr Ser Asp Ser Glu Arg Lys Cys Cys
1 5 10 15
Glu Gly Met Val Ser Arg Leu Trp Cys Lys Lys Lys Leu Trp
20 25 30
<210> 204
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 204
tgcaactgca gcagatggcg cgaccatagc aggtgctg 38
<210> 205
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 205
Cys Asn Cys Ser Arg Trp Arg Asp His Ser Arg Cys
1 5 10
<210> 206
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 206
gagagatgct gcaatggcag acgcggctgc agcagcagat ggtgccgcga tcatagcagg 60
tgctgc 66
<210> 207
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 207
Glu Arg Cys Cys Asn Gly Arg Arg Gly Cys Ser Ser Arg Trp Cys Arg
1 5 10 15
Asp His Ser Arg Cys Cys
20
<210> 208
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 208
aggatattgt agtggtagca gcagatgggg tagctgctac tcc 43
<210> 209
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 209
Gly Tyr Cys Ser Gly Ser Ser Arg Trp Gly Ser Cys Tyr Ser
1 5 10
<210> 210
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 210
gtattatgat tacgagagag cttgcaatgg cagacgcggc tgcagcagat gggctcgcga 60
tcatagcagg tgctgctatc gttatacc 88
<210> 211
<211> 29
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 211
Tyr Tyr Asp Tyr Glu Arg Ala Cys Asn Gly Arg Arg Gly Cys Ser Arg
1 5 10 15
Trp Ala Arg Asp His Ser Arg Cys Cys Tyr Arg Tyr Thr
20 25
<210> 212
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 212
gagaggcttg cttgtggctt ccctaagagc tgcagcaggc aagctaagcc tcacagatgc 60
tgc 63
<210> 213
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 213
Glu Arg Leu Ala Cys Gly Phe Pro Lys Ser Cys Ser Arg Gln Ala Lys
1 5 10 15
Pro His Arg Cys Cys
20
<210> 214
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 214
tactgccaga agtggatgtg gacttgcgat agtgagagga agagctgtga gggtatggta 60
tgccggctgt ggagtaagaa gaagctctgg 90
<210> 215
<211> 30
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 215
Tyr Cys Gln Lys Trp Met Trp Thr Cys Asp Ser Glu Arg Lys Ser Cys
1 5 10 15
Glu Gly Met Val Cys Arg Leu Trp Ser Lys Lys Lys Leu Trp
20 25 30
<210> 216
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 216
tgcaactgca gcagatgggc tcgcgaccat agcaggtgct g 41
<210> 217
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 217
Cys Asn Cys Ser Arg Trp Ala Arg Asp His Ser Arg Cys
1 5 10
<210> 218
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 218
gagagagctt gcaatggcag acgcggctgc agcagatggg ctcgcgatca tagcaggtgc 60
tgc 63
<210> 219
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 219
Glu Arg Ala Cys Asn Gly Arg Arg Gly Cys Ser Arg Trp Ala Arg Asp
1 5 10 15
His Ser Arg Cys Cys
20
<210> 220
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 220
agcatattgt cggagcaggc agtgctattc c 31
<210> 221
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 221
Ala Tyr Cys Arg Ser Arg Gln Cys Tyr Ser
1 5 10
<210> 222
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 222
gtattactat gagaggcttg cttgtggctt ccctaagagc tgcagcaggc aagctaagcc 60
tcacagatgc tgctattact ac 82
<210> 223
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 223
Tyr Tyr Tyr Glu Arg Leu Ala Cys Gly Phe Pro Lys Ser Cys Ser Arg
1 5 10 15
Gln Ala Lys Pro His Arg Cys Cys Tyr Tyr Tyr
20 25
<210> 224
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 224
gagaggcttt gctgtggctt ccctaagagc tgccgcagca ggcaatgcaa gcctcacaga 60
tgctgc 66
<210> 225
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 225
Glu Arg Leu Cys Cys Gly Phe Pro Lys Ser Cys Arg Ser Arg Gln Cys
1 5 10 15
Lys Pro His Arg Cys Cys
20
<210> 226
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 226
tactgccaga agtggatgtg gacttgcgat agtgagagga agtgctgtga gggtatggta 60
tgccggctgt ggtgtaagaa gaagctctgg 90
<210> 227
<211> 30
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 227
Tyr Cys Gln Lys Trp Met Trp Thr Cys Asp Ser Glu Arg Lys Cys Cys
1 5 10 15
Glu Gly Met Val Cys Arg Leu Trp Cys Lys Lys Lys Leu Trp
20 25 30
<210> 228
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 228
tgctgcaact gcagcagcaa atggtgccgc gaccatagca ggtgctgc 48
<210> 229
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 229
Cys Cys Asn Cys Ser Ser Lys Trp Cys Arg Asp His Ser Arg Cys Cys
1 5 10 15
<210> 230
<211> 77
<212> DNA
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列
<400> 230
ggtatagtgg ggagaggctt tgtggcttcc ctaagagctg cagcaggcaa aagcctcaca 60
gatgctgcag ctactac 77
<210> 231
<211> 25
<212> PRT
<213> 人工序列
<220>
<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列
<400> 231
Tyr Ser Gly Glu Arg Leu Cys Gly Phe Pro Lys Ser Cys Ser Arg Gln
1 5 10 15
Lys Pro His Arg Cys Cys Ser Tyr Tyr
20 25
<210> 232
<211> 9975
<212> DNA
<213> 人工序列
<220>
<223> Tx-DH1166
<400> 232
tacgtagccg tttcgatcct cccgaattga ctagtgggta ggcctggcgg ccgctgccat 60
ttcattacct ctttctccgc acccgacata gataccggtg gattcgaatt ctccccgttg 120
aagctgacct gcccagaggg gcctgggccc accccacaca ccggggcgga atgtgtacag 180
gccccggtct ctgtgggtgt tccgctaact ggggctccca gtgctcaccc cacaactaaa 240
gcgagcccca gcctccagag cccccgaagg agatgccgcc cacaagccca gcccccatcc 300
aggaggcccc agagctcagg gcgccggggc ggattttgta cagccccgag tcactgtgga 360
gagaagctgc aatggcagac gcggctgcag cagcagatgg agccgcgatc atagcaggtg 420
ctgccacagt gagaaaaact gtgtcaaaaa ccgtctcctg gcccctgctg gaggccgcgc 480
cagagagggg agcagccgcc ccgaacctag gtcctgctca gctcacacga cccccagcac 540
ccagagcaca acggagtccc cattgaatgg tgaggacggg gaccagggct ccagggggtc 600
atggaagggg ctggacccca tcctactgct atggtcccag tgctcctggc cagaactgac 660
cctaccaccg acaagagtcc ctcagggaaa cgggggtcac tggcacctcc cagcatcaac 720
cccaggcagc acaggcataa accccacatc cagagccgac tccaggagca gagacacccc 780
agtaccctgg gggacaccga ccctgatgac tccccactgg aatccacccc agagtccacc 840
aggaccaaag accccgcccc tgtctctgtc cctcactcag gacctgctgc ggggcgggcc 900
atgagaccag actcgggctt agggaacacc actgtggccc caacctcgac caggccacag 960
gcccttcctt cctgccctgc ggcagcacag actttggggt ctgtgcagag aggaatcaca 1020
gaggccccag gctgaggtgg tgggggtgga agacccccag gaggtggccc acttcccttc 1080
ctcccagctg gaacccacca tgaccttctt aagatagggg tgtcatccga ggcaggtcct 1140
ccatggagct cccttcaggc tcctccccgg tcctcactag gcctcagtcc cggctgcggg 1200
aatgcagcca ccacaggcac accaggcagc ccagacccag ccagcctgca gtgcccaagc 1260
ccacattctg gagcagagca ggctgtgtct gggagagtct gggctcccca ccgccccccc 1320
gcacacccca cccacccctg tccaggccct atgcaggagg gtcagagccc cccatggggt 1380
atggacttag ggtctcactc acgtggctcc cctcctgggt gaaggggtct catgcccaga 1440
tccccacagc agagctggtc aaaggtggag gcagtggccc cagggccacc ctgacctgga 1500
ccctcaggct cctctagccc tggctgccct gctgtccctg ggaggcctgg actccaccag 1560
accacaggtc cagggcaccg cccataggtg ctgcccacac tcagttcaca ggaagaagat 1620
aagctccaga cccccaagac tgggacctgc cttcctgcca ccgcttgtag ctccagacct 1680
ccgtgcctcc cccgaccact tacacacggg ccagggagct gttccacaaa gatcaacccc 1740
aaaccgggac cgcctggcac tcgggccgct gccacttccc tctccatttg ttcccagcac 1800
ctctgtgctc cctccctcct ccctccttca ggggaacagc ctgtgcagcc cctccctgca 1860
ccccacaccc tggggaggcc caaccctgcc tccagccctt tctcccccgc tgctcttcct 1920
gcccatccag acaaccctgg ggtcccatcc ctgcagccta caccctggtc tccacccaga 1980
cccctgtctc tccctccaga cacccctccc aggccaaccc tgcacatgca ggccctcccc 2040
ttttctgctg ccagagcctc agtttctacc ctctgtgcct accccctgcc tcctcctgcc 2100
cacaactcga gctcttcctc tcctggggcc cctgagccat ggcactgacc gtgcactccc 2160
acccccacac tgcccatgcc ctcaccttcc tcctggacac tctgaccccg ctcccctctt 2220
ggacccagcc ctggtatttc caggacaaag gctcacccaa gtcttcccca tgcaggccct 2280
tgccctcact gcccggttac acggcagcct cctgtgcaca gaagcaggga gctcagccct 2340
tccacaggca gaaggcactg aaagaaatcg gcctccagca ccctgatgca cgtccgcctg 2400
tgtctctcac tgcccgcacc tgcagggagg ctcggcactc cctgtaaaga cgagggatcc 2460
aggcagcaac atcatgggag aatgcagggc tcccagacag cccagccctc tcgcaggcct 2520
ctcctgggaa gagacctgca gccaccactg aacagccacg gagcccgctg gatagtaact 2580
gagtcagtga ccgacctgga gggcagggga gcagtgaacc ggagcccaga ccatagggac 2640
agagaccagc cgctgacatc ccgagcccct cactggcggc cccagaacac cgcgtggaaa 2700
cagaacagac ccacattccc acctggaaca gggcagacac tgctgagccc ccagcaccag 2760
ccctgagaaa caccaggcaa cggcatcaga gggggctcct gagaaagaaa ggaggggagg 2820
tctccttcac cagcaagtac ttcccttgac caaaaacagg gtccacgcaa ctcccccagg 2880
acaaaggagg agccccctgt acagcactgg gctcagagtc ctctcccaca caccctgagt 2940
ttcagacaaa aaccccctgg aaatcatagt atcagcagga gaactagcca gagacagcaa 3000
gaggggactc agtgactccc gcggggacag gaggattttg tgggggctcg tgtcactgtg 3060
aggatattgt agcagcagat ggtgctatac ccacagtgac acagccccat tcaaaaaccc 3120
ctgctgtaaa cgcttccact tctggagctg aggggctggg gggagcgtct gggaagtagg 3180
gcctaggggt ggccatcaat gcccaaaacg caccagactc ccccccagac atcaccccac 3240
tggccagtga gcagagtaaa cagaaaatga gaagcagctg ggaagcttgc acaggcccca 3300
aggaaagagc tttggcgggt gtgcaagagg ggatgcgggc agagcctgag cagggccttt 3360
tgctgtttct gctttcctgt gcagatagtt ccataaactg gtgttcaaga tcgatggctg 3420
ggagtgagcc caggaggaca gtgtgggaag ggcacaggga aggagaagca gccgctatcc 3480
tacactgtca tctttcaaga gtttgccctg tgcccacaat gctgcatcat gggatgctta 3540
acagctgatg tagacacagc taaagagaga atcagtgaaa tggatttgca gcacagatct 3600
gaataaattc tccagaatgt ggagccacac agaagcaagc acaaggaaag tgcctgatgc 3660
aagggcaaag tacagtgtgt accttcaggc tgggcacaga cactctgaaa agccttggca 3720
ggaactccct gcaacaaagc agagccctgc aggcaatgcc agctccagag ccctccctga 3780
gagcctcatg ggcaaagatg tgcacaacag gtgtttctca tagccccaaa ctgagaatga 3840
agcaaacagc catctgaagg aaaacaggca aataaacgat ggcaggttca tgaaatgcaa 3900
acccagacag ccagaaggac aacagtgagg gttacaggtg actctgtggt tgagttcatg 3960
acaatgctga gtaattggag taacaaagga aagtccaaaa aatactttca atgtgatttc 4020
ttctaaataa aatttacagc cggcaaaatg aactatcttc ttaagggata aactttccac 4080
taggaaaact ataaggaaaa tcaagaaaag gatgatcaca taaacacagt ggtcgttact 4140
tctactgggg aaggaagagg gtatgaactg agacacacag ggttggcaag tctcctaaca 4200
agaacagaac aaatacatta cagtaccttg aaaacagcag ttaaaattct aaattgcaag 4260
aagaggaaaa tgcacacagc tgtgtttaga aaattctcag tccagcactg ttcataatag 4320
caaagacatt aacccaggtt ggataaataa acgatgacac aggcaattgc acaatgatac 4380
agacatacat tcagtatatg agacattgat gatgtatccc caaagaaatg actttaaaga 4440
gaaaaggcct gatatgtggt ggcactcacc tccctgggca tccccggaca ggctgcaggc 4500
acactgtgtg gcagggcagg ctggtacctg ctggcagctc ctggggcctg atgtggagca 4560
ggcacagagc cgtatccccc cgaggacata tacccccaag gacggcacag ttggtacatt 4620
ccggagacaa gcaactcagc cacactccca ggccagagcc cgagagggac gcccatgcac 4680
agggaggcag agcccagctc ctccacagcc agcagcaccc gtgcaggggc cgccatctgg 4740
caggcacaga gcatgggctg ggaggagggg cagggacacc aggcagggtt ggcaccaact 4800
gaaaattaca gaagtctcat acatctacct cagccttgcc tgacctgggc ctcacctgac 4860
ctggacctca cctggcctgg acctcacctg gcctagacct cacctctggg cttcacctga 4920
gctcggcctc acctgacttg gaccttgcct gtcctgagct cacatgatct gggcctcacc 4980
tgacctgggt ttcacctgac ctgggcttca cctgacctgg gcctcatctg acctgggcct 5040
cactggcctg gacctcacct ggcctgggct tcacctggcc tcaggcctca tctgcacctg 5100
ctccaggtct tgctggaacc tcagtagcac tgaggctgca ggggctcatc cagggttgca 5160
gaatgactct agaacctccc acatctcagc tttctgggtg gaggcacctg gtggcccagg 5220
gaatataaaa agcctgaatg atgcctgcgt gatttggggg caatttataa acccaaaagg 5280
acatggccat gcagcgggta gggacaatac agacagatat cagcctgaaa tggagcctca 5340
gggcacaggt gggcacggac actgtccacc taagccaggg gcagacccga gtgtccccgc 5400
agtagacctg agagcgctgg gcccacagcc tcccctcggt gccctgctac ctcctcaggt 5460
cagccctgga catcccgggt ttccccaggc ctggcggtag gattttgttg aggtctgtgt 5520
cactgtggta ttacgattgc aactgcagca gatggcgcga ccatagcagg tgctgctatt 5580
atacccacag tgtcacagag tccatcaaaa acccatccct gggaaccttc tgccacagcc 5640
ctccctgtgg ggcaccgccg cgtgccatgt taggattttg actgaggaca cagcaccatg 5700
ggtatggtgg ctaccgcagc agtgcagccc gtgacccaaa cacacagggc agcaggcaca 5760
acagacaagc ccacaagtga ccaccctgag ctcctgcctg ccagccctgg agaccatgaa 5820
acagatggcc aggattatcc cataggtcag ccagacctca gtccaacagg tctgcatcgc 5880
tgctgccctc caataccagt ccggatgggg acagggctgg cccacattac catttgctgc 5940
catccggcca acagtcccag aagcccctcc ctcaaggctg ggccacatgt gtggaccctg 6000
agagcccccc atgtctgagt aggggcacca ggaaggtggg gctggccctg tgcactgtcc 6060
ctgcccctgt ggtccctggc ctgcctggcc ctgacacctg ggcctctcct gggtcatttc 6120
caagacagaa gacattccca ggacagctgg agctgggagt ccatcatcct gcctggccgt 6180
cctgagtcct gcgcctttcc aaacctcacc cgggaagcca acagaggaat cacctcccac 6240
aggcagagac aaagaccttc cagaaatctc tgtctctctc cccagtgggc accctcttcc 6300
agggcagtcc tcagtgatat cacagtggga acccacatct ggatcgggac tgcccccaga 6360
acacaagatg gcccacaggg acagccccac agcccagccc ttcccagacc cctaaaaggc 6420
gtcccacccc ctgcatctgc cccagggctc aaactccagg aggactgact cctgcacacc 6480
ctcctgccag acatcacctc agcccctcct ggaagggaca ggagcgcgca agggtgagtc 6540
agaccctcct gccctcgatg gcaggcggag aagattcaga aaggtctgag atccccagga 6600
cgcagcacca ctgtcaatgg gggccccaga cgcctggacc agggcctgcg tgggaaaggc 6660
ctctgggcac actcaggggg attttgtgaa gggtcctccc actgtggaga ggcttagctg 6720
tggcttccct aagagctgcc gcagcaggca aagcaagcct cacagatgct gccacagtga 6780
tgaacccagc atcaaaaacc gaccggactc ccaaggttta tgcacacttc tccgctcaga 6840
gctctccagg atcagaagag ccgggcccaa gggtttctgc ccagaccctc ggcctctagg 6900
gacatcttgg ccatgacagc ccatgggctg gtgccccaca catcgtctgc cttcaaacaa 6960
gggcttcaga gggctctgag gtgacctcac tgatgaccac aggtgccctg gccccttccc 7020
caccagctgc accagacccc gtcatgacag atgccccgat tccaacagcc aattcctggg 7080
gccaggaatc gctgtagaca ccagcctcct tccaacacct cctgccaatt gcctggattc 7140
ccatcccggt tggaatcaag aggacagcat cccccaggct cccaacaggc aggactccca 7200
caccctcctc tgagaggccg ctgtgttccg tagggccagg ctgcagacag tccccctcac 7260
ctgccactag acaaatgcct gctgtagatg tccccacctg gaaaatacca ctcatggagc 7320
ccccagcccc aggtacagct gtagagagag tctctgaggc ccctaagaag tagccatgcc 7380
cagttctgcc gggaccctcg gccaggctga caggagtgga cgctggagct gggcccatac 7440
tgggccacat aggagctcac cagtgagggc aggagagcac atgccgggga gcacccagcc 7500
tcctgctgac cagaggcccg tcccagagcc caggaggctg cagaggcctc tccaggggga 7560
cactgtgcat gtctggtccc tgagcagccc cccacgtccc cagtcctggg ggcccctggc 7620
acagctgtct ggaccctctc tattccctgg gaagctcctc ctgacagccc cgcctccagt 7680
tccaggtgtg gattttgtca gggggtgtca cactgtgtac agccagaagt ggatgtggac 7740
ttgcgatagt gagaggaagt gcagtgaggg tatggtatgc cggctgtggt gtaagaagaa 7800
gctctggcac agtggtgctg cccatatcaa aaaccaggcc aagtagacag gcccctgctg 7860
tgcagcccca ggcctccagc tcacctgctt ctcctggggc tctcaaggct gctgttttct 7920
gcactctccc ctctgtgggg agggttccct cagtgggaga tctgttctca acatcccacg 7980
gcctcattcc tgcaaggaag gccaatggat gggcaacctc acatgccgcg gctaagatag 8040
ggtgggcagc ctggcgggga caggacatcc tgctggggta tctgtcactg tgcctagtgg 8100
ggcactggct cccaaacaac gcagtccttg ccaaaatccc cacggcctcc cccgctaggg 8160
gctggcctga tctcctgcag tcctaggagg ctgctgacct ccagaatggc tccgtcccca 8220
gttccagggc gagagcagat cccaggccgg ctgcagactg ggaggccacc ccctccttcc 8280
cagggttcac tgcaggtgac cagggcagga aatggcctga acacagggat aaccgggcca 8340
tcccccaaca gagtccaccc cctcctgctc tgtaccccgc accccccagg ccagcccatg 8400
acatccgaca accccacacc agagtcactg cccggtgctg ccctagggag gacccctcag 8460
cccccaccct gtctagagga ctggggagga caggacacgc cctctcctta tggttccccc 8520
acctggctct ggctgggacc cttggggtgt ggacagaaag gacgcttgcc tgattggccc 8580
ccaggagccc agaacttctc tccagggacc ccagcccgag caccccctta cccaggaccc 8640
agccctgccc ctcctcccct ctgctctcct ctcatcaccc catgggaatc cagaatcccc 8700
aggaagccat caggaagggc tgagggagga agtggggcca ctgcaccacc aggcaggagg 8760
ctctgtcttt gtgaacccag ggaggtgcca gcctcctaga gggtatggtc caccctgcct 8820
atggctccca cagtggcagg ctgcagggaa ggaccaggga cggtgtgggg gagggctcag 8880
ggccccgcgg gtgctccatc ttggatgagc ctatctctct cacccacgga ctcgcccacc 8940
tcctcttcac cctggccaca cgtcgtccac accatcctaa gtcccaccta caccagagcc 9000
ggcacagcca gtgcagacag aggctggggt gcaggggggc cgactgggca gcttcgggga 9060
gggaggaatg gaggaagggg agttcagtga agaggccccc ctcccctggg tccaggatcc 9120
tcctctggga cccccggatc ccatcccctc caggctctgg gaggagaagc aggatgggag 9180
aatctgtgcg ggaccctctc acagtggaat acctccacag cggctcaggc cagatacaaa 9240
agcccctcag tgagccctcc actgcagtgc tgggcctggg ggcagccgct cccacacagg 9300
atgaacccag caccccgagg atgtcctgcc agggggagct cagagccatg aaggagcagg 9360
atatgggacc cccgatacag gcacagacct cagctccatt caggactgcc acgtcctgcc 9420
ctgggaggaa cccctttctc tagtccctgc aggccaggag gcagctgact cctgacttgg 9480
acgcctattc cagacaccag acagaggggc aggcccccca gaaccaggga tgaggacgcc 9540
ccgtcaaggc cagaaaagac caagttgcgc tgagcccagc aagggaaggt ccccaaacaa 9600
accaggagga ttttgtaggt gtctgtgtca ctgtgagctg caactgcagc agcaaatgga 9660
gccgcgacca tagcaggtgc tgccacagtg acactcgcca ggtcaaaaac cccatcccaa 9720
gtcagcggaa tgcagagaga gcagggagga catgtttagg atctgaggcc gcacctgaca 9780
cccaggccag cagacgtctc ctgtccacgg caccctgcca tgtcctgcat ttctggaaga 9840
acaagggcag gctgaagggg gtccaggacc aggagatggg tccgctctac ccagagaagg 9900
agccaggcag gacacaagcc cccacgcgtg ggctcgtagt ttgacgtgcg tgaagtgtgg 9960
gtaagaaagt acgta 9975
<210> 233
<211> 9714
<212> DNA
<213> 人工序列
<220>
<223> TxDH17613
<400> 233
gcggccgctg ccatttcatt acctctttct ccgcacccga catagattac gtaacgcgtg 60
ggctcgtagt ttgacgtgcg tgaagtgtgg gtaagaaagt ccccattgag gctgacctgc 120
ccagagggtc ctgggcccac ccaacacacc ggggcggaat gtgtgcaggc ctcggtctct 180
gtgggtgttc cgctagctgg ggctcacagt gctcacccca cacctaaaac gagccacagc 240
ctccggagcc cctgaaggag accccgccca caagcccagc ccccacccag gaggccccag 300
agcacagggc gccccgtcgg attttgtaca gccccgagtc actgtggaga gatgcaatgg 360
cagacgcggc tgcagcagat ggcgcgatca tagcaggtgc tgccacagtg agaaaagctt 420
cgtcaaaaac cgtctcctgg ccacagtcgg aggccccgcc agagagggga gcagccaccc 480
caaacccatg ttctgccggc tcccatgacc ccgtgcacct ggagccccac ggtgtcccca 540
ctggatggga ggacaagggc cgggggctcc ggcgggtcgg ggcaggggct tgatggcttc 600
cttctgccgt ggccccattg cccctggctg gagttgaccc ttctgacaag tgtcctcaga 660
gagtcaggga tcagtggcac ctcccaacat caaccccacg cagcccaggc acaaacccca 720
catccagggc caactccagg aacagagaca ccccaatacc ctgggggacc ccgaccctga 780
tgactcccgt cccatctctg tccctcactt ggggcctgct gcggggcgag cacttgggag 840
caaactcagg cttaggggac accactgtgg gcctgacctc gagcaggcca cagacccttc 900
cctcctgccc tggtgcagca cagactttgg ggtctgggca gggaggaact tctggcaggt 960
caccaagcac agagccccca ggctgaggtg gccccagggg gaaccccagc aggtggccca 1020
ctacccttcc tcccagctgg accccatgtc ttccccaaga taggggtgcc atccaaggca 1080
ggtcctccat ggagccccct tcaggctcct ctccagaccc cactgggcct cagtccccac 1140
tctaggaatg cagccaccac gggcacacca ggcagcccag gcccagccac cctgcagtgc 1200
ccaagcccac accctggagg agagcagggt gcgtctggga ggggctgggc tccccacccc 1260
cacccccacc tgcacacccc acccaccctt gcccgggccc cctgcaggag ggtcagagcc 1320
cccatgggat atggacttag ggtctcactc acgcacctcc cctcctggga gaaggggtct 1380
catgcccaga tccccccagc agcgctggtc acaggtagag gcagtggccc cagggccacc 1440
ctgacctggc ccctcaggct cctctagccc tggctgccct gctgtccctg ggaggcctgg 1500
gctccaccag accacaggtc tagggcaccg cccacactgg ggccgcccac acacagctca 1560
caggaagaag ataagctcca gacccccagg cccgggacct gccttgctgc tacgacttcc 1620
tgccccagac ctcgttgccc tcccccgtcc acttacacac aggccaggaa gctgttccca 1680
cacagaccaa ccccagacgg ggaccacctg gcactcaggt cactgccatt tccttctcca 1740
ttcacttcca atgcctctgt gcttcctccc tcctccttcc ttcgggggag caccctgtgc 1800
agctcctccc tgcagtccac accctgggga gacccgaccc tgcagcccac accctgggga 1860
gacctgaccc tcctccagcc ctttctcccc cgctgctctt gccacccacc aagacagccc 1920
tggggtcctg tccctacagc ccccacccag ttctctacct agacccgtct tcctccctct 1980
aaacacctct cccaggccaa ccctacacct gcaggccctc ccctccactg ccaaagaccc 2040
tcagtttctc ctgcctgtgc ccacccccgt gctcctcctg cccacagctc gagctcttcc 2100
tctcctaggg cccctgaggg atggcattga ccgtgccctc gcacccacac actgcccatg 2160
ccctcacatt cctcctggcc actccagccc cactcccctc tcaggcctgg ctctggtatt 2220
tctgggacaa agccttaccc aagtctttcc catgcaggcc tgggccctta ccctcactgc 2280
ccggttacag ggcagcctcc tgtgcacaga agcagggagc tcagcccttc cacaggcaga 2340
aggcactgaa agaaatcggc ctccagcgcc ttgacacacg tctgcctgtg tctctcactg 2400
cccgcacctg cagggaggct cggcactccc tctaaagacg agggatccag gcagcagcat 2460
cacaggagaa tgcagggcta ccagacatcc cagtcctctc acaggcctct cctgggaaga 2520
gacctgaaga cgcccagtca acggagtcta acaccaaacc tccctggagg ccgatgggta 2580
gtaacggagt cattgccaga cctggaggca ggggagcagt gagcccgagc ccacaccata 2640
gggccagagg acagccactg acatcccaag ccactcactg gtggtcccac aacaccccat 2700
ggaaagagga cagacccaca gtcccacctg gaccagggca gagactgctg agacccagca 2760
ccagaaccaa ccaagaaaca ccaggcaaca gcatcagagg gggctctggc agaacagagg 2820
aggggaggtc tccttcacca gcaggcgctt cccttgaccg aagacaggat ccatgcaact 2880
cccccaggac aaaggaggag ccccttgttc agcactgggc tcagagtcct ctccaagaca 2940
cccagagttt cagacaaaaa ccccctggaa tgcacagtct cagcaggaga gccagccaga 3000
gccagcaaga tggggctcag tgacacccgc agggacagga ggattttgtg ggggctcgtg 3060
tcactgtgag gatattgtac taatcggagc aggcagggtg tatgctatac ccacagtgac 3120
acagccccat tcaaaaaccc ctactgcaaa cgcattccac ttctggggct gaggggctgg 3180
gggagcgtct gggaaatagg gctcaggggt gtccatcaat gcccaaaacg caccagactc 3240
ccctccatac atcacaccca ccagccagcg agcagagtaa acagaaaatg agaagcaagc 3300
tggggaagct tgcacaggcc ccaaggaaag agctttggcg ggtgtgtaag aggggatgcg 3360
ggcagagcct gagcagggcc ttttgctgtt tctgctttcc tgtgcagaga gttccataaa 3420
ctggtgttcg agatcaatgg ctgggagtga gcccaggagg acagcgtggg aagagcacag 3480
ggaaggagga gcagccgcta tcctacactg tcatctttcg aaagtttgcc ttgtgcccac 3540
actgctgcat catgggatgc ttaacagctg atgtagacac agctaaagag agaatcagtg 3600
agatggattt gcagcacaga tctgaataaa ttctccagaa tgtggagcag cacagaagca 3660
agcacacaga aagtgcctga tgcaaggaca aagttcagtg ggcaccttca ggcattgctg 3720
ctgggcacag acactctgaa aagccctggc aggaactccc tgtgacaaag cagaaccctc 3780
aggcaatgcc agccccagag ccctccctga gagcctcatg ggcaaagatg tgcacaacag 3840
gtgtttctca tagccccaaa ctgagagcaa agcaaacgtc catctgaagg agaacaggca 3900
aataaacgat ggcaggttca tgaaatgcaa acccagacag ccacaagcac aaaagtacag 3960
ggttataagc gactctggtt gagttcatga caatgctgag taattggagt aacaaagtaa 4020
actccaaaaa atactttcaa tgtgatttct tctaaataaa atttacaccc tgcaaaatga 4080
actgtcttct taagggatac atttcccagt tagaaaacca taaagaaaac caagaaaagg 4140
atgatcacat aaacacagtg gtggttactt ctgctgggga aggaagaggg tatgaactga 4200
gatacacagg gtgggcaagt ctcctaacaa gaacagaacg aatacattac agtaccttga 4260
aaacagcagt taaacttcta aattgcaaga agaggaaaat gcacacagtt gtgtttagaa 4320
aattctcagt ccagcactgt tcataatagc aaagacatta acccaggtcg gataaataag 4380
cgatgacaca ggcaattgca caatgataca gacatatatt tagtatatga gacatcgatg 4440
atgtatcccc aaataaacga ctttaaagag ataaagggct gatgtgtggt ggcattcacc 4500
tccctgggat ccccggacag gttgcaggct cactgtgcag cagggcaggc gggtacctgc 4560
tggcagttcc tggggcctga tgtggagcaa gcgcagggcc atatatcccg gaggacggca 4620
cagtcagtga attccagaga gaagcaactc agccacactc cccaggcaga gcccgagagg 4680
gacgcccacg cacagggagg cagagcccag cacctccgca gccagcacca cctgcgcacg 4740
ggccaccacc ttgcaggcac agagtgggtg ctgagaggag gggcagggac accaggcagg 4800
gtgagcaccc agagaaaact gcagacgcct cacacatcca cctcagcctc ccctgacctg 4860
gacctcactg gcctgggcct cacttaacct gggcttcacc tgaccttggc ctcacctgac 4920
ttggacctcg cctgtcccaa gctttacctg acctgggcct caactcacct gaacgtctcc 4980
tgacctgggt ttaacctgtc ctggaactca cctggccttg gcttcccctg acctggacct 5040
catctggcct gggcttcacc tggcctgggc ctcacctgac ctggacctca tctggcctgg 5100
acctcacctg gcctggactt cacctggcct gggcttcacc tgacctggac ctcacctggc 5160
ctcgggcctc acctgcacct gctccaggtc ttgctggagc ctgagtagca ctgagggtgc 5220
agaagctcat ccagggttgg ggaatgactc tagaagtctc ccacatctga cctttctggg 5280
tggaggcagc tggtggccct gggaatataa aaatctccag aatgatgact ctgtgatttg 5340
tgggcaactt atgaacccga aaggacatgg ccatggggtg ggtagggaca tagggacaga 5400
tgccagcctg aggtggagcc tcaggacaca ggtgggcacg gacactatcc acataagcga 5460
gggatagacc cgagtgtccc cacagcagac ctgagagcgc tgggcccaca gcctcccctc 5520
agagccctgc tgcctcctcc ggtcagccct ggacatccca ggtttcccca ggcctggcgg 5580
taggattttg ttgaggtctg tgtcactgtg gtattacgat tgcaactgca gcagatgggc 5640
tcgcgaccat agcaggtgct gctattataa ccacagtgtc acagagtcca tcaaaaaccc 5700
atgcctggaa gcttcccgcc acagccctcc ccatggggcc ctgctgcctc ctcaggtcag 5760
ccccggacat cccgggtttc cccaggctgg gcggtaggat tttgttgagg tctgtgtcac 5820
tgtggtatta ctatgagaga tgcaatggca gacgcggctg cagcagatgg cgcgatcata 5880
gcaggtgctg ctattataac cacagtgtca cagagtccat caaaaaccca tccctgggag 5940
cctcccgcca cagccctccc tgcaggggac cggtacgtgc catgttagga ttttgatcga 6000
ggagacagca ccatgggtat ggtggctacc acagcagtgc agcctgtgac ccaaacccgc 6060
agggcagcag gcacgatgga caggcccgtg actgaccacg ctgggctcca gcctgccagc 6120
cctggagatc atgaaacaga tggccaaggt caccctacag gtcatccaga tctggctccg 6180
aggggtctgc atcgctgctg ccctcccaac gccagtccaa atgggacagg gacggcctca 6240
cagcaccatc tgctgccatc aggccagcga tcccagaagc ccctccctca aggctgggca 6300
catgtgtgga cactgagagc cctcatatct gagtaggggc accaggaggg aggggctggc 6360
cctgtgcact gtccctgccc ctgtggtccc tggcctgcct ggccctgaca cctgagcctc 6420
tcctgggtca tttccaagac agaagacatt cctggggaca gccggagctg ggcgtcgctc 6480
atcctgcccg gccgtcctga gtcctgctca tttccagacc tcaccgggga agccaacaga 6540
ggactcgcct cccacattca gagacaaaga accttccaga aatccctgcc tctctcccca 6600
gtggacaccc tcttccagga cagtcctcag tggcatcaca gcggcctgag atccccagga 6660
cgcagcaccg ctgtcaatag gggccccaaa tgcctggacc agggcctgcg tgggaaaggc 6720
ctctggccac actcggggat tttgtgaagg gccctcccac tgtggagagg ctttgtggct 6780
tccctaagag ctgcagcagg caaaagcctc acagatgctg ccacagtgat gaacccagtg 6840
tcaaaaaccg gctggaaacc caggggctgt gtgcacgcct cagcttggag ctctccagga 6900
gcacaagagc cgggcccaag gatttgtgcc cagaccctca gcctctaggg acacctgggt 6960
catctcagcc tgggctggtg ccctgcacac catcttcctc caaatagggg cttcagaggg 7020
ctctgaggtg acctcactca tgaccacagg tgacctggcc cttccctgcc agctatacca 7080
gaccctgtct tgacagatgc cccgattcca acagccaatt cctgggaccc tgaatagctg 7140
tagacaccag cctcattcca gtacctcctg ccaattgcct ggattcccat cctggctgga 7200
atcaagaagg cagcatccgc caggctccca acaggcagga ctcccgcaca ccctcctctg 7260
agaggccgct gtgttccgca gggccaggcc ctggacagtt cccctcacct gccactagag 7320
aaacacctgc cattgtcgtc cccacctgga aaagaccact cgtggagccc ccagccccag 7380
gtacagctgt agagacagtc ctcgaggccc ctaagaagga gccatgccca gttctgccgg 7440
gaccctcggc caggccgaca ggagtggacg ctggagctgg gcccacactg ggccacatag 7500
gagctcacca gtgagggcag gagagcacat gccggggagc acccagcctc ctgctgacca 7560
gaggcccgtc ccagagccca ggaggctgca gaggcctctc cagggagaca ctgtgcatgt 7620
ctggtaccta agcagccccc cacgtcccca gtcctggggg cccctggctc agctgtctgg 7680
gccctccctg ctccctggga agctcctcct gacagccccg cctccagttc caggtgtgga 7740
ttttgtcagg cgatgtcaca ctgtgtactg ccagaagtgg atgtggacta gcgatagtga 7800
gaggaagtgc tgtgagggta tggtaagccg gctgtggtgt aagaagaagc tctggcacag 7860
tggtgccgcc catatcaaaa accaggccaa gtagacaggc ccctgctgcg cagccccagg 7920
catccacttc acctgcttct cctggggctc tcaaggctgc tgtctgtcct ctggccctct 7980
gtggggaggg ttccctcagt gggaggtctg tgctccaggg cagggatgat tgagatagaa 8040
atcaaaggct ggcagggaaa ggcagcttcc cgccctgaga ggtgcaggca gcaccacgga 8100
gccacggagt cacagagcca cggagccccc attgtgggca tttgagagtg ctgtgccccc 8160
ggcaggccca gccctgatgg ggaagcctgt cccatcccac agcccgggtc ccacgggcag 8220
cgggcacaga agctgccagg ttgtcctcta tgatcctcat ccctccagca gcatcccctc 8280
cacagtgggg aaactgaggc ttggagcacc acccggcccc ctggaaatga ggctgtgagc 8340
ccagacagtg ggcccagagc actgtgagta ccccggcagt acctggctgc agggatcagc 8400
cagagatgcc aaaccctgag tgaccagcct acaggaggat ccggccccac ccaggccact 8460
cgattaatgc tcaaccccct gccctggaga cctcttccag taccaccagc agctcagctt 8520
ctcagggcct catccctgca aggaaggtca agggctgggc ctgccagaaa cacagcaccc 8580
tccctagccc tggctaagac agggtgggca gacggctgtg gacgggacat attgctgggg 8640
catttctcac tgtcacttct gggtggtagc tctgacaaaa acgcagaccc tgccaaaatc 8700
cccactgcct cccgctaggg gctggcctgg aatcctgctg tcctaggagg ctgctgacct 8760
ccaggatggc tccgtcccca gttccagggc gagagcagat cccaggcagg ctgtaggctg 8820
ggaggccacc cctgcccttg ccggggttga atgcaggtgc ccaaggcagg aaatggcatg 8880
agcacaggga tgaccgggac atgccccacc agagtgcgcc ccttcctgct ctgcaccctg 8940
caccccccag gccagcccac gacgtccaac aactgggcct gggtggcagc cccacccaga 9000
caggacagac ccagcaccct gaggaggtcc tgccaggggg agctaagagc catgaaggag 9060
caagatatgg ggcccccgat acaggcacag atgtcagctc catccaggac cacccagccc 9120
acaccctgag aggaacgtct gtctccagcc tctgcaggtc gggaggcagc tgacccctga 9180
cttggacccc tattccagac accagacaga ggcgcaggcc ccccagaacc agggttgagg 9240
gacgccccgt caaagccaga caaaaccaag gggtgttgag cccagcaagg gaaggccccc 9300
aaacagacca ggaggatttt gtaggtgtct gtgtcactgt gtgcaactgc agcagatggc 9360
gcgaccatag caggtgctgc cacagtgaca ctcacccagt caaaaacccc attccaagtc 9420
agcggaagca gagagagcag ggaggacacg tttaggatct gagactgcac ctgacaccca 9480
ggccagcaga cgtctcccct ccagggcacc ccaccctgtc ctgcatttct gcaagatcag 9540
gggcggcctg agggggggtc tagggtgagg agatgggtcc cctgtacacc aaggaggagt 9600
taggcaggtc ccgagcactc ttaattaaac gacgcctcga atggaactac tacaacgaat 9660
ggttgctcta cgtaatgcat tcgctacctt aggaccgtta tagttaggcg cgcc 9714
<210> 234
<211> 9797
<212> DNA
<213> 人工序列
<220>
<223> TxDH114619
<400> 234
tacgtattaa ttaaacgacg cctcgaatgg aactactaca acgaatggtt gctctcccca 60
ttgaggctga cctgcccaga gagtcctggg cccaccccac acaccggggc ggaatgtgtg 120
caggcctcgg tctctgtggg tgttccgcta gctggggctc acagtgctca ccccacacct 180
aaaatgagcc acagcctccg gagcccccgc aggagacccc gcccacaagc ccagccccca 240
cccaggaggc cccagagctc agggcgcccc gtcggatttt gtacagcccc gagtcactgt 300
ggagagatgc tgcaatggca gacgcggctg cagcagcaga tggtgccgcg atcatagcag 360
gtgctgccac agtgagaata gctacgtcaa aaaccgtcca gtggccactg ccggaggccc 420
cgccagagag ggcagcagcc actctgatcc catgtcctgc cggctcccat gacccccagc 480
acgcggagcc ccacagtgtc cccactggat gggaggacaa gagctgggga ttccggcggg 540
tcggggcagg ggcttgatcg catccttctg ccgtggctcc agtgcccctg gctggagttg 600
acccttctga caagtgtcct cagagagaca ggcatcaccg gcgcctccca acatcaaccc 660
caggcagcac aggcacaaac cccacatcca gagccaactc caggagcaga gacaccccaa 720
taccctgggg gaccccgacc ctgatgactt cccactggaa ttcgccgtag agtccaccag 780
gaccaaagac cctgcctctg cctctgtccc tcactcagga cctgctgccg ggcgaggcct 840
tgggagcaga cttgggctta ggggacacca gtgtgacccc gaccttgacc aggacgcaga 900
cctttccttc ctttcctggg gcagcacaga ctttggggtc tgggccagga ggaacttctg 960
gcaggtcgcc aagcacagag gccacaggct gaggtggccc tggaaagacc tccaggaggt 1020
ggccactccc cttcctccca gctggacccc atgtcctccc caagataagg gtgccatcca 1080
aggcaggtgc tccttggagc cccattcaga ctcctccctg gaccccactg ggcctcagtc 1140
ccagctctgg ggatgaagcc accacaagca caccaggcag cccaggccca gccaccctgc 1200
agtgcccaag cacacactct ggagcagagc agggtgcctc tgggaggggc tgagctcccc 1260
accccacccc cacctgcaca ccccacccac ccctgcccag cggctctgca ggagggtcag 1320
agccccacat ggggtatgga cttagggtct cactcacgtg gctcccatca tgagtgaagg 1380
ggcctcaagc ccaggttccc acagcagcgc ctgtcgcaag tggaggcaga ggcccgaggg 1440
ccaccctgac ctggtccctg aggttcctgc agcccaggct gccctgctgt ccctgggagg 1500
cctgggctcc accagaccac aggtccaggg caccgggtgc aggagccacc cacacacagc 1560
tcacaggaag aagataagct ccagaccccc agggccagaa cctgccttcc tgctactgct 1620
tcctgcccca gacctgggcg ccctcccccg tccacttaca cacaggccag gaagctgttc 1680
ccacacagaa caaccccaaa ccaggaccgc ctggcactca ggtggctgcc atttccttct 1740
ccatttgctc ccagcgcctc tgtcctccct ggttcctcct tcgggggaac agcctgtgca 1800
gccagtccct gcagcccaca ccctggggag acccaaccct gcctggggcc cttccaaccc 1860
tgctgctctt actgcccacc cagaaaactc tggggtcctg tccctgcagt ccctaccctg 1920
gtctccaccc agacccctgt gtatcactcc agacacccct cccaggcaaa ccctgcacct 1980
gcaggccctg tcctcttctg tcgctagagc ctcagtttct cccccctgtg cccacaccct 2040
acctcctcct gcccacaact ctaactcttc ttctcctgga gcccctgagc catggcattg 2100
accctgccct cccaccaccc acagcccatg ccctcacctt cctcctggcc actccgaccc 2160
cgccccctct caggccaagc cctggtattt ccaggacaaa ggctcaccca agtctttccc 2220
aggcaggcct gggctcttgc cctcacttcc cggttacacg ggagcctcct gtgcacagaa 2280
gcagggagct cagcccttcc acaggcagaa ggcactgaaa gaaatcggcc tccagcacct 2340
tgacacacgt ccgcccgtgt ctctcactgc ccgcacctgc agggaggctc cgcactccct 2400
ctaaagacaa gggatccagg cagcagcatc acgggagaat gcagggctcc cagacatccc 2460
agtcctctca caggcctctc ctgggaagag acctgcagcc accaccaaac agccacagag 2520
gctgctggat agtaactgag tcaatgaccg acctggaggg caggggagca gtgagccgga 2580
gcccatacca tagggacaga gaccagccgc tgacatcccg agctcctcaa tggtggcccc 2640
ataacacacc taggaaacat aacacaccca cagccccacc tggaacaggg cagagactgc 2700
tgagccccca gcaccagccc caagaaacac caggcaacag tatcagaggg ggctcccgag 2760
aaagagagga ggggagatct ccttcaccat caaatgcttc ccttgaccaa aaacagggtc 2820
cacgcaactc ccccaggaca aaggaggagc cccctataca gcactgggct cagagtcctc 2880
tctgagacac cctgagtttc agacaacaac ccgctggaat gcacagtctc agcaggagaa 2940
cagaccaaag ccagcaaaag ggacctcggt gacaccagta gggacaggag gattttgtgg 3000
gggctcgtgt cactgtgagg atattgtagt ggtagcagca gatggggtag ctgctactcc 3060
cacagtgaca cagacccatt caaaaacccc tactgcaaac acacccactc ctggggctga 3120
ggggctgggg gagcgtctgg gaagtagggt ccaggggtgt ctatcaatgt ccaaaatgca 3180
ccagactccc cgccaaacac caccccacca gccagcgagc agggtaaaca gaaaatgaga 3240
ggctctggga agcttgcaca ggccccaagg aaagagcttt ggcgggtgtg caagagggga 3300
tgcaggcaga gcctgagcag ggccttttgc tgtttctgct ttcctgtgca gagagttcca 3360
taaactggtg ttcaagatca gtggctggga atgagcccag gagggcagtc tgtgggaaga 3420
gcacagggaa ggaggagcag ccgctatcct acactgtcat ctttcaaaag tttgccttgt 3480
gaccacacta ttgcatcatg ggatgcttaa gagctgatgt agacacagct aaagagagaa 3540
tcagtgagat gaatttgcag catagatctg aataaactct ccagaatgtg gagcagtaca 3600
gaagcaaaca cacagaaagt gcctgatgca aggacaaagt tcagtgggca ccttcaggca 3660
ttgctgctgg gcacagacac tctgaaaagc cttggcagga tctccctgcg acaaagcaga 3720
accctcaggc aatgccagcc ccagagccct ccctgagagc gtcatgggga aagatgtgca 3780
gaacagctga ttatcataga ctcaaactga gaacagagca aacgtccatc tgaagaacag 3840
tcaaataagc aatggtaggt tcatgcaatg caaacccaga cagccagggg acaacagtag 3900
agggctacag gcggctttgc ggttgagttc atgacaatgc tgagtaattg gagtaacaga 3960
ggaaagccca aaaaatactt ttaatgtgat ttcttctaaa taaaatttac accaggcaaa 4020
atgaactgtc ttcttaaggg ataaactttc ccctggaaaa actacaagga aaattaagaa 4080
aacgatgatc acataaacac agttgtggtt acttctactg gggaaggaag agggtatgag 4140
ctgagacaca cagagtcggc aagtctccaa gcaagcacag aacgaataca ttacagtacc 4200
ttgaatacag cagttaaact tctaaatcgc aagaacagga aaatgcacac agctgtgttt 4260
agaaaattct cagtccagca ctattcataa tagcaaagac attaacccag gttggataaa 4320
taaatgatga cacaggcaat tgcacaatga tacagacata catttagtac atgagacatc 4380
gatgatgtat ccccaaagaa atgactttaa agagaaaagg cctgatgtgt ggtggcactc 4440
acctccctgg gatccccgga caggttgcag gcacactgtg tggcagggca ggctggtaca 4500
tgctggcagc tcctggggcc tgatgtggag caagcgcagg gctgtatacc cccaaggatg 4560
gcacagtcag tgaattccag agagaagcag ctcagccaca ctgcccaggc agagcccgag 4620
agggacgccc acgtacaggg aggcagagcc cagctcctcc acagccacca ccacctgtgc 4680
acgggccacc accttgcagg cacagagtgg gtgctgagag gaggggcagg gacaccaggc 4740
agggtgagca cccagagaaa actgcagaag cctcacacat ccacctcagc ctcccctgac 4800
ctggacctca cctggtctgg acctcacctg gcctgggcct cacctgacct ggacctcacc 4860
tggcctgggc ttcacctgac ctggacctca cctggcctcc ggcctcacct gcacctgctc 4920
caggtcttgc tggaacctga gtagcactga ggctgcagaa gctcatccag ggttggggaa 4980
tgactctgga actctcccac atctgacctt tctgggtgga ggcatctggt ggccctggga 5040
atataaaaag ccccagaatg gtgcctgcgt gatttggggg caatttatga acccgaaagg 5100
acatggccat ggggtgggta gggacatagg gacagatgcc agcctgaggt ggagcctcag 5160
gacacagttg gacgcggaca ctatccacat aagcgaggga cagacccgag tgttcctgca 5220
gtagacctga gagcgctggg cccacagcct cccctcggtg ccctgctgcc tcctcaggtc 5280
agccctggac atcccgggtt tccccaggcc agatggtagg attttgttga ggtctgtgtc 5340
actgtggtat tatgattacg agagagcttg caatggcaga cgcggctgca gcagatgggc 5400
tcgcgatcat agcaggtgct gctatcgtta tacccacagt gtcacacggt ccatcaaaaa 5460
cccatgccac agccctcccc gcaggggacc gccgcgtgcc atgttacgat tttgatcgag 5520
gacacagcgc catgggtatg gtggctacca cagcagtgca gcccatgacc caaacacaca 5580
gggcagcagg cacaatggac aggcctgtga gtgaccatgc tgggctccag cccgccagcc 5640
ccggagacca tgaaacagat ggccaaggtc accccacagt tcagccagac atggctccgt 5700
ggggtctgca tcgctgctgc cctctaacac cagcccagat ggggacaagg ccaaccccac 5760
attaccatct cctgctgtcc acccagtggt cccagaagcc cctccctcat ggctgagcca 5820
catgtgtgaa ccctgagagc accccatgtc agagtagggg cagcagaagg gcggggctgg 5880
ccctgtgcac tgtccctgca cccatggtcc ctcgcctgcc tggccctgac acctgagcct 5940
cttctgagtc atttctaaga tagaagacat tcccggggac agccggagct gggcgtcgct 6000
catcccgccc ggccgtcctg agtcctgctt gtttccagac ctcaccaggg aagccaacag 6060
aggactcacc tcacacagtc agagacaaag aaccttccag aaatccctgt ctcactcccc 6120
agtgggcacc ttcttccagg acattcctcg gtcgcatcac agcaggcacc cacatctgga 6180
tcaggacggc ccccagaaca caagatggcc catggggaca gccccacaac ccaggccttc 6240
ccagacccct aaaaggcgtc ccaccccctg cacctgcccc agggctaaaa atccaggagg 6300
cttgactccc gcataccctc cagccagaca tcacctcagc cccctcctgg aggggacagg 6360
agcccgggag ggtgagtcag acccacctgc cctcgatggc aggcggggaa gattcagaaa 6420
ggcctgagat ccccaggacg cagcaccact gtcaatgggg gccccagacg cctggaccag 6480
ggcctgcgtg ggaaaggccg ctgggcacac tcagggggat tttgtgaagg cccctcccac 6540
tgtggagagg cttgcttgtg gcttccctaa gagctgcagc aggcaagcta agcctcacag 6600
atgctgccac agtgatgaaa ctagcatcaa aaaccggccg gacacccagg gaccatgcac 6660
acttctcagc ttggagctct ccaggaccag aagagtcagg tctgagggtt tgtagccaga 6720
ccctcggcct ctagggacac cctggccatc acagcggatg ggctggtgcc ccacatgcca 6780
tctgctccaa acaggggctt cagagggctc tgaggtgact tcactcatga ccacaggtgc 6840
cctggcccct tccccgccag ctacaccgaa ccctgtccca acagctgccc cagttccaac 6900
agccaattcc tggggcccag aattgctgta gacaccagcc tcgttccagc acctcctgcc 6960
aattgcctgg attcacatcc tggctggaat caagagggca gcatccgcca ggctcccaac 7020
aggcaggact cccgcacacc ctcctctgag aggccgctgt gttccgcagg gccaggccct 7080
ggacagttcc cctcacctgc cactagagaa acacctgcca ttgtcgtccc cacctggaaa 7140
agaccactcg tggagccccc agccccaggt acagctgtag agagactccc cgagggatct 7200
aagaaggagc catgcgcagt tctgccggga ccctcggcca ggccgacagg agtggacact 7260
ggagctgggc ccacactggg ccacatagga gctcaccagt gagggcagga gagcacatgc 7320
cggggagcac ccagcctcct gctgaccaga ggcccgtccc agagcccagg aggctgcaga 7380
ggcctctcca gggggacact gtgcatgtct ggtccctgag cagcccccca cgtccccagt 7440
cctgggggcc cctggcacag ctgtctggac cctccctgtt ccctgggaag ctcctcctga 7500
cagccccgcc tccagttcca ggtgtggatt ttgtcagggg gtgtcacact gtgtactgcc 7560
agaagtggat gtggacttgc gatagtgaga ggaagagctg tgagggtatg gtatgccggc 7620
tgtggagtaa gaagaagctc tggcacagtg gtgctgccca tatcaaaaac caggccaagt 7680
agacaggccc ctgctgtgca gccccaggcc tccacttcac ctgcttctcc tggggctctc 7740
aaggtcactg ttgtctgtac tctgccctct gtggggaggg ttccctcagt gggaggtctg 7800
ttctcaacat cccagggcct catgtctgca cggaaggcca atggatgggc aacctcacat 7860
gccgcggcta agatagggtg ggcagcctgg cgggggacag tacatactgc tggggtgtct 7920
gtcactgtgc ctagtggggc actggctccc aaacaacgca gtcctcgcca aaatccccac 7980
agcctcccct gctaggggct ggcctgatct cctgcagtcc taggaggctg ctgacctcca 8040
gaatgtctcc gtccccagtt ccagggcgag agcagatccc aggccggctg cagactggga 8100
ggccaccccc tccttcccag ggttcactgg aggtgaccaa ggtaggaaat ggccttaaca 8160
cagggatgac tgcgccatcc cccaacagag tcagccccct cctgctctgt accccgcacc 8220
ccccaggcca gtccacgaaa accagggccc cacatcagag tcactgcctg gcccggccct 8280
ggggcggacc cctcagcccc caccctgtct agaggacttg gggggacagg acacaggccc 8340
tctccttatg gttcccccac ctgcctccgg ccgggaccct tggggtgtgg acagaaagga 8400
cacctgccta attggccccc aggaacccag aacttctctc cagggacccc agcccgagca 8460
cccccttacc caggacccag ccctgcccct cctcccctct gctctcctct catcacccca 8520
tgggaatccg gtatccccag gaagccatca ggaagggctg aaggaggaag cggggccgtg 8580
caccaccggg caggaggctc cgtcttcgtg aacccaggga agtgccagcc tcctagaggg 8640
tatggtccac cctgcctggg gctcccaccg tggcaggctg cggggaagga ccagggacgg 8700
tgtgggggag ggctcagggc cctgcgggtg ctcctccatc ttcggtgagc ctcccccttc 8760
acccaccgtc ccgcccacct cctctccacc ctggctgcac gtcttccaca ccatcctgag 8820
tcctacctac accagagcca gcaaagccag tgcagacaaa ggctggggtg caggggggct 8880
gccagggcag cttcggggag ggaaggatgg agggagggga ggtcagtgaa gaggccccct 8940
tcccctgggt ccaggatcct cctctgggac ccccggatcc catcccctcc tggctctggg 9000
aggagaagca ggatgggaga atctgtgcgg gaccctctca cagtggaata tccccacagc 9060
ggctcaggcc agacccaaaa gcccctcagt gagccctcca ctgcagtcct gggcctgggt 9120
agcagcccct cccacagagg acagacccag caccccgaag aagtcctgcc agggggagct 9180
cagagccatg aaagagcagg atatggggtc cccgatacag gcacagacct cagctccatc 9240
caggcccacc gggacccacc atgggaggaa cacctgtctc cgggttgtga ggtagctggc 9300
ctctgtctcg gaccccactc cagacaccag acagaggggc aggcccccca aaaccagggt 9360
tgagggatga tccgtcaagg cagacaagac caaggggcac tgaccccagc aagggaaggc 9420
tcccaaacag acgaggagga ttttgtagct gtctgtatca ctgtgtgcaa ctgcagcaga 9480
tgggctcgcg accatagcag gtgctgccac agtgacactc gccaggtcaa aaaccccgtc 9540
ccaagtcagc ggaagcagag agagcaggga ggacacgttt aggatctgag gccgcacctg 9600
acacccaggg cagcagacgt ctcccctcca gggcaccctc caccgtcctg cgtttcttca 9660
agaatagggg cggcctgagg gggtccaggg ccaggcgata ggtcccctct accccaagga 9720
ggagccaggc aggacccgag caccgatgca tctaacgcag tcatgtaatg ctgggtgaca 9780
gtcagttcgc ctacgta 9797
<210> 235
<211> 12029
<212> DNA
<213> 人工序列
<220>
<223> TxDH120126
<400> 235
tacgtaatgc atctaacgca gtcatgtaat gctgggtgac agtcagttcg cctccccatt 60
gaggctgacc tgcccagacg ggcctgggcc caccccacac accggggcgg aatgtgtgca 120
ggccccagtc tctgtgggtg ttccgctagc tggggccccc agtgctcacc ccacacctaa 180
agcgagcccc agcctccaga gccccctaag cattccccgc ccagcagccc agcccctgcc 240
cccacccagg aggccccaga gctcagggcg cctggtcgga ttttgtacag ccccgagtca 300
ctgtggagag agcttgcaat ggcagacgcg gctgcagcag atgggctcgc gatcatagca 360
ggtgctgcca cagtgagaaa aactgtgtca aaaaccgact cctggcagca gtcggaggcc 420
ccgccagaga ggggagcagc cggcctgaac ccatgtcctg ccggttccca tgacccccag 480
cacccagagc cccacggtgt ccccgttgga taatgaggac aagggctggg ggctccggtg 540
gtttgcggca gggacttgat cacatccttc tgctgtggcc ccattgcctc tggctggagt 600
tgacccttct gacaagtgtc ctcagaaaga cagggatcac cggcacctcc caatatcaac 660
cccaggcagc acagacacaa accccacatc cagagccaac tccaggagca gagacacccc 720
aacactctgg gggaccccaa ccgtgataac tccccactgg aatccgcccc agagtctacc 780
aggaccaaag gccctgccct gtctctgtcc ctcactcagg gcctcctgca gggcgagcgc 840
ttgggagcag actcggtctt aggggacacc actgtgggcc ccaactttga tgaggccact 900
gacccttcct tcctttcctg gggcagcaca gactttgggg tctgggcagg gaagaactac 960
tggctggtgg ccaatcacag agcccccagg ccgaggtggc cccaagaagg ccctcaggag 1020
gtggccactc cacttcctcc cagctggacc ccaggtcctc cccaagatag gggtgccatc 1080
caaggcaggt cctccatgga gcccccttca gactcctccc gggaccccac tggacctcag 1140
tccctgctct gggaatgcag ccaccacaag cacaccagga agcccaggcc cagccaccct 1200
gcagtgggca agcccacact ctggagcaga gcagggtgcg tctgggaggg gctaacctcc 1260
ccacccccca ccccccatct gcacacagcc acctaccact gcccagaccc tctgcaggag 1320
ggccaagcca ccatggggta tggacttagg gtctcactca cgtgcctccc ctcctgggag 1380
aaggggcctc atgcccagat ccctgcagca ctagacacag ctggaggcag tggccccagg 1440
gccaccctga cctggcatct aaggctgctc cagcccagac agcactgccg ttcctgggaa 1500
gcctgggctc caccagacca caggtccagg gcacagccca caggagccac ccacacacag 1560
ctcacaggaa gaagataagc tccagacccc agggcgggac ctgccttcct gccaccactt 1620
acacacaggc cagggagctg ttcccacaca gatcaacccc aaaccgggac tgcctggcac 1680
tagggtcact gccatttccc tctccattcc ctcccagtgc ctctgtgctc cctccttctg 1740
gggaacaccc tgtgcagccc ctccctgcag cccacacgct ggggagaccc caccctgcct 1800
cgggcctttt ctacctgctg cacttgccgc ccacccaaac aaccctgggt acgtgaccct 1860
gcagtcctca ccctgatctg caaccagacc cctgtccctc cctctaaaca cccctcccag 1920
gccaactctg cacctgcagg ccctccgctc ttctgccaca agagcctcag gttttcctac 1980
ctgtgcccac cccctaaccc ctcctgccca caacttgagt tcttcctctc ctggagccct 2040
tgagccatgg cactgaccct acactcccac ccacacactg cccatgccat caccttcctc 2100
ctggacactc tgaccccgct cccctccctc tcagacccgg ccctggtatt tccaggacaa 2160
aggctcaccc aagtcttccc catgcaggcc cttgccctca ctgcctggtt acacgggagc 2220
ctcctgtgcg cagaagcagg gagctcagct cttccacagg cagaaggcac tgaaagaaat 2280
cagcctccag tgccttgaca cacgtccgcc tgtgtctctc actgcctgca cctgcaggga 2340
ggctccgcac tccctctaaa gatgagggat ccaggcagca acatcacggg agaatgcagg 2400
gctcccagac agcccagccc tctcgcaggc ctctcctggg aagagacctg cagccaccac 2460
tgaacagcca cggaggtcgc tggatagtaa ccgagtcagt gaccgacctg gagggcaggg 2520
gagcagtgaa ccggagccca taccataggg acagagacca gccgctaaca tcccgagccc 2580
ctcactggcg gccccagaac accccgtgga aagagaacag acccacagtc ccacctggaa 2640
cagggcagac actgctgagc ccccagcacc agccccaaga aacactaggc aacagcatca 2700
gagggggctc ctgagaaaga gaggagggga ggtctccttc accatcaaat gcttcccttg 2760
accaaaaaca gggtccacgc aactccccca ggacaaagga ggagccccct gtacagcact 2820
gggctcagag tcctctctga gacaggctca gtttcagaca acaacccgct ggaatgcaca 2880
gtctcagcag gagagccagg ccagagccag caagaggaga ctcggtgaca ccagtctcct 2940
gtagggacag gaggattttg tgggggttcg tgtcactgtg agcatattgt cggagcaggc 3000
agtgctattc ccacagtgac acaaccccat tcaaaaaccc ctactgcaaa cgcacccact 3060
cctgggactg aggggctggg ggagcgtctg ggaagtatgg cctaggggtg tccatcaatg 3120
cccaaaatgc accagactct ccccaagaca tcaccccacc agccagtgag cagagtaaac 3180
agaaaatgag aagcagctgg gaagcttgca caggccccaa ggaaagagct ttggcaggtg 3240
tgcaagaggg gatgtgggca gagcctcagc agggcctttt gctgtttctg ctttcctgtg 3300
cagagagttc cataaactgg tattcaagat caatggctgg gagtgagccc aggaggacag 3360
tgtgggaaga gcacagggaa ggaggagcag ccgctatcct acactgtcat cttttgaaag 3420
tttgccctgt gcccacaatg ctgcatcatg ggatgcttaa cagctgatgt agacacagct 3480
aaagagagaa tcagtgaaat ggatttgcag cacagatctg aataaatcct ccagaatgtg 3540
gagcagcaca gaagcaagca cacagaaagt gcctgatgcc aaggcaaagt tcagtgggca 3600
ccttcaggca ttgctgctgg gcacagacac tctgaaaagc actggcagga actgcctgtg 3660
acaaagcaga accctcaggc aatgccagcc ctagagccct tcctgagaac ctcatgggca 3720
aagatgtgca gaacagctgt ttgtcatagc cccaaactat ggggctggac aaagcaaacg 3780
tccatctgaa ggagaacaga caaataaacg atggcaggtt catgaaatgc aaactaggac 3840
agccagagga caacagtaga gagctacagg cggctttgcg gttgagttca tgacaatgct 3900
gagtaattgg agtaacagag gaaagcccaa aaaatacttt taatgtgatt tcttctaaat 3960
aaaatttaca cccggcaaaa tgaactatct tcttaaggga taaactttcc cctggaaaaa 4020
ctataaggaa aatcaagaaa acgatgatca cataaacaca gtggtggtta cttctactgg 4080
ggaaggaaga gggtatgagc tgagacacac agagtcggca agtctcctaa caagaacaga 4140
acaaatacat tacagtacct tgaaaacagc agttaaactt ctaaatcgca agaagaggaa 4200
aatgcacaca cctgtgttta gaaaattctc agtccagcac tgttcataat agcaaagaca 4260
ttaacccagg ttggataaat aagcgatgac acaggcaatt gcacaatgat acagacatac 4320
attcagtata tgagacatcg atgatgtatc cccaaagaaa tgactttaaa gagaaaaggc 4380
ctgatgtgtg gtggcaatca cctccctggg catccccgga caggctgcag gctcactgtg 4440
tggcagggca ggcaggcacc tgctggcagc tcctggggcc tgatgtggag caggcacaga 4500
gctgtatatc cccaaggaag gtacagtcag tgcattccag agagaagcaa ctcagccaca 4560
ctccctggcc agaacccaag atgcacaccc atgcacaggg aggcagagcc cagcacctcc 4620
gcagccacca ccacctgcgc acgggccacc accttgcagg cacagagtgg gtgctgagag 4680
gaggggcagg gacaccaggc agggtgagca cccagagaaa actgcagaag cctcacacat 4740
ccctcacctg gcctgggctt cacctgacct ggacctcacc tggcctcggg cctcacctgc 4800
acctgctcca ggtcttgctg gagcctgagt agcactgagg ctgtagggac tcatccaggg 4860
ttggggaatg actctgcaac tctcccacat ctgacctttc tgggtggagg cacctggtgg 4920
cccagggaat ataaaaagcc ccagaatgat gcctgtgtga tttgggggca atttatgaac 4980
ccgaaaggac atggccatgg ggtgggtagg gacagtaggg acagatgtca gcctgaggtg 5040
aagcctcagg acacaggtgg gcatggacag tgtccaccta agcgagggac agacccgagt 5100
gtccctgcag tagacctgag agcgctgggc ccacagcctc ccctcggggc cctgctgcct 5160
cctcaggtca gccctggaca tcccgggttt ccccaggcct ggcggtagga ttttgttgag 5220
gtctgtgtca ctgtggtatt actatgagag gcttgcttgt ggcttcccta agagctgcag 5280
caggcaagct aagcctcaca gatgctgcta ttactaccac agtgtcacag agtccatcaa 5340
aaacccatgc ctgggagcct cccaccacag ccctccctgc gggggaccgc tgcatgccgt 5400
gttaggattt tgatcgagga cacggcgcca tgggtatggt ggctaccaca gcagtgcagc 5460
ccatgaccca aacacacggg gcagcagaaa caatggacag gcccacaagt gaccatgatg 5520
ggctccagcc caccagcccc agagaccatg aaacagatgg ccaaggtcac cctacaggtc 5580
atccagatct ggctccaagg ggtctgcatc gctgctgccc tcccaacgcc aaaccagatg 5640
gagacagggc cggccccata gcaccatctg ctgccgtcca cccagcagtc ccggaagccc 5700
ctccctgaac gctgggccac gtgtgtgaac cctgcgagcc ccccatgtca gagtaggggc 5760
agcaggaggg cggggctggc cctgtgcact gtcactgccc ctgtggtccc tggcctgcct 5820
ggccctgaca cctgagcctc tcctgggtca tttccaagac attcccaggg acagccggag 5880
ctgggagtcg ctcatcctgc ctggctgtcc tgagtcctgc tcatttccag acctcaccag 5940
ggaagccaac agaggactca cctcacacag tcagagacaa cgaaccttcc agaaatccct 6000
gtttctctcc ccagtgagag aaaccctctt ccagggtttc tcttctctcc caccctcttc 6060
caggacagtc ctcagcagca tcacagcggg aacgcacatc tggatcagga cggcccccag 6120
aacacgcgat ggcccatggg gacagcccag cccttcccag acccctaaaa ggtatcccca 6180
ccttgcacct gccccagggc tcaaactcca ggaggcctga ctcctgcaca ccctcctgcc 6240
agatatcacc tcagccccct cctggagggg acaggagccc gggagggtga gtcagaccca 6300
cctgccctca atggcaggcg gggaagattc agaaaggcct gagatcccca ggacgcagca 6360
ccactgtcaa tgggggcccc agacgcctgg accagggcct gtgtgggaaa ggcctctggc 6420
cacactcagg gggattttgt gaagggccct cccactgtgg agaggctttg ctgtggcttc 6480
cctaagagct gccgcagcag gcaatgcaag cctcacagat gctgccacag tgatgaaacc 6540
agcatcaaaa accgaccgga ctcgcagggt ttatgcacac ttctcggctc ggagctctcc 6600
aggagcacaa gagccaggcc cgagggtttg tgcccagacc ctcggcctct agggacaccc 6660
gggccatctt agccgatggg ctgatgccct gcacaccgtg tgctgccaaa caggggcttc 6720
agagggctct gaggtgactt cactcatgac cacaggtgcc ctggtccctt cactgccagc 6780
tgcaccagac cctgttccga gagatgcccc agttccaaaa gccaattcct ggggccggga 6840
attactgtag acaccagcct cattccagta cctcctgcca attgcctgga ttcccatcct 6900
ggctggaatc aagagggcag catccgccag gctcccaaca ggcaggactc ccacacaccc 6960
tcctctgaga ggccgctgtg ttccgcaggg ccaggccgca gacagttccc ctcacctgcc 7020
catgtagaaa cacctgccat tgtcgtcccc acctggcaaa gaccacttgt ggagccccca 7080
gccccaggta cagctgtaga gagagtcctc gaggccccta agaaggagcc atgcccagtt 7140
ctgccgggac cctcggccag gccgacagga gtggacgctg gagctgggcc cacactgggc 7200
cacataggag ctcaccagtg agggcaggag agcacatgcc ggggagcacc cagcctcctg 7260
ctgaccagag acccgtccca gagcccagga ggctgcagag gcctctccag ggggacacag 7320
tgcatgtctg gtccctgagc agcccccagg ctctctagca ctgggggccc ctggcacagc 7380
tgtctggacc ctccctgttc cctgggaagc tcctcctgac agccccgcct ccagttccag 7440
gtgtggattt tgtcaggggg tgccacactg tgtactgcca gaagtggatg tggacttgcg 7500
atagtgagag gaagtgctgt gagggtatgg tatgccggct gtggtgtaag aagaagctct 7560
ggcacagtgg tgccgcccat atcaaaaacc aggccaagta gacagacccc tgccacgcag 7620
ccccaggcct ccagctcacc tgcttctcct ggggctctca aggctgctgt ctgccctctg 7680
gccctctgtg gggagggttc cctcagtggg aggtctgtgc tccagggcag ggatgactga 7740
gatagaaatc aaaggctggc agggaaaggc agcttcccgc cctgagaggt gcaggcagca 7800
ccacagagcc atggagtcac agagccacgg agcccccagt gtgggcgtgt gagggtgctg 7860
ggctcccggc aggcccagcc ctgatgggga agcctgcccc gtcccacagc ccaggtcccc 7920
aggggcagca ggcacagaag ctgccaagct gtgctctacg atcctcatcc ctccagcagc 7980
atccactcca cagtggggaa actgagcctt ggagaaccac ccagccccct ggaaacaagg 8040
cggggagccc agacagtggg cccagagcac tgtgtgtatc ctggcactag gtgcagggac 8100
cacccggaga tccccatcac tgagtggcca gcctgcagaa ggacccaacc ccaaccaggc 8160
cgcttgatta agctccatcc ccctgtcctg ggaacctctt cccagcgcca ccaacagctc 8220
ggcttcccag gccctcatcc ctccaaggaa ggccaaaggc tgggcctgcc aggggcacag 8280
taccctccct tgccctggct aagacagggt gggcagacgg ctgcagatag gacatattgc 8340
tggggcatct tgctctgtga ctactgggta ctggctctca acgcagaccc taccaaaatc 8400
cccactgcct cccctgctag gggctggcct ggtctcctcc tgctgtccta ggaggctgct 8460
gacctccagg atggcttctg tccccagttc tagggccaga gcagatccca ggcaggctgt 8520
aggctgggag gccacccctg tccttgccga ggttcagtgc aggcacccag gacaggaaat 8580
ggcctgaaca cagggatgac tgtgccatgc cctacctaag tccgcccctt tctactctgc 8640
aacccccact ccccaggtca gcccatgacg accaacaacc caacaccaga gtcactgcct 8700
ggccctgccc tggggaggac ccctcagccc ccaccctgtc tagaggagtt ggggggacag 8760
gacacaggct ctctccttat ggttccccca cctggctcct gccgggaccc ttggggtgtg 8820
gacagaaagg acgcctgcct aattggcccc caggaaccca gaacttctct ccagggaccc 8880
cagcccgagc acccccttac ccaggaccca gccctgcccc tcctcccctc tgctctcctc 8940
tcatcactcc atgggaatcc agaatcccca ggaagccatc aggaagggct gaaggaggaa 9000
gcggggccgc tgcaccaccg ggcaggaggc tccgtcttcg tgaacccagg gaagtgccag 9060
cctcctagag ggtatggtcc accctgcctg gggctcccac cgtggcaggc tgcggggaag 9120
gaccagggac ggtgtggggg agggctcagg gccctgcagg tgctccatct tggatgagcc 9180
catccctctc acccaccgac ccgcccacct cctctccacc ctggccacac gtcgtccaca 9240
ccatcctgag tcccacctac accagagcca gcagagccag tgcagacaga ggctggggtg 9300
caggggggcc gccagggcag ctttggggag ggaggaatgg aggaagggga ggtcagtgaa 9360
gaggcccccc tcccctgggt ctaggatcca cctttgggac ccccggatcc catcccctcc 9420
aggctctggg aggagaagca ggatgggaga ttctgtgcag gaccctctca cagtggaata 9480
cctccacagc ggctcaggcc agatacaaaa gcccctcagt gagccctcca ctgcagtgca 9540
gggcctgggg gcagcccctc ccacagagga cagacccagc accccgaaga agtcctgcca 9600
gggggagctc agagccatga aggagcaaga tatggggacc ccaatactgg cacagacctc 9660
agctccatcc aggcccacca ggacccacca tgggtggaac acctgtctcc ggcccctgct 9720
ggctgtgagg cagctggcct ctgtctcgga cccccattcc agacaccaga cagagggaca 9780
ggccccccag aaccagtgtt gagggacacc cctgtccagg gcagccaagt ccaagaggcg 9840
cgctgagccc agcaagggaa ggcccccaaa caaaccagga ggtttctgaa gctgtctgtg 9900
tcacagtctg ctgcaactgc agcagcaaat ggtgccgcga ccatagcagg tgctgccaca 9960
atgacactgg gcaggacaga aaccccatcc caagtcagcc gaaggcagag agagcaggca 10020
ggacacattt aggatctgag gccacacctg acactcaagc caacagatgt ctcccctcca 10080
gggcgccctg ccctgttcag tgttcctgag aaaacagggg cagcctgagg ggatccaggg 10140
ccaggagatg ggtcccctct accccgagga ggagccaggc gggaatccca gccccctccc 10200
cattgaggcc atcctgccca gaggggcccg gacccacccc acacacccag gcagaatgtg 10260
tgcaggcctc aggctctgtg ggtgccgcta gctggggctg ccagtcctca ccccacacct 10320
aaggtgagcc acagccgcca gagcctccac aggagacccc acccagcagc ccagccccta 10380
cccaggaggc cccagagctc agggcgcctg ggtggatttt gtacagcccc gagtcactgt 10440
gggtatagtg gggagaggct ttgtggcttc cctaagagct gcagcaggca aaagcctcac 10500
agatgctgca gctactacca cagtgagaaa agctatgtca aaaaccgtct cccggccact 10560
gctggaggcc cagccagaga agggaccagc cgcccgaaca tacgaccttc ccagacctca 10620
tgacccccag cacttggagc tccacagtgt ccccattgga tggtgaggat gggggccggg 10680
gccatctgca cctcccaaca tcacccccag gcagcacagg cacaaacccc aaatccagag 10740
ccgacaccag gaacacagac accccaatac cctgggggac cctggccctg gtgacttccc 10800
actgggatcc acccccgtgt ccacctggat caaagacccc accgctgtct ctgtccctca 10860
ctcagggcct gctgaggggc gggtgctttg gagcagactc aggtttaggg gccaccattg 10920
tggggcccaa cctcgaccag gacacagatt tttctttcct gccctggggc aacacagact 10980
ttggggtctg tgcagggagg accttctgga aagtcaccaa gcacagagcc ctgactgagg 11040
tggtctcagg aagaccccca ggagggggct tgtgcccctt cctctcatgt ggaccccatg 11100
ccccccaaga taggggcatc atgcagggca ggtcctccat gcagccacca ctaggcaact 11160
ccctggcgcc ggtccccact gcgcctccat cccggctctg gggatgcagc caccatggcc 11220
acaccaggca gcccgggtcc agcaaccctg cagtgcccaa gcccttggca ggattcccag 11280
aggctggagc ccacccctcc tcatcccccc acacctgcac acacacacct accccctgcc 11340
cagtccccct ccaggagggt tggagccgcc catagggtgg gggctccagg tctcactcac 11400
tcgcttccct tcctgggcaa aggagcctcg tgccccggtc ccccctgacg gcgctgggca 11460
caggtgtggg tactgggccc cagggctcct ccagccccag ctgccctgct ctccctggga 11520
ggcctgggca ccaccagacc accagtccag ggcacagccc cagggagccg cccactgcca 11580
gctcacagga agaagataag cttcagaccc tcagggccgg gagctgcctt cctgccaccc 11640
cttcctgccc cagacctcca tgccctcccc caaccactta cacacaagcc agggagctgt 11700
ttccacacag ttcaacccca aaccaggacg gcctggcact cgggtcactg ccatttctgt 11760
ctgcattcgc tcccagcgcc cctgtgttcc ctccctcctc cctccttcct ttcttcctgc 11820
attgggttca tgccgcagag tgccaggtgc aggtcagccc tgagcttggg gtcacctcct 11880
cactgaaggc agcctcaggg tgcccagggg caggcagggt gggggtgagg cttccagctc 11940
caaccgcttc gctaccttag gaccgttata gttaggcgcg ccgtcgacca attctcatgt 12000
ttgacagctt atcatcgaat ttctacgta 12029
<210> 236
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 236
tcttatcaga cagggggctc tc 22
<210> 237
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 237
gtgactggag ttcagacgtg tgctcttccg atcttcacca tggactgsac ctgga 55
<210> 238
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 238
gtgactggag ttcagacgtg tgctcttccg atctccatgg acacactttg ytccac 56
<210> 239
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 239
gtgactggag ttcagacgtg tgctcttccg atcttcacca tggagtttgg gctgagc 57
<210> 240
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 240
gtgactggag ttcagacgtg tgctcttccg atctagaaca tgaaacayct gtggttctt 59
<210> 241
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 241
gtgactggag ttcagacgtg tgctcttccg atctatgggg tcaaccgcca tcct 54
<210> 242
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 242
gtgactggag ttcagacgtg tgctcttccg atctacaatg tctgtctcct tcctcat 57
<210> 243
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<400> 243
acactctttc cctacacgac gctcttccga tctgggaaga catttgggaa ggac 54
<210> 244
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<220>
<221> nnnnnn
<222> (25)..(30)
<223> 6核苷酸指数
<220>
<221> misc_feature
<222> (25)..(30)
<223> n是a、c、g或t
<400> 244
caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 245
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 引物和/或探针
<220>
<221> nnnnnn
<222> (29)..(35)
<223> 6核苷酸指数
<220>
<221> misc_feature
<222> (30)..(35)
<223> n是a、c、g或t
<400> 245
aatgatacgg cgaccaccga gatctacacn nnnnnacact ctttccctac acgacgctct 60
tccgatct 68

Claims (1)

1.一种啮齿类动物,其基因组包含免疫球蛋白重链可变区,所述免疫球蛋白重链可变区包括经改造的DH区,其中所述经改造的DH区包括一个或多个核苷酸序列,所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分。
CN202111210808.9A 2016-01-13 2017-01-12 具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途 Pending CN114128676A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662278127P 2016-01-13 2016-01-13
US62/278,127 2016-01-13
CN201780014326.1A CN108777951B (zh) 2016-01-13 2017-01-12 具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201780014326.1A Division CN108777951B (zh) 2016-01-13 2017-01-12 具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途

Publications (1)

Publication Number Publication Date
CN114128676A true CN114128676A (zh) 2022-03-04

Family

ID=58010373

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201780014326.1A Active CN108777951B (zh) 2016-01-13 2017-01-12 具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途
CN202111210808.9A Pending CN114128676A (zh) 2016-01-13 2017-01-12 具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201780014326.1A Active CN108777951B (zh) 2016-01-13 2017-01-12 具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途

Country Status (13)

Country Link
US (2) US20190037816A1 (zh)
EP (2) EP3402326A1 (zh)
JP (4) JP6979955B2 (zh)
KR (2) KR20230006929A (zh)
CN (2) CN108777951B (zh)
AU (2) AU2017206785C1 (zh)
BR (1) BR112018014250A2 (zh)
CA (1) CA3011359A1 (zh)
IL (2) IL302725A (zh)
MX (1) MX2018008701A (zh)
RU (1) RU2763320C2 (zh)
SG (2) SG11201805973WA (zh)
WO (1) WO2017123804A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3612631A4 (en) * 2017-04-20 2021-01-13 Ramot at Tel-Aviv University Ltd. RECOMBINATION ACTIVATING GENE (RAG) INDUCED V (D) J GENE TARGETING
WO2021217181A1 (en) * 2020-04-21 2021-10-28 Tempus Labs, Inc. Tcr/bcr profiling
MX2020012914A (es) * 2020-11-27 2022-05-30 Centro De Investig Cientifica Y De Educacion Superior De Ensenada Baja California Cicese Proteina andamio para la generacion de proteinas quimericas de union a antigeno.

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE158021T1 (de) 1990-08-29 1997-09-15 Genpharm Int Produktion und nützung nicht-menschliche transgentiere zur produktion heterologe antikörper
US5670356A (en) 1994-12-12 1997-09-23 Promega Corporation Modified luciferase
US5874304A (en) 1996-01-18 1999-02-23 University Of Florida Research Foundation, Inc. Humanized green fluorescent protein genes and methods
US6596541B2 (en) 2000-10-31 2003-07-22 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US6586251B2 (en) 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
EP1572079A4 (en) * 2002-03-29 2006-09-06 Centocor Inc MAMMAL-CDR MIMETIC BODIES, COMPOSITIONS, PROCESSES AND APPLICATION PURPOSES
CA2534055A1 (en) * 2003-08-01 2005-02-10 Genentech, Inc. Antibody cdr polypeptide sequences with restricted diversity
US8211648B2 (en) * 2005-07-22 2012-07-03 Kalobios Pharmaceuticals, Inc. Secretion of antibodies without signal peptides from bacteria
PL2041177T3 (pl) 2006-06-02 2012-09-28 Regeneron Pharma Przeciwciała o wysokim powinowactwie przeciw ludzkiemu receptorowi IL 6
DK2185719T3 (en) * 2007-08-02 2014-02-17 Novimmune Sa ANTI-RANTES ANTIBODIES AND PROCEDURES FOR USE THEREOF
WO2009114400A1 (en) 2008-03-07 2009-09-17 Regeneron Pharmaceuticals, Inc. Es cell-derived mice from diploid host embryo injection
US8012714B2 (en) * 2008-04-14 2011-09-06 Innovative Targeting Solutions, Inc. Sequence diversity generation in immunoglobulins
RU2425880C2 (ru) * 2009-07-30 2011-08-10 Учреждение Российской академии наук Институт общей генетики им. Н.И. Вавилова РАН Способ получения трансгенных мышей
US20130185821A1 (en) 2010-02-08 2013-07-18 Regeneron Pharmaceuticals, Inc. Common Light Chain Mouse
US20120021409A1 (en) 2010-02-08 2012-01-26 Regeneron Pharmaceuticals, Inc. Common Light Chain Mouse
RU2724663C2 (ru) 2010-02-08 2020-06-25 Ридженерон Фармасьютикалз, Инк. Мышь с общей легкой цепью
US9796788B2 (en) 2010-02-08 2017-10-24 Regeneron Pharmaceuticals, Inc. Mice expressing a limited immunoglobulin light chain repertoire
US20130045492A1 (en) 2010-02-08 2013-02-21 Regeneron Pharmaceuticals, Inc. Methods For Making Fully Human Bispecific Antibodies Using A Common Light Chain
EP2371863A1 (en) * 2010-03-30 2011-10-05 Pierre Fabre Médicament Humanized anti CXCR4 antibodies for the treatment of cancer
US8871996B2 (en) 2010-06-09 2014-10-28 Regeneron Pharmaceuticals, Inc. Mice expressing human voltage-gated sodium channels
US8486647B2 (en) 2010-06-09 2013-07-16 Regeneron Pharmaceuticals, Inc. Neuropeptide release assay for sodium channels
PL2578688T5 (pl) 2011-02-25 2023-05-29 Regeneron Pharmaceuticals, Inc. Myszy adam6
JP2014533930A (ja) * 2011-09-19 2014-12-18 カイマブ・リミテッド 免疫グロブリン遺伝子多様性の操作およびマルチ抗体治療薬
SG10202010120XA (en) 2011-10-17 2020-11-27 Regeneron Pharma Restricted immunoglobulin heavy chain mice
EP3165086A1 (en) 2012-03-06 2017-05-10 Regeneron Pharmaceuticals, Inc. Common light chain mouse
CA2867235C (en) * 2012-03-14 2021-11-09 Innovative Targeting Solutions Inc. Generating targeted sequence diversity in fusion proteins
PT2825037T (pt) * 2012-03-16 2019-08-07 Regeneron Pharma Animais não humanos que expressam sequências de imunoglobulinas sensíveis ao ph
JP2015525071A (ja) 2012-06-05 2015-09-03 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. 共通の軽鎖を用いて完全ヒト型二重特異性抗体を作製するための方法
EP2943512A4 (en) * 2013-01-11 2016-06-01 California Inst Biomedical Res FUSION BOVINE ANTIBODIES
RU2689664C2 (ru) 2013-03-13 2019-05-28 Регенерон Фарматютикалз, Инк. Мыши, экспрессирующие ограниченный репертуар легких цепей иммуноглобулина
KR20150126863A (ko) 2013-03-13 2015-11-13 리제너론 파마슈티칼스 인코포레이티드 공통 경쇄 마우스
CA2953499C (en) 2014-06-23 2023-10-24 Regeneron Pharmaceuticals, Inc. Nuclease-mediated dna assembly
SI3221457T1 (sl) 2014-11-21 2019-08-30 Regeneron Pharmaceuticals, Inc. Postopki in sestavki za ciljno genetsko modifikacijo z uporabo vodilnih RNK v parih
WO2016100819A1 (en) 2014-12-19 2016-06-23 Regeneron Pharmaceuticals, Inc. Methods and compositions for targeted genetic modification through single-step multiple targeting

Also Published As

Publication number Publication date
SG10201914034WA (en) 2020-03-30
EP3402326A1 (en) 2018-11-21
KR102482103B1 (ko) 2022-12-28
IL260526A (zh) 2018-08-30
JP6979955B2 (ja) 2021-12-15
SG11201805973WA (en) 2018-08-30
JP2023024619A (ja) 2023-02-16
AU2023201372A1 (en) 2023-04-06
AU2017206785B2 (en) 2023-03-16
US20190037816A1 (en) 2019-02-07
WO2017123804A1 (en) 2017-07-20
RU2018129169A (ru) 2020-02-13
KR20230006929A (ko) 2023-01-11
WO2017123804A9 (en) 2017-08-17
BR112018014250A2 (pt) 2018-12-18
CN108777951A (zh) 2018-11-09
JP2024091951A (ja) 2024-07-05
EP4257599A2 (en) 2023-10-11
AU2017206785A1 (en) 2018-08-02
EP4257599A3 (en) 2024-01-17
JP2021101738A (ja) 2021-07-15
IL302725A (en) 2023-07-01
RU2763320C2 (ru) 2021-12-28
MX2018008701A (es) 2019-06-06
IL260526B1 (en) 2023-06-01
CN108777951B (zh) 2021-11-05
AU2017206785C1 (en) 2023-09-07
CA3011359A1 (en) 2017-07-20
IL260526B2 (en) 2023-10-01
KR20180108652A (ko) 2018-10-04
JP2019501660A (ja) 2019-01-24
RU2018129169A3 (zh) 2020-05-25
US20220174920A1 (en) 2022-06-09

Similar Documents

Publication Publication Date Title
AU2016204127B2 (en) Restricted immunoglobulin heavy chain mice
CN107361011B (zh) 制备表达ph敏感性免疫球蛋白序列的非人动物的方法
KR102484480B1 (ko) 제한된 면역글로불린 중쇄 유전자좌를 가지는 인간화된 비-인간 동물
KR20140134672A (ko) pH-의존성 결합 특성을 나타내는 항원-결합 단백질을 생성하는 마우스
KR20220025838A (ko) 유전자이식 포유동물 및 사용 방법
CN108777951B (zh) 具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途
KR20200019722A (ko) 키메라 Notch 수용체의 면역원성을 감소시키는 방법 및 조성물
KR20190120170A (ko) Vhh-함유 중쇄 항체 및 이의 생산
CN114134153A (zh) Garp基因人源化非人动物及其构建方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination