CN116802200A - 具有人源化tslp基因、人源化tslp受体基因和/或人源化il7ra基因的非人动物 - Google Patents

具有人源化tslp基因、人源化tslp受体基因和/或人源化il7ra基因的非人动物 Download PDF

Info

Publication number
CN116802200A
CN116802200A CN202180086511.8A CN202180086511A CN116802200A CN 116802200 A CN116802200 A CN 116802200A CN 202180086511 A CN202180086511 A CN 202180086511A CN 116802200 A CN116802200 A CN 116802200A
Authority
CN
China
Prior art keywords
rodent
il7ra
human
tslpr
humanized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180086511.8A
Other languages
English (en)
Inventor
Y·唐
S·布莱吉斯
S·斯里瓦桑
D·弗里塔
C·居雷尔
A·J·墨菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Publication of CN116802200A publication Critical patent/CN116802200A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Knock-in vertebrates, e.g. humanised vertebrates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • C07K14/54Interleukins [IL]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/715Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons
    • C07K14/7155Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons for interleukins [IL]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/89Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microinjection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5082Supracellular entities, e.g. tissue, organisms
    • G01N33/5088Supracellular entities, e.g. tissue, organisms of vertebrates
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • A01K2217/052Animals comprising random inserted nucleic acids (transgenic) inducing gain of function
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/15Animals comprising multiple alterations of the genome, by transgenesis or homologous recombination, e.g. obtained by cross-breeding
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0331Animal model for proliferative diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/035Animal model for multifactorial diseases
    • A01K2267/0368Animal model for inflammation
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/035Animal model for multifactorial diseases
    • A01K2267/0387Animal model for diseases of the immune system
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/10Screening for compounds of potential therapeutic value involving cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Environmental Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Toxicology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Urology & Nephrology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Hematology (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Husbandry (AREA)
  • Pathology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Rheumatology (AREA)
  • Endocrinology (AREA)
  • Diabetes (AREA)

Abstract

本文公开了啮齿动物(如但不限于小鼠和大鼠),所述啮齿动物被基因修饰以包括人源化Tslp基因、人源化Tslpr基因、人源化Il7ra基因或其组合。提供了用于制备此类经基因修饰的啮齿动物的组合物和方法以及使用此类经基因修饰的啮齿动物作为如过敏性疾病和癌症等疾病的动物模型的方法。

Description

具有人源化TSLP基因、人源化TSLP受体基因和/或人源化 IL7RA基因的非人动物
相关申请交叉引用
本申请要求于2020年12月21日提交的美国临时申请第63/128,258号的优先权的权益,所述美国临时申请的全部内容通过引用并入本文。
通过引用并入序列表
命名为37301_10589WO01_SequenceListing,大小为192KB,创建于2021年12月2日并通过EFS-Web提交给美国专利商标局的呈ASCII文本文件形式的序列表通过引用并入本文。
背景技术
胸腺基质淋巴细胞生成素(TSLP)通过异源二聚体受体发挥作用,所述异源二聚体受体由对TSLP(被称为“TSLPR”或“Tslpr”)具有特异性的链和IL7受体α链组成,并与过敏性疾病和某些癌症有关。需要有效的体内系统来更好地理解过敏性疾病和癌症的发病机制并且开发治疗剂。
发明内容
在一些实施例中,本文公开了一种经基因修饰的啮齿动物,所述啮齿动物在其基因组中包括人源化Tslp基因,其中所述人源化Tslp基因包括啮齿动物Tslp核酸序列和人TSLP核酸序列,其中所述人源化Tslp基因编码人源化Tslp多肽,所述人源化Tslp多肽包括与人TSLP蛋白的成熟蛋白序列基本上相同的成熟蛋白序列。
在一些实施例中,所述人源化Tslp多肽包括与人TSLP蛋白的成熟蛋白序列相同的成熟蛋白序列。
在一些实施例中,所述人源化Tslp蛋白包括与啮齿动物Tslp蛋白的信号肽基本上相同的信号肽。在一些实施例中,所述人源化Tslp蛋白包括与啮齿动物Tslp蛋白,例如内源性啮齿动物Tslp蛋白的信号肽相同的信号肽。
在一些实施例中,人源化Tslp基因中的所述人TSLP核酸序列至少编码人TSLP蛋白的大部分成熟蛋白序列。在一些实施例中,所述人TSLP核酸序列编码人TSLP蛋白的所述成熟蛋白序列,例如人TSLP蛋白的氨基酸29-159(例如,SEQ ID NO:3中所示的人TSLP蛋白)。在一些实施例中,所述人TSLP核酸序列包括人TSLP基因的从编码成熟蛋白序列的第一氨基酸的密码子开始的外显子1至外显子4中的终止密码子。
在一些实施例中,人源化Tslp基因中的所述啮齿动物Tslp核酸序列包括啮齿动物Tslp基因(例如,内源性啮齿动物Tslp基因)的编码啮齿动物Tslp信号肽的外显子序列。在一些实施例中,所述啮齿动物是小鼠,并且人源化Tslp基因中的所述啮齿动物核酸序列包括小鼠Tslp基因的外显子1和编码信号肽氨基酸的外显子2的5'部分。在一些实施例中,人源化Tslp基因中的所述啮齿动物Tslp核酸序列还包括啮齿动物Tslp基因(例如,内源性啮齿动物Tslp基因)的3'UTR。
在一些实施例中,所述啮齿动物是小鼠,并且所述人源化Tslp基因包括:(i)小鼠Tslp基因的外显子1和编码信号肽氨基酸的外显子2的5'部分;以及(ii)人TSLP基因的从编码成熟蛋白序列的第一氨基酸的密码子开始的外显子1至外显子4中的终止密码子。在一些实施例中,所述人源化Tslp基因进一步包括小鼠Tslp基因的3'UTR。在各个实施例中,小鼠Tslp基因是内源性小鼠Tslp基因。
在一些实施例中,人源化Tslp基因与如内源性啮齿动物Tslp启动子等啮齿动物Tslp启动子可操作地连接。
在一些实施例中,人源化Tslp基因位于除内源性啮齿动物Tslp基因座之外的基因座处。在一些实施例中,人源化Tslp基因位于内源性啮齿动物Tslp基因座处。
在人源化Tslp基因位于内源性啮齿动物Tslp基因座处的实施例中的一些实施例中,所述人源化Tslp基因是由于位于内源性啮齿动物Tslp基因座处的啮齿动物Tslp基因组DNA被人TSLP核酸置换而形成的。在一些实施例中,所述人源化Tslp基因是由于包括至少编码所述内源性啮齿动物Tslp蛋白的大部分成熟蛋白序列的外显子序列的啮齿动物基因组DNA被至少编码人TSLP蛋白的大部分成熟蛋白序列的人TSLP核酸置换而形成的。在一些实施例中,人源化Tslp基因是由于包括编码所述内源性啮齿动物Tslp蛋白的成熟蛋白序列的外显子序列的啮齿动物基因组DNA被编码人TSLP蛋白的成熟蛋白序列的人TSLP核酸置换而形成的。在一些实施例中,所述啮齿动物是小鼠,并且被置换的小鼠基因组DNA包括内源性小鼠Tslp基因的从编码成熟小鼠Tslp蛋白的第一氨基酸的密码子开始的外显子2至外显子5中的终止密码子,并且所述人基因组DNA包括人TSLP基因的从编码成熟人TSLP蛋白的第一氨基酸的密码子开始的外显子1至外显子4中的终止密码子。
在一些实施例中,所述啮齿动物对人源化Tslp基因是纯合的。在一些实施例中,所述啮齿动物对人源化Tslp基因是杂合的。
在一些实施例中,人源化Tslp多肽在来自人源化Tslp基因的啮齿动物中表达。
在一些实施例中,啮齿动物在其基因组中进一步包括人源化Tslpr基因、人源化Il7ra基因或其组合。
在一些实施例中,所述啮齿动物是小鼠或大鼠。
在一些实施例中,本文公开了一种分离的啮齿动物组织或细胞,其基因组包括本文所描述的人源化Tslp基因。在一些实施例中,所述啮齿动物细胞是啮齿动物胚胎干细胞。在一些实施例中,所述啮齿动物细胞是卵子或精子。在一些实施例中,分离的啮齿动物组织或细胞是小鼠组织或细胞或大鼠组织或细胞。
在一些实施例中,本文公开了一种啮齿动物胚胎,所述啮齿动物胚胎包括啮齿动物胚胎干细胞,所述啮齿动物胚胎干细胞包括本文所描述的人源化Tslp基因。
在一些实施例中,本文公开了一种制备经基因修饰的啮齿动物的方法。在一些实施例中,所述方法包括:修饰啮齿动物基因组以包括人源化Tslp基因,其中所述人源化Tslp基因包括啮齿动物Tslp核酸序列和人TSLP核酸序列,并且编码人源化Tslp多肽,所述人源化Tslp多肽包括与人TSLP蛋白的成熟蛋白序列基本上相同的成熟蛋白序列;以及制备包括经修饰的啮齿动物基因组的啮齿动物。
在一些实施例中,修饰啮齿动物基因组包括以下步骤:将包括人TSLP核酸序列的核酸分子引入到啮齿动物胚胎干(ES)细胞的基因组中,从而获得啮齿动物ES细胞,其中所述人TSLP核酸序列已整合到内源性Tslp基因座中以置换啮齿动物Tslp基因组DNA,由此形成人源化Tslp基因;以及从所获得的啮齿动物ES细胞产生啮齿动物。在一些实施例中,所述人TSLP核酸序列至少编码人TSLP蛋白的大部分成熟蛋白序列。在一些实施例中,引入到所述ES细胞中的所述核酸分子进一步包括侧接所述人TSLP核酸序列的5'同源臂和3'同源臂,并且其中所述5'同源臂和所述3'同源臂与侧接待置换的啮齿动物Tslp基因组DNA的内源性啮齿动物基因座处的核酸序列同源。在一些实施例中,所述人源化Tslp基因与啮齿动物Tslp启动子,例如位于所述内源性啮齿动物Tslp基因座处的内源性啮齿动物Tslp启动子可操作地连接。
在所述方法的一些实施例中,所述啮齿动物是小鼠或大鼠。
在一些实施例中,本文公开了一种靶向核酸构建体,所述靶向核酸构建体包括将整合到内源性啮齿动物Tslp基因座处的啮齿动物Tslp基因中的人TSLP核酸序列,所述人TSLP核酸序列侧接有与所述啮齿动物Tslp基因座处的核苷酸序列同源的5'核苷酸序列和3'核苷酸序列,其中所述人TSLP核酸序列整合到所述啮齿动物Tslp基因中使得啮齿动物Tslp基因组DNA被所述人TSLP核酸序列置换,由此形成人源化Tslp基因,并且其中所述人TSLP核酸序列至少编码人TSLP蛋白的大部分成熟蛋白序列。在靶向核酸的一些实施例中,所述啮齿动物是小鼠或大鼠。
在一些实施例中,本文公开了一种用于产生经基因修饰的啮齿动物细胞的体外方法,所述方法包括将靶向载体引入到啮齿动物细胞中,所述靶向载体包括至少编码人TSLP蛋白的大部分成熟蛋白序列的人TSLP核酸序列,所述人TSLP核酸序列侧接有啮齿动物同源臂,所述啮齿动物同源臂介导所述人TSLP核苷酸序列整合到内源性啮齿动物Tslp基因座中,使得啮齿动物Tslp基因组DNA被所述人TSLP核酸序列置换以形成如本文所描述的人源化Tslp基因,由此产生经基因修饰的啮齿动物细胞。在一些实施例中,所述啮齿动物细胞是小鼠细胞或大鼠细胞。在一些实施例中,所述啮齿动物细胞是啮齿动物ES细胞,并且所述方法产生经基因修饰的啮齿动物ES细胞。
在一些实施例中,本文公开了一种经基因修饰的啮齿动物,所述啮齿动物在其基因组中包括人源化Tslpr基因,其中所述人源化Tslpr基因包括啮齿动物Tslpr核酸序列和人TSLPR核酸序列,其中所述人源化Tslpr基因编码人源化Tslpr多肽,所述人源化Tslpr多肽包括与人TSLPR蛋白的胞外结构域基本上相同的胞外结构域。
在一些实施例中,所述人源化Tslpr蛋白包括与啮齿动物Tslpr蛋白(例如,内源性啮齿动物Tslpr蛋白)的跨膜细胞质序列基本上相同的跨膜细胞质序列。在一些实施例中,所述人源化Tslpr蛋白包括与啮齿动物Tslpr蛋白(例如,内源性啮齿动物Tslpr蛋白)的跨膜细胞质序列相同的跨膜细胞质序列。
在一些实施例中,所述人源化Tslpr蛋白包括与啮齿动物Tslpr蛋白的信号肽基本上相同的信号肽。在一些实施例中,所述人源化Tslpr蛋白包括与啮齿动物Tslpr蛋白(例如,内源性啮齿动物Tslpr蛋白)的信号肽相同的信号肽。
在一些实施例中,人源化Tslpr基因中的所述人TSLPR核酸序列至少编码人TSLPR蛋白的大部分胞外结构域。在一些实施例中,人源化Tslpr基因中的所述人TSLPR核酸序列编码人TSLPR的氨基酸29-231(例如,如SEQ ID NO:23中所示的人TSLPR)。在一些实施例中,所述人TSLPR核酸序列包括人TSLPR基因的外显子2至编码外显子6中的最后一个胞外结构域氨基酸的密码子。
在一些实施例中,人源化Tslpr基因中的所述啮齿动物Tslpr核酸序列包括至少编码啮齿动物Tslpr蛋白(例如,内源性啮齿动物Tslpr蛋白)的大部分跨膜细胞质序列的啮齿动物Tslpr基因的外显子序列。在一些实施例中,所述啮齿动物是小鼠,并且所述啮齿动物Tslpr核酸序列包括小鼠Tslpr基因(例如,内源性小鼠Tslpr基因)的从编码跨膜结构域的第一氨基酸的密码子开始的外显子6至外显子8。
在一些实施例中,人源化Tslpr基因中的所述啮齿动物Tslpr核酸序列包括啮齿动物Tslpr基因的编码啮齿动物Tslpr蛋白(例如,内源性啮齿动物Tslpr蛋白)的信号肽的外显子序列。在一些实施例中,所述啮齿动物是小鼠,并且所述啮齿动物核酸序列包括小鼠Tslpr基因(例如,内源性小鼠Tslpr基因)的外显子1。
在一些实施例中,所述啮齿动物是小鼠,并且所述人源化Tslpr基因包括:(i)小鼠Tslpr基因(例如,内源性小鼠Tslpr基因)的外显子1;(ii)人TSLPR基因的外显子2至编码外显子6中的胞外结构域的最后一个氨基酸的密码子;以及(iii)小鼠Tslpr基因的从编码跨膜结构域的第一氨基酸的密码子开始的外显子6至外显子8。
在一些实施例中,人源化Tslpr基因与如内源性啮齿动物Tslpr启动子等啮齿动物Tslpr启动子可操作地连接。
在一些实施例中,人源化Tslpr基因位于除内源性啮齿动物Tslpr基因座之外的基因座处。在一些实施例中,人源化Tslpr基因位于内源性啮齿动物Tslpr基因座处。
在人源化Tslpr基因位于内源性啮齿动物Tslpr基因座处的实施例中的一些实施例中,所述人源化Tslpr基因是由于位于内源性啮齿动物Tslpr基因座处的啮齿动物Tslpr基因组DNA被人TSLPR核酸置换而形成的。在一些实施例中,人源化Tslpr基因是由于包括至少编码所述内源性啮齿动物Tslpr蛋白的大部分胞外结构域的外显子序列的啮齿动物基因组DNA被至少编码所述人TSLPR蛋白的大部分胞外结构域的所述人TSLPR核酸置换而形成的。在一些实施例中,所述啮齿动物是小鼠,并且其中被置换的小鼠基因组DNA包括内源性小鼠Tslpr基因的外显子2至编码外显子6中的胞外结构域的最后一个氨基酸的密码子,并且所述人基因组DNA包括人TSLPR基因的外显子2至编码外显子6中的胞外结构域的最后一个氨基酸的密码子。
在一些实施例中,啮齿动物对人源化Tslpr基因是杂合的。在一些实施例中,啮齿动物对人源化Tslpr基因是纯合的。
在一些实施例中,人源化Tslpr多肽在来自人源化Tslpr基因的啮齿动物中表达。
在一些实施例中,啮齿动物在其基因组中进一步包括人源化Tslp基因、人源化Il7ra基因或其组合。
在一些实施例中,所述啮齿动物是小鼠或大鼠。
在一些实施例中,本文公开了一种分离的啮齿动物组织或细胞,其基因组包括本文所描述的人源化Tslpr基因。在一些实施例中,所述啮齿动物细胞是啮齿动物胚胎干细胞。在一些实施例中,所述啮齿动物细胞是卵子或精子。在一些实施例中,分离的啮齿动物组织或细胞是小鼠组织或细胞或大鼠组织或细胞。
在一些实施例中,本文公开了一种啮齿动物胚胎,所述啮齿动物胚胎包括啮齿动物胚胎干细胞,所述啮齿动物胚胎干细胞包括本文所描述的人源化Tslpr基因。
在一些实施例中,本文公开了一种制备经基因修饰的啮齿动物的方法。在一些实施例中,所述方法包括:修饰啮齿动物基因组以包括人源化Tslpr基因,其中所述人源化Tslpr基因包括啮齿动物Tslpr核酸序列和人TSLPR核酸序列,并且编码人源化Tslpr多肽,所述人源化Tslpr多肽包括与人TSLPR蛋白的胞外结构域基本上相同的胞外结构域;以及制备包括经修饰的啮齿动物基因组的啮齿动物。
在一些实施例中,修饰啮齿动物基因组包括以下步骤:将包括人TSLPR核酸序列的核酸分子引入到啮齿动物胚胎干(ES)细胞的基因组中,从而获得啮齿动物ES细胞,其中所述人TSLPR核酸序列已整合到内源性Tslpr基因座中以置换啮齿动物Tslpr基因组DNA,由此形成人源化Tslpr基因;以及从所获得的啮齿动物ES细胞产生啮齿动物。在一些实施例中,所述人TSLPR核酸序列至少编码人TSLPR蛋白的大部分胞外结构域。在一些实施例中,引入到所述ES细胞中的所述核酸分子进一步包括侧接所述人TSLPR核酸序列的5'同源臂和3'同源臂,并且其中所述5'同源臂和所述3'同源臂与侧接待置换的啮齿动物Tslpr基因组DNA的内源性啮齿动物基因座处的核酸序列同源。在一些实施例中,所述人源化Tslpr基因与啮齿动物Tslpr启动子,例如位于所述内源性啮齿动物Tslpr基因座处的内源性啮齿动物Tslp启动子可操作地连接。
在所述方法的一些实施例中,所述啮齿动物是小鼠或大鼠。
在一些实施例中,本文公开了一种靶向核酸构建体,所述靶向核酸构建体包括将整合到内源性啮齿动物Tslpr基因座处的啮齿动物Tslpr基因中的人TSLPR核酸序列,所述人TSLPR核酸序列侧接有与所述啮齿动物Tslpr基因座处的核苷酸序列同源的5'核苷酸序列和3'核苷酸序列,其中所述人TSLPR核酸序列整合到所述啮齿动物Tslpr基因中使得啮齿动物Tslpr基因组DNA被所述人TSLPR核酸序列置换,由此形成人源化Tslpr基因,并且其中所述人TSLPR核酸序列至少编码人TSLP蛋白的大部分胞外结构域。在靶向核酸的一些实施例中,所述啮齿动物是小鼠或大鼠。
在一些实施例中,本文公开了一种用于产生经基因修饰的啮齿动物细胞的体外方法,所述方法包括将靶向载体引入到啮齿动物细胞中,所述靶向载体包括至少编码人TSLPR蛋白的大部分胞外结构域的人TSLPR核酸序列,所述人TSLPR核酸序列侧接有啮齿动物同源臂,所述啮齿动物同源臂介导所述人TSLPR核苷酸序列整合到内源性啮齿动物Tslpr基因座中,使得啮齿动物Tslpr基因组DNA被所述人TSLP核酸序列置换以形成如本文所描述的人源化Tslpr基因,由此产生经基因修饰的啮齿动物细胞。在一些实施例中,所述啮齿动物细胞是小鼠细胞或大鼠细胞。在一些实施例中,所述啮齿动物细胞是啮齿动物ES细胞,并且所述方法产生经基因修饰的啮齿动物ES细胞。
在一些实施例中,本文公开了一种经基因修饰的啮齿动物,所述啮齿动物在其基因组中包括人源化Il7ra基因,其中所述人源化Il7ra基因包括啮齿动物Il7ra核酸序列和人IL7RA核酸序列,其中所述人源化Il7ra基因编码人源化Il7ra多肽,所述人源化Il7ra多肽包括与人IL7RA蛋白的胞外结构域基本上相同的胞外结构域。
在一些实施例中,所述人源化Il7ra蛋白包括与啮齿动物Il7ra蛋白(例如,内源性啮齿动物Il7ra蛋白)的跨膜细胞质序列基本上相同的跨膜细胞质序列。在一些实施例中,所述人源化Il7ra蛋白包括与啮齿动物Il7ra蛋白(例如,内源性啮齿动物Il7ra蛋白)的跨膜细胞质序列相同的跨膜细胞质序列。
在一些实施例中,所述人源化Il7ra蛋白包括与啮齿动物Il7ra蛋白的信号肽基本上相同的信号肽。在一些实施例中,所述人源化Il7ra蛋白包括与啮齿动物Il7ra蛋白(例如,内源性啮齿动物Il7ra蛋白)的信号肽相同的信号肽。
在一些实施例中,人源化Il7ra基因中的所述人IL7RA核酸序列至少编码所述人IL7RA蛋白的大部分胞外结构域。在一些实施例中,人源化Il7ra基因中的所述人IL7RA核酸序列编码人IL7RA蛋白的氨基酸21-236(例如,如SEQ ID NO:43中所示的人IL7RA蛋白)。在一些实施例中,所述人IL7RA核酸序列包括人IL7RA基因的从编码成熟蛋白的第一氨基酸的外显子1中的密码子至外显子5。
在一些实施例中,人源化Il7ra基因中的所述啮齿动物Il7ra核酸序列包括至少编码啮齿动物Il7ra蛋白(例如,内源性啮齿动物Il7ra蛋白)的大部分跨膜细胞质序列的啮齿动物Il7ra基因的序列。在一些实施例中,所述啮齿动物是小鼠,并且所述啮齿动物Il7ra核酸序列包括小鼠Il7ra基因(例如,内源性小鼠Il7ra基因)的外显子6至外显子8。
在一些实施例中,人源化Il7ra基因中的所述啮齿动物Il7ra核酸序列包括啮齿动物Il7ra基因的编码啮齿动物Il7ra蛋白(例如,内源性啮齿动物Il7ra蛋白)的信号肽的外显子1的一部分。在一些实施例中,所述啮齿动物是小鼠,并且所述啮齿动物核酸序列包括小鼠Il7ra基因(例如,内源性小鼠Il7ra基因)的包括小鼠Il7ra的5'UTR和编码信号肽两者的外显子1的一部分。
在一些实施例中,所述啮齿动物是小鼠,并且所述人源化Il7ra基因包括:(i)小鼠Il7ra基因(例如,内源性小鼠Il7ra基因)的编码小鼠Il7ra蛋白的信号肽的外显子1的一部分;(ii)人IL7RA基因的从编码成熟蛋白的第一氨基酸的密码子开始的外显子1至外显子5;以及(iii)所述小鼠Il7ra基因的外显子6至外显子8。
在一些实施例中,人源化Il7ra基因与如内源性啮齿动物Il7ra启动子等啮齿动物Il7ra启动子可操作地连接。
在一些实施例中,人源化Il7ra基因位于除内源性啮齿动物Il7ra基因座之外的基因座处。在一些实施例中,人源化Il7ra基因位于内源性啮齿动物Il7ra基因座处。
在人源化Il7ra基因位于内源性啮齿动物Il7ra基因座处的实施例中的一些实施例中,所述人源化Il7ra基因是由于位于内源性啮齿动物Il7ra基因座处的啮齿动物Il7ra基因组DNA被人IL7RA核酸置换而形成的。在一些实施例中,人源化Il7ra基因是由于包括至少编码所述内源性啮齿动物Il7ra蛋白的大部分胞外结构域的外显子序列的啮齿动物基因组DNA被至少编码所述人IL7RA蛋白的大部分胞外结构域的所述人IL7RA核酸置换而形成的。在一些实施例中,所述啮齿动物是小鼠,并且其中被置换的小鼠基因组DNA包括内源性小鼠Il7ra基因的从编码成熟蛋白序列的第一氨基酸的外显子1中的密码子至外显子5,并且所述人基因组DNA包括人IL7RA基因的从编码成熟蛋白序列的第一氨基酸的外显子1中的密码子至外显子5。
在一些实施例中,啮齿动物对人源化Il7ra基因是杂合的。在一些实施例中,啮齿动物对人源化Il7ra基因是纯合的。
在一些实施例中,人源化Il7ra多肽在来自人源化Il7ra基因的啮齿动物中表达。
在一些实施例中,啮齿动物在其基因组中进一步包括人源化Tslp基因、人源化Tslpr基因或其组合。
在一些实施例中,所述啮齿动物是小鼠或大鼠。
在一些实施例中,本文公开了一种分离的啮齿动物组织或细胞,其基因组包括本文所描述的人源化Il7ra基因。在一些实施例中,所述啮齿动物细胞是啮齿动物胚胎干细胞。在一些实施例中,所述啮齿动物细胞是卵子或精子。在一些实施例中,分离的啮齿动物组织或细胞是小鼠组织或细胞或大鼠组织或细胞。
在一些实施例中,本文公开了一种啮齿动物胚胎,所述啮齿动物胚胎包括啮齿动物胚胎干细胞,所述啮齿动物胚胎干细胞包括本文所描述的人源化Il7ra基因。
在一些实施例中,本文公开了一种制备经基因修饰的啮齿动物的方法。在一些实施例中,所述方法包括:修饰啮齿动物基因组以包括人源化Il7ra基因,其中所述人源化Il7ra基因包括啮齿动物Il7ra核酸序列和人IL7RA核酸序列,并且编码人源化Il7ra多肽,所述人源化Il7ra多肽包括与人IL7RA蛋白的胞外结构域基本上相同的胞外结构域;以及制备包括经修饰的啮齿动物基因组的啮齿动物。
在一些实施例中,修饰啮齿动物基因组包括以下步骤:将包括人IL7RA核酸序列的核酸分子引入到啮齿动物胚胎干(ES)细胞的基因组中,从而获得啮齿动物ES细胞,其中所述人IL7RA核酸序列已整合到内源性Il7ra基因座中以置换啮齿动物Il7ra基因组DNA,由此形成人源化Il7ra基因;以及从所获得的啮齿动物ES细胞产生啮齿动物。在一些实施例中,所述人IL7RA核酸序列至少编码人IL7RA蛋白的大部分胞外结构域。在一些实施例中,引入到所述ES细胞中的所述核酸分子进一步包括侧接所述人IL7RA核酸序列的5'同源臂和3'同源臂,并且其中所述5'同源臂和所述3'同源臂与侧接待置换的啮齿动物Il7ra基因组DNA的内源性啮齿动物基因座处的核酸序列同源。在一些实施例中,所述人源化Il7ra基因与啮齿动物Il7ra启动子,例如位于所述内源性啮齿动物Il7ra基因座处的内源性啮齿动物Il7ra启动子可操作地连接。
在所述方法的一些实施例中,所述啮齿动物是小鼠或大鼠。
在一些实施例中,本文公开了一种靶向核酸构建体,所述靶向核酸构建体包括将整合到内源性啮齿动物Il7ra基因座处的啮齿动物Il7ra基因中的人IL7RA核酸序列,所述人IL7RA核酸序列侧接有与所述啮齿动物Il7ra基因座处的核苷酸序列同源的5'核苷酸序列和3'核苷酸序列,其中所述人IL7RA核酸序列整合到所述啮齿动物Il7ra基因中使得啮齿动物Il7ra基因组DNA被所述人IL7RA核酸序列置换,由此形成人源化Il7ra基因,并且其中所述人IL7RA核酸序列至少编码人IL7RA蛋白的大部分胞外结构域。在靶向核酸的一些实施例中,所述啮齿动物是小鼠或大鼠。
在一些实施例中,本文公开了一种用于产生经基因修饰的啮齿动物细胞的体外方法,所述方法包括将靶向载体引入到啮齿动物细胞中,所述靶向载体包括至少编码人IL7RA蛋白的大部分胞外结构域的人IL7RA核酸序列,所述人IL7RA核酸序列侧接有啮齿动物同源臂,所述啮齿动物同源臂介导所述人IL7RA核苷酸序列整合到内源性啮齿动物Il7ra基因座中,使得啮齿动物Il7ra基因组DNA被所述人IL7RA核酸序列置换以形成如本文所描述的人源化Il7ra基因,由此产生经基因修饰的啮齿动物细胞。在一些实施例中,所述啮齿动物细胞是小鼠细胞或大鼠细胞。在一些实施例中,所述啮齿动物细胞是啮齿动物ES细胞,并且所述方法产生经基因修饰的啮齿动物ES细胞。
在一些实施例中,本文公开的啮齿动物在其基因组中包括一种或多种另外的基因修饰,如人源化Sirpα基因、内源性RAG2基因的破坏、内源性IL-2RG基因的破坏、人源化Tpo基因和人源化GM-CSF/IL-3基因座。啮齿动物对任何此类另外的基因修饰可以是杂合的或纯合的。
在一些实施例中,本文公开的啮齿动物在其基因组中包括人源化Tslp基因和人源化Sirpα基因,并且对RAG2和IL-2RG基因两者是纯合无效的。在一些此类实施例中,啮齿动物在其基因组中进一步包括人源化Tpo基因和/或人源化GM-CSF/IL-3基因座。啮齿动物对人源化基因可以是杂合的或纯合的。
在一些实施例中,本文公开的啮齿动物在其基因组中包括人源化Tslp基因、人源化Tslpr基因和人源化Sirpα基因,并且对RAG2和IL-2RG基因两者是纯合无效的。在一些此类实施例中,啮齿动物在其基因组中进一步包括人源化Tpo基因和/或人源化GM-CSF/IL-3基因座。啮齿动物对人源化基因可以是纯合的或杂合的。
在一些实施例中,本文公开的啮齿动物在其基因组中包括人源化Tslp基因、人源化Tslpr基因、人源化Il7ra基因和人源化Sirpα基因,并且对RAG2和IL-2RG基因两者是纯合无效的。在一些此类实施例中,啮齿动物在其基因组中进一步包括人源化Tpo基因和/或人源化GM-CSF/IL-3基因座。啮齿动物对人源化基因可以是纯合的或杂合的。
在一些实施例中,如本文所公开的包括人源化Tslp基因、人源化Tslpr基因、人源化Il7ra基因或其组合,任选地具有一种或多种另外的基因修饰的经基因修饰的啮齿动物用于制备过敏性疾病(例如,气道或皮肤炎症)或癌症的啮齿动物模型。
在一些实施例中,本文公开了一种测试用于治疗过敏性病状的候选药剂的方法,所述方法包括:诱导本文公开的经基因修饰的啮齿动物的过敏性病状;向所述啮齿动物施用候选药剂;以及确定所述候选药剂是否抑制所述啮齿动物的所述过敏性病状。
在一些实施例中,本文公开了一种测试用于治疗癌症的候选药剂的方法,所述方法包括:将人癌细胞移植到本文公开的经基因修饰的啮齿动物体内;向所述啮齿动物施用候选药剂;以及确定所述候选药剂是否抑制所述啮齿动物体内的癌细胞的生长。在一些实施例中,所述癌症是Th2驱动的癌症,包含例如乳腺癌、肺癌和胰腺癌。
附图说明
本专利或申请的文件含有至少一幅彩色绘制的图。在请求并支付必要的费用后,专利和商标局将提供具有彩图的本专利的副本。
并入本说明书中并且构成本说明书的一部分的附图展示了若干实施例,并且与描述一起展示了所公开的组合物和方法。
图1A描绘了小鼠Tslp基因座人源化的策略的示例性实施例。小鼠Tslp基因和人TSLP基因由水平线表示,其外显子由置于所述线上方的方框表示。从编码氨基酸20的外显子2中的密码子开始至外显子5中的终止密码子的内源性小鼠Tslp基因座处的3486bp的连续小鼠Tslp基因组片段被从编码氨基酸29的人TSLP外显子1中的密码子开始至外显子4中的终止密码子的4100bp的人TSLP基因组片段置换。置换产生了包含小鼠Tslp信号肽和人成熟TSLP多肽的小鼠-人杂交体(“人源化”)Tslp蛋白。还参见图1D和1F。
图1B描绘了用于包括小鼠Tslp基因座的核酸的小鼠TSLP基因座(未按比例)和包括人源化小鼠Tslp基因座的靶向核酸构建体的人源化的策略的示例性实施例,其中小鼠Tslp基因座处的3.49kB的小鼠基因组片段已被包括1.9kb的人基因组片段1(人TLSP的从编码氨基酸29的外显子1中的密码子至外显子3的3'末端后的257bp)、4.4kb的Floxed HUb-Puro盒(插入人TLSP内含子3)和2.2kb的人基因组片段2(人TLSP的从外显子3的末端后的258bp至外显子4中的终止密码子)的人源化片段置换。靶向构建体中的人源化片段侧接有114.3kb的小鼠5'同源臂和65.3kb的小鼠3'同源臂。包括人源化小鼠Tslp基因座的靶向核酸构建体可以被引入到小鼠胚胎干细胞中,用于靶向插入到小鼠基因组中的小鼠Tslp基因中。还指示了用于等位基因的人获得和等位基因的小鼠丢失测定以确认正确靶向的引物和探针的位置。引物和探针的序列如表6所示。
图1C描绘了用包括人基因组片段1、Floxed HUb-Puro盒和人基因组片段2的人源化片段置换上文针对图1B所描述的小鼠Tslp基因组片段而产生的、被指定为MAID#7466的人源性Tslp等位基因的小鼠TSLP等位基因(不按比例)的人源化的策略的示例性实施例。在去除Floxed HUb-Puro盒之后,人源化Tslp等位基因被指定为MAID#7467。
图1D示出了小鼠Tslp(SEQ ID NO:1)、人TSLP同种型1(SEQ ID NO:3)(粗体斜体)和人源化(杂交体)Tslp(SEQ ID NO:5)(人部分为粗体斜体)的蛋白序列的示例性实施例。信号肽在每个蛋白序列中带有下划线。
图1E示出了小鼠Tslp(SEQ ID NO:2)、人TSLP同种型1(SEQ ID NO:4)(粗体斜体)和人源化(杂交体)Tslp(SEQ ID NO:6)(人部分为粗体斜体)的mRNA序列的示例性实施例。编码信号肽的部分在每个mRNA中带有划线。
图1F示出了小鼠Tslp(“mTslp”,SEQ ID NO:1),人TSLP同种型1(“hTSLP”,SEQ IDNO:3)和人源化(杂交体)Tslp(SEQ ID NO:5)蛋白序列的示例性实施例的比对。蛋白的信号肽加方框。小鼠与人序列之间在形成人源化(杂交体)Tslp蛋白中的接合点由分子的5'(N末端)和3'(C末端)处的箭头指示。三角形表示人内含子3(2429bp)的位置,其中插入了FloxedHUb-Puro盒。
图1G示出了在示例性实施例中,对如实例1中所描述的Tslp人源化杂合的小鼠在小鼠血清中表达成熟人TSLP蛋白(中间),其中未进行Tslp人源化的小鼠作为阴性对照(左)并且正常人血清作为阳性对照(右)。每个点表示一只小鼠。
图2A描绘了小鼠Tslpr基因座人源化的策略的示例性实施例。小鼠Tslpr基因和人TSLPR基因由水平线表示,其外显子由置于所述线上方的方框表示。从外显子2前328bp处的内含子1开始并在外显子6中的第47个bp处结束的内源性小鼠Tslpr基因座处的2362bp的连续小鼠Tslpr基因组片段被从外显子2前909bp处的内含子1开始并在外显子6中的第47个bp处结束的13743bp的人TSLPR基因组片段置换。置换使得小鼠Tslpr的氨基酸27至243缺失,但保留了小鼠Tslpr信号肽(氨基酸1-19)、小鼠Tslpr成熟蛋白的前7个氨基酸和小鼠Tslpr跨膜结构域(氨基酸244-264)和细胞内结构域,并插入了大部分人TSLPR胞外结构域(从氨基酸27开始,并在氨基酸231处结束,正好在氨基酸232-252的人跨膜结构域之前)。还参见图2D。
图2B描绘了用于包括小鼠Tslpr基因座的核酸的小鼠Tslpr基因座(未按比例)和包括人源化小鼠Tslpr基因座的靶向核酸构建体的人源化的策略的示例性实施例,其中小鼠Tslpr基因座处的2.36kB的小鼠基因组片段已被包括4.8kb的Floxed HUb-Neo盒和13.7kb的人基因组片段(包括人TSLPR的外显子6中的内含子1的3'部分、外显子2至第47个bp)的人源化片段置换。靶向构建体中的人源化片段侧接有29.1kb的小鼠5'同源臂(在小鼠Tslpr的外显子2之前高达328bp)和133.2kb的小鼠3'同源臂(从小鼠Tslpr的外显子6至外显子8中的第48个bp,随后是小鼠3'基因组序列)。包括人源化小鼠Tslpr基因座的靶向核酸构建体可以被引入到小鼠胚胎干细胞中,用于靶向插入到小鼠基因组中。还指示了用于等位基因的人获得和等位基因的小鼠丢失测定以确认正确靶向的引物和探针的位置。引物和探针的序列如表9所示。
图2C描绘了用包括4.8kb的Floxed HUb-Neo盒和13743bp的人TSLPR基因组片段的人源化片段置换上文针对图2B所描述的小鼠Tslp基因组片段而产生的、被指定为MAID#7558的人源性Tslpr等位基因的小鼠TSLP等位基因(不按比例)的人源化的策略的示例性实施例。在去除Floxed HUb-Neo盒之后,人源化Tslpr等位基因被指定为MAID#7559。
图2D示出了小鼠Tslpr(SEQ ID NO:21)、人TSLPR(SEQ ID NO:23)(粗体斜体)和人源化(杂交体)Tslpr(SEQ ID NO:25)(人部分为粗体斜体)的蛋白序列的示例性实施例。信号肽(“SP”)和跨膜区段(“TM”)在每个蛋白序列中带有下划线。
图2E示出了小鼠Tslpr(SEQ ID NO:22)、人TSLPR(SEQ ID NO:24)(粗体斜体)和人源化(杂交体)Tslpr(SEQ ID NO:26)(人部分为粗体斜体)的mRNA序列的示例性实施例。编码信号肽和跨膜区段的部分分别在每个mRNA中带有下划线。
图2F示出了小鼠Tslpr(“mTslpr”,SEQ ID NO:21)、人TSLPR(“hTSLPR”,SEQ IDNO:23)和人源化(杂交体)Tslpr(SEQ ID NO:25)蛋白序列的示例性实施例的比对。蛋白的信号肽用虚线加方框。跨膜结构域用实线加方框。小鼠与人序列之间在形成人源化(杂交体)Tslpr中的接合点由分子的5'(内含子1中)和3'(外显子6中)处的三角形指示。
图3A描绘了小鼠Il7ra基因座人源化的策略的示例性实施例。小鼠Il7ra基因和人IL7RA基因由水平线表示,其外显子由置于所述线上方的方框表示。从外显子1的编码序列中的第69个bp开始至内含子5的5'部分的内源性小鼠Il7ra基因座处的19235bp的连续小鼠Il7ra基因组片段被包含从外显子1的编码序列中的第69个bp至内含子5的5'部分的17232bp的人IL7RA基因组片段置换。置换产生包含小鼠IL7ra信号肽的小鼠-人杂交体(“人源化”)Tslp蛋白、基本上是人的胞外结构域(除了最后两个氨基酸Gly-Trp)以及小鼠Il7ra的跨膜和细胞内结构域。还参见图3D。
图3B描绘了用于包括小鼠IL7ra基因座的核酸的小鼠IL7ra基因座(未按比例)和包括人源化小鼠IL7ra基因座的靶向核酸构建体的人源化的策略的示例性实施例,其中小鼠IL7ra基因座处的19.2kB的小鼠基因组片段已被包括126bp的人基因组片段1(包含人IL7RA的外显子1中的最后14个bp和内含子1中的第一个112bp)、5.2kb的Floxed HUb-Hyg盒(插入人IL7RA内含子1)和17106bp的人基因组片段2(包含人IL7RA的内含子1的3'部分、外显子2至外显子5和内含子5的5'部分)的人源化片段置换。靶向构建体中的人源化片段侧接有48.8kb的小鼠5'同源臂和124.3kb的小鼠3'同源臂。包括人源化小鼠Il7ra基因座的靶向核酸构建体可以被引入到小鼠胚胎干细胞中,用于靶向插入到小鼠基因组中。还指示了用于等位基因的人获得和等位基因的小鼠丢失测定以确认正确靶向的引物和探针的位置。引物和探针的序列如表12所示。
图3C描绘了用包括人基因组片段1(126bp)、Floxed HUb-Hyg盒和人基因组片段2(17106bp)的人源化片段置换上文针对图3B所描述的小鼠IL7ra基因组片段而产生的、被指定为MAID#7266的人源性Il7ra等位基因的小鼠Il7ra等位基因(不按比例)的人源化的策略的示例性实施例。在去除Floxed HUb-hyg盒之后,人源化Il7ra等位基因被指定为MAID#7267。
图3D示出了小鼠Il7ra(SEQ ID NO:41)、人IL7RA(SEQ ID NO:43)(粗体斜体)和人源化(杂交体)Il7ra(SEQ ID NO:45)(人部分为粗体斜体)的蛋白序列。信号肽和跨膜结构域在每个蛋白序列中带有下划线。
图3E示出了小鼠Il7ra(SEQ ID NO:42)、人IL7RA(SEQ ID NO:44)(粗体斜体)和人源化(杂交体)Il7ra(SEQ ID NO:46)(人部分为粗体斜体)的编码序列(CDS)的示例性实施例。用于人源化的人IL7RA序列的部分带有下划线。具有人源的杂合体Il7ra序列的部分也带有下划线。
图3F示出了小鼠Il7ra(SEQ ID NO:41,顶部)和人IL7RA(SEQ ID NO:43,底部)蛋白序列的示例性实施例的比对。指示了信号肽和蛋白的跨膜片段(在方框中)。小鼠与人序列之间在形成图3A-3E中所描述的人源化(杂交体)Il7ra中的接合点由N末端处的竖直线(“5'接合点”)和胞外结构域的C末端附近的线(“3'接合点”)指示。突出显示了涉及人源化的胞外结构域的氨基酸(在5'接合点之后立即从氨基酸开始并且在3'接合点处结束)。三角形表示编码序列中的外显子的接合点。
图4A-4E。小鼠在第0天和第14天对盐水和明矾(仅明矾)或卵清蛋白和明矾(Ova-明矾)腹膜内致敏,随后在第21天至第24天用Ova连续4次鼻内激发。在第25天,收集肺组织和血清用于进一步分析。4A.流式细胞术对肺细胞浸润的评估。肺组织嗜酸性粒细胞的细胞频率被绘制为总活细胞的频率。4B.Muc5ac mRNA表达水平的评估通过实时qPCR测量并相对于β2m(β2-微球蛋白)对照mRNA表达进行表达。血清Ova特异性IgE(4C)和Ova特异性IgG1(4D)的ELISA测定。每个点表示单个小鼠。符号表示与盐水对照相比的统计显著性(*)。4E描绘了实验方案:小鼠在第0天和第14天对盐水和明矾(仅明矾)或卵清蛋白和明矾(Ova-明矾)腹膜内致敏,随后在第21天至第24天用Ova连续4次鼻内激发。在第25天,收集肺组织和血清用于进一步分析4A-4D中示出的参数。
具体实施方式
本文公开了啮齿动物(如但不限于小鼠和大鼠),所述啮齿动物被基因修饰以包括人源化Tslp基因、人源化Tslpr基因、人源化Il7ra基因或其组合。本文公开的啮齿动物可以用作例如但不限于Th2驱动的过敏性疾病的模型,或用作炎性Th2驱动的癌症的模型。提供并且在下文进一步描述了用于制备此类经基因修饰的啮齿动物的组合物和方法以及使用此类经基因修饰的啮齿动物测试用于治疗过敏或癌症的候选治疗剂的方法。
Tslp人源化啮齿动物
胸腺基质淋巴细胞生成(TSLP)是4-螺旋束细胞因子家族的成员和白细胞介素-7(IL-7)的远处旁系同源物。TSLP最初是在小鼠胸腺基质细胞系的培养上清液中发现的,并已被证明是T细胞和B细胞的生长因子。参见例如Tsilingiri等人,《细胞和分子胃肠病学和肝病学(Cell Mol.Gastroenterology&Hepatology)》2017;3:174-182,所述文献通过引用以其整体并入本文。表达TSLP的细胞包含上皮细胞、角质细胞、成纤维细胞、基质细胞、树突状细胞、肥大细胞和嗜碱性粒细胞。参见Tsilingiri等人(2017),同上所描述的。在人体内存在两种TSLP同种型:长TSLP同种型(同种型1),其在稳定状态下以低/不可检测的水平表达,并在一些组织的炎症中上调并且是多种Th2相关疾病(例如但不限于特应性皮炎、哮喘、过敏性应答和某些类型的癌症)中Th2应答加剧的标志;以及短TSLP同种型(同种型2),其由单独的启动子组成型表达并在肠道和胸腺中介导某些免疫稳态功能。参见Tsilingiri等人(2017),同上所描述的。除非特别指出,否则人TSLP基因的外显子编号基于编码长同种型(人TSLP蛋白同种型1)的外显子。
序列表中公开了示例性序列,包含人TSLP同种型1、小鼠Tslp、大鼠Tslp和人源化Tslp的核酸和蛋白序列,并总结于表1中。小鼠和大鼠Tslp基因具有小的编码外显子1和总共5个外显子,而不是像人TSLP基因中的4个外显子。图1F中提供了人TSLP同种型1、小鼠Tslp和人源化(杂交体)Tslp蛋白序列的比对。
表1
在一些实施例中,本文公开的啮齿动物包括种系中的人源化Tslp基因。
在一些实施例中,本文公开的啮齿动物包括在其基因组中包含啮齿动物Tslp基因的核苷酸序列和人TSLP基因的核苷酸序列的人源化Tslp基因。如本文所使用的,“基因的核苷酸序列”包含基因的基因组序列、mRNA或cDNA序列的全部或部分。例如,人TSLP基因的核苷酸序列可以是人TSLP基因的基因组序列、mRNA序列或cDNA序列的全部或部分;并且啮齿动物Tslp基因的核苷酸序列可以是啮齿动物Tslp基因(例如,内源性啮齿动物Tslp基因)的基因组序列、mRNA序列或cDNA序列的全部或部分。啮齿动物Tslp基因的核苷酸序列和人TSLP基因的核苷酸序列可操作地彼此连接,使得啮齿动物基因组中的人源化Tslp基因编码执行Tslp蛋白的功能,例如与Tslp受体(Tslpr)结合的人源化Tslp蛋白。
如本文所使用的“人TSLP”基因和蛋白是指人来源的TSLP基因和蛋白。
在一些实施例中,人TSLP蛋白包括SEQ ID NO:3的氨基酸序列。在一些实施例中,人TSLP蛋白包括与SEQ ID NO:3的氨基酸序列至少95%相同的氨基酸序列。在一些实施例中,人TSLP蛋白包括与SEQ ID NO:3的氨基酸序列至少98%相同的氨基酸序列。在一些实施例中,人TSLP蛋白包括与SEQ ID NO:3的氨基酸序列至少99%相同的氨基酸序列。
如本文所使用的“啮齿动物Tslp”基因和蛋白是指啮齿动物(例如,小鼠或大鼠)来源的Tslp基因和蛋白。
在一些实施例中,小鼠Tslp蛋白包括
SEQ ID NO:1的氨基酸序列。在一些实施例中,小鼠Tslp蛋白包括与SEQ ID NO:1的氨基酸序列至少95%相同的氨基酸序列。在一些
实施例中,小鼠Tslp蛋白包括
与SEQ ID NO:1的氨基酸序列至少98%相同的氨基酸序列。在一些实施例中,小鼠Tslp蛋白包括与SEQ ID NO:1的氨基酸序列至少99%相同的氨基酸序列。
在一些实施例中,大鼠Tslp蛋白包括SEQ ID NO:7的氨基酸序列。在一些实施例中,大鼠Tslp蛋白包括与SEQ ID NO:7的氨基酸序列至少95%相同的氨基酸序列。在一些实施例中,大鼠Tslp蛋白包括与SEQ ID NO:7的氨基酸序列至少98%相同的氨基酸序列。在一些实施例中,大鼠Tslp蛋白包括与SEQ ID NO:7的氨基酸序列至少99%相同的氨基酸序列。
在一些实施例中,经基因修饰的啮齿动物包括在其基因组中的人源化Tslp基因,其中人源化Tslp基因编码人源化Tslp蛋白,所述人源化Tslp蛋白包括与人TSLP蛋白(如SEQID NO:3中所示的人TSLP蛋白)的成熟蛋白序列基本上相同的成熟蛋白序列。
“成熟蛋白”是指在N末端信号肽已被切割之后的蛋白的部分。
与人TSLP蛋白的成熟蛋白序列基本上相同的成熟蛋白序列可以是(i)与人TSLP蛋白的成熟蛋白至少95%相同的多肽序列、与人TSLP蛋白的成熟蛋白至少98%相同的多肽序列或与人TSLP蛋白的成熟蛋白至少99%相同的多肽序列。与人TSLP蛋白的成熟蛋白序列基本上相同的成熟蛋白序列可以是与人TSLP蛋白的成熟蛋白序列相同的多肽序列。与人TSLP蛋白的成熟蛋白序列基本上相同的成熟蛋白序列可以可替代地或另外地是(ii)与人TSLP蛋白的成熟蛋白序列相差不超过5个氨基酸的多肽序列、与人TSLP蛋白的成熟蛋白序列相差不超过4个氨基酸的多肽序列、与人TSLP蛋白的成熟蛋白序列相差不超过3个氨基酸的多肽序列、与人TSLP蛋白的成熟蛋白序列相差不超过2个氨基酸的多肽序列或与人TSLP蛋白的成熟蛋白序列相差不超过1个氨基酸的多肽序列。与人TSLP蛋白的成熟蛋白序列基本上相同的成熟蛋白序列可以可替代地或另外地是(iii)仅在结构域的N或C末端部分处不同于人TSLP蛋白的成熟蛋白序列的多肽,例如通过在成熟蛋白的N或C末端部分处添加、缺失或取代氨基酸(不超过5个氨基酸);“成熟蛋白的N或C末端部分”意指从成熟蛋白的N或C末端开始5-10个氨基酸内。与人TSLP蛋白的成熟蛋白序列基本上相同的成熟蛋白序列可以可替代地或另外地是(iv)具有上文(i)-(iii)中所描述的一种或多种特征的多肽,例如,与人TSLP蛋白的成熟蛋白至少95%相同并且仅在结构域的N或C末端部分处与人TSLP蛋白的成熟蛋白序列相差不超过5个氨基酸的多肽或与人TSLP蛋白的成熟蛋白至少98%相同并且仅在结构域的N或C末端部分处与人TSLP蛋白的成熟蛋白序列相差不超过3个氨基酸的多肽。
在一些实施例中,人TSLP蛋白是如SEQ ID NO:3中所示的人TSLP蛋白同种型1,其中氨基酸29-159构成成熟蛋白序列。因此,在一些实施例中,经基因修饰的啮齿动物包括在其基因组中的人源化Tslp基因,所述人源化Tslp基因编码人源化Tslp蛋白,所述人源化Tslp蛋白包括与如SEQ ID NO:3的氨基酸29-159中所示的氨基酸序列基本上相同的成熟蛋白序列。在一些实施例中,人源化Tslp蛋白包括包含SEQ ID NO:3的氨基酸29-159的成熟蛋白序列。在一些实施例中,人源化Tslp蛋白包括包含SEQ ID NO:3的氨基酸30-159的成熟蛋白序列。在一些实施例中,人源化Tslp蛋白包括包含SEQ ID NO:3的氨基酸31-159的成熟蛋白序列。在一些实施例中,人源化Tslp蛋白包括包含SEQ ID NO:3的氨基酸32-159的成熟蛋白序列。在一些实施例中,人源化Tslp蛋白包括包含SEQ ID NO:3的氨基酸29-158的成熟蛋白序列。在一些实施例中,人源化Tslp蛋白包括包含SEQ ID NO:3的氨基酸29-157的成熟蛋白序列。在一些实施例中,人源化Tslp蛋白包括包含SEQ ID NO:3的氨基酸29-156的成熟蛋白序列。在一些实施例中,人源化Tslp蛋白包括如SEQ ID NO:3的氨基酸29-159中所示的成熟蛋白序列。
在一些实施例中,所述人源化Tslp基因编码人源化Tslp蛋白,所述人源化Tslp蛋白包括与人TSLP蛋白的信号肽基本上相同的信号肽。在一些实施例中,与人TSLP蛋白的信号肽基本上相同的信号肽是与人TSLP蛋白的信号肽序列至少95%相同的信号肽。与人TSLP蛋白的信号肽基本上相同的信号肽可以是与人TSLP蛋白的信号肽相同的信号肽。另外地或可替代地,与人TSLP蛋白的信号肽基本上相同的信号肽可以是与人TSLP蛋白的信号肽相差不超过3个氨基酸、不超过2个氨基酸或不超过1个氨基酸的信号肽。在具体实施例中,人TSLP蛋白的信号肽包括如SEQ ID NO:3的氨基酸1-28中所示的氨基酸序列。
在一些实施例中,所述人源化Tslp基因编码人源化Tslp蛋白,所述人源化Tslp蛋白包括与如内源性啮齿动物Tslp蛋白等啮齿动物Tslp蛋白的信号肽基本上相同的信号肽。在一些实施例中,与啮齿动物Tslp蛋白的信号肽基本上相同的信号肽是与啮齿动物Tslp蛋白的信号肽在序列上至少95%相同的信号肽;在一些实施例中,与啮齿动物Tslp蛋白的信号肽基本上相同的信号肽是与啮齿动物Tslp蛋白的信号肽在序列上相同的信号肽。在一些实施例中,与啮齿动物Tslp蛋白的信号肽基本上相同的信号肽是与啮齿动物Tslp蛋白蛋白的信号肽相差不超过3个氨基酸的信号肽;在一些实施例中,与啮齿动物Tslp蛋白的信号肽基本上相同的信号肽是与啮齿动物Tslp蛋白蛋白的信号肽相差不超过2个氨基酸的信号肽;在一些实施例中,与啮齿动物Tslp蛋白的信号肽基本上相同的信号肽是与啮齿动物Tslp蛋白蛋白的信号肽相差不超过1个氨基酸的信号肽。在具体实施例中,人源化Tslp蛋白包括与小鼠Tslp蛋白的信号肽,例如SEQ ID NO:1的氨基酸1-19中所示的信号肽基本上相同的信号肽。在具体实施例中,人源化Tslp蛋白包括与大鼠Tslp蛋白,例如SEQ ID NO:7中所示的大鼠Tslp蛋白的信号肽基本上相同的信号肽。
如上文所描述的,经基因修饰的啮齿动物的基因组中的人源化Tslp基因包含人TSLP基因的核苷酸序列(“人TSLP核苷酸序列”)和啮齿动物Tslp基因的核苷酸序列(“啮齿动物Tslp核苷酸序列”,例如,内源性啮齿动物Tslp核苷酸序列)。
在一些实施例中,人源化Tslp基因中的人TSLP核苷酸序列至少编码人TSLP蛋白(例如,人TSLP蛋白同种型1)的大部分成熟蛋白序列。成熟Tslp蛋白序列的“大部分”是指接近成熟蛋白序列的全长的多肽。在一些实施例中,大部分成熟蛋白序列是指全长成熟蛋白序列的至少95%的多肽;在一些实施例中,大部分成熟蛋白序列是指全长成熟蛋白序列的至少98%的多肽;在一些实施例中,大部分成熟蛋白序列是指全长成熟蛋白序列的至少99%的多肽。在一些实施例中,大部分成熟蛋白序列是指与成熟蛋白序列的不同之处在于在成熟蛋白序列的N或C末端处缺少不超过5个氨基酸的多肽;在一些实施例中,大部分成熟蛋白序列是指与成熟蛋白序列的不同之处在于在成熟蛋白序列的N或C末端处缺少不超过4个氨基酸的多肽;在一些实施例中,大部分成熟蛋白序列是指与成熟蛋白序列的不同之处在于在成熟蛋白序列的N或C末端处缺少不超过3个氨基酸的多肽;大部分成熟蛋白序列是指与成熟蛋白序列的不同之处在于在成熟蛋白序列的N或C末端处缺少不超过2个氨基酸的多肽;大部分成熟蛋白序列是指与成熟蛋白序列的不同之处在于在成熟蛋白序列的N或C末端处缺少不超过1个氨基酸的多肽。在一些实施例中,人源化Tslp基因中的人TSLP核苷酸序列编码人TSLP蛋白(例如,人TSLP蛋白同种型1,如SEQ ID NO:3中所示的人TSLP蛋白同种型1)的成熟蛋白序列。在一些实施例中,人源化Tslp基因中的所述人TSLP核苷酸序列编码SEQID NO:3的氨基酸29-159。在一些实施例中,人源化Tslp基因中的所述人TSLP核苷酸序列编码SEQ ID NO:3的氨基酸30-159。在一些实施例中,人源化Tslp基因中的所述人TSLP核苷酸序列编码SEQ ID NO:3的氨基酸31-159。在一些实施例中,人源化Tslp基因中的所述人TSLP核苷酸序列编码SEQ ID NO:3的氨基酸32-159。在一些实施例中,人源化Tslp基因中的所述人TSLP核苷酸序列编码SEQ ID NO:3的氨基酸29-158。在一些实施例中,人源化Tslp基因中的所述人TSLP核苷酸序列编码SEQ ID NO:3的氨基酸29-157。在一些实施例中,人源化Tslp基因中的所述人TSLP核苷酸序列编码SEQ ID NO:3的氨基酸29-156。
在一些实施例中,人源化Tslp基因中的人TSLP核苷酸序列是cDNA序列。在一些实施例中,人TSLP核苷酸序列是人TSLP基因的基因组片段。在一些实施例中,人TSLP核苷酸序列是包括至少编码人TSLP蛋白的大部分成熟蛋白序列的外显子序列的基因组片段。在一些实施例中,人TSLP核苷酸序列是包括编码人TSLP蛋白(例如,人TSLP蛋白同种型1,如SEQ IDNO:3中所示的人TSLP蛋白同种型1)的成熟蛋白序列的外显子序列的基因组片段。在一些实施例中,人TSLP核苷酸序列是人TSLP基因的基因组片段,所述片段包括外显子1、外显子2、外显子3的成熟蛋白氨基酸编码部分和外显子4的编码部分(即,至外显子4中的终止密码子)。
在一些实施例中,人TSLP核苷酸序列是人TSLP基因的基因组片段,所述片段还包括人TSLP基因的3'UTR(人TSLP外显子4的3'部分)。
在一些实施例中,人源化Tslp基因中的所述啮齿动物Tslp核苷酸序列编码与啮齿动物Tslp蛋白(例如,内源性啮齿动物Tslp蛋白)的所述信号肽基本上相同的多肽。在一些实施例中,与啮齿动物Tslp蛋白的信号肽基本上相同的多肽包含与啮齿动物Tslp蛋白的信号肽在序列上至少95%相同的多肽。在一些实施例中,与啮齿动物Tslp蛋白的信号肽基本上相同的多肽包含与啮齿动物Tslp蛋白蛋白的信号肽相差不超过3个氨基酸的多肽。在一些实施例中,与啮齿动物Tslp蛋白的信号肽基本上相同的多肽包含与啮齿动物Tslp蛋白蛋白的信号肽相差不超过2个氨基酸的多肽。在一些实施例中,与啮齿动物Tslp蛋白的信号肽基本上相同的多肽包含与啮齿动物Tslp蛋白蛋白的信号肽相差不超过1个氨基酸的多肽。在一些实施例中,人源化Tslp基因中的啮齿动物Tslp核苷酸序列编码啮齿动物Tslp蛋白(例如,内源性啮齿动物Tslp蛋白,例如,小鼠或大鼠Tslp蛋白)的信号肽。在一些实施例中,啮齿动物Tslp核苷酸序列包括编码啮齿动物Tslp蛋白的信号肽的啮齿动物Tslp基因的外显子序列。在一些实施例中,啮齿动物Tslp核苷酸序列是小鼠Tslp核苷酸序列,并且在一些此类实施例中,小鼠Tslp核苷酸序列包括小鼠Tslp基因(例如,内源性小鼠Tslp基因)的外显子1和外显子2的信号肽氨基酸编码部分。在一些实施例中,人源化Tslp基因中的啮齿动物Tslp核苷酸序列包括啮齿动物Tslp基因(例如,小鼠或大鼠Tslp基因,如内源性小鼠或大鼠Tslp基因)的5'UTR。
在一些实施例中,人源化Tslp基因与啮齿动物Tslp调控序列,例如,5'转录调控序列,如啮齿动物Tslp基因的启动子和/或增强子,如位于内源性啮齿动物Tslp基因座处的内源性啮齿动物5'转录调控序列可操作地连接,使得人源化Tslp基因的表达在啮齿动物Tslp5'调控序列的控制下。
在一些实施例中,人源化Tslp基因位于内源性啮齿动物Tslp基因座处。在一些实施例中,人源化Tslp基因位于除内源性啮齿动物Tslp基因座之外的基因座处;例如,由于随机整合。在人源化Tslp基因位于除内源性啮齿动物Tslp基因座之外的基因座处的一些实施例中,所述啮齿动物不能表达啮齿动物Tslp蛋白,例如,由于内源性啮齿动物Tslp基因的失活(例如,全部或部分缺失)。
在人源化Tslp基因位于内源性啮齿动物Tslp基因座处的一些实施例中,人源化Tslp基因可能是由于位于内源性啮齿动物Tslp基因座处的内源性啮齿动物Tslp基因的核苷酸序列被人TSLP基因的核苷酸序列置换而产生的。
在一些实施例中,置换位于内源性啮齿动物Tslp基因座处的啮齿动物Tslp基因的基因组片段的人TSLP基因的核苷酸序列是cDNA序列。在一些实施例中,置换位于内源性啮齿动物Tslp基因座处的啮齿动物Tslp基因的基因组片段的人TSLP核苷酸序列是人TSLP基因的基因组片段。在一些实施例中,人TSLP核苷酸序列至少编码人TSLP蛋白的大部分成熟蛋白序列。在一些实施例中,人TSLP核苷酸序列是包含包含至少编码人TSLP蛋白的大部分成熟蛋白序列的人TSLP基因的全部或部分中的外显子的人TSLP基因的基因组片段。在一些实施例中,人基因组片段包括人TSLP基因外显子1、外显子2、外显子3的成熟蛋白氨基酸编码部分和外显子4的编码部分。在一些实施例中,人基因组片段可以进一步包括人TSLP基因的外显子4的3'UTR部分。
在一些实施例中,整合在内源性啮齿动物Tslp基因座处的人核苷酸序列与编码与啮齿动物Tslp蛋白的信号肽基本上相同的多肽的啮齿动物Tslp核苷酸序列可操作地连接。在一些实施例中,整合在内源性啮齿动物Tslp基因座处的人核苷酸序列与基本上编码内源性啮齿动物Tslp蛋白的信号肽的内源性啮齿动物Tslp基因组序列可操作地连接。在一些实施例中,人核苷酸序列整合在内源性小鼠Tslp基因座处并与编码与小鼠Tslp蛋白的信号肽基本上相同的多肽的小鼠Tslp核苷酸序列可操作地连接;并且在一些此类实施例中,小鼠Tslp核苷酸序列包括小鼠Tslp基因(例如,内源性小鼠Tslp基因)的外显子1和外显子2的信号肽氨基酸编码部分。
在一些实施例中,包括编码位于内源性啮齿动物Tslp基因座处的内源性啮齿动物Tslp蛋白的成熟蛋白序列的外显子序列的基因组片段(例如,从编码成熟小鼠Tslp蛋白的第一氨基酸的外显子2中的密码子开始至终止密码子的小鼠基因组片段)已经被包括编码人TSLP蛋白的成熟蛋白序列的外显子序列的人TSLP基因的基因组片段(例如,从编码成熟人TSLP蛋白的第一氨基酸的外显子1中的密码子开始至外显子4中终止密码子的基因组片段)置换。因此,人源化Tslp基因在内源性啮齿动物Tslp基因座处形成。在一些实施例中,人源化Tslp基因在内源性小鼠Tslp基因座处形成并包括小鼠Tslp外显子1、小鼠Tslp外显子2的信号肽氨基酸编码部分、编码成熟人TSLP蛋白的第一氨基酸的人TSLP外显子1中的密码子至人TSLP外显子4中的终止密码子和小鼠Tslp外显子5中的小鼠3'UTR。此类人源化Tslp基因编码包括小鼠Tslp信号肽和成熟人TSLP多肽的人源化Tslp蛋白。
在一些实施例中,本文提供的啮齿动物对其基因组中的人源化Tslp基因是杂合的。在一些实施例中,本文提供的啮齿动物对其基因组中的人源化Tslp基因是纯合的。
在一些实施例中,人源化Tslp基因使经编码的人源化Tslp蛋白在啮齿动物中,例如在啮齿动物的血清中表达。在一些实施例中,人源化Tslp蛋白在细胞和组织中表达,其中对应的啮齿动物Tslp蛋白在对照啮齿动物(例如,没有人源化Tslp基因的啮齿动物)中表达;例如皮肤、肠、肺和眼组织中的上皮细胞和角质细胞,以及树突状细胞、肥大细胞和嗜碱性粒细胞。参见例如Tsilingiri等人(2017),同上所描述的。
在一些实施例中,本文公开的啮齿动物例如由于内源性啮齿动物Tslp基因的失活(例如,全部或部分缺失)或置换(全部或部分)而不能表达啮齿动物Tslp蛋白。
TSLPR人源化
TSLP通过异源二聚体发挥作用,所述异源二聚体由对TSLP(被称为“TSLPR”或“Tslpr”)具有特异性的链和IL7受体α链组成。TSLPR含有信号肽、细胞外结构域(“ECD”或“胞外结构域”)、跨膜结构域和细胞内(细胞质)结构域。
序列表中公开了示例性序列,包含人TSLPR同种型1、小鼠Tslpr同种型1、大鼠Tslpr同种型1和人源化(小鼠-人杂交体)Tslpr的核酸和蛋白序列,并总结于表2中。图2F中提供了人TSLPR同种型1、小鼠Tslpr同种型1和人源化(小鼠-人杂交体)Tslpr蛋白序列的比对。除非特别指出,否则人和小鼠基因的外显子编号基于编码人和小鼠蛋白同种型1的外显子。
表2
在一些实施例中,本文公开的啮齿动物包括种系中的人源化Tslpr基因。
在一些实施例中,本文公开的啮齿动物包括在其基因组中包含啮齿动物Tslpr基因(例如,内源性啮齿动物Tslpr基因)的核苷酸序列和人TSLPR基因的核苷酸序列的人源化Tslpr基因。如本文所使用的,“基因的核苷酸序列”包含基因的基因组序列、mRNA或cDNA序列的全部或部分。作为非限制性实例,人TSLPR基因的核苷酸序列包含人TSLPR基因的基因组序列、mRNA或cDNA序列的全部或部分。啮齿动物Tslpr基因的核苷酸序列和人TSLPR基因的核苷酸序列可操作地彼此连接,使得啮齿动物基因组中的人源化Tslpr基因编码具有Tslpr蛋白结构(包括胞外结构域、跨膜结构域和细胞质结构域)并执行Tslpr功能(例如,与Tslp蛋白结合并与IL-7受体形成异源二聚体)的人源化Tslpr蛋白。
如本文所使用的“人TSLPR”基因和蛋白是指人来源的TSLPR基因和蛋白。在一些实施例中,人TSLPR蛋白包括SEQ ID NO:23的氨基酸序列。在一些实施例中,人TSLPR蛋白包括与SEQ ID NO:23的氨基酸序列至少95%相同的氨基酸序列。在一些实施例中,人TSLPR蛋白包括与SEQ ID NO:23的氨基酸序列至少98%相同的氨基酸序列。在一些实施例中,人TSLPR蛋白包括与SEQ ID NO:23的氨基酸序列至少99%相同的氨基酸序列。
如本文所使用的“啮齿动物Tslpr”基因和蛋白是指啮齿动物(例如,小鼠或大鼠)来源的Tslpr基因和蛋白。在一些实施例中,小鼠Tslpr蛋白包括SEQ ID NO:21的氨基酸序列。在一些实施例中,小鼠Tslpr蛋白包括与SEQ ID NO:21的氨基酸序列至少95%相同的氨基酸序列。在一些实施例中,小鼠Tslpr蛋白包括与SEQ ID NO:21的氨基酸序列至少98%相同的氨基酸序列。在一些实施例中,小鼠Tslpr蛋白包括与SEQ ID NO:21的氨基酸序列至少99%相同的氨基酸序列。在一些实施例中,大鼠Tslpr蛋白包括SEQ ID NO:27的氨基酸序列。在一些实施例中,大鼠Tslpr蛋白包括与SEQ ID NO:27的氨基酸序列至少95%相同的氨基酸序列。在一些实施例中,大鼠Tslpr蛋白包括与SEQ ID NO:27的氨基酸序列至少98%相同的氨基酸序列。在一些实施例中,大鼠Tslpr蛋白包括与SEQ ID NO:27的氨基酸序列至少99%相同的氨基酸序列。
在一些实施例中,经基因修饰的啮齿动物含有在其基因组中的人源化Tslpr基因,其中人源化Tslpr基因编码人源化Tslpr蛋白,所述人源化Tslpr蛋白含有与人TSLPR蛋白的胞外结构域基本上相同的胞外结构域。在一些实施例中,与人TSLPR蛋白的胞外结构域基本上相同的胞外结构域表现出与人TSLPR蛋白的胞外结构域相同的功能性(例如,配体结合性质)。“与人TSLPR蛋白的胞外结构域基本上相同”的胞外结构域或多肽可以是(i)与人TSLPR蛋白的胞外结构域在序列上至少95%相同的多肽、与人TSLPR蛋白的胞外结构域在序列上至少98%相同的多肽或与人TSLPR蛋白的胞外结构域在序列上至少99%相同的多肽。“与人TSLPR蛋白的胞外结构域基本上相同”的胞外结构域或多肽可以是与人TSLPR蛋白的胞外结构域在序列上100%相同的多肽。可替代地或另外地,“与人TSLPR蛋白的胞外结构域基本上相同”的胞外结构域或多肽可以是(ii)与人TSLPR蛋白的胞外结构域相差不超过10个氨基酸的多肽、与人TSLPR蛋白的胞外结构域相差不超过7个氨基酸的多肽、与人TSLPR蛋白的胞外结构域相差不超过5个氨基酸的多肽、与人TSLPR蛋白的胞外结构域相差不超过4个氨基酸的多肽、与人TSLPR蛋白的胞外结构域相差不超过3个氨基酸的多肽、与人TSLPR蛋白的胞外结构域相差不超过2个氨基酸的多肽、与人TSLPR蛋白的胞外结构域相差不超过1个氨基酸的多肽。可替代地或另外地,“与人TSLPR蛋白的胞外结构域基本上相同”的胞外结构域或多肽可以是(iii)仅在胞外结构域的N或C末端部分处不同于人TSLPR蛋白的胞外结构域的多肽,例如通过在胞外结构域的N和/或C末端部分处添加、缺失和/或取代氨基酸(即,从胞外结构域的N或C末端开始5-10个氨基酸内)。可替代地或另外地,“与人TSLPR蛋白的胞外结构域基本上相同”的胞外结构域或多肽可以是(iv)具有上文(i)-(iii)中所描述的特征中的一种或多种的多肽,例如,与人TSLPR蛋白的胞外结构域在序列上至少95%相同并且仅在胞外结构域的N或C末端部分处与人TSLPR蛋白的胞外结构域相差不超过10个氨基酸的多肽、与人TSLPR蛋白的胞外结构域在序列上至少95%相同并且仅在胞外结构域的N或C末端部分处与人TSLPR蛋白的胞外结构域相差不超过5个氨基酸的多肽或与人TSLPR蛋白的胞外结构域在序列上至少98%相同并且仅在胞外结构域的N或C末端部分处与人TSLPR蛋白的胞外结构域相差不超过3个氨基酸的多肽。在一些实施例中,人TSLPR蛋白包括如SEQ ID NO:23中所示的氨基酸序列,并且其胞外结构域由SEQ ID NO:23的氨基酸23-231组成。在一些实施例中,人源化Tslpr基因编码人源化Tslpr蛋白,其胞外结构域与如SEQ ID NO:23中所示的人TSLPR蛋白的胞外结构域基本上相同,即与SEQ ID NO:23的氨基酸23-231基本上相同。例如,人源化Tslpr基因编码具有包括SEQ ID NO:23的氨基酸23-231、24-231、25-231、26-231、27-231、28-231、23-230、23-229、23-228、23-227或23-226的胞外结构域的人源化Tslpr蛋白。在一些实施例中,人源化Tslpr基因编码具有包括SEQ ID NO:23的氨基酸23-231的胞外结构域的人源化Tslpr蛋白。在一些实施例中,人源化Tslpr基因编码具有包括SEQ ID NO:23的氨基酸25-231的胞外结构域的人源化Tslpr蛋白。在一些实施例中,人源化Tslpr基因编码具有包括SEQ ID NO:23的氨基酸27-231的胞外结构域的人源化Tslpr蛋白。在一些实施例中,人源化Tslpr基因编码具有包括SEQ ID NO:23的氨基酸23-228的胞外结构域的人源化Tslpr蛋白。在一些实施例中,人源化Tslpr基因编码具有包括SEQ ID NO:23的氨基酸23-226的胞外结构域的人源化Tslpr蛋白。
在一些实施例中,人源化Tslpr基因编码具有胞外结构域的人源化Tslpr蛋白,所述胞外结构域包括来自啮齿动物Tslpr(例如,内源性啮齿动物Tslpr)的胞外结构域的N末端的氨基酸,随后是人TSLPR的胞外结构域或其大部分。人TSLPR(或啮齿动物Tslpr)蛋白的“大部分胞外结构域”是指接近蛋白的全胞外结构域的多肽。在一些实施例中,人TSLPR蛋白的大部分胞外结构域是指人TSLPR蛋白全长胞外结构域的至少95%的多肽。在一些实施例中,人TSLPR蛋白的大部分胞外结构域是指人TSLPR蛋白全长胞外结构域的至少98%的多肽。序列。在一些实施例中,人TSLPR蛋白的大部分胞外结构域是指与全长胞外结构域的不同之处在于在胞外结构域的N或C末端处缺少不超过10个氨基酸的多肽。在一些实施例中,人TSLPR蛋白的大部分胞外结构域是指与全长胞外结构域的不同之处在于在胞外结构域的N或C末端处缺少不超过5个氨基酸的多肽。在一些实施例中,人TSLPR蛋白的大部分胞外结构域是指与全长胞外结构域的不同之处在于在胞外结构域的N或C末端处缺少不超过4个氨基酸的多肽。例如,如SEQ ID NO:23中所示的人TSLPR蛋白的胞外结构域由氨基酸23-231定义,并且大部分胞外结构域的实例可以包含SEQ ID NO:23的氨基酸25-231、26-231、27-231、23-228、23-227或23-226。在一些实施例中,人TSLPR蛋白的大部分胞外结构域包括SEQID NO:23的氨基酸25-231。在一些实施例中,人TSLPR蛋白的大部分胞外结构域包括SEQ IDNO:23的氨基酸27-231。在一些实施例中,人TSLPR蛋白的大部分胞外结构域包括SEQ IDNO:23的氨基酸23-228。在一些实施例中,人TSLPR蛋白的大部分胞外结构域包括SEQ IDNO:23的氨基酸23-226。在一些实施例中,人源化Tslpr蛋白的胞外结构域包括来自啮齿动物Tslpr(例如,内源性啮齿动物Tslpr)的胞外结构域的N末端的6-8个氨基酸,随后是人TSLPR蛋白的大部分胞外结构域。在一些实施例中,人源化Tslpr蛋白的胞外结构域包括来自啮齿动物Tslpr(例如,内源性啮齿动物Tslpr)的胞外结构域的N末端的7个氨基酸,随后是SEQ ID NO:23的氨基酸27-231。在一些实施例中,人源化Tslpr基因编码含有如SEQ IDNO:25的氨基酸20-231中所示的胞外结构域的人源化Tslpr蛋白——该胞外结构域包括来自小鼠Tslpr胞外结构域的N末端的7个氨基酸,随后是SEQ ID NO:23(人Tslpr)的氨基酸27-231;并且在胞外结构域的N末端中不同于SEQ ID NO:23的人TSLPR蛋白的胞外结构域(SEQ ID NO:25的人源化TSLPR中的“AAAVTSR”(SEQ ID NO:67),与SEQ ID NO:23的人TSLPR中的“QGGA”(SEQ ID NO:68)相反),但是在其余的ame 205个氨基酸中与人TSLP胞外结构域相同。
在一些实施例中,人源化Tslpr基因编码人源化Tslpr蛋白,所述人源化Tslpr蛋白含有与啮齿动物Tslpr蛋白,例如内源性啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同的跨膜细胞质序列(即,包含跨膜结构域和细胞质结构域两者的序列)。在一些实施例中,与内源性啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同的跨膜细胞质序列表现出与如内源性啮齿动物Tslpr蛋白等啮齿动物Tslpr蛋白的跨膜细胞质序列相同的功能性(例如,信号转导和/或与细胞内分子的相互作用)。“与啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同”的跨膜细胞质序列或多肽可以是(i)与啮齿动物Tslpr蛋白的跨膜细胞质序列在序列上至少95%相同的多肽或与啮齿动物Tslpr蛋白的跨膜细胞质序列在序列上至少98%相同的多肽。“与啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同”的跨膜细胞质序列或多肽可以是与啮齿动物Tslpr蛋白的跨膜细胞质序列相同的多肽。可替代地或另外地,“与啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同”的跨膜细胞质序列或多肽可以是(ii)与啮齿动物Tslpr蛋白的跨膜细胞质序列相差不超过5个氨基酸的多肽、与啮齿动物Tslpr蛋白的跨膜细胞质序列相差不超过4个氨基酸的多肽、与啮齿动物Tslpr蛋白的跨膜细胞质序列相差不超过3个氨基酸的多肽、与啮齿动物Tslpr蛋白的跨膜细胞质序列相差不超过2个氨基酸的多肽或与啮齿动物Tslpr蛋白的跨膜细胞质序列相差不超过1个氨基酸的多肽。可替代地或另外地,“与啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同”的跨膜细胞质序列或多肽可以是(iii)在一些实施例中,仅在N或C末端处不同于啮齿动物Tslpr蛋白的跨膜细胞质序列的多肽,例如通过在跨膜细胞质序列的N或C末端部分处添加、缺失或取代氨基酸。可替代地或另外地,“与啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同”的跨膜细胞质序列或多肽可以是(iv)具有上文(i)-(iii)中所描述的一种或多种特征的多肽,例如与啮齿动物Tslpr蛋白的跨膜细胞质序列在序列上至少95%相同并且仅在N或C末端处与啮齿动物Tslpr蛋白的跨膜细胞质序列相差不超过5个氨基酸的多肽;或与啮齿动物Tslpr蛋白的跨膜细胞质序列在序列上至少95%相同并且仅在N或C末端处与啮齿动物Tslpr蛋白的跨膜细胞质序列相差不超过3个氨基酸的多肽。“跨膜细胞质序列的N或C末端部分”意指从跨膜结构域的N末端开始5-10个氨基酸内或从细胞质结构域的C末端开始5-10个氨基酸内。在一些实施例中,人源化Tslpr蛋白含有与小鼠Tslpr蛋白(如内源性小鼠Tslpr蛋白)的跨膜细胞质序列基本上相同的跨膜细胞质序列。在一些实施例中,人源化Tslpr蛋白含有与大鼠Tslpr蛋白(如内源性大鼠Tslpr蛋白)的跨膜细胞质序列基本上相同的跨膜细胞质序列。
在一些实施例中,人源化Tslp基因编码人源化Tslpr蛋白,所述人源化Tslpr蛋白含有与啮齿动物Tslpr蛋白(例如,内源性啮齿动物Tslpr蛋白)的信号肽基本上相同的信号肽。“与啮齿动物Tslpr蛋白的信号肽基本上相同”的信号肽可以是(i)与啮齿动物Tslpr蛋白的信号肽在序列上至少95%相同的多肽或与啮齿动物Tslpr蛋白的信号肽在序列上相同的多肽。可替代地或另外地,“与啮齿动物Tslpr蛋白的信号肽基本上相同”的信号肽可以是(ii)与内源性啮齿动物Tslpr蛋白的信号肽相差不超过3个氨基酸的多肽、与内源性啮齿动物Tslpr蛋白的信号肽相差不超过2个氨基酸的多肽或与内源性啮齿动物Tslpr蛋白的信号肽相差不超过1个氨基酸的多肽。可替代地或另外地,“与啮齿动物Tslpr蛋白的信号肽基本上相同”的信号肽可以是仅在N或C末端处不同于内源性啮齿动物Tslpr蛋白的信号肽的多肽,例如通过在信号肽的N或C末端部分处添加、缺失或取代氨基酸。可替代地或另外地,“与啮齿动物Tslpr蛋白的信号肽基本上相同”的信号肽可以是(iv)具有上文(i)-(iii)中所描述的一种或多种特征的多肽,例如与啮齿动物Tslpr蛋白的信号肽至少95%相同并且仅在N或C末端处与啮齿动物Tslpr蛋白的信号肽相差不超过3个氨基酸的多肽。“信号肽的N或C末端部分”意指从信号肽的N或C末端开始5个氨基酸内。在一些实施例中,人源化Tslpr蛋白包含与小鼠Tslpr蛋白(如内源性小鼠Tslpr蛋白)的信号肽基本上相同的信号肽。在一些实施例中,人源化Tslpr蛋白包含与大鼠Tslpr蛋白(如内源性大鼠Tslpr蛋白)的信号肽基本上相同的信号肽。
在一些实施例中,经基因修饰的啮齿动物的基因组中的人源化Tslpr基因包含人TSLPR基因的核苷酸序列(“人TSLPR核苷酸序列”)和啮齿动物Tslpr基因的核苷酸序列(“啮齿动物Tslpr核苷酸序列”,如内源性啮齿动物Tslpr核苷酸序列),其中人TSLPR核苷酸序列至少编码人TSLPR蛋白的大部分胞外结构域。如上文所描述的,人TSLPR的大部分胞外结构域的实例可以包含SEQ ID NO:23的氨基酸25-231、26-231、27-231、23-228、23-227或23-226。在一些实施例中,大部分胞外结构域包括SEQ ID NO:23的氨基酸27-231。在一些实施例中,大部分胞外结构域包括SEQ ID NO:23的氨基酸25-231。在一些实施例中,大部分胞外结构域包括SEQ ID NO:23的氨基酸23-228。在一些实施例中,大部分胞外结构域包括SEQID NO:23的氨基酸23-226。在一些实施例中,人TSLPR核苷酸序列是cDNA序列。在一些实施例中,人源化Tslpr基因中的人TSLPR核苷酸序列编码人TSLPR蛋白(例如,SEQ ID NO:23中定义的人TSLPR蛋白同种型1)的胞外结构域。在一些实施例中,人TSLPR核苷酸序列是人TSLPR基因的基因组片段。在一些实施例中,人TSLPR核苷酸序列是人TSLPR基因的基因组片段,所述人TSLPR基因包括外显子2至编码人TSLPR蛋白的胞外结构域的最后一个氨基酸的外显子6中的密码子。在一些实施例中,人TSLPR基因组片段编码人TSLPR同种型1的氨基酸27-231,缺少人TSLPR同种型1的胞外结构域的N末端处的4个氨基酸。在一些实施例中,人TSLPR基因组片段进一步包括内含子1的3'部分,与外显子2至编码人TSLPR蛋白的胞外结构域的最后一个氨基酸的外显子6中的密码子可操作地连接。
在一些实施例中,经基因修饰的啮齿动物的基因组中的人源化Tslpr基因包含啮齿动物Tslpr核苷酸序列和人TSLPR核苷酸序列,其中啮齿动物Tslpr核苷酸序列编码与啮齿动物Tslpr蛋白(例如,内源性啮齿动物Tslpr蛋白)的跨膜细胞质序列基本上相同的多肽。在一些实施例中,人源化Tslpr基因中存在的啮齿动物Tslpr核苷酸序列编码内源性啮齿动物Tslpr蛋白的跨膜细胞质序列。在一些实施例中,人源化Tslpr基因中存在的啮齿动物Tslpr核苷酸序列是小鼠Tslpr核苷酸序列;并且在一些此类实施例中,小鼠Tslpr核苷酸序列包括小鼠Tslpr基因(例如,内源性小鼠Tslpr基因)的外显子6(从编码小鼠Tslpr跨膜结构域的第一氨基酸的密码子开始)至外显子8的一部分。
在一些实施例中,经基因修饰的啮齿动物的基因组中的人源化Tslpr基因包含人TSLPR核苷酸序列上游(5')的啮齿动物Tslpr核苷酸序列,其中啮齿动物Tslpr核苷酸序列编码与啮齿动物Tslpr蛋白(例如,内源性啮齿动物Tslpr蛋白)的信号肽基本上相同的多肽。在一些实施例中,编码与啮齿动物Tslpr蛋白的信号肽基本上相同的多肽的啮齿动物Tslpr核苷酸序列是小鼠Tslpr核苷酸序列(例如,内源性小鼠Tslpr核苷酸序列)或大鼠Tslpr核苷酸序列(例如,内源性大鼠Tslpr核苷酸序列)。在一些实施例中,啮齿动物Tslpr核苷酸序列编码包括信号肽序列和来自啮齿动物Tslpr蛋白的胞外结构域的N末端的氨基酸(例如,6-8个氨基酸)的多肽。在一些实施例中,啮齿动物Tslpr核苷酸序列编码包括信号肽序列和来自啮齿动物Tslpr蛋白的胞外结构域的N末端的7个氨基酸的多肽。在一些实施例中,啮齿动物Tslpr核苷酸序列是包括小鼠Tslpr基因(例如,内源性小鼠Tslpr基因)的外显子1的小鼠Tslpr核苷酸序列;并且在一些此类实施例中,小鼠Tslpr核苷酸序列进一步包括小鼠Tslpr基因的内含子1的5'部分。
在一些实施例中,人源化Tslpr基因与啮齿动物Tslpr 5'调控序列,如内源性啮齿动物Tslpr调控序列,例如5'转录调控序列,如启动子和/或增强子可操作地连接,使得人源化Tslpr基因的表达在啮齿动物Tslpr 5'调控序列的控制下。
在一些实施例中,人源化Tslpr基因位于内源性啮齿动物Tslpr基因座处。在一些实施例中,人源化Tslpr基因位于除内源性啮齿动物Tslpr基因座之外的基因座处;例如,由于随机整合。在人源化Tslpr基因位于除内源性啮齿动物Tslpr基因座之外的基因座处的一些实施例中,所述啮齿动物不能表达啮齿动物Tslpr蛋白,例如,由于内源性啮齿动物Tslpr基因的失活(例如,全部或部分缺失)。
在人源化Tslpr基因位于内源性啮齿动物Tslpr基因座处的一些实施例中,人源化Tslpr基因是由于内源性啮齿动物Tslpr基因座处的内源性啮齿动物Tslpr基因的核苷酸序列被人TSLPR基因的核苷酸序列置换而产生的。
在一些实施例中,正在被置换的内源性啮齿动物Tslpr基因座处的内源性啮齿动物Tslpr基因的核苷酸序列是内源性啮齿动物Tslpr基因的基因组片段,所述基因组片段至少编码啮齿动物Tslpr蛋白的大部分胞外结构域。在一些实施例中,啮齿动物是小鼠,并且被置换的小鼠Tslpr基因组片段至少编码内源性小鼠Tslpr蛋白的大部分胞外结构域。例如,SEQ ID NO:21的小鼠Tslpr的胞外结构域由氨基酸20-243定义,大部分胞外结构域的实例可以包含SEQ ID NO:21的氨基酸21-243、22-243、23-243、24-243、25-243、26-243、27-243、20-241、20-240、20-239和20-238。在一些实施例中,小鼠Tslpr蛋白的大部分胞外结构域包括SEQ ID:21的氨基酸27-243。在一些实施例中,小鼠Tslpr蛋白的大部分胞外结构域包括SEQ ID:21的氨基酸25-243。在一些实施例中,小鼠Tslpr蛋白的大部分胞外结构域包括SEQ ID:21的氨基酸20-240。在一些实施例中,小鼠Tslpr蛋白的大部分胞外结构域包括SEQ ID:21的氨基酸20-238。在一些实施例中,要置换的小鼠Tslpr基因组片段包括外显子2至编码胞外结构域的最后一个氨基酸的外显子6中的密码子。
在一些实施例中,置换内源性啮齿动物Tslpr基因座处的啮齿动物Tslpr基因的基因组片段的人TSLPR基因的核苷酸序列是cDNA序列。在一些实施例中,置换内源性啮齿动物Tslpr基因座处的啮齿动物Tslpr基因的基因组片段的人TSLPR核苷酸序列是人TSLPR基因的基因组片段。在一些实施例中,置换内源性啮齿动物Tslpr基因座处的啮齿动物Tslpr基因的基因组片段的人TSLPR基因的基因组片段包含人TSLPR基因的外显子的全部或部分,所述外显子至少编码人TSLPR蛋白的大部分胞外结构域。上文已经描述了人TSLPR的大部分胞外结构域的实例,例如SEQ ID NO:23的氨基酸23-231、24-231、25-231、26-231、27-231、28-231、23-230、23-229、23-228、23-227或23-226。在一些实施例中,人TSLPR的大部分胞外结构域包括SEQ ID NO:23的氨基酸25-231。在一些实施例中,人TSLPR的大部分胞外结构域包括SEQ ID NO:23的氨基酸27-231。在一些实施例中,人TSLPR的大部分胞外结构域包括SEQID NO:23的氨基酸23-228。在一些实施例中,人TSLPR的大部分胞外结构域包括SEQ ID NO:23的氨基酸23-226。在一些实施例中,人基因组片段包括人TSLPR外显子2至编码人TSLPR胞外结构域的最后一个氨基酸的外显子6中的密码子。
在一些实施例中,插入到内源性啮齿动物Tslpr基因座中的人TSLPR核苷酸序列与啮齿动物Tslpr基因的基因组序列可操作地连接,所述啮齿动物Tslpr基因编码与啮齿动物Tslpr蛋白(如内源性啮齿动物,例如小鼠或大鼠,Tslpr蛋白)的跨膜细胞质序列基本上相同的多肽。在啮齿动物是小鼠的实施例中,小鼠Tslpr基因的基因组序列在一些实施例中包括小鼠Tslpr基因(例如,内源性小鼠Tslpr基因)的从编码跨膜结构域的第一氨基酸的密码子开始的外显子6至外显子8。
在一些实施例中,插入到内源性啮齿动物Tslpr基因座中的人TSLPR核苷酸序列与啮齿动物Tslpr基因的基因组序列可操作地连接,所述啮齿动物Tslpr基因编码与啮齿动物Tslpr蛋白(如内源性啮齿动物,例如小鼠或大鼠,Tslpr蛋白)的信号肽基本上相同的多肽。在啮齿动物是小鼠的实施例中,小鼠Tslpr基因的基因组序列在一些实施例中包括小鼠Tslpr基因(例如,内源性小鼠Tslpr基因)的外显子1以及任选地内含子1的全部或部分。
在一些实施例中,啮齿动物是小鼠,并且包括外显子2至编码小鼠Tslpr胞外结构域的最后一个氨基酸的外显子6中的密码子的内源性小鼠Tslpr基因座处的内源性小鼠Tslpr基因的基因组片段已被包括外显子2至编码人TSLPR胞外结构域的最后一个氨基酸的外显子6中的密码子的人TSLPR基因的基因组片段置换。在一些实施例中,人源化Tslpr基因在内源性啮齿动物Tslpr基因座处形成并且包括小鼠Tslpr基因的外显子1、外显子2至编码人TSLPR基因的最后一个氨基酸的外显子6中的密码子,以及从编码小鼠Tslpr跨膜结构域的第一氨基酸的密码子开始的外显子6至小鼠Tslpr基因的外显子8。
在一些实施例中,本文提供的啮齿动物对其基因组中的人源化Tslpr基因是杂合的。在一些实施例中,本文提供的啮齿动物对其基因组中的人源化Tslpr基因是纯合的。
在一些实施例中,人源化Tslpr基因使经编码的人源化Tslpr蛋白在啮齿动物中表达。在一些实施例中,人源化Tslpr蛋白在细胞和组织中表达,其中对应的啮齿动物(例如,没有人源化Tslpr基因的啮齿动物)中的对应啮齿动物Tslpr蛋白通常在例如树突状细胞、CD4+T细胞和第2组先天淋巴细胞以及非免疫细胞类型如上皮细胞、内皮细胞和平滑肌细胞上表达。
在一些实施例中,本文公开的啮齿动物例如由于内源性啮齿动物Tslpr基因的失活(例如,全部或部分缺失)或置换(全部或部分)而不能表达啮齿动物Tslpr蛋白。
IL7RA人源化
TSLP通过异源二聚体发挥作用,所述异源二聚体由对TSLP(被称为“TSLPR”或“Tslpr”)具有特异性的链和IL7受体α链组成(“IL7RA”用于人并且“Il7ra”用于非人或人源化分子)。IL7RA含有信号肽、细胞外结构域(“ECD”或“胞外结构域”)、跨膜结构域和细胞内(细胞质)结构域。
序列表中公开了示例性序列,包含人IL7RA、小鼠Il7ra、大鼠Il7ra和人源化(小鼠-人杂交体)Il7ra的核酸和蛋白序列,并总结于表3中。图3F中提供了人IL7RA和小鼠Il7ra蛋白序列的比对。
表3
/>
在一些实施例中,本文公开的啮齿动物包括种系中的人源化Il7ra基因。
在一些实施例中,本文公开的啮齿动物包括在其基因组中包含啮齿动物Il7ra基因(例如,内源性啮齿动物Il7ra基因)的核苷酸序列和人IL7RA基因的核苷酸序列的人源化Il7ra基因。如本文所使用的,“基因的核苷酸序列”包含基因的基因组序列、mRNA或cDNA序列的全部或部分。作为非限制性实例,人IL7RA基因的核苷酸序列包含人IL7RA基因的基因组序列、mRNA或cDNA序列的全部或部分。啮齿动物Il7ra基因的核苷酸序列和人IL7RA基因的核苷酸序列可操作地彼此连接,使得啮齿动物基因组中的人源化Il7ra基因编码具有Il7ra蛋白结构(包括胞外结构域、跨膜结构域和细胞质结构域)并执行Il7ra功能(例如,与Il7蛋白结合并与和Tslp结合的Tslpr形成异源二聚体)的人源化Il7ra蛋白。
如本文所使用的“人IL7RA”基因和蛋白是指人来源的IL7RA基因和蛋白。在一些实施例中,人IL7RA蛋白包括SEQ ID NO:43的氨基酸序列。在一些实施例中,人IL7RA蛋白包括与SEQ ID NO:43的氨基酸序列至少95%相同的氨基酸序列。在一些实施例中,人IL7RA蛋白包括与SEQ ID NO:43的氨基酸序列至少98%相同的氨基酸序列。在一些实施例中,人IL7RA蛋白包括与SEQ ID NO:43的氨基酸序列至少99%相同的氨基酸序列。
如本文所使用的“啮齿动物Il7ra”基因和蛋白是指啮齿动物(例如,小鼠或大鼠)来源的Il7rar基因和蛋白。在一些实施例中,小鼠Il7ra蛋白包括SEQ ID NO:41的氨基酸序列。在一些实施例中,小鼠Il7ra蛋白包括与SEQ ID NO:41的氨基酸序列至少95%相同的氨基酸序列。在一些实施例中,小鼠Il7rar蛋白包括与SEQ ID NO:41的氨基酸序列至少98%相同的氨基酸序列。在一些实施例中,小鼠Il7rar蛋白包括与SEQ ID NO:41的氨基酸序列至少99%相同的氨基酸序列。在一些实施例中,大鼠Il7ra蛋白包括SEQ ID NO:47的氨基酸序列。在一些实施例中,大鼠Il7ra蛋白包括与SEQ ID NO:47的氨基酸序列至少95%相同的氨基酸序列。在一些实施例中,大鼠Il7ra蛋白包括与SEQ ID NO:47的氨基酸序列至少98%相同的氨基酸序列。在一些实施例中,大鼠Il7ra蛋白包括与SEQ ID NO:47的氨基酸序列至少99%相同的氨基酸序列。
在一些实施例中,经基因修饰的啮齿动物含有在其基因组中的人源化Il7ra基因,其中人源化Il7ra基因编码人源化Il7ra蛋白,所述人源化Il7ra蛋白含有与人IL7RA蛋白的胞外结构域基本上相同的胞外结构域。在一些实施例中,与人IL7RA蛋白的胞外结构域基本上相同的胞外结构域表现出与人IL7RA蛋白的胞外结构域相同的功能性(例如,配体结合性质)。“与人IL7RA蛋白的胞外结构域基本上相同”的胞外结构域或多肽可以是与人IL7RA蛋白的胞外结构域在序列上至少95%相同的多肽;与人IL7RA蛋白的胞外结构域在序列上至少98%相同的多肽;或与人IL7RA蛋白的胞外结构域在序列上至少99%相同的多肽。“与人IL7RA蛋白的胞外结构域基本上相同”的胞外结构域或多肽可以是与人IL7RA蛋白的胞外结构域在序列上100%相同的多肽。可替代地或另外地,“与人IL7RA蛋白的胞外结构域基本上相同”的胞外结构域或多肽可以是(ii)与人IL7RA蛋白的胞外结构域相差不超过10个氨基酸的多肽、与人IL7RA蛋白的胞外结构域相差不超过7个氨基酸的多肽、与人IL7RA蛋白的胞外结构域相差不超过5个氨基酸的多肽、与人IL7RA蛋白的胞外结构域相差不超过4个氨基酸的多肽、与人TSLPR蛋白的胞外结构域相差不超过3个氨基的多肽、与人TSLPR蛋白的胞外结构域相差不超过2个氨基酸的多肽或与人TSLPR蛋白的胞外结构域相差不超过1个氨基酸的多肽。可替代地或另外地,“与人IL7RA蛋白的胞外结构域基本上相同”的胞外结构域或多肽可以是(iii)仅在胞外结构域的N或C末端部分处不同于人IL7RA蛋白的胞外结构域的多肽,例如通过在胞外结构域的N和/或C末端部分处添加、缺失和/或取代氨基酸(即,从胞外结构域的N或C末端开始5-10个氨基酸内)。可替代地或另外地,“与人IL7RA蛋白的胞外结构域基本上相同”的胞外结构域或多肽可以是(iv)具有上文(i)-(iii)中所描述的特征中的一种或多种的多肽,例如,与人IL7RA蛋白的胞外结构域在序列上至少95%相同并且仅在胞外结构域的N或C末端部分处与人IL7RA蛋白的胞外结构域相差不超过5个氨基酸的多肽;或与人IL7RA蛋白的胞外结构域在序列上至少98%相同并且仅在胞外结构域的N或C末端部分处与人IL7RA蛋白的胞外结构域相差不超过3个氨基酸的多肽。在一些实施例中,人IL7RA蛋白包括如SEQ ID NO:43中所示的氨基酸序列,并且其胞外结构域由SEQ ID NO:43的氨基酸21-238定义。在一些实施例中,人源化Il7ra基因编码人源化Il7ra蛋白,其胞外结构域与如SEQ ID NO:43中所示的人IL7RA蛋白的胞外结构域基本上相同,即与SEQ ID NO:43的氨基酸21-238基本上相同。在一些实施例中,人源化Il7ra蛋白包括包含SEQ ID NO:43的氨基酸21-238的胞外结构域。在一些实施例中,人源化Il7ra蛋白包括包含SEQ ID NO:43的氨基酸21-237的胞外结构域。在一些实施例中,人源化Il7ra蛋白包括包含SEQ ID NO:43的氨基酸21-236的胞外结构域。在一些实施例中,人源化Il7ra蛋白包括包含SEQ ID NO:43的氨基酸22-238的胞外结构域。在一些实施例中,人源化Il7ra蛋白包括包含SEQ ID NO:43的氨基酸24-238的胞外结构域。
在一些实施例中,人源化Il7ra基因编码具有胞外结构域的人源化Il7ra蛋白,所述胞外结构域包括人IL7RA的胞外结构域或其大部分,随后是来自啮齿动物Il7ra(例如,内源性啮齿动物Il7ra)的胞外结构域的C末端的氨基酸。人IL7RA(或啮齿动物IL7ra)蛋白的“大部分胞外结构域”是指接近人IL7RA(或啮齿动物IL7ra)蛋白的全胞外结构域的多肽。在一些实施例中,大部分胞外结构域包含全长胞外结构域序列的至少95%。在一些实施例中,大部分胞外结构域包含全长胞外结构域序列的至少98%。在一些实施例中,大部分胞外结构域与胞外结构域的不同之处在于在胞外结构域的N或C末端处缺少不超过10个氨基酸。在一些实施例中,大部分胞外结构域与胞外结构域的不同之处在于在胞外结构域的N或C末端处缺少不超过7个氨基酸。在一些实施例中,大部分胞外结构域与胞外结构域的不同之处在于在胞外结构域的N或C末端处缺少不超过5个氨基酸。在一些实施例中,大部分胞外结构域与胞外结构域的不同之处在于在胞外结构域的N或C末端处缺少不超过3个氨基酸。例如,如SEQ ID NO:43中所示的人IL7RA蛋白的胞外结构域由氨基酸21-238定义,并且大部分胞外结构域的实例可以包含如SEQ ID NO:43中所示的人IL7RA蛋白的氨基酸22-238、23-238、24-238、21-237、21-236、21-235。在一些实施例中,人IL7RA的大部分胞外结构域包括SEQID NO:43的氨基酸21-236。在一些实施例中,人IL7RA的大部分胞外结构域包括SEQ ID NO:43的氨基酸21-237。在一些实施例中,人IL7RA的大部分胞外结构域包括SEQ ID NO:43的氨基酸22-238。在一些实施例中,人IL7RA的大部分胞外结构域包括SEQ ID NO:43的氨基酸23-238。在一些实施例中,人源化Il7ra蛋白的胞外结构域包括人IL7RA的大部分胞外结构域,随后是来自啮齿Il7ra(例如,内源性啮齿动物Il7ra)的胞外结构域的C末端的1-3个氨基酸。在一些实施例中,人源化Il7ra蛋白的胞外结构域包括SEQ ID NO:43的氨基酸21-236,随后是来自啮齿动物Il7ra的胞外结构域的C末端的2个氨基酸。在一些实施例中,人源化Il7ra基因编码含有包括SEQ ID NO:45的氨基酸21-238的胞外结构域的人源化Il7ra蛋白——该胞外结构域包括SEQ ID NO:43(人IL7RA)的氨基酸21-236和来自小鼠Il7ra的胞外结构域的C末端的最后2个氨基酸(“GW”),并且在胞外结构域的C末端处的两个氨基酸中不同于SEQ ID NO:43的人IL7RA蛋白的胞外结构域(SEQ ID NO:45的人源化Il7ra中的“GW”,与SEQ ID NO:43的人IL7RA中的“EM”相反)并且在其它方面与人IL7RA胞外结构域相同。
在一些实施例中,人源化Il7ra基因编码人源化Il7ra蛋白,所述人源化Il7ra蛋白含有与啮齿动物Il7ra蛋白,例如内源性啮齿动物Il7ra蛋白的跨膜细胞质序列基本上相同的跨膜细胞质序列(即,包含跨膜结构域和细胞质结构域两者的序列)。在一些实施例中,与内源性啮齿动物Il7ra蛋白的跨膜细胞质序列基本上相同的跨膜细胞质序列表现出与如内源性啮齿动物Il7ra蛋白等啮齿动物Il7ra蛋白的跨膜细胞质序列相同的功能性(例如,信号转导和/或与细胞内分子的相互作用)。“与啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同”的跨膜细胞质序列或多肽可以是(i)与啮齿动物Il7ra蛋白的跨膜细胞质序列在序列上至少95%相同的多肽或与啮齿动物Il7ra蛋白的跨膜细胞质序列在序列上至少98%相同的多肽;在一些实施例中。“与啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同”的跨膜细胞质序列或多肽可以是与啮齿动物Il7ra蛋白的跨膜细胞质序列在序列上相同的多肽。可替代地或另外地,“与啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同”的跨膜细胞质序列或多肽可以是(ii)与啮齿动物Il7ra蛋白的跨膜细胞质序列相差不超过5个氨基酸的多肽、与啮齿动物Il7ra蛋白的跨膜细胞质序列相差不超过4个氨基酸的多肽、与啮齿动物Il7ra蛋白的跨膜细胞质序列相差不超过3个氨基酸的多肽、与啮齿动物Il7ra蛋白的跨膜细胞质序列相差不超过2个氨基酸的多肽、与啮齿动物Il7ra蛋白的跨膜细胞质序列相差不超过1个氨基酸的多肽。可替代地或另外地,“与啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同”的跨膜细胞质序列或多肽可以是(iii)仅在N或C末端处不同于啮齿动物Il7ra蛋白的跨膜细胞质序列的多肽,例如通过在跨膜细胞质序列的N或C末端部分处添加、缺失或取代氨基酸。可替代地或另外地,“与啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同”的跨膜细胞质序列或多肽可以是(iv)具有上文(i)-(iii)中所描述的一种或多种特征的多肽,例如,与啮齿动物Il7ra蛋白的跨膜细胞质序列在序列上至少95%相同并且仅在N或C末端处与啮齿动物Il7ra蛋白的跨膜细胞质序列相差不超过3个氨基酸的多肽。“跨膜细胞质序列的N或C末端部分”意指从跨膜结构域的N末端开始5-10个氨基酸内或从细胞质结构域的C末端开始5-10个氨基酸内。在一些实施例中,人源化Il7ra蛋白含有与小鼠Il7ra蛋白(如内源性小鼠Il7ra蛋白)的跨膜细胞质序列基本上相同,或与大鼠Il7ra蛋白(如内源性大鼠Il7ra蛋白)的跨膜细胞质序列基本上相同的跨膜细胞质序列。
在一些实施例中,人源化Il7ra基因编码人源化Il7ra蛋白,所述人源化Il7ra蛋白含有与啮齿动物Il7ra蛋白(例如,内源性啮齿动物Il7ra蛋白)的信号肽基本上相同的信号肽。在一些实施例中,人源化Il7ra基因编码人源化Il7ra蛋白,所述人源化Il7ra蛋白含有与人IL7RA蛋白(例如,如SEQ ID NO:43中所示的人IL7RA蛋白)的信号肽基本上相同的信号肽。与参考蛋白(人IL7RA蛋白或啮齿动物Il7ra蛋白)的信号肽“基本上相同”的信号肽可以是(i)与参考蛋白的信号肽在序列上至少95%相同的多肽或与参考蛋白的信号肽在序列上相同的多肽。可替代地或另外地,与参考蛋白的信号肽“基本上相同”的信号肽可以是(ii)与参考蛋白的信号肽相差不超过3个氨基酸的多肽、与参考蛋白的信号肽相差不超过2个氨基酸的多肽;在一些实施例中,或与参考蛋白的信号肽相差不超过1个氨基酸的多肽。可替代地或另外地,与参考蛋白的信号肽“基本上相同”的信号肽可以是(iii)仅在N或C末端处不同于参考蛋白的信号肽的多肽,例如通过在信号肽的N或C末端部分处添加、缺失或取代氨基酸;或(iv)具有上文(i)-(iii)中所描述的一种或多种特征的多肽,例如与参考蛋白的信号肽至少95%相同并且仅在N或C末端处与参考蛋白的信号肽相差不超过3个氨基酸的多肽。“信号肽的N或C末端部分”意指从信号肽的N或C末端开始5个氨基酸内。在一些实施例中,人源化Il7ra蛋白包含与小鼠Il7ra蛋白(如内源性小鼠Il7ra蛋白)的信号肽基本上相同的信号肽。在一些实施例中,人源化Il7ra蛋白包含与大鼠Il7ra蛋白(如内源性大鼠Il7ra蛋白)的信号肽基本上相同的信号肽。在一些实施例中,人源化Il7ra蛋白包含与人IL7RA蛋白(例如,如SEQ ID NO:43中所示的人IL7RA蛋白)的信号肽基本上相同的信号肽。
在一些实施例中,经基因修饰的啮齿动物的基因组中的人源化Il7ra基因包含人IL7RA基因的核苷酸序列(“人IL7RA核苷酸序列”)和啮齿动物Il7ra基因的核苷酸序列(“啮齿动物Il7ra核苷酸序列”,如内源性啮齿动物Il7ra核苷酸序列),其中人IL7RA核苷酸序列至少编码人IL7RA蛋白的大部分胞外结构域。在一些实施例中,人IL7RA核苷酸序列是cDNA序列。在一些实施例中,人源化Il7ra基因中的人IL7RA核苷酸序列编码人IL7RA蛋白的胞外结构域(例如,SEQ ID NO:43的人IL7RA蛋白)。在一些实施例中,人IL7RA核苷酸序列是人IL7RA基因的基因组片段。在一些实施例中,人IL7RA核苷酸序列是人IL7RA基因的基因组片段,所述基因组片段包括从编码成熟蛋白序列中的第一氨基酸的外显子2中的密码子至外显子5(即,至编码氨基酸残基的密码子,所述氨基酸残基是人IL7RA蛋白的跨膜区段开始前的两个氨基酸)。在一些实施例中,人IL7RA基因组片段编码人IL7RA蛋白的氨基酸21-238(例如,如SEQ ID NO:43中所示的人IL7RA蛋白)。在一些实施例中,人IL7RA基因组片段编码人IL7RA蛋白的氨基酸21-237(例如,如SEQ ID NO:43中所示的人IL7RA蛋白)。在一些实施例中,人IL7RA基因组片段编码人IL7RA蛋白的氨基酸21-236(例如,如SEQ ID NO:43中所示的人IL7RA蛋白)。在一些实施例中,人IL7RA基因组片段编码人IL7RA蛋白的氨基酸21-235(例如,如SEQ ID NO:43中所示的人IL7RA蛋白)。在一些实施例中,人IL7RA基因组片段编码人IL7RA蛋白的氨基酸22-238(例如,如SEQ ID NO:43中所示的人IL7RA蛋白)。在一些实施例中,人IL7RA基因组片段编码人IL7RA蛋白的氨基酸24-238(例如,如SEQ ID NO:43中所示的人IL7RA蛋白)。在一些实施例中,人IL7RA基因组片段进一步包括内含子5的5'部分。
在一些实施例中,经基因修饰的啮齿动物的基因组中的人源化Il7ra基因包含啮齿动物Il7ra核苷酸序列和人IL7RA核苷酸序列,其中啮齿动物Il7ra核苷酸序列编码与啮齿动物Il7ra蛋白(例如,内源性啮齿动物Il7ra蛋白)的跨膜细胞质序列基本上相同的多肽。在一些实施例中,人源化Il7ra基因中存在的啮齿动物Il7ra核苷酸序列编码内源性啮齿动物Il7ra蛋白的跨膜细胞质序列。在一些实施例中,人源化Il7ra基因中存在的啮齿动物Il7ra核苷酸序列是小鼠Il7ra核苷酸序列;并且在一些此类实施例中,小鼠Il7ra核苷酸序列包括小鼠Il7ra基因(例如,内源性小鼠Il7ra基因)的内含子5和外显子6至外显子8的3'部分。
在一些实施例中,经基因修饰的啮齿动物的基因组中的人源化Il7ra基因包含人IL7RA核苷酸序列上游(5')的啮齿动物Il7ra核苷酸序列,其中啮齿动物Il7ra核苷酸序列编码与啮齿动物Il7ra蛋白(例如,内源性啮齿动物Il7ra蛋白)的信号肽基本上相同的多肽。在一些实施例中,编码与啮齿动物Il7ra蛋白的信号肽基本上相同的多肽的啮齿动物Il7ra核苷酸序列是小鼠Il7ra核苷酸序列(例如,内源性小鼠Il7ra核苷酸序列)或大鼠Il7ra核苷酸序列(例如,内源性大鼠Il7ra核苷酸序列)。在一些实施例中,人源化Il7ra基因中的小鼠Il7ra核苷酸序列包括小鼠Il7ra基因(例如,内源性小鼠Il7ra基因)的编码小鼠Il7ra的信号肽的外显子1的部分;在一些实施例中,小鼠Il7ra核苷酸序列还包括小鼠Il7ra基因的外显子1的5'UTR。
在一些实施例中,人源化Il7ra基因与啮齿动物Il7ra 5'调控序列,如内源性啮齿动物Il7ra调控序列,例如5'转录调控序列,如启动子和/或增强子可操作地连接,使得人源化Il7ra基因的表达在啮齿动物Il7ra 5'调控序列的控制下。
在一些实施例中,人源化Il7ra基因位于内源性啮齿动物Il7ra基因座。在一些实施例中,人源化Il7ra基因位于除内源性啮齿动物Il7ra基因座之外的基因座处;例如,由于随机整合。在人源化Il7ra基因位于除内源性啮齿动物Il7ra基因座之外的基因座处的一些实施例中,所述啮齿动物不能表达啮齿动物Il7ra蛋白,例如,由于内源性啮齿动物Il7ra基因的失活(例如,全部或部分缺失)。
在人源化Il7ra基因位于内源性啮齿动物Il7ra基因座的一些实施例中,人源化Il7ra基因是由于内源性啮齿动物Il7ra基因座处的内源性啮齿动物Il7ra基因的核苷酸序列被人IL7RA基因的核苷酸序列置换而产生的。
在一些实施例中,正在被置换的内源性啮齿动物Il7ra基因座处的内源性啮齿动物Il7ra基因的核苷酸序列是内源性啮齿动物Il7ra基因的基因组片段,所述基因组片段至少编码啮齿动物Il7ra蛋白的大部分胞外结构域。在一些实施例中,啮齿动物是小鼠,并且被置换的小鼠Il7ra基因组片段至少编码内源性小鼠Il7ra蛋白的大部分胞外结构域。内源性小鼠Il7ra蛋白的大部分胞外结构域的实例包含内源性小鼠Il7ra蛋白的氨基酸22-238、23-238、24-238、21-237、21-236或21-235(例如,SEQ ID NO:41)。在一些实施例中,要置换的小鼠Il7ra基因组片段编码内源性小鼠Il7ra蛋白的氨基酸21-235(例如,SEQ ID NO:41)。在一些实施例中,要置换的小鼠Il7ra基因组片段编码内源性小鼠Il7ra蛋白的氨基酸21-236(例如,SEQ ID NO:41)。在一些实施例中,要置换的小鼠Il7ra基因组片段编码内源性小鼠Il7ra蛋白的氨基酸21-237(例如,SEQ ID NO:41)。在一些实施例中,要置换的小鼠Il7ra基因组片段编码内源性小鼠Il7ra蛋白的氨基酸21-238(例如,SEQ ID NO:41)。在一些实施例中,要置换的小鼠Il7ra基因组片段编码内源性小鼠Il7ra蛋白的氨基酸22-238(例如,SEQ ID NO:41)。在一些实施例中,要置换的小鼠Il7ra基因组片段编码内源性小鼠Il7ra蛋白的氨基酸23-238(例如,SEQ ID NO:41)。在一些实施例中,要置换的小鼠Il7ra基因组片段包括小鼠Il7ra基因的从编码成熟Il7ra蛋白的第一氨基酸的外显子1中的密码子至外显子5,并且在一些实施例中至内含子5的5'部分。
在一些实施例中,置换内源性啮齿动物Il7ra基因座处的啮齿动物Il7ra基因的基因组片段的人IL7RA基因的核苷酸序列是cDNA序列。在一些实施例中,置换内源性啮齿动物Il7ra基因座处的啮齿动物Il7ra基因的基因组片段的人IL7RA核苷酸序列是人IL7RA基因的基因组片段。在一些实施例中,置换内源性啮齿动物Il7ra基因座处的啮齿动物Il7ra基因的基因组片段的人IL7RA基因的基因组片段包含人IL7RA基因的外显子的全部或部分,所述外显子至少编码人IL7RA蛋白的大部分胞外结构域。在一些实施例中,人IL7RA基因组片段编码人IL7RA,例如,如SEQ ID NO:43中所示的人IL7RA的氨基酸21-238。在一些实施例中,人IL7RA基因组片段编码人IL7RA,例如,如SEQ ID NO:43中所示的人IL7RA的氨基酸21-237。在一些实施例中,人IL7RA基因组片段编码人IL7RA,例如,如SEQ ID NO:43中所示的人IL7RA的氨基酸21-236。在一些实施例中,人IL7RA基因组片段编码人IL7RA,例如,如SEQ IDNO:43中所示的人IL7RA的氨基酸21-235。在一些实施例中,人IL7RA基因组片段编码人IL7RA,例如,如SEQ ID NO:43中所示的人IL7RA的氨基酸22-238。在一些实施例中,人IL7RA基因组片段编码人IL7RA,例如,如SEQ ID NO:43中所示的人IL7RA的氨基酸24-238。在一些实施例中,人基因组片段包括人IL7RA基因的编码成熟人IL7RA蛋白的第一氨基酸的外显子1中的密码子至外显子5,并且在一些实施例中至内含子5的5'部分。
在一些实施例中,插入到内源性啮齿动物Il7ra基因座中的人IL7RA核苷酸序列与啮齿动物Il7ra基因的基因组序列可操作地连接,所述啮齿动物Il7ra基因编码与啮齿动物Il7ra蛋白(如内源性啮齿动物,例如小鼠或大鼠,Il7ra蛋白)的跨膜细胞质序列基本上相同的多肽。在啮齿动物是小鼠的实施例中,小鼠Il7ra基因的基因组序列在一些实施例中包括小鼠Il7ra基因(例如,内源性小鼠Il7ra基因)的外显子6至外显子8;在一些实施例中包括小鼠Il7ra基因(例如,内源性小鼠Il7ra基因)的内含子5至外显子8的3'部分。
在一些实施例中,插入到内源性啮齿动物Il7ra基因座中的人IL7RA核苷酸序列与啮齿动物Il7ra基因的基因组序列可操作地连接,所述啮齿动物Il7ra基因编码与啮齿动物Il7ra蛋白(如内源性啮齿动物,例如小鼠或大鼠,Il7ra蛋白)的信号肽基本上相同的多肽。在啮齿动物是小鼠的实施例中,小鼠Il7ra基因的基因组序列在一些实施例中包括编码小鼠Il7ra的信号肽的小鼠Il7ra基因(例如,内源性小鼠Il7ra基因)的外显子1的部分;并且在一些实施例中包括编码小鼠Il7ra的信号肽的小鼠Il7ra基因(例如,内源性小鼠Il7ra基因)的外显子1的5'UTR和外显子1的部分。
在一些实施例中,啮齿动物是小鼠,并且包括从编码第一成熟Il7ra氨基酸的外显子1中的第一密码子至外显子5(或在一些实施例中至内含子5的5'部分)的内源性小鼠Il7ra基因座处的内源性小鼠Il7ra基因的基因组片段已被包括从编码第一成熟IL7RA氨基酸的外显子1中的第一密码子至外显子5(或在一些实施例中至内含子5的5'部分)的人IL7RA基因的基因组片段置换。在一些实施例中,人源化Il7ra基因在内源性啮齿动物Il7ra基因座处形成并包括小鼠Il7ra基因的外显子1的5'UTR和信号肽编码部分、人IL7RA基因的外显子1至外显子5的成熟氨基酸编码部分和小鼠Il7ra基因的外显子6至外显子8;并且在一些此类实施例中,人源化Il7ra基因的内含子5包含来自人内含子5的5'部分和来自内源性小鼠内含子5的3'部分。
在一些实施例中,啮齿动物是在内源性小鼠Il7ra基因座处包括人源化Il7ra基因的小鼠,其中人源化Il7ra基因编码人源化Il7ra蛋白,所述人源化Il7ra蛋白包括与人IL7RA蛋白的信号肽至少基本上相同的信号肽、与人IL7RA蛋白的胞外结构域至少基本上相同的胞外结构域和内源性小鼠Il7ra蛋白的跨膜胞质结构域。在一些实施例中,人源化Il7ra蛋白的胞外结构域包括人IL7RA蛋白的全长胞外结构域。在一些实施例中,人源化Il7ra蛋白的胞外结构域包括:(i)几乎全长的人IL7RA蛋白的胞外结构域,除了人IL7RA蛋白的胞外结构域的C末端处的2个氨基酸;以及(ii)内源性小鼠Il7ra蛋白的胞外结构域的C末端处的2个氨基酸。在一些实施例中,啮齿动物是在内源性小鼠Il7ra基因座处包括人源化Il7ra基因的小鼠,如CN111808882A中所描述的,所述文献通过引用整体并入本文。
在一些实施例中,本文提供的啮齿动物对其基因组中的人源化Il7ra基因是杂合的。在一些实施例中,本文提供的啮齿动物对其基因组中的人源化Il7ra基因是纯合的。
在一些实施例中,人源化Il7ra基因使经编码的人源化Il7ra蛋白在啮齿动物中表达。在一些实施例中,人源化Il7ra蛋白在细胞和组织中表达,其中对照啮齿动物(例如,没有人源化Il7ra基因的啮齿动物)中的对应的啮齿动物Il7ra蛋白通常在例如T淋巴细胞上表达。
在一些实施例中,本文公开的啮齿动物例如由于内源性啮齿动物Il7ra基因的失活(例如,全部或部分缺失)或置换(全部或部分)而不能表达啮齿动物Il7ra蛋白。
另外的基因特征
在一些实施例中,本文公开的啮齿动物在其基因组中进一步包括人源化Sirpα基因。啮齿动物Sirpα基因的人源化已经在例如WO 2015/042557 A1(再生元制药公司(Regeneron Pharmaceuticals Inc.))和US20190373867A1(北京百奥赛图基因生物技术公司(Beijing Biocytogen))中有所描述,所述文献通过引用以其整体并入本文。
在一些实施例中,人源化Sirpa基因编码包括人SIRPα蛋白的胞外结构域的全部或部分的人源化Sirpα蛋白。在一些实施例中,人源化Sirpa基因编码包括负责配体结合(即,与CD47结合)的人SIRPα蛋白的胞外部分的人源化Sirpα蛋白。在一些实施例中,人源化Sirpa基因编码包括人SIRPα蛋白的氨基酸残基28-362的人源化Sirpα蛋白,例如,如在GenBank登录号NP_001035111.1中所示的人SIRPα蛋白。在一些实施例中,人源化Sirpa基因编码包括啮齿动物Sirpα蛋白(例如,内源性啮齿动物Sirpα蛋白)的跨膜结构域和胞质结构域的人源化Sirpα蛋白。在一些实施例中,人源化Sirpα基因包括人SIRPα基因的外显子2、3和4。在一些实施例中,人源化Sirpα基因位于内源性啮齿动物Sirpα基因座。在一些实施例中,人源化Sirpα基因是由于内源性啮齿动物Sirpα基因座处的内源性啮齿动物Sirpα基因的外显子2-4被人SIRPα基因的外显子2-4置换而形成的。在一些实施例中,人源化Sirpα基因位于内源性啮齿动物Sirpα基因座,并且包括内源性啮齿动物Sirpα基因的外显子1、人SIRPα基因的外显子2-4和内源性啮齿动物Sirpα基因的外显子5-8,其中人源化Sirpα基因可操作地连接到内源性啮齿动物Sirpα基因座处的啮齿动物Sirpα启动子。在一些实施例中,啮齿动物对人源化Sirpα基因是杂合的。在一些实施例中,啮齿动物对人源化Sirpα基因是纯合的。在一些实施例中,包括人源化Sirpα基因的啮齿动物表达人源化Sirpα蛋白,如包括人SIRPα蛋白的胞外结构域和啮齿动物Sirpα蛋白的跨膜胞质结构域的蛋白。在一些实施例中,本文公开的啮齿动物不能表达内源性啮齿动物Sirpα蛋白(例如,由于内源性啮齿动物Sirpα基因的破坏或置换)。
在一些实施例中,本文公开的啮齿动物进一步包括在其基因组中的人源化Tpo(血小板生成素)基因。啮齿动物Tpo基因的人源化已在例如美国专利第8541646号(再生元制药公司、耶鲁大学和生物医学研究所IRB)和Rongvaux等人(《美国国家科学院院刊(Proc NatlAcad Sci USA.)》2011;108(6):2378-2383)中描述,所述文献通过引用以其整体并入本文。在一些实施例中,人源化包括用人TPO基因置换内源性啮齿动物Tpo基因。在一些实施例中,啮齿动物表达来自人源化Tpo基因的人TPO蛋白。在一些实施例中,啮齿动物对人源化Tpo基因是杂合的。在一些实施例中,啮齿动物对人源化Tpo基因是纯合的。在一些实施例中,包括人源化Tpo基因的啮齿动物不能表达内源性啮齿动物Tpo蛋白(例如,由于内源性啮齿动物Tpo基因的破坏或置换)。
在一些实施例中,本文公开的啮齿动物在其基因组中进一步包括人源化GM-CSF/IL-3基因座,其中内源性啮齿动物GM-CSF基因被人GM-CSF基因置换并且内源性啮齿动物IL-3基因被人IL-3基因置换。啮齿动物GM-CSF/IL-3基因座的人源化已在例如美国专利第8541646号(再生元制药公司、耶鲁大学和生物医学研究所IRB)和Willinger等人(《美国国家科学院院刊》,108(6):2390-2395,2011)中描述,所有文献以其整体并入本文)。在一些实施例中,啮齿动物对人源化GM-CSF/IL-3基因座是杂合的。在一些实施例中,啮齿动物对人源化GM-CSF/IL-3基因座是纯合的。在一些实施例中,啮齿动物表达来自人源化GM-CSF/IL-3基因座的人GM-CSF和人IL-3。在一些实施例中,本文公开的啮齿动物不能表达内源性啮齿动物GM-CSF蛋白并且不能表达内源性啮齿动物IL-3蛋白(例如,由于内源性啮齿动物GM-CSF/IL-3基因座的破坏或置换)。
在一些实施例中,本文公开的啮齿动物的内源性RAG2基因被破坏;并且在一些实施例中,啮齿动物对破坏(RAG2-/-或RAG敲除)是纯合的并且不能表达内源性RAG2蛋白。在一些实施例中,本文公开的啮齿动物的内源性IL-2RG基因被破坏;并且在一些实施例中,啮齿动物对破坏(IL-2RG-/或IL-2RG敲除)是纯合的并且不能表达内源性IL-2RG蛋白(也被称为“γc”)。RAG2和IL-2RG双敲除(DKO)啮齿动物是已知的免疫缺陷啮齿动物(参见例如Traggiai E等人(2004)脐带血细胞移植小鼠中人适应性免疫系统的开发(Development ofa human adaptive immune system in cord blood cell-transplanted mice),《科学(Science)》304:104-107,所述文献通过引用整体并入本文),并且易于(例如从纽约泰康利生物科学公司(Taconic Biosciences,Inc.,New York))商购获得。
在一些实施例中,本文公开的啮齿动物在其基因组中包括人源化Tslp基因和人源化Sirpα基因,并且对RAG2和IL-2RG基因两者是纯合无效的。在一些此类实施例中,啮齿动物在其基因组中进一步包括人源化Tpo基因和/或人源化GM-CSF/IL-3基因座。啮齿动物对人源化基因可以是杂合的或纯合的。
在一些实施例中,本文公开的啮齿动物在其基因组中包括人源化Tslp基因、人源化Tslpr基因和人源化Sirpα基因,并且对RAG2和IL-2RG基因两者是纯合无效的。在一些此类实施例中,啮齿动物在其基因组中进一步包括人源化Tpo基因和/或人源化GM-CSF/IL-3基因座。啮齿动物对人源化基因可以是纯合的或杂合的。
在一些实施例中,本文公开的啮齿动物在其基因组中包括人源化Tslp基因、人源化Tslpr基因、人源化Il7ra基因和人源化Sirpα基因,并且对RAG2和IL-2RG基因两者是纯合无效的。在一些此类实施例中,啮齿动物在其基因组中进一步包括人源化Tpo基因和/或人源化GM-CSF/IL-3基因座。啮齿动物对人源化基因可以是纯合的或杂合的。
啮齿动物物种和品系
在一些实施例中,作为非限制性实例,本公开的啮齿动物包含小鼠、大鼠和仓鼠。在一些实施例中,啮齿动物选自鼠总科(superfamily Muroidea)。在一些实施例中,本公开的啮齿动物来自选自以下的科:丽仓鼠科(Calomyscidae)(例如,丽仓鼠(mouse-likehamster))、仓鼠科(Cricetidae)(例如,仓鼠、新世界大鼠和小鼠、田鼠)、鼠科(Muridae)(真小鼠和大鼠、沙鼠、棘鼠、冠鼠)、马岛鼠科(Nesomyidae)(攀鼠、岩鼠、具尾大鼠、马达加斯加大鼠和小鼠)、刺山鼠科(Platacanthomyidae)(例如,刺棒睡鼠)和鼹形鼠科(Spalacidae)(例如,鼹鼠、竹鼠和鼢鼠)。在一些实施例中,本公开的啮齿动物选自真小鼠或大鼠(鼠科)、沙鼠、棘鼠和冠鼠。在一些实施例中,本公开的小鼠来自鼠科的成员。
在一些实施例中,啮齿动物是小鼠。在一些实施例中,啮齿动物是选自以下的C57BL品系的小鼠:C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola。在一些实施例中,啮齿动物是选自由以下品系组成的组的129品系的小鼠,即129P1、129P2、129P3、129X1、129S1(例如,129S1/SV、129S1/SvIm)、129S2、129S4、129S5、129S9/SvEvH、129/SvJae、129S6(129/SvEvTac)、129S7、129S8、129T1、129T2(参见例如Festing等人,1999,《哺乳动物基因组(Mammalian Genome)》10:836;Auerbach等人,2000,《生物技术(Biotechniques)》29(5):1024-1028,1030,1032)。在一些实施例中,啮齿动物是129品系和C57BL/6品系的混合体的小鼠。在一些实施例中,啮齿动物是前述129品系的混合体或前述BL/6品系的混合体的小鼠。在一些实施例中,啮齿动物是BALB品系(例如,BALB/c品系)的小鼠。在一些实施例中,啮齿动物是BALB品系和另一前述品系的混合物的小鼠。
在一些实施例中,啮齿动物是大鼠。在一些某些实施例中,大鼠选自威斯塔大鼠(Wistar rat)、LEA品系、斯泼累格多雷品系(Sprague Dawley strain)、费舍尔品系(Fischer strain)、F344、F6和黑刺鼠(Dark Agouti)。在一些实施例中,如本文所描述的大鼠品系是选自由以下组成的组的两个或更多个品系的混合体:威斯塔、LEA、斯泼累格多雷、费舍尔、F344、F6和黑刺鼠。
经基因修饰的啮齿动物的组织和细胞
在一些实施例中,本文公开了一种分离的啮齿动物细胞或组织,所述分离的啮齿动物细胞或组织的基因组包括人源化Tslp基因、人源化Tslpr基因、人源化Il7ra基因或其组合。在一些实施例中,分离的啮齿动物细胞或组织进一步包括上文所描述的另外的基因修饰中的一种或多种(例如,人源化Sirpα基因、RAG2-/-和IL-2RG-/-、人源化Tpo基因或人源化GM-CSF/IL-3基因座)。
在一些实施例中,组织选自脂肪、膀胱、脑、乳房、骨髓、眼、心脏、肠、肾、肝、肺、淋巴结、肌肉、胰腺、血浆、血清、皮肤、脾、胃、胸腺、睾丸、卵子以及其组合。
在一些实施例中,细胞选自上皮细胞、角质细胞、树突状细胞、淋巴细胞(例如,B或T细胞)、巨噬细胞、肥大细胞和嗜碱性粒细胞。在一些实施例中,分离的啮齿动物细胞是啮齿动物胚胎干细胞。在一些实施例中,分离的啮齿动物细胞是啮齿动物卵子或啮齿动物精子。
用于制备人源化啮齿动物的组合物和方法
本文公开了包括人TSLP核苷酸序列、人TSLPR核苷酸序列或人IL7RA核苷酸序列的期望被整合到啮齿动物基因座中以形成本文所描述的人源化基因的靶向载体(或核酸构建体)。
在一些实施例中,靶向载体包括至少编码如上文所描述的人TSLP蛋白的大部分成熟蛋白序列的人TSLP核苷酸序列。在一些实施例中,人TSLP核苷酸序列编码包括SEQ IDNO:3的氨基酸29-159的多肽。在一些实施例中,所述人TSLP核苷酸序列包括从所述成熟蛋白的第一氨基酸的密码子开始至人TSLP基因的外显子4中的终止密码子的外显子1。
在一些实施例中,靶向载体包括至少编码如上文所描述的人TSLPR蛋白的大部分胞外结构域的人TSLPR核苷酸序列。在一些实施例中,人TSLPR核苷酸序列编码包括SEQ IDNO:23的氨基酸27-231的多肽。在一些实施例中,人TSLPR核苷酸序列包括外显子2至编码人TSLPR基因的最后一个胞外结构域氨基酸的外显子6中的密码子。
在一些实施例中,靶向载体包括至少编码如上文所描述的人IL7RA蛋白的大部分胞外结构域的人IL7RA核苷酸序列。在一些实施例中,人IL7RA核苷酸序列编码包括SEQ IDNO:43的氨基酸21-236的多肽。在一些实施例中,人IL7RA核苷酸序列包括人IL7RA基因的从编码成熟IL7RA蛋白的第一氨基酸的外显子1中的密码子至外显子5(并且在一些实施例中至内含子5的5'部分)。
靶向载体还包含侧接待整合的人核苷酸序列的5'和3'啮齿动物序列,也称为5'和3'同源臂,所述啮齿动物序列介导人核苷酸序列的同源重组和将所述人核苷酸序列整合到靶啮齿动物基因座(例如,内源性啮齿动物Tslp基因座、内源性啮齿动物Tslpr基因座或内源性啮齿动物Il7ra基因座)中,从而形成如上文所描述的人源化基因。通常,5'和3'侧接啮齿动物序列是在将被人核苷酸序列置换的靶啮齿动物基因座处侧接对应啮齿动物核苷酸序列的核苷酸序列。在一些实施例中,靶向载体包括如上文所描述的人源化基因。在一些实施例中,靶向载体包括包含人TSLP核苷酸序列和啮齿动物Tslp核苷酸序列的人源化Tslp基因,如上文所描述的。在一些实施例中,靶向载体包括包含人TSLPR核苷酸序列和啮齿动物Tslpa核苷酸序列的人源化Tslpr基因,如上文所描述的。在一些实施例中,靶向载体包括包含人IL7RA核苷酸序列和啮齿动物Il7ra核苷酸序列的人源化Il7ra基因,如上文所描述的。
在一些实施例中,靶向载体包括选择标记基因。可以将选择标记基因插入要整合的人基因组序列的内含子中。在一些实施例中,选择标记基因作为自删除盒提供,所述自删除盒可以在成功整合人核苷酸序列之后删除。
在示例性实施例中,使用细菌同源重组和技术(参见例如U.S.6,586,251和Valenzuela等人(2003)《自然生物科学(Nature Biotech.)》21(6):652-659,所述文献通过引用以其整体并入本文)从携带啮齿动物Tslp、Tslpr或Il7ra基因组DNA的细菌人工染色体(BAC)克隆产生靶向载体。由于细菌同源重组,从BAC克隆中缺失啮齿动物基因组序列,并且插入人核苷酸序列,从而产生携带人核苷酸序列的经修饰的BAC克隆,所述人核苷酸序列侧接有5'和3'啮齿动物同源臂。在一些实施例中,人核苷酸序列可以是cDNA序列或人基因组DNA。经修饰的BAC克隆一旦线性化就可以引入到啮齿动物胚胎干(ES)细胞中。
在一些实施例中,本发明提供了如本文所描述的靶向载体用于制备经修饰的啮齿动物胚胎干(ES)细胞的用途。可以通过例如电穿孔将靶向载体引入到啮齿动物ES细胞中。本领域已经描述了小鼠ES细胞和大鼠ES细胞两者。参见例如US 7,576,259、US 7,659,442、US 7,294,754和US 2008-0078000A1(所述文献全部以全文引用的方式并入本文),所述文献描述了小鼠ES细胞和用于制备经基因修饰的小鼠的方法;US2014/0235933A1(再生元制药公司)、US 2014/0310828 A1(再生元制药公司),Tong等人(2010)《自然(Nature)》467:211-215以及Tong等人(2011)《自然实验手册(Nat Protoc.)》6(6):doi:10.1038/nprot.2011.338(所述文献全部以全文引用的方式并入本文),所述文献描述了大鼠ES细胞和用于制备经基因修饰的大鼠的方法,所述经基因修饰的大鼠可以用于制备经修饰的啮齿动物胚胎,所述经修饰的啮齿动物胚胎进而可以用于制备啮齿动物。
在一些实施例中,可以选择具有整合在基因组中的期望的人核苷酸序列(例如,人TSLP、人TSLPR或人IL7RA核苷酸序列)的ES细胞。在一些实施例中,基于啮齿动物等位基因的丢失和/或人等位基因测定的增益来选择ES细胞。在一些实施例中,然后将所选ES细胞用作供体ES细胞以通过使用方法(参见例如US 7,576,259、US 7,659,442、US 7,294,754和US 2008-0078000 A1,所述专利全部以全文引用的方式并入)或在US2014/0235933 A1和US 2014/0310828 A1(所述文献均以全文引用的方式并入)中描述的方法注射到桑椹胚前期胚胎(例如,8细胞期胚胎)中。在一些实施例中,包括供体ES细胞的胚胎被温育并且植入到代孕母亲体内以产生F0啮齿动物。可以通过使用啮齿动物等位基因的丢失和/或人等位基因测定的增益对从剪尾分离的DNA进行基因分型来鉴定携带人核苷酸序列的啮齿动物幼崽。
在一些实施例中,可以使对人源化基因而言杂合的啮齿动物杂交以产生纯合的啮齿动物。
如本文所描述的人源化啮齿动物(即,包括人源化Tslp基因、人源化Tslpr基因、人源化Il7ra基因或其组合的啮齿动物)可以与另一种啮齿动物繁殖或杂交。因此,繁殖方法以及从此类繁殖获得的子代也是本公开的实施例。
在一些实施例中,提供了一种方法,所述方法包括如上所描述的繁殖第一啮齿动物(例如,基因组包括人源化Tslp基因、人源化Tslpr基因、人源化Il7ra基因或其组合的啮齿动物)与第二啮齿动物,从而产生基因组包括人源化Tslp、Tslpr和/或Il7ra基因的子代啮齿动物。子代可以拥有从繁殖中所使用的第二啮齿动物遗传的其它期望的表型或基因修饰。在一些实施例中,子代啮齿动物对来自第一啮齿动物的一种或多种人源化基因是杂合的。在一些实施例中,子代啮齿动物对来自第一啮齿动物的人源化基因是纯合的。在一些实施例中,用于繁殖的第二啮齿动物包括另外的基因修饰中的一种或多种,如人源化Sirpα基因、RAG2-/-和IL-2RG-/-、人源化Tpo基因或人源化GM-CSF/IL-3基因座。
在一些实施例中,提供了一种子代啮齿动物,所述子代啮齿动物的基因组包括人源化Tslp基因、人源化Tslpr基因、人源化Il7ra基因或其组合,其中子代啮齿动物是通过包括繁殖第一啮齿动物与第二啮齿动物的方法产生的,所述第一啮齿动物的基因组包括一种或多种人源化基因。在一些实施例中,子代啮齿动物对来自第一啮齿动物的一种或多种人源化基因是杂合的。在一些实施例中,子代啮齿动物对来自第一啮齿动物的一种或多种人源化基因是纯合的。
在一些实施例中,本文公开了一种用于产生经基因修饰的啮齿动物细胞的体外方法,所述方法包括将靶向载体引入到啮齿动物细胞中,所述靶向载体包括至少编码人TSLP蛋白的大部分成熟蛋白序列的人TSLP核酸序列,所述人TSLP核酸序列侧接有啮齿动物同源臂,所述啮齿动物同源臂介导所述人TSLP核苷酸序列整合到内源性啮齿动物Tslp基因座中,使得啮齿动物Tslp基因组DNA被所述人TSLP核酸序列置换以形成如本文所描述的人源化Tslp基因,由此产生经基因修饰的啮齿动物细胞。在一些实施例中,所述啮齿动物细胞是小鼠细胞或大鼠细胞。在一些实施例中,所述啮齿动物细胞是啮齿动物ES细胞,并且所述方法产生经基因修饰的啮齿动物ES细胞。
在一些实施例中,本文公开了一种用于产生经基因修饰的啮齿动物细胞的体外方法,所述方法包括将靶向载体引入到啮齿动物细胞中,所述靶向载体包括至少编码人TSLPR蛋白的大部分胞外结构域的人TSLPR核酸序列,所述人TSLPR核酸序列侧接有啮齿动物同源臂,所述啮齿动物同源臂介导所述人TSLPR核苷酸序列整合到内源性啮齿动物Tslpr基因座中,使得啮齿动物Tslpr基因组DNA被所述人TSLP核酸序列置换以形成如本文所描述的人源化Tslpr基因,由此产生经基因修饰的啮齿动物细胞。在一些实施例中,所述啮齿动物细胞是小鼠细胞或大鼠细胞。在一些实施例中,所述啮齿动物细胞是啮齿动物ES细胞,并且所述方法产生经基因修饰的啮齿动物ES细胞。
在一些实施例中,本文公开了一种用于产生经基因修饰的啮齿动物细胞的体外方法,所述方法包括将靶向载体引入到啮齿动物细胞中,所述靶向载体包括至少编码人IL7RA蛋白的大部分胞外结构域的人IL7RA核酸序列,所述人IL7RA核酸序列侧接有啮齿动物同源臂,所述啮齿动物同源臂介导所述人IL7RA核苷酸序列整合到内源性啮齿动物Il7ra基因座中,使得啮齿动物Il7ra基因组DNA被所述人IL7RA核酸序列置换以形成如本文所描述的人源化Il7ra基因,由此产生经基因修饰的啮齿动物细胞。在一些实施例中,所述啮齿动物细胞是小鼠细胞或大鼠细胞。在一些实施例中,所述啮齿动物细胞是啮齿动物ES细胞,并且所述方法产生经基因修饰的啮齿动物ES细胞。
采用人源化啮齿动物的方法
本文公开的啮齿动物提供了一种用于鉴定和测试化合物治疗人类疾病的潜力的有用的体内系统和生物材料来源,所述疾病包含特别是与TSLP信号传导相关的疾病,如Th2驱动的过敏性疾病、哮喘和癌症。
在一些实施例中,本文公开的啮齿动物用于开发靶向TSLP信号传导的药剂,例如通过靶向人TSLP、人TSLPR或人IL7RA。在一些实施例中,本文公开的啮齿动物用于筛选和开发与人TSLP、人TSLPR或人IL7RA特异性地结合的候选药剂(例如,抗体)。在一些实施例中,本文公开的啮齿动物用于确定药剂(例如,抗体)的结合谱。在一些实施例中,本文公开的啮齿动物用于测量阻断或调节人TSLP、TSLPR或IL7RA活性的效应。在一些实施例中,本文公开的啮齿动物被暴露于与人TSLP结合并且抑制其的候选药剂,并且被用于分析对人TSLP依赖性过程的影响。
在一些实施例中,本文所描述的经基因修饰的啮齿动物用作过敏性疾病的模型。在一些实施例中,过敏性疾病涉及气道炎症(例如,哮喘)。
在一些实施例中,肺部炎症的ova-明矾模型用于评估Tslp信号传导。肺部炎症的ova-明矾模型在本领域中已被充分证明(Al-Shami等人,《实验医学杂志(JEM)》,第202卷,第6期,829-839,2005;Chu等人,《过敏症与临床免疫学杂志(J.Allergy Clin Immunol)》2013;131:187-200,所述文献通过引用以其整体并入本文)。在一些实施例中,将乳化在氢氧化铝中的OVA或单独的氢氧化铝(作为对照)腹膜内施用于啮齿动物(例如,小鼠,如针对本文公开的Tslp、Tslpr和/或Il7ra中的一种或多种人源化的小鼠,或未人源化的野生型小鼠)。然后用OVA对小鼠进行鼻内激发,并且随后分析指示肺部炎症的参数,包含例如血清ova特异性IgE和ova特异性IgG1、杯状细胞化生和/或肺组织嗜酸性粒细胞增多。在一些实施例中,在激发之后分析哮喘肺的气道中过表达的代表性粘蛋白基因Muc5ac的肺表达并且可以作为杯状细胞化生的替代终点。在示例性方案中,将乳化在2mg的氢氧化铝中的50μg的OVA或单独的2mg的氢氧化铝腹膜内施用于啮齿动物(例如,小鼠,如对Tslp和Tslpr双重人源化的小鼠,对Tslp、Tslpr和Il7ra三重人源化的小鼠,如本文所公开的,或未人源化的野生型小鼠,在第1天和第14天)。从第21天开始,用PBS中的150μg的OVA对麻醉的小鼠进行鼻内激发4天。在最后一次激发之后24小时,分析小鼠的血清Ova特异性IgE和Ova特异性IgG1、杯状细胞化生和/或肺组织嗜酸性粒细胞增多。在一些实施例中,在激发之后分析哮喘肺的气道中过表达的代表性粘蛋白基因Muc5ac的肺表达并且可以作为杯状细胞化生的替代终点。
在一些实施例中,可以通过以一种或多种剂量鼻内施用过敏原(例如,屋尘螨提取物或“HDM”模型)一段时间来诱导啮齿动物的气道炎症,并且可以基于粘液累积、支气管肺泡灌洗液中的嗜酸性浸润细胞、总循环IgE水平和/或通过微阵列表达分析可测量的表达谱的改变来测量气道炎症。候选治疗剂的效果可以通过测量气道炎症的程度在ova-明矾模型或HDM模型中是否因施用药剂而降低来确定。用于诱导气道炎症的过敏原和要测试的药剂可以同时或在不同时间施用。在一些实施例中,将过敏原以一种或多种剂量给予啮齿动物,并且在将至少一种剂量的过敏原给予啮齿动物之后将要测试的药剂施用于啮齿动物。
在一些实施例中,过敏性疾病涉及皮肤炎症或特应性皮炎。可以通过造成皮肤损伤并将受伤的皮肤暴露于一种或多种剂量的过敏原(例如,细菌毒素或屋尘螨提取物)一段时间来诱导啮齿动物的皮肤炎症。药剂的效果可以通过测量皮肤炎症(如通过评估例如IgE水平、瘙痒、表皮增厚和特应性皮炎的其它典型症状来确定)是否因施用药剂而减轻来确定。
在一些实施例中,本文公开的啮齿动物用作如Th2驱动的癌症等癌症的动物模型,以便例如评估靶向人癌细胞的治疗药物的功效。在各个实施例中,将本文公开的啮齿动物与人癌细胞移植,并且将靶向此类人癌细胞的候选药物施用于啮齿动物。然后通过在施用药物之后监测啮齿动物体内的人癌细胞(例如,通过评估药物的施用是否抑制啮齿动物体内的人癌细胞的生长或转移)来确定药物的治疗疗效。适于移植到啮齿动物体内的人癌细胞包含例如乳腺癌细胞、肺癌细胞、胰腺癌细胞、结肠癌细胞、黑色素瘤等。可以在非人动物中测试的药物包含小分子化合物(即,分子量小于1500kD、1200kD、1000kD或800道尔顿的化合物)和大分子化合物(如蛋白,例如,抗体)两者,所述小分子化合物和所述大分子化合物具有通过靶向人类细胞(例如,与人类细胞结合和/或作用于人类细胞)治疗人类疾病和病状的预期治疗效果。
通过以下实例进一步展示本说明书,所述实例不应被解释为以任何方式进行限制。所有引用文献(包含贯穿本申请所引用的参考文献、发布的专利和公开的专利申请)的内容特此以全文引用的方式明确并入。
实例
提出以下实例以便向所属领域的普通技术人员提供如何制备和评估本文所要求保护的化合物、组合物、制品、装置和/或方法的完整公开和描述,并且旨在单纯作为示例而非意图限制本公开。
实例1.人源化Tslp小鼠的产生
通过使用技术使小鼠Tslp基因座人源化(参见例如美国专利第6,586,251号和Valenzuela等人(2003)小鼠基因组的高通量工程与高分辨率表达分析,《自然实验手册》21(6):652-659,所有文献通过引用以其整体并入本文)。所得人源化Tslp基因座包含小鼠Tslp启动子、小鼠Tslp外显子1、部分小鼠Tslp外显子2(从外显子2的5'末端至编码小鼠Tslp信号肽的最后一个氨基酸的密码子)、部分人TSLP外显子1(从编码成熟人TSLP蛋白的第一氨基酸的密码子至外显子1的3'末端)至人TSLP外显子4的终止密码子,随后是小鼠Tslp 3'UTR和下游小鼠基因组序列。参见图1A-1C。
为了使小鼠Tslp基因座人源化,基于以下小鼠和人序列产生靶向核酸构建体:
表4
表5
靶向核酸构建体从5'至3'含有:
(i)编码成熟小鼠Tslp蛋白的第一氨基酸的小鼠Tslp外显子2中的密码子上游的114.3kb的5'小鼠同源臂;参见图1B;
(ii)从编码成熟人TSLP蛋白的第一氨基酸(氨基酸29)的人TSLP外显子1中的密码子开始并在人TSLP外显子3的末端后的257bp处结束、被指定为“人基因组片段1”的1.9kb的人TSLP基因组序列;参见图1B;
(iii)插入人TSLP的内含子3中的被指定为“Floxed HUb-Puro”(与人泛素启动子可操作地连接的嘌呤霉素抗性基因,侧接LoxP位点)的4.4kb的选择盒;参见图1B;
(iv)从人TSLP外显子3的末端后的258bp开始并在人TSLP外显子4的终止密码子处结束、被指定为“人基因组片段2”的2.2kb的人TSLP基因组序列;参见图1B;以及
(v)包含小鼠Tslp外显子5的3'UTR序列和下游小鼠基因组序列的约65.3kb的3'小鼠同源臂;参见图1B。
将靶向核酸构建体电穿孔到F1H4小鼠胚胎干(ES)细胞中。通过等位基因修饰(MOA)测定证实了成功整合,如例如在Valenzuela等人,同上中所描述的。表6中描述了用于检测人TSLP序列的存在并确认小鼠Tslp序列的丢失和/或保留的MOA测定的引物和探针,并且图1B中示出了引物和探针的位置。
表6
/>
在选择正确靶向的ES细胞克隆之后,切除嘌呤霉素选择盒。人源化Tslp基因的编码序列和经编码的氨基酸序列分别阐述于SEQ ID NO:6和SEQ ID NO:5中。图1F中提供了小鼠Tslp(SEQ ID NO:1)、人TSLP(SEQ ID NO:3)和人源化Tslp(SEQ ID NO:5)蛋白序列的比对。
阳性靶向的ES细胞用作供体ES细胞,并且通过方法将其显微注射到桑椹胚前期(8细胞)小鼠胚胎中(参见例如US 7,576,259、US 7,659,442、US 7,294,754和US 2008-0078000 A1,所有文献通过引用以其整体并入本文)。在体外温育包括供体ES细胞的小鼠胚胎,并且然后将所述小鼠胚胎植入到代孕母亲体内以产生完全源自供体ES细胞的F0小鼠。使用上文所描述的MOA测定,通过基因分型来鉴定携带人源化Tslp基因的小鼠。将对人源化Tslp基因杂合的小鼠繁殖为纯合性的。
为了确定对Tslp人源化纯合的小鼠是否表达人源化Tslp蛋白,对小鼠实施安乐死并通过心脏穿刺放血。将血液收集到血清分离管中并制备血清。根据制造商的说明,使用人Quantikine TSLP ELISA(R&D系统公司(R&Dsystems);目录号DTSLP0)确定血清中的人TSLP水平。1000pg/mL的重组鼠类Tslp(R&D系统公司目录号555-TS-010)也用作阴性对照,以验证ELISA的物种特异性(数据未显示)并且正常人血清(NHS)用作阳性对照。发现对如上文所述的Tslp人源化杂合的小鼠在血清中表达成熟人TSLP(图1G)。
实例2.人源化Tslpr小鼠的产生
通过使用技术使小鼠Tslpr基因座人源化(参见例如美国专利第6,586,251号和Valenzuela等人(2003)小鼠基因组的高通量工程与高分辨率表达分析,《自然实验手册》21(6):652-659,所有文献通过引用以其整体并入本文)。所得人源化Tslpr基因座包含小鼠Tslpr启动子、小鼠Tslpr外显子1(包含5'UTR和编码小鼠Tslpr信号肽和小鼠Tslpr成熟蛋白的前7个氨基酸的序列)、部分小鼠Tslpr内含子1(在外显子2前高达328bp)、部分人TSLPR内含子1(从外显子2前的909bp处开始)、人TSLPR外显子2至外显子6的前47个bp(基本上编码人TSLPR胞外结构域,即从氨基酸27至刚好在跨膜结构域之前)、从第48个bp开始至外显子8的小鼠Tslpr外显子6(编码小鼠Tslpr跨膜和细胞内结构域,并且包含小鼠Tslpr 3'UTR),随后是下游小鼠基因组序列。参见图2A-2C。
为了使小鼠Tslpr基因座人源化,基于以下序列信息产生靶向核酸构建体:
表7
表8
基因组构建 开始 结束 长度(bp)
5'小鼠臂 GRCm38/mm10 Chr5:109557943 Chr5:109586999 29057
人插入物 GRCh37/hg37 ChrX:1314968 ChrX:1328710 13743
3'小鼠臂 GRCm38/mm10 Chr5:109422337 Chr5:109555580 133244
靶向核酸构建体从5'至3'含有:
(i)小鼠Tslpr外显子2前的约29.1kb至328bp的5'小鼠同源臂;参见图2B;
(ii)含有与人泛素启动子可操作地连接的新霉素抗性基因的自删除选择盒,侧接LoxP位点(“Floxed HUb-Neo”),参见图2B;
(iii)从人TSLPR的外显子2前的909bp开始至外显子6中的前47个bp、基本上编码人TSLPR胞外结构域,即从氨基酸27至氨基酸231(在人TSLPR中:构成信号肽的氨基酸1-22和构成跨膜结构域的氨基酸232至252)的13743bp的人TSLPR核酸序列,参见图2B;以及
(iv)从外显子6至外显子8中的第48个bp开始、编码小鼠Tslpr跨膜结构域和细胞内结构域并包含小鼠Tslpr3'UTR随后是下游小鼠基因组序列的约133.2kb的3'小鼠同源臂;参见图2B。
将靶向核酸构建体电穿孔到小鼠胚胎干(ES)细胞中。通过等位基因修饰(MOA)测定证实了成功整合,如例如在Valenzuela等人,同上中所描述的。表9中示出了用于检测人TSLPR序列的存在并确认小鼠Tslpr序列的丢失和/或保留的MOA测定的引物和探针,并且图2B中指示了引物和探针的位置。在选择正确靶向的ES细胞克隆之后,可以切除新霉素选择盒。带有和不带有盒的靶向的(人源化)Tslpr等位基因的基因组序列分别在SEQ ID NO:63和64中示出。人源化Tslpr基因的编码序列和经编码的氨基酸序列分别阐述于SEQ ID NO:26和SEQ ID NO:25中。图2F中提供了小鼠Tslpr(SEQ ID NO:21)、人TSLPR(SEQ ID NO:23)和人源化Tslpr(SEQ ID NO:25)蛋白序列的比对。
表9
阳性靶向的ES细胞用作供体ES细胞,并且通过方法将其显微注射到桑椹胚前期(8细胞)小鼠胚胎中(参见例如US 7,576,259、US 7,659,442、US 7,294,754和US 2008-0078000 A1,所有文献通过引用以其整体并入本文)。在体外温育包括供体ES细胞的小鼠胚胎,并且然后将所述小鼠胚胎植入到代孕母亲体内以产生完全源自供体ES细胞的F0小鼠。使用上文所描述的MOA测定,通过基因分型来鉴定携带人源化Tslpr基因的小鼠。将对人源化Tslpr基因杂合的小鼠繁殖为纯合性的。/>
实例3.人源化Il7ra小鼠的产生
通过使用技术使小鼠Il7ra基因座人源化(参见例如美国专利第6,586,251号和Valenzuela等人(2003)小鼠基因组的高通量工程与高分辨率表达分析,《自然实验手册》21(6):652-659,所有文献通过引用以其整体并入本文)。所得人源化Il7ra基因座包含小鼠Il7ra启动子、部分小鼠Il7ra外显子1(包含从起始密码子开始的5'UTR和前68个bp,并编码小鼠Il7ra信号肽和小鼠Il7ra成熟蛋白的前3个氨基酸)、部分人IL7RA外显子1(外显子1的最后14个bp)、人IL7RA内含子1、人IL7RA外显子2至外显子5、部分人IL7RA内含子5、部分小鼠Il7ra内含子5、小鼠Il7ra外显子6至外显子8(编码小鼠Il7ra胞外结构域、小鼠Il7ra的跨膜结构域和细胞内结构域的最后两个氨基酸,并且包含小鼠Il7ra 3'UTR)。参见图3A-3F。
为了使小鼠Il7ra基因座人源化,基于以下序列信息产生靶向核酸构建体:
表10
表11
基因组构建 开始 结束 长度(bp)
5'小鼠臂 GRCm38/mm10 Chr15:9529675 Chr15:9578484 48810
人插入物 GRCh38/hg38 Chr5:35857046 Chr5:35874277 17232
3'小鼠臂 GRCm38/mm10 Chr15:9386119 Chr15:9510439 124321
靶向核酸构建体从5'至3'含有:
(i)约48.8kb以上的5'小鼠同源臂(小鼠Il7ra 5'序列至部分外显子1,即5'UTR和从起始密码子开始的前68个bp);参见图3B和图3E;
(ii)126bp的人基因组片段1(SEQ ID NO:69)(其包含人IL7RA的外显子1的最后14个bp和内含子1的前112个bp);参见图3B和图3E;
(iii)含有与人泛素启动子可操作地连接的潮霉素抗性基因的约5.2kb的自删除选择盒,侧接LoxP位点(“Floxed HUb-Hyg”);参见图3B;
(iv)包含人IL7RA的内含子1的3'部分、外显子2至外显子5和内含子5的5'部分的17106bp的人基因组片段2;参见图3B;以及
(v)包含小鼠Il7ra(包含小鼠Il7ra 3'UTR)的内含子5的3'部分、外显子6至外显子8,随后是下游小鼠基因组序列的约124.3kb的3'小鼠同源;参见图3B和3F。小鼠Il7ra的外显子6至外显子8编码小鼠Il7ra的胞外结构域、跨膜结构域和细胞内结构域的最后两个氨基酸(Gly-Trp)。
将靶向核酸构建体电穿孔到F1H4小鼠胚胎干(ES)细胞中。通过等位基因修饰(MOA)测定证实了成功整合,如例如在Valenzuela等人,同上中所描述的。表12中示出了用于检测人IL7RA序列的存在并确认小鼠Il7ra序列的丢失和/或保留的MOA测定的引物和探针,并且图3B中指示了引物和探针的位置。在选择正确靶向的ES细胞克隆之后,可以切除潮霉素选择盒。带有和不带有盒的靶向的(人源化)Il7ra等位基因的基因组序列分别在SEQID NO:65和66中示出。人源化Il7ra基因的编码序列和经编码的氨基酸序列分别阐述于SEQID NO:46和SEQ ID NO:45中。图3F中提供了小鼠Il7ra(SEQ ID NO:41)和人IL7RA(SEQ IDNO:43)蛋白序列的比对。
表12
阳性靶向的ES细胞用作供体ES细胞,并且通过方法将其显微注射到桑椹胚前期(8细胞)小鼠胚胎中(参见例如US 7,576,259、US 7,659,442、US 7,294,754和US 2008-0078000 A1,所有文献通过引用以其整体并入本文)。在体外温育包括供体ES细胞的小鼠胚胎,并且然后将所述小鼠胚胎植入到代孕母亲体内以产生完全源自供体ES细胞的F0小鼠。使用上文所描述的MOA测定,通过基因分型来鉴定携带人源化Il7ra基因的小鼠。将对人源化Il7ra基因杂合的小鼠繁殖为纯合性的。
实例4.Ova-明矾诱导野生型、双重人源化小鼠(Tslp hu/hu/Tslpr hu/hu)和三重人源化小鼠(Tslp hu/hu/Tslpr hu/hu/Il7rahu/hu)的2型驱动的炎症
为了证实各种人源化小鼠品系在2型驱动的炎症的模型中具有可比较的病理学,采用了卵清蛋白(OVA)/明矾诱导的肺部炎症模型,其中TSLP的作用先前已有报道(Chu等人,《过敏症与临床免疫学杂志》2013;131:187-200.e1-8,所述文献的全部内容通过引用并入本文)。传统的2型炎症终点,如抗原特异性IgE和IgG1的循环水平,肺组织嗜酸性粒细胞浸润和哮喘肺的气道中过表达的代表性粘蛋白基因Muc5ac的肺表达,以及杯状细胞化生(GCM)的替代终点(Wills-Karp等人,《科学》1998;282:2258-61,所述文献的全部内容通过引用并入本文)在三种小鼠品系中进行评估:野生型小鼠(WT)、双重人源化小鼠(Tslphu/hu/Tslprhu/hu)和三重人源化小鼠(Tslphu/hu/Tslprhu/hu/IL7Rhu/hu)。Tslp、Tslpr和IL7R分子中的每一个的人源化分别如实例1、2和3中所描述的。
由于肺是高度血管化的器官,在对嗜酸性粒细胞进行门控之前,使用基于CD45的血管内标记技术(Anderson等人,《自然实验手册》2014;9:209-22,所述文献的全部内容通过引用并入本文)来区分浸润肺(肺组织)的细胞和在肺血管系统中循环(肺循环)的细胞。如所预期的,TSLP/OVA施用以跨小鼠品系的相当水平诱导肺组织嗜酸性粒细胞的增加(图4A)。另外,TSLP/OVA诱导Muc5ac(图4B)的肺表达的相当水平以及Ova特异性IgE(图4C)和Ova特异性IgG1(图4D)的循环水平的相当水平。
方法
Ova-明矾诱导的肺部炎症。在第1天和第14天将乳化在2mg的氢氧化铝(西格玛奥德里奇公司(Sigma Aldrich))中的50μg的OVA(V级;西格玛奥德里奇公司)或单独的2mg的氢氧化铝中腹膜内施用于WT Balb/c小鼠。从第21天开始,用20μL的PBS中的150μg的OVA(III级,西格玛奥德里奇公司)对麻醉的小鼠进行鼻内激发4天。在最后一次激发之后24小时对小鼠进行分析。
在研究结束时,将小鼠处死并收集血液和肺用于分析肺组织中的嗜酸性粒细胞浸润、通过实时qPCR的肺基因表达和循环血清免疫球蛋白水平。
流式细胞术分析。为了能够对肺中的循环免疫细胞与组织浸润免疫细胞进行流式细胞术分析,在处死之前5分钟,向小鼠静脉内注射抗CD45 BV650抗体(BD生物科学公司(BDBiosciences))以选择性地标记仍在血管系统中的免疫细胞,而不标记已经浸润肺实质的细胞。使用Liberase TH(罗氏公司(Roche))和DNase I(罗氏公司)的溶液消化小鼠尾侧肺叶以制备单细胞悬浮液,随后进行机械解离。然后用活/死可固定死细胞染色剂(BD生物科学公司)对细胞进行染色,以排除死细胞,随后是针对以下的抗体:CD45、CD26、Siglec-F、Ly6G、Ly6C、CD11b、CD19、SIRPα、CD23、CD127、Sca-1、CD44、CD4、CD8、TCRb、CD69 CD62L(BD生物科学公司);CD64、XCR1、I-A/I-E、CD11c、CD301b(百进生物公司(Biolegend));MerTK、ST2(e生物科学公司(eBioscience))。使用HTS附件(BD)在LSR Fortessa X-20或FACSymphony细胞分析仪上采集样品。使用FlowJo v10软件(BD)执行数据分析。
血清IgE和抗原特异性IgE或IgG1的测量。将全血收集到微容器SST血清管中并通过在4℃下以15,000g离心10分钟来沉淀。血清样品用于确定浓度:通过IgE夹心ELISAOptEIA试剂盒(BD生物科学公司)确定总IgE浓度;通过间接ELISA(Chondrex公司(Chondrex))确定总抗Ova IgE和抗Ova IgG1浓度;通过夹心ELISA(Chondrex公司)确定总抗HDM IgE;以及通过内部夹心ELISA确定总抗HDM IgG1滴度。所有ELISA试剂盒遵循制造商的说明。
Muc5ac的测量。肺Muc5ac基因表达通过实时qPCR在采集的肺组织中检测并归一化为管家基因。简而言之,在研究结束时,对小鼠进行放血并取出每只小鼠右肺的副叶,然后放入含有400μL的RNA的管中并储存在-20℃下。所有样品在TRIzol中均质化并且氯仿用于相分离。根据制造商的说明书,使用用于微阵列总RNA分离试剂盒的MagMAXTM-96(艾莫宾生命技术公司(Ambion by Life Technologies))纯化含有总RNA的水相。使用无RNase的DNase组(凯杰公司(Qiagen))去除基因组DNA。使用VILOTMMaster Mix(英杰生命技术公司(Invitrogen by Life Technologies))将mRNA逆转录为cDNA。将cDNA稀释至2ng/uL,并使用ABI 7900HT序列检测系统(应用生物系统公司(Applied Biosystems))用SensiFAST探针Hi-ROX(Meridian公司(Meridian))扩增10ng cDNA。内部对照管家基因用于归一化任何cDNA输入差异。测量肺组织mRNA表达水平相对于对照小鼠的变化倍数并相对于管家mRNA表达进行表达。
表13
结论
基于对肺嗜酸性粒细胞浸润、肺基因表达分析和循环抗体抗体水平的分析,Ova-明矾模型诱导在双重人源化(Tslphu/hu/Tslprhu/hu)和三重人源化(Tslphu/hu/Tslprhu/hu/Il7rahu/hu)小鼠的相当水平的2型驱动的炎症。
序列表
<110> 再生元制药公司(Regeneron Pharmaceuticals, Inc.)
<120> 具有人源化TSLP基因、人源化TSLP受体基因和/或人源化IL7RA
基因的非人动物
<130> 37301 (10589WO01)
<150> 63/128,258
<151> 2020-12-21
<160> 69
<170> PatentIn 3.5版
<210> 1
<211> 140
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 1
Met Val Leu Leu Arg Ser Leu Phe Ile Leu Gln Val Leu Val Arg Met
1 5 10 15
Gly Leu Thr Tyr Asn Phe Ser Asn Cys Asn Phe Thr Ser Ile Thr Lys
20 25 30
Ile Tyr Cys Asn Ile Ile Phe His Asp Leu Thr Gly Asp Leu Lys Gly
35 40 45
Ala Lys Phe Glu Gln Ile Glu Asp Cys Glu Ser Lys Pro Ala Cys Leu
50 55 60
Leu Lys Ile Glu Tyr Tyr Thr Leu Asn Pro Ile Pro Gly Cys Pro Ser
65 70 75 80
Leu Pro Asp Lys Thr Phe Ala Arg Arg Thr Arg Glu Ala Leu Asn Asp
85 90 95
His Cys Pro Gly Tyr Pro Glu Thr Glu Arg Asn Asp Gly Thr Gln Glu
100 105 110
Met Ala Gln Glu Val Gln Asn Ile Cys Leu Asn Gln Thr Ser Gln Ile
115 120 125
Leu Arg Leu Trp Tyr Ser Phe Met Gln Ser Pro Glu
130 135 140
<210> 2
<211> 423
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 2
atggttcttc tcaggagcct cttcatcctg caagtactag tacggatggg gctaacttac 60
aacttttcta actgcaactt cacgtcaatt acgaaaatat attgtaacat aatttttcat 120
gacctgactg gagatttgaa aggggctaag ttcgagcaaa tcgaggactg tgagagcaag 180
ccagcttgtc tcctgaaaat cgagtactat actctcaatc ctatccctgg ctgcccttca 240
ctccccgaca aaacatttgc ccggagaaca agagaagccc tcaatgacca ctgcccaggc 300
taccctgaaa ctgagagaaa tgacggtact caggaaatgg cacaagaagt ccaaaacatc 360
tgcctgaatc aaacctcaca aattctaaga ttgtggtatt ccttcatgca atctccagaa 420
taa 423
<210> 3
<211> 159
<212> PRT
<213> 智人(Homo sapiens)
<400> 3
Met Phe Pro Phe Ala Leu Leu Tyr Val Leu Ser Val Ser Phe Arg Lys
1 5 10 15
Ile Phe Ile Leu Gln Leu Val Gly Leu Val Leu Thr Tyr Asp Phe Thr
20 25 30
Asn Cys Asp Phe Glu Lys Ile Lys Ala Ala Tyr Leu Ser Thr Ile Ser
35 40 45
Lys Asp Leu Ile Thr Tyr Met Ser Gly Thr Lys Ser Thr Glu Phe Asn
50 55 60
Asn Thr Val Ser Cys Ser Asn Arg Pro His Cys Leu Thr Glu Ile Gln
65 70 75 80
Ser Leu Thr Phe Asn Pro Thr Ala Gly Cys Ala Ser Leu Ala Lys Glu
85 90 95
Met Phe Ala Met Lys Thr Lys Ala Ala Leu Ala Ile Trp Cys Pro Gly
100 105 110
Tyr Ser Glu Thr Gln Ile Asn Ala Thr Gln Ala Met Lys Lys Arg Arg
115 120 125
Lys Arg Lys Val Thr Thr Asn Lys Cys Leu Glu Gln Val Ser Gln Leu
130 135 140
Gln Gly Leu Trp Arg Arg Phe Asn Arg Pro Leu Leu Lys Gln Gln
145 150 155
<210> 4
<211> 480
<212> DNA
<213> 智人(Homo sapiens)
<400> 4
atgttccctt ttgccttact atatgttctg tcagtttctt tcaggaaaat cttcatctta 60
caacttgtag ggctggtgtt aacttacgac ttcactaact gtgactttga gaagattaaa 120
gcagcctatc tcagtactat ttctaaagac ctgattacat atatgagtgg gaccaaaagt 180
accgagttca acaacaccgt ctcttgtagc aatcggccac attgccttac tgaaatccag 240
agcctaacct tcaatcccac cgccggctgc gcgtcgctcg ccaaagaaat gttcgccatg 300
aaaactaagg ctgccttagc tatctggtgc ccaggctatt cggaaactca gataaatgct 360
actcaggcaa tgaagaagag gagaaaaagg aaagtcacaa ccaataaatg tctggaacaa 420
gtgtcacaat tacaaggatt gtggcgtcgc ttcaatcgac ctttactgaa acaacagtaa 480
<210> 5
<211> 150
<212> PRT
<213> 人工序列
<220>
<223> 杂交体Tslp蛋白:(小鼠信号肽+人同种型1胞外+ C末端)
<400> 5
Met Val Leu Leu Arg Ser Leu Phe Ile Leu Gln Val Leu Val Arg Met
1 5 10 15
Gly Leu Thr Tyr Asp Phe Thr Asn Cys Asp Phe Glu Lys Ile Lys Ala
20 25 30
Ala Tyr Leu Ser Thr Ile Ser Lys Asp Leu Ile Thr Tyr Met Ser Gly
35 40 45
Thr Lys Ser Thr Glu Phe Asn Asn Thr Val Ser Cys Ser Asn Arg Pro
50 55 60
His Cys Leu Thr Glu Ile Gln Ser Leu Thr Phe Asn Pro Thr Ala Gly
65 70 75 80
Cys Ala Ser Leu Ala Lys Glu Met Phe Ala Met Lys Thr Lys Ala Ala
85 90 95
Leu Ala Ile Trp Cys Pro Gly Tyr Ser Glu Thr Gln Ile Asn Ala Thr
100 105 110
Gln Ala Met Lys Lys Arg Arg Lys Arg Lys Val Thr Thr Asn Lys Cys
115 120 125
Leu Glu Gln Val Ser Gln Leu Gln Gly Leu Trp Arg Arg Phe Asn Arg
130 135 140
Pro Leu Leu Lys Gln Gln
145 150
<210> 6
<211> 453
<212> DNA
<213> 人工序列
<220>
<223> 小鼠/人Tslp mRNA(CDS):(小鼠信号肽+人同种型1胞外+ C末端)
<400> 6
atggttcttc tcaggagcct cttcatcctg caagtactag tacggatggg gctaacttac 60
gacttcacta actgtgactt tgagaagatt aaagcagcct atctcagtac tatttctaaa 120
gacctgatta catatatgag tgggaccaaa agtaccgagt tcaacaacac cgtctcttgt 180
agcaatcggc cacattgcct tactgaaatc cagagcctaa ccttcaatcc caccgccggc 240
tgcgcgtcgc tcgccaaaga aatgttcgcc atgaaaacta aggctgcctt agctatctgg 300
tgcccaggct attcggaaac tcagataaat gctactcagg caatgaagaa gaggagaaaa 360
aggaaagtca caaccaataa atgtctggaa caagtgtcac aattacaagg attgtggcgt 420
cgcttcaatc gacctttact gaaacaacag taa 453
<210> 7
<211> 136
<212> PRT
<213> 褐家鼠(Rattus norvegicus)
<400> 7
Met Val Leu Phe Arg Tyr Leu Phe Ile Leu Gln Val Val Arg Leu Ala
1 5 10 15
Leu Thr Tyr Asn Phe Ser Asn Cys Asn Phe Glu Met Ile Leu Arg Ile
20 25 30
Tyr His Ala Thr Ile Phe Arg Asp Leu Leu Lys Asp Leu Asn Gly Ile
35 40 45
Leu Phe Asp Gln Ile Glu Asp Cys Asp Ser Arg Thr Ala Cys Leu Leu
50 55 60
Lys Ile Asp His His Thr Phe Asn Pro Val Pro Gly Cys Pro Ser Leu
65 70 75 80
Pro Glu Lys Ala Phe Ala Leu Lys Thr Lys Ala Ala Leu Ile Asn Tyr
85 90 95
Cys Pro Gly Tyr Ser Glu Thr Glu Arg Asn Gly Thr Leu Glu Met Thr
100 105 110
Arg Glu Ile Arg Asn Ile Cys Leu Asn Gln Thr Ser Gln Ile Leu Gly
115 120 125
Leu Trp Leu Ser Cys Ile Gln Ser
130 135
<210> 8
<211> 411
<212> DNA
<213> 褐家鼠(Rattus norvegicus)
<400> 8
atggttcttt tcaggtacct ctttatcctg caagtggtac ggctggcact aacttacaac 60
ttttctaact gtaacttcga gatgattttg agaatatatc atgcaacaat ttttcgtgac 120
ctgcttaaag atttgaatgg gatcttgttc gaccaaatcg aggactgtga cagcaggaca 180
gcttgtctcc tgaaaatcga ccaccatacc ttcaatcctg tccctggctg cccgtcactc 240
cccgagaaag cgttcgcttt gaaaacgaaa gcggccctca ttaactactg cccaggctac 300
tctgaaactg agagaaatgg tactctggaa atgacacgag aaatcagaaa catctgcctg 360
aatcaaacct cacaaattct aggattgtgg ctttcctgca ttcaatcttg a 411
<210> 9
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 9
cagatgcgga catccaaagg at 22
<210> 10
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 10
tactcacaag catagtgcta tgtgca 26
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 11
cccttccctc aagccataac 20
<210> 12
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 12
gcccagtgta ctactcaaag gta 23
<210> 13
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 13
tactgcaatc ctctttaaaa taagc 25
<210> 14
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 14
cccattgtct agatgtgtca caga 24
<210> 15
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 15
ggctgacaac agatatggat attgg 25
<210> 16
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 16
actgcttggt acagaatggg aatcc 25
<210> 17
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 17
cacggcttca tgtcttagct g 21
<210> 18
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 18
gtgctgagag acagggcatt c 21
<210> 19
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 19
tggagaagca catgcaatca taccgt 26
<210> 20
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 20
ggctgagtgg cactatgttt c 21
<210> 21
<211> 370
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 21
Met Ala Trp Ala Leu Ala Val Ile Leu Leu Pro Arg Leu Leu Ala Ala
1 5 10 15
Ala Ala Ala Ala Ala Ala Val Thr Ser Arg Gly Asp Val Thr Val Val
20 25 30
Cys His Asp Leu Glu Thr Val Glu Val Thr Trp Gly Ser Gly Pro Asp
35 40 45
His His Gly Ala Asn Leu Ser Leu Glu Phe Arg Tyr Gly Thr Gly Ala
50 55 60
Leu Gln Pro Cys Pro Arg Tyr Phe Leu Ser Gly Ala Gly Val Thr Ser
65 70 75 80
Gly Cys Ile Leu Pro Ala Ala Arg Ala Gly Leu Leu Glu Leu Ala Leu
85 90 95
Arg Asp Gly Gly Gly Ala Met Val Phe Lys Ala Arg Gln Arg Ala Ser
100 105 110
Ala Trp Leu Lys Pro Arg Pro Pro Trp Asn Val Thr Leu Leu Trp Thr
115 120 125
Pro Asp Gly Asp Val Thr Val Ser Trp Pro Ala His Ser Tyr Leu Gly
130 135 140
Leu Asp Tyr Glu Val Gln His Arg Glu Ser Asn Asp Asp Glu Asp Ala
145 150 155 160
Trp Gln Thr Thr Ser Gly Pro Cys Cys Asp Leu Thr Val Gly Gly Leu
165 170 175
Asp Pro Val Arg Cys Tyr Asp Phe Arg Val Arg Ala Ser Pro Arg Ala
180 185 190
Ala His Tyr Gly Leu Glu Ala Gln Pro Ser Glu Trp Thr Ala Val Thr
195 200 205
Arg Leu Ser Gly Ala Ala Ser Ala Gly Asp Pro Cys Ala Ala His Leu
210 215 220
Pro Pro Leu Ala Ser Cys Thr Ala Ser Pro Ala Pro Ser Pro Ala Leu
225 230 235 240
Ala Pro Pro Leu Leu Pro Leu Gly Cys Gly Leu Ala Ala Leu Leu Thr
245 250 255
Leu Ser Leu Leu Leu Ala Ala Leu Arg Leu Arg Arg Val Lys Asp Ala
260 265 270
Leu Leu Pro Cys Val Pro Asp Pro Ser Gly Ser Phe Pro Gly Leu Phe
275 280 285
Glu Lys His His Gly Asn Phe Gln Ala Trp Ile Ala Asp Ala Gln Ala
290 295 300
Thr Ala Pro Pro Ala Arg Thr Glu Glu Glu Asp Asp Leu Ile His Thr
305 310 315 320
Lys Ala Lys Arg Val Glu Pro Glu Asp Gly Thr Ser Leu Cys Thr Val
325 330 335
Pro Arg Pro Pro Ser Phe Glu Pro Arg Gly Pro Gly Gly Gly Ala Met
340 345 350
Val Ser Val Gly Gly Ala Thr Phe Met Val Gly Asp Ser Gly Tyr Met
355 360 365
Thr Leu
370
<210> 22
<211> 1113
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 22
atggcatggg cactcgcggt catcctcctg cctcggctcc ttgcggcggc agcggcggcg 60
gcggcggtga cgtcacgggg tgatgtcaca gtcgtctgcc atgacctgga gacggtggag 120
gtcacgtggg gctcgggccc cgaccaccac ggcgccaact tgagcctgga gttccgttat 180
ggcactggcg ccctgcaacc ctgcccgcga tatttcctgt ccggcgctgg tgtcacttcc 240
gggtgcatcc tccccgcggc gagggcgggg ctgctggagc tggcactgcg cgacggaggc 300
ggggccatgg tgtttaaggc taggcagcgc gcgtccgcct ggctgaagcc ccgcccacct 360
tggaatgtga cgctgctctg gacaccagac ggggacgtga ctgtctcctg gcctgcccac 420
tcctacctgg gcctggacta cgaggtgcag caccgggaga gcaatgacga tgaggacgcc 480
tggcagacga cctcagggcc ctgctgtgac ttgacagtgg gcgggctcga ccccgtacgc 540
tgctatgact tccgggttcg ggcgtcgccc cgggccgcgc actatggcct ggaggcgcag 600
cctagcgagt ggacagcggt gacaaggctt tccggggcag catccgcggg tgacccctgc 660
gccgcccacc ttccccccct agcctcctgt accgcaagcc ccgccccatc cccggccctg 720
gccccgcccc tcctgcccct gggctgcggc ctagcagcgc tgctgacact gtccctgctc 780
ctggccgccc tgaggcttcg cagggtgaaa gatgcgctgc tgccctgcgt ccctgacccc 840
agcggctcct tccctggact ctttgagaag catcacggga acttccaggc ctggattgcg 900
gacgcccagg ccacagcccc gccagccagg accgaggagg aagatgacct catccacacc 960
aaggctaaga gggtggagcc cgaggacggc acctccctct gcaccgtgcc aaggccaccc 1020
agcttcgagc caagggggcc gggaggcggg gccatggtgt cagtgggcgg ggccacgttc 1080
atggtgggcg acagcggcta catgaccctg tga 1113
<210> 23
<211> 371
<212> PRT
<213> 智人(Homo sapiens)
<400> 23
Met Gly Arg Leu Val Leu Leu Trp Gly Ala Ala Val Phe Leu Leu Gly
1 5 10 15
Gly Trp Met Ala Leu Gly Gln Gly Gly Ala Ala Glu Gly Val Gln Ile
20 25 30
Gln Ile Ile Tyr Phe Asn Leu Glu Thr Val Gln Val Thr Trp Asn Ala
35 40 45
Ser Lys Tyr Ser Arg Thr Asn Leu Thr Phe His Tyr Arg Phe Asn Gly
50 55 60
Asp Glu Ala Tyr Asp Gln Cys Thr Asn Tyr Leu Leu Gln Glu Gly His
65 70 75 80
Thr Ser Gly Cys Leu Leu Asp Ala Glu Gln Arg Asp Asp Ile Leu Tyr
85 90 95
Phe Ser Ile Arg Asn Gly Thr His Pro Val Phe Thr Ala Ser Arg Trp
100 105 110
Met Val Tyr Tyr Leu Lys Pro Ser Ser Pro Lys His Val Arg Phe Ser
115 120 125
Trp His Gln Asp Ala Val Thr Val Thr Cys Ser Asp Leu Ser Tyr Gly
130 135 140
Asp Leu Leu Tyr Glu Val Gln Tyr Arg Ser Pro Phe Asp Thr Glu Trp
145 150 155 160
Gln Ser Lys Gln Glu Asn Thr Cys Asn Val Thr Ile Glu Gly Leu Asp
165 170 175
Ala Glu Lys Cys Tyr Ser Phe Trp Val Arg Val Lys Ala Met Glu Asp
180 185 190
Val Tyr Gly Pro Asp Thr Tyr Pro Ser Asp Trp Ser Glu Val Thr Cys
195 200 205
Trp Gln Arg Gly Glu Ile Arg Asp Ala Cys Ala Glu Thr Pro Thr Pro
210 215 220
Pro Lys Pro Lys Leu Ser Lys Phe Ile Leu Ile Ser Ser Leu Ala Ile
225 230 235 240
Leu Leu Met Val Ser Leu Leu Leu Leu Ser Leu Trp Lys Leu Trp Arg
245 250 255
Val Lys Lys Phe Leu Ile Pro Ser Val Pro Asp Pro Lys Ser Ile Phe
260 265 270
Pro Gly Leu Phe Glu Ile His Gln Gly Asn Phe Gln Glu Trp Ile Thr
275 280 285
Asp Thr Gln Asn Val Ala His Leu His Lys Met Ala Gly Ala Glu Gln
290 295 300
Glu Ser Gly Pro Glu Glu Pro Leu Val Val Gln Leu Ala Lys Thr Glu
305 310 315 320
Ala Glu Ser Pro Arg Met Leu Asp Pro Gln Thr Glu Glu Lys Glu Ala
325 330 335
Ser Gly Gly Ser Leu Gln Leu Pro His Gln Pro Leu Gln Gly Gly Asp
340 345 350
Val Val Thr Ile Gly Gly Phe Thr Phe Val Met Asn Asp Arg Ser Tyr
355 360 365
Val Ala Leu
370
<210> 24
<211> 1116
<212> DNA
<213> 智人(Homo sapiens)
<400> 24
atggggcggc tggttctgct gtggggagct gccgtctttc tgctgggagg ctggatggct 60
ttggggcaag gaggagcagc agaaggagta cagattcaga tcatctactt caatttagaa 120
accgtgcagg tgacatggaa tgccagcaaa tactccagga ccaacctgac tttccactac 180
agattcaacg gtgatgaggc ctatgaccag tgcaccaact accttctcca ggaaggtcac 240
acttcggggt gcctcctaga cgcagagcag cgagacgaca ttctctattt ctccatcagg 300
aatgggacgc accccgtttt caccgcaagt cgctggatgg tttattacct gaaacccagt 360
tccccgaagc acgtgagatt ttcgtggcat caggatgcag tgacggtgac gtgttctgac 420
ctgtcctacg gggatctcct ctatgaggtt cagtaccgga gccccttcga caccgagtgg 480
cagtccaaac aggaaaatac ctgcaacgtc accatagaag gcttggatgc cgagaagtgt 540
tactctttct gggtcagggt gaaggctatg gaggatgtat atgggccaga cacataccca 600
agcgactggt cagaggtgac atgctggcag agaggcgaga ttcgggatgc ctgtgcagag 660
acaccaacgc ctcccaaacc aaagctgtcc aaatttattt taatttccag cctggccatc 720
cttctgatgg tgtctctcct ccttctgtct ttatggaaat tatggagagt gaagaagttt 780
ctcattccca gcgtgccaga cccgaaatcc atcttccccg ggctctttga gatacaccaa 840
gggaacttcc aggagtggat cacagacacc cagaacgtgg cccacctcca caagatggca 900
ggtgcagagc aagaaagtgg ccccgaggag cccctggtag tccagttggc caagactgaa 960
gccgagtctc ccaggatgct ggacccacag accgaggaga aagaggcctc tgggggatcc 1020
ctccagcttc cccaccagcc cctccaaggc ggtgatgtgg tcacaatcgg gggcttcacc 1080
tttgtgatga atgaccgctc ctacgtggcg ttgtga 1116
<210> 25
<211> 358
<212> PRT
<213> 人工序列
<220>
<223> 杂交体Tslpr蛋白:(小鼠信号肽 +大多数人胞外+小鼠TM +小鼠C末端)
<400> 25
Met Ala Trp Ala Leu Ala Val Ile Leu Leu Pro Arg Leu Leu Ala Ala
1 5 10 15
Ala Ala Ala Ala Ala Ala Val Thr Ser Arg Ala Glu Gly Val Gln Ile
20 25 30
Gln Ile Ile Tyr Phe Asn Leu Glu Thr Val Gln Val Thr Trp Asn Ala
35 40 45
Ser Lys Tyr Ser Arg Thr Asn Leu Thr Phe His Tyr Arg Phe Asn Gly
50 55 60
Asp Glu Ala Tyr Asp Gln Cys Thr Asn Tyr Leu Leu Gln Glu Gly His
65 70 75 80
Thr Ser Gly Cys Leu Leu Asp Ala Glu Gln Arg Asp Asp Ile Leu Tyr
85 90 95
Phe Ser Ile Arg Asn Gly Thr His Pro Val Phe Thr Ala Ser Arg Trp
100 105 110
Met Val Tyr Tyr Leu Lys Pro Ser Ser Pro Lys His Val Arg Phe Ser
115 120 125
Trp His Gln Asp Ala Val Thr Val Thr Cys Ser Asp Leu Ser Tyr Gly
130 135 140
Asp Leu Leu Tyr Glu Val Gln Tyr Arg Ser Pro Phe Asp Thr Glu Trp
145 150 155 160
Gln Ser Lys Gln Glu Asn Thr Cys Asn Val Thr Ile Glu Gly Leu Asp
165 170 175
Ala Glu Lys Cys Tyr Ser Phe Trp Val Arg Val Lys Ala Met Glu Asp
180 185 190
Val Tyr Gly Pro Asp Thr Tyr Pro Ser Asp Trp Ser Glu Val Thr Cys
195 200 205
Trp Gln Arg Gly Glu Ile Arg Asp Ala Cys Ala Glu Thr Pro Thr Pro
210 215 220
Pro Lys Pro Lys Leu Ser Lys Leu Leu Pro Leu Gly Cys Gly Leu Ala
225 230 235 240
Ala Leu Leu Thr Leu Ser Leu Leu Leu Ala Ala Leu Arg Leu Arg Arg
245 250 255
Val Lys Asp Ala Leu Leu Pro Cys Val Pro Asp Pro Ser Gly Ser Phe
260 265 270
Pro Gly Leu Phe Glu Lys His His Gly Asn Phe Gln Ala Trp Ile Ala
275 280 285
Asp Ala Gln Ala Thr Ala Pro Pro Ala Arg Thr Glu Glu Glu Asp Asp
290 295 300
Leu Ile His Thr Lys Ala Lys Arg Val Glu Pro Glu Asp Gly Thr Ser
305 310 315 320
Leu Cys Thr Val Pro Arg Pro Pro Ser Phe Glu Pro Arg Gly Pro Gly
325 330 335
Gly Gly Ala Met Val Ser Val Gly Gly Ala Thr Phe Met Val Gly Asp
340 345 350
Ser Gly Tyr Met Thr Leu
355
<210> 26
<211> 1077
<212> DNA
<213> 人工序列
<220>
<223> 杂交体Tslpr mRNA
<400> 26
atggcatggg cactcgcggt catcctcctg cctcggctcc ttgcggcggc agcggcggcg 60
gcggcggtga cgtcacgggc agaaggagta cagattcaga tcatctactt caatttagaa 120
accgtgcagg tgacatggaa tgccagcaaa tactccagga ccaacctgac tttccactac 180
agattcaacg gtgatgaggc ctatgaccag tgcaccaact accttctcca ggaaggtcac 240
acttcggggt gcctcctaga cgcagagcag cgagacgaca ttctctattt ctccatcagg 300
aatgggacgc accccgtttt caccgcaagt cgctggatgg tttattacct gaaacccagt 360
tccccgaagc acgtgagatt ttcgtggcat caggatgcag tgacggtgac gtgttctgac 420
ctgtcctacg gggatctcct ctatgaggtt cagtaccgga gccccttcga caccgagtgg 480
cagtccaaac aggaaaatac ctgcaacgtc accatagaag gcttggatgc cgagaagtgt 540
tactctttct gggtcagggt gaaggctatg gaggatgtat atgggccaga cacataccca 600
agcgactggt cagaggtgac atgctggcag agaggcgaga ttcgggatgc ctgtgcagag 660
acaccaacgc ctcccaaacc aaagctgtcc aaactcctgc ccctgggctg cggcctagca 720
gcgctgctga cactgtccct gctcctggcc gccctgaggc ttcgcagggt gaaagatgcg 780
ctgctgccct gcgtccctga ccccagcggc tccttccctg gactctttga gaagcatcac 840
gggaacttcc aggcctggat tgcggacgcc caggccacag ccccgccagc caggaccgag 900
gaggaagatg acctcatcca caccaaggct aagagggtgg agcccgagga cggcacctcc 960
ctctgcaccg tgccaaggcc acccagcttc gagccaaggg ggccgggagg cggggccatg 1020
gtgtcagtgg gcggggccac gttcatggtg ggcgacagcg gctacatgac cctgtga 1077
<210> 27
<211> 360
<212> PRT
<213> 褐家鼠(Rattus norvegicus)
<400> 27
Met Arg Ala Val Thr Trp Ala Ile Val Ala Met Leu Leu Pro Arg Val
1 5 10 15
Leu Gly Ala Ile Pro Thr Arg Thr Pro Arg Thr Gly Gly Val Gly Asp
20 25 30
Thr Leu Ser Val Ala Ile Val Cys His Asp Leu Glu Ser Val Glu Val
35 40 45
Thr Trp Gly Pro Gly Ser Ala His His Gly Leu Ser Ala Asn Leu Ser
50 55 60
Leu Glu Phe Arg Tyr Gly Asn Gln Val Pro Gln Pro Cys Pro His Tyr
65 70 75 80
Phe Leu Leu Asp Ser Val Arg Ala Gly Cys Val Leu Pro Met Gly Lys
85 90 95
Gly Leu Leu Glu Val Val Leu Arg Glu Gly Gly Gly Ala Lys Leu Phe
100 105 110
Ser Arg Lys Lys Lys Ala Ser Ala Trp Leu Arg Pro Arg Pro Pro Trp
115 120 125
Asn Val Thr Leu Ser Trp Val Gly Asp Thr Val Ala Val Ser Cys Pro
130 135 140
Ser His Ser Tyr Pro Gly Leu Glu Tyr Glu Val Gln His Arg Asp Asp
145 150 155 160
Phe Asp Pro Glu Trp Gln Ser Thr Ser Ala Pro Phe Cys Asn Leu Thr
165 170 175
Val Gly Gly Leu Asp Pro Gly Arg Cys Tyr Asp Phe Arg Val Arg Ala
180 185 190
Thr Pro Gln Asp Phe Tyr Tyr Gly Pro Glu Ala Arg Pro Ser Lys Trp
195 200 205
Thr Gly Val Ala Ser Leu Gln Gly Val Gly Pro Thr Gly Ser Cys Thr
210 215 220
Gly Pro Thr Leu Pro Arg Thr Pro Gly Thr Pro Thr Pro Pro Leu Ala
225 230 235 240
Leu Ala Cys Gly Leu Ala Val Ala Leu Leu Thr Leu Val Leu Leu Leu
245 250 255
Ala Leu Leu Arg Met Arg Arg Val Lys Glu Ala Leu Leu Pro Gly Val
260 265 270
Pro Asp Pro Arg Gly Ser Phe Pro Gly Leu Phe Glu Lys His His Gly
275 280 285
Asn Phe Gln Ala Trp Ile Ala Asp Ser Gln Ala Ala Val Pro Thr Val
290 295 300
Pro Glu Gln Asp Lys Asp Asp Asp Val Ile Arg Pro Gln Thr Lys Gly
305 310 315 320
Val Glu Thr Gln Glu Asp Asp Asp Val Ile Ala Pro Gly Ser Pro Cys
325 330 335
Leu Gly Gly Gly Ala Leu Met Ser Val Gly Gly Ala Ser Phe Leu Met
340 345 350
Gly Asp Ser Gly Tyr Thr Thr Leu
355 360
<210> 28
<211> 1209
<212> DNA
<213> 褐家鼠(Rattus norvegicus)
<400> 28
accctagaac tcgcgacccc gccgaggccc cgcccctatc atgcgagctg tgacctgggc 60
catcgtggcc atgctcctgc cgcgggtctt gggggcgatt ccgacgagga cgccacggac 120
agggggcgtc ggtgacaccc tctctgttgc cattgtttgc catgacctgg agagcgtgga 180
agtcacgtgg ggcccgggct ctgcccacca tgggctgtca gccaatctca gcctggagtt 240
ccggtatgga aaccaggtcc cccagccctg cccacactac tttctgttgg acagcgtcag 300
agcaggctgt gtcctcccca tggggaaggg gcttctggag gtggtgctgc gtgagggagg 360
cggagccaag ctgttctccc ggaagaagaa ggcatcggcc tggctgaggc cccgccctcc 420
atggaacgtc accctgagct gggtagggga cactgttgct gtttcctgcc cctcccactc 480
ttaccctggg ctggaatatg aggtgcagca cagagatgac ttcgaccctg aatggcagtc 540
gacctctgca ccattctgca acctgacagt gggcgggctg gaccctgggc gctgctacga 600
cttccgggtg cgggcgacgc cccaggattt ctactatggc cccgaggcgc ggcccagcaa 660
gtggacaggc gtggccagcc tgcagggagt gggacccaca ggctcctgca ctggccccac 720
cctcccgagg acccccggga cccccacccc acctctcgcc ctggcctgtg gccttgcggt 780
ggccctgctc accctggtgc tgctcctggc cctgctgcgg atgcgcaggg tgaaggaagc 840
cctgctgcct ggtgtccccg acccccgcgg ctccttccct ggcctcttcg agaaacatca 900
tgggaacttc caggcttgga tcgcagattc tcaggctgct gtccctacgg tcccagagca 960
ggacaaagat gatgatgtca tccggcctca gaccaagggg gtggaaactc aggaggatga 1020
tgatgtcatt gccccggggt ccccatgcct tgggggaggg gccctgatgt cggtgggcgg 1080
ggcctcgttc ctgatgggag acagcggcta caccaccctg tgacaaccct gtgttgaccc 1140
ctgcctggac cctcgttgct gtcacttatg ccccgcttca tttgcataaa tatgaatttg 1200
ttaatctgg 1209
<210> 29
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 29
tgcctcaccg tgaacttcat g 21
<210> 30
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 30
cgtctctctg tgtctagcag aagga 25
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 31
tcacctgcac ggtttctaaa ttg 23
<210> 32
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 32
cagccgcacg tcatgttg 18
<210> 33
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 33
tgacagccgc cttttcattt tgtttca 27
<210> 34
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 34
ggacagcttt ggtttggga 19
<210> 35
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 35
gctagctgct catttgcata ttcg 24
<210> 36
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 36
agaagcgctt tccatattca tgagccc 27
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 37
gggcgacacc tcatttgcat 20
<210> 38
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 38
gggtctgggt aagatgaact ca 22
<210> 39
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 39
tcggctcctg gatgcttgac a 21
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 40
catccgggtc accaatgatg 20
<210> 41
<211> 459
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 41
Met Met Ala Leu Gly Arg Ala Phe Ala Ile Val Phe Cys Leu Ile Gln
1 5 10 15
Ala Val Ser Gly Glu Ser Gly Asn Ala Gln Asp Gly Asp Leu Glu Asp
20 25 30
Ala Asp Ala Asp Asp His Ser Phe Trp Cys His Ser Gln Leu Glu Val
35 40 45
Asp Gly Ser Gln His Leu Leu Thr Cys Ala Phe Asn Asp Ser Asp Ile
50 55 60
Asn Thr Ala Asn Leu Glu Phe Gln Ile Cys Gly Ala Leu Leu Arg Val
65 70 75 80
Lys Cys Leu Thr Leu Asn Lys Leu Gln Asp Ile Tyr Phe Ile Lys Thr
85 90 95
Ser Glu Phe Leu Leu Ile Gly Ser Ser Asn Ile Cys Val Lys Leu Gly
100 105 110
Gln Lys Asn Leu Thr Cys Lys Asn Met Ala Ile Asn Thr Ile Val Lys
115 120 125
Ala Glu Ala Pro Ser Asp Leu Lys Val Val Tyr Arg Lys Glu Ala Asn
130 135 140
Asp Phe Leu Val Thr Phe Asn Ala Pro His Leu Lys Lys Lys Tyr Leu
145 150 155 160
Lys Lys Val Lys His Asp Val Ala Tyr Arg Pro Ala Arg Gly Glu Ser
165 170 175
Asn Trp Thr His Val Ser Leu Phe His Thr Arg Thr Thr Ile Pro Gln
180 185 190
Arg Lys Leu Arg Pro Lys Ala Met Tyr Glu Ile Lys Val Arg Ser Ile
195 200 205
Pro His Asn Asp Tyr Phe Lys Gly Phe Trp Ser Glu Trp Ser Pro Ser
210 215 220
Ser Thr Phe Glu Thr Pro Glu Pro Lys Asn Gln Gly Gly Trp Asp Pro
225 230 235 240
Val Leu Pro Ser Val Thr Ile Leu Ser Leu Phe Ser Val Phe Leu Leu
245 250 255
Val Ile Leu Ala His Val Leu Trp Lys Lys Arg Ile Lys Pro Val Val
260 265 270
Trp Pro Ser Leu Pro Asp His Lys Lys Thr Leu Glu Gln Leu Cys Lys
275 280 285
Lys Pro Lys Thr Ser Leu Asn Val Ser Phe Asn Pro Glu Ser Phe Leu
290 295 300
Asp Cys Gln Ile His Glu Val Lys Gly Val Glu Ala Arg Asp Glu Val
305 310 315 320
Glu Ser Phe Leu Pro Asn Asp Leu Pro Ala Gln Pro Glu Glu Leu Glu
325 330 335
Thr Gln Gly His Arg Ala Ala Val His Ser Ala Asn Arg Ser Pro Glu
340 345 350
Thr Ser Val Ser Pro Pro Glu Thr Val Arg Arg Glu Ser Pro Leu Arg
355 360 365
Cys Leu Ala Arg Asn Leu Ser Thr Cys Asn Ala Pro Pro Leu Leu Ser
370 375 380
Ser Arg Ser Pro Asp Tyr Arg Asp Gly Asp Arg Asn Arg Pro Pro Val
385 390 395 400
Tyr Gln Asp Leu Leu Pro Asn Ser Gly Asn Thr Asn Val Pro Val Pro
405 410 415
Val Pro Gln Pro Leu Pro Phe Gln Ser Gly Ile Leu Ile Pro Val Ser
420 425 430
Gln Arg Gln Pro Ile Ser Thr Ser Ser Val Leu Asn Gln Glu Glu Ala
435 440 445
Tyr Val Thr Met Ser Ser Phe Tyr Gln Asn Lys
450 455
<210> 42
<211> 1380
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 42
atgatggctc tgggtagagc tttcgctata gttttctgct taattcaagc tgtttctgga 60
gaaagtggaa atgcccagga tggagaccta gaagatgcag acgcggacga tcactccttc 120
tggtgccaca gccagttgga agtggatgga agtcaacatt tattgacttg tgcttttaat 180
gactcagaca tcaacacagc taatctggaa tttcaaatat gtggggctct tttacgagtg 240
aaatgcctaa ctcttaacaa gctgcaagat atatatttta taaagacatc agaattctta 300
ctgattggta gcagcaatat atgtgtgaag cttggacaaa agaatttaac ttgcaaaaat 360
atggctataa acacaatagt taaagccgag gctccctctg acctgaaagt cgtttatcgc 420
aaagaagcaa atgatttttt ggtgacattt aatgcacctc acttgaaaaa gaaatattta 480
aaaaaagtaa agcatgatgt ggcctaccgc ccagcaaggg gtgaaagcaa ctggacgcat 540
gtatctttat tccacacaag aacaacaatc ccacagagaa aactacgacc aaaagcaatg 600
tatgaaatca aagtccgatc cattccccat aacgattact tcaaaggctt ctggagcgag 660
tggagtccaa gttctacctt cgaaactcca gaacccaaga atcaaggagg atgggatcct 720
gtcttgccaa gtgtcaccat tctgagtttg ttctctgtgt ttttgttggt catcttagcc 780
catgtgctat ggaaaaaaag gattaaacct gtcgtatggc ctagtctccc cgatcataag 840
aaaactctgg aacaactatg taagaagcca aaaacgagtc tgaatgtgag tttcaatccc 900
gaaagtttcc tggactgcca gattcatgag gtgaaaggcg ttgaagccag ggacgaggtg 960
gaaagttttc tgcccaatga tcttcctgca cagccagagg agttggagac acagggacac 1020
agagccgctg tacacagtgc aaaccgctcg cctgagactt cagtcagccc accagaaaca 1080
gttagaagag agtcaccctt aagatgcctg gctagaaatc tgagtacctg caatgcccct 1140
ccactccttt cctctaggtc ccctgactac agagatggtg acagaaatag gcctcctgtg 1200
tatcaagact tgctgccaaa ctctggaaac acaaatgtcc ctgtccctgt ccctcaacca 1260
ttgcctttcc agtcgggaat cctgatacca gtttctcaga gacagcccat ctccacttcc 1320
tcagtactga atcaagaaga agcgtatgtc accatgtcta gtttttacca aaacaaatga 1380
<210> 43
<211> 459
<212> PRT
<213> 智人(Homo sapiens)
<400> 43
Met Thr Ile Leu Gly Thr Thr Phe Gly Met Val Phe Ser Leu Leu Gln
1 5 10 15
Val Val Ser Gly Glu Ser Gly Tyr Ala Gln Asn Gly Asp Leu Glu Asp
20 25 30
Ala Glu Leu Asp Asp Tyr Ser Phe Ser Cys Tyr Ser Gln Leu Glu Val
35 40 45
Asn Gly Ser Gln His Ser Leu Thr Cys Ala Phe Glu Asp Pro Asp Val
50 55 60
Asn Ile Thr Asn Leu Glu Phe Glu Ile Cys Gly Ala Leu Val Glu Val
65 70 75 80
Lys Cys Leu Asn Phe Arg Lys Leu Gln Glu Ile Tyr Phe Ile Glu Thr
85 90 95
Lys Lys Phe Leu Leu Ile Gly Lys Ser Asn Ile Cys Val Lys Val Gly
100 105 110
Glu Lys Ser Leu Thr Cys Lys Lys Ile Asp Leu Thr Thr Ile Val Lys
115 120 125
Pro Glu Ala Pro Phe Asp Leu Ser Val Val Tyr Arg Glu Gly Ala Asn
130 135 140
Asp Phe Val Val Thr Phe Asn Thr Ser His Leu Gln Lys Lys Tyr Val
145 150 155 160
Lys Val Leu Met His Asp Val Ala Tyr Arg Gln Glu Lys Asp Glu Asn
165 170 175
Lys Trp Thr His Val Asn Leu Ser Ser Thr Lys Leu Thr Leu Leu Gln
180 185 190
Arg Lys Leu Gln Pro Ala Ala Met Tyr Glu Ile Lys Val Arg Ser Ile
195 200 205
Pro Asp His Tyr Phe Lys Gly Phe Trp Ser Glu Trp Ser Pro Ser Tyr
210 215 220
Tyr Phe Arg Thr Pro Glu Ile Asn Asn Ser Ser Gly Glu Met Asp Pro
225 230 235 240
Ile Leu Leu Thr Ile Ser Ile Leu Ser Phe Phe Ser Val Ala Leu Leu
245 250 255
Val Ile Leu Ala Cys Val Leu Trp Lys Lys Arg Ile Lys Pro Ile Val
260 265 270
Trp Pro Ser Leu Pro Asp His Lys Lys Thr Leu Glu His Leu Cys Lys
275 280 285
Lys Pro Arg Lys Asn Leu Asn Val Ser Phe Asn Pro Glu Ser Phe Leu
290 295 300
Asp Cys Gln Ile His Arg Val Asp Asp Ile Gln Ala Arg Asp Glu Val
305 310 315 320
Glu Gly Phe Leu Gln Asp Thr Phe Pro Gln Gln Leu Glu Glu Ser Glu
325 330 335
Lys Gln Arg Leu Gly Gly Asp Val Gln Ser Pro Asn Cys Pro Ser Glu
340 345 350
Asp Val Val Ile Thr Pro Glu Ser Phe Gly Arg Asp Ser Ser Leu Thr
355 360 365
Cys Leu Ala Gly Asn Val Ser Ala Cys Asp Ala Pro Ile Leu Ser Ser
370 375 380
Ser Arg Ser Leu Asp Cys Arg Glu Ser Gly Lys Asn Gly Pro His Val
385 390 395 400
Tyr Gln Asp Leu Leu Leu Ser Leu Gly Thr Thr Asn Ser Thr Leu Pro
405 410 415
Pro Pro Phe Ser Leu Gln Ser Gly Ile Leu Thr Leu Asn Pro Val Ala
420 425 430
Gln Gly Gln Pro Ile Leu Thr Ser Leu Gly Ser Asn Gln Glu Glu Ala
435 440 445
Tyr Val Thr Met Ser Ser Phe Tyr Gln Asn Gln
450 455
<210> 44
<211> 1380
<212> DNA
<213> 智人(Homo sapiens)
<400> 44
atgacaattc taggtacaac ttttggcatg gttttttctt tacttcaagt cgtttctgga 60
gaaagtggct atgctcaaaa tggagacttg gaagatgcag aactggatga ctactcattc 120
tcatgctata gccagttgga agtgaatgga tcgcagcact cactgacctg tgcttttgag 180
gacccagatg tcaacatcac caatctggaa tttgaaatat gtggggccct cgtggaggta 240
aagtgcctga atttcaggaa actacaagag atatatttca tcgagacaaa gaaattctta 300
ctgattggaa agagcaatat atgtgtgaag gttggagaaa agagtctaac ctgcaaaaaa 360
atagacctaa ccactatagt taaacctgag gctccttttg acctgagtgt cgtctatcgg 420
gaaggagcca atgactttgt ggtgacattt aatacatcac acttgcaaaa gaagtatgta 480
aaagttttaa tgcacgatgt agcttaccgc caggaaaagg atgaaaacaa atggacgcat 540
gtgaatttat ccagcacaaa gctgacactc ctgcagagaa agctccaacc ggcagcaatg 600
tatgagatta aagttcgatc catccctgat cactatttta aaggcttctg gagtgaatgg 660
agtccaagtt attacttcag aactccagag atcaataata gctcagggga gatggatcct 720
atcttactaa ccatcagcat tttgagtttt ttctctgtcg ctctgttggt catcttggcc 780
tgtgtgttat ggaaaaaaag gattaagcct atcgtatggc ccagtctccc cgatcataag 840
aagactctgg aacatctttg taagaaacca agaaaaaatt taaatgtgag tttcaatcct 900
gaaagtttcc tggactgcca gattcatagg gtggatgaca ttcaagctag agatgaagtg 960
gaaggttttc tgcaagatac gtttcctcag caactagaag aatctgagaa gcagaggctt 1020
ggaggggatg tgcagagccc caactgccca tctgaggatg tagtcatcac tccagaaagc 1080
tttggaagag attcatccct cacatgcctg gctgggaatg tcagtgcatg tgacgcccct 1140
attctctcct cttccaggtc cctagactgc agggagagtg gcaagaatgg gcctcatgtg 1200
taccaggacc tcctgcttag ccttgggact acaaacagca cgctgccccc tccattttct 1260
ctccaatctg gaatcctgac attgaaccca gttgctcagg gtcagcccat tcttacttcc 1320
ctgggatcaa atcaagaaga agcatatgtc accatgtcca gcttctacca aaaccagtga 1380
<210> 45
<211> 459
<212> PRT
<213> 人工序列
<220>
<223> 小鼠/人杂交体Il7ra蛋白
<400> 45
Met Met Ala Leu Gly Arg Ala Phe Ala Ile Val Phe Cys Leu Ile Gln
1 5 10 15
Ala Val Ser Gly Glu Ser Gly Tyr Ala Gln Asn Gly Asp Leu Glu Asp
20 25 30
Ala Glu Leu Asp Asp Tyr Ser Phe Ser Cys Tyr Ser Gln Leu Glu Val
35 40 45
Asn Gly Ser Gln His Ser Leu Thr Cys Ala Phe Glu Asp Pro Asp Val
50 55 60
Asn Ile Thr Asn Leu Glu Phe Glu Ile Cys Gly Ala Leu Val Glu Val
65 70 75 80
Lys Cys Leu Asn Phe Arg Lys Leu Gln Glu Ile Tyr Phe Ile Glu Thr
85 90 95
Lys Lys Phe Leu Leu Ile Gly Lys Ser Asn Ile Cys Val Lys Val Gly
100 105 110
Glu Lys Ser Leu Thr Cys Lys Lys Ile Asp Leu Thr Thr Ile Val Lys
115 120 125
Pro Glu Ala Pro Phe Asp Leu Ser Val Val Tyr Arg Glu Gly Ala Asn
130 135 140
Asp Phe Val Val Thr Phe Asn Thr Ser His Leu Gln Lys Lys Tyr Val
145 150 155 160
Lys Val Leu Met His Asp Val Ala Tyr Arg Gln Glu Lys Asp Glu Asn
165 170 175
Lys Trp Thr His Val Asn Leu Ser Ser Thr Lys Leu Thr Leu Leu Gln
180 185 190
Arg Lys Leu Gln Pro Ala Ala Met Tyr Glu Ile Lys Val Arg Ser Ile
195 200 205
Pro Asp His Tyr Phe Lys Gly Phe Trp Ser Glu Trp Ser Pro Ser Tyr
210 215 220
Tyr Phe Arg Thr Pro Glu Ile Asn Asn Ser Ser Gly Gly Trp Asp Pro
225 230 235 240
Val Leu Pro Ser Val Thr Ile Leu Ser Leu Phe Ser Val Phe Leu Leu
245 250 255
Val Ile Leu Ala His Val Leu Trp Lys Lys Arg Ile Lys Pro Val Val
260 265 270
Trp Pro Ser Leu Pro Asp His Lys Lys Thr Leu Glu Gln Leu Cys Lys
275 280 285
Lys Pro Lys Thr Ser Leu Asn Val Ser Phe Asn Pro Glu Ser Phe Leu
290 295 300
Asp Cys Gln Ile His Glu Val Lys Gly Val Glu Ala Arg Asp Glu Val
305 310 315 320
Glu Ser Phe Leu Pro Asn Asp Leu Pro Ala Gln Pro Glu Glu Leu Glu
325 330 335
Thr Gln Gly His Arg Ala Ala Val His Ser Ala Asn Arg Ser Pro Glu
340 345 350
Thr Ser Val Ser Pro Pro Glu Thr Val Arg Arg Glu Ser Pro Leu Arg
355 360 365
Cys Leu Ala Arg Asn Leu Ser Thr Cys Asn Ala Pro Pro Leu Leu Ser
370 375 380
Ser Arg Ser Pro Asp Tyr Arg Asp Gly Asp Arg Asn Arg Pro Pro Val
385 390 395 400
Tyr Gln Asp Leu Leu Pro Asn Ser Gly Asn Thr Asn Val Pro Val Pro
405 410 415
Val Pro Gln Pro Leu Pro Phe Gln Ser Gly Ile Leu Ile Pro Val Ser
420 425 430
Gln Arg Gln Pro Ile Ser Thr Ser Ser Val Leu Asn Gln Glu Glu Ala
435 440 445
Tyr Val Thr Met Ser Ser Phe Tyr Gln Asn Lys
450 455
<210> 46
<211> 1380
<212> DNA
<213> 人工序列
<220>
<223> 小鼠/人杂交体Il7ra mRNA
<400> 46
atgatggctc tgggtagagc tttcgctata gttttctgct taattcaagc tgtttctgga 60
gaaagtggct atgctcaaaa tggagacttg gaagatgcag aactggatga ctactcattc 120
tcatgctata gccagttgga agtgaatgga tcgcagcact cactgacctg tgcttttgag 180
gacccagatg tcaacatcac caatctggaa tttgaaatat gtggggccct cgtggaggta 240
aagtgcctga atttcaggaa actacaagag atatatttca tcgagacaaa gaaattctta 300
ctgattggaa agagcaatat atgtgtgaag gttggagaaa agagtctaac ctgcaaaaaa 360
atagacctaa ccactatagt taaacctgag gctccttttg acctgagtgt cgtctatcgg 420
gaaggagcca atgactttgt ggtgacattt aatacatcac acttgcaaaa gaagtatgta 480
aaagttttaa tgcacgatgt agcttaccgc caggaaaagg atgaaaacaa atggacgcat 540
gtgaatttat ccagcacaaa gctgacactc ctgcagagaa agctccaacc ggcagcaatg 600
tatgagatta aagttcgatc catccctgat cactatttta aaggcttctg gagtgaatgg 660
agtccaagtt attacttcag aactccagag atcaataata gctcaggagg atgggatcct 720
gtcttgccaa gtgtcaccat tctgagtttg ttctctgtgt ttttgttggt catcttagcc 780
catgtgctat ggaaaaaaag gattaaacct gtcgtatggc ctagtctccc cgatcataag 840
aaaactctgg aacaactatg taagaagcca aaaacgagtc tgaatgtgag tttcaatccc 900
gaaagtttcc tggactgcca gattcatgag gtgaaaggcg ttgaagccag ggacgaggtg 960
gaaagttttc tgcccaatga tcttcctgca cagccagagg agttggagac acagggacac 1020
agagccgctg tacacagtgc aaaccgctcg cctgagactt cagtcagccc accagaaaca 1080
gttagaagag agtcaccctt aagatgcctg gctagaaatc tgagtacctg caatgcccct 1140
ccactccttt cctctaggtc ccctgactac agagatggtg acagaaatag gcctcctgtg 1200
tatcaagact tgctgccaaa ctctggaaac acaaatgtcc ctgtccctgt ccctcaacca 1260
ttgcctttcc agtcgggaat cctgatacca gtttctcaga gacagcccat ctccacttcc 1320
tcagtactga atcaagaaga agcgtatgtc accatgtcta gtttttacca aaacaaatga 1380
<210> 47
<211> 457
<212> PRT
<213> 褐家鼠(Rattus norvegicus)
<400> 47
Met Met Ala Leu Gly Arg Ala Phe Ala Ile Val Phe Cys Leu Leu Gln
1 5 10 15
Ala Ala Ser Gly Glu Ser Gly Asn Ala Gln Asp Gly Asp Leu Glu Asp
20 25 30
Ala Glu Pro Asp Asp His Ser Phe Trp Cys His Ser Gln Leu Glu Val
35 40 45
Asp Gly Asn Gln His Ser Leu Thr Cys Ala Phe Asn Asp Pro Asp Ile
50 55 60
Lys Thr Thr Asn Leu Glu Phe Gln Ile Cys Gly Ala Leu Leu Gly Ile
65 70 75 80
Asp Cys Leu Thr Leu Asn Lys Leu Arg Glu Met Tyr Phe Ile Lys Thr
85 90 95
Ser Lys Phe Leu Leu Ile Gly Asn Ser Ser Val Cys Val Lys Leu Gly
100 105 110
Lys Met Asp Val Ile Cys Lys Ile Leu Asp Ile Ser Thr Ile Val Lys
115 120 125
Pro Glu Ala Pro Ser Asn Leu Lys Val Val Tyr Arg Lys Glu Ala Asn
130 135 140
Asp Phe Leu Val Thr Phe Asn Thr Ser His Ser Thr Lys Lys Tyr Val
145 150 155 160
Thr Ala Leu Lys His Asp Val Ala Tyr Arg Pro Glu Arg Gly Glu Ser
165 170 175
Asn Trp Thr His Val Tyr Leu Phe His Thr Arg Thr Thr Ile Leu Gln
180 185 190
Arg Lys Leu Gln Pro Lys Ala Val Tyr Glu Ile Lys Val Arg Ser Ile
195 200 205
Pro Asn His Glu Tyr Phe Lys Gly Phe Trp Ser Glu Trp Ser Pro Ser
210 215 220
Ser Thr Phe Glu Thr Pro Asp Ser Lys Tyr Gln Gly Gly Trp Asp Pro
225 230 235 240
Val Leu Pro Ser Ile Ile Leu Leu Ser Leu Phe Ser Met Val Leu Leu
245 250 255
Val Ile Leu Ala His Val Leu Trp Lys Lys Arg Ile Lys Pro Val Val
260 265 270
Trp Pro Ser Leu Pro Asp His Lys Lys Thr Leu Glu Gln Leu Cys Lys
275 280 285
Lys Pro Lys Lys Asn Leu Asn Val Ser Phe Asn Pro Glu Ser Phe Leu
290 295 300
Asp Cys Gln Ile His Glu Val Asn Gly Ile Gln Ala Arg Asp Glu Val
305 310 315 320
Glu Ser Phe Leu Gln Asn Asp Leu Pro Pro Arg Pro Gly Glu Leu Glu
325 330 335
Lys Gln Gly His Arg Ala Thr Val His Gly Ala Asn Trp Pro Ser Glu
340 345 350
Ile Ser Gly Ser Thr Pro Glu Thr Phe Arg Arg Glu Ser Pro Leu Arg
355 360 365
Cys Leu Ala Arg Asn Leu Ser Thr Cys Asn Thr Pro Ala Phe Leu Ser
370 375 380
Ser Arg Ser Pro Asp Tyr Arg Glu Gly Asp Gly Asn Arg Ser His Val
385 390 395 400
Tyr Gln Asp Leu Leu Pro Ser Ser Arg Asn Thr Asn Gly Thr Val Pro
405 410 415
Gln Pro Phe Pro Leu Gln Ser Gly Ile Leu Ile Pro Val Ser Gln Gly
420 425 430
Gln Pro Ile Ser Thr Ser Ser Val Leu Asn Gln Glu Glu Ala Tyr Val
435 440 445
Thr Met Ser Ser Phe Tyr Gln Asn Lys
450 455
<210> 48
<211> 3124
<212> DNA
<213> 褐家鼠(Rattus norvegicus)
<400> 48
agagctgggt ttggtctccc cctctctcat tcacttgcgc acacaagtgt gcttcttctc 60
tcttctctct ctcagaatga tggctctggg tagagctttc gctatagttt tctgcttact 120
tcaagctgct tctggagaaa gtggcaatgc ccaggatgga gatctagagg atgcggaacc 180
agatgatcac tccttctggt gccacagcca gctggaagtg gatggaaatc agcactcact 240
gacgtgtgct tttaatgacc cagacatcaa aaccactaat ctggaatttc aaatatgtgg 300
ggctcttcta ggcatagatt gcctaactct taataagcta cgagagatgt attttataaa 360
gacatcaaaa ttcttactga ttggtaacag cagtgtatgt gtgaagcttg gaaaaatgga 420
tgtaatttgc aaaattttgg acataagcac aatagttaaa cctgaggcgc cttctaacct 480
gaaagtagtt tatcgaaaag aagcaaatga ctttttggta acatttaata catctcactc 540
aacaaagaaa tatgtaacag cattaaagca tgatgtggcc taccgcccag aaaggggtga 600
aagtaactgg acgcatgtat atttattcca tacaagaaca acaatcctac agagaaaact 660
acaaccaaaa gcagtgtatg aaatcaaagt ccgatccatt cccaatcatg aatacttcaa 720
aggcttctgg agtgagtgga gtccaagttc tacctttgaa acaccagatt ccaagtatca 780
agggggatgg gatccggttt tgccaagtat catccttctg agtttgttct ctatggtttt 840
gttggtcatt ttagcccatg tgctatggaa aaaaaggatt aaacctgttg tatggcctag 900
tcttcctgat cataagaaaa ctctggaaca actatgtaag aagccaaaaa agaatttgaa 960
tgtgagtttc aatcctgaaa gtttcctgga ctgccagatt catgaggtga atggcattca 1020
agccagggat gaagtggaaa gctttctgca aaatgatctt cctccacggc ctggggagct 1080
ggagaagcag ggacatagag caactgtaca cggtgcaaac tggccatctg agatttcagg 1140
cagcacacca gaaacgttcc gaagagaatc acccctaaga tgcctggcta gaaatctaag 1200
cacatgcaat acccctgcat tcctttcctc taggtcccct gactacagag aaggtgacgg 1260
aaataggtct catgtgtatc aagacttgct gccaagctcc agaaacacaa atggcactgt 1320
ccctcaacca tttcctctcc agtcaggaat cctgatacca gtttctcaag gacagcccat 1380
ctctacttct tcagtattga atcaagaaga agcatatgtc actatgtcta gcttttacca 1440
aaacaaatga attataagaa acctgagacc ccttccacag aaaaccaaat gatcactgag 1500
atggaaagtc tggaatgctt gtctccctca tagctcttag aagagaaagt caacatggac 1560
ttgctacaca tcttcagcat tctaagaaat cattttgatc tcctagctca aaagcattta 1620
ttcaaagcag gaagaatctg ctttcccctt gttggattag tcatatgagt acaaatgacc 1680
caattaaaat tgtaaaactc aattaaatga agagtaaagg gaaagataga aggaggtgaa 1740
tacaggaaga agagaaggat gtcagtggtg ggtctatcat taggacttac tatatatcca 1800
gcagtacaca acggctctca tttcttcctc acaataatac tacaatgtgg gttcatccat 1860
tagaattgtt attttctttg tcatagatgc tgaagttgaa agtggaaatt tttaagtaat 1920
gtccaggttt ttcttccagc aacagatgaa gcatgcattc caacttcaac cctccttggc 1980
catgaacctg tcctactact gagtatcaaa catcaccact aagtgggtgg ttacagtcag 2040
aatccaaact gggtcatttt ggaaagggaa agttagaaaa aattaatagc aagcataaac 2100
tgtatctttc ttagagagat gtggatacat ggtcacttca cgtaaagtgt ctatgaggat 2160
gaacatagag gacaaaatac acttatggga gtgaaatacc gtgaccatgt gtcaaaggaa 2220
gtgggagaaa gaaaaaaggc accaagctca tttgattttg ttttctttca tttgaaaacg 2280
aacccaaaaa gtaataagtt ataagtcaag aagttccaga gtcagttatc tagaccatga 2340
tcttcctgct gctattaccc atcggcttcc ctgtgagatc gtatggggag ctatggccaa 2400
cctacatcag agcaacattt aacagtgagt agatgtctcc tcctgtgaca ccattacacc 2460
ttaccccaag ttctacagcc ttggatattg cctaaactac aggaagaaag ggctgtgcac 2520
acctcagtga ttatcccaac tgaaactatg tttgtggaag cataaagaag atgggtaagt 2580
tactcaaatg caaatgttga ttcatgactg caagccacaa ttttgaatcc ctgctgtgta 2640
tggccagtct cctaaagaaa acaacaaata actgaaagac accgtgattg ggtgccttag 2700
cattaaaatt ctttgtttca gtgttgacat tggttgttta aatcggtgtg tctcttcggt 2760
catgtattat atctatgcat tatattcaga taactacaac tgctgctaat gcttgattat 2820
atactcagga accacatgcc atgtaacatt actggtttgt tctgccattt ttcctcttga 2880
tatttagaaa ggaagaccaa aactcttggc cagagacagt atgcaaaaca gagatgtcaa 2940
gaactatgtc taaataatgt gaaatacaat gagaaatagg taacaaattt atcaaccaac 3000
tatgtctgga tccagagaat ctctagttat tcaatttatt ttctataagc ctttgtctct 3060
ctcttcatcc agacttccat gggaattttt gccttcaaat aaaagaatgg gcaaatttct 3120
ggaa 3124
<210> 49
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 49
gggatcaata ctatgggtgg tttataa 27
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 50
acctcagtat tctcaagaag 20
<210> 51
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 51
ctacacttgg gagtgaaatg catt 24
<210> 52
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 52
ggagggcact cttacacttt c 21
<210> 53
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 53
ttggagaatg acttgcctgc tgtc 24
<210> 54
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 54
cctctgcttc cttgttcttc aca 23
<210> 55
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 55
cagggcaagc aagaatttag ca 22
<210> 56
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 56
tgtgggtatt aatcaccagg acagaggg 28
<210> 57
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 57
acaagccatt tgcagtattg tca 23
<210> 58
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 58
tgggtcagtt tggctatcca t 21
<210> 59
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 59
tcttttccca gaacaatgaa gatgctatgg 30
<210> 60
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 60
tgctttgggt actgtcctga ag 22
<210> 61
<211> 9475
<212> DNA
<213> 人工序列
<220>
<223> 靶向的Tslp等位基因,基因组DAN(总计9475 bp)
<220>
<221> misc_feature
<222> (1)..(238)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (18)..(20)
<223> 起始密码子
<220>
<221> misc_feature
<222> (18)..(21)
<223> 编码外显子1
<220>
<221> misc_feature
<222> (239)..(2166)
<223> 人基因组片段1
<220>
<221> misc_feature
<222> (2167)..(6610)
<223> Puro自缺失盒
<220>
<221> misc_feature
<222> (2167)..(2172)
<223> Nhel
<220>
<221> misc_feature
<222> (2173)..(2198)
<223> I_Ceu
<220>
<221> misc_feature
<222> (2205)..(2238)
<223> LoxP1
<220>
<221> misc_feature
<222> (6571)..(6604)
<223> LoxP2
<220>
<221> misc_feature
<222> (6605)..(6610)
<223> Xhol
<220>
<221> misc_feature
<222> (6611)..(8782)
<223> 人基因组片段2
<220>
<221> misc_feature
<222> (8780)..(8782)
<223> 终止密码子
<220>
<221> misc_feature
<222> (8783)..(9475)
<223> 小鼠序列
<400> 61
cacgttcagg cgacagcatg ggtgactatg ggctgtgcag ggactgggaa ggggtggtga 60
gggctgatac ccgagcacag tctttgcagg tctggaggct ctccccgctt agaggggcag 120
ttccacggga aacagagttg gaactgtgtt tcagtgaaaa tttttcttac tgtgtgtctt 180
tccagttctt ctcaggagcc tcttcatcct gcaagtacta gtacggatgg ggctaactta 240
cgacttcact aactgtgact ttgagaagat taaagcagcc tatctcagta ctatttctaa 300
agacctgatt acatatatga gtggggtaag tgaagaagct tttttaaaac aaatgtattt 360
tcatcagagg agtcggcata cacacactct acaatttaac tttgtaggaa agaaaaataa 420
tttagaaaaa atcatggccc cacattttgt caaggattct tacaagtgat attcaaatat 480
ctaatctaaa atgattatct agaaattggc acattctaag tgtgcagatg ctgatgagga 540
gcaggtattg atagacagcg cgttatgcgt caaaggatgt ctatcctttg ctaaagtgtt 600
actctgacta tgctgtaaaa agcaggaggt aagagcttaa gaaagaggag taaaagagat 660
aattctcatg agataaactc taaggattga tgctgtgctc caggtctctc cagtgtttta 720
gatgtttcag gatgctattt attacagaat atggtgtact tggaattttt tttaacatac 780
agtagtaatc attttcctga ttaacctaat ttctagacag agtttgcatt catgaatggc 840
cacagtacag atgcggacat ccaaaggatg gcattattac tcacaagcat agtgctatgt 900
gcagttatgg cttgagggaa gggagggggg aggtcgccct ctgagacctg aaccttttgg 960
tgtggtttca agcactaacc agcactatct aatggctatt tcactgcctt gtcaatgaca 1020
taggaaaaag gtacctgagt ggaaactgtt ttcagggcac ctttaaagcc tgggagcaaa 1080
gggtggaggg atgattttcc ttgtggactt aaaagtcttt accctctttg tcctattttt 1140
ctttcttcca gaccaaaagt accgagttca acaacaccgt ctcttgtagc aatcgggtga 1200
gtagagagtt cagtgctgct ggctttctcc agggagacgc caggcatttt ggagagggag 1260
tatcctgcta cgtgcagaac tccgagaggt gcctgggctc cgggacgccg ccgccggggg 1320
aaaggggaca tctgggctgt cagagcgggg ctgcgcctag cttgggacaa cacttctgtt 1380
ccaatttagg gagaggaagt ctctatccgg aggaaaggca aattgggaac tgggacgagg 1440
gaacgttgtt aggggcacca cctgctgggg tccggcgcct ccgcgctcgg gctcggaatt 1500
ttggcagcct ccgccccctg gagacttggg aggagcgagc gtgggtgaca gtcttttcgc 1560
gacgagtgcc ctccgccacc ctcgccacgc ccctgctccc ccgcggttgg ttcttccttg 1620
ctctactcaa ccctgacctc ttctctctga ctctcgactt gtgttccccg ctcctccctg 1680
accttcctcc cctccccttt cactcaattc tcaccaactc tttctctctc tggtgttttc 1740
tccttttctc gtaaactttg ccgcctatga gcagccacat tgccttactg aaatccagag 1800
cctaaccttc aatcccaccg ccggctgcgc gtcgctcgcc aaagaaatgt tcgccatgaa 1860
aactaaggct gccttagcta tctggtgccc aggctattcg gaaactcagg taagcccgaa 1920
gcctcagacg tttgctgtac cttggggcta acctcaaatt aaactggggc tttggtgcag 1980
aagtcgttct cttattttta tttaggtttt atctttcgaa gagcaaacga gccgggtaaa 2040
agtggtagga tgtcagttag acccacgttg atacccggaa tcaaactcac ctatttctac 2100
ggttctgata ctgttttggc tgaattatgg ttctaaacct tagggcaatg tttcaagcta 2160
tgatgagcta gctcgctacc ttaggaccgt tatagttacc tagcataact tcgtatagca 2220
tacattatac gaagttatct aggccgcctc agaagccata gagcccaccg catccccagc 2280
atgcctgcta ttgtcttccc aatcctcccc cttgctgtcc tgccccaccc caccccccag 2340
aatagaatga cacctactca gacaatgcga tgcaatttcc tcattttatt aggaaaggac 2400
agtgggagtg gcaccttcca gggtcaagga aggcacgggg gaggggcaaa caacagatgg 2460
ctggcaacta gaaggcacag tcgaggctga tcagcgagct ctagatcatc gatgcatggg 2520
gtcgtgcgct cctttcggtc gggcgctgcg ggtcgtgggg cgggcgtcag gcaccgggct 2580
tgcgggtcat gcaccaggtg cgcggtcctt cgggcacctc gacgtcggcg gtgacggtga 2640
agccgagccg ctcgtagaag gggaggttgc ggggcgcgga ggtctccagg aaggcgggca 2700
ccccggcgcg ctcggccgcc tccactccgg ggagcacgac ggcgctgccc agacccttgc 2760
cctggtggtc gggcgagacg ccgacggtgg ccaggaacca cgcgggctcc ttgggccggt 2820
gcggcgccag gaggccttcc atctgttgct gcgcggccag ccgggaaccg ctcaactcgg 2880
ccatgcgcgg gccgatctcg gcgaacaccg cccccgcttc gacgctctcc ggcgtggtcc 2940
agaccgccac cgcggcgccg tcgtccgcga cccacacctt gccgatgtcg agcccgacgc 3000
gcgtgaggaa gagttcttgc agctcggtga cccgctcgat gtggcggtcc ggatcgacgg 3060
tgtggcgcgt ggcggggtag tcggcgaacg cggcggcgag ggtgcgtacg gccctgggga 3120
cgtcgtcgcg ggtggcgagg cgcaccgtgg gcttgtactc ggtcatggtt tagttcctca 3180
ccttgtcgta ttatactatg ccgatatact atgccgatga ttaattgtca acacgtctaa 3240
caaaaaagcc aaaaacggcc agaatttagc ggacaattta ctagtctaac actgaaaatt 3300
acatattgac ccaaatgatt acatttcaaa aggtgcctaa aaaacttcac aaaacacact 3360
cgccaacccc gagcgcatag ttcaaaaccg gagcttcagc tacttaagaa gataggtaca 3420
taaaaccgac caaagaaact gacgcctcac ttatccctcc cctcaccaga ggtccggcgc 3480
ctgtcgattc aggagagcct accctaggcc cgaaccctgc gtcctgcgac ggagaaaagc 3540
ctaccgcaca cctaccggca ggtggcccca ccctgcatta taagccaaca gaacgggtga 3600
cgtcacgaca cgacgagggc gcgcgctccc aaaggtacgg gtgcactgcc caacggcacc 3660
gccataactg ccgcccccgc aacagacgac aaaccgagtt ctccagtcag tgacaaactt 3720
cacgtcaggg tccccagatg gtgccccagc ccatctcacc cgaataagag ctttcccgca 3780
ttagcgaagg cctcaagacc ttgggttctt gccgcccacc atgcccccca ccttgtttca 3840
acgacctcac agcccgcctc acaagcgtct tccattcaag actcgggaac agccgccatt 3900
ttgctgcgct ccccccaacc cccagttcag ggcaaccttg ctcgcggacc cagactacag 3960
cccttggcgg tctctccaca cgcttccgtc ccaccgagcg gcccggcggc cacgaaagcc 4020
ccggccagcc cagcagcccg ctactcacca agtgacgatc acagcgatcc acaaacaaga 4080
accgcgaccc aaatcccggc tgcgacggaa ctagctgtgc cacacccggc gcgtccttat 4140
ataatcatcg gcgttcaccg ccccacggag atccctccgc agaatcgccg agaagggact 4200
acttttcctc gcctgttccg ctctctggaa agaaaaccag tgccctagag tcacccaagt 4260
cccgtcctaa aatgtccttc tgctgatact ggggttctaa ggccgagtct tatgagcagc 4320
gggccgctgt cctgagcgtc cgggcggaag gatcaggacg ctcgctgcgc ccttcgtctg 4380
acgtggcagc gctcgccgtg aggagggggg cgcccgcggg aggcgccaaa acccggcgcg 4440
gaggccatga tcccggggga tccactagtt ctagtgttta aactctagcc gggggatcca 4500
gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 4560
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 4620
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 4680
gaggtttttt aaagcaagta aaacctctac aaatgtggta tggctgatta gcggccggcc 4740
gcctaatcgc catcttccag caggcgcacc attgcccctg tttcactatc caggttacgg 4800
atatagttca tgacaatatt tacattggtc cagccaccag cttgcatgat ctccggtatt 4860
gaaactccag cgcgggccat atctcgcgcg gctccgacac gggcactgtg tccagaccag 4920
gccaggtatc tctgaccaga gtcatcctta gcgccgtaaa tcaatcgatg agttgcttca 4980
aaaatccctt ccagggcgcg agttgatagc tggctggtgg cagatggcgc ggcaacacca 5040
ttttttctga cccggcaaaa caggtagtta ttcggatcat cagctacacc agagacggaa 5100
atccatcgct cgaccagttt agttaccccc aggctaagtg ccttctctac acctgcggtg 5160
ctaaccagcg ttttcgttct gccaatatgg attaacattc tcccaccgtc agtacgtgag 5220
atatctttaa ccctgatcct ggcaatttcg gctatacgta acagggtgtt ataagcaatc 5280
cccagaaatg ccagattacg tatatcctgg cagcgatcgc tattttccat gagtgaacga 5340
acctggtcga aatcagtgcg ttcgaacgct agagcctaaa atacacaaac aattagaatc 5400
agtagtttaa catcattata cacttaaaaa ttttatattt acctgttttg cacgttcacc 5460
ggcatcaacg ttttcttttc ggatccgccg cataaccagt gaaacagcat tgctgtcact 5520
tggtcgtggc agcccggacc gacgatgaag catgtttagc tggcccaaat gttgctggat 5580
agtttttact gccagaccgc gcgcctgaag atatagaaga taatcgcgaa catcttcagg 5640
ttctgcggga aaccatttcc ggttattcaa cttgcaccat gccgcccacg accggcaaac 5700
ggacagaagc attttccagg tatgctcaga aaacgcctgg cgatccctga acatgtccat 5760
caggttcttg cgaacctcat cactcgttgc atcgaccggt aatgcaggca aattttggtg 5820
tacggtcagt aaattggaat ttaaatcggt acgcaccttc ctcttcttct tgggggttcc 5880
catggtgctg gcttggccgg gagctggctc agagcagggg acaccacctg ggtcgagcca 5940
gccaacctgt gagcaggtgg aattttgtgg gctgtggcct gggagccagc accctcttcc 6000
tcttatagat actagtggcc cctaggaatt atgaagtcaa agaggaccag gacctcacag 6060
accatggcca gtgaggacct gtaccatgtc caaatatggg catgagaggg gtgggcaggg 6120
ctttggcatc aggagttgct tgtgtcacag tcaagaagtg acaaagatgg catccacttg 6180
agtgttcagt tagtcactca gcttaggtgt taagtgccac acacctgctt ctaggctagg 6240
tcctgataga taacccaagg ccaggcaggt gggtgaaaca gccacatgga tttgaactgt 6300
gaaaagcaca catcttcaga ctgctcagag aatgctgctg agggaacttg accttttaag 6360
aaattatcca acgccccagt gaggcactga cagacaaatc cagagggtct cagagttgca 6420
ggggggtggg ctctagtaaa acattgaggc cccatcaagt gcttcaggta taaatgggag 6480
ccacatggat gcagagcagt gtttggactg agggaggtgt tggacattac tagacagaag 6540
gtggacgtgg gtgctgctac tggcatgcat ataacttcgt atagcataca ttatacgaag 6600
ttatctcgag gtgagacttc tatatcagaa tgttttgatt gctggagcat aagagtatgg 6660
ctgctaaaaa tgccaattcc caggtactca acccagacct tcaacattaa aatctcagat 6720
tatggggctc cttaagagat tcttgtccag tccaaagttt gagcaacacc tcttgttctt 6780
atcacttaat tattgtgtgc ttatttgcta aatgtataat tacattatac ataaaatctc 6840
tatcctatgt ttgcttaatt gcttgtgtgg gcgctattgc tgtctcttta cacatttttg 6900
cacatgtagt tatctgcatt tgaatgctcg tgtagcatta aatatggaga tagtgtagtg 6960
gaaagttagg cacaggaact ctggagacaa cctgcctgac tttgaatcct ggccctataa 7020
cttctgtgaa gacttagtta aattacttag cctccgtgta ctgtagcttc atgggtaaag 7080
taagtatcat atcagttagt cttatacagg ttgtttctga ggattaaatt agtcaacaca 7140
tgtaaatgca gttggaacag tgcctggtac acaacaggca ctcaatattt atttcagtca 7200
gcaagtagag gatttatctt catggtgaca agtttaagga acagagagag acaagtgcag 7260
atatgtttga ttgctcctta ttagcctagt ggactttata tgtctacagt ctaggtagat 7320
ggacacgact gtcacttttt tttttttttt ttttttgaga cagaatctcg ctctgttacc 7380
caggctggaa tgcagtggca cgatctcagc tcactgcaac ctccatctcc tgggttcaag 7440
cctcagcctc ccgagtagct ggaactacag gtgcccgcca ccacgcctgg ctaacttttg 7500
tatttttagt agagacgggg tttcaccata ttggccaggc tggtctcgaa ttcctgacct 7560
tgtgatctgc ctgcctcggc ctcccaaagt gctggaatta caagcatgag ccaccatgcc 7620
cagccaaaac tgtcactttc tagaggttga ggattgaagc catagcgctg atctgggttg 7680
agcttgaatt agaaactcaa taccagacag ccatatggga aacctatttg gcttcatgcc 7740
ttcttatgaa ggagaccctg gcaaatctgc agatggctac aataaaattc atttaaataa 7800
gagcacaaac aaaaagctag atcaagttct tggacagcat gtgagaaagg gagagtttgg 7860
agaaatttat ttcagtccct cccaagccca aatggagagt ctaagactaa taataatgat 7920
tttgcaggtt tttttaagat ttgtgcttaa taaccctgtg actttattaa tttgcatacc 7980
atgtgtctag gaggcccagt gtactactca aaggtaattc agataaaggt atatactgca 8040
atcctcttta aaataagccc tcagatgtct gtgacacatc tagacaatgg ggcaggggag 8100
ggggaaggat ggggagcagg agcatgcatt ttgggtccaa aaaatagact aggtttattg 8160
aatgatgtct ataaacaggt ataagatagc tcttgcccat gaggaacttg tgatcttgtc 8220
agggaggtct tgaaatcagc aatttattca tttacttaat cactcaacaa atattcagtg 8280
tttcctatga ttaagacact gtattcagtg ctatggggaa tacctatgat gcaatataaa 8340
gaaaagcatg ttaagtgaga gccaagttaa atgacacaca ctcttaagta ctggaagagt 8400
ttccaaaagc aaggtctgag caattagtgg aggctttttg aaggaggtgg tgcttggcct 8460
tgaagcaaaa gtaggtgggt acagaaacag gaaggcattc ccctggaaaa ggcacatgct 8520
agcacatagt aagcaggtgc tttggagaca cactgaaaga tggatttgca tagagaaggc 8580
aattaaacct gctctcaaca gttactaaag atagtgaaaa gtaattttga ctattgattc 8640
ttatattctg cagataaatg ctactcaggc aatgaagaag aggagaaaaa ggaaagtcac 8700
aaccaataaa tgtctggaac aagtgtcaca attacaagga ttgtggcgtc gcttcaatcg 8760
acctttactg aaacaacagt aaaattagct ttcagcttct gctatgaaaa tctctatctt 8820
ggttttagtg gacagaatac taagggtgtg acacttagag gaccactggt gtttattctt 8880
taattacaga agggattctt aacttatttt ttggcatatc gcttttttca gtataggtgc 8940
tttaaatggg aaatgagcaa tagaccgtta atggaaatat ctgtactgtt aatgaccagc 9000
ttctgagaag tctttctcac ctcccctgca cacaccttac tctagggcaa acctaactgt 9060
agtaggaaga gaattgaaag tagaaaaaaa aaattaaaac caatgacagc atctaaaccc 9120
tgtttaaaag gcaaggattt ttctacctgt aatgattctt ctaacattcc tatgctaaga 9180
ttttaccaaa gaagaaaatg acagttcggg cagtcactgc catgatgagg tggtctgaaa 9240
gaagattgtg gaatctggga gaaactgctg agatcatatt gcaaatccag ctgtcaaagg 9300
gttcagaccc aggacagtac aattcgtgag cagatctcaa gagccttgca catctacgag 9360
atatatattt aaagttgtag ataatgaatt tctaatttat tttgtgagca cttttggaaa 9420
tatacatgct actttgtaat gaatacattt ctgaataaag taattctcaa gtttg 9475
<210> 62
<211> 5109
<212> DNA
<213> 人工序列
<220>
<223> 靶向的Tslp等位基因(无盒),基因组DAN(总计5109 bp)
<220>
<221> misc_feature
<222> (1)..(238)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (18)..(20)
<223> 起始密码子
<220>
<221> misc_feature
<222> (18)..(21)
<223> 编码外显子1
<220>
<221> misc_feature
<222> (2167)..(6610)
<223> 缺失的Puro自缺失盒
<220>
<221> misc_feature
<222> (2167)..(2172)
<223> Nhel
<220>
<221> misc_feature
<222> (2173)..(2198)
<223> I_Ceu
<220>
<221> misc_feature
<222> (2205)..(2238)
<223> LoxP
<220>
<221> misc_feature
<222> (2239)..(2244)
<223> Xhol
<220>
<221> misc_feature
<222> (2245)..(4416)
<223> 人基因组片段2
<220>
<221> misc_feature
<222> (4414)..(4416)
<223> 终止密码子
<220>
<221> misc_feature
<222> (4417)..(5109)
<223> 小鼠序列
<400> 62
cacgttcagg cgacagcatg ggtgactatg ggctgtgcag ggactgggaa ggggtggtga 60
gggctgatac ccgagcacag tctttgcagg tctggaggct ctccccgctt agaggggcag 120
ttccacggga aacagagttg gaactgtgtt tcagtgaaaa tttttcttac tgtgtgtctt 180
tccagttctt ctcaggagcc tcttcatcct gcaagtacta gtacggatgg ggctaactta 240
cgacttcact aactgtgact ttgagaagat taaagcagcc tatctcagta ctatttctaa 300
agacctgatt acatatatga gtggggtaag tgaagaagct tttttaaaac aaatgtattt 360
tcatcagagg agtcggcata cacacactct acaatttaac tttgtaggaa agaaaaataa 420
tttagaaaaa atcatggccc cacattttgt caaggattct tacaagtgat attcaaatat 480
ctaatctaaa atgattatct agaaattggc acattctaag tgtgcagatg ctgatgagga 540
gcaggtattg atagacagcg cgttatgcgt caaaggatgt ctatcctttg ctaaagtgtt 600
actctgacta tgctgtaaaa agcaggaggt aagagcttaa gaaagaggag taaaagagat 660
aattctcatg agataaactc taaggattga tgctgtgctc caggtctctc cagtgtttta 720
gatgtttcag gatgctattt attacagaat atggtgtact tggaattttt tttaacatac 780
agtagtaatc attttcctga ttaacctaat ttctagacag agtttgcatt catgaatggc 840
cacagtacag atgcggacat ccaaaggatg gcattattac tcacaagcat agtgctatgt 900
gcagttatgg cttgagggaa gggagggggg aggtcgccct ctgagacctg aaccttttgg 960
tgtggtttca agcactaacc agcactatct aatggctatt tcactgcctt gtcaatgaca 1020
taggaaaaag gtacctgagt ggaaactgtt ttcagggcac ctttaaagcc tgggagcaaa 1080
gggtggaggg atgattttcc ttgtggactt aaaagtcttt accctctttg tcctattttt 1140
ctttcttcca gaccaaaagt accgagttca acaacaccgt ctcttgtagc aatcgggtga 1200
gtagagagtt cagtgctgct ggctttctcc agggagacgc caggcatttt ggagagggag 1260
tatcctgcta cgtgcagaac tccgagaggt gcctgggctc cgggacgccg ccgccggggg 1320
aaaggggaca tctgggctgt cagagcgggg ctgcgcctag cttgggacaa cacttctgtt 1380
ccaatttagg gagaggaagt ctctatccgg aggaaaggca aattgggaac tgggacgagg 1440
gaacgttgtt aggggcacca cctgctgggg tccggcgcct ccgcgctcgg gctcggaatt 1500
ttggcagcct ccgccccctg gagacttggg aggagcgagc gtgggtgaca gtcttttcgc 1560
gacgagtgcc ctccgccacc ctcgccacgc ccctgctccc ccgcggttgg ttcttccttg 1620
ctctactcaa ccctgacctc ttctctctga ctctcgactt gtgttccccg ctcctccctg 1680
accttcctcc cctccccttt cactcaattc tcaccaactc tttctctctc tggtgttttc 1740
tccttttctc gtaaactttg ccgcctatga gcagccacat tgccttactg aaatccagag 1800
cctaaccttc aatcccaccg ccggctgcgc gtcgctcgcc aaagaaatgt tcgccatgaa 1860
aactaaggct gccttagcta tctggtgccc aggctattcg gaaactcagg taagcccgaa 1920
gcctcagacg tttgctgtac cttggggcta acctcaaatt aaactggggc tttggtgcag 1980
aagtcgttct cttattttta tttaggtttt atctttcgaa gagcaaacga gccgggtaaa 2040
agtggtagga tgtcagttag acccacgttg atacccggaa tcaaactcac ctatttctac 2100
ggttctgata ctgttttggc tgaattatgg ttctaaacct tagggcaatg tttcaagcta 2160
tgatgagcta gctcgctacc ttaggaccgt tatagttacc tagcataact tcgtatagca 2220
tacattatac gaagttatct cgaggtgaga cttctatatc agaatgtttt gattgctgga 2280
gcataagagt atggctgcta aaaatgccaa ttcccaggta ctcaacccag accttcaaca 2340
ttaaaatctc agattatggg gctccttaag agattcttgt ccagtccaaa gtttgagcaa 2400
cacctcttgt tcttatcact taattattgt gtgcttattt gctaaatgta taattacatt 2460
atacataaaa tctctatcct atgtttgctt aattgcttgt gtgggcgcta ttgctgtctc 2520
tttacacatt tttgcacatg tagttatctg catttgaatg ctcgtgtagc attaaatatg 2580
gagatagtgt agtggaaagt taggcacagg aactctggag acaacctgcc tgactttgaa 2640
tcctggccct ataacttctg tgaagactta gttaaattac ttagcctccg tgtactgtag 2700
cttcatgggt aaagtaagta tcatatcagt tagtcttata caggttgttt ctgaggatta 2760
aattagtcaa cacatgtaaa tgcagttgga acagtgcctg gtacacaaca ggcactcaat 2820
atttatttca gtcagcaagt agaggattta tcttcatggt gacaagttta aggaacagag 2880
agagacaagt gcagatatgt ttgattgctc cttattagcc tagtggactt tatatgtcta 2940
cagtctaggt agatggacac gactgtcact tttttttttt tttttttttt gagacagaat 3000
ctcgctctgt tacccaggct ggaatgcagt ggcacgatct cagctcactg caacctccat 3060
ctcctgggtt caagcctcag cctcccgagt agctggaact acaggtgccc gccaccacgc 3120
ctggctaact tttgtatttt tagtagagac ggggtttcac catattggcc aggctggtct 3180
cgaattcctg accttgtgat ctgcctgcct cggcctccca aagtgctgga attacaagca 3240
tgagccacca tgcccagcca aaactgtcac tttctagagg ttgaggattg aagccatagc 3300
gctgatctgg gttgagcttg aattagaaac tcaataccag acagccatat gggaaaccta 3360
tttggcttca tgccttctta tgaaggagac cctggcaaat ctgcagatgg ctacaataaa 3420
attcatttaa ataagagcac aaacaaaaag ctagatcaag ttcttggaca gcatgtgaga 3480
aagggagagt ttggagaaat ttatttcagt ccctcccaag cccaaatgga gagtctaaga 3540
ctaataataa tgattttgca ggttttttta agatttgtgc ttaataaccc tgtgacttta 3600
ttaatttgca taccatgtgt ctaggaggcc cagtgtacta ctcaaaggta attcagataa 3660
aggtatatac tgcaatcctc tttaaaataa gccctcagat gtctgtgaca catctagaca 3720
atggggcagg ggagggggaa ggatggggag caggagcatg cattttgggt ccaaaaaata 3780
gactaggttt attgaatgat gtctataaac aggtataaga tagctcttgc ccatgaggaa 3840
cttgtgatct tgtcagggag gtcttgaaat cagcaattta ttcatttact taatcactca 3900
acaaatattc agtgtttcct atgattaaga cactgtattc agtgctatgg ggaataccta 3960
tgatgcaata taaagaaaag catgttaagt gagagccaag ttaaatgaca cacactctta 4020
agtactggaa gagtttccaa aagcaaggtc tgagcaatta gtggaggctt tttgaaggag 4080
gtggtgcttg gccttgaagc aaaagtaggt gggtacagaa acaggaaggc attcccctgg 4140
aaaaggcaca tgctagcaca tagtaagcag gtgctttgga gacacactga aagatggatt 4200
tgcatagaga aggcaattaa acctgctctc aacagttact aaagatagtg aaaagtaatt 4260
ttgactattg attcttatat tctgcagata aatgctactc aggcaatgaa gaagaggaga 4320
aaaaggaaag tcacaaccaa taaatgtctg gaacaagtgt cacaattaca aggattgtgg 4380
cgtcgcttca atcgaccttt actgaaacaa cagtaaaatt agctttcagc ttctgctatg 4440
aaaatctcta tcttggtttt agtggacaga atactaaggg tgtgacactt agaggaccac 4500
tggtgtttat tctttaatta cagaagggat tcttaactta ttttttggca tatcgctttt 4560
ttcagtatag gtgctttaaa tgggaaatga gcaatagacc gttaatggaa atatctgtac 4620
tgttaatgac cagcttctga gaagtctttc tcacctcccc tgcacacacc ttactctagg 4680
gcaaacctaa ctgtagtagg aagagaattg aaagtagaaa aaaaaaatta aaaccaatga 4740
cagcatctaa accctgttta aaaggcaagg atttttctac ctgtaatgat tcttctaaca 4800
ttcctatgct aagattttac caaagaagaa aatgacagtt cgggcagtca ctgccatgat 4860
gaggtggtct gaaagaagat tgtggaatct gggagaaact gctgagatca tattgcaaat 4920
ccagctgtca aagggttcag acccaggaca gtacaattcg tgagcagatc tcaagagcct 4980
tgcacatcta cgagatatat atttaaagtt gtagataatg aatttctaat ttattttgtg 5040
agcacttttg gaaatataca tgctactttg taatgaatac atttctgaat aaagtaattc 5100
tcaagtttg 5109
<210> 63
<211> 20473
<212> DNA
<213> 人工序列
<220>
<223> 靶向的Tslpr等位基因7558,基因组DNA,总计20473 bp
<220>
<221> misc_feature
<222> (1)..(1051)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (111)..(113)
<223> 起始密码子
<220>
<221> misc_feature
<222> (111)..(189)
<223> 编码外显子1
<220>
<221> misc_feature
<222> (1052)..(5860)
<223> Neo自缺失盒
<220>
<221> misc_feature
<222> (1052)..(1057)
<223> Xhol
<220>
<221> misc_feature
<222> (1058)..(1091)
<223> LoxP1
<220>
<221> misc_feature
<222> (5790)..(5823)
<223> LoxP2
<220>
<221> misc_feature
<222> (5829)..(5824)
<223> I_Ceu
<220>
<221> misc_feature
<222> (5855)..(5860)
<223> Nhel
<220>
<221> misc_feature
<222> (5861)..(19603)
<223> 人序列
<220>
<221> misc_feature
<222> (19604)..(20473)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (20336)..(20338)
<223> 终止密码子
<400> 63
gcccccggct tcccgttttc ggctctaagc ggcctgggcg ccctcgactc ggaccggctc 60
ggaccgaacc agctgtcaat cactgcagcg tccgcggccc cgccggcgac atggcatggg 120
cactcgcggt catcctcctg cctcggctcc ttgcggcggc agcggcggcg gcggcggtga 180
cgtcacgggg tgaggagtga gcgggggcgg ggctgcctgt caatcgccgc ggtgggcggg 240
gcccgagcaa gagctaccaa gttgcttttc gtcccatcat tgcttttcgt cccatcatga 300
atatgcaaat aaggcctctg gccctcctaa gggcgatcgg atagcgcttc gtttgcatat 360
tcattttgat ctttgcgtat gcatgagccc cgccctcccc ccctacgctc ggcgctttct 420
cctcagtaat atgcaaatga gacctaaacc ccgccttgac ctcattagca tagtgctgcc 480
gccacaatct cgctcctcct cctgaatatg caaataaggc ctctgggccg ctccttcttt 540
gcatattcat atacagcttt cccgcttata tgcaaataac gcttcgcccc taccgagttc 600
tcactcatcg cttctcattt gcatatccat cgggagatac acatattcat gagcgatgta 660
tttctgtctt ccatcccctc atgaatatag aattgatgcc ctgtccatat ggatcactat 720
gcatttgcat attttcccca cgatttacat atgcacaagc ctcaacgtct tgctccaacg 780
tccctgatca tgaatatgca gatgagacct cagatctccg aaattgaatc tgcccgctcc 840
tcatcatata ctgctattct catatgcacc agccacaaag tcttccatcc ttttcccctc 900
atgaatatgc aaagaatgct tccccagtcc atctccactc tggttcactg cctgctcatt 960
tgtgtatcca ttggtcgctt tgcatagtgg tgagccccgc ttccctaccg ctttctttgc 1020
gatcatgtat attcaaatga ggctccgact tgtcgagata acttcgtata atgtatgcta 1080
tacgaagtta tatgcatgcc agtagcagca cccacgtcca ccttctgtct agtaatgtcc 1140
aacacctccc tcagtccaaa cactgctctg catccatgtg gctcccattt atacctgaag 1200
cacttgatgg ggcctcaatg ttttactaga gcccaccccc ctgcaactct gagaccctct 1260
ggatttgtct gtcagtgcct cactggggcg ttggataatt tcttaaaagg tcaagttccc 1320
tcagcagcat tctctgagca gtctgaagat gtgtgctttt cacagttcaa atccatgtgg 1380
ctgtttcacc cacctgcctg gccttgggtt atctatcagg acctagccta gaagcaggtg 1440
tgtggcactt aacacctaag ctgagtgact aactgaacac tcaagtggat gccatctttg 1500
tcacttcttg actgtgacac aagcaactcc tgatgccaaa gccctgccca cccctctcat 1560
gcccatattt ggacatggta caggtcctca ctggccatgg tctgtgaggt cctggtcctc 1620
tttgacttca taattcctag gggccactag tatctataag aggaagaggg tgctggctcc 1680
caggccacag cccacaaaat tccacctgct cacaggttgg ctggctcgac ccaggtggtg 1740
tcccctgctc tgagccagct cccggccaag ccagcaccat gggaaccccc aagaagaaga 1800
ggaaggtgcg taccgattta aattccaatt tactgaccgt acaccaaaat ttgcctgcat 1860
taccggtcga tgcaacgagt gatgaggttc gcaagaacct gatggacatg ttcagggatc 1920
gccaggcgtt ttctgagcat acctggaaaa tgcttctgtc cgtttgccgg tcgtgggcgg 1980
catggtgcaa gttgaataac cggaaatggt ttcccgcaga acctgaagat gttcgcgatt 2040
atcttctata tcttcaggcg cgcggtctgg cagtaaaaac tatccagcaa catttgggcc 2100
agctaaacat gcttcatcgt cggtccgggc tgccacgacc aagtgacagc aatgctgttt 2160
cactggttat gcggcggatc cgaaaagaaa acgttgatgc cggtgaacgt gcaaaacagg 2220
taaatataaa atttttaagt gtataatgat gttaaactac tgattctaat tgtttgtgta 2280
ttttaggctc tagcgttcga acgcactgat ttcgaccagg ttcgttcact catggaaaat 2340
agcgatcgct gccaggatat acgtaatctg gcatttctgg ggattgctta taacaccctg 2400
ttacgtatag ccgaaattgc caggatcagg gttaaagata tctcacgtac tgacggtggg 2460
agaatgttaa tccatattgg cagaacgaaa acgctggtta gcaccgcagg tgtagagaag 2520
gcacttagcc tgggggtaac taaactggtc gagcgatgga tttccgtctc tggtgtagct 2580
gatgatccga ataactacct gttttgccgg gtcagaaaaa atggtgttgc cgcgccatct 2640
gccaccagcc agctatcaac tcgcgccctg gaagggattt ttgaagcaac tcatcgattg 2700
atttacggcg ctaaggatga ctctggtcag agatacctgg cctggtctgg acacagtgcc 2760
cgtgtcggag ccgcgcgaga tatggcccgc gctggagttt caataccgga gatcatgcaa 2820
gctggtggct ggaccaatgt aaatattgtc atgaactata tccgtaacct ggatagtgaa 2880
acaggggcaa tggtgcgcct gctggaagat ggcgattagg cggccggccg ctaatcagcc 2940
ataccacatt tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc 3000
tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt 3060
acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 3120
gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctggatcccc cggctagagt 3180
ttaaacacta gaactagtgg atcccccggg atcatggcct ccgcgccggg ttttggcgcc 3240
tcccgcgggc gcccccctcc tcacggcgag cgctgccacg tcagacgaag ggcgcagcga 3300
gcgtcctgat ccttccgccc ggacgctcag gacagcggcc cgctgctcat aagactcggc 3360
cttagaaccc cagtatcagc agaaggacat tttaggacgg gacttgggtg actctagggc 3420
actggttttc tttccagaga gcggaacagg cgaggaaaag tagtcccttc tcggcgattc 3480
tgcggaggga tctccgtggg gcggtgaacg ccgatgatta tataaggacg cgccgggtgt 3540
ggcacagcta gttccgtcgc agccgggatt tgggtcgcgg ttcttgtttg tggatcgctg 3600
tgatcgtcac ttggtgagta gcgggctgct gggctggccg gggctttcgt ggccgccggg 3660
ccgctcggtg ggacggaagc gtgtggagag accgccaagg gctgtagtct gggtccgcga 3720
gcaaggttgc cctgaactgg gggttggggg gagcgcagca aaatggcggc tgttcccgag 3780
tcttgaatgg aagacgcttg tgaggcgggc tgtgaggtcg ttgaaacaag gtggggggca 3840
tggtgggcgg caagaaccca aggtcttgag gccttcgcta atgcgggaaa gctcttattc 3900
gggtgagatg ggctggggca ccatctgggg accctgacgt gaagtttgtc actgactgga 3960
gaactcggtt tgtcgtctgt tgcgggggcg gcagttatgg cggtgccgtt gggcagtgca 4020
cccgtacctt tgggagcgcg cgccctcgtc gtgtcgtgac gtcacccgtt ctgttggctt 4080
ataatgcagg gtggggccac ctgccggtag gtgtgcggta ggcttttctc cgtcgcagga 4140
cgcagggttc gggcctaggg taggctctcc tgaatcgaca ggcgccggac ctctggtgag 4200
gggagggata agtgaggcgt cagtttcttt ggtcggtttt atgtacctat cttcttaagt 4260
agctgaagct ccggttttga actatgcgct cggggttggc gagtgtgttt tgtgaagttt 4320
tttaggcacc ttttgaaatg taatcatttg ggtcaatatg taattttcag tgttagacta 4380
gtaaattgtc cgctaaattc tggccgtttt tggctttttt gttagacgtg ttgacaatta 4440
atcatcggca tagtatatcg gcatagtata atacgacaag gtgaggaact aaaccatggg 4500
atcggccatt gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct 4560
attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct 4620
gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga 4680
actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc 4740
tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg 4800
gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc 4860
aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca 4920
tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga 4980
cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc 5040
cgacggcgat gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga 5100
aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca 5160
ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg 5220
cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct 5280
tcttgacgag ttcttctgag gggatccgct gtaagtctgc agaaattgat gatctattaa 5340
acaataaaga tgtccactaa aatggaagtt tttcctgtca tactttgtta agaagggtga 5400
gaacagagta cctacatttt gaatggaagg attggagcta cgggggtggg ggtggggtgg 5460
gattagataa atgcctgctc tttactgaag gctctttact attgctttat gataatgttt 5520
catagttgga tatcataatt taaacaagca aaaccaaatt aagggccagc tcattcctcc 5580
cactcatgat ctatagatct atagatctct cgtgggatca ttgtttttct cttgattccc 5640
actttgtggt tctaagtact gtggtttcca aatgtgtcag tttcatagcc tgaagaacga 5700
gatcagcagc ctctgttcca catacacttc attctcagta ttgttttgcc aagttctaat 5760
tccatcagac ctcgacctgc agcccctaga taacttcgta taatgtatgc tatacgaagt 5820
tatgctagta actataacgg tcctaaggta gcgagctagc catttctgaa gttggtgtgt 5880
gtggtgtttt gagaaagaca gtaaggtgga tcgatgggga cagtttccga tgccacctta 5940
ggtatccaca ggggatgtgt tgttggatac atgattgatc tatacagata catctgtgca 6000
tggcactagt gggtgaactt accttttgca aaaacaaaaa caaaagcagc cgggcgcggt 6060
ggctcacgcc tgcaatctca gcactttagg tggatgaggc gggcggatca cgaggtcagg 6120
agatcgagac catcctggct aacacagtga aaccccatct ctactaaaag tacaaaaaat 6180
tatccaggca tggtggcggg cacctgtagc cccagctact cgggaggctg aggcaggaga 6240
atggcgtgaa cccgggaggc ggagcttgca gtgagccgag attgcgccac tgcagtccag 6300
cctgggtgac agagtgagag tctgtctcac acaatacact acactacact acactacact 6360
acactacact acactacact acaatacaat gcaatacaat gcaatacaat acgtcaggcg 6420
cggtggctca cgcctgtaat cccagtactt tgggaggccg aggcgggtgg atcatgaggt 6480
caggagatcg agaccatcct ggctaacacg gtgaaacccc gtctctacta aaaatacaaa 6540
aaattagcca ggtgtggtga caggtgcctg taatcccggc tactcgggag gctgaggcag 6600
gggaatcgct tgaacccggg aggcggaggt tgcagtgagc cgagatcgtg ccattgtact 6660
ccagcctggg caacagagtg agactctgtc tcaaaaagaa aaataaattt aaaaaaataa 6720
aaaaatagag ttgcctcacc gtgaacttca tgcgtctctc tgtgtctagc agaaggagta 6780
cagattcaga tcatctactt caatttagaa accgtgcagg tgacatggaa tgccagcaaa 6840
tactccagga ccaacctgac tttccactac aggtaagtgg cccccagaaa gcgaacccca 6900
cgcccagggg gctcaaaatc gctcttctga gccgtcagcg attgggaatg cttgagaaca 6960
aaagtgtaaa gcatcagact gtgcaagccg gaatgtttgt tctgtgaaac cctcagccct 7020
caccacaacc acaatctcat tgccccaaac cttcttgcca agggatggct gactcactgt 7080
caaaatcaac tacattcttt tttttgtttg tttttatttt gagtcggagt ctcactccgt 7140
tgccacgctg gagtgcagtg gcgcaatctc ggctcactgc aacctctgcc tcccgggttc 7200
aagccattcc cctgcctcag cctcccgagt agctgggatt acaggcacct gccaccatgc 7260
ctagctaatt tttgtatttt tagtagagat ggtgattcac catattggtc aggccggttt 7320
caaactcctg acctcatgtg atccacctgc ctcagcctcc caaagtgctg ggatgacagg 7380
cgtgagccac ggcatccgga ctgaaaatca cctagattct tcacgggaga ttaacagaga 7440
gttttgttca cccagagctc tgggtgaact ttaagtctta tctgctaggc agccggggag 7500
ggaaagactc agtctctgaa acatttcaca gccttacccg gggctacccc caaccctgtg 7560
tctccctgat gtgactttat ttttattttt actttggctt agttagacac ccagaagtat 7620
gcgtacgaac attgcaggaa gggtttttcc aataaattta atcatgggtg gatgattctt 7680
cagtttgata acaaaagaga taaacggcaa agcgtacaga acagggaaat tttaaaacga 7740
agttatttgg aaaataagac tcaccgttgg gagaccgagg tgggtggatc atctgagatc 7800
aggagttcca gaccatcctg gccaacatgg tgaaacccca actctactaa aaatacaaaa 7860
actagccggg cgtggcggca ggtgcctgta atcccagcta ctcaggaggc tgaggcaaga 7920
gaatcgcttc aacctgggag acggagttca cggtgagccg agattgcact ccagcctggc 7980
cgacagagcg agactgtctc aaaaacaaaa caaaacaaaa caaaaacctc acaaaaagaa 8040
aaaaaaaagt gctggatttt gcacgtagtt gcagaattca gctcagtttc ttcctctgta 8100
aaaggggcag ttcttggggg gggtgttggc tcatgcctgt tatcccagca ctttgggagg 8160
ctgagggggg ggggggtgga tcacctgagg tcaggagttc aagaccagcc tggccaacat 8220
ggtgaaacct cgtctctact aaaaatacaa aaaaattagc cgggcgcggg ggcgtgcgcc 8280
tgtaatccca gcaacttggg aggctgaggc aggagaatcg cttgaatccg ggaggcagag 8340
gttgcagtgg gccgagatca cgccattgca ctccagcctg ggcaacaaga acaaaactct 8400
gtttcaaaaa acaaacgaac aaataaaaaa acggccgggc gcggtggctc acgcctgtaa 8460
tcccagcact ctgggaggcc gaggcgggtg gatcacctga ggtcaggaga tcgagaccag 8520
cctggtcaac atggcgaaat cccatctcta ttaaaaacac aaaaattagc tgggggtggt 8580
ggtgcgtgcc cgtaatccca gctactcagg aggcagaggc aggagaatcg cttgaacccg 8640
ggaggcagag attgcaatga gccgagatcg tgccactgca ctccagcctc agggacagag 8700
cgagacacca tcttaaaaaa aaaaaaaaaa aaaaagccgg tgtggtagct cacacctctc 8760
attccagcag tttgggaggc caaggtgtat ggatcacctg aggtcaggag ttccagacca 8820
gcctggcccc aacatggtga aaccctgtct ccagtaaaac tacaaaaatt agctgtatat 8880
ggtggcaggt gcctgtaatc ccagctactc aggaggctga gacaggagaa ttgcttgaac 8940
ccgggaggca gaggttgcag tgagctgaga tcgcgccatt gcactccaac ctgggcgaca 9000
agagcaagac cccatctcta aataaataag acatgctttt ttgttttgtt gctgaatggt 9060
catcgtttta aaccacagat tcaacggtga tgaggcctat gaccagtgca ccaactacct 9120
tctccaggaa ggtcacactt cggggtgcct cctagacgca gagcagcgag acgacattct 9180
ctatttctcc atcaggaatg ggacgcaccc cgttttcacc gcaagtcgct ggatggttta 9240
ttaccgtaag tattgtaaag ccagctcacc atgcttttca gtacttcctt cagcttatta 9300
ccacaaggac tgaaaaccaa gctcatgcaa atcgccggat ccatgattac cgttaactat 9360
tgagaagcaa gctcaccatg cctttcagta cttcctgcag cttattactg taagtaacga 9420
aaaaccaagc tccagccagt cgcgggatca atgattcccg taactattga aaaggaagct 9480
cagcatagtt ttcagtactt ccttcagctt attaccgtaa gtactgaaaa gctcacgtaa 9540
atcgtcggat ccatgattac cgtaataatt gaaaagcaag ctcagcacgc ttttcactac 9600
ttccttcagc tgattaccgt aagtaccgaa aagcaatctc atgatagtcg ctggatcaat 9660
gattaccgta accactgaaa agcaacccag cctacttttc gctacttcct tcaggttatt 9720
accataagta ctgaaaagct catgcaaatt accggatcca tgattaccat aactattgaa 9780
aagcaagctc accatgcttt tcgtacttcc ttcagcttat taccataagt actgataaag 9840
caagctcatg caagtcactg gatcagtgat taccgtagct attgaaaagc aagctcacca 9900
tgcttttcag tacttccttc agcttattac cataagtact gaaaagcaag ctctagcaag 9960
tcgcaggatc agattcccgt aactattgaa aagcagccca gcatcctttt cactacttcc 10020
ttcagcttat tgccataaat aaaaaagctc atgcaaataa ccggatccat gattaccgta 10080
actattgaaa agcaagctca acatgctttt cagtatttcc ttcagcttat taccataagt 10140
actgaaaagc aagctctcgc aagtcgcggg atcaatgatt accataacaa ttgaaaagca 10200
agctcagcat gcttttcagt acttccttca gctgattatc ataagtaccg aaaagcaagc 10260
tctcgcaagt cgcgggatca atgattaccg taacgattga aaagcaatcc cagcacactt 10320
ttcagtaccc cttcatctcc ttaccttcag ttactttcag ttaagttctg aaaatcaagc 10380
tcatggacca ttggccacta gagcccggtg cccagctcct cactccaagt gggaagaaac 10440
cggccttcca ggaagttccc tcttacacgc acactggttg gggattgaat ctgcccccag 10500
tggggagacc agatgacccc gggagactgt gatttaaggg aatgaattaa aggcggggcg 10560
cggtggctca cgcctgtaat cccagcacta tgggaggcca aggcgggcgg atcacttgag 10620
gtctggagtt cgagaccagc ctcaccaaca tggtgaaacc ccatctctac aaacaaacaa 10680
acaaacaaaa aattagccgg gctggtggcg catgcctgta atcctagctg ttcgggaggc 10740
tgaggcaggg aaattgcttg aacctgggag gcagaggctg cagtgagcca cgttggtgcc 10800
actgcactcc agcctgggcg atttataaat tcattattta aaaataaata aggcccaggg 10860
tggtggctta cccctgtaat cccagtactt tgggagacca aggcgggcgg atcacttgag 10920
gtctggagtt cgagaccagc cttgccaacg tggtgaaacc ccgtctctat taaaaataat 10980
ttaaaaaaaa ttagccaggc gtggtggcac acgcttgtaa tcccagctac tcgggaggct 11040
gaggcaggga aattgcttga acccgggagg cggaggctgc agtgagccaa gacggtgcca 11100
ctgcactgca gcctgggcga tttataaatt tattatttaa aaataaataa ggcccagggc 11160
ggtggctctc ccctgtaatc ccagtacttt gggaggccaa ggcaggggga tcacgtgacg 11220
tggggagttc gagaccagcc tgaccaacat ggagaaactc catctctatt aaaaatacat 11280
aattagccgg gcttggtggt gcatgcctgt aatcccagct actcgggacg ctgaggcagg 11340
agaatctctt gaatctggga ggcggagttt gtggtgagcc gagatcgcgc cattgcactc 11400
cagcctggac aacaagagtg aaactccatc tcaaataaat aaattcatta aattaaataa 11460
gggaattaat tagagatgct ctctggtgcc ctgcctacac acacacacac acacacacac 11520
acacacacac acacacacac acagagtgag ctggaaatac tctctcatcc tcatcccact 11580
cactggatgt tctctctctt tttttttttt tttttgagag agagggtctt cctctgttgc 11640
ccaggctggt tttcttatgt gcgttgagaa ctggctgtta agtctcgggc gaggaaatga 11700
gggacaaatg tagggaaacc ctgtttccaa aatgtttatt ctttatccta gaattctgta 11760
aggctgtgtt tcttttttac ttttttattt tttagaggta ggggaaacgg atctgtttga 11820
gaatccggtg agaactatga actctttatt cgcgaaatta cttacagata ctgggtgcgt 11880
ttcctgggct ataataggtc accacaaact ggaggcttaa aacagcagaa atttattctc 11940
tcccagtttt gaagcccatg agtctgagat ggagatgtct gagagccgca ttccctctgg 12000
aggttctaag ggaggatcct tcctgcctct cccagctcct gggggctcca ggcatccctg 12060
ggcttgtggc cgcatcactc cagtctctgc ctccgtctcc atgtggcctt ctcctctgtg 12120
tctcctcttc tgtctcttac aagggcacct gtcattagat ttaggggaca ccctactcca 12180
ggatgatctc acctcaaggt ccttcaccta attacatctg cagagagcct atttccaaat 12240
ccggtctcat tccaggtcct gggctttagg atgtggacag atgtttctgg gggccactgt 12300
tccattcagt ataattatat tcagttcctt ccagggttct aggggaggct ccttcctacc 12360
tctcccagct cctgggggct ccaggcatcc ctgggcttgt ggccccatca ctccagtctc 12420
tgcctccgtc tccacgtggc ctcctcctct gtgtctgcgt ctcctcctct gtctccgaga 12480
aggacacctg tcattggatt tagaaccctt ccttctccag tatgacctca tcctaactaa 12540
ctgaatctat aatgatccta actaactgaa tctataatga tccttttttt tttttttttt 12600
ttttttgaga tagtctcgct ctgtcaccca ggctggaggg cagtggttca atctcggctc 12660
accgcaacct ccgcctcccc ggttcaagcg attctcctgc ctcagcctca ctaatagctg 12720
ggattacaag cgctggccac catgcctgta tttttagtag agacggggtt ttagcatatt 12780
ggccaggctg gtctcgaact cctgacttca ggtgatccac ccgcctcggc cttctaaagg 12840
atcctatttt taaatacagt tccattctga gtttctgggg agttgggatt ttaacatata 12900
tttttgtggg ggacttaatt tagcccgtaa cagacacaca ggacattttc cgcagaattt 12960
tagagagttc cttccttcac aaacctacag gttctcggag ctctggtgga agcttctcct 13020
ataaaagtaa tgaggacggg tgaaccccga gacccataag gtattaaggg gaggaggggt 13080
acaggctaga gaaaggggat gaggtcagcc tgtcacaatc agctcagaga ggagggacgt 13140
cgcttccgtt atttcttctt ctcagtgaaa cccagttccc cgaagcacgt gagattttcg 13200
tggcatcagg atgcagtgac ggtgacgtgt tctgacctgt cctacgggga tctcctctat 13260
gaggttcagt accggagccc cttcgacacc gagtggcagg tgagccgggc ggccgcgact 13320
cagggcgatg gtggctgagc gtcccccagg tgcgggctgt gggattcgct gtttcatcag 13380
acctcgctcc cctctgtcta caccttcctg aattccactc tgctgtatct tcctgagaga 13440
gctctagtcc agcttggctt tttcatgttt ctctctgtgt ctctgagggg tctccagaga 13500
aagagaacca ataatatgtc tgtctgtctg tctatcaatc tatttatcta tctatctatc 13560
aatctatcta tatcattcta ttttatctct acctctatct atgtatctat atcattctat 13620
ttccctctct ttcaatctat catctatcta tctcattcta ttttatctct atctctgtct 13680
ttcaatctat ctcattctat tttatctcta tctctgtctt tcaatctatc atctatttta 13740
tctattaact ctctttgttc tatctatctc tctatggctc tatccatatc tattttatct 13800
accaactctc ttttatctat ctatgtatgg tcaatcttct atatatatca tccctatctc 13860
tatgtagttc aactatctat catctctatc taactaccca ttatctctat tctaccatct 13920
actatcttat ctatgtattt atctatctat gtatgtatct atacatctat catctatccg 13980
tctctatcta tctaagtatc atctatctat ctactctgta tcatctgtct gtctgtctct 14040
ctatctatct aatgtatcat ctatttatct ctctatcatc tgtctatgta tcatctatct 14100
ctctatcatt gctctatcat ctatgtatca tctatctctc tctcatcact ctatcatcta 14160
tgtatcatct atctatctct ctatcatcta tctatgtatc atctgtctct ctctcatcgc 14220
tctatcatct atgtatcatc tatctatcta tcatctgtct atgtatcatc tatcaactct 14280
gtcatctctc tgttttatct atgtatctat catttcttta tctgtctacc tctagtccta 14340
tctctatctg tatctctaca cacctgtctc tctacacaca cacacacaca cacagacaca 14400
caaacacagg cacacagaca cacacagaca tgcacagaca cacacagaca cacacagaca 14460
cacacaggca cacacacaca gtcatgtgct gcctaacgac cttttggtca tcagcagact 14520
gcatgtatca cggtagtctc ctatgattat cacacagctg tcctatgcag ctgtcccaat 14580
tattttcttc tatatcatat ttttcctgta ccttctctat gtttagatac acaaatactt 14640
acccttgcgt taggtttgtc tgcagtattc agtacagtaa cgtgctgtat ggctgtgtag 14700
ctgaagagca atttactata cagcctaggt gtgcagcggg ctagaccagc taggtgtgtg 14760
taagtaaact ctagaatatt ctcataatga agaaatcacc tcacaatgaa tttcccagaa 14820
catgtcccca tcgttaagca atgcatgact gtatatctac ctatatgtgt gtgtacacac 14880
acacatatac acacacatat gtacgtacct tgtgtacaca gcttatatat acatatatac 14940
acacgcatat acacacatat agatacacag cttatataca catatatata cacatgcata 15000
tacacacata tagatacaca gcttatatac acacatatat acatacctta tatatgcata 15060
tttatacaca tgtatataca catcttatat acgcacacat atacacacac acacagctta 15120
tatacacata tatataccca cacatatata cacagcttat atacacgtat atatatgtat 15180
atatgcacct tatatacaca gcttatatac acatatttat acacacgtat acacacacct 15240
tatataaaca catatataca cacatataca cagcttatat aacatatata cacacacata 15300
tatacatacc ttatatatgc atatttatac acatgtacat acacatctta tatacacata 15360
tatatacata catatgtgca cagcttatat acacgtatat atacacatat atatgcacct 15420
tatatacaca gcttatatac acatatttat acacacgtat acacacaccg tatatacaca 15480
cacatacaca catatacaca gcttatatac acagcttata tacaggtata tatacacaca 15540
tgtatataca cacatgtata tatacacaaa ctttatatat atatacacac acagcttata 15600
tacaatacat atacacacat atatacacac cttatataca cacatatata cacacacata 15660
tatacagagc ttatatacac agcttatata cacatatata tacacacgta tatacacacc 15720
taatatacac agcttatata tacacatata tacacacata catatataca caacacacgt 15780
acacagctta tatatacaca tatatacaca cacatataga tacatagctt atatatacac 15840
atatatacac atcttatata catagcttct atacacacag atatacacac accttataca 15900
cacaacttat atatacacaa ttatatatac acaccttata tatacagctt atatatacac 15960
acatatataa atatacatat agagatatct tattggtaca tatatctaca aacatatata 16020
aactatatat gtataaactg atacatagaa tagaacattc atctgtatct ttatatccat 16080
ttatatctgt aaagatatgt agatacaggc tggatgcagt ggctcacacc tttaatccca 16140
gcactttggg aggccgagga gggtggatca cctgaggtca ggagttcaag accagcctgg 16200
ccaacgtggt gaaacctcat ctctactaga aatacaaaaa ttagccaagc atggtggtgc 16260
ctgtaatccg agctactcgg gaggctgagg cacaagaatt gcttgaaccc gacaggcaga 16320
ggttgcagtg agccgagacc gcaccactgc actccagcct gggcaacaga gcaagactct 16380
gtctcagtaa ataaataaat aatatattaa aataataata aagtaaatac aggccaggca 16440
cagtggctca tgcctgtaat cccagtactg ttggaggcca aggcaggagg atcgcttgag 16500
cccaggagtt gttgaccagc ttgggcaaca gagtgagacc ccatctcttt ttcttttttt 16560
agacacagtc ccgctctgtc acccaggctg gagtgcagtg gtgcgatctc tgcttgctac 16620
aaccttcgcc tcccaggttc aagcgattct cctgcctcag cctcccaagt agctgggatt 16680
acaggcaccc gccaccacgc ctggctaatt tttgtattat cagtagagac ggggtttctc 16740
catgttggcc aggctggtct cgaacttgcg acctcaggtg atccacccgc ctcagcctcc 16800
caaagcgttg ggtttacagg agtgagccac tgtgtccggc ctcgcggctc cattcttgaa 16860
gtcagcgaga ctgtgaaccc tccggaagga aaactctgga cagacaggtt acatcactaa 16920
tcattgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tatgtgtatg 16980
tttctccagt ccaaacagga aaatacctgc aacgtcacca tagaaggctt ggatgccgag 17040
aagtgttact ctttctgggt cagggtgaag gctatggagg atgtatatgg gccagacaca 17100
tacccaagcg actggtcaga ggtgacatgc tggcagagag gcgagattcg gggtaatgct 17160
tgttacacgg cagtgtccca tagccttgtc accaggctgg agtaggcata gccactgcct 17220
tcccgggagg tgggagggag ggtgtcctgc cttcgaggtg ggagggaggg tgtcctgcct 17280
tcctgggagg tgggagggag ggtgtcctgc cttcgaggtg ggagggaggg tgtcctatct 17340
tcccgggagg tgggagggag ggtgtcctat cttcccggga ggtgggaggg aggctgtcct 17400
gccttcgagg tgggagggag ggtgtcctgc cttcctggga ggtgggaggg agggtgtcct 17460
gccttcctag gaggtgggag ggagggtgtc ctgccttcct gggaggtggg agggagggtg 17520
tcctgccttc gaggtgggag ggagggtgtc ctgtcttccc gggaggtggg agggagggtg 17580
tcctatcttc ccgggaggtg ggagggaggc tgtcctgcct tcgaggtggg agggagggtg 17640
tcctgccttc ctgggaggtg ggagggaggg tgtcctgcct tcctaggagg tgggagggag 17700
ggtgtcctgc cttcctggga ggtgggaggg agggtgtcct gccttcgagg tgggagggag 17760
ggtgtcctgc cttcctggga ggtgggaggg agggtgtcct gccttctagg tgggagggag 17820
ggtgtcctgc cttcctggga ggtgggaggg agggtgtcct gccttcgagg tgggagggag 17880
ggtgtcctgc cttcctggga ggtgggaggg agggtgtcct gccttctagg tgggagggag 17940
ggtgtcctgc cttcctggga ggtgggaggg agggtgtcct gccttcgagg tgggagggag 18000
ggtgtcctgc cttcctggga ggtgggaggg agggtgtcct gccttcgagg tgggagggag 18060
ggtgtcctgc cttcctggga ggtgggaggg agggtgtcct gccttcctgg gaggtgggag 18120
ggagggtgtc ctgccttcct gggaggtggg agggagggtg tcctgccttc ctgggaggtg 18180
ggagggaggg tgtcctgcct tcctgggagg tgggagggag ggtgtcctgc cttcctggga 18240
ggtgggaggg agggtgtcct gccttcctgg gaggtgggag ggagggtgtc ctgccttcga 18300
ggtgggaggg agggtgtcct gccttcccag gagggtgtgt ctgagcaagc tcagccttct 18360
gtcatcctcc agggccccat ctgaaagtaa ttcctctcct tgtttcattc tcgggctgct 18420
ttcacttggg agagttttct ttcttttgtt tttttgagaa acattctcat ggtgcccagg 18480
ctggagtgca gtggcgcgat ctcggctccc tgcaacatct gtctcccacg ttcaatcgat 18540
tctcccgcct cagcctcccg agtgcctggg attacagtgt acacgccacc acacctgatt 18600
aaatcttttt attttttatt tttttatttt tatttttttt tagagggagt ctcagtctgt 18660
ggtccaggct ggagttcagt ggcacggtct tggctcactg caacctccgc ctcccgagtt 18720
caagtgattc tcctgcctca gcctcccaag tagctgggac tacaggcacg caccaccaag 18780
cccgcctaat gtttgtattt ttagtaggga tggcgtttcc ccatattggc caggctggtc 18840
tcgaactcct gaccttgtga tccgcccgcc tcggcctccc aaagtgctgg gattaaaggc 18900
gtgagccacc gcgcccggcc tttgacgtat gttttcaggg ggcatgattt aaggagcaca 18960
gccaccaaca cacgaaagca agctctcata tgctgtaaac acctccagca accagaagcc 19020
tccaaaggct acatgttgga cctgccctta cttcctcggg gtggctgtgg gatgtgttgt 19080
tgtccagaga cacggtgtct ctttccagga tattttccat aggaatgaaa atttgctgac 19140
actaacattc attaaaaaaa aaaaataggt ccatctctac taaaaataca aaaattagcc 19200
cggtgtggtg gcggatgcct gtcatcccag ctgctcagga ggctgagaca ggagaatcgc 19260
ttgagtccgg gagacggagg ttgcagtgag ctgagatgga gccactgcac tccagcctgg 19320
gcaacagagt gaggttctgc ctcaaaaaaa aaaaaaaaaa aaagtaaaag atttgctgac 19380
acgaatattt acaaaaaaca aaaacaaaac aaaaaacaaa caacgagaac caagaaaaaa 19440
aaacgaacac caaaaaatga gggagactgg ttagggatga gatgtaacat cacgttgaaa 19500
acgtacagcc gcacgtcatg ttgaaaactg acagccgcct tttcattttg tttcagatgc 19560
ctgtgcagag acaccaacgc ctcccaaacc aaagctgtcc aaactcctgc ccctgggctg 19620
cggcctagca gcgctgctga cactgtccct gctcctggcc gccctgaggc ttcgcaggtg 19680
aggggtctcc gaggagtcat ggggtcatgg tggggtaatt gcgatgtcta cggcgatgac 19740
gtcaccactg tgatgacgtc atgttcgggt cgggggcatg gcatgggggt gtcaggtgaa 19800
ccctgacccc tgaccctgaa ccccagggtg aaagatgcgc tgctgccctg cgtccctgac 19860
cccagcggct ccttccctgg actctttgag aagcatcacg ggaacttcca ggtgcgcggg 19920
gggggggggg gggtcaggat cgctgtgggg ggtcacttcc tgtccccgga gagtgagggc 19980
atgaggcagg gggatgatgg gagtgacagg cgtcacgggc cactgcctga ctccaggcac 20040
cgctcccctc cccctccccc cacccccttc cctccacccc ccccctccac acacacaacc 20100
cctttcgctg caggcctgga ttgcggacgc ccaggccaca gccccgccag ccaggaccga 20160
ggaggaagat gacctcatcc acaccaaggc taagagggtg gagcccgagg acggcacctc 20220
cctctgcacc gtgccaaggc cacccagctt cgagccaagg gggccgggag gcggggccat 20280
ggtgtcagtg ggcggggcca cgttcatggt gggcgacagc ggctacatga ccctgtgacc 20340
ttgaagtcac tgccagtcta tacttcaggc tgaggtcact tcctgtcttt aaataattca 20400
aactcacaaa tcctgtgcct gtctgtatgc aaatgtggtc acaaatattc aaataaaatg 20460
caaatgctat gct 20473
<210> 64
<211> 15741
<212> DNA
<213> 人工序列
<220>
<223> 靶向的Tslpr等位基因7559(无盒),基因组DAN,总计15741 bp
<220>
<221> misc_feature
<222> (1)..(1051)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (111)..(113)
<223> 起始密码子
<220>
<221> misc_feature
<222> (111)..(189)
<223> 编码外显子1
<220>
<221> misc_feature
<222> (1052)..(1128)
<223> 缺失的Neo自缺失盒
<220>
<221> misc_feature
<222> (1052)..(1057)
<223> 5Xhol
<220>
<221> misc_feature
<222> (1058)..(1091)
<223> LoxP
<220>
<221> misc_feature
<222> (1097)..(1122)
<223> I_Ceu
<220>
<221> misc_feature
<222> (1123)..(1128)
<223> Nhel
<220>
<221> misc_feature
<222> (1129)..(14871)
<223> 人序列
<220>
<221> misc_feature
<222> (14872)..(15741)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (15604)..(15606)
<223> 终止密码子
<400> 64
gcccccggct tcccgttttc ggctctaagc ggcctgggcg ccctcgactc ggaccggctc 60
ggaccgaacc agctgtcaat cactgcagcg tccgcggccc cgccggcgac atggcatggg 120
cactcgcggt catcctcctg cctcggctcc ttgcggcggc agcggcggcg gcggcggtga 180
cgtcacgggg tgaggagtga gcgggggcgg ggctgcctgt caatcgccgc ggtgggcggg 240
gcccgagcaa gagctaccaa gttgcttttc gtcccatcat tgcttttcgt cccatcatga 300
atatgcaaat aaggcctctg gccctcctaa gggcgatcgg atagcgcttc gtttgcatat 360
tcattttgat ctttgcgtat gcatgagccc cgccctcccc ccctacgctc ggcgctttct 420
cctcagtaat atgcaaatga gacctaaacc ccgccttgac ctcattagca tagtgctgcc 480
gccacaatct cgctcctcct cctgaatatg caaataaggc ctctgggccg ctccttcttt 540
gcatattcat atacagcttt cccgcttata tgcaaataac gcttcgcccc taccgagttc 600
tcactcatcg cttctcattt gcatatccat cgggagatac acatattcat gagcgatgta 660
tttctgtctt ccatcccctc atgaatatag aattgatgcc ctgtccatat ggatcactat 720
gcatttgcat attttcccca cgatttacat atgcacaagc ctcaacgtct tgctccaacg 780
tccctgatca tgaatatgca gatgagacct cagatctccg aaattgaatc tgcccgctcc 840
tcatcatata ctgctattct catatgcacc agccacaaag tcttccatcc ttttcccctc 900
atgaatatgc aaagaatgct tccccagtcc atctccactc tggttcactg cctgctcatt 960
tgtgtatcca ttggtcgctt tgcatagtgg tgagccccgc ttccctaccg ctttctttgc 1020
gatcatgtat attcaaatga ggctccgact tgtcgagata acttcgtata atgtatgcta 1080
tacgaagtta tgctagtaac tataacggtc ctaaggtagc gagctagcca tttctgaagt 1140
tggtgtgtgt ggtgttttga gaaagacagt aaggtggatc gatggggaca gtttccgatg 1200
ccaccttagg tatccacagg ggatgtgttg ttggatacat gattgatcta tacagataca 1260
tctgtgcatg gcactagtgg gtgaacttac cttttgcaaa aacaaaaaca aaagcagccg 1320
ggcgcggtgg ctcacgcctg caatctcagc actttaggtg gatgaggcgg gcggatcacg 1380
aggtcaggag atcgagacca tcctggctaa cacagtgaaa ccccatctct actaaaagta 1440
caaaaaatta tccaggcatg gtggcgggca cctgtagccc cagctactcg ggaggctgag 1500
gcaggagaat ggcgtgaacc cgggaggcgg agcttgcagt gagccgagat tgcgccactg 1560
cagtccagcc tgggtgacag agtgagagtc tgtctcacac aatacactac actacactac 1620
actacactac actacactac actacactac aatacaatgc aatacaatgc aatacaatac 1680
gtcaggcgcg gtggctcacg cctgtaatcc cagtactttg ggaggccgag gcgggtggat 1740
catgaggtca ggagatcgag accatcctgg ctaacacggt gaaaccccgt ctctactaaa 1800
aatacaaaaa attagccagg tgtggtgaca ggtgcctgta atcccggcta ctcgggaggc 1860
tgaggcaggg gaatcgcttg aacccgggag gcggaggttg cagtgagccg agatcgtgcc 1920
attgtactcc agcctgggca acagagtgag actctgtctc aaaaagaaaa ataaatttaa 1980
aaaaataaaa aaatagagtt gcctcaccgt gaacttcatg cgtctctctg tgtctagcag 2040
aaggagtaca gattcagatc atctacttca atttagaaac cgtgcaggtg acatggaatg 2100
ccagcaaata ctccaggacc aacctgactt tccactacag gtaagtggcc cccagaaagc 2160
gaaccccacg cccagggggc tcaaaatcgc tcttctgagc cgtcagcgat tgggaatgct 2220
tgagaacaaa agtgtaaagc atcagactgt gcaagccgga atgtttgttc tgtgaaaccc 2280
tcagccctca ccacaaccac aatctcattg ccccaaacct tcttgccaag ggatggctga 2340
ctcactgtca aaatcaacta cattcttttt tttgtttgtt tttattttga gtcggagtct 2400
cactccgttg ccacgctgga gtgcagtggc gcaatctcgg ctcactgcaa cctctgcctc 2460
ccgggttcaa gccattcccc tgcctcagcc tcccgagtag ctgggattac aggcacctgc 2520
caccatgcct agctaatttt tgtattttta gtagagatgg tgattcacca tattggtcag 2580
gccggtttca aactcctgac ctcatgtgat ccacctgcct cagcctccca aagtgctggg 2640
atgacaggcg tgagccacgg catccggact gaaaatcacc tagattcttc acgggagatt 2700
aacagagagt tttgttcacc cagagctctg ggtgaacttt aagtcttatc tgctaggcag 2760
ccggggaggg aaagactcag tctctgaaac atttcacagc cttacccggg gctaccccca 2820
accctgtgtc tccctgatgt gactttattt ttatttttac tttggcttag ttagacaccc 2880
agaagtatgc gtacgaacat tgcaggaagg gtttttccaa taaatttaat catgggtgga 2940
tgattcttca gtttgataac aaaagagata aacggcaaag cgtacagaac agggaaattt 3000
taaaacgaag ttatttggaa aataagactc accgttggga gaccgaggtg ggtggatcat 3060
ctgagatcag gagttccaga ccatcctggc caacatggtg aaaccccaac tctactaaaa 3120
atacaaaaac tagccgggcg tggcggcagg tgcctgtaat cccagctact caggaggctg 3180
aggcaagaga atcgcttcaa cctgggagac ggagttcacg gtgagccgag attgcactcc 3240
agcctggccg acagagcgag actgtctcaa aaacaaaaca aaacaaaaca aaaacctcac 3300
aaaaagaaaa aaaaaagtgc tggattttgc acgtagttgc agaattcagc tcagtttctt 3360
cctctgtaaa aggggcagtt cttggggggg gtgttggctc atgcctgtta tcccagcact 3420
ttgggaggct gagggggggg ggggtggatc acctgaggtc aggagttcaa gaccagcctg 3480
gccaacatgg tgaaacctcg tctctactaa aaatacaaaa aaattagccg ggcgcggggg 3540
cgtgcgcctg taatcccagc aacttgggag gctgaggcag gagaatcgct tgaatccggg 3600
aggcagaggt tgcagtgggc cgagatcacg ccattgcact ccagcctggg caacaagaac 3660
aaaactctgt ttcaaaaaac aaacgaacaa ataaaaaaac ggccgggcgc ggtggctcac 3720
gcctgtaatc ccagcactct gggaggccga ggcgggtgga tcacctgagg tcaggagatc 3780
gagaccagcc tggtcaacat ggcgaaatcc catctctatt aaaaacacaa aaattagctg 3840
ggggtggtgg tgcgtgcccg taatcccagc tactcaggag gcagaggcag gagaatcgct 3900
tgaacccggg aggcagagat tgcaatgagc cgagatcgtg ccactgcact ccagcctcag 3960
ggacagagcg agacaccatc ttaaaaaaaa aaaaaaaaaa aaagccggtg tggtagctca 4020
cacctctcat tccagcagtt tgggaggcca aggtgtatgg atcacctgag gtcaggagtt 4080
ccagaccagc ctggccccaa catggtgaaa ccctgtctcc agtaaaacta caaaaattag 4140
ctgtatatgg tggcaggtgc ctgtaatccc agctactcag gaggctgaga caggagaatt 4200
gcttgaaccc gggaggcaga ggttgcagtg agctgagatc gcgccattgc actccaacct 4260
gggcgacaag agcaagaccc catctctaaa taaataagac atgctttttt gttttgttgc 4320
tgaatggtca tcgttttaaa ccacagattc aacggtgatg aggcctatga ccagtgcacc 4380
aactaccttc tccaggaagg tcacacttcg gggtgcctcc tagacgcaga gcagcgagac 4440
gacattctct atttctccat caggaatggg acgcaccccg ttttcaccgc aagtcgctgg 4500
atggtttatt accgtaagta ttgtaaagcc agctcaccat gcttttcagt acttccttca 4560
gcttattacc acaaggactg aaaaccaagc tcatgcaaat cgccggatcc atgattaccg 4620
ttaactattg agaagcaagc tcaccatgcc tttcagtact tcctgcagct tattactgta 4680
agtaacgaaa aaccaagctc cagccagtcg cgggatcaat gattcccgta actattgaaa 4740
aggaagctca gcatagtttt cagtacttcc ttcagcttat taccgtaagt actgaaaagc 4800
tcacgtaaat cgtcggatcc atgattaccg taataattga aaagcaagct cagcacgctt 4860
ttcactactt ccttcagctg attaccgtaa gtaccgaaaa gcaatctcat gatagtcgct 4920
ggatcaatga ttaccgtaac cactgaaaag caacccagcc tacttttcgc tacttccttc 4980
aggttattac cataagtact gaaaagctca tgcaaattac cggatccatg attaccataa 5040
ctattgaaaa gcaagctcac catgcttttc gtacttcctt cagcttatta ccataagtac 5100
tgataaagca agctcatgca agtcactgga tcagtgatta ccgtagctat tgaaaagcaa 5160
gctcaccatg cttttcagta cttccttcag cttattacca taagtactga aaagcaagct 5220
ctagcaagtc gcaggatcag attcccgtaa ctattgaaaa gcagcccagc atccttttca 5280
ctacttcctt cagcttattg ccataaataa aaaagctcat gcaaataacc ggatccatga 5340
ttaccgtaac tattgaaaag caagctcaac atgcttttca gtatttcctt cagcttatta 5400
ccataagtac tgaaaagcaa gctctcgcaa gtcgcgggat caatgattac cataacaatt 5460
gaaaagcaag ctcagcatgc ttttcagtac ttccttcagc tgattatcat aagtaccgaa 5520
aagcaagctc tcgcaagtcg cgggatcaat gattaccgta acgattgaaa agcaatccca 5580
gcacactttt cagtacccct tcatctcctt accttcagtt actttcagtt aagttctgaa 5640
aatcaagctc atggaccatt ggccactaga gcccggtgcc cagctcctca ctccaagtgg 5700
gaagaaaccg gccttccagg aagttccctc ttacacgcac actggttggg gattgaatct 5760
gcccccagtg gggagaccag atgaccccgg gagactgtga tttaagggaa tgaattaaag 5820
gcggggcgcg gtggctcacg cctgtaatcc cagcactatg ggaggccaag gcgggcggat 5880
cacttgaggt ctggagttcg agaccagcct caccaacatg gtgaaacccc atctctacaa 5940
acaaacaaac aaacaaaaaa ttagccgggc tggtggcgca tgcctgtaat cctagctgtt 6000
cgggaggctg aggcagggaa attgcttgaa cctgggaggc agaggctgca gtgagccacg 6060
ttggtgccac tgcactccag cctgggcgat ttataaattc attatttaaa aataaataag 6120
gcccagggtg gtggcttacc cctgtaatcc cagtactttg ggagaccaag gcgggcggat 6180
cacttgaggt ctggagttcg agaccagcct tgccaacgtg gtgaaacccc gtctctatta 6240
aaaataattt aaaaaaaatt agccaggcgt ggtggcacac gcttgtaatc ccagctactc 6300
gggaggctga ggcagggaaa ttgcttgaac ccgggaggcg gaggctgcag tgagccaaga 6360
cggtgccact gcactgcagc ctgggcgatt tataaattta ttatttaaaa ataaataagg 6420
cccagggcgg tggctctccc ctgtaatccc agtactttgg gaggccaagg cagggggatc 6480
acgtgacgtg gggagttcga gaccagcctg accaacatgg agaaactcca tctctattaa 6540
aaatacataa ttagccgggc ttggtggtgc atgcctgtaa tcccagctac tcgggacgct 6600
gaggcaggag aatctcttga atctgggagg cggagtttgt ggtgagccga gatcgcgcca 6660
ttgcactcca gcctggacaa caagagtgaa actccatctc aaataaataa attcattaaa 6720
ttaaataagg gaattaatta gagatgctct ctggtgccct gcctacacac acacacacac 6780
acacacacac acacacacac acacacacac agagtgagct ggaaatactc tctcatcctc 6840
atcccactca ctggatgttc tctctctttt tttttttttt tttgagagag agggtcttcc 6900
tctgttgccc aggctggttt tcttatgtgc gttgagaact ggctgttaag tctcgggcga 6960
ggaaatgagg gacaaatgta gggaaaccct gtttccaaaa tgtttattct ttatcctaga 7020
attctgtaag gctgtgtttc ttttttactt ttttattttt tagaggtagg ggaaacggat 7080
ctgtttgaga atccggtgag aactatgaac tctttattcg cgaaattact tacagatact 7140
gggtgcgttt cctgggctat aataggtcac cacaaactgg aggcttaaaa cagcagaaat 7200
ttattctctc ccagttttga agcccatgag tctgagatgg agatgtctga gagccgcatt 7260
ccctctggag gttctaaggg aggatccttc ctgcctctcc cagctcctgg gggctccagg 7320
catccctggg cttgtggccg catcactcca gtctctgcct ccgtctccat gtggccttct 7380
cctctgtgtc tcctcttctg tctcttacaa gggcacctgt cattagattt aggggacacc 7440
ctactccagg atgatctcac ctcaaggtcc ttcacctaat tacatctgca gagagcctat 7500
ttccaaatcc ggtctcattc caggtcctgg gctttaggat gtggacagat gtttctgggg 7560
gccactgttc cattcagtat aattatattc agttccttcc agggttctag gggaggctcc 7620
ttcctacctc tcccagctcc tgggggctcc aggcatccct gggcttgtgg ccccatcact 7680
ccagtctctg cctccgtctc cacgtggcct cctcctctgt gtctgcgtct cctcctctgt 7740
ctccgagaag gacacctgtc attggattta gaacccttcc ttctccagta tgacctcatc 7800
ctaactaact gaatctataa tgatcctaac taactgaatc tataatgatc cttttttttt 7860
tttttttttt ttttgagata gtctcgctct gtcacccagg ctggagggca gtggttcaat 7920
ctcggctcac cgcaacctcc gcctccccgg ttcaagcgat tctcctgcct cagcctcact 7980
aatagctggg attacaagcg ctggccacca tgcctgtatt tttagtagag acggggtttt 8040
agcatattgg ccaggctggt ctcgaactcc tgacttcagg tgatccaccc gcctcggcct 8100
tctaaaggat cctattttta aatacagttc cattctgagt ttctggggag ttgggatttt 8160
aacatatatt tttgtggggg acttaattta gcccgtaaca gacacacagg acattttccg 8220
cagaatttta gagagttcct tccttcacaa acctacaggt tctcggagct ctggtggaag 8280
cttctcctat aaaagtaatg aggacgggtg aaccccgaga cccataaggt attaagggga 8340
ggaggggtac aggctagaga aaggggatga ggtcagcctg tcacaatcag ctcagagagg 8400
agggacgtcg cttccgttat ttcttcttct cagtgaaacc cagttccccg aagcacgtga 8460
gattttcgtg gcatcaggat gcagtgacgg tgacgtgttc tgacctgtcc tacggggatc 8520
tcctctatga ggttcagtac cggagcccct tcgacaccga gtggcaggtg agccgggcgg 8580
ccgcgactca gggcgatggt ggctgagcgt cccccaggtg cgggctgtgg gattcgctgt 8640
ttcatcagac ctcgctcccc tctgtctaca ccttcctgaa ttccactctg ctgtatcttc 8700
ctgagagagc tctagtccag cttggctttt tcatgtttct ctctgtgtct ctgaggggtc 8760
tccagagaaa gagaaccaat aatatgtctg tctgtctgtc tatcaatcta tttatctatc 8820
tatctatcaa tctatctata tcattctatt ttatctctac ctctatctat gtatctatat 8880
cattctattt ccctctcttt caatctatca tctatctatc tcattctatt ttatctctat 8940
ctctgtcttt caatctatct cattctattt tatctctatc tctgtctttc aatctatcat 9000
ctattttatc tattaactct ctttgttcta tctatctctc tatggctcta tccatatcta 9060
ttttatctac caactctctt ttatctatct atgtatggtc aatcttctat atatatcatc 9120
cctatctcta tgtagttcaa ctatctatca tctctatcta actacccatt atctctattc 9180
taccatctac tatcttatct atgtatttat ctatctatgt atgtatctat acatctatca 9240
tctatccgtc tctatctatc taagtatcat ctatctatct actctgtatc atctgtctgt 9300
ctgtctctct atctatctaa tgtatcatct atttatctct ctatcatctg tctatgtatc 9360
atctatctct ctatcattgc tctatcatct atgtatcatc tatctctctc tcatcactct 9420
atcatctatg tatcatctat ctatctctct atcatctatc tatgtatcat ctgtctctct 9480
ctcatcgctc tatcatctat gtatcatcta tctatctatc atctgtctat gtatcatcta 9540
tcaactctgt catctctctg ttttatctat gtatctatca tttctttatc tgtctacctc 9600
tagtcctatc tctatctgta tctctacaca cctgtctctc tacacacaca cacacacaca 9660
cagacacaca aacacaggca cacagacaca cacagacatg cacagacaca cacagacaca 9720
cacagacaca cacaggcaca cacacacagt catgtgctgc ctaacgacct tttggtcatc 9780
agcagactgc atgtatcacg gtagtctcct atgattatca cacagctgtc ctatgcagct 9840
gtcccaatta ttttcttcta tatcatattt ttcctgtacc ttctctatgt ttagatacac 9900
aaatacttac ccttgcgtta ggtttgtctg cagtattcag tacagtaacg tgctgtatgg 9960
ctgtgtagct gaagagcaat ttactataca gcctaggtgt gcagcgggct agaccagcta 10020
ggtgtgtgta agtaaactct agaatattct cataatgaag aaatcacctc acaatgaatt 10080
tcccagaaca tgtccccatc gttaagcaat gcatgactgt atatctacct atatgtgtgt 10140
gtacacacac acatatacac acacatatgt acgtaccttg tgtacacagc ttatatatac 10200
atatatacac acgcatatac acacatatag atacacagct tatatacaca tatatataca 10260
catgcatata cacacatata gatacacagc ttatatacac acatatatac ataccttata 10320
tatgcatatt tatacacatg tatatacaca tcttatatac gcacacatat acacacacac 10380
acagcttata tacacatata tatacccaca catatataca cagcttatat acacgtatat 10440
atatgtatat atgcacctta tatacacagc ttatatacac atatttatac acacgtatac 10500
acacacctta tataaacaca tatatacaca catatacaca gcttatataa catatataca 10560
cacacatata tacatacctt atatatgcat atttatacac atgtacatac acatcttata 10620
tacacatata tatacataca tatgtgcaca gcttatatac acgtatatat acacatatat 10680
atgcacctta tatacacagc ttatatacac atatttatac acacgtatac acacaccgta 10740
tatacacaca catacacaca tatacacagc ttatatacac agcttatata caggtatata 10800
tacacacatg tatatacaca catgtatata tacacaaact ttatatatat atacacacac 10860
agcttatata caatacatat acacacatat atacacacct tatatacaca catatataca 10920
cacacatata tacagagctt atatacacag cttatataca catatatata cacacgtata 10980
tacacaccta atatacacag cttatatata cacatatata cacacataca tatatacaca 11040
acacacgtac acagcttata tatacacata tatacacaca catatagata catagcttat 11100
atatacacat atatacacat cttatataca tagcttctat acacacagat atacacacac 11160
cttatacaca caacttatat atacacaatt atatatacac accttatata tacagcttat 11220
atatacacac atatataaat atacatatag agatatctta ttggtacata tatctacaaa 11280
catatataaa ctatatatgt ataaactgat acatagaata gaacattcat ctgtatcttt 11340
atatccattt atatctgtaa agatatgtag atacaggctg gatgcagtgg ctcacacctt 11400
taatcccagc actttgggag gccgaggagg gtggatcacc tgaggtcagg agttcaagac 11460
cagcctggcc aacgtggtga aacctcatct ctactagaaa tacaaaaatt agccaagcat 11520
ggtggtgcct gtaatccgag ctactcggga ggctgaggca caagaattgc ttgaacccga 11580
caggcagagg ttgcagtgag ccgagaccgc accactgcac tccagcctgg gcaacagagc 11640
aagactctgt ctcagtaaat aaataaataa tatattaaaa taataataaa gtaaatacag 11700
gccaggcaca gtggctcatg cctgtaatcc cagtactgtt ggaggccaag gcaggaggat 11760
cgcttgagcc caggagttgt tgaccagctt gggcaacaga gtgagacccc atctcttttt 11820
ctttttttag acacagtccc gctctgtcac ccaggctgga gtgcagtggt gcgatctctg 11880
cttgctacaa ccttcgcctc ccaggttcaa gcgattctcc tgcctcagcc tcccaagtag 11940
ctgggattac aggcacccgc caccacgcct ggctaatttt tgtattatca gtagagacgg 12000
ggtttctcca tgttggccag gctggtctcg aacttgcgac ctcaggtgat ccacccgcct 12060
cagcctccca aagcgttggg tttacaggag tgagccactg tgtccggcct cgcggctcca 12120
ttcttgaagt cagcgagact gtgaaccctc cggaaggaaa actctggaca gacaggttac 12180
atcactaatc attgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgta 12240
tgtgtatgtt tctccagtcc aaacaggaaa atacctgcaa cgtcaccata gaaggcttgg 12300
atgccgagaa gtgttactct ttctgggtca gggtgaaggc tatggaggat gtatatgggc 12360
cagacacata cccaagcgac tggtcagagg tgacatgctg gcagagaggc gagattcggg 12420
gtaatgcttg ttacacggca gtgtcccata gccttgtcac caggctggag taggcatagc 12480
cactgccttc ccgggaggtg ggagggaggg tgtcctgcct tcgaggtggg agggagggtg 12540
tcctgccttc ctgggaggtg ggagggaggg tgtcctgcct tcgaggtggg agggagggtg 12600
tcctatcttc ccgggaggtg ggagggaggg tgtcctatct tcccgggagg tgggagggag 12660
gctgtcctgc cttcgaggtg ggagggaggg tgtcctgcct tcctgggagg tgggagggag 12720
ggtgtcctgc cttcctagga ggtgggaggg agggtgtcct gccttcctgg gaggtgggag 12780
ggagggtgtc ctgccttcga ggtgggaggg agggtgtcct gtcttcccgg gaggtgggag 12840
ggagggtgtc ctatcttccc gggaggtggg agggaggctg tcctgccttc gaggtgggag 12900
ggagggtgtc ctgccttcct gggaggtggg agggagggtg tcctgccttc ctaggaggtg 12960
ggagggaggg tgtcctgcct tcctgggagg tgggagggag ggtgtcctgc cttcgaggtg 13020
ggagggaggg tgtcctgcct tcctgggagg tgggagggag ggtgtcctgc cttctaggtg 13080
ggagggaggg tgtcctgcct tcctgggagg tgggagggag ggtgtcctgc cttcgaggtg 13140
ggagggaggg tgtcctgcct tcctgggagg tgggagggag ggtgtcctgc cttctaggtg 13200
ggagggaggg tgtcctgcct tcctgggagg tgggagggag ggtgtcctgc cttcgaggtg 13260
ggagggaggg tgtcctgcct tcctgggagg tgggagggag ggtgtcctgc cttcgaggtg 13320
ggagggaggg tgtcctgcct tcctgggagg tgggagggag ggtgtcctgc cttcctggga 13380
ggtgggaggg agggtgtcct gccttcctgg gaggtgggag ggagggtgtc ctgccttcct 13440
gggaggtggg agggagggtg tcctgccttc ctgggaggtg ggagggaggg tgtcctgcct 13500
tcctgggagg tgggagggag ggtgtcctgc cttcctggga ggtgggaggg agggtgtcct 13560
gccttcgagg tgggagggag ggtgtcctgc cttcccagga gggtgtgtct gagcaagctc 13620
agccttctgt catcctccag ggccccatct gaaagtaatt cctctccttg tttcattctc 13680
gggctgcttt cacttgggag agttttcttt cttttgtttt tttgagaaac attctcatgg 13740
tgcccaggct ggagtgcagt ggcgcgatct cggctccctg caacatctgt ctcccacgtt 13800
caatcgattc tcccgcctca gcctcccgag tgcctgggat tacagtgtac acgccaccac 13860
acctgattaa atctttttat tttttatttt tttattttta ttttttttta gagggagtct 13920
cagtctgtgg tccaggctgg agttcagtgg cacggtcttg gctcactgca acctccgcct 13980
cccgagttca agtgattctc ctgcctcagc ctcccaagta gctgggacta caggcacgca 14040
ccaccaagcc cgcctaatgt ttgtattttt agtagggatg gcgtttcccc atattggcca 14100
ggctggtctc gaactcctga ccttgtgatc cgcccgcctc ggcctcccaa agtgctggga 14160
ttaaaggcgt gagccaccgc gcccggcctt tgacgtatgt tttcaggggg catgatttaa 14220
ggagcacagc caccaacaca cgaaagcaag ctctcatatg ctgtaaacac ctccagcaac 14280
cagaagcctc caaaggctac atgttggacc tgcccttact tcctcggggt ggctgtggga 14340
tgtgttgttg tccagagaca cggtgtctct ttccaggata ttttccatag gaatgaaaat 14400
ttgctgacac taacattcat taaaaaaaaa aaataggtcc atctctacta aaaatacaaa 14460
aattagcccg gtgtggtggc ggatgcctgt catcccagct gctcaggagg ctgagacagg 14520
agaatcgctt gagtccggga gacggaggtt gcagtgagct gagatggagc cactgcactc 14580
cagcctgggc aacagagtga ggttctgcct caaaaaaaaa aaaaaaaaaa agtaaaagat 14640
ttgctgacac gaatatttac aaaaaacaaa aacaaaacaa aaaacaaaca acgagaacca 14700
agaaaaaaaa acgaacacca aaaaatgagg gagactggtt agggatgaga tgtaacatca 14760
cgttgaaaac gtacagccgc acgtcatgtt gaaaactgac agccgccttt tcattttgtt 14820
tcagatgcct gtgcagagac accaacgcct cccaaaccaa agctgtccaa actcctgccc 14880
ctgggctgcg gcctagcagc gctgctgaca ctgtccctgc tcctggccgc cctgaggctt 14940
cgcaggtgag gggtctccga ggagtcatgg ggtcatggtg gggtaattgc gatgtctacg 15000
gcgatgacgt caccactgtg atgacgtcat gttcgggtcg ggggcatggc atgggggtgt 15060
caggtgaacc ctgacccctg accctgaacc ccagggtgaa agatgcgctg ctgccctgcg 15120
tccctgaccc cagcggctcc ttccctggac tctttgagaa gcatcacggg aacttccagg 15180
tgcgcggggg gggggggggg gtcaggatcg ctgtgggggg tcacttcctg tccccggaga 15240
gtgagggcat gaggcagggg gatgatggga gtgacaggcg tcacgggcca ctgcctgact 15300
ccaggcaccg ctcccctccc cctcccccca cccccttccc tccacccccc ccctccacac 15360
acacaacccc tttcgctgca ggcctggatt gcggacgccc aggccacagc cccgccagcc 15420
aggaccgagg aggaagatga cctcatccac accaaggcta agagggtgga gcccgaggac 15480
ggcacctccc tctgcaccgt gccaaggcca cccagcttcg agccaagggg gccgggaggc 15540
ggggccatgg tgtcagtggg cggggccacg ttcatggtgg gcgacagcgg ctacatgacc 15600
ctgtgacctt gaagtcactg ccagtctata cttcaggctg aggtcacttc ctgtctttaa 15660
ataattcaaa ctcacaaatc ctgtgcctgt ctgtatgcaa atgtggtcac aaatattcaa 15720
ataaaatgca aatgctatgc t 15741
<210> 65
<211> 26915
<212> DNA
<213> 人工序列
<220>
<223> 靶向的Il7ra等位基因,基因组DAN(总计:26915 bp)
<220>
<221> misc_feature
<222> (1)..(184)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (117)..(119)
<223> 起始密码子
<220>
<221> misc_feature
<222> (185)..(310)
<223> 人基因组片段1
<220>
<221> misc_feature
<222> (311)..(5528)
<223> Hyg自缺失盒
<220>
<221> misc_feature
<222> (317)..(350)
<223> LoxP1
<220>
<221> misc_feature
<222> (5458)..(5491)
<223> LoxP2
<220>
<221> misc_feature
<222> (5529)..(22634)
<223> 人基因组片段2
<220>
<221> misc_feature
<222> (22635)..(26915)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (25217)..(25219)
<223> 终止密码子
<400> 65
acagagctgg tttgggtctc cctctctctc attcacttgc acatacaagc gtgcttcttc 60
tctattcttt ctctctctct ctctctctct ctctctctct ctctctctct ctcagaatga 120
tggctctggg tagagctttc gctatagttt tctgcttaat tcaagctgtt tctggagaaa 180
gtggctatgc tcaaaatggt gagtcatttc taagttttct tatggatttt ggattatctg 240
tagcatggtt tcaggttatt cagttcccta acagacctga gtcaggcact gggtttgaat 300
gcagtttgag gtcgagataa cttcgtataa tgtatgctat acgaagttat atgcatggcc 360
tccgcgccgg gttttggcgc ctcccgcggg cgcccccctc ctcacggcga gcgctgccac 420
gtcagacgaa gggcgcagcg agcgtcctga tccttccgcc cggacgctca ggacagcggc 480
ccgctgctca taagactcgg ccttagaacc ccagtatcag cagaaggaca ttttaggacg 540
ggacttgggt gactctaggg cactggtttt ctttccagag agcggaacag gcgaggaaaa 600
gtagtccctt ctcggcgatt ctgcggaggg atctccgtgg ggcggtgaac gccgatgatt 660
atataaggac gcgccgggtg tggcacagct agttccgtcg cagccgggat ttgggtcgcg 720
gttcttgttt gtggatcgct gtgatcgtca cttggtgagt agcgggctgc tgggctggcc 780
ggggctttcg tggccgccgg gccgctcggt gggacggaag cgtgtggaga gaccgccaag 840
ggctgtagtc tgggtccgcg agcaaggttg ccctgaactg ggggttgggg ggagcgcagc 900
aaaatggcgg ctgttcccga gtcttgaatg gaagacgctt gtgaggcggg ctgtgaggtc 960
gttgaaacaa ggtggggggc atggtgggcg gcaagaaccc aaggtcttga ggccttcgct 1020
aatgcgggaa agctcttatt cgggtgagat gggctggggc accatctggg gaccctgacg 1080
tgaagtttgt cactgactgg agaactcggt ttgtcgtctg ttgcgggggc ggcagttatg 1140
gcggtgccgt tgggcagtgc acccgtacct ttgggagcgc gcgccctcgt cgtgtcgtga 1200
cgtcacccgt tctgttggct tataatgcag ggtggggcca cctgccggta ggtgtgcggt 1260
aggcttttct ccgtcgcagg acgcagggtt cgggcctagg gtaggctctc ctgaatcgac 1320
aggcgccgga cctctggtga ggggagggat aagtgaggcg tcagtttctt tggtcggttt 1380
tatgtaccta tcttcttaag tagctgaagc tccggttttg aactatgcgc tcggggttgg 1440
cgagtgtgtt ttgtgaagtt ttttaggcac cttttgaaat gtaatcattt gggtcaatat 1500
gtaattttca gtgttagact agtaaattgt ccgctaaatt ctggccgttt ttggcttttt 1560
tgttagacgt gttgacaatt aatcatcggc atagtatatc ggcatagtat aatacgacaa 1620
ggtgaggaac taaaccatga aaaagcctga actcaccgcg acgtctgtcg agaagtttct 1680
gatcgaaaag ttcgacagcg tgtccgacct gatgcagctc tcggagggcg aagaatctcg 1740
tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg cgggtaaata gctgcgccga 1800
tggtttctac aaagatcgtt atgtttatcg gcactttgca tcggccgcgc tcccgattcc 1860
ggaagtgctt gacattgggg aattcagcga gagcctgacc tattgcatct cccgccgtgc 1920
acagggtgtc acgttgcaag acctgcctga aaccgaactg cccgctgttc tgcagccggt 1980
cgcggaggcc atggatgcga ttgctgcggc cgatcttagc cagacgagcg ggttcggccc 2040
attcggaccg caaggaatcg gtcaatacac tacatggcgt gatttcatat gcgcgattgc 2100
tgatccccat gtgtatcact ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc 2160
gcaggctctc gatgagctga tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt 2220
gcacgcggat ttcggctcca acaatgtcct gacggacaat ggccgcataa cagcggtcat 2280
tgactggagc gaggcgatgt tcggggattc ccaatacgag gtcgccaaca tcttcttctg 2340
gaggccgtgg ttggcttgta tggagcagca gacgcgctac ttcgagcgga ggcatccgga 2400
gcttgcagga tcgccgcggc tccgggcgta tatgctccgc attggtcttg accaactcta 2460
tcagagcttg gttgacggca atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc 2520
aatcgtccga tccggagccg ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc 2580
cgtctggacc gatggctgtg tagaagtact cgccgatagt ggaaaccgac gccccagcac 2640
tcgtccgagg gcaaaggaat agggggatcc gctgtaagtc tgcagaaatt gatgatctat 2700
taaacaataa agatgtccac taaaatggaa gtttttcctg tcatactttg ttaagaaggg 2760
tgagaacaga gtacctacat tttgaatgga aggattggag ctacgggggt gggggtgggg 2820
tgggattaga taaatgcctg ctctttactg aaggctcttt actattgctt tatgataatg 2880
tttcatagtt ggatatcata atttaaacaa gcaaaaccaa attaagggcc agctcattcc 2940
tcccactcat gatctataga tctatagatc tctcgtggga tcattgtttt tctcttgatt 3000
cccactttgt ggttctaagt actgtggttt ccaaatgtgt cagtttcata gcctgaagaa 3060
cgagatcagc agcctctgtt ccacatacac ttcattctca gtattgtttt gccaagttct 3120
aattccatca gacctcgacc tgcagcccct agcccgggcg ccagtagcag cacccacgtc 3180
caccttctgt ctagtaatgt ccaacacctc cctcagtcca aacactgctc tgcatccatg 3240
tggctcccat ttatacctga agcacttgat ggggcctcaa tgttttacta gagcccaccc 3300
ccctgcaact ctgagaccct ctggatttgt ctgtcagtgc ctcactgggg cgttggataa 3360
tttcttaaaa ggtcaagttc cctcagcagc attctctgag cagtctgaag atgtgtgctt 3420
ttcacagttc aaatccatgt ggctgtttca cccacctgcc tggccttggg ttatctatca 3480
ggacctagcc tagaagcagg tgtgtggcac ttaacaccta agctgagtga ctaactgaac 3540
actcaagtgg atgccatctt tgtcacttct tgactgtgac acaagcaact cctgatgcca 3600
aagccctgcc cacccctctc atgcccatat ttggacatgg tacaggtcct cactggccat 3660
ggtctgtgag gtcctggtcc tctttgactt cataattcct aggggccact agtatctata 3720
agaggaagag ggtgctggct cccaggccac agcccacaaa attccacctg ctcacaggtt 3780
ggctggctcg acccaggtgg tgtcccctgc tctgagccag ctcccggcca agccagcacc 3840
atgggtaccc ccaagaagaa gaggaaggtg cgtaccgatt taaattccaa tttactgacc 3900
gtacaccaaa atttgcctgc attaccggtc gatgcaacga gtgatgaggt tcgcaagaac 3960
ctgatggaca tgttcaggga tcgccaggcg ttttctgagc atacctggaa aatgcttctg 4020
tccgtttgcc ggtcgtgggc ggcatggtgc aagttgaata accggaaatg gtttcccgca 4080
gaacctgaag atgttcgcga ttatcttcta tatcttcagg cgcgcggtct ggcagtaaaa 4140
actatccagc aacatttggg ccagctaaac atgcttcatc gtcggtccgg gctgccacga 4200
ccaagtgaca gcaatgctgt ttcactggtt atgcggcgga tccgaaaaga aaacgttgat 4260
gccggtgaac gtgcaaaaca ggctctagcg ttcgaacgca ctgatttcga ccaggttcgt 4320
tcactcatgg aaaatagtga tcgctgccag gatatacgta atctggcatt tctggggatt 4380
gcttataaca ccctgttacg tatagccgaa attgccagga tcagggttaa agatatctca 4440
cgtactgacg gtgggagaat gttaatccat attggcagaa cgaaaacgct ggttagcacc 4500
gcaggtgtag agaaggcact tagcctgggg gtaactaaac tggtcgagcg atggatttcc 4560
gtctctggtg tagctgatga tccgaataac tacctgtttt gccgggtcag aaaaaatggt 4620
gttgccgcgc catctgccac cagccagcta tcaactcgcg ccctggaagg gatttttgaa 4680
gcaactcatc gattgattta cggcgctaag gtaaatataa aatttttaag tgtataatgt 4740
gttaaactac tgattctaat tgtttgtgta ttttaggatg actctggtca gagatacctg 4800
gcctggtctg gacacagtgc ccgtgtcgga gccgcgcgag atatggcccg cgctggagtt 4860
tcaataccgg agatcatgca agctggtggc tggaccaatg taaatattgt catgaactat 4920
atccgtaacc tggatagtga aacaggggca atggtgcgcc tgctggaaga tggcgattga 4980
tctagataag taatgatcat aatcagccat atcacatctg tagaggtttt acttgcttta 5040
aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt 5100
aaacctgccc tagttgcggc caattccagc tgagcgtgcc tccgcaccat taccagttgg 5160
tctggtgtca aaaataataa taaccgggca ggggggatct aagctctaga taagtaatga 5220
tcataatcag ccatatcaca tctgtagagg ttttacttgc tttaaaaaac ctcccacacc 5280
tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaacttg tttattgcag 5340
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 5400
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctggaata 5460
acttcgtata atgtatgcta tacgaagtta tgctagtaac tataacggtc ctaaggtagc 5520
gagctagcaa tttcccacat attcagtcat tttttttaat gtttaaccac catgacaggg 5580
ggcaggggat caatactatg ggtggtttat aagacctcag tattctcaag aaggaatgca 5640
tttcactccc aagtgtagat cttaaatgtt gaatgattac tctgctctta caaaaagaat 5700
gctcatgtag atgctatgac tgtacttgta ggaaaatgtc caaagtaatt ttaccttgtc 5760
aggagatcaa actggattca ttttgtttga ctttttaaga aatcctgaaa gcataacttt 5820
caggataagg taatgtacag aagcaatagc tttgtcttca gtgaccagtg ctatatcctc 5880
agcacctaaa tcagtggcta gaatatagta gacatccaat aacttttgaa agtgttttca 5940
aaatacttta gttttgagag atttatgtga gattttaagt aaataactga ctagagaaag 6000
atctaaatga gtttactcat tgaaatacac tgaattgcct ccacaccaac aaattggcca 6060
tatgtaataa ttctttttgg gatctaaaaa acttagtacc gagaagccaa ccctgcccat 6120
acataaacac attgtaatta taacaaaact aggcagaagc ttctaacagc agcaggaggc 6180
atgtgggaat ttagaccatc aacttgctcc tgcaaattaa gccctttctc tttaagagtt 6240
aaaaactatt tggctataga caatatcaaa cacatcagcc taatgactca gcttatgcat 6300
tttgagtcat gtaattacga aggatggaaa tccctagaat tttctcatta agggaattgt 6360
cagagagttt gacatttttt acagtatatg actcacttta tgggggatga ttattattct 6420
atgctaaact ttgccttgga tttccacaaa gactgatggg aggcaggaaa cataaatctt 6480
actctctttc atgtcatcta tactcactag ttcaccctgg tgatcatact atttttaaaa 6540
tatataagaa tgctagttga aagctgggtt ttcactccaa ctttttaagt ttcagatttt 6600
ttagaagatg tataattacc ctattcacat gattacgtca aaatacttcc cagtttgggg 6660
tataggaatt cacattcagt tgctgcttgt tgaaagttgt caattttctg atcatcacaa 6720
ggatgatcaa gagaagaaag ggatactttt taaaaatcca aatcatttac actattaatc 6780
aactaactcc attcagtagg aagaagactt ctagatgaca ctggcttgcc tatgatacat 6840
attccacaca atttaaattt ttatggataa atatgtctag atacctattt aaatatgaat 6900
aatattaatt attgagcatt taaagaataa tagattaact cattattcaa aagctctatg 6960
taatttcaaa accatagtaa ttataacacc gtcaattgac ataaactttt taaagagaag 7020
ctcaaatgtt tcatgtatat tttcagaatt agaattctta ttttaccttt tcattactta 7080
tttctcagaa aatattatac tcatagctaa tccctattaa atccttactg tgttctaagc 7140
tacctctttg taaatatcca ttcagtgatt gctcatagca cgagtttaca tattagaaca 7200
catgtcttag agaagttgcc tacctgacag aggaccacag gtagagtatc cagaatttaa 7260
acgcacatct gtccagctct aacaccacag gtcttaacca ctgtgtacat taactactct 7320
tagccaagaa tttttcagct cacgtcatgt agaatattct ttttgtaaaa tgccatcaca 7380
ttttataagt cattgaaggg aatttttctt ggttacaaag caactctgcc ccataatatc 7440
tactgaaaag ccagtgagct gcttcctaaa acacagccat tttaggtgca ggaaacagtg 7500
tataaatggc tcattgtata ttgtatgctt tgccagactg agtggcagtg ggagtccttt 7560
gttatgtggg tgctgacatc tgctagagtg tgctgtctct attgaagaat cgtgaagaca 7620
aagccgaccc acaggatgtc tgaatccaaa taataataca tgttctgtgt atagaattgg 7680
tggaagagaa aatgtcagga cagtgtgagg actgccatgt aaggtcagaa ccactgcatt 7740
tagaaagcta ccactgcaca gggaagaaat ctaagtctac aaaattagtg ggctgtctct 7800
cattatttcg tgctgtcatc agaaggaggg ccataccctg ctgaaactac ataaagagct 7860
tttgctggtg gcagaactgt gaactggatg gattctggga atggccagaa aaacaaatgc 7920
ctgtggttgt gagcagtgcc cacacccatg gtctagctag ggctgtttga gatttgttgc 7980
tttgactgaa ccaacctgtc attcaactgg ttggtccatt cacagtcagc tttattaact 8040
ttcccatttt ccctactgag ttatttaagt aaagaaagtg ctattcggac agcccttggt 8100
ctctgggaca atcaactggg atttgatttt agtatattct gtctccagtg taaagccttg 8160
gaagcatcta atttctagta ctgatgaacc aaaaatacat ggaagcagtc ctaggctcac 8220
acttgagcac tctgagaatg gctttgctta ctccagattt tctcaggtcc cagtgggtgt 8280
atattttctg acatatttat tccagcctca ctttctatca tgtaaaacat acatacaaaa 8340
tgtagatttc attatagggt ctacaaaaca gcttaagaaa ccaaatacta tgtgtgacag 8400
atcacacttt ccaaaagtaa tagcaaaaaa aaaaaaaatc tggttcccca ctttcttcca 8460
gcatcctgct agaatctatc agatactgcg tctatagaag aatctataag aacagaagca 8520
gtatgtacaa cattcacagg aagtttcacc aaatcggagt cctgccagat ctaatttttt 8580
ttccctaatc acgtttgtct cagtcagtag cttaagacaa tggaaataat cagtgccact 8640
tttaattggg atgccttttt aggcaaggga aagtgacctc ttaaaaaagc aaaattctga 8700
ctgcaagata gctatcattg tccttcattt aagacaaaaa aaatactagg gagggaataa 8760
attatgattt gtaataaagt gaaaagtgag attaggtagc atggggataa tggaaataaa 8820
gtgtctcttc tttgaaataa tatgaacaat caatgtaaca aatgtagcag aaaaaactcc 8880
agtttaaata cagaaaagaa tgtgttcaat gcctctggtt ctttaactca gaaatatttg 8940
gaggttactt actcattatg atggattttt tttttctatt ggaaaactct gttagcattg 9000
agcgtttttg ttttttgttt tttgttggtt ggttggtttt gaagcatttt tcttgtcttt 9060
gcccttgggc ttttcttcct tgaatactac ataatccatt actatttcat gtctgccaca 9120
gagtctgcta ttttattaag gtcatgccat atttcaaaag gatgcattta tttgtttcat 9180
taacagctgc atgtttgttc ctccccagga gacttggaag atgcagaact ggatgactac 9240
tcattctcat gctatagcca gttggaagtg aatggatcgc agcactcact gacctgtgct 9300
tttgaggacc cagatgtcaa catcaccaat ctggaatttg aaatatggtg agggatggtg 9360
gttttaatgg ttgcttagac atcctctgtc tctcttttca tatgctcttt ttaatagcca 9420
caaaagaaag aatatgtggc ctaattaaca aatgttaaca tctaaggaat tcccaaaggc 9480
ctcctgaaac tccttgtcct tcaccaaaaa cactcataca aatctcctct cacggttcag 9540
ctttcagacc ctgagactca gtcaaatgat gctctggatc ttggggatcc cacatccctc 9600
ccaacttcat atcagaattt aaatcctgcg tctcctacaa cacttctcac caaaaatctg 9660
tttgcccaac acgagacaat ccagtgtctt caagttgcat ctgagagtta aactgccttg 9720
tttccaatcc caataccagt gcttactagt tttttgacct agagaaagtt atgtaatgta 9780
tctatgcctc agtttcctca cctgtaaaat gagataacct gcctcacagg aaggctgtga 9840
tggttaaata atttcatcat ataaatcatt ccaaatagtc ggccagtgaa taacgagtaa 9900
tggggaagca acattaaatt ataattctgt gaatattgac ctaacttcta ccatcttgac 9960
acaatttgac ttcagatgat cctctcaatg taaattttcc aaaaatccac aggaataagt 10020
tggcattttg tttcacaagg tctcacagaa aagacaaagg aaaagagtct ggtttgaaag 10080
tttactaaag gtctcaggga actttatctt ctccttctcc ttcatccata agtcatctct 10140
tgttgccaag ggttactatc tctggtgatt tgagaaacta ctctagcttg aaattctgac 10200
ctgaggctat ctccaaattc atatccgaat gacctacttt ttagttagtg tcctagtgag 10260
caaagtaaat caagatccac cagtagtaat agaaggcttc ctacattcca tagacactga 10320
gacaattctc cacagtctat agtccaaaca agccctgaat tccagttttt gtcaatttat 10380
gggagcttcc tgcatctatt tatggagtgc tttctgctgc agtccttaga taaacatgct 10440
gttggacttg agtagtgtac tgtgttctct gtctgcctct gttcacttcc ctaacacatt 10500
ttccaggaat aaaatatgtc aaaagaacct gaaccagttc gatgtccaca atctaggctg 10560
gaaatggatt gcactaaaac agccataaca actcattcaa acaaggcact cattttcatg 10620
ggcaaatcac tctcccacac ggaggtttga ctttggcttc tttaaccagc tggctggtgg 10680
gctgagtgtt catcctggtt tctcttggcc aagctgaggt tgacctttct gttcactttc 10740
attcacacca tatttgacca cttccttgcc cactcaaaca tacttaccct ttaacatatc 10800
tcttgacttt tcctgtcata ttgtaatctg tccagagcct cctctatttg ggttttccaa 10860
ttggattcag atatttcagt tggaaaggga ctgccttaag aaagaaacgt tttcagtgga 10920
aaatatatgt atgagctctt taatagatga actcctggag ttcagagccc ttaaaaggat 10980
gcccagtttc acaagacagc catacggtca tccttgattg tccattgctc attaatttca 11040
ttctcaaaat catgggaatg agctgagaat accattttag atcctcctta aattcccaac 11100
agtaccagaa acttgctaca ggttggggcc tgtaattgga tatttcacac atactttcct 11160
tacaaatata ttctatactc aagaattgaa ctaaaagtta ttgtcctagt ttctccacat 11220
cccatgttta cctaaaattc agaaatggga ccccgctccc agtctcccct tctatattta 11280
tttatcaaat cgtgacaaca ttaccatctt cagatctttc cacctgatgt ttgtcctaag 11340
cttattccct ggtatctgtc tagcttaccc aaaaattcgg tttttatttt tatcctgttc 11400
caagttggga aagcctatct accccaacaa ggaacacaac tccctagtaa ctttgagaca 11460
cacacacaca tacacaccta ctctttaaag cctaaacaat cgcacactct aaaagatagc 11520
agttaacaaa agtaacgatt tgggagaaca gttttaagga atgtccccaa aataatcaat 11580
acatttagcc agttaattaa cttaacattt cttcaccaat ctctagtttt catgactgta 11640
ggagcttaac cagtcactct cagaccacaa taaaccaaag gtgaaagatt ctgtaacaaa 11700
agctagggca ctctcccctg catttaacct cctggccagc tcactcgaag ccagacaaac 11760
aggttcctct ttttgtgcag agtccaggaa ccattctcga aaggactcat ttgagcacat 11820
gcagagaaga gtgtacacac atccagttca ccaagggaag ccaacacaca ttgtgggttg 11880
taggtagtaa aaggccttcc tagaacacac tccttaggat ttaaacaaaa ttacatcggt 11940
taatggaaag aattctttca tatacgcaaa cttacccaga ggaacttttc ttctgcccag 12000
atcttcactt ccaatttgac ccagttatac ctctttagag ctatttggct gagcttaaac 12060
agcacatagg aaaaacaaat tggtaactgt gtttatcaca gaagaggaaa attaaattta 12120
gggttgggaa aggaaaataa ccctatgata ttacttttat tctaccttta caatgagaat 12180
atataccttt gttacttctt taatttttac attatttact tatttttctt tgctttcttg 12240
tttgattaca atgcatttta ggggtaaaat ttatgtgtgg taaaatgcac aaaaattaag 12300
tgaatttgga gaaatgtcta tgacctgtag ccattccaat ggtaaagata tagaacttat 12360
ttttccccta gaaggatgct tcatgttcct ttccagtcaa tcttcatacc ccaggagcaa 12420
tcataattct caattctatt accctttggt ttttgccagt ttctgatagt tcttattaat 12480
agaatactct ttattctttt ctgtcttctt tcatttaacc agtgtttgtg agagttagcc 12540
atgttgatgt ccatctcata gctcatcttt tcaattgcta agtagtaatt ccactgtatg 12600
aatataccac aaatttttaa ttctttctct tcttgatgaa catttgtgtt ttttcaagtt 12660
tgagactatt attttttagg ttgctgttca cattcttgga caaatcagtt tgtgtatata 12720
tattttcatt tttctggggt ataaaacctc agaatggaat tgctgtgtca taaggtaagc 12780
atgtatctaa gtttataaga aaccgcccaa cagtttttca aagtggttat accattctac 12840
tctccttcca gcgatgcatg agagatatac atcatttgca acgtttgact ttgggatagt 12900
atctcgttag gtttttaatt cgcatttgtc aaataacaaa tgttgagcag cttttcatat 12960
acttggtctt ttgcctgtct tctttgggct agtatctgtt aaaagcactg agttatttgt 13020
ccttttgtta ttgctggata tgagttcttt atacattctg tatacatttc ctttgtcaga 13080
tagatgtatt gcatctattt tctattctga agtttgccat tttattttct tactggtgcg 13140
ttttaataag caagagtttt tttttatttt gatggagtct aatatatcat ttattttctt 13200
ttatatgtag tgctttttgt atccttgcta agataacttt gcctactccc aaagttggga 13260
agatattttc tcatgttttc ttttaaatgt tctacagttt tagcctttat atttagtttt 13320
tttaattatt attatacttt aagttctagg gtacatgtgc acaacgtgta ggtttgttac 13380
atatgtatac atgtgccatg ttggtgtgct gcaccgatta actcgtcatt tacattaggt 13440
atatctccta atgctatccc tcccccctcc ttccacctat gactggccct ggtgtgtgat 13500
gttccccttc ctgtgtccaa gtgctcttat cgttcaattc ccatctatga gtgagaacat 13560
gcagtgtttg attttttgtc cttgtgatag tttgctgaga atgatggttt ccagcttcat 13620
ccatgtccct ataaaggaca tgaactcatc cttttttatg gctgcatagt attccatggt 13680
gtatatgtgc cacattttct taatccagtc tatcattgat ggacatttgg cttggttcca 13740
agtctttgct attgtgaata gtgctgcaat aatcgtacat gtgcatgtgt ctttatagca 13800
gcatgattta tactcctttg ggtatatacc cagtaatggg atggctgggt caaatagtat 13860
ttctagctct ggatccttga ggactcgcca cactgtcttc cacaatggtt gaactagttt 13920
acagtcccac caacagtgta aaagtgttcc tatttctcca cattccctcc agcacctttt 13980
gtttcctgac tttttaatga tcaccattct aactggtgtg agatggtatg tcattgtggt 14040
tttgatttgc atttctctga tggccattga tggctaatat ccagaatcta caatgaactc 14100
aaacaaattt acaagaaaaa aacaaacaac cccatcaaaa agtgggcaaa ggatatgaac 14160
agacacttct caaaagaaga catttatgca gccaaaagac acatgaaaaa atgctcatca 14220
tcaatggcca tcagagaaac gcaaatcaaa ttgtgtttat ttgtttctct tgtcttatgc 14280
attggctaaa acctcctgta caccactgaa tagaaatggt gaaagtggat attcctgtcg 14340
tgtcctggtc ttagggaaac aattcatgtt cacaatttca gcactaaata tgatattaac 14400
tataggcttt tgtaaatgct ctttatcaga ttgaggaagt gtctttctat ttcttatttg 14460
ctgtgagttt ttaacatgaa tagatgcatt catgttatta aattatgctt tgaatgcatt 14520
gattgattat aaccaggtta tttatgtctt ctagtctgtt aacatggcaa attatattga 14580
ttaatttttg aatctttaac ctgctttggt ttcctgagat gtgccctact ttataattat 14640
gtattaaaat tagtgtgtta gtattttctt gtgaaagttt gcttatacat ttttgaggga 14700
tatttgtcta tcaacttctt ttctctaata ttttggccag gtttgggtac caggattaag 14760
ctagcttcaa aaaataggtt gagaagggtc attcctcttc cagtttctaa aataatttgt 14820
gtcagattga cactatttct ttccttatac atttgataga atttaccaga atataaccat 14880
caagcataga gttttctttg gggggaagtt tattgataat aagtttaatt tctttgagag 14940
aaatataact gttgaaatat tccatttcta tgtgggtcag atttactaat ttgtgtttat 15000
aaaaacattt tcattacatc taagttatta tatacattaa aatagcattt aaaatttcct 15060
tattatactt ttaacatctg catgttctat agtgatatct cctcttacat tccagatatt 15120
agtaatttat atattttgtt ttcttaacca ctcttgttag ggttcaccag ccaaaattac 15180
ctataaaaat ccattacgtt acccatcaag tatatgtgat attatgtata taacccttta 15240
tactatgtta tcattttctt taacactttt tttaatcaat attttttaca gctcttattt 15300
cttacatata ttcctatgga acatcaaaaa aagcaattac tttttaatct aaacaaagta 15360
tttgtttttc agtgatcaat tataaaaata tagaaatttc ccataatttt ataaatatgt 15420
cttgactatt tcaggttcaa ttgcatctaa ttctaagtaa atcatcacta agtatcatag 15480
cagcagaaag ccataagatt ttaattcatt atctctcatt cctgaacatg cctccactca 15540
cccacccaca tacctatgaa cagagttaaa gtcaaacata catcaatgtg catatgatac 15600
tattccactg catacaggaa ctcctacctg aatcaagaca tatccccttt ttattcctac 15660
agtggggccc tcgtggaggt aaagtgcctg aatttcagga aactacaaga gatatatttc 15720
atcgagacaa agaaattctt actgattgga aagagcaata tatgtgtgaa ggttggagaa 15780
aagagtctaa cctgcaaaaa aatagaccta accactatag gtaagaagtt gtatataaaa 15840
gtatggttgt cacttttggg ctacctgaaa acactgtgtc tggacattct gtaggttaaa 15900
agtagacaaa tagtggaaac aactggcaat agataatagc taattcccta ctgtaaattt 15960
ttataataaa tgaaaagctt gaaatttata ctttcctgca gtgaaagaat tctgaggatc 16020
ttcaaaccca ggtgtgaaag atagtgtttg tgcaaaccta catgaagtgg ctaactggag 16080
ctgggcttcc tgtcatccat cacaggtgtc ctttccttcc ttatctgtcc tttccttcct 16140
tacctgtcct tctcccaaat tccttgtggt cttctcccca aatccccaca acattctgag 16200
taagtttagc taacttatca agttatttta aaaagcatat atgccttctc tattagtcag 16260
agttttctac aaaaaaaaaa gggaatcaat aggaggatag atagatagat cattgatagg 16320
agagatttct attaagaaat tgacttttgt ggttgtggga actggcaatc gcaaaaatcc 16380
ataaggcaag ccagtaggct agaaattcag gaaagagtgc agtattgagc ctaaattccg 16440
cagggcaaga aactcaagca gattttctgt attgtactct tgagacagac ttgcttcttc 16500
ttcagggaac ctctgtcttt gctctagagg ccttctactg atgaggtgat gcccaccaca 16560
tcacggaagg caatctactt tactcaaagt ttactgattt aaatgttaac catgtcttaa 16620
aaatactttt agcattccct attcgctccc ccttcaaccc tcaaaaagaa aattaaaggt 16680
aagagagcaa tactcattag agataagaaa gagtaagaaa cctagctcag ctttgtctca 16740
gttttgtttc actaagatga taaaatagag aggtaaagca gaagttccat gtgtgaacaa 16800
ttaacttgtg aaaaggcaaa tgtagtagaa aagagacatt aggcagatgg ctgtgcatgt 16860
tggccacaca gaagcagcat tggccatgac cagtgtgggt cctggttagg ggaagagaac 16920
tggctttgac aacaacaggg tatctctgag gttataaaaa gttgggttct gatcatttgg 16980
agatgaggtc cctatggata gggcaccata tctaaaggtt caccatttac attgcaaata 17040
tacattcagt tctctgagag tgagcagaga aggcagaggt tctcagtctt ctgacaaggt 17100
cctggagcat caggggagag cccattctta caaaactcca caccagcatg caagccctta 17160
catgcacata agcactcaca acacaccaag agcctccagg tgacatctgc cacctccaaa 17220
tccccatatc ccacatgctc aatgcacttg cagtctccat cccccagcag actgcaaatc 17280
tgacatgcct cctccgaacg gcaaggggga gaggtacgta tggtacacac actgctgatg 17340
gcataggccc ctttggaagg ggtagtgtga gtctcttggg gctatggcaa gcacccctgg 17400
acaagcagga agagaggtgg tggaggcatg tctcacggta gcatctcctt ctaggtccta 17460
atgggacact tcattaatgg aactaccatt taagtgagtt taaactggat gcttctgatt 17520
gagccccaga gccagtgctc cactgccacc acctgcaccc tcacttcccc ttgtttaagc 17580
atcttccaac ccagtaaggc tgaagaggga agcatcctgc cttcccactt ctcttagcag 17640
agtagattga tatgattatt cagattgtac aagaatctat tccctctgaa gtattgcttg 17700
atgaatgagc ccctttttct aatttgctca aagaaatcat ttgagcttga ggaaaactgt 17760
ccagagggca cgaggaccag ccgttgtgat atgtaacaag gtagagaaac aaaagctaaa 17820
tgaagaagag tgagcctcag aatcaaagaa ctggatttgg atccctttaa accattttac 17880
aggggcctga atgtaattaa cttctctgaa attcagtttc cttatcaata tgctggtgat 17940
aagtgactat tgtttgaaga cagcataagc aaagcatgca gtacttagga gatgtgttct 18000
tccttcaatt cctctattat taaaagatgg gcacagggca ggggcttcag ctcagaaggc 18060
cttgttgaga atggaatgga gagcaggaac aagagagagg ggcaaaggca ttgccagcat 18120
tctctgttcg gctgttctcc acccactgcc tttcctcctg cttccctcta agtccagggc 18180
attttccctt ttgataaact tcccctttta caacccatcc aagggtgaaa aacaaagtca 18240
ttactttttt ttcagtacct ctaaggcaaa gcagcagaaa caggcagtca ccactacgaa 18300
taagtgacta caacaagagc taggccaaac tctgccatgt gggctgcatt ttattgggcc 18360
ggcaagtaac tttaaatccc agctcacact ctactgagtg aaagtctgat gaacccgcat 18420
cttcttgtga acaactgcgc ctgagatcag tcatgcaaga agtagcaccc ccacccccag 18480
acaactaact tcccaggctg tgaccaacaa gcagccaaga ggccaggaca gggaagtctc 18540
aggacctttc taggaaatca atacctttct ctgggtttgt tctgcctgaa ataataccaa 18600
tctccctcca acagcttagc atgtgtggag catttgatac taacagcaac cctgcaaggc 18660
aggaaggcag tagggagagg cccaagagga attcagcatt aaggcagtga gactgacaga 18720
ggggaccccc tgaggacatt ctggaaggtc ttagccaggg ccaggatgca gacccttcat 18780
gtcactgtag ctgagacgag gtgcaaggtt cacagcatat aacctaattt tattacaaga 18840
ataaagactc agagtttaaa tactcctgct ttggggctca ttagtaacaa gttctccaat 18900
attcaaaagg caaagtggat gtgttttagt gtaaaattaa cactagctgc tgtaacaaat 18960
aagcccccaa acatatgata tctcaaacac cgtaggttta tttctcactc acatcagagt 19020
caaaatggat gtttctaacc tgcagctggg gcttctccca gcagtattag gggcactttc 19080
catcttgtgg ctccaccgtc tgtaatgcag gactccaagt ggtggaagag gacggagcag 19140
aggagtcaca catgggtgtg tgtctggccc agggtggaag tggatgtgca tttcttctgc 19200
ccacctcact cacaaggcca caccccactg caagagaggc tggagaatgc ggactggatt 19260
taaacccaag aagaagaaat ggttttctga atagttggcc atttactgac acaaaaaggg 19320
tcaaagtgac ttgcagagga gatgaatttt aaatactata attatttcct tggctgccct 19380
ttagacagaa tttatttctt tttcttttcc agttaaacct gaggctcctt ttgacctgag 19440
tgtcgtctat cgggaaggag ccaatgactt tgtggtgaca tttaatacat cacacttgca 19500
aaagaagtat gtaaaagttt taatgcacga tgtagcttac cgccaggaaa aggatgaaaa 19560
caaatggacg gtatgtagtt caactacatt aataaaataa aaacttatga atgttttcta 19620
ttttgttggc ctagtagtgc atttcccctg ggagggccca acaattttgc tttcaaaatc 19680
taccttctac tgaaagaatc tcccaatatt ggccccatga aaacctggat cttccctgat 19740
gcatactctt ctagctctgg ttgttttctt ctgctctaat tttggtcttc agaatgtttc 19800
tacattagtg agttggataa caatatagat tgaggccaaa ttaatcctct gtattcaggg 19860
gcctcaaaaa gtgtcatgtc tagtgccact ttcataggca aatcaggcaa aatgtatatc 19920
tgcttatgat caccaagtcg tagccacatt ctggcttatg agattcatgg gaccagcatg 19980
aggtaaagaa aagaggcata atgtttgcct ttgttttgtt tttattttaa agcccaaggt 20040
ctttgttttt gaagtaacag cttaattttt acccttcata atcaggagag ttacttagat 20100
gctctcttca tgatttgttg aggttggaat gatttggcag tccctgaaat ttattttggg 20160
gaggaggtgg cagaagagtg gagtgtacca ggttatgaga tttctcttaa cccaccaacc 20220
taacttctgt tctttctgca cctcagagat gaagaagaga tgatgatttc tcttcctcaa 20280
gtccttctta ttcttgctgt cctgtttttt caggccaaga ttggccttgt ttgtttgcag 20340
tgtgatgcaa gatgccactt gcataaatgt aacaactgcc ccaaaccacc tgctccctcc 20400
ttctactcac ccaccccacc cttgatcctg ccatctttca ttattcatct gaaaattgca 20460
ccaattgaaa agcaacttag tggagaaagg aaggattatg aataaatgct gccaggacaa 20520
ttagttaact aaaaagaaaa atagataaat tcaataaata catgaatttt tttgagatgg 20580
agtcttgctc agtcatccag gttggagtgc aatggcgcca tcttggctca ctgcaacctc 20640
cgcctcccgg gttcaagcaa ttctcccatc tcagcctccc aagtacctgt gattacaggc 20700
acccgccatc atgcccggct aatttttgta tttttgtaga gctggggttt caccatgttg 20760
gccaggctgg tcttgaactc ctcacctcag gtgatctgcc cacctcagcc tcccaaagtg 20820
ctgggattac aggcataagc caacacgcca gccaaaaatt gttttaatta aaaaaaatta 20880
aactaaatgc ctagccacct tcatataaca acaacaaaat accagatgat ttaaggaaat 20940
tatataaaag tgaaactcta aacaaattag aaaaattata gccaaatgtt tacataatct 21000
tgacatgaag aagaacattc taagcatcaa agctgtagaa gaaaagaaag gattgagaca 21060
tgcaactaca taaaaagtgg aggtttatat atgtcaacac acacaataat caaaaatcaa 21120
aaatgcaaat ttaaaagtaa gcttaaattg ccacataaac agctgataga tggttagtat 21180
cattaataga taaaggactc ttataaatca ttaaaaaaac aaatatcaca atagaaaaat 21240
gagcaaaaaa attgggaaaa atctcataaa gtatggaata gataaattca ataaatatat 21300
gaaaatgaac taattatcaa ataaatacag atataaatag caatggactt ctttttatct 21360
gtcaaattga tagagtggtt tttttttaat cttaaagata atacactgtg tggtggagac 21420
ttttgtctct ttatcactat tcacaatgta aaatggcgtc tttctggaga gaaatgattc 21480
ctgctcacta acctaaccta acctttcatc tccccttaat atgtgaaagg atagagagaa 21540
aagaagaaga tattgaagtg tggaaaggga gatcctgggc agtgcctaac tcacctgaat 21600
aagacccatc atttcactct cctccttgac cactcacaac atcctttata agctcagatt 21660
ctgtccctaa ttttgctgtt gactccttta cgtatcagag ctccttattc taacaaatac 21720
gagacaactt cagagaatgc ttatgggact aaaggaatcc caattgaaat gatttgggag 21780
atttaggcaa cacctctttt cccatcctaa gaatgtaact gcactctact ctctagcatg 21840
tgaatttatc cagcacaaag ctgacactcc tgcagagaaa gctccaaccg gcagcaatgt 21900
atgagattaa agttcgatcc atccctgatc actattttaa aggcttctgg agtgaatgga 21960
gtccaagtta ttacttcaga actccagaga tcaataatag ctcaggtaag gaatggtggt 22020
agagtttttg ttccctcaga gtgctttgca tgtcaaagtg tgggagcaag tgagaggaag 22080
attgttgaaa ctaacctgca aaataggaca cccttggagg gcactcttac actttctttg 22140
gagaatgact tgcctgctgt ctttgcgcct tttgtgaaga acaaggaagc agagggagtg 22200
gggtccttat tagctgagaa ttagtacaag ccatctgtat tcctggaagc tgccatacat 22260
tttgaacaaa atccccaccc actacgtcca gttaaccaat ttagcctggg accccaatgg 22320
ctgctgtctc taaggcccct ttaagaagca cctttattgg tgtcaggtat gcaggcaagt 22380
gcggctgtcc tatgtctcct tttccagaag gatgaagatg tctttgggac tggaactgag 22440
aatgtgtagg aactgagaca tctcctccct aaaatttgca acaggggtga acatccctct 22500
catcatctcc tgctctggct tcttttcctt ggtagaaagt caagaaggga agagagcatt 22560
ggtacctttg atgctagatc acgtttacat ttcaagtggc agatgctctg ggcctggtca 22620
cccaagtcaa tgcccaagta gctgatgttc ttcccactgt caccgagatc agctcaactc 22680
tttctctcta tcaaagaact gtttctaaga aacaataagt gagacatgtt attaagtaaa 22740
atcaaactac cctaaatata tacccacact ttatgcttac tgaatgctaa ccgtgatctc 22800
tccttatatt ccaggaggat gggatcctgt cttgccaagt gtcaccattc tgagtttgtt 22860
ctctgtgttt ttgttggtca tcttagccca tgtgctatgg aaaaaaaggt gattttcttt 22920
agtaaacaag agggttattt gtggagcccc agaaaagcag gactcaggta ccatctagaa 22980
aagtttaaaa taacagactt gacatttcaa gaattatagt agcaaatata tgccctccta 23040
tttttagatc ccagtcaatt taccatagtt gatttcagaa gaggcaaaaa tatacaaact 23100
agacataaga caaacaatat tgcacaaata ttaatagtgt gtgtgtgtct gtacacatgt 23160
gcatctgtgc attgcatgtg tttgtgtatc tgtgtctgtg tatatacaca tgtgtgtgtg 23220
tgtgtgtgcg tgcgtgtgtg tatatgtgtg tgtgtgtgtg tgtatgtgtg tatgtgtgct 23280
gggtctgtct gtttgtttat ctgtacatat atggttgtgt tcatgtgtgt atacatgcaa 23340
atgtgtgctg gcctacaggc agccaaactc aacacatatt attttattca attatcttcc 23400
accttgtctc ttgatgcagg gtcttccact aaacatgaac cttaccaccc ctgtcagatt 23460
aattggtcag taaactctga gtatctgtct gcctccacca ctccacatat catagagtta 23520
cagatacatg ttatcataca ttgctatcca aactcagttc ttcaaaattg tatgacaaga 23580
ggtttattta ttggattatt tccctaggcc atgacgcccc cccccaaaaa aagaattctt 23640
taagaagtgt tttccaaata ttttttccac agcctcctaa aggacttaga ggtgattacc 23700
catgctaaca tggagtctat ttgatctcat gactttctgc acacaaattc acatgatttt 23760
tgtattttgc tctgtggtag aaccatgccc tgtgaattac tcagtgttct aggaagttgc 23820
cctcggcaat tttgtattcc taggaccaaa agtgctctaa tttgaaaaac gctaccataa 23880
aataattttc ttgaatagct tagaacgtat tcccaatttc cactggaatt aaagtaaaac 23940
ctttacttcc agtaaagaca gtggataaga tgacaatacc aacagtgagc ataaaagacc 24000
aggtctcatt gtagctccat ataaacacca atactgcctc cctgcaaacc tcactcttcg 24060
ctttagggta ctttgcaaca taattacatt gtctcattca caatagatcg ttagcaagga 24120
gctctgttct atccactcct taaaccaaga gcatgatact gtcagagaaa ataaggtgtt 24180
tgtccagtaa cagaaatgtt ttcacaatct acctcaaata aggtgaaaga gttgtttgtg 24240
tgccttctcc ttctgccgtt tgtttcaagt atgaatgttc tctggtttta ggattaaacc 24300
tgtcgtatgg cctagtctcc ccgatcataa gaaaactctg gaacaactat gtaagaagcc 24360
aaaaacggta attgcttgag gtggggaaag aaacaccata atgttgaaat cttagtctaa 24420
gaatgattaa gactgacact caacttacgg tcttttatat atcacataaa tgaaagtcct 24480
tttaagactc tgaagaataa agccaagata tgccacaggg cagggggttg gggaaaaatc 24540
aatatttact tcaaagttgg agtatcacag ctcagtcaga agtgaagcca actgtcattt 24600
tttcacatcg tgtgtcaatt ttacaagaaa gtttcgtaaa cgttttagtt tcctgaatca 24660
aatgtatagc agcgcctctt tgccacgcct ctaacgcttc tgcctttctc tgcagagtct 24720
gaatgtgagt ttcaatcccg aaagtttcct ggactgccag attcatgagg tgaaaggcgt 24780
tgaagccagg gacgaggtgg aaagttttct gcccaatgat cttcctgcac agccagagga 24840
gttggagaca cagggacaca gagccgctgt acacagtgca aaccgctcgc ctgagacttc 24900
agtcagccca ccagaaacag ttagaagaga gtcaccctta agatgcctgg ctagaaatct 24960
gagtacctgc aatgcccctc cactcctttc ctctaggtcc cctgactaca gagatggtga 25020
cagaaatagg cctcctgtgt atcaagactt gctgccaaac tctggaaaca caaatgtccc 25080
tgtccctgtc cctcaaccat tgcctttcca gtcgggaatc ctgataccag tttctcagag 25140
acagcccatc tccacttcct cagtactgaa tcaagaagaa gcgtatgtca ccatgtctag 25200
tttttaccaa aacaaatgaa ttataagaaa acccttccat cgacaaccaa atgatcactg 25260
agatggaaag tctggaatgc ttgctctccc ccgtagctca cagaagagaa agtcaacgtg 25320
accttgctac acatcttcag cattctaaga aatcattttg ctcttctagc tcagaagcat 25380
ttgcacaaag caggaagaat ctgttttccc tgttgttgga ttagtcataa gagtccatat 25440
gacccaatta aaattgcaaa actcagttaa gtgaagaaag aaagatagac aaaagaagat 25500
agaaggatgt ggtgaatgca ggaagaagaa aatgaaagat gtgagtggtg ggtctatcat 25560
tcaaattgac tatttatcca gcactatacc actcttctca tttcttcctc acaataatat 25620
tacaatgtgg gcttatccat tataactttt attttctttg tcatagatgc tgaagttgaa 25680
agtagagatt ttaagtgata tccaaatttt tctttcagct acagatgagg cacacattcc 25740
aacttcaacc ctctcttgcc atgaacctgt cctattgttg agtgtcaaac atcaccacta 25800
agtggatggt tatgtagtcc attatccaaa ctgagtcgtt ttggaaagaa aaagttagac 25860
ataattaaca gtaagcataa actgtatatg tctaagagag atgtggatgg atggtcattt 25920
tacttaaagt ggctataggg atgaacatga aggacaaagt acatttatgg gtgtggcata 25980
ccatgaccat gtgtcaaagg aagtgggaaa aagaaaaaaa aagcaccaag atcatttgat 26040
tttgttttgt tgttttgttt gaaaacaaac tcaagaagca atgagttaga agccgagaag 26100
ttccagagtc agttatcaag accatgattt tcctgctgct attatccatt ggcttctctg 26160
tgacattgta ggaggaacta tggccaatct acaggagttc aacatttaac agtgaatgga 26220
gtcctcctat gtgagtcctc ctatgtgtgg agacaccatt aagaactacc ccaagttcta 26280
catctctgga tattgcctga actacagaaa aagggggctg cgcacaccac aatgagtgcc 26340
ctacctgaaa ctatgctcac agaaacacaa agaagatggg taagttattc aaattcaaat 26400
gttgatttat gactgcaagt cacaattttg aatccctgct gtgtataacc aatctcctga 26460
agaaaacaac aaataactga aagatactgt ggttgggtgc cttagcatta aaattctgtt 26520
taagtgttga cattgtttat ttggattgga gtgtctgtcc ggtcatgtat tgtatccatg 26580
cattatattc agataaccac aacagctgct aatgcttgat tatattctca gggactgcat 26640
gcaatgtaac attactggtt ggttctgcca attttcctct tggtatttat aaaggaaaac 26700
caaaactctt ggtcagagac aatatgcaaa acagagatgt caagtactat gtccaaatac 26760
tgtgaaatat aatgagaaat aggtaacaaa tttatcaatc aactatgttt ggatccaggg 26820
aatctcaagt tattcaattc attctctgta agcctttgtc tctctcttca tccagacttt 26880
tgccttcaaa tacaagcatg cgctattttc tggaa 26915
<210> 66
<211> 21774
<212> DNA
<213> 人工序列
<220>
<223> 靶向的Il7ra等位基因,无盒(总计21774 bp)
<220>
<221> misc_feature
<222> (1)..(184)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (117)..(119)
<223> 起始密码子
<220>
<221> misc_feature
<222> (185)..(310)
<223> 人基因组片段1
<220>
<221> misc_feature
<222> (311)..(387)
<223> 缺失的Hyg自缺失盒
<220>
<221> misc_feature
<222> (317)..(350)
<223> LoxP
<220>
<221> misc_feature
<222> (388)..(17493)
<223> 人基因组片段2
<220>
<221> misc_feature
<222> (17494)..(21774)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (20076)..(20078)
<223> 终止密码子
<400> 66
acagagctgg tttgggtctc cctctctctc attcacttgc acatacaagc gtgcttcttc 60
tctattcttt ctctctctct ctctctctct ctctctctct ctctctctct ctcagaatga 120
tggctctggg tagagctttc gctatagttt tctgcttaat tcaagctgtt tctggagaaa 180
gtggctatgc tcaaaatggt gagtcatttc taagttttct tatggatttt ggattatctg 240
tagcatggtt tcaggttatt cagttcccta acagacctga gtcaggcact gggtttgaat 300
gcagtttgag gtcgagataa cttcgtataa tgtatgctat acgaagttat gctagtaact 360
ataacggtcc taaggtagcg agctagcaat ttcccacata ttcagtcatt ttttttaatg 420
tttaaccacc atgacagggg gcaggggatc aatactatgg gtggtttata agacctcagt 480
attctcaaga aggaatgcat ttcactccca agtgtagatc ttaaatgttg aatgattact 540
ctgctcttac aaaaagaatg ctcatgtaga tgctatgact gtacttgtag gaaaatgtcc 600
aaagtaattt taccttgtca ggagatcaaa ctggattcat tttgtttgac tttttaagaa 660
atcctgaaag cataactttc aggataaggt aatgtacaga agcaatagct ttgtcttcag 720
tgaccagtgc tatatcctca gcacctaaat cagtggctag aatatagtag acatccaata 780
acttttgaaa gtgttttcaa aatactttag ttttgagaga tttatgtgag attttaagta 840
aataactgac tagagaaaga tctaaatgag tttactcatt gaaatacact gaattgcctc 900
cacaccaaca aattggccat atgtaataat tctttttggg atctaaaaaa cttagtaccg 960
agaagccaac cctgcccata cataaacaca ttgtaattat aacaaaacta ggcagaagct 1020
tctaacagca gcaggaggca tgtgggaatt tagaccatca acttgctcct gcaaattaag 1080
ccctttctct ttaagagtta aaaactattt ggctatagac aatatcaaac acatcagcct 1140
aatgactcag cttatgcatt ttgagtcatg taattacgaa ggatggaaat ccctagaatt 1200
ttctcattaa gggaattgtc agagagtttg acatttttta cagtatatga ctcactttat 1260
gggggatgat tattattcta tgctaaactt tgccttggat ttccacaaag actgatggga 1320
ggcaggaaac ataaatctta ctctctttca tgtcatctat actcactagt tcaccctggt 1380
gatcatacta tttttaaaat atataagaat gctagttgaa agctgggttt tcactccaac 1440
tttttaagtt tcagattttt tagaagatgt ataattaccc tattcacatg attacgtcaa 1500
aatacttccc agtttggggt ataggaattc acattcagtt gctgcttgtt gaaagttgtc 1560
aattttctga tcatcacaag gatgatcaag agaagaaagg gatacttttt aaaaatccaa 1620
atcatttaca ctattaatca actaactcca ttcagtagga agaagacttc tagatgacac 1680
tggcttgcct atgatacata ttccacacaa tttaaatttt tatggataaa tatgtctaga 1740
tacctattta aatatgaata atattaatta ttgagcattt aaagaataat agattaactc 1800
attattcaaa agctctatgt aatttcaaaa ccatagtaat tataacaccg tcaattgaca 1860
taaacttttt aaagagaagc tcaaatgttt catgtatatt ttcagaatta gaattcttat 1920
tttacctttt cattacttat ttctcagaaa atattatact catagctaat ccctattaaa 1980
tccttactgt gttctaagct acctctttgt aaatatccat tcagtgattg ctcatagcac 2040
gagtttacat attagaacac atgtcttaga gaagttgcct acctgacaga ggaccacagg 2100
tagagtatcc agaatttaaa cgcacatctg tccagctcta acaccacagg tcttaaccac 2160
tgtgtacatt aactactctt agccaagaat ttttcagctc acgtcatgta gaatattctt 2220
tttgtaaaat gccatcacat tttataagtc attgaaggga atttttcttg gttacaaagc 2280
aactctgccc cataatatct actgaaaagc cagtgagctg cttcctaaaa cacagccatt 2340
ttaggtgcag gaaacagtgt ataaatggct cattgtatat tgtatgcttt gccagactga 2400
gtggcagtgg gagtcctttg ttatgtgggt gctgacatct gctagagtgt gctgtctcta 2460
ttgaagaatc gtgaagacaa agccgaccca caggatgtct gaatccaaat aataatacat 2520
gttctgtgta tagaattggt ggaagagaaa atgtcaggac agtgtgagga ctgccatgta 2580
aggtcagaac cactgcattt agaaagctac cactgcacag ggaagaaatc taagtctaca 2640
aaattagtgg gctgtctctc attatttcgt gctgtcatca gaaggagggc cataccctgc 2700
tgaaactaca taaagagctt ttgctggtgg cagaactgtg aactggatgg attctgggaa 2760
tggccagaaa aacaaatgcc tgtggttgtg agcagtgccc acacccatgg tctagctagg 2820
gctgtttgag atttgttgct ttgactgaac caacctgtca ttcaactggt tggtccattc 2880
acagtcagct ttattaactt tcccattttc cctactgagt tatttaagta aagaaagtgc 2940
tattcggaca gcccttggtc tctgggacaa tcaactggga tttgatttta gtatattctg 3000
tctccagtgt aaagccttgg aagcatctaa tttctagtac tgatgaacca aaaatacatg 3060
gaagcagtcc taggctcaca cttgagcact ctgagaatgg ctttgcttac tccagatttt 3120
ctcaggtccc agtgggtgta tattttctga catatttatt ccagcctcac tttctatcat 3180
gtaaaacata catacaaaat gtagatttca ttatagggtc tacaaaacag cttaagaaac 3240
caaatactat gtgtgacaga tcacactttc caaaagtaat agcaaaaaaa aaaaaaatct 3300
ggttccccac tttcttccag catcctgcta gaatctatca gatactgcgt ctatagaaga 3360
atctataaga acagaagcag tatgtacaac attcacagga agtttcacca aatcggagtc 3420
ctgccagatc taattttttt tccctaatca cgtttgtctc agtcagtagc ttaagacaat 3480
ggaaataatc agtgccactt ttaattggga tgccttttta ggcaagggaa agtgacctct 3540
taaaaaagca aaattctgac tgcaagatag ctatcattgt ccttcattta agacaaaaaa 3600
aatactaggg agggaataaa ttatgatttg taataaagtg aaaagtgaga ttaggtagca 3660
tggggataat ggaaataaag tgtctcttct ttgaaataat atgaacaatc aatgtaacaa 3720
atgtagcaga aaaaactcca gtttaaatac agaaaagaat gtgttcaatg cctctggttc 3780
tttaactcag aaatatttgg aggttactta ctcattatga tggatttttt ttttctattg 3840
gaaaactctg ttagcattga gcgtttttgt tttttgtttt ttgttggttg gttggttttg 3900
aagcattttt cttgtctttg cccttgggct tttcttcctt gaatactaca taatccatta 3960
ctatttcatg tctgccacag agtctgctat tttattaagg tcatgccata tttcaaaagg 4020
atgcatttat ttgtttcatt aacagctgca tgtttgttcc tccccaggag acttggaaga 4080
tgcagaactg gatgactact cattctcatg ctatagccag ttggaagtga atggatcgca 4140
gcactcactg acctgtgctt ttgaggaccc agatgtcaac atcaccaatc tggaatttga 4200
aatatggtga gggatggtgg ttttaatggt tgcttagaca tcctctgtct ctcttttcat 4260
atgctctttt taatagccac aaaagaaaga atatgtggcc taattaacaa atgttaacat 4320
ctaaggaatt cccaaaggcc tcctgaaact ccttgtcctt caccaaaaac actcatacaa 4380
atctcctctc acggttcagc tttcagaccc tgagactcag tcaaatgatg ctctggatct 4440
tggggatccc acatccctcc caacttcata tcagaattta aatcctgcgt ctcctacaac 4500
acttctcacc aaaaatctgt ttgcccaaca cgagacaatc cagtgtcttc aagttgcatc 4560
tgagagttaa actgccttgt ttccaatccc aataccagtg cttactagtt ttttgaccta 4620
gagaaagtta tgtaatgtat ctatgcctca gtttcctcac ctgtaaaatg agataacctg 4680
cctcacagga aggctgtgat ggttaaataa tttcatcata taaatcattc caaatagtcg 4740
gccagtgaat aacgagtaat ggggaagcaa cattaaatta taattctgtg aatattgacc 4800
taacttctac catcttgaca caatttgact tcagatgatc ctctcaatgt aaattttcca 4860
aaaatccaca ggaataagtt ggcattttgt ttcacaaggt ctcacagaaa agacaaagga 4920
aaagagtctg gtttgaaagt ttactaaagg tctcagggaa ctttatcttc tccttctcct 4980
tcatccataa gtcatctctt gttgccaagg gttactatct ctggtgattt gagaaactac 5040
tctagcttga aattctgacc tgaggctatc tccaaattca tatccgaatg acctactttt 5100
tagttagtgt cctagtgagc aaagtaaatc aagatccacc agtagtaata gaaggcttcc 5160
tacattccat agacactgag acaattctcc acagtctata gtccaaacaa gccctgaatt 5220
ccagtttttg tcaatttatg ggagcttcct gcatctattt atggagtgct ttctgctgca 5280
gtccttagat aaacatgctg ttggacttga gtagtgtact gtgttctctg tctgcctctg 5340
ttcacttccc taacacattt tccaggaata aaatatgtca aaagaacctg aaccagttcg 5400
atgtccacaa tctaggctgg aaatggattg cactaaaaca gccataacaa ctcattcaaa 5460
caaggcactc attttcatgg gcaaatcact ctcccacacg gaggtttgac tttggcttct 5520
ttaaccagct ggctggtggg ctgagtgttc atcctggttt ctcttggcca agctgaggtt 5580
gacctttctg ttcactttca ttcacaccat atttgaccac ttccttgccc actcaaacat 5640
acttaccctt taacatatct cttgactttt cctgtcatat tgtaatctgt ccagagcctc 5700
ctctatttgg gttttccaat tggattcaga tatttcagtt ggaaagggac tgccttaaga 5760
aagaaacgtt ttcagtggaa aatatatgta tgagctcttt aatagatgaa ctcctggagt 5820
tcagagccct taaaaggatg cccagtttca caagacagcc atacggtcat ccttgattgt 5880
ccattgctca ttaatttcat tctcaaaatc atgggaatga gctgagaata ccattttaga 5940
tcctccttaa attcccaaca gtaccagaaa cttgctacag gttggggcct gtaattggat 6000
atttcacaca tactttcctt acaaatatat tctatactca agaattgaac taaaagttat 6060
tgtcctagtt tctccacatc ccatgtttac ctaaaattca gaaatgggac cccgctccca 6120
gtctcccctt ctatatttat ttatcaaatc gtgacaacat taccatcttc agatctttcc 6180
acctgatgtt tgtcctaagc ttattccctg gtatctgtct agcttaccca aaaattcggt 6240
ttttattttt atcctgttcc aagttgggaa agcctatcta ccccaacaag gaacacaact 6300
ccctagtaac tttgagacac acacacacat acacacctac tctttaaagc ctaaacaatc 6360
gcacactcta aaagatagca gttaacaaaa gtaacgattt gggagaacag ttttaaggaa 6420
tgtccccaaa ataatcaata catttagcca gttaattaac ttaacatttc ttcaccaatc 6480
tctagttttc atgactgtag gagcttaacc agtcactctc agaccacaat aaaccaaagg 6540
tgaaagattc tgtaacaaaa gctagggcac tctcccctgc atttaacctc ctggccagct 6600
cactcgaagc cagacaaaca ggttcctctt tttgtgcaga gtccaggaac cattctcgaa 6660
aggactcatt tgagcacatg cagagaagag tgtacacaca tccagttcac caagggaagc 6720
caacacacat tgtgggttgt aggtagtaaa aggccttcct agaacacact ccttaggatt 6780
taaacaaaat tacatcggtt aatggaaaga attctttcat atacgcaaac ttacccagag 6840
gaacttttct tctgcccaga tcttcacttc caatttgacc cagttatacc tctttagagc 6900
tatttggctg agcttaaaca gcacatagga aaaacaaatt ggtaactgtg tttatcacag 6960
aagaggaaaa ttaaatttag ggttgggaaa ggaaaataac cctatgatat tacttttatt 7020
ctacctttac aatgagaata tatacctttg ttacttcttt aatttttaca ttatttactt 7080
atttttcttt gctttcttgt ttgattacaa tgcattttag gggtaaaatt tatgtgtggt 7140
aaaatgcaca aaaattaagt gaatttggag aaatgtctat gacctgtagc cattccaatg 7200
gtaaagatat agaacttatt tttcccctag aaggatgctt catgttcctt tccagtcaat 7260
cttcataccc caggagcaat cataattctc aattctatta ccctttggtt tttgccagtt 7320
tctgatagtt cttattaata gaatactctt tattcttttc tgtcttcttt catttaacca 7380
gtgtttgtga gagttagcca tgttgatgtc catctcatag ctcatctttt caattgctaa 7440
gtagtaattc cactgtatga atataccaca aatttttaat tctttctctt cttgatgaac 7500
atttgtgttt tttcaagttt gagactatta ttttttaggt tgctgttcac attcttggac 7560
aaatcagttt gtgtatatat attttcattt ttctggggta taaaacctca gaatggaatt 7620
gctgtgtcat aaggtaagca tgtatctaag tttataagaa accgcccaac agtttttcaa 7680
agtggttata ccattctact ctccttccag cgatgcatga gagatataca tcatttgcaa 7740
cgtttgactt tgggatagta tctcgttagg tttttaattc gcatttgtca aataacaaat 7800
gttgagcagc ttttcatata cttggtcttt tgcctgtctt ctttgggcta gtatctgtta 7860
aaagcactga gttatttgtc cttttgttat tgctggatat gagttcttta tacattctgt 7920
atacatttcc tttgtcagat agatgtattg catctatttt ctattctgaa gtttgccatt 7980
ttattttctt actggtgcgt tttaataagc aagagttttt ttttattttg atggagtcta 8040
atatatcatt tattttcttt tatatgtagt gctttttgta tccttgctaa gataactttg 8100
cctactccca aagttgggaa gatattttct catgttttct tttaaatgtt ctacagtttt 8160
agcctttata tttagttttt ttaattatta ttatacttta agttctaggg tacatgtgca 8220
caacgtgtag gtttgttaca tatgtataca tgtgccatgt tggtgtgctg caccgattaa 8280
ctcgtcattt acattaggta tatctcctaa tgctatccct cccccctcct tccacctatg 8340
actggccctg gtgtgtgatg ttccccttcc tgtgtccaag tgctcttatc gttcaattcc 8400
catctatgag tgagaacatg cagtgtttga ttttttgtcc ttgtgatagt ttgctgagaa 8460
tgatggtttc cagcttcatc catgtcccta taaaggacat gaactcatcc ttttttatgg 8520
ctgcatagta ttccatggtg tatatgtgcc acattttctt aatccagtct atcattgatg 8580
gacatttggc ttggttccaa gtctttgcta ttgtgaatag tgctgcaata atcgtacatg 8640
tgcatgtgtc tttatagcag catgatttat actcctttgg gtatataccc agtaatggga 8700
tggctgggtc aaatagtatt tctagctctg gatccttgag gactcgccac actgtcttcc 8760
acaatggttg aactagttta cagtcccacc aacagtgtaa aagtgttcct atttctccac 8820
attccctcca gcaccttttg tttcctgact ttttaatgat caccattcta actggtgtga 8880
gatggtatgt cattgtggtt ttgatttgca tttctctgat ggccattgat ggctaatatc 8940
cagaatctac aatgaactca aacaaattta caagaaaaaa acaaacaacc ccatcaaaaa 9000
gtgggcaaag gatatgaaca gacacttctc aaaagaagac atttatgcag ccaaaagaca 9060
catgaaaaaa tgctcatcat caatggccat cagagaaacg caaatcaaat tgtgtttatt 9120
tgtttctctt gtcttatgca ttggctaaaa cctcctgtac accactgaat agaaatggtg 9180
aaagtggata ttcctgtcgt gtcctggtct tagggaaaca attcatgttc acaatttcag 9240
cactaaatat gatattaact ataggctttt gtaaatgctc tttatcagat tgaggaagtg 9300
tctttctatt tcttatttgc tgtgagtttt taacatgaat agatgcattc atgttattaa 9360
attatgcttt gaatgcattg attgattata accaggttat ttatgtcttc tagtctgtta 9420
acatggcaaa ttatattgat taatttttga atctttaacc tgctttggtt tcctgagatg 9480
tgccctactt tataattatg tattaaaatt agtgtgttag tattttcttg tgaaagtttg 9540
cttatacatt tttgagggat atttgtctat caacttcttt tctctaatat tttggccagg 9600
tttgggtacc aggattaagc tagcttcaaa aaataggttg agaagggtca ttcctcttcc 9660
agtttctaaa ataatttgtg tcagattgac actatttctt tccttataca tttgatagaa 9720
tttaccagaa tataaccatc aagcatagag ttttctttgg ggggaagttt attgataata 9780
agtttaattt ctttgagaga aatataactg ttgaaatatt ccatttctat gtgggtcaga 9840
tttactaatt tgtgtttata aaaacatttt cattacatct aagttattat atacattaaa 9900
atagcattta aaatttcctt attatacttt taacatctgc atgttctata gtgatatctc 9960
ctcttacatt ccagatatta gtaatttata tattttgttt tcttaaccac tcttgttagg 10020
gttcaccagc caaaattacc tataaaaatc cattacgtta cccatcaagt atatgtgata 10080
ttatgtatat aaccctttat actatgttat cattttcttt aacacttttt ttaatcaata 10140
ttttttacag ctcttatttc ttacatatat tcctatggaa catcaaaaaa agcaattact 10200
ttttaatcta aacaaagtat ttgtttttca gtgatcaatt ataaaaatat agaaatttcc 10260
cataatttta taaatatgtc ttgactattt caggttcaat tgcatctaat tctaagtaaa 10320
tcatcactaa gtatcatagc agcagaaagc cataagattt taattcatta tctctcattc 10380
ctgaacatgc ctccactcac ccacccacat acctatgaac agagttaaag tcaaacatac 10440
atcaatgtgc atatgatact attccactgc atacaggaac tcctacctga atcaagacat 10500
atcccctttt tattcctaca gtggggccct cgtggaggta aagtgcctga atttcaggaa 10560
actacaagag atatatttca tcgagacaaa gaaattctta ctgattggaa agagcaatat 10620
atgtgtgaag gttggagaaa agagtctaac ctgcaaaaaa atagacctaa ccactatagg 10680
taagaagttg tatataaaag tatggttgtc acttttgggc tacctgaaaa cactgtgtct 10740
ggacattctg taggttaaaa gtagacaaat agtggaaaca actggcaata gataatagct 10800
aattccctac tgtaaatttt tataataaat gaaaagcttg aaatttatac tttcctgcag 10860
tgaaagaatt ctgaggatct tcaaacccag gtgtgaaaga tagtgtttgt gcaaacctac 10920
atgaagtggc taactggagc tgggcttcct gtcatccatc acaggtgtcc tttccttcct 10980
tatctgtcct ttccttcctt acctgtcctt ctcccaaatt ccttgtggtc ttctccccaa 11040
atccccacaa cattctgagt aagtttagct aacttatcaa gttattttaa aaagcatata 11100
tgccttctct attagtcaga gttttctaca aaaaaaaaag ggaatcaata ggaggataga 11160
tagatagatc attgatagga gagatttcta ttaagaaatt gacttttgtg gttgtgggaa 11220
ctggcaatcg caaaaatcca taaggcaagc cagtaggcta gaaattcagg aaagagtgca 11280
gtattgagcc taaattccgc agggcaagaa actcaagcag attttctgta ttgtactctt 11340
gagacagact tgcttcttct tcagggaacc tctgtctttg ctctagaggc cttctactga 11400
tgaggtgatg cccaccacat cacggaaggc aatctacttt actcaaagtt tactgattta 11460
aatgttaacc atgtcttaaa aatactttta gcattcccta ttcgctcccc cttcaaccct 11520
caaaaagaaa attaaaggta agagagcaat actcattaga gataagaaag agtaagaaac 11580
ctagctcagc tttgtctcag ttttgtttca ctaagatgat aaaatagaga ggtaaagcag 11640
aagttccatg tgtgaacaat taacttgtga aaaggcaaat gtagtagaaa agagacatta 11700
ggcagatggc tgtgcatgtt ggccacacag aagcagcatt ggccatgacc agtgtgggtc 11760
ctggttaggg gaagagaact ggctttgaca acaacagggt atctctgagg ttataaaaag 11820
ttgggttctg atcatttgga gatgaggtcc ctatggatag ggcaccatat ctaaaggttc 11880
accatttaca ttgcaaatat acattcagtt ctctgagagt gagcagagaa ggcagaggtt 11940
ctcagtcttc tgacaaggtc ctggagcatc aggggagagc ccattcttac aaaactccac 12000
accagcatgc aagcccttac atgcacataa gcactcacaa cacaccaaga gcctccaggt 12060
gacatctgcc acctccaaat ccccatatcc cacatgctca atgcacttgc agtctccatc 12120
ccccagcaga ctgcaaatct gacatgcctc ctccgaacgg caagggggag aggtacgtat 12180
ggtacacaca ctgctgatgg cataggcccc tttggaaggg gtagtgtgag tctcttgggg 12240
ctatggcaag cacccctgga caagcaggaa gagaggtggt ggaggcatgt ctcacggtag 12300
catctccttc taggtcctaa tgggacactt cattaatgga actaccattt aagtgagttt 12360
aaactggatg cttctgattg agccccagag ccagtgctcc actgccacca cctgcaccct 12420
cacttcccct tgtttaagca tcttccaacc cagtaaggct gaagagggaa gcatcctgcc 12480
ttcccacttc tcttagcaga gtagattgat atgattattc agattgtaca agaatctatt 12540
ccctctgaag tattgcttga tgaatgagcc cctttttcta atttgctcaa agaaatcatt 12600
tgagcttgag gaaaactgtc cagagggcac gaggaccagc cgttgtgata tgtaacaagg 12660
tagagaaaca aaagctaaat gaagaagagt gagcctcaga atcaaagaac tggatttgga 12720
tccctttaaa ccattttaca ggggcctgaa tgtaattaac ttctctgaaa ttcagtttcc 12780
ttatcaatat gctggtgata agtgactatt gtttgaagac agcataagca aagcatgcag 12840
tacttaggag atgtgttctt ccttcaattc ctctattatt aaaagatggg cacagggcag 12900
gggcttcagc tcagaaggcc ttgttgagaa tggaatggag agcaggaaca agagagaggg 12960
gcaaaggcat tgccagcatt ctctgttcgg ctgttctcca cccactgcct ttcctcctgc 13020
ttccctctaa gtccagggca ttttcccttt tgataaactt ccccttttac aacccatcca 13080
agggtgaaaa acaaagtcat tacttttttt tcagtacctc taaggcaaag cagcagaaac 13140
aggcagtcac cactacgaat aagtgactac aacaagagct aggccaaact ctgccatgtg 13200
ggctgcattt tattgggccg gcaagtaact ttaaatccca gctcacactc tactgagtga 13260
aagtctgatg aacccgcatc ttcttgtgaa caactgcgcc tgagatcagt catgcaagaa 13320
gtagcacccc cacccccaga caactaactt cccaggctgt gaccaacaag cagccaagag 13380
gccaggacag ggaagtctca ggacctttct aggaaatcaa tacctttctc tgggtttgtt 13440
ctgcctgaaa taataccaat ctccctccaa cagcttagca tgtgtggagc atttgatact 13500
aacagcaacc ctgcaaggca ggaaggcagt agggagaggc ccaagaggaa ttcagcatta 13560
aggcagtgag actgacagag gggaccccct gaggacattc tggaaggtct tagccagggc 13620
caggatgcag acccttcatg tcactgtagc tgagacgagg tgcaaggttc acagcatata 13680
acctaatttt attacaagaa taaagactca gagtttaaat actcctgctt tggggctcat 13740
tagtaacaag ttctccaata ttcaaaaggc aaagtggatg tgttttagtg taaaattaac 13800
actagctgct gtaacaaata agcccccaaa catatgatat ctcaaacacc gtaggtttat 13860
ttctcactca catcagagtc aaaatggatg tttctaacct gcagctgggg cttctcccag 13920
cagtattagg ggcactttcc atcttgtggc tccaccgtct gtaatgcagg actccaagtg 13980
gtggaagagg acggagcaga ggagtcacac atgggtgtgt gtctggccca gggtggaagt 14040
ggatgtgcat ttcttctgcc cacctcactc acaaggccac accccactgc aagagaggct 14100
ggagaatgcg gactggattt aaacccaaga agaagaaatg gttttctgaa tagttggcca 14160
tttactgaca caaaaagggt caaagtgact tgcagaggag atgaatttta aatactataa 14220
ttatttcctt ggctgccctt tagacagaat ttatttcttt ttcttttcca gttaaacctg 14280
aggctccttt tgacctgagt gtcgtctatc gggaaggagc caatgacttt gtggtgacat 14340
ttaatacatc acacttgcaa aagaagtatg taaaagtttt aatgcacgat gtagcttacc 14400
gccaggaaaa ggatgaaaac aaatggacgg tatgtagttc aactacatta ataaaataaa 14460
aacttatgaa tgttttctat tttgttggcc tagtagtgca tttcccctgg gagggcccaa 14520
caattttgct ttcaaaatct accttctact gaaagaatct cccaatattg gccccatgaa 14580
aacctggatc ttccctgatg catactcttc tagctctggt tgttttcttc tgctctaatt 14640
ttggtcttca gaatgtttct acattagtga gttggataac aatatagatt gaggccaaat 14700
taatcctctg tattcagggg cctcaaaaag tgtcatgtct agtgccactt tcataggcaa 14760
atcaggcaaa atgtatatct gcttatgatc accaagtcgt agccacattc tggcttatga 14820
gattcatggg accagcatga ggtaaagaaa agaggcataa tgtttgcctt tgttttgttt 14880
ttattttaaa gcccaaggtc tttgtttttg aagtaacagc ttaattttta cccttcataa 14940
tcaggagagt tacttagatg ctctcttcat gatttgttga ggttggaatg atttggcagt 15000
ccctgaaatt tattttgggg aggaggtggc agaagagtgg agtgtaccag gttatgagat 15060
ttctcttaac ccaccaacct aacttctgtt ctttctgcac ctcagagatg aagaagagat 15120
gatgatttct cttcctcaag tccttcttat tcttgctgtc ctgttttttc aggccaagat 15180
tggccttgtt tgtttgcagt gtgatgcaag atgccacttg cataaatgta acaactgccc 15240
caaaccacct gctccctcct tctactcacc caccccaccc ttgatcctgc catctttcat 15300
tattcatctg aaaattgcac caattgaaaa gcaacttagt ggagaaagga aggattatga 15360
ataaatgctg ccaggacaat tagttaacta aaaagaaaaa tagataaatt caataaatac 15420
atgaattttt ttgagatgga gtcttgctca gtcatccagg ttggagtgca atggcgccat 15480
cttggctcac tgcaacctcc gcctcccggg ttcaagcaat tctcccatct cagcctccca 15540
agtacctgtg attacaggca cccgccatca tgcccggcta atttttgtat ttttgtagag 15600
ctggggtttc accatgttgg ccaggctggt cttgaactcc tcacctcagg tgatctgccc 15660
acctcagcct cccaaagtgc tgggattaca ggcataagcc aacacgccag ccaaaaattg 15720
ttttaattaa aaaaaattaa actaaatgcc tagccacctt catataacaa caacaaaata 15780
ccagatgatt taaggaaatt atataaaagt gaaactctaa acaaattaga aaaattatag 15840
ccaaatgttt acataatctt gacatgaaga agaacattct aagcatcaaa gctgtagaag 15900
aaaagaaagg attgagacat gcaactacat aaaaagtgga ggtttatata tgtcaacaca 15960
cacaataatc aaaaatcaaa aatgcaaatt taaaagtaag cttaaattgc cacataaaca 16020
gctgatagat ggttagtatc attaatagat aaaggactct tataaatcat taaaaaaaca 16080
aatatcacaa tagaaaaatg agcaaaaaaa ttgggaaaaa tctcataaag tatggaatag 16140
ataaattcaa taaatatatg aaaatgaact aattatcaaa taaatacaga tataaatagc 16200
aatggacttc tttttatctg tcaaattgat agagtggttt ttttttaatc ttaaagataa 16260
tacactgtgt ggtggagact tttgtctctt tatcactatt cacaatgtaa aatggcgtct 16320
ttctggagag aaatgattcc tgctcactaa cctaacctaa cctttcatct ccccttaata 16380
tgtgaaagga tagagagaaa agaagaagat attgaagtgt ggaaagggag atcctgggca 16440
gtgcctaact cacctgaata agacccatca tttcactctc ctccttgacc actcacaaca 16500
tcctttataa gctcagattc tgtccctaat tttgctgttg actcctttac gtatcagagc 16560
tccttattct aacaaatacg agacaacttc agagaatgct tatgggacta aaggaatccc 16620
aattgaaatg atttgggaga tttaggcaac acctcttttc ccatcctaag aatgtaactg 16680
cactctactc tctagcatgt gaatttatcc agcacaaagc tgacactcct gcagagaaag 16740
ctccaaccgg cagcaatgta tgagattaaa gttcgatcca tccctgatca ctattttaaa 16800
ggcttctgga gtgaatggag tccaagttat tacttcagaa ctccagagat caataatagc 16860
tcaggtaagg aatggtggta gagtttttgt tccctcagag tgctttgcat gtcaaagtgt 16920
gggagcaagt gagaggaaga ttgttgaaac taacctgcaa aataggacac ccttggaggg 16980
cactcttaca ctttctttgg agaatgactt gcctgctgtc tttgcgcctt ttgtgaagaa 17040
caaggaagca gagggagtgg ggtccttatt agctgagaat tagtacaagc catctgtatt 17100
cctggaagct gccatacatt ttgaacaaaa tccccaccca ctacgtccag ttaaccaatt 17160
tagcctggga ccccaatggc tgctgtctct aaggcccctt taagaagcac ctttattggt 17220
gtcaggtatg caggcaagtg cggctgtcct atgtctcctt ttccagaagg atgaagatgt 17280
ctttgggact ggaactgaga atgtgtagga actgagacat ctcctcccta aaatttgcaa 17340
caggggtgaa catccctctc atcatctcct gctctggctt cttttccttg gtagaaagtc 17400
aagaagggaa gagagcattg gtacctttga tgctagatca cgtttacatt tcaagtggca 17460
gatgctctgg gcctggtcac ccaagtcaat gcccaagtag ctgatgttct tcccactgtc 17520
accgagatca gctcaactct ttctctctat caaagaactg tttctaagaa acaataagtg 17580
agacatgtta ttaagtaaaa tcaaactacc ctaaatatat acccacactt tatgcttact 17640
gaatgctaac cgtgatctct ccttatattc caggaggatg ggatcctgtc ttgccaagtg 17700
tcaccattct gagtttgttc tctgtgtttt tgttggtcat cttagcccat gtgctatgga 17760
aaaaaaggtg attttcttta gtaaacaaga gggttatttg tggagcccca gaaaagcagg 17820
actcaggtac catctagaaa agtttaaaat aacagacttg acatttcaag aattatagta 17880
gcaaatatat gccctcctat ttttagatcc cagtcaattt accatagttg atttcagaag 17940
aggcaaaaat atacaaacta gacataagac aaacaatatt gcacaaatat taatagtgtg 18000
tgtgtgtctg tacacatgtg catctgtgca ttgcatgtgt ttgtgtatct gtgtctgtgt 18060
atatacacat gtgtgtgtgt gtgtgtgcgt gcgtgtgtgt atatgtgtgt gtgtgtgtgt 18120
gtatgtgtgt atgtgtgctg ggtctgtctg tttgtttatc tgtacatata tggttgtgtt 18180
catgtgtgta tacatgcaaa tgtgtgctgg cctacaggca gccaaactca acacatatta 18240
ttttattcaa ttatcttcca ccttgtctct tgatgcaggg tcttccacta aacatgaacc 18300
ttaccacccc tgtcagatta attggtcagt aaactctgag tatctgtctg cctccaccac 18360
tccacatatc atagagttac agatacatgt tatcatacat tgctatccaa actcagttct 18420
tcaaaattgt atgacaagag gtttatttat tggattattt ccctaggcca tgacgccccc 18480
ccccaaaaaa agaattcttt aagaagtgtt ttccaaatat tttttccaca gcctcctaaa 18540
ggacttagag gtgattaccc atgctaacat ggagtctatt tgatctcatg actttctgca 18600
cacaaattca catgattttt gtattttgct ctgtggtaga accatgccct gtgaattact 18660
cagtgttcta ggaagttgcc ctcggcaatt ttgtattcct aggaccaaaa gtgctctaat 18720
ttgaaaaacg ctaccataaa ataattttct tgaatagctt agaacgtatt cccaatttcc 18780
actggaatta aagtaaaacc tttacttcca gtaaagacag tggataagat gacaatacca 18840
acagtgagca taaaagacca ggtctcattg tagctccata taaacaccaa tactgcctcc 18900
ctgcaaacct cactcttcgc tttagggtac tttgcaacat aattacattg tctcattcac 18960
aatagatcgt tagcaaggag ctctgttcta tccactcctt aaaccaagag catgatactg 19020
tcagagaaaa taaggtgttt gtccagtaac agaaatgttt tcacaatcta cctcaaataa 19080
ggtgaaagag ttgtttgtgt gccttctcct tctgccgttt gtttcaagta tgaatgttct 19140
ctggttttag gattaaacct gtcgtatggc ctagtctccc cgatcataag aaaactctgg 19200
aacaactatg taagaagcca aaaacggtaa ttgcttgagg tggggaaaga aacaccataa 19260
tgttgaaatc ttagtctaag aatgattaag actgacactc aacttacggt cttttatata 19320
tcacataaat gaaagtcctt ttaagactct gaagaataaa gccaagatat gccacagggc 19380
agggggttgg ggaaaaatca atatttactt caaagttgga gtatcacagc tcagtcagaa 19440
gtgaagccaa ctgtcatttt ttcacatcgt gtgtcaattt tacaagaaag tttcgtaaac 19500
gttttagttt cctgaatcaa atgtatagca gcgcctcttt gccacgcctc taacgcttct 19560
gcctttctct gcagagtctg aatgtgagtt tcaatcccga aagtttcctg gactgccaga 19620
ttcatgaggt gaaaggcgtt gaagccaggg acgaggtgga aagttttctg cccaatgatc 19680
ttcctgcaca gccagaggag ttggagacac agggacacag agccgctgta cacagtgcaa 19740
accgctcgcc tgagacttca gtcagcccac cagaaacagt tagaagagag tcacccttaa 19800
gatgcctggc tagaaatctg agtacctgca atgcccctcc actcctttcc tctaggtccc 19860
ctgactacag agatggtgac agaaataggc ctcctgtgta tcaagacttg ctgccaaact 19920
ctggaaacac aaatgtccct gtccctgtcc ctcaaccatt gcctttccag tcgggaatcc 19980
tgataccagt ttctcagaga cagcccatct ccacttcctc agtactgaat caagaagaag 20040
cgtatgtcac catgtctagt ttttaccaaa acaaatgaat tataagaaaa cccttccatc 20100
gacaaccaaa tgatcactga gatggaaagt ctggaatgct tgctctcccc cgtagctcac 20160
agaagagaaa gtcaacgtga ccttgctaca catcttcagc attctaagaa atcattttgc 20220
tcttctagct cagaagcatt tgcacaaagc aggaagaatc tgttttccct gttgttggat 20280
tagtcataag agtccatatg acccaattaa aattgcaaaa ctcagttaag tgaagaaaga 20340
aagatagaca aaagaagata gaaggatgtg gtgaatgcag gaagaagaaa atgaaagatg 20400
tgagtggtgg gtctatcatt caaattgact atttatccag cactatacca ctcttctcat 20460
ttcttcctca caataatatt acaatgtggg cttatccatt ataactttta ttttctttgt 20520
catagatgct gaagttgaaa gtagagattt taagtgatat ccaaattttt ctttcagcta 20580
cagatgaggc acacattcca acttcaaccc tctcttgcca tgaacctgtc ctattgttga 20640
gtgtcaaaca tcaccactaa gtggatggtt atgtagtcca ttatccaaac tgagtcgttt 20700
tggaaagaaa aagttagaca taattaacag taagcataaa ctgtatatgt ctaagagaga 20760
tgtggatgga tggtcatttt acttaaagtg gctataggga tgaacatgaa ggacaaagta 20820
catttatggg tgtggcatac catgaccatg tgtcaaagga agtgggaaaa agaaaaaaaa 20880
agcaccaaga tcatttgatt ttgttttgtt gttttgtttg aaaacaaact caagaagcaa 20940
tgagttagaa gccgagaagt tccagagtca gttatcaaga ccatgatttt cctgctgcta 21000
ttatccattg gcttctctgt gacattgtag gaggaactat ggccaatcta caggagttca 21060
acatttaaca gtgaatggag tcctcctatg tgagtcctcc tatgtgtgga gacaccatta 21120
agaactaccc caagttctac atctctggat attgcctgaa ctacagaaaa agggggctgc 21180
gcacaccaca atgagtgccc tacctgaaac tatgctcaca gaaacacaaa gaagatgggt 21240
aagttattca aattcaaatg ttgatttatg actgcaagtc acaattttga atccctgctg 21300
tgtataacca atctcctgaa gaaaacaaca aataactgaa agatactgtg gttgggtgcc 21360
ttagcattaa aattctgttt aagtgttgac attgtttatt tggattggag tgtctgtccg 21420
gtcatgtatt gtatccatgc attatattca gataaccaca acagctgcta atgcttgatt 21480
atattctcag ggactgcatg caatgtaaca ttactggttg gttctgccaa ttttcctctt 21540
ggtatttata aaggaaaacc aaaactcttg gtcagagaca atatgcaaaa cagagatgtc 21600
aagtactatg tccaaatact gtgaaatata atgagaaata ggtaacaaat ttatcaatca 21660
actatgtttg gatccaggga atctcaagtt attcaattca ttctctgtaa gcctttgtct 21720
ctctcttcat ccagactttt gccttcaaat acaagcatgc gctattttct ggaa 21774
<210> 67
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 67
Ala Ala Ala Val Thr Ser Arg
1 5
<210> 68
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 68
Gln Gly Gly Ala
1
<210> 69
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 69
ctatgctcaa aatggtgagt catttctaag ttttcttatg gattttggat tatctgtagc 60
atggtttcag gttattcagt tccctaacag acctgagtca ggcactgggt ttgaatgcag 120
tttgag 126

Claims (137)

1.一种经基因修饰的啮齿动物,其在其基因组中包括:
人源化Tslp基因,所述人源化Tslp基因包括:
啮齿动物Tslp核酸序列;以及
人TSLP核酸序列,
其中所述人源化Tslp基因编码人源化Tslp多肽,所述人源化Tslp多肽包括与人TSLP蛋白的成熟蛋白序列基本上相同的成熟蛋白序列。
2.根据权利要求1所述的经基因修饰的啮齿动物,其中所述人源化Tslp多肽包括与所述人TSLP蛋白的成熟蛋白序列具有至少95%同一性的成熟蛋白序列。
3.根据权利要求1所述的经基因修饰的啮齿动物,其中所述人源化Tslp多肽包括与所述人TSLP蛋白的成熟蛋白序列相同的成熟蛋白序列。
4.根据权利要求1至3中任一项所述的经基因修饰的啮齿动物,其中所述人源化Tslp蛋白包括与啮齿动物Tslp蛋白的信号肽基本上相同的信号肽。
5.根据权利要求4所述的经基因修饰的啮齿动物,其中所述人源化Tslp蛋白包括与啮齿动物Tslp蛋白的信号肽具有至少95%同一性的信号肽。
6.根据权利要求4所述的经基因修饰的啮齿动物,其中所述人源化Tslp蛋白包括与内源性啮齿动物Tslp蛋白的信号肽相同的信号肽。
7.根据前述权利要求中任一项所述的经基因修饰的啮齿动物,其中所述人TSLP核酸序列至少编码所述人TSLP蛋白的大部分成熟蛋白序列。
8.根据权利要求7所述的经基因修饰的啮齿动物,其中所述人TSLP核酸序列编码所述人TSLP蛋白的成熟蛋白序列。
9.根据权利要求8所述的经基因修饰的啮齿动物,其中所述人TSLP核酸序列包括人TSLP基因的从成熟蛋白序列的第一氨基酸的密码子开始的外显子1至外显子4中的终止密码子。
10.根据权利要求1至9中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物Tslp核酸序列包括编码啮齿动物Tslp信号肽的啮齿动物Tslp基因的外显子序列。
11.根据权利要求10所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠,并且所述啮齿动物核酸序列包括小鼠Tslp基因的外显子1和编码信号肽氨基酸的外显子2的5'部分。
12.根据权利要求1至9中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物Tslp核酸序列包括啮齿动物Tslp基因的3'UTR。
13.根据权利要求10至12中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物Tslp基因是内源性Tslp基因。
14.根据权利要求1所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠,并且所述人源化Tslp基因包括:(i)小鼠Tslp基因的外显子1和编码信号肽氨基酸的外显子2的5'部分;以及(ii)人TSLP基因的从成熟蛋白序列的第一氨基酸的密码子开始的外显子1至外显子4中的终止密码子。
15.根据权利要求14所述的经基因修饰的啮齿动物,其中所述人源化Tslp基因进一步包括所述小鼠Tslp基因的3'UTR。
16.根据权利要求1至15中任一项所述的经基因修饰的啮齿动物,其中所述人源化Tslp基因与啮齿动物Tslp启动子可操作地连接。
17.根据权利要求16所述的经基因修饰的啮齿动物,其中所述啮齿动物Tslp启动子是内源性啮齿动物Tslp启动子。
18.根据权利要求1至17中任一项所述的经基因修饰的啮齿动物,其中所述人源化Tslp基因位于内源性啮齿动物Tslp基因座处。
19.根据权利要求18所述的经基因修饰的啮齿动物,其中所述人源化Tslp基因是由于位于内源性啮齿动物Tslp基因座处的啮齿动物Tslp基因组DNA被人TSLP核酸置换而形成的。
20.根据权利要求19所述的经基因修饰的啮齿动物,其中所述人源化Tslp基因是由于包括至少编码所述内源性啮齿动物Tslp蛋白的大部分成熟蛋白序列的外显子序列的啮齿动物基因组DNA被至少编码所述人TSLP蛋白的大部分成熟蛋白序列的所述人TSLP核酸置换而形成的。
21.根据权利要求20所述的经基因修饰的啮齿动物,其中所述人源化Tslp基因是由于包括编码所述内源性啮齿动物Tslp蛋白的成熟蛋白序列的外显子序列的啮齿动物基因组DNA被编码所述人TSLP蛋白的成熟蛋白序列的所述人TSLP核酸置换而形成的。
22.根据权利要求21所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠,并且其中被置换的小鼠基因组DNA包括内源性小鼠Tslp基因的从成熟小鼠Tslp蛋白的第一氨基酸的密码子开始的外显子2至外显子5中的终止密码子,并且人基因组DNA包括人TSLP基因的从成熟人TSLP蛋白的第一氨基酸的密码子开始的外显子1至外显子4中的终止密码子。
23.根据权利要求1至22中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物对所述人源化Tslp基因是纯合的。
24.根据权利要求1至22中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物对所述人源化Tslp基因是杂合的。
25.根据前述权利要求中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物表达所述人源化Tslp多肽。
26.根据前述权利要求中任一项所述的经基因修饰的啮齿动物,其基因组进一步包括位于内源性啮齿动物Tslpr基因座处的人源化Tslpr基因、位于内源性啮齿动物Il7ra基因座处的人源化Il7ra基因或其组合。
27.根据前述权利要求中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠或大鼠。
28.一种分离的啮齿动物组织或细胞,其基因组包括人源化Tslp基因,所述人源化Tslp基因包括啮齿动物Tslp核酸序列和人TSLP核酸序列,其中所述人源化Tslp基因编码人源化Tslp多肽,所述人源化Tslp多肽包括与人TSLP蛋白的成熟蛋白序列基本上相同的成熟蛋白序列。
29.根据权利要求28所述的分离的啮齿动物组织或细胞,其中所述人源化Tslp多肽包括与人TSLP蛋白的成熟蛋白序列具有至少95%同一性的成熟蛋白序列。
30.根据权利要求28或29所述的分离的啮齿动物组织或细胞,其中所述啮齿动物细胞是啮齿动物胚胎干细胞。
31.根据权利要求28至30中任一项所述的分离的啮齿动物组织或细胞,其中所述啮齿动物是小鼠或大鼠。
32.一种啮齿动物胚胎,其包括权利要求30的所述啮齿动物胚胎干细胞。
33.一种制备经基因修饰的啮齿动物的方法,所述方法包括:
修饰啮齿动物基因组以包括人源化Tslp基因,其中所述人源化Tslp基因包括啮齿动物Tslp核酸序列和人TSLP核酸序列,并且编码人源化Tslp多肽,所述人源化Tslp多肽包括与人TSLP蛋白的成熟蛋白序列基本上相同的成熟蛋白序列;以及
制备包括经修饰的啮齿动物基因组的啮齿动物。
34.根据权利要求33所述的方法,其中所述人源化Tslp多肽包括与人TSLP蛋白的成熟蛋白序列具有至少95%同一性的成熟蛋白序列。
35.根据权利要求33或34所述的方法,其中所述修饰包括:
将包括所述人TSLP核酸序列的核酸分子引入到啮齿动物胚胎干(ES)细胞的基因组中;
获得啮齿动物ES细胞,其中所述人TSLP核酸序列已整合到内源性Tslp基因座中以置换啮齿动物Tslp基因组DNA,由此形成所述人源化Tslp基因;以及
由所获得的啮齿动物ES细胞产生啮齿动物。
36.根据权利要求35所述的方法,其中所述核酸分子进一步包括侧接所述人TSLP核酸序列的5'同源臂和3'同源臂,并且其中所述5'同源臂和所述3'同源臂与侧接待置换的啮齿动物Tslp基因组DNA的内源性啮齿动物基因座处的核酸序列同源。
37.根据权利要求35或36所述的方法,其中所述人源化Tslp基因在内源性啮齿动物Tslp基因座处与内源性啮齿动物Tslp启动子可操作地连接。
38.根据权利要求33至37中任一项所述的方法,其中所述人TSLP核酸序列至少编码所述人TSLP蛋白的大部分成熟蛋白序列。
39.根据权利要求33至38中任一项所述的方法,其中所述啮齿动物是小鼠或大鼠。
40.一种靶向核酸构建体,其包括
将整合到内源性啮齿动物Tslp基因座处的啮齿动物Tslp基因中的人TSLP核酸序列,所述人TSLP核酸序列侧接有与所述啮齿动物Tslp基因座处的核苷酸序列同源的5'核苷酸序列和3'核苷酸序列,
其中所述人TSLP核酸序列整合到所述啮齿动物Tslp基因中使得啮齿动物Tslp基因组DNA被所述人TSLP核酸序列置换,由此形成人源化Tslp基因,并且
其中所述人TSLP核酸序列至少编码人TSLP蛋白的大部分成熟蛋白序列。
41.根据权利要求40所述的靶向核酸,其中啮齿动物是小鼠或大鼠。
42.一种经基因修饰的啮齿动物,其在其基因组中包括:
人源化Tslpr基因,所述人源化Tslpr基因包括:
啮齿动物Tslpr核酸序列;以及
人TSLPR核酸序列,
其中所述人源化Tslpr基因编码人源化Tslpr多肽,所述人源化Tslpr多肽包括与人TSLPR蛋白的胞外结构域基本上相同的胞外结构域。
43.根据权利要求42所述的经基因修饰的啮齿动物,其中人源化Tslpr蛋白包括与人TSLPR蛋白的胞外结构域具有至少95%同一性的胞外结构域。
44.根据权利要求42所述的经基因修饰的啮齿动物,其中所述人源化Tslpr蛋白包括与人TSLPR蛋白的胞外结构域相同的胞外结构域。
45.根据权利要求42至44中任一项所述的经基因修饰的啮齿动物,其中所述人源化Tslpr蛋白包括与啮齿动物Tslpr蛋白的跨膜细胞质序列基本上相同的跨膜细胞质序列。
46.根据权利要求45所述的经基因修饰的啮齿动物,其中所述人源化Tslpr蛋白包括与啮齿动物Tslpr蛋白的跨膜细胞质序列具有至少95%同一性的跨膜细胞质序列。
47.根据权利要求46所述的经基因修饰的啮齿动物,其中所述人源化Tslpr蛋白包括内源性啮齿动物Tslpr蛋白的跨膜细胞质序列。
48.根据权利要求42至47中任一项所述的经基因修饰的啮齿动物,其中所述人源化Tslpr蛋白包括与啮齿动物Tslpr蛋白的信号肽基本上相同的信号肽。
49.根据权利要求48所述的经基因修饰的啮齿动物,其中所述人源化Tslpr蛋白包括与啮齿动物Tslpr蛋白的信号肽具有至少95%同一性的信号肽。
50.根据权利要求49所述的经基因修饰的啮齿动物,其中所述人源化Tslpr蛋白包括内源性啮齿动物Tslpr蛋白的信号肽。
51.根据权利要求40至50中任一项所述的经基因修饰的啮齿动物,其中所述人TSLPR核酸序列至少编码所述人TSLPR蛋白的大部分胞外结构域。
52.根据权利要求51所述的经基因修饰的啮齿动物,其中所述人TSLPR核酸序列包括人TSLPR基因的外显子2至外显子6中的最后一个胞外结构域氨基酸的密码子。
53.根据权利要求40至52中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物Tslpr核酸序列包括至少编码啮齿动物Tslpr蛋白的大部分跨膜细胞质序列的啮齿动物Tslpr基因的外显子序列。
54.根据权利要求53所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠,并且所述啮齿动物Tslpr核酸序列包括小鼠Tslpr基因的从跨膜结构域的第一氨基酸的密码子开始的外显子6至外显子8。
55.根据权利要求40至54中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物Tslpr核酸序列包括啮齿动物Tslpr基因的编码啮齿动物Tslpr蛋白的信号肽的外显子序列。
56.根据权利要求55所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠,并且所述啮齿动物核酸序列包括小鼠Tslpr基因的外显子1。
57.根据权利要求53至56中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物Tslpr基因是内源性Tslpr基因。
58.根据权利要求40所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠,并且所述人源化Tslpr基因包括:(i)小鼠Tslpr基因的外显子1;(ii)人TSLPR基因的外显子2至外显子6中的胞外结构域的最后一个氨基酸的密码子;以及(iii)所述小鼠Tslpr基因的从所述跨膜结构域的所述第一氨基酸的所述密码子开始的外显子6至外显子8。
59.根据权利要求40至58中任一项所述的经基因修饰的啮齿动物,其中所述人源化Tslpr基因与啮齿动物Tslpr启动子可操作地连接。
60.根据权利要求59所述的经基因修饰的啮齿动物,其中所述啮齿动物Tslpr启动子是内源性啮齿动物Tslpr启动子。
61.根据权利要求40至60中任一项所述的经基因修饰的啮齿动物,其中所述人源化Tslpr基因位于内源性啮齿动物Tslpr基因座处。
62.根据权利要求61所述的经基因修饰的啮齿动物,其中所述人源化Tslpr基因是由于内源性啮齿动物Tslpr基因座处的啮齿动物Tslpr基因组DNA被人TSLPR核酸置换而形成的。
63.根据权利要求62所述的经基因修饰的啮齿动物,其中所述人源化Tslpr基因是由于包括至少编码所述内源性啮齿动物Tslpr蛋白的大部分胞外结构域的外显子序列的啮齿动物基因组DNA被至少编码所述人TSLPR蛋白的大部分胞外结构域的所述人TSLPR核酸置换而形成的。
64.根据权利要求63所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠,并且其中被置换的小鼠基因组DNA包括内源性小鼠Tslpr基因的外显子2至外显子6中的胞外结构域的最后一个氨基酸的密码子,并且人基因组DNA包括人TSLPR基因的外显子2至外显子6中的胞外结构域的最后一个氨基酸的密码子。
65.根据权利要求40至64中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物对所述人源化Tslpr基因是纯合的。
66.根据权利要求40至62中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物对所述人源化Tslpr基因是杂合的。
67.根据权利要求40至66中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物表达所述人源化Tslpr多肽。
68.根据权利要求40至67中任一项所述的经基因修饰的啮齿动物,其基因组进一步包括位于内源性啮齿动物Tslp基因座处的人源化Tslp基因、位于内源性啮齿动物Il7ra基因座处的人源化Il7ra基因或其组合。
69.根据权利要求40至68中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠或大鼠。
70.一种分离的啮齿动物组织或细胞,其基因组包括人源化Tslpr基因,所述人源化Tslpr基因包括啮齿动物Tslpr核酸序列和人TSLPR核酸序列,其中所述人源化Tslpr基因编码人源化Tslpr多肽,所述人源化Tslpr多肽包括与人TSLPR蛋白的胞外结构域基本上相同的胞外结构域。
71.根据权利要求70所述的分离的啮齿动物组织或细胞,其中所述人源化Tslpr多肽包括与人TSLPR蛋白的胞外结构域具有至少95%同一性的胞外结构域。
72.根据权利要求70或71所述的分离的啮齿动物组织或细胞,其中所述啮齿动物细胞是啮齿动物胚胎干细胞。
73.根据权利要求70至72中任一项所述的分离的啮齿动物组织或细胞,其中啮齿动物是小鼠或大鼠。
74.一种啮齿动物胚胎,其包括权利要求72的所述啮齿动物胚胎干细胞。
75.一种制备经基因修饰的啮齿动物的方法,所述方法包括:
修饰啮齿动物基因组以包括人源化Tslpr基因,其中所述人源化Tslpr基因包括啮齿动物Tslpr核酸序列和人TSLPR核酸序列,并且编码人源化Tslpr多肽,所述人源化Tslpr多肽包括与人TSLP蛋白的胞外结构域基本上相同的胞外结构域;以及
制备包括经修饰的啮齿动物基因组的啮齿动物。
76.根据权利要求75所述的方法,其中所述人源化Tslpr多肽包括与人TSLP蛋白的胞外结构域具有至少95%同一性的胞外结构域。
77.根据权利要求75或76所述的方法,其中所述修饰包括:
将包括所述人TSLPR核酸序列的核酸分子引入到啮齿动物胚胎干(ES)细胞的基因组中;
获得啮齿动物ES细胞,其中所述人TSLPR核酸序列已整合到内源性Tslpr基因座中以置换啮齿动物Tslpr基因组DNA,由此形成所述人源化Tslpr基因;以及
由所获得的啮齿动物ES细胞产生啮齿动物。
78.根据权利要求75所述的方法,其中所述核酸分子进一步包括侧接所述人TSLPR核酸序列的5'同源臂和3'同源臂,并且其中所述5'同源臂和所述3'同源臂与侧接待置换的啮齿动物Tslpr基因组DNA的内源性啮齿动物基因座处的核酸序列同源。
79.根据权利要求77或78所述的方法,其中所述人源化Tslpr基因在内源性啮齿动物Tslpr基因座处与内源性啮齿动物Tslpr启动子可操作地连接。
80.根据权利要求75至79中任一项所述的方法,其中所述人TSLPR核酸序列至少编码人TSLPR蛋白的大部分胞外结构域。
81.根据权利要求75至80中任一项所述的方法,其中所述啮齿动物是小鼠或大鼠。
82.一种靶向核酸构建体,其包括
将整合到内源性啮齿动物Tslpr基因座处的啮齿动物Tslpr基因中的人TSLPR核酸序列,所述人TSLPR核酸序列侧接有与所述啮齿动物Tslpr基因座处的核苷酸序列同源的5'核苷酸序列和3'核苷酸序列,
其中所述人TSLPR核酸序列整合到所述啮齿动物Tslpr基因中使得啮齿动物Tslpr基因组DNA被所述人TSLPR核酸序列置换,由此形成人源化Tslpr基因,并且
其中所述人TSLPR核酸序列至少编码人TSLPR蛋白的大部分胞外结构域。
83.根据权利要求82所述的靶向核酸,其中所述啮齿动物是小鼠或大鼠。
84.一种经基因修饰的啮齿动物,其在其基因组中包括:
人源化Il7ra基因,所述人源化Il7ra基因包括:
啮齿动物Il7ra核酸序列;以及
人IL7RA核酸序列,
其中所述人源化Il7ra基因编码人源化Il7ra多肽,所述人源化Il7ra多肽包括与人IL7RA蛋白的胞外结构域基本上相同的胞外结构域。
85.根据权利要求84所述的经基因修饰的啮齿动物,其中所述人源化Il7ra多肽包括与人IL7RA蛋白的胞外结构域具有至少95%同一性的胞外结构域。
86.根据权利要求84所述的经基因修饰的啮齿动物,其中所述人源化Il7ra多肽包括与人IL7RA蛋白的胞外结构域相同的胞外结构域。
87.根据权利要求84至86中任一项所述的经基因修饰的啮齿动物,其中所述人源化Il7ra蛋白包括与啮齿动物Il7ra蛋白的跨膜细胞质序列基本上相同的跨膜细胞质序列。
88.根据权利要求87所述的经基因修饰的啮齿动物,其中所述人源化Il7ra蛋白包括与啮齿动物Il7ra蛋白的跨膜细胞质序列具有至少95%同一性的跨膜细胞质序列。
89.根据权利要求87所述的经基因修饰的啮齿动物,其中所述人源化Il7ra蛋白包括内源性啮齿动物Il7ra蛋白的跨膜细胞质序列。
90.根据权利要求84至89中任一项所述的经基因修饰的啮齿动物,其中所述人源化Il7ra蛋白包括与啮齿动物Il7ra蛋白的信号肽基本上相同的信号肽。
91.根据权利要求90所述的经基因修饰的啮齿动物,其中所述人源化Il7ra蛋白包括与啮齿动物Il7ra蛋白的信号肽具有至少95%同一性的信号肽。
92.根据权利要求90所述的经基因修饰的啮齿动物,其中所述人源化Il7ra蛋白包括内源性啮齿动物Il7ra蛋白的信号肽。
93.根据权利要求84至92中任一项所述的经基因修饰的啮齿动物,其中所述人IL7RA核酸序列至少编码所述人IL7RA蛋白的大部分胞外结构域。
94.根据权利要求93所述的经基因修饰的啮齿动物,其中所述人IL7RA核酸序列包括人IL7RA基因的从编码成熟人IL7RA蛋白的第一氨基酸的外显子2中的密码子至外显子5。
95.根据权利要求84至94中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物Il7ra核酸序列包括至少编码啮齿动物Il7ra蛋白的大部分跨膜细胞质序列的啮齿动物Il7ra基因的外显子序列。
96.根据权利要求95所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠,并且所述啮齿动物Il7ra核酸序列包括小鼠Il7ra基因的外显子6至外显子8。
97.根据权利要求84至96中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物Il7ra核酸序列包括啮齿动物Il7ra基因的编码啮齿动物Il7ra蛋白的信号肽的外显子1中的部分。
98.根据权利要求97所述的经基因修饰的啮齿动物,其中所述啮齿动物Il7ra核酸序列包括所述啮齿动物Il7ra基因的外显子1的5'UTR部分。
99.根据权利要求95至98中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物Il7ra基因是内源性Il7ra基因。
100.根据权利要求84所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠,并且所述人源化Il7ra基因包括:(i)小鼠Il7ra基因的包括小鼠Il7ra的5'UTR和编码信号肽的序列的外显子1的一部分;(ii)人IL7RA基因的编码成熟人IL7RA蛋白的第一氨基酸的外显子1中的密码子至所述人IL7RA基因的外显子5;以及(iii)所述小鼠Il7ra基因的外显子6至外显子8。
101.根据权利要求84至100中任一项所述的经基因修饰的啮齿动物,其中所述人源化Il7ra基因与啮齿动物Il7ra启动子可操作地连接。
102.根据权利要求101所述的经基因修饰的啮齿动物,其中所述啮齿动物Il7ra启动子是内源性啮齿动物Il7ra启动子。
103.根据权利要求84至101中任一项所述的经基因修饰的啮齿动物,其中所述人源化Il7ra基因位于内源性啮齿动物Il7ra基因座处。
104.根据权利要求102所述的经基因修饰的啮齿动物,其中所述人源化Il7ra基因是由于内源性啮齿动物Il7ra基因座处的啮齿动物Il7ra基因组DNA被人IL7RA核酸置换而形成的。
105.根据权利要求103所述的经基因修饰的啮齿动物,其中所述人源化Il7ra基因是由于包括至少编码所述内源性啮齿动物Il7ra蛋白的大部分胞外结构域的外显子序列的啮齿动物基因组DNA被至少编码所述人IL7RA蛋白的大部分胞外结构域的所述人IL7RA核酸置换而形成的。
106.根据权利要求105所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠,并且其中被置换的小鼠基因组DNA包括内源性小鼠Il7ra基因的编码成熟小鼠Il7ra蛋白的第一氨基酸的外显子1中的密码子至外显子5,并且人基因组DNA包括人IL7RA基因的编码所述成熟人IL7RA蛋白的第一氨基酸的外显子1中的密码子至外显子5。
107.根据权利要求84至105中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物对所述人源化Il7ra基因是纯合的。
108.根据权利要求84至105中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物对所述人源化Il7ra基因是杂合的。
109.根据权利要求84至107中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物表达所述人源化Il7ra多肽。
110.根据权利要求84至108中任一项所述的经基因修饰的啮齿动物,其基因组进一步包括位于内源性啮齿动物Tslp基因座处的人源化Tslp基因、位于内源性啮齿动物Tslpr基因座处的人源化Tslpr基因或其组合。
111.根据权利要求84至109中任一项所述的经基因修饰的啮齿动物,其中所述啮齿动物是小鼠或大鼠。
112.一种分离的啮齿动物组织或细胞,其基因组包括人源化Il7ra基因,所述人源化Il7ra基因包括啮齿动物Il7ra核酸序列和人IL7RA核酸序列,其中所述人源化Il7ra基因编码人源化Il7ra多肽,所述人源化Il7ra多肽包括与人IL7RA蛋白的胞外结构域基本上相同的胞外结构域。
113.根据权利要求111所述的分离的啮齿动物组织或细胞,其中所述人源化Il7ra多肽包括与人IL7RA蛋白的胞外结构域具有至少95%同一性的胞外结构域。
114.根据权利要求111或112所述的分离的啮齿动物组织或细胞,其中所述啮齿动物细胞是啮齿动物胚胎干细胞。
115.根据权利要求111至113中任一项所述的分离的啮齿动物组织或细胞,其中啮齿动物是小鼠或大鼠。
116.一种啮齿动物胚胎,其包括权利要求113的所述啮齿动物胚胎干细胞。
117.一种制备经基因修饰的啮齿动物的方法,所述方法包括:
修饰啮齿动物基因组以包括人源化Il7ra基因,其中所述人源化Il7ra基因包括啮齿动物Il7ra核酸序列和人IL7RA核酸序列,并且编码人源化Il7ra多肽,所述人源化Il7ra多肽包括与人IL7RA蛋白的胞外结构域基本上相同的胞外结构域;以及
制备包括经修饰的啮齿动物基因组的啮齿动物。
118.根据权利要求116所述的方法,其中所述人源化Il7ra多肽包括与人IL7RA蛋白的胞外结构域具有至少95%同一性的胞外结构域。
119.根据权利要求116或117所述的方法,其中所述修饰包括:
将包括所述人IL7RA核酸序列的核酸分子引入到啮齿动物胚胎干(ES)细胞的基因组中;
获得啮齿动物ES细胞,其中所述人IL7RA核酸序列已整合到内源性Il7ra基因座中以置换啮齿动物Il7ra基因组DNA,由此形成所述人源化Il7ra基因;以及
由所获得的啮齿动物ES细胞产生啮齿动物。
120.根据权利要求118所述的方法,其中所述核酸分子进一步包括侧接所述人IL7RA核酸序列的5'同源臂和3'同源臂,并且其中所述5'同源臂和所述3'同源臂与侧接待置换的啮齿动物Il7ra基因组DNA的内源性啮齿动物基因座处的核酸序列同源。
121.根据权利要求118或119所述的方法,其中所述人源化Il7ra基因在内源性啮齿动物Tslpr基因座处与内源性啮齿动物Il7ra启动子可操作地连接。
122.根据权利要求116至120中任一项所述的方法,其中所述人IL7RA核酸序列至少编码所述人IL7RA蛋白的大部分胞外结构域。
123.根据权利要求116至121中任一项所述的方法,其中所述啮齿动物是小鼠或大鼠。
124.一种靶向核酸构建体,其包括
将整合到内源性啮齿动物Il7ra基因座处的啮齿动物Il7ra基因中的人IL7RA核酸序列,所述人IL7RA核酸序列侧接有与所述啮齿动物Il7ra基因座处的核苷酸序列同源的5'核苷酸序列和3'核苷酸序列,
其中所述人IL7RA核酸序列整合到所述啮齿动物Il7ra基因中使得啮齿动物Il7ra基因组DNA被所述人IL7RA核酸序列置换,由此形成人源化Il7ra基因,并且
其中所述人IL7RA核酸序列编码人IL7RA蛋白的大部分胞外结构域。
125.根据权利要求123所述的靶向核酸,其中啮齿动物是小鼠或大鼠。
126.根据权利要求1至27、42至69或84至110中任一项所述的经基因修饰的啮齿动物,其进一步包括人源化Sirpα基因,其中所述啮齿动物对RAG2-/-和IL2RG-/-是纯合的。
127.根据权利要求125所述的经基因修饰的啮齿动物,其中所述啮齿动物进一步包括人源化Tpo基因和/或人源化GM-CSF/IL-3基因座。
128.一种根据权利要求1至27、42至69、84至110或125至126中任一项所述的经基因修饰的啮齿动物在制备过敏性疾病(例如,哮喘或皮肤炎症)或癌症的啮齿动物模型中的用途。
129.一种测试用于治疗过敏性病状的候选药剂的方法,所述方法包括:
诱导根据权利要求1至27、42至69、84至110或125至126中任一项所述的经基因修饰的啮齿动物的过敏性病状;
向所述经基因修饰的啮齿动物施用候选药剂;以及
确定所述候选药剂是否抑制所述经基因修饰的啮齿动物的所述过敏性病状。
130.一种测试用于治疗癌症的候选药剂的方法,所述方法包括:
将人癌细胞移植到根据权利要求1至27、42至69、84至110或125至126中任一项所述的经基因修饰的啮齿动物体内;
向所述经基因修饰的啮齿动物施用候选药剂;以及
确定所述候选药剂是否抑制所述经基因修饰的啮齿动物体内的癌细胞的生长。
131.根据权利要求128或129所述的方法,其中所述候选药剂是小分子化合物、核酸或抗体。
132.一种用于产生经基因修饰的啮齿动物细胞的体外方法,所述方法包括
将根据权利要求40或41所述的靶向核酸构建体引入到啮齿动物细胞中,由此将所述人TSLP核酸序列整合到内源性啮齿动物Tslp基因中,使得啮齿动物Tslp基因组DNA被所述人TSLP核酸序列置换以形成人源化Tslp基因,由此产生所述经基因修饰的啮齿动物细胞。
133.根据权利要求131所述的方法,其中所述啮齿动物细胞是啮齿动物ES细胞。
134.一种用于产生经基因修饰的啮齿动物细胞的体外方法,所述方法包括
将根据权利要求82或83所述的靶向核酸构建体引入到啮齿动物细胞中,由此将所述人TSLPR核酸序列整合到内源性啮齿动物Tslpr基因中,使得啮齿动物Tslpr基因组DNA被所述人TSLPR核酸序列置换以形成人源化Tslpr基因,由此产生所述经基因修饰的啮齿动物细胞。
135.根据权利要求133所述的方法,其中所述啮齿动物细胞是啮齿动物ES细胞。
136.一种用于产生经基因修饰的啮齿动物细胞的体外方法,所述方法包括
将根据权利要求123或124所述的靶向核酸构建体引入到啮齿动物细胞中,由此将所述人IL7RA核酸序列整合到内源性啮齿动物Il7ra基因中,使得啮齿动物Il7ra基因组DNA被所述人IL7RA核酸序列置换以形成人源化Il7ra基因,由此产生所述经基因修饰的啮齿动物细胞。
137.根据权利要求135所述的方法,其中所述啮齿动物细胞是啮齿动物ES细胞。
CN202180086511.8A 2020-12-21 2021-12-20 具有人源化tslp基因、人源化tslp受体基因和/或人源化il7ra基因的非人动物 Pending CN116802200A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063128258P 2020-12-21 2020-12-21
US63/128,258 2020-12-21
PCT/US2021/064270 WO2022140221A1 (en) 2020-12-21 2021-12-20 Non-human animals having a humanized tslp gene, a humanized tslp receptor gene, and/or a humanized il7ra gene

Publications (1)

Publication Number Publication Date
CN116802200A true CN116802200A (zh) 2023-09-22

Family

ID=80050757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180086511.8A Pending CN116802200A (zh) 2020-12-21 2021-12-20 具有人源化tslp基因、人源化tslp受体基因和/或人源化il7ra基因的非人动物

Country Status (9)

Country Link
US (1) US20220192165A1 (zh)
EP (1) EP4262374A1 (zh)
JP (1) JP2024500153A (zh)
KR (1) KR20230124973A (zh)
CN (1) CN116802200A (zh)
AU (1) AU2021409632A1 (zh)
CA (1) CA3171455A1 (zh)
IL (1) IL303724A (zh)
WO (1) WO2022140221A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115850442A (zh) * 2021-09-27 2023-03-28 百奥赛图(北京)医药科技股份有限公司 一种tslp和/或tslpr基因人源化的非人动物及其构建方法和应用

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6586251B2 (en) 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US7294754B2 (en) 2004-10-19 2007-11-13 Regeneron Pharmaceuticals, Inc. Method for generating an animal homozygous for a genetic modification
ES2700852T3 (es) 2009-10-06 2019-02-19 Regeneron Pharma Ratones modificados genéticamente e injerto
US8962913B2 (en) * 2012-06-18 2015-02-24 Regeneron Pharmaceuticals, Inc. Humanized IL-7 rodents
ES2904803T3 (es) 2013-02-20 2022-04-06 Regeneron Pharma Modificación genética de ratas
ES2699578T3 (es) 2013-04-16 2019-02-11 Regeneron Pharma Modificación direccionada del genoma de rata
DK3175706T3 (en) 2013-09-23 2019-03-04 Regeneron Pharma Non-human animals with a humanized signal regulatory protein gene
NO2785538T3 (zh) * 2014-05-07 2018-08-04
WO2018177441A1 (en) 2017-03-31 2018-10-04 Beijing Biocytogen Co., Ltd GENETICALLY MODIFIED NON-HUMAN ANIMAL WITH HUMAN OR CHIMERIC SIRPα
WO2020008066A1 (en) * 2018-07-06 2020-01-09 Institut Pasteur Human immune system mouse model
CN111808882B (zh) * 2020-09-01 2020-12-29 北京百奥赛图基因生物技术有限公司 Il7r基因人源化改造的动物模型的构建方法及其应用

Also Published As

Publication number Publication date
WO2022140221A1 (en) 2022-06-30
US20220192165A1 (en) 2022-06-23
IL303724A (en) 2023-08-01
KR20230124973A (ko) 2023-08-28
EP4262374A1 (en) 2023-10-25
JP2024500153A (ja) 2024-01-04
AU2021409632A1 (en) 2023-06-29
CA3171455A1 (en) 2022-06-30

Similar Documents

Publication Publication Date Title
AU2020250262B2 (en) Compositions for modulating tau expression
KR101774526B1 (ko) 헌팅틴 발현의 조절
DK2859793T3 (en) Humanized IL-7 rodents
AU2021200783B2 (en) Mitigating tissue damage and fibrosis via latent transforming growth factor beta binding protein (LTBP4)
AU2023202878A1 (en) Methods for targeted insertion of DNA in genes
KR20220012230A (ko) 스플라이싱 및 번역을 조절하기 위한 방법 및 조성물
KR20120099363A (ko) 탯줄 혈액으로부터의 유도 만능 줄기 세포의 생성
TW202311530A (zh) 用於減少tau表現之組合物及方法
KR20210088605A (ko) 유전 장애에 대한 유전자 발현을 변경하는 방법
AU2016325030A1 (en) Novel biomarkers and methods of treating cancer
KR20130123357A (ko) 저산소증과 관련된 질환의 진단방법 및 키트
WO2006022629A1 (en) Methods of identifying risk of type ii diabetes and treatments thereof
CN116802200A (zh) 具有人源化tslp基因、人源化tslp受体基因和/或人源化il7ra基因的非人动物
KR20210116480A (ko) 기분 장애의 설치류 모델
CN111278468A (zh) 用于脂肪营养不良的自体细胞疗法的人脂肪组织祖细胞
KR102647919B1 (ko) App 돌연변이 세포 및 이의 이용
US20040138441A1 (en) Novel gene functionally related to dyslexia
US20030219787A1 (en) Novel human gene functionally related to dyslexia
CN115362255A (zh) 用无七之子2(sos2)抑制剂治疗眼科疾患
JP2002355069A (ja) 新規な遺伝的多型による慢性関節リウマチの検査方法
KR20240093742A (ko) 타우 발현 조절 조성물

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination