CN109068621A - 具有人源化的tmprss基因的啮齿类动物 - Google Patents

具有人源化的tmprss基因的啮齿类动物 Download PDF

Info

Publication number
CN109068621A
CN109068621A CN201780010404.0A CN201780010404A CN109068621A CN 109068621 A CN109068621 A CN 109068621A CN 201780010404 A CN201780010404 A CN 201780010404A CN 109068621 A CN109068621 A CN 109068621A
Authority
CN
China
Prior art keywords
gene
rodent
humanization
tmprss
people
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780010404.0A
Other languages
English (en)
Other versions
CN109068621B (zh
Inventor
L.珀塞尔恩甘博
A.O.姆吉卡
Y.唐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ray Jenner Pharmaceuticals
Regeneron Pharmaceuticals Inc
Original Assignee
Ray Jenner Pharmaceuticals
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ray Jenner Pharmaceuticals filed Critical Ray Jenner Pharmaceuticals
Publication of CN109068621A publication Critical patent/CN109068621A/zh
Application granted granted Critical
Publication of CN109068621B publication Critical patent/CN109068621B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Knock-in vertebrates, e.g. humanised vertebrates
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0603Embryonic cells ; Embryoid bodies
    • C12N5/0606Pluripotent embryonic cells, e.g. embryonic stem cells [ES]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0337Animal models for infectious diseases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10332Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Environmental Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gynecology & Obstetrics (AREA)
  • Reproductive Health (AREA)
  • Developmental Biology & Embryology (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了经遗传修饰的啮齿类动物例如小鼠和大鼠,以及用于制备和使用其的方法和组合物。啮齿类动物包含至少一种内源性啮齿类动物Tmprss基因(例如内源性啮齿类动物Tmprss2、Tmprss4或Tmprss11d基因)的人源化。

Description

具有人源化的TMPRSS基因的啮齿类动物
相关申请的交叉引用
本申请要求于2016年2月29日提交的美国临时申请号62/301,023的优先权权益,所述美国临时申请的全部内容以引用的方式并入本文。
序列表以引用方式并入
275KB的ASCII文本文件中的序列表命名为33093_10234US01_SequenceListing.txt,于2017年2月13日创建,并且经由EFS-Web提交给美国专利和商标局(United States Patent and Trademark Office),其以引用的方式并入本文。
背景技术
II型跨膜丝氨酸蛋白酶是特征在于N末端跨膜结构域的蛋白酶家族(Bugge等人,J.Biol.Chem.284(35):23177-23181,2009;Hooper等人,J.Biol.Chem.272(2):857-860,2001)。该家族的所有成员都作为单链酶原表达,并且通过在高度保守的R/(IV)VGG基序内切割而被蛋白酶解激活。家族中的一个成员,跨膜蛋白酶,4型丝氨酸(TMPRSS4)已显示激活上皮钠通道(ENaC),其调节跨越上皮细胞的钠和水通量(Guipponi等人2002Hum.Mol.Genet.11:2829;Vuagniaux等人2002J.Gen.Physiol.120:191)。TMPRSS4的蛋白酶解激活物是未知的;然而,迄今为止的数据提示该蛋白质是自动激活的。当被激活时,TMPRSS4的催化结构域经由二硫键保持与蛋白质的N末端结合。TMPRSS4、TMPRSS2和TMPRSS11D(或人气道胰蛋白酶样蛋白酶;“HAT”)已在体外显示切割A型流感血凝素(HA),这是病毒生命周期中的第一个必要步骤。这种切割对于HA的活性是必要的,因为蛋白质作为前体蛋白质(HA0)合成,并且需要切割成HA1和HA2用于活性。在Caco-2细胞中TMPRSS4的RNAi击倒导致病毒传播减少。另外,显示TMPRSS4在感染流感的小鼠的肺中强烈上调( 等人2006J.Virol.80:9896;等人2009Vaccine 27:6324;等人2010J.Virol.84:5604;Bertam等人2010J.Virol.84:10016;Bertam等人2010J.Virol.84:10016; 等人2011J.Virol.85:1554;Bahgat等人2011Virol.J.8:27)。
需要开发体内系统例如感染的啮齿类动物模型,以便鉴定和测试包括抗体的化合物,所述化合物特异性靶向人II型跨膜丝氨酸蛋白酶,用于治疗和预防病毒感染和其它疾病。
发明内容
本发明涵盖期望改造啮齿类动物以提供用于鉴定和开发新治疗剂的体内系统的认识。例如,本发明涵盖具有人源化的Tmprss基因的啮齿类动物期望用于鉴定和开发用于治疗和预防病毒感染的治疗剂的认识。
在一个方面,本发明提供了其基因组含有人源化的Tmprss基因的啮齿类动物,所述人源化的Tmprss基因包括内源性啮齿类动物Tmprss基因的核苷酸序列和同源人TMPRSS基因的核苷酸序列,其中所述人源化的Tmprss基因处于内源性啮齿类动物Tmprss基因的5'调控序列,例如启动子和/或增强子的控制下。
在一些实施例中,本文公开的啮齿类动物中的人源化的Tmprss基因编码人源化的Tmprss蛋白质,其含有的胞外域与人TMPRSS蛋白质的胞外域基本上相同(例如,在序列中至少85%、90%、95%、98%、99%或100%相同)。在一些实施例中,人源化的Tmprss蛋白质含有的细胞质和跨膜部分与内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜部分基本上相同(例如,在序列中至少85%、90%、95%、98%、99%或100%相同)。
在一些实施例中,本文公开的啮齿类动物包含人源化的Tmprss基因,其包括内源性啮齿类动物Tmprss基因的核苷酸序列和同源人TMPRSS基因的核苷酸序列,其中所述同源人TMPRSS基因的核苷酸序列编码的多肽与由同源人TMPRSS基因编码的人TMPRSS蛋白质的胞外域基本上相同(例如,在序列中至少85%、90%、95%、98%、99%或100%相同)。在一些实施例中,本文公开的啮齿类动物含有人源化的Tmprss基因,其包括内源性啮齿类动物Tmprss基因的核苷酸序列和同源人TMPRSS基因的核苷酸序列,其中所述内源性啮齿类动物Tmprss基因的核苷酸序列编码的多肽与由内源性啮齿类动物Tmprss基因编码的内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜部分基本上相同(例如,在序列中至少85%、90%、95%、98%、99%或100%相同)。
在一些实施例中,本文公开的啮齿类动物含有位于内源性啮齿类动物Tmprss基因座处的人源化的Tmprss基因,其来源于内源性啮齿类动物Tmprss基因的连续基因组序列由同源人TMPRSS基因的连续基因组序列的替换。在具体实施例中,插入的同源人TMPRSS基因的连续基因组序列包括编码与由人TMPRSS基因编码的人TMPRSS蛋白质的胞外域基本上相同的胞外域的外显子序列。在一些实施例中,同源人TMPRSS基因的连续基因组序列还包括同源人TMPRSS基因的3'UTR。
在一些实施例中,本文公开的啮齿类动物在内源性啮齿类动物Tmprss基因座处对于人源化的Tmprss基因是杂合的。在其它实施例中,啮齿类动物在内源性啮齿类动物Tmprss基因座处对于人源化的Tmprss基因是纯合的。
在进一步的实施例中,啮齿类动物含有在不同的内源性啮齿类动物Tmprss基因座处的两种或更多种人源化的Tmprss基因,其中每个内源性啮齿类动物Tmprss基因座用分别的同源人TMPRSS基因人源化;例如人源化的Tmprss2、人源化的Tmprss4和人源化的Tmprss11d基因中的两种或更多种。
在一些实施例中,本文公开的啮齿类动物含有人源化的Tmprss2基因,其包括内源性啮齿类动物Tmprss2基因的核苷酸序列和人TMPRSS2基因的核苷酸序列,其中所述人源化的Tmprss2基因处于内源性啮齿类动物Tmprss2基因的启动子的控制下。
在一些实施例中,人源化的Tmprss2基因编码人源化的Tmprss2蛋白质,其含有的胞外域与由人源化中使用的人TMPRSS2基因编码的人TMPRSS2蛋白质的胞外域基本上相同(例如,在序列中至少85%、90%、95%、98%、99%或100%相同)。在一些实施例中,人TMPRSS2蛋白质含有的氨基酸序列与SEQ ID NO:4中所示的氨基酸序列至少85%相同(例如,至少90%、95%、98%、99%或100%相同)。在一些实施例中,人源化的Tmprss2蛋白质含有的胞外域与氨基酸序列基本上相同(例如至少85%、90%、95%、98%、99%或100%相同),所述氨基酸序列由如例如SEQ ID NO:4中所示的人TMPRSS2蛋白质的残基W106至G492或C末端387个氨基酸组成。在一些实施例中,人源化的Tmprss2基因编码人源化的Tmprss2蛋白质,其还含有与由人源化的内源性啮齿类动物Tmprss2基因编码的啮齿类动物Tmprss2蛋白质的细胞质和跨膜部分基本上相同(例如至少85%、90%、95%、98%、99%或100%相同)的细胞质和跨膜部分。示例性的内源性啮齿类动物Tmprss2蛋白质在SEQ ID NO:2中示出。
在一些实施例中,啮齿类动物含有人源化的Tmprss2基因,其包括内源性啮齿类动物Tmprss2基因的核苷酸序列和人TMPRSS2基因的核苷酸序列,其中所述人TMPRSS2基因的核苷酸序列编码的胞外域与由人TMPRSS2基因编码的人TMPRSS2蛋白质的胞外域基本上相同(例如,在序列中至少85%、90%、95%、98%、99%或100%相同)。在具体实施例中,人TMPRSS2基因的核苷酸序列是人TMPRSS2基因的连续基因组序列,其含有人TMPRSS2基因的编码外显子4直到编码外显子13中的终止密码子。在特定实施例中,人TMPRSS2基因的连续基因组序列还含有人TMPRSS2基因的3'UTR。在一些实施例中,包括在人源化的Tmprss2基因中的内源性啮齿类动物Tmprss2基因的核苷酸序列编码的细胞质和跨膜部分与由内源性啮齿类动物Tmprss2基因编码的内源性啮齿类动物Tmprss2蛋白质的细胞质和跨膜部分基本上相同(例如至少85%、90%、95%、98%、99%或100%相同)。
在特定实施例中,人源化的Tmprss2基因含有内源性啮齿类动物Tmprss2基因的编码外显子1-2、以及人TMPRSS2基因的编码外显子4直到编码外显子13,其中所述人源化的Tmprss2基因编码人源化的Tmprss2蛋白质,其含有与由内源性啮齿类动物Tmprss2基因编码的啮齿类动物Tmprss2蛋白质的细胞质和跨膜部分基本上相同的细胞质和跨膜部分,以及与由人TMPRSS2基因编码的人TMPRSS2蛋白质的胞外域基本上相同的胞外域。人源化的Tmprss2基因含有外显子3,其在一些实施例中编码人TMPRSS2基因的外显子3,并且在其它实施例中是内源性啮齿类动物Tmprss2基因的编码外显子3。在一些实施例中,人源化的Tmprss2基因含有外显子3,其包括内源性啮齿类动物Tmprss2基因的编码外显子3的5'部分和人TMPRSS2基因的编码外显子3的3'部分。
在一些实施例中,本文公开的啮齿类动物含有人源化的Tmprss4基因,其包括内源性啮齿类动物Tmprss4基因的核苷酸序列和人TMPRSS4基因的核苷酸序列,其中所述人源化的Tmprss4基因处于内源性啮齿类动物Tmprss4基因的启动子的控制下。
在一些实施例中,人源化的Tmprss4基因编码人源化的Tmprss4蛋白质,其含有的胞外域与由人源化中使用的人TMPRSS4基因编码的人TMPRSS4蛋白质的胞外域基本上相同(例如,在序列中至少85%、90%、95%、98%、99%或100%相同)。在一些实施例中,人TMPRSS4蛋白质含有的氨基酸序列与SEQ ID NO:11中所示的氨基酸序列至少85%相同(例如,至少90%、95%、98%、99%或100%相同)。在一些实施例中,人源化的Tmprss4蛋白质含有的胞外域与氨基酸序列基本上相同(例如至少85%、90%、95%、98%、99%或100%相同),所述氨基酸序列由如例如SEQ ID NO:11中所示的人TMPRSS4蛋白质的残基K54至L437或C末端384个氨基酸组成。在一些实施例中,人源化的Tmprss4基因编码人源化的Tmprss4蛋白质,其还含有与由人源化的内源性啮齿类动物Tmprss4基因编码的啮齿类动物Tmprss4蛋白质的细胞质和跨膜部分基本上相同(例如至少85%、90%、95%、98%、99%或100%相同)的细胞质和跨膜部分。示例性的内源性啮齿类动物Tmprss4蛋白质在SEQ ID NO:9中示出。
在一些实施例中,啮齿类动物含有人源化的Tmprss4基因,其包括内源性啮齿类动物Tmprss4基因的核苷酸序列和人TMPRSS4基因的核苷酸序列,其中所述人TMPRSS4基因的核苷酸序列编码的胞外域与由人TMPRSS4基因编码的人TMPRSS4蛋白质的胞外域基本上相同。在具体实施例中,人TMPRSS4基因的核苷酸序列是含有人TMPRSS4基因的编码外显子4直到编码外显子13中的终止密码子的连续基因组序列。在一些实施例中,包括在人源化的Tmprss4基因中的内源性啮齿类动物Tmprss4基因的核苷酸序列编码的细胞质和跨膜部分与由内源性啮齿类动物Tmprss4基因编码的啮齿类动物Tmprss4蛋白质的细胞质和跨膜部分基本上相同。
在特定实施例中,人源化的Tmprss4基因含有内源性啮齿类动物Tmprss4基因的编码外显子1直到编码外显子3、以及人TMPRSS4基因的编码外显子4直到编码外显子13中的终止密码子。
在一些实施例中,本文公开的啮齿类动物含有人源化的Tmprss11d基因,其包括内源性啮齿类动物Tmprss11d基因的核苷酸序列和人TMPRSS11D基因的核苷酸序列,其中所述人源化的Tmprss11d基因处于内源性啮齿类动物Tmprss11d基因的启动子的控制下。
在一些实施例中,人源化的Tmprss11d基因编码人源化的Tmprss11d蛋白质,其含有的胞外域与由人源化中使用的人TMPRSS11D基因编码的人TMPRSS11D蛋白质的胞外域基本上相同(例如,在序列中至少85%、90%、95%、98%、99%或100%相同)。在一些实施例中,人TMPRSS11D蛋白质含有的氨基酸序列与SEQ ID NO:18中所示的氨基酸序列至少85%相同(例如,至少90%、95%、98%、99%或100%相同)。在一些实施例中,人源化的Tmprss11d蛋白质含有的胞外域与氨基酸序列基本上相同(例如至少85%、90%、95%、98%、99%或100%相同),所述氨基酸序列由如例如SEQ ID NO:18中所示的人TMPRSS11D蛋白质的残基A42-I418或C末端377个氨基酸组成。在一些实施例中,人源化的Tmprss11d基因编码人源化的Tmprss11d蛋白质,其还含有与由人源化的内源性啮齿类动物Tmprss11d基因编码的内源性啮齿类动物Tmprss11d蛋白质的细胞质和跨膜部分基本上相同(例如至少85%、90%、95%、98%、99%或100%相同)的细胞质和跨膜部分。示例性的内源性啮齿类动物Tmprss11d蛋白质在SEQ ID NO:16中示出。
在一些实施例中,啮齿类动物含有人源化的Tmprss11d基因,其包括内源性啮齿类动物Tmprss11d基因的核苷酸序列和人TMPRSS11D基因的核苷酸序列,其中所述人TMPRSS11D基因的核苷酸序列编码的胞外域与由人TMPRSS11D基因编码的人TMPRSS11D蛋白质的胞外域基本上相同。在具体实施例中,人TMPRSS11d基因的核苷酸序列是含有人TMPRSS11D基因的编码外显子3直到编码外显子10中的终止密码子的连续基因组序列。在特定实施例中,人TMPRSS11D基因的连续基因组序列还含有人TMPRSS11D基因的3'UTR。在一些实施例中,包括在人源化的Tmprss11d基因中的内源性啮齿类动物Tmprss11d基因的核苷酸序列编码的细胞质和跨膜部分与由内源性啮齿类动物Tmprss11d基因编码的啮齿类动物Tmprss11d蛋白质的细胞质和跨膜部分基本上相同。
在特定实施例中,人源化的Tmprss11d基因含有内源性啮齿类动物Tmprss11d基因的编码外显子1-2、以及人TMPRSS11D基因的编码外显子3直到编码外显子13。
在另一个方面,本发明提供了分离的啮齿类动物细胞或组织,其基因组含有如本文所述的人源化的Tmprss基因。在具体实施例中,人源化的Tmprss基因选自人源化的Tmprss2基因、人源化的Tmprss4基因和人源化的Tmprss11d基因。
在另外一个方面,本发明提供了啮齿类动物胚胎干细胞,其基因组含有如本文所述的人源化的Tmprss基因。在具体实施例中,人源化的Tmprss基因选自人源化的Tmprss2基因、人源化的Tmprss4基因和人源化的Tmprss11d基因。
在另一个方面,本发明还提供了由本文公开的啮齿类动物胚胎干细胞生成的啮齿类动物胚胎。
在一个方面,本发明提供了适用于人源化啮齿类动物中的内源性Tmprss基因的核酸载体。在一些实施例中,核酸载体包括人Tmprss核酸序列(例如,编码人TMPRSS蛋白质的胞外域的人基因组DNA),侧面为5'同源臂和3'同源臂。5'和3'同源臂是核酸序列,其分别位于人Tmprss核酸序列的5'和3',并且与啮齿类动物中的内源性Tmprss基因座处的基因组DNA序列同源,其侧接编码同源啮齿类动物Tmprss蛋白质的胞外域的啮齿类动物基因组DNA。因此,5'和3'同源臂能够介导同源重组,以及编码同源啮齿类动物Tmprss蛋白质的胞外域的啮齿类动物基因组DNA由人Tmprss核酸序列的替换,以形成如本文所述的人源化的Tmprss基因。
在一个进一步方面,本发明涉及提供其基因组含有人源化的Tmprss基因的啮齿类动物的方法。该方法包括修饰啮齿类动物的基因组,以用同源人TMPRSS基因的基因组序列替换内源性啮齿类动物Tmprss基因的基因组序列,以形成人源化的Tmprss基因。
在一些实施例中,本发明提供了制备具有人源化的Tmprss基因的啮齿类动物(例如小鼠或大鼠)的方法,所述方法包括以下步骤:(a)将基因组片段插入啮齿类动物胚胎干细胞中的内源性啮齿类动物Tmprss基因座内,其中所述基因组片段含有同源人TMPRSS基因的核苷酸序列,从而形成人源化的Tmprss基因(例如本文所述的那些);(b)获得包含(a)的人源化的Tmprss基因的啮齿类动物胚胎干细胞;和(c)使用(b)的啮齿类动物胚胎干细胞产生啮齿类动物。
在一些实施例中,人源化的Tmprss基因选自人源化的Tmprss2基因、人源化的Tmprss4基因和人源化的Tmprss11d基因。在各种实施例中,人源化的Tmprss基因编码人源化的Tmprss蛋白质,其含有的胞外域与由用于人源化的人TMPRSS基因编码的人TMPRSS蛋白质的胞外域基本上相同(例如,在序列中至少90%、95%、98%、99%或100%相同)。在具体实施例中,人源化的Tmprss蛋白质含有选自人TMPRSS2蛋白质、人TMPRSS4蛋白质和人TMPRSS11D蛋白质的人TMPRSS蛋白质的胞外域。在具体实施例中,人源化的Tmprss蛋白质还含有与由人源化的内源性啮齿类动物Tmprss基因编码的啮齿类动物Tmprss蛋白质的细胞质和跨膜部分基本上相同的细胞质和跨膜部分。
在另一个方面,本发明提供了使用本文公开的啮齿类动物来评价化合物(例如,特异性靶向人TMPRSS蛋白质的候选抑制剂)在治疗流感病毒感染中的治疗功效的方法。该方法可包括以下步骤:提供本文所述的啮齿类动物,向啮齿类动物施用流感病毒和候选化合物;并且监测啮齿类动物中的流感病毒感染的存在和严重性,以确定药物候选物的治疗功效。
在一些实施例中,流感病毒在化合物之前施用于啮齿类动物。在其它实施例中,流感病毒在化合物之后施用于啮齿类动物。
在一些实施例中,候选化合物是对于人TMPRSS蛋白质特异性的抗体或其抗原结合片段。在具体实施例中,候选化合物是对于选自人TMPRSS2蛋白质、人TMPRSS4蛋白质和人TMPRSS11D蛋白质的人TMPRSS蛋白质特异的抗体或其抗原结合片段。
本发明的其他特征、目的和优点在以下详细描述中是显而易见的。然而,应当理解,详细描述虽然指示本发明的实施例,但其仅通过举例说明的方式给出,而不是限制性的。根据详细描述,本发明的范围内的各种变化和修改对于本领域技术人员而言将变得明显。
附图说明
本文中包括的由以下各图组成的附图仅用于举例说明目的而非用于限制。
图1A-1D。用于人源化小鼠Tmprss2的示例性策略。
图1A显示了未按比例绘制的小鼠Tmprss2和人TMPRSS2基因的基因组组构的图解。外显子由跨越基因组序列放置的细条代表,其中两个基因的第一个编码外显子由在外显子上方的起始密码子"ATG"指示,并且最后一个编码外显子由在外显子上方“终止”密码子指示。指出了待缺失的约25,291bp的小鼠基因组片段和待插入的约25,091bp的人基因组片段。指出了在实例1中描述的测定中使用的探针的位置。TM:跨膜结构域;SRCR:清道夫受体富含半胱氨酸样结构域;LDLRa:低密度脂蛋白受体A类。
图1B示出了未按比例绘制的用于内源性小鼠Tmprss2基因的人源化的示例性修饰的BAC载体连同连接序列(SEQ ID NO:22、23和24)。
图1C示出了未按比例绘制的在新霉素盒已缺失后的人源化的Tmprss2等位基因连同连接序列(SEQ ID NO:22和25)。
图1D阐述了人TMPRSS2蛋白质(SEQ ID NO:4)、小鼠Tmprss2蛋白质(SEQ ID NO:2)和人源化的Tmprss2蛋白质(“7010突变蛋白质”)(SEQ ID NO:7)的序列比对。
图2A-2D。用于人源化小鼠Tmprss4的示例性策略。
图2A显示了未按比例绘制的小鼠Tmprss4和人TMPRSS4基因的基因组组构的图解。外显子由跨越基因组序列放置的细条代表,其中两个基因的第一个外显子(也是第一个编码外显子)由在外显子上方的起始密码子"ATG"指示,并且最后一个编码外显子由在外显子上方“终止”密码子指示。指出了待缺失的约11,074bp的小鼠基因组片段和待插入的约14,963bp的人基因组片段。指出了在实例2中描述的测定中使用的探针的位置。TM:跨膜结构域;SRCR:清道夫受体富含半胱氨酸样结构域;LDLRa:低密度脂蛋白受体A类。
图2B示出了未按比例绘制的用于内源性小鼠Tmprss4基因的人源化的示例性修饰的BAC载体连同连接序列(SEQ ID NO:38、39和40)。
图2C示出了未按比例绘制的在新霉素盒已缺失后的人源化的Tmprss4等位基因连同连接序列(SEQ ID NO:41和40)。
图2D阐述了人TMPRSS4蛋白质(SEQ ID NO:11)、小鼠Tmprss4蛋白质(SEQ ID NO:9)和人源化的Tmprss4蛋白质(“7224突变蛋白质”)(SEQ ID NO:14)的序列比对。
图3A-3D。用于人源化小鼠Tmprss11d的示例性策略。
图3A显示了未按比例绘制的小鼠Tmprss11d和人TMPRSS11D基因的基因组组构的图解。外显子由跨越基因组序列放置的细条代表,其中两个基因的第一个外显子(也是第一个编码外显子)由在外显子上方的起始密码子"ATG"指示,并且最后一个编码外显子由在外显子上方“终止”密码子指示。指出了待缺失的约35,667bp的小鼠基因组片段和待插入的约33,927bp的人基因组片段。指出了在实例3中描述的测定中使用的探针的位置。TM:跨膜结构域;SEA:在海胆精子蛋白、肠激酶和集聚蛋白中发现的结构域。
图3B示出了未按比例绘制的用于内源性小鼠Tmprss11d基因的人源化的示例性修饰的BAC载体连同连接序列(SEQ ID NO:57、58和59)。
图3C示出了未按比例绘制的在新霉素盒已缺失后的人源化的Tmprss11等位基因连同连接序列(SEQ ID NO:57和60)。
图3D阐述了人TMPRSS11D蛋白质(SEQ ID NO:18)、小鼠Tmprss11d蛋白质(SEQ IDNO:16)和人源化的Tmprss11d蛋白质(“7226突变蛋白质”)(SEQ ID NO:21)的序列比对。
图4描述了实验结果,其显示了MAID7225 HumInTMPRSS4小鼠在其对用高剂量的严重A型流感H1N1或重度小鼠适应的H3N2攻击的敏感性方面没有差异。与野生型小鼠(浅灰色方块,虚线)相比,用A/Puerto Rico/08/1934(H1N1)(浅灰色圆圈,虚线)攻击的MAID7225HumIn TMRPSS4小鼠显示相似的存活率。同样地,与野生型小鼠(浅灰色倒三角形,虚线)相比,用A/Aichi/02/1968-X31(H3N2)攻击的MAID7225 HumIn TMRPSS4小鼠(深灰色三角形,虚线)显示相似的存活率。小鼠在第0天时用1150 PFU的A/Puerto Rico/08/1934(H1N1)或10,000 PFU的A/Aichi/02/1968-X31(H3N2)进行IN感染。对照组包括未感染的阴性对照MAID7225 HumIn TMPRSS4和野生型小鼠(黑色菱形,实线)。
具体实施方式
本发明涉及具有编码II型跨膜丝氨酸蛋白酶(或“Tmprss,”用于跨膜蛋白酶/丝氨酸)的人源化基因的经遗传修饰的啮齿类动物(例如小鼠和大鼠)。经遗传修饰的啮齿类动物适用于筛选特异性靶向人TMPRSS分子的候选化合物,用于治疗和预防疾病例如流感病毒感染。相应地,本发明提供了具有人源化的Tmprss基因的经遗传修饰的啮齿类动物,从经遗传修饰的啮齿类动物中分离的细胞和组织,用于制备经遗传修饰的啮齿类动物的方法和组合物,以及经遗传修饰的啮齿类动物用于筛选和测试治疗化合物的用途。下文进一步描述了本发明的各种实施例。
II型跨膜丝氨酸蛋白酶("Tmprss")
II型跨膜丝氨酸蛋白酶,在本文中也称为非人分子的“Tmprss”或人分子的“TMPRSS”(“跨膜蛋白酶/丝氨酸”),是特征在于N末端跨膜结构域和C末端细胞外丝氨酸蛋白酶结构域的蛋白质家族。家族中已鉴定了至少18个成员,所述成员分组为四个亚家族(Bugge等人(2009),同上)。所有成员都共享限定家族的几个共同结构特点,包括(i)短N末端细胞质结构域,(ii)跨膜结构域,和(iii)胞外域,其含有蛋白酶结构域和连接跨膜结构域与蛋白酶结构域的茎区。茎区含有六种不同类型的模块结构结构域的组合:SEA(海胆精子蛋白/肠肽酶/聚集蛋白)域、A组清道夫受体结构域、LDLA(低密度脂A类)结构域、CUB(Cls/Clr海胆胚胎生长因子、骨形态发生蛋白-1)结构域、MAM(甲基多巴/A5抗原/受体蛋白磷酸酶mu)结构域和卷曲结构域(frizzled domain)。参见通过Bugge等人(2009),同上的综述。例如,属于hepsin/TMPRSS亚家族的TMPRSS2和TMPRSS4具有A组清道夫受体结构域,其前面是茎区中的单个LDLA结构域。TMPRSS11D也被称为关于属于HAT/DESC亚家族的人气道胰蛋白酶样蛋白酶的"HAT",具有单个SEA结构域。参见Bugge等人(2009),同上的图1。
II型跨膜丝氨酸蛋白酶最初作为失活的酶原产生,其需要通过在蛋白酶结构域之前的共有激活基序中的碱性氨基酸残基后的切割而活化。一些活化的蛋白酶由于前结构域和蛋白酶结构域之间的二硫键而保持膜结合。细胞外结构域对于这些蛋白酶的细胞定位、激活、抑制和/或底物特异性视为关键的(Bugge等人(2009),同上;Szabo等人,Int.J.Biochem.Cell Biol.40:1297-1316(2008))。
各种生物化学和病理生理学信息已对于II型跨膜丝氨酸蛋白酶的成员得到记录。TMPRSS2、TMPRSS4和TMPRSS11D已在体外显示切割A型流感血凝素(HA),这是病毒生命周期中的第一个必要步骤。具有本文公开的人源化的Tmprss基因的经遗传修饰的啮齿类动物提供了有用的体内系统,其允许彻底理解TMPRSS分子的生物学功能,以及筛选特异性靶向人TMPRSS分子的治疗化合物。
在本申请中提供了示例性Tmprss序列,包括小鼠、人和人源化的Tmprss核酸和蛋白质序列,并且在下表中概括。在实例部分中描述的测定中使用的引物和探针序列以及示例性人源化Tmprss等位基因的插入连接序列也包括在该表中。
序列的概括描述
人源化的Tmprss啮齿类动物
在一个方面,本发明提供了在种系中含有编码人源化的Tmprss蛋白质的人源化的Tmprss基因的啮齿类动物。
当在核酸或蛋白质的上下文中使用时,术语“人源化”指这样的核酸或蛋白质,其结构(即,核苷酸或氨基酸序列)包括与啮齿类动物中天然发现的特定基因或蛋白质的结构基本上或同一地对应的部分,并且还包括与在相关啮齿类动物基因或蛋白质中发现的部分不同,而是与相应的人基因或蛋白质中发现的结构更紧密地或同一地对应的部分。含有人源化基因或表达人源化蛋白质的啮齿类动物是“人源化”啮齿类动物。
在一些实施例中,本发明的啮齿类动物选自小鼠、大鼠和仓鼠。在一些实施例中,本发明的啮齿类动物选自超家族鼠总科。在一些实施例中,本发明的经遗传修饰的啮齿类动物来自选自以下的科:丽仓鼠科(Calomys cidae)(例如,鼠样仓鼠)、仓鼠科(Cricetidae)(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠科(Muridae)(真小鼠和大鼠、沙鼠、棘鼠、冠鼠)、马岛鼠科(Nesomyidae)(攀鼠、岩鼠、具尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(Platacanthomyidae)(例如多刺睡鼠)和鼹形鼠科(Spalacidae)(例如鼹鼠、竹鼠和鼢鼠)。在某些实施例中,本发明的经遗传修饰的啮齿类动物选自真小鼠或大鼠(鼠科)、沙鼠、棘鼠和冠鼠。在某些实施例中,本发明的经遗传修饰的小鼠是来自鼠科的成员。
在一些实施例中,本文公开的啮齿类动物在基因组中含有人源化的Tmprss基因,其包括内源性啮齿类动物Tmprss基因的核苷酸序列和人TMPRSS基因的核苷酸序列,其中所述内源性啮齿类动物Tmprss基因的核苷酸序列和人TMPRSS基因的核苷酸序列彼此可操作地连接,使得人源化的Tmprss基因编码Tmprss蛋白质,并且处于内源性啮齿类动物Tmprss基因的5'调控元件例如启动子和/或增强子的控制下。
本发明特别涉及对等的人源化(like-for-like humanization);换言之,内源性啮齿类动物Tmprss基因的核苷酸序列与同源人TMPRSS基因的核苷酸序列可操作地连接,以形成人源化基因。例如,在一些实施例中,内源性啮齿类动物Tmprss2基因的核苷酸序列与人TMPRSS2基因的核苷酸序列可操作地连接,以形成人源化的Tmprss2基因。在其它实施例中,内源性啮齿类动物Tmprss4基因的核苷酸序列与人TMPRSS4基因的核苷酸序列可操作地连接,以形成人源化的Tmprss4基因。在另外其它实施例中,内源性啮齿类动物Tmprss11d基因的核苷酸序列与人TMPRSS11D基因的核苷酸序列可操作地连接,以形成人源化的Tmprss11d基因。
在一些实施例中,本发明的经遗传修饰的啮齿类动物在其基因组中含有人源化的Tmprss基因,其中所述人源化的Tmprss基因编码人源化的Tmprss蛋白质,其含有与人TMPRSS蛋白质的胞外域基本上相同的胞外域。术语“胞外域”指延伸到细胞膜外的跨膜蛋白质的部分,即跨膜蛋白质的细胞外部分。TMPRSS分子的胞外域包括蛋白酶结构域和连接跨膜结构域与蛋白酶结构域的茎区。在一些实施例中,“与人TMPRSS蛋白质的胞外域基本上相同”的胞外域或多肽,意指在序列中与人TMPRSS蛋白质的胞外域至少85%、90%、95%、95%、99%或100%相同的多肽;在一些实施例中,与人TMPRSS蛋白质的胞外域相差不超过10、9、8、7、6、5、4、3、2或1个氨基酸的多肽;在一些实施例中,例如通过在胞外域的N末端或C末端处缺乏氨基酸或者具有另外的氨基酸,仅在胞外域的N末端或C末端处与人TMPRSS蛋白质的胞外域不同的多肽;以及在一些实施例中,其基本上是人TMPRSS蛋白质的胞外域的多肽。人TMPRSS蛋白质的“基本上胞外域”意指与胞外域相同的多肽,或通过在N末端或C末端处缺少1-5个(即1、2、3、4或5个)氨基酸或具有另外的1-5个氨基酸而与胞外域不同的多肽。
在一些实施例中,人源化的Tmprss基因编码人源化的Tmprss蛋白质,其还含有与内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜部分基本上相同的细胞质和跨膜部分。在一些实施例中,“与内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜部分基本上相同”的细胞质和跨膜部分或多肽意指与内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜部分在序列中至少85%、90%、95%、95%、99%或100%相同的多肽;在一些实施例中,与内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜部分相差不超过10、9、8、7、6、5、4、3、2或1个氨基酸的多肽;在一些实施例中,例如通过在跨膜结构域的C末端处缺乏氨基酸或具有另外的氨基酸,仅在C末端处与内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜部分不同的多肽;以及在一些实施例中,由内源性啮齿类动物Tmprss蛋白质的细胞质结构域和基本上跨膜结构域组成的多肽。内源性啮齿类动物Tmprss蛋白质的“基本上跨膜结构域”意指与跨膜结构域相同的多肽,或通过在C末端处缺少1-5个氨基酸或具有另外的1-5个氨基酸而与跨膜结构域不同的多肽。
在一些实施例中,经遗传修饰的啮齿类动物的基因组中的人源化的Tmprss基因包括内源性啮齿类动物Tmprss基因的核苷酸序列和同源人TMPRSS基因的核苷酸序列,其中所述同源人TMPRSS基因的核苷酸序列编码的多肽与由人TMPRSS基因编码的人TMPRSS蛋白质的胞外域基本上相同。在某些实施例中,人源化的Tmprss基因中的同源人TMPRSS基因的核苷酸序列编码由人TMPRSS基因编码的人TMPRSS蛋白质的胞外域。
在一些实施例中,经遗传修饰的啮齿类动物的基因组中的人源化的Tmprss基因包括内源性啮齿类动物Tmprss基因的核苷酸序列和同源人TMPRSS基因的核苷酸序列,其中所述内源性啮齿类动物Tmprss基因的核苷酸序列编码的多肽与由啮齿类动物Tmprss基因编码的内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜部分基本上相同。在具体实施例中,存在于人源化的Tmprss基因中的内源性啮齿类动物Tmprss基因的核苷酸序列编码由内源性啮齿类动物Tmprss基因编码的内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜结构域。
在一些实施例中,人源化的Tmprss基因来源于在内源性啮齿类动物Tmprss基因座处的内源性啮齿类动物Tmprss基因的核苷酸序列由同源人TMPRSS基因的核苷酸序列的替换。
在一些实施例中,在内源性啮齿类动物Tmprss基因座处的啮齿类动物Tmprss基因的连续基因组序列已被替换为同源人TMPRSS基因的连续基因组序列,以形成人源化的Tmprss基因。
在具体实施例中,插入内源性啮齿类动物Tmprss基因内的人TMPRSS基因的连续基因组序列包括人TMPRSS基因的外显子的全部或部分,所述人TMPRSS基因编码的胞外域与由人TMPRSS基因编码的人TMPRSS蛋白质的胞外域基本上相同。
在某些实施例中,在人源化替换后在内源性啮齿类动物Tmprss基因座处保留并且与插入的连续人TMPRSS基因组序列可操作连接的内源性啮齿类动物Tmprss基因的基因组序列编码的细胞质和跨膜部分与由内源性啮齿类动物Tmprss基因编码的内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜部分基本上相同。
在其中内源性Tmprss蛋白质和人TMPRSS蛋白质共享在跨膜结构域和胞外域之间的接头附近的共同氨基酸的情况下,可能不需要插入精确地编码人TMPRSS蛋白质的胞外域的人TMPRSS基因组序列。能够插入人TMPRSS基因的稍微更长或更短的基因组序列,其基本上编码人TMPRSS蛋白质的胞外域,其可操作地连接至编码内源性啮齿类动物Tmprss蛋白质的细胞质结构域和基本上跨膜结构域的内源性啮齿类动物Tmprss基因的基因组序列,使得由所得到的人源化的Tmprss基因编码的人源化的Tmprss蛋白质包括与人TMPRSS蛋白质的胞外域相同的胞外域,以及与内源性啮齿类动物Tmprss蛋白质的跨膜结构域相同的跨膜结构域。
在一些实施例中,包括在人源化的Tmprss基因中的人TMPRSS基因的核苷酸序列还包括人TMPRSS基因的3'非翻译区("UTR")。在某些实施例中,除人TMPRSS基因的3'UTR之外,人源化的Tmprss基因还包括在人TMPRSS 3'UTR之后,来自人TMPRSS基因基因座的另外的人基因组序列。另外的人基因组序列可由在紧邻人TMPRSS基因的3'UTR的下游的人TMPRSS基因基因座中发现的至少10-200bp,例如50bp、75bp、100bp、125bp、150bp、175bp、200bp或更多组成。在其它实施例中,存在于人源化的Tmprss基因中的人TMPRSS基因的核苷酸序列不包括人3’UTR;相反,包括内源性啮齿类动物Tmprss基因的3’UTR,并且紧接着是人源化的Tmprss基因的终止密码子。例如,人源化的Tmprss基因可包括内源性啮齿类动物Tmprss基因的核苷酸序列,所述核苷酸序列含有编码内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜结构域的外显子序列,随后为人TMPRSS基因的核苷酸序列,所述核苷酸序列含有编码人TMPRSS蛋白质的胞外域直到终止密码子的外显子序列,具有紧随终止密码子之后的内源性啮齿类动物Tmprss基因的3’UTR。
在一些实施例中,人源化的Tmprss基因导致啮齿类动物中编码的人源化的Tmprss蛋白质的表达。在一些实施例中,人源化的Tmprss蛋白质以与对照啮齿类动物(例如,不含人源化的Tmprss基因的啮齿类动物)中的配对物啮齿类动物Tmprss蛋白质可比较或基本上相同的模式表达。在一些实施例中,人源化的Tmprss蛋白质以与对照啮齿类动物(例如,不含人源化的Tmprss基因的啮齿类动物)中的配对物啮齿类动物Tmprss蛋白质可比较或基本上相同的水平表达。在某些实施例中,人源化的Tmprss蛋白质在细胞表面处表达且检测到。在某些实施例中,人源化的Tmprss蛋白质或可溶形式(例如脱落的胞外域形式)在啮齿类动物的血清中表达且检测到,例如其水平与对照啮齿类动物中的配对物啮齿类动物Tmprss蛋白质或其可溶形式可比较或基本上相同。在比较人源化的啮齿类动物中的人源化基因或蛋白质与对照啮齿类动物中的内源性啮齿类动物基因或蛋白质的情况下,术语“可比较的”意指待比较的分子或水平可能彼此不相同,但是足够相似以允许两者之间的比较,使得基于观察到的差异或相似性可合理地得出结论;而提及表达水平的术语“基本上相同”意指待比较的水平彼此相差不超过20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%。
在一些实施例中,本发明还提供了如本文所述的来自啮齿类动物的分离的细胞或组织。在一些实施例中,细胞选自树突状细胞、淋巴细胞(例如,B细胞或T细胞)、巨噬细胞和单核细胞。在一些实施例中,组织选自脂肪、膀胱、大脑、乳房、骨髓、眼、心、肠、肾、肝、肺、淋巴结、肌肉、胰腺、血浆、血清、皮肤、脾、胃、胸腺、睾丸、卵子以及它们的组合。
在一些实施例中,本发明提供了啮齿类动物胚胎干细胞,其基因组含有如本文所述的人源化的Tmprss基因。在一些实施例中,啮齿类动物胚胎干细胞是小鼠胚胎干细胞。在其它实施例中,啮齿类动物胚胎干细胞是大鼠胚胎干细胞。如下文进一步描述的,在其基因组中含有人源化的Tmprss基因的啮齿类动物胚胎干细胞可用于制备人源化的啮齿类动物。
在一些实施例中,本文提供的啮齿类动物对于其基因组中的人源化的Tmprss基因是杂合的。在其它实施例中,本文提供的啮齿类动物对于其基因组中的人源化的Tmprss基因是纯合的。
在某些实施例中,啮齿类动物在其基因组中包括多重,即两种或更多种人源化的Tmprss基因。换言之,啮齿类动物中的两种或更多种不同的内源性Tmprss基因座已使用同源人TMPRSS基因的核苷酸序列人源化。例如,啮齿类动物已在选自以下的两个或更多个基因基因座处人源化:Tmprss2、Tmprss4和Tmprss11d。
下文还描述了示例性的人源化的Tmprss2啮齿类动物(例如小鼠)、人源化的Tmprss4啮齿类动物(例如小鼠)和人源化的Tmprss11d啮齿类动物(例如小鼠)。
人源化的Tmprss2啮齿类动物
在一些实施例中,本发明提供了其基因组含有人源化的Tmprss2基因的啮齿类动物,所述人源化的Tmprss2基因包括内源性啮齿类动物Tmprss2基因的核苷酸序列和人TMPRSS2基因的核苷酸序列,并且处于内源性啮齿类动物Tmprss2基因的5'调控元件,例如启动子和/或增强子的控制下。啮齿类动物的例子包括小鼠和大鼠。
在一些实施例中,人源化的Tmprss2基因编码人源化的Tmprss2蛋白质,其含有与人TMPRSS2蛋白质的胞外域基本上相同的胞外域。
在具体实施例中,人TMPRSS2蛋白质具有与SEQ ID NO:4中所示的氨基酸序列具有至少85%、90%、95%、98%、99%或100%同一性的氨基酸序列。
在一些实施例中,人源化的Tmprss2蛋白质含有人TMPRSS2蛋白质的C末端387个氨基酸,例如人TMPRSS2蛋白质的氨基酸106至492。在一些实施例中,人源化的Tmprss2蛋白质含有与由SEQ ID NO:4的W106至G492组成的氨基酸序列基本上相同的胞外域。在具体实施例中,人源化的Tmprss2蛋白质含有与由SEQ ID NO:4的W106至G492组成的氨基酸序列具有至少85%、90%、95%、98%、99%或100%同一性的胞外域;与由SEQ ID NO:4的W106至G492组成的氨基酸序列相差不超过10、9、8、7、6、5、4、3、2或1个氨基酸的胞外域;或仅在胞外域的N末端或C末端处与由SEQ ID NO:4的W106至G492组成的氨基酸序列不同的胞外域,例如在N末端或C末端处缺少1-5个氨基酸或具有另外的1-5个氨基酸。
在一些实施例中,人源化的Tmprss2蛋白质还含有与内源性啮齿类动物Tmprss2蛋白质的细胞质和跨膜部分基本上相同的细胞质和跨膜部分。在一些实施例中,人源化的Tmprss2蛋白质还包括内源性啮齿类动物Tmprss2蛋白质的跨膜结构域和细胞质结构域。
在具体实施例中,人源化的Tmprss2蛋白质含有内源性啮齿类动物Tmprss2蛋白质的跨膜结构域和细胞质结构域,以及人TMPRSS2蛋白质的胞外域。在特定实施例中,人源化的Tmprss2基因编码具有如SEQ ID NO:7中所示的氨基酸序列的人源化的Tmprss2蛋白质。
在一些实施例中,人源化的Tmprss2基因来源于在内源性啮齿类动物Tmprss2基因座处的内源性啮齿类动物Tmprss2基因的核苷酸序列由人TMPRSS2基因的核苷酸序列的替换。
在一些实施例中,在内源性啮齿类动物Tmprss2基因座处的内源性啮齿类动物Tmprss2基因的连续基因组序列已被替换为人TMPRSS2基因的连续基因组序列,以形成人源化的Tmprss2基因。
在具体实施例中,插入内源性啮齿类动物Tmprss2基因内的人TMPRSS2基因的连续基因组序列包括外显子序列,即人TMPRSS2基因的外显子的全部或部分,所述人TMPRSS2基因编码的胞外域与由人TMPRSS2基因编码的人TMPRSS2蛋白质的胞外域基本上相同。在其中内源性Tmprss2蛋白质和人TMPRSS2蛋白质共享在跨膜结构域和胞外域的接头附近的共同氨基酸的情况下,可能不需要插入精确地编码人TMPRSS2蛋白质的胞外域的人TMPRSS2基因组序列,并且能够使用稍微更长或更短的人TMPRSS2基因组序列,其基本上编码人TMPRSS2蛋白质的胞外域,以便制备具有与人TMPRSS2蛋白质的胞外域相同的胞外域的人源化的Tmprss2蛋白质。
在具体实施例中,插入内源性啮齿类动物Tmprss2基因内的人TMPRSS2基因的连续基因组序列至少含有人TMPRSS2基因的编码外显子4直到编码外显子13中的终止密码子。
在某些实施例中,插入内源性啮齿类动物Tmprss2基因内的人TMPRSS2基因的连续基因组序列含有人TMPRSS2基因的内含子3和编码外显子4直到编码外显子13中的终止密码子。在特定实施例中,插入内源性啮齿类动物Tmprss 2基因内的人TMPRSS2基因的连续基因组序列含有人TMPRSS2基因的编码外显子3的3’部分、内含子3和编码外显子4直到编码外显子13中的终止密码子。在具体实施例中,包括在人源化中的人TMPRSS2基因的编码外显子3的3'部分长度为约5-10个碱基对,即编码外显子3的3’末端的约5、6、7、8、9或10个碱基对。
在一些实施例中,插入内源性啮齿类动物Tmprss2基因内的人TMPRSS2基因的连续基因组序列还含有人TMPRSS2基因的3’UTR。在具体实施例中,人TMPRSS2基因的整个编码外显子13包括在用于人源化的连续人TMPRSS2基因组序列中,其包括人TMPRSS2基因的3’UTR。在特定实施例中,人TMPRSS2基因的连续基因组序列包括人TMPRSS2基因的3’UTR下游的另外的人基因组序列。另外的人基因组序列可为紧接在人TMPRSS2基因座处的人TMPRSS2基因的3’UTR下游发现的至少10-200bp,或至少10、20、30、40、50、75、100、125、150、175或200bp的序列。
在一些实施例中,在人源化的Tmprss2基因座处保留的内源性啮齿类动物Tmprss2基因的核苷酸序列编码的多肽与内源性啮齿类动物Tmprss2蛋白质的细胞质和跨膜部分基本上相同。在其中内源性Tmprss2蛋白质和人TMPRSS2蛋白质共享在跨膜结构域和胞外域的接头附近的共同氨基酸的情况下,可能不需要维持精确地编码内源性啮齿类动物Tmprss2蛋白质的跨膜结构域的内源性啮齿类动物Tmprss2基因组序列,并且能够维持稍微更长或更短的啮齿类动物Tmprss2基因组序列,其基本上编码人源化替换中的内源性啮齿类动物Tmprss2蛋白质的跨膜结构域,以便编码具有与内源性啮齿类动物Tmprss2蛋白质的跨膜相同的跨膜结构域的人源化的Tmprss2蛋白质。在一些实施例中,在人源化的Tmprss2基因座处保留的内源性啮齿类动物Tmprss2基因的核苷酸序列包括内源性啮齿类动物Tmprss2基因的外显子1-2和编码外显子3的5'部分,其中编码外显子3的5'部分是密码子外显子3的基本部分,例如除了在编码外显子3的3'末端处的5-10个碱基对以外的整个编码外显子3。
在具体实施例中,人源化的Tmprss2基因含有编码内源性啮齿类动物Tmprss2基因的外显子1-2和编码外显子3的5'部分,以及人Tmprss2基因的编码外显子3和编码外显子4直到编码外显子13的3'部分,其中所述人源化的Tmprss2基因编码人源化的Tmprss2蛋白质,其含有与啮齿类动物Tmprss2蛋白质的细胞质和跨膜部分基本上相同的细胞质和跨膜部分,以及与人TMPRSS2蛋白质的胞外域基本上相同的胞外域。在某些实施例中,人源化的Tmprss2基因编码人源化的Tmprss2蛋白质,其含有由内源性啮齿类动物Tmprss2基因编码的啮齿类动物Tmprss2蛋白质的细胞质结构域和跨膜结构域,以及由人TMPRSS2基因编码的人TMPRSS2蛋白质的胞外域。在特定实施例中,人源化的Tmprss2基因编码具有如SEQ IDNO:7中所示的氨基酸序列的人源化的Tmprss2蛋白质。
在一些实施例中,用于人源化的人TMPRSS2基因和啮齿类动物Tmprss2基因的外显子和内含子是在SEQ ID NO:1、3和5-6中发现的那些。
在一些实施例中,人源化的Tmprss2基因导致啮齿类动物中编码的人源化的Tmprss2蛋白质的表达。在一些实施例中,人源化的Tmprss2蛋白质以与对照啮齿类动物(例如,不含人源化的Tmprss2基因的啮齿类动物)中的配对物啮齿类动物Tmprss2蛋白质可比较或基本上相同的模式表达。在一些实施例中,人源化的Tmprss2蛋白质以与对照啮齿类动物(例如,不含人源化的Tmprss2基因的啮齿类动物)中的配对物啮齿类动物Tmprss2蛋白质可比较或基本上相同的水平表达。在某些实施例中,人源化的Tmprss2蛋白质在细胞表面处表达且检测到。在某些实施例中,人源化的Tmprss2蛋白质或可溶形式(例如脱落的胞外域形式)在啮齿类动物的血清中表达且检测到,例如其水平与对照啮齿类动物中的配对物啮齿类动物Tmprss2蛋白质或其可溶形式可比较或基本上相同。
人源化的Tmprss4啮齿类动物
在一些实施例中,本发明提供了其基因组含有人源化的Tmprss4基因的啮齿类动物,所述人源化的Tmprss4基因包括内源性啮齿类动物Tmprss4基因的核苷酸序列和人TMPRSS4基因的核苷酸序列,并且处于内源性啮齿类动物Tmprss4基因的5'调控元件,例如启动子和/或增强子的控制下。啮齿类动物的例子包括小鼠和大鼠。
在一些实施例中,人源化的Tmprss4基因编码人源化的Tmprss4蛋白质,其含有与人TMPRSS4蛋白质的胞外域基本上相同的胞外域。在具体实施例中,人TMPRSS4蛋白质具有与SEQ ID NO:11中所示的氨基酸序列具有至少85%、90%、95%、98%、99%或100%同一性的氨基酸序列。
在一些实施例中,人源化的Tmprss4蛋白质含有人TMPRSS4蛋白质的C末端384个氨基酸,例如人TMPRSS4蛋白质的氨基酸54至437。在一些实施例中,人源化的Tmprss4蛋白质含有与由SEQ ID NO:11的K54至L437组成的氨基酸序列基本上相同的胞外域。在具体实施例中,人源化的Tmprss4蛋白质含有与由SEQ ID NO:11的K54至L437组成的氨基酸序列具有至少85%、90%、95%、98%、99%或100%同一性的胞外域;与由SEQ ID NO:11的K54至L437组成的氨基酸序列相差不超过10、9、8、7、6、5、4、3、2或1个氨基酸的胞外域;或仅在胞外域的N末端或C末端处与由SEQ ID NO:11的K54至L437组成的氨基酸序列不同的胞外域,例如在N末端或C末端处缺少1-5个氨基酸或具有另外的1-5个氨基酸。
在一些实施例中,人源化的Tmprss4蛋白质还含有与内源性啮齿类动物Tmprss4蛋白质的细胞质和跨膜部分基本上相同的细胞质和跨膜部分。在一些实施例中,人源化的Tmprss4蛋白质还包括内源性啮齿类动物Tmprss4蛋白质的跨膜结构域和细胞质结构域。
在具体实施例中,人源化的Tmprss4蛋白质含有内源性啮齿类动物Tmprss4蛋白质的跨膜结构域和细胞质结构域,以及人TMPRSS4蛋白质的胞外域。在特定实施例中,人源化的Tmprss4基因编码具有如SEQ ID NO:14中所示的氨基酸序列的人源化的Tmprss4蛋白质。
在一些实施例中,人源化的Tmprss4基因来源于在内源性啮齿类动物Tmprss4基因座处的内源性啮齿类动物Tmprss4基因的核苷酸序列由人TMPRSS4基因的核苷酸序列的替换。
在一些实施例中,在内源性啮齿类动物Tmprss4基因座处的内源性啮齿类动物Tmprss4基因的连续基因组序列已被替换为人TMPRSS4基因的连续基因组序列,以形成人源化的Tmprss4基因。
在具体实施例中,插入内源性啮齿类动物Tmprss4基因内的人TMPRSS4基因的连续基因组序列包括外显子序列,即人TMPRSS4基因的外显子的全部或部分,所述人TMPRSS4基因编码的胞外域与由人TMPRSS4基因编码的人TMPRSS4蛋白质的胞外域基本上相同。在其中内源性Tmprss4蛋白质和人TMPRSS4蛋白质共享在跨膜结构域和胞外域的接头附近的共同氨基酸的情况下,可能不需要插入精确地编码人TMPRSS4蛋白质的胞外域的人TMPRSS4基因组序列,并且能够使用稍微更长或更短的人TMPRSS4基因组序列,其基本上编码人TMPRSS4蛋白质的胞外域,以便制备具有与人TMPRSS4蛋白质的胞外域相同的胞外域的人源化的Tmprss4蛋白质。
在具体实施例中,插入内源性啮齿类动物Tmprss4基因内的人TMPRSS4基因的连续基因组序列至少含有人TMPRSS4基因的编码外显子4直到编码外显子13中的终止密码子。
在某些实施例中,插入内源性啮齿类动物Tmprss4基因内的人TMPRSS4基因的连续基因组序列包括人TMPRSS4基因的内含子3的3’部分和编码外显子4直到编码外显子13中的终止密码子。在具体实施例中,包括在人源化中的人TMPRSS4基因的编码内含子3的3'部分长度为约140-160个碱基对,即内含子3的3’末端的约140、145、150、155、160个碱基对。
在一些实施例中,插入内源性啮齿类动物Tmprss4基因内的人TMPRSS4基因的连续基因组序列含有人TMPRSS4基因的3’UTR。在具体实施例中,插入内源性啮齿类动物Tmprss4基因内的人TMPRSS4基因的连续基因组序列不含有人TMPRSS4基因的3'UTR,并且内源性啮齿类动物Tmprss4基因的3'UTR紧接在人源化的Tmprss4基因中的终止密码子之后。
在一些实施例中,在人源化的Tmprss4基因座处保留的内源性啮齿类动物Tmprss4基因的核苷酸序列编码的多肽与内源性啮齿类动物Tmprss4蛋白质的细胞质和跨膜部分基本上相同。在其中内源性Tmprss4蛋白质和人TMPRSS4蛋白质共享在跨膜结构域和胞外域的接头附近的共同氨基酸的情况下,可能不需要维持精确地编码内源性啮齿类动物Tmprss4蛋白质的跨膜结构域的内源性啮齿类动物Tmprss4基因组序列,并且能够维持稍微更长或更短的啮齿类动物Tmprss4基因组序列,其基本上编码人源化替换中的内源性啮齿类动物Tmprss4蛋白质的跨膜结构域,以便编码具有与内源性啮齿类动物Tmprss4蛋白质的跨膜相同的跨膜结构域的人源化的Tmprss4蛋白质。
在具体实施例中,人源化的Tmprss4基因含有内源性啮齿类动物Tmprss4基因的编码外显子1-3,以及人TMPRSS4基因的编码外显子4直到编码外显子13的终止密码子。在特定实施例中,人源化的Tmprss4基因含有内源性啮齿类动物Tmprss4基因的编码外显子1-3和内含子3的5'部分,以及人TMPRSS4基因的内含子3的3'部分以及编码外显子4直到编码外显子13的终止密码子。在某些实施例中,人源化的Tmprss4基因编码人源化的Tmprss4蛋白质,其含有由内源性啮齿类动物Tmprss4基因编码的啮齿类动物Tmprss4蛋白质的细胞质结构域和跨膜结构域,以及由人TMPRSS4基因编码的人TMPRSS4蛋白质的胞外域。在特定实施例中,人源化的Tmprss4基因编码具有如SEQ ID NO:14中所示的氨基酸序列的人源化的Tmprss4蛋白质。
在一些实施例中,用于人源化的人TMPRSS4基因和啮齿类动物Tmprss4基因的外显子和内含子是在SEQ ID NO:8、10和12-13中发现的那些。
在一些实施例中,人源化的Tmprss4基因导致啮齿类动物中编码的人源化的Tmprss4蛋白质的表达。在一些实施例中,人源化的Tmprss4蛋白质以与对照啮齿类动物(例如,不含编码人源化的Tmprss4蛋白质的人源化的Tmprss4基因的啮齿类动物)中的配对物啮齿类动物Tmprss4蛋白质可比较或基本上相同的模式表达。在一些实施例中,人源化的Tmprss4蛋白质以与对照啮齿类动物(例如,不含编码人源化的Tmprss4蛋白质的人源化的Tmprss4基因的啮齿类动物)中的配对物啮齿类动物Tmprss4蛋白质可比较或基本上相同的水平表达。在某些实施例中,人源化的Tmprss4蛋白质在细胞表面处表达且检测到。在某些实施例中,人源化的Tmprss4蛋白质或可溶形式(例如脱落的胞外域形式)在啮齿类动物的血清中表达且检测到,例如其水平与对照啮齿类动物中的配对物啮齿类动物Tmprss4蛋白质或其可溶形式可比较或基本上相同。
人源化的Tmprss11d啮齿类动物
在一些实施例中,本发明提供了其基因组含有人源化的Tmprss11d基因的啮齿类动物,所述人源化的Tmprss11d基因包括内源性啮齿类动物Tmprss11d基因的核苷酸序列和人TMPRSS11D基因的核苷酸序列,并且处于内源性啮齿类动物Tmprss11d基因的5'调控元件,例如启动子和/或增强子的控制下。啮齿类动物的例子包括小鼠和大鼠。
在一些实施例中,人源化的Tmprss11d基因编码人源化的Tmprss11d蛋白质,其含有与人TMPRSS11D蛋白质的胞外域基本上相同的胞外域。
在具体实施例中,人TMPRSS11D蛋白质具有与SEQ ID NO:18中所示的氨基酸序列具有至少85%、90%、95%、98%、99%或100%同一性的氨基酸序列。
在一些实施例中,人源化的Tmprss11d蛋白质含有人TMPRSS11D蛋白质的C末端377个氨基酸,例如人TMPRSS11D蛋白质的氨基酸42至418。在一些实施例中,人源化的Tmprss11d蛋白质含有与由SEQ ID NO:18的A42至I418组成的氨基酸序列基本上相同的胞外域。在具体实施例中,人源化的Tmprss11d蛋白质含有与由SEQ ID NO:18的A42至I418组成的氨基酸序列具有至少85%、90%、95%、98%、99%或100%同一性的胞外域;与由SEQID NO:18的A42至I418组成的氨基酸序列相差不超过10、9、8、7、6、5、4、3、2或1个氨基酸的胞外域;或例如通过在N末端或C末端处缺少1-5个氨基酸或具有另外的1-5个氨基酸,仅在N末端或C末端处与由SEQ ID NO:18的A42至I418组成的氨基酸序列不同的胞外域。
在一些实施例中,人源化的Tmprss11d蛋白质还含有与内源性啮齿类动物Tmprss11d蛋白质的细胞质和跨膜部分基本上相同的细胞质和跨膜部分。在一些实施例中,人源化的Tmprss11d蛋白质包括内源性啮齿类动物Tmprss11d蛋白质的跨膜结构域和细胞质结构域。
在具体实施例中,人源化的Tmprss11d蛋白质含有内源性啮齿类动物Tmprss11d蛋白质的跨膜结构域和细胞质结构域,以及人TMPRSS11D蛋白质的胞外域。在特定实施例中,人源化的Tmprss11d基因编码具有如SEQ ID NO:21中所示的氨基酸序列的人源化的Tmprss11d蛋白质。
在一些实施例中,人源化的Tmprss11d基因来源于在内源性啮齿类动物Tmprss11d基因座处的内源性啮齿类动物Tmprss11d基因的核苷酸序列由人TMPRSS11D基因的核苷酸序列的替换。
在一些实施例中,在内源性啮齿类动物Tmprss11d基因座处的内源性啮齿类动物Tmprss11d基因的连续基因组序列已被替换为人TMPRSS11D基因的连续基因组序列,以形成人源化的Tmprss11d基因。在具体实施例中,插入内源性啮齿类动物Tmprss11d基因内的人TMPRSS11D基因的连续基因组序列包括外显子序列,即人TMPRSS11D基因的外显子的全部或部分,所述人TMPRSS11D基因编码的胞外域与由人TMPRSS11D基因编码的人TMPRSS11D蛋白质的胞外域基本上相同。在其中内源性Tmprss11d蛋白质和人TMPRSS11D蛋白质共享在跨膜结构域和胞外域的接头附近的共同氨基酸的情况下,可能不需要插入精确地编码人TMPRSS11D蛋白质的胞外域的人TMPRSS11D基因组序列,并且能够使用稍微更长或更短的人TMPRSS11D基因组序列,其基本上编码人TMPRSS11D蛋白质的胞外域,以便制备具有与人TMPRSS11D蛋白质的胞外域相同的胞外域的人源化的Tmprss11d蛋白质。
在具体实施例中,插入内源性啮齿类动物Tmprss11d基因内的人TMPRSS11D基因的连续基因组序列至少含有人TMPRSS11D基因的编码外显子3直到编码外显子10中的终止密码子。
在某些实施例中,插入内源性啮齿类动物Tmprss11d基因内的人TMPRSS11D基因的连续基因组序列含有人TMPRSS11D基因的内含子2的至少3’部分和编码外显子3直到编码外显子10中的终止密码子。在具体实施例中,包括在人源化中的人TMPRSS2基因的内含子2的3'部分长度为约444个碱基对。
在一些实施例中,插入内源性啮齿类动物Tmprss11d基因内的人TMPRSS11D基因的连续基因组序列含有人TMPRSS11D基因的3’UTR。在具体实施例中,人TMPRSS11D基因的整个编码外显子10包括在用于人源化的连续人TMPRSS11D基因组序列中,其包括人TMPRSS11D基因的3’UTR。在特定实施例中,人TMPRSS11D基因的连续基因组序列包括人TMPRSS11D基因的3’UTR下游的另外的人基因组序列。另外的人基因组序列可为紧接在人TMPRSS11D基因座处的人TMPRSS11D基因的3’UTR下游发现的至少10-200bp,50-200bp,或约150、160、170、180bp的序列。
在一些实施例中,在人源化的Tmprss11d基因座处保留的内源性啮齿类动物Tmprss11d基因的核苷酸序列编码的多肽与由内源性啮齿类动物Tmprss11d基因编码的内源性啮齿类动物Tmprss11d蛋白质的细胞质和跨膜部分基本上相同。在其中内源性Tmprss11d蛋白质和人TMPRSS11D蛋白质共享在跨膜结构域和胞外域的接头附近的共同氨基酸的情况下,可能不需要维持精确地编码内源性啮齿类动物Tmprss11d蛋白质的跨膜结构域的内源性啮齿类动物Tmprss11d基因组序列,并且能够维持稍微更长或更短的啮齿类动物Tmprss11d基因组序列,其基本上编码人源化替换中的内源性啮齿类动物Tmprss11d蛋白质的跨膜结构域,以便编码具有与内源性啮齿类动物Tmprss11d蛋白质的跨膜相同的跨膜结构域的人源化的Tmprss11d蛋白质。
在具体实施例中,人源化的Tmprss11d基因含有内源性啮齿类动物Tmprss11d基因的编码外显子1-2、以及人TMPRSS11D基因的编码外显子3直到编码外显子10。在某些实施例中,人源化的Tmprss11d基因编码人源化的Tmprss11d蛋白质,其含有由内源性啮齿类动物Tmprss11d基因编码的啮齿类动物Tmprss11d蛋白质的细胞质结构域和跨膜结构域,以及由人TMPRSS11D基因编码的人TMPRSS11D蛋白质的胞外域。在特定实施例中,人源化的Tmprss11d基因编码具有如SEQ ID NO:21中所示的氨基酸序列的人源化的Tmprss11d蛋白质。
在一些实施例中,用于人源化的人TMPRSS11D基因和啮齿类动物Tmprss11d基因的外显子和内含子是在SEQ ID NO:15、17和19-20中发现的那些。
在一些实施例中,人源化的Tmprss11D基因导致啮齿类动物中编码的人源化的Tmprss11d蛋白质的表达。在一些实施例中,人源化的Tmprss11d蛋白质以与对照啮齿类动物(例如,不含编码人源化的Tmprss11d蛋白质的人源化的Tmprss11d基因的啮齿类动物)中的配对物啮齿类动物Tmprss11d蛋白质可比较或基本上相同的模式表达。在一些实施例中,人源化的Tmprss11d蛋白质以与对照啮齿类动物(例如,不含编码人源化的Tmprss11d蛋白质的人源化的Tmprss11d基因的啮齿类动物)中的配对物啮齿类动物Tmprss11d蛋白质可比较或基本上相同的水平表达。在某些实施例中,人源化的Tmprss11d蛋白质在细胞表面处表达且检测到。在某些实施例中,人源化的Tmprss11d蛋白质或可溶形式(例如脱落的胞外域形式)在啮齿类动物的血清中表达且检测到,例如其水平与对照啮齿类动物中的配对物啮齿类动物Tmprss11d蛋白质或其可溶形式可比较或基本上相同。
制备人源化的Tmprss啮齿类动物的方法
本公开内容的进一步方面涉及用于制备上述人源化的Tmprs啮齿类动物的方法,以及适用于制备人源化的Tmprs啮齿类动物的核酸载体和非人胚胎干细胞。
本文提供的啮齿类动物可使用本领域已知的方法制备。在示例性实施例中,携带啮齿类动物Tmprss基因的细菌人工染色体(BAC)克隆可使用细菌同源重组和技术(参见例如US 6,586,251和Valenzuela等人(2003),High-throughput engineering of the mouse genome coupled with high-resolutionexpression analysis,Nature Biotech.21(6):652-659)进行修饰。因此,啮齿类动物Tmprss核苷酸序列已从原始BAC克隆中缺失,并且人Tmprss核苷酸序列已插入,导致携带人源化的Tmprss基因的经修饰的BAC克隆,侧面为5'和3'啮齿类动物同源臂。一旦被线性化,就可通过例如电穿孔将经修饰的BAC克隆引入啮齿类动物胚胎干(ES)内。本领域已经描述了小鼠ES细胞和大鼠ES细胞。参见例如US 7,576,259、US 7,659,442、US 7,294,754和US2008-0078000 A1(所有这些专利都以引用的方式并入本文)描述了小鼠ES细胞和用于制备经遗传修饰的小鼠的方法;US 2014/0235933 A1、US 2014/0310828A1、Tong等人(2010)Nature 467:211-215和Tong等人(2011)Nat Protoc.6(6):doi:10.1038/nprot.2011.338(所有这些参考文献都以引用的方式并入本文)描述了大鼠ES细胞和用于制备经遗传修饰的大鼠的方法。
可选择具有整合到基因组中的人源化的Tmprss基因的ES细胞。在一些实施例中,基于啮齿类动物等位基因的丢失和/或人等位基因获得的测定,可选择具有整合到内源性啮齿类动物Tmprss基因座内的人源化Tmprss的ES细胞。然后通过使用方法(参见例如US 7,576,259、US 7,659,442、US 7,294,754和US 2008-0078000 A1),或US2014/0235933 A1和US 2014/0310828 A1中所述的方法,将选择的ES细胞用作供体ES细胞用于注射到桑椹前期胚胎(例如8细胞期胚胎)内。孵育包含供体ES细胞的胚胎直至胚泡期,然后植入到代孕母体中以产生完全源自供体ES细胞的F0啮齿类动物。使用啮齿类动物等位基因丢失和/或人等位基因获得测定,通过从尾巴剪片(tail snip)中分离的DNA的基因分型,可鉴定带有人源化的Tmprss基因的啮齿类动物幼崽。
可将对于人源化的Tmprss基因杂合的啮齿类动物杂交,以生成纯合啮齿类动物。含有一个人源化的Tmprss基因的啮齿类动物可与含有另一个人源化的Tmprss基因的啮齿类动物杂交,以制备含有多重人源化的Tmprss基因的啮齿类动物。例如,含有人源化的Tmprss2基因的啮齿类动物可与含有人源化的Tmprss4基因的啮齿类动物杂交,以制备含有人源化的Tmprss2基因和人源化的Tmprss4基因的啮齿类动物。
采用具有人源化的Tmprss基因的啮齿类动物的方法
本文公开的啮齿类动物提供了表达人源化的Tmprss蛋白质的生物材料(例如细胞)的有用体内系统和来源,用于鉴定和测试特异性靶向人TMPRSS蛋白质的化合物。
在一个方面,本文公开的啮齿类动物用于确定候选化合物如人TMPRSS蛋白质抑制剂治疗和/或预防流感病毒感染的能力。
在一些实施例中,在实验性流感病毒感染之前,用候选化合物施用含有人源化的Tmprss基因并表达本文公开的人源化的Tmprss蛋白质的啮齿类动物。可通过与对照啮齿类动物相比,确定啮齿类动物是否显示出流感病毒感染的更少和/或更不严重的症状和/或改善的存活力,来评估化合物的预防功效。
在其它实施例中,在实验性流感病毒感染后,用人TMPRSS蛋白质的候选抑制剂施用含有人源化的Tmprss基因并表达包含该人TMPRSS蛋白质的胞外域的人源化的Tmprss蛋白质的啮齿类动物。可通过与对照啮齿类动物相比,确定啮齿类动物是否显示出流感病毒感染的更少和/或更不严重的症状和/或改善的存活力,来评估候选抑制剂的治疗功效。
合适的对照啮齿类动物包括例如含有人源化的Tmprss基因,而不经受实验性感染的啮齿类动物;和含有人源化的Tmprss基因、经受实验性感染而无任何化合物的啮齿类动物;以及含有人源化的Tmprss基因、经受实验性感染和已知治疗有效的化合物的啮齿类动物。
可在本发明的方法中评估的化合物包括候选TMPRSS抑制剂例如小分子蛋白酶抑制剂、基于核酸的抑制剂(例如siRNA、核酶、反义构建体等)、抗原结合蛋白(例如抗体或其抗原结合片段)或阻断肽/肽抑制剂。TMPRSS抑制剂可通过抑制或降低TMPRSS蛋白质将血凝素前体蛋白(HA0)蛋白酶解切割成HA1和HA2亚基的能力来起作用。
在一些实施例中,候选抑制剂是抗体或其抗原结合片段。单克隆抗体和多克隆抗体两者均适合于本发明的目的。在具体实施例中,抗体特异性结合TMPRSS蛋白质且抑制该TMPRSS蛋白质的蛋白酶活性,并且基本上不抑制另一种TMPRSS蛋白质的蛋白酶活性。例如,抗TMPRSS2抗体抑制剂特异性结合TMPRSS2蛋白质且抑制TMPRSS2蛋白质的蛋白酶活性,并且对TMPRSS4或TMPRSS11D的蛋白酶解活性没有作用,或者相对于在相同或基本上相同的实验条件下测试的非抑制性对照分子,使TMPRSS4或TMPRSS11D的蛋白酶解活性降低不超过25%(例如,20%、15%、10%、5%或更少)。
在一些实施例中,抑制剂是抗TMPRSS2抗体或其抗原结合片段。在一些实施例中,抑制剂是抗TMPRSS4抗体或其抗原结合片段。在其它实施例中,抑制剂是抗TMPRSS11D抗体或其抗原结合片段。
可遵循已知方案诱导且监测实验性流感病毒感染。参见例如US 2013/0273070A1。例如,啮齿类动物可用流感病毒鼻内施用。可评估受感染的动物以确定感染的症状和严重程度。例如,可分析动物的(1)体重变化和存活率,(2)经由流式细胞术的细胞变化,(3)整个肺的免疫化学、PAS和H&E染色,以及(4)血清中的细胞因子水平。与未感染的动物相比,已知对病毒敏感的对照动物显示出树突状细胞的频率、肺中的流感阳性肺泡巨噬细胞、嗜中性粒细胞或上皮细胞的水平以及IFNγ水平中的显著增加。
实例
提供以下实例是为了向本领域普通技术人员描述如何制备和使用本发明的方法和组合物,而非旨在限制发明人所认为的其发明的范围。除非另外指明,否则所给出的温度为摄氏度,压力是大气压或接近大气压。
实例1.内源性Tmprss2基因的人源化。
本实例示出了在啮齿类动物(例如小鼠)中人源化编码Tmprss2的内源基因的示例性方法。本实例中描述的方法可用于人源化啮齿类动物的内源性Tmprss2基因,根据需要使用任何人序列或人序列(或序列片段)的组合。
使用细菌人工染色体(BAC)克隆和技术(参见例如美国专利号6,586,251和Valenzuela等人(2003)High-throughput engineering of the mousegenome coupled with high-resolution expression analysis,Nature Biotech.21(6):652-659;以引用的方式并入本文),构建用于内源性Tmprss2基因的人源化的靶向载体。
简言之,使用含有小鼠Tmprss2基因的小鼠细菌人工染色体(BAC)克隆bMQ-264A15并如下修饰。生成DNA片段以包括5'小鼠同源核苷酸序列、约25,091bp的人TMPRSS2基因组DNA(含有人TMPRSS2基因的编码外显子3的最后7bp、内含子3和编码外显子4直到编码外显子13(包括其为编码外显子13的部分的3'UTR))、约2,691bp的自缺失新霉素盒和3'小鼠同源序列。该DNA片段用于通过细菌细胞中的同源重组来修饰BAC克隆bMQ-264A15。因此,将BAC克隆中的编码胞外域的小鼠Tmprss2基因组片段(约25,291bp)替换为约25,091bp的人TMPRSS2基因组片段,随后为约2691bp的自缺失新霉素盒。具体地,替换的小鼠Tmprss2基因组片段包括小鼠Tmprss2基因的编码外显子3的最后7bp、内含子3和编码外显子4直到编码外显子13中的终止密码子(图1A-1B)。插入的人TMPRSS2基因组片段包括人TMPRSS2基因(包括人TMPRSS2的3’UTR)的编码外显子3的最后7bp、内含子3和编码外显子4直到编码外显子13、以及人TMPRSS2的3’UTR下游131bp的人3'基因组序列(图1A-1B)。所得到的经修饰的BAC克隆从5’至3’包括:(i)含有约12kb的小鼠基因组DNA的5'小鼠同源臂,包括小鼠Tmprss25’UTR、小鼠Tmprss2外显子1(非编码)、编码外显子1-3(除了编码外显子3的最后7bp以外);(ii)约25,091bp的人TMPRSS2基因组片段,包括人编码外显子3的最后7bp、内含子3、人编码外显子4直到13(包括人TMPRSS2的3’UTR)、以及人3'基因组序列;(iii)约2691bp的自缺失新霉素盒,随后为(iv)45kb的3'小鼠同源臂,含有小鼠Tmprss2 3’UTR和原始BAC克隆中剩余的小鼠基因组DNA。参见图1A-1B。连接序列也在图1B的底部示出。包含人TMPRSS2基因组片段和新霉素盒的经修饰的BAC克隆的部分,以及上游和下游插入连接在SEQ ID NO:5中示出。由人源化的Tmprss2基因编码的蛋白质的氨基酸序列在SEQ ID NO:7中示出。该人源化的Tmprss2蛋白质(“7010突变蛋白质”)、小鼠Tmprss2蛋白质(SEQ ID NO:2)和人TMPRSS2蛋白质(SEQ ID NO:4)的比对在图1D中提供。
如上所述,含有人源化的Tmprss2基因的经修饰的BAC克隆用于电穿孔小鼠胚胎干(ES)细胞,以产生包含人源化的Tmprss2基因的经修饰的ES细胞。通过检测人TMPRSS2序列(例如,人TMPRSS2的编码外显子4-13)的存在(Valenzuela等人,同上)的测定,鉴定含有人源化的Tmprss2基因的阳性靶向ES细胞,并且证实小鼠Tmprss2序列的丢失和/或保留(例如小鼠Tmprss2的编码外显子4-13的丢失)。表1示出了用于证实如上所述的内源性Tmprss2基因的人源化的引物和探针(图1A-1B)。一旦已选择了正确靶向的ES细胞克隆,就可例如经由电穿孔通过引入Cre重组酶来切除新霉素选择盒。可替代地,可以通过将由ES克隆产生的后代与表达Cre重组酶的删除者啮齿类动物品系杂交来除去新霉素选择盒。在图1C中描绘了在缺失该盒之后的人源化的Tmprss2基因座,其中连接序列显示在图1C的底部。
使用方法(参见例如美国专利号7,294,754和Poueymirou等人,F0generation mice that are essentially fully derived from the donor gene-targeted ES cells allowing immediate phenotypic analyses,2007,NatureBiotech.25(1):91-99),将选择的ES细胞克隆(具有或不具有盒)用于植入雌性小鼠,以生成在基因组中含有人源化的Tmprss2等位基因的一窝幼崽。使用检测人TMPRSS2基因序列的存在的等位基因测定(Valenzuela等人,同上)的修改,通过对从尾巴剪片中分离的DNA的基因分型,可再次证实且鉴定带有人源化的Tmprss2等位基因的小鼠。将幼崽进行基因分型,并且选择对于人源化的Tmprss2基因座杂合的动物群组用于表征。对于人源化的Tmprss2基因座纯合的动物通过杂交杂合动物来制备。
表1
实例2.内源性Tmprss4基因的人源化。
本实例示出了在啮齿类动物(例如小鼠)中人源化编码Tmprss4的内源基因的示例性方法。本实例中描述的方法可用于人源化啮齿类动物的内源性Tmprss4基因,根据需要使用任何人序列或人序列(或序列片段)的组合。
使用细菌人工染色体(BAC)克隆和技术(参见例如美国专利号6,586,251和Valenzuela等人(2003),同上),构建用于内源性Tmprss4基因的人源化的靶向载体。
简言之,使用含有小鼠Tmprss4基因的小鼠细菌人工染色体(BAC)克隆RP23-71M15并如下修饰。生成DNA片段以包括5'小鼠同源核苷酸序列、约4,996bp的自缺失新霉素盒、约14,963bp的人基因组DNA(含有人TMPRSS4基因的编码外显子4直到编码外显子13中的终止密码子)和3'小鼠同源序列。该DNA片段用于通过细菌细胞中的同源重组来修饰BAC克隆RP23-71M15。因此,将BAC克隆中的编码胞外域的小鼠基因组片段(约11,074bp)替换为约4,996bp的自缺失新霉素盒,随后为约14,963bp的人基因组DNA。具体地,缺失且替换的小鼠基因组片段包括小鼠内含子3的3'130bp、小鼠Tmprss4基因的编码外显子4直到编码外显子13中的终止密码子(图2A-2B)。插入的人基因组片段包括约150bp的人TMPRSS4内含子3的3'部分和人TMPRSS4编码外显子4直到编码外显子13中的终止密码子的(图2A-2B)。所得到的经修饰的BAC克隆从5’至3’包括:含有约44.8kb的小鼠基因组DNA的5'小鼠同源臂(包括小鼠Tmprss4 5’UTR、小鼠Tmprss4编码外显子1直到3、小鼠Tmprss4内含子3部分(不含3'130bp),约4996bp的自缺失新霉素盒,约150bp的人TMPRSS4内含子3的3'部分,人TMPRSS4编码外显子4直到编码外显子13中的终止密码子,随后直接为小鼠Tmprss4 3’UTR和原始BAC克隆中剩余的小鼠基因组DNA(总共大约118kb的3'小鼠同源臂)。参见图2A-2B。连接序列也在图2B的底部示出。含有新霉素盒和人TMPRSS4基因组片段的经修饰的BAC克隆的部分,以及上游和下游插入连接在SEQ ID NO:12中示出。由人源化的Tmprss4基因编码的蛋白质的氨基酸序列在SEQ ID NO:14中示出。该人源化的Tmprss4蛋白质(“7224突变蛋白质”)、小鼠Tmprss4蛋白质(SEQ ID NO:9)和人TMPRSS4蛋白质(SEQ ID NO:11)的比对在图2D中提供。
如上所述,含有人源化的Tmprss4基因的经修饰的BAC克隆用于电穿孔小鼠胚胎干(ES)细胞,以产生包含人源化的Tmprss4基因的经修饰的ES细胞。通过检测人TMPRSS4序列(例如,人TMPRSS4的编码外显子4-13)的存在(Valenzuela等人,同上)的测定,鉴定含有人源化的Tmprss4基因的阳性靶向ES细胞,并且证实小鼠Tmprss4序列的丢失和/或保留(例如小鼠Tmprss4的编码外显子4-13的丢失)。表2示出了用于证实如上所述的内源性Tmprss4基因的人源化的引物和探针(图2A-2B)。一旦已选择了正确靶向的ES细胞克隆,就可例如经由电穿孔通过引入Cre重组酶来切除新霉素选择盒。可替代地,可以通过将由ES克隆产生的后代与表达Cre重组酶的删除者啮齿类动物品系杂交来除去新霉素选择盒。在图2C中描绘了在缺失该盒之后的人源化的Tmprss4基因座,其中连接序列显示在图2C的底部。
使用方法(参见例如美国专利号7,294,754和Poueymirou等人(2007),同上),将选择的ES细胞克隆(具有或不具有盒)用于植入雌性小鼠,以生成在基因组中含有人源化的Tmprss4等位基因的一窝幼崽。使用检测人TMPRSS4基因序列的存在的等位基因测定(Valenzuela等人,同上)的修改,通过对从尾巴剪片中分离的DNA的基因分型,可再次证实且鉴定带有人源化的Tmprss4等位基因的小鼠。将幼崽进行基因分型,并且选择对于人源化的Tmprss4基因座杂合的动物群组用于表征。对于人源化的Tmprss4基因座纯合的动物通过使杂合动物杂交来制备。
表2
实例3.内源性Tmprss11d基因的人源化。
本实例示出了在啮齿类动物(例如小鼠)中人源化编码Tmprss11d的内源基因的示例性方法。本实例中描述的方法可用于人源化啮齿类动物的内源性Tmprss11d基因,根据需要使用任何人序列或人序列(或序列片段)的组合。
使用细菌人工染色体(BAC)克隆和技术(参见例如美国专利号6,586,251和Valenzuela等人(2003),同上),构建用于内源性Tmprss11d基因的人源化的靶向载体。
简言之,使用含有小鼠Tmprss11d基因的小鼠细菌人工染色体(BAC)克隆RP23-95N22并如下修饰。生成DNA片段以包括5'小鼠同源核苷酸序列、约33,927bp的人TMPRSS11D基因组DNA(含有在人TMPRSS11D基因的内含子2的3'末端处的444bp、以及编码外显子3直到编码外显子10(包括其为编码外显子10的部分的3'UTR))、约4,996bp的自缺失新霉素盒和3'小鼠同源序列。该DNA片段用于通过细菌细胞中的同源重组来修饰BAC克隆RP23-95N22。因此,将BAC克隆中的编码胞外域的小鼠Tmprss11d基因组片段(约35,667bp)替换为约33,927bp的人TMPRSS11D基因组片段,随后为约4,996bp的自缺失新霉素盒。具体地,替换的小鼠Tmprss11d基因组片段包括小鼠Tmprss11d基因的内含子2的3'部分、以及编码外显子3直到编码外显子10中的终止密码子(图3A-3B)。插入的人TMPRSS11D基因组片段包括在内含子2的3'末端处的444bp、和人TMPRSS11D基因的编码外显子3直到编码外显子10(包括人TMPRSS11D的3’UTR)、以及人TMPRSS11D的3’UTR下游约172bp的人3'基因组序列(图3A-3B)。所得到的经修饰的BAC克隆从5’至3’包括:(i)含有约143kb的小鼠基因组DNA的5'小鼠同源臂,包括小鼠Tmprss11d5’UTR、小鼠Tmprss11d编码外显子1-2和内含子2的5'部分;(ii)人TMPRSS11D基因组片段,包括人TMPRSS11D的内含子2的3'部分和编码外显子3直到10(包括3’UTR)以及人3'基因组序列;(iii)约4,996bp的自缺失新霉素盒,随后为(iv)10kb的3'小鼠同源臂,含有小鼠Tmprss11d 3’UTR和原始BAC克隆中剩余的小鼠基因组DNA。参见图3A-3B。连接序列也在图3B的底部示出。包含人TMPRSS11D基因组片段和新霉素盒的经修饰的BAC克隆的部分,以及上游和下游插入连接在SEQ ID NO:19中示出。由人源化的Tmprss11d基因编码的蛋白质的氨基酸序列在SEQ ID NO:21中示出。该人源化的Tmprss11d蛋白质(“7226突变蛋白质”)、小鼠Tmprss11d蛋白质(SEQ ID NO:16)和人TMPRSS11D蛋白质(SEQID NO:18)的比对在图3D中提供。
如上所述,含有人源化的Tmprss11d基因的经修饰的BAC克隆用于电穿孔小鼠胚胎干(ES)细胞,以产生包含人源化的Tmprss11d基因的经修饰的ES细胞。通过检测人TMPRSS11D序列(例如,人TMPRSS11D的编码外显子3-10)的存在(Valenzuela等人,同上)的测定,鉴定含有人源化的Tmprss11d基因的阳性靶向ES细胞,并且证实小鼠Tmprss11d序列的丢失和/或保留(例如小鼠Tmprss11d的编码外显子3-10的丢失)。表3示出了用于证实如上所述的内源性Tmprss11d基因的人源化的引物和探针(图3A-3B)。一旦已选择了正确靶向的ES细胞克隆,就可例如经由电穿孔通过引入Cre重组酶来切除新霉素选择盒。可替代地,可以通过将由ES克隆产生的后代与表达Cre重组酶的删除者啮齿类动物品系杂交来除去新霉素选择盒。在图3C中描绘了在缺失该盒之后的人源化的Tmprss11d基因座,其中连接序列显示在图3C的底部。
使用方法(参见例如美国专利号7,294,754和Poueymirou等人(2007),同上),将选择的ES细胞克隆(具有或不具有盒)用于植入雌性小鼠,以生成在基因组中含有人源化的Tmprss11d等位基因的一窝幼崽。使用检测人TMPRSS11D基因序列的存在的等位基因测定(Valenzuela等人,同上)的修改,通过对从尾巴剪片中分离的DNA的基因分型,再次证实且鉴定带有人源化的Tmprss11d等位基因的小鼠。将幼崽进行基因分型,并且选择对于人源化的Tmprss11d基因座杂合的动物群组用于表征。对于人源化的Tmprss11d基因座纯合的动物通过杂交杂合动物来制备。
表3
实例4.在MAID7225 HumIn相对于野生型Tmprss4小鼠中评估组1和组2的A型流感病毒
为了验证人源化的Tmprss啮齿类动物作为感染的动物模型的用途,进行了实验以评估在严重流感感染的A型流感组1和组2模型中MAID7225 HumIn TMPRSS4小鼠相对于野生型(WT)同窝仔畜的存活率。
MAID7225 HumIn TMPRSS4小鼠对于其基因组中的人源化的Tmprss4基因是纯合的,并且如实例2中所述生成。在这些研究中使用的病毒株包括历史A/Puerto Rico/08/1934(H1N1)A型流感病毒组1分离株和内部小鼠适应的A/Aichi/02/1968(HA,NA)X-31(H3N2)A型流感病毒组2分离株。所有实验都在6-8周龄的雄性和雌性MAID7225 HumInTMPRSS4小鼠或WT同窝仔畜中执行。用1150噬菌斑形成单位(PFU)的A/Puerto Rico/08/1934(H1N1)或10,000 PFU的A/Aichi/02/1968-X31(H3N2)攻击小鼠。在这些存活模型中,小鼠在感染后(p.i.)第0天时进行鼻内(IN)攻击。将小鼠称重并且每天观察直至p.i.第14天,并且当它们丧失其起始重量的20%时处死。结果作为存活百分比报告(表4)。
表4
在用严重的A型流感组1病毒[A/Puerto Rico/08/1934(H1N1)]和严重的小鼠适应的A型流感组2病毒[A/Aichi/02/1968-X31(H3N2)]两者攻击后,将MAID7225 HumInTMPRSS4小鼠的存活与WT同窝仔畜相比较(图4)。使用H1N1攻击(分别为25%;n=8和20%;n=10)或H3N2攻击(分别为25%;n=8和11.1%;n=9),MAID7225 HumIn TMPRSS4小鼠的存活与野生型小鼠并无不同。
本文引用的用以描述本发明背景以及用以提供与其实施有关的其他细节的出版物、网站和其他参考材料均据此以引用方式并入。
序列表
<110> 雷杰纳荣制药公司
<120> 具有人源化的TMPRSS基因的啮齿类动物
<130> 33093PCT (10234WO01)
<150> 62/301,023
<151> 2016-02-29
<160> 72
<170> PatentIn version 3.5
<210> 1
<211> 3175
<212> DNA
<213> 小家鼠
<400> 1
gcctttcctg gccgttccct ccttctggcc gaggtgcctg cgtttagggg tgtcaccctg 60
gctcccggga cgccgcctcc ggagatttaa gcgagaactg gagtaggtcg tgtacttgga 120
gcggacgagg aagccaagag ctcggacaga ggcggagagg ggcgggaagc gcaacaggtc 180
acctggagga agccccatac tgacctcctc atgctgctga cacaggcagg atggcattga 240
actcagggtc acctccagga atcggacctt gctatgagaa ccacgggtat cagtctgagc 300
acatctgtcc tccgagacca ccagtggctc ccaatggcta caacttgtat ccagcccagt 360
actacccatc tccagtgcct cagtatgctc cgaggattac aacgcaagcc tcaacatctg 420
tcatccacac acatcccaag tcctcaggag cactgtgcac ctcaaagtct aagaaatcgc 480
tgtgtttagc cctcgccctg ggcactgtcc tcacgggagc tgctgtggct gctgtcttgc 540
tttggaggtt ctgggacagc aactgttcta cgtctgagat ggagtgtggg tcttcaggca 600
catgcatcag ctcttctctc tggtgtgacg gggtagcaca ttgtcccaac ggagaagatg 660
agaaccgttg tgttcgtctc tacggacaaa gcttcatcct ccaggtttac tcatctcaga 720
ggaaagcctg gtatcccgtg tgccaggatg attggagtga gagctacggg agagcagcat 780
gtaaagacat gggatacaag aacaattttt attctagcca agggatacca gaccagagcg 840
gggcaacgag ctttatgaag ctgaatgtga gctcaggcaa cgttgacctc tataaaaaac 900
tctaccacag tgactcatgt tcatcccgca tggtggtttc tttgcgctgt atagaatgcg 960
gggttcgctc agtgaaacgc cagagcagga ttgtgggtgg attgaatgcc tcaccaggag 1020
actggccctg gcaggtcagc ctgcacgtcc aaggcgtcca cgtctgcgga ggctccatca 1080
tcacccccga gtggattgtg acggccgccc actgtgtgga agaacccctc agcagcccga 1140
ggtactggac ggcatttgcg ggaattctga gacagtctct catgttctat ggaagtagac 1200
accaggtaga aaaagtaatt tcccatccaa attacgactc taagaccaag aataacgaca 1260
ttgctctcat gaagctgcag acacctttgg cttttaatga tctagtgaag ccagtgtgtc 1320
tgccgaaccc aggcatgatg ctagacctag accaggaatg ctggatttcg gggtgggggg 1380
ccacctatga gaaagggaag acctcggacg tgttgaatgc tgccatggta cccttgatcg 1440
agccctccaa atgtaatagt aaatacatat acaacaacct aatcacacca gccatgatct 1500
gtgccggctt cctccagggg tctgtcgact cttgccaggg agacagtgga gggccgctgg 1560
ttactttgaa gaatgggatc tggtggctga ttggggacac gagctggggc tcgggctgtg 1620
ccaaggcact cagacctgga gtatacggga acgtgacggt atttacagat tggatctacc 1680
agcaaatgag ggcgaacagc taatccacgt ggctttgtcc cagacttcct ttgtcttcaa 1740
caaccttctg caagaaaacc aagggcctga attttaactt cctgtgcaca atgtaccttt 1800
tgagatgatt cgaagggcct ttcactttta ttaaacagtg acttgtttga ctgtgctccc 1860
tggtcctgtg agggcttcag tgccccaccc ctgggccact tctgcagctc ccaccagaat 1920
ggatgaccag attctgttgg gtttgggcac atagggccaa aggcagagga gggtggcact 1980
ctcatgttgg aacttctttt gggctcatgc tcaggccttt tttggatcac taaggactat 2040
gacctctgag taacctgatg acctgagaaa gagtaaggag gccaggcagg gccttgggcc 2100
caggaacagg taccttgaga gtgagagcta cccattgcct gtggcctaaa tctgctgtgc 2160
aggttgggct ggtcatactg tcatgatttc attaacagcc tgggtgaaca tggctgggag 2220
taaagggctt gctctcctgc atgttgacat gacggccctt tccaagggtg atggaggctt 2280
tcccaagcta agggcctagg cagatctctc agagcaagaa gctaatgccg gcatgtccct 2340
tgggtgagct ctacatggtg ttattcagtc tggttcttgg ctccccacta ctgtttctct 2400
cagcctctca gagcctgaaa cttacctctt agctttggct acaggcatgg cctagtacct 2460
gatggagcct gtatagctca gctaatcaaa tggaggctca ggtccatcag aatcagggac 2520
ttgtgatttc agtcaccttg cttctgggtt gtgtttcttc tcttactacc tcactgcacc 2580
tggacactag agtggatgaa tgtctggagt tcacctgcat ttggactgtg tgattgtgcc 2640
tcagacacta gacctcttcc agatggttag gttgttctgt agactggcaa tgagattaga 2700
agttcctagc ttcagataaa gatgaaagag aggagatcat tgtcttctgt cttcttctgg 2760
ccctgggttt ataccaggaa agccatgcca gaattaccaa atatgaagta tgaatgtctt 2820
acccacggtg aggctctgcc tccttctctc tgcctggttc ttcagaaggc agtgaatggg 2880
tcataactgg gactccatct ttgctgggga aagtctccca cctagggaat ggttaccact 2940
ccatgtaaag aaaactccct catgcgtcct ctgggacctt cttagatgct gtaaggtacc 3000
tacatacaga ctaaatgtgc aagcaccttg aagtgtgaga acctgtcccc tccttagctc 3060
tccttgtctt tgctgttggt tggttatttc ctgctttgtg tctgttctga gctgtgagat 3120
tccactgtga aatatatgaa taaagtatat aattctttta aaaaaaaaaa aaaaa 3175
<210> 2
<211> 490
<212> PRT
<213> 小家鼠
<400> 2
Met Ala Leu Asn Ser Gly Ser Pro Pro Gly Ile Gly Pro Cys Tyr Glu
1 5 10 15
Asn His Gly Tyr Gln Ser Glu His Ile Cys Pro Pro Arg Pro Pro Val
20 25 30
Ala Pro Asn Gly Tyr Asn Leu Tyr Pro Ala Gln Tyr Tyr Pro Ser Pro
35 40 45
Val Pro Gln Tyr Ala Pro Arg Ile Thr Thr Gln Ala Ser Thr Ser Val
50 55 60
Ile His Thr His Pro Lys Ser Ser Gly Ala Leu Cys Thr Ser Lys Ser
65 70 75 80
Lys Lys Ser Leu Cys Leu Ala Leu Ala Leu Gly Thr Val Leu Thr Gly
85 90 95
Ala Ala Val Ala Ala Val Leu Leu Trp Arg Phe Trp Asp Ser Asn Cys
100 105 110
Ser Thr Ser Glu Met Glu Cys Gly Ser Ser Gly Thr Cys Ile Ser Ser
115 120 125
Ser Leu Trp Cys Asp Gly Val Ala His Cys Pro Asn Gly Glu Asp Glu
130 135 140
Asn Arg Cys Val Arg Leu Tyr Gly Gln Ser Phe Ile Leu Gln Val Tyr
145 150 155 160
Ser Ser Gln Arg Lys Ala Trp Tyr Pro Val Cys Gln Asp Asp Trp Ser
165 170 175
Glu Ser Tyr Gly Arg Ala Ala Cys Lys Asp Met Gly Tyr Lys Asn Asn
180 185 190
Phe Tyr Ser Ser Gln Gly Ile Pro Asp Gln Ser Gly Ala Thr Ser Phe
195 200 205
Met Lys Leu Asn Val Ser Ser Gly Asn Val Asp Leu Tyr Lys Lys Leu
210 215 220
Tyr His Ser Asp Ser Cys Ser Ser Arg Met Val Val Ser Leu Arg Cys
225 230 235 240
Ile Glu Cys Gly Val Arg Ser Val Lys Arg Gln Ser Arg Ile Val Gly
245 250 255
Gly Leu Asn Ala Ser Pro Gly Asp Trp Pro Trp Gln Val Ser Leu His
260 265 270
Val Gln Gly Val His Val Cys Gly Gly Ser Ile Ile Thr Pro Glu Trp
275 280 285
Ile Val Thr Ala Ala His Cys Val Glu Glu Pro Leu Ser Ser Pro Arg
290 295 300
Tyr Trp Thr Ala Phe Ala Gly Ile Leu Arg Gln Ser Leu Met Phe Tyr
305 310 315 320
Gly Ser Arg His Gln Val Glu Lys Val Ile Ser His Pro Asn Tyr Asp
325 330 335
Ser Lys Thr Lys Asn Asn Asp Ile Ala Leu Met Lys Leu Gln Thr Pro
340 345 350
Leu Ala Phe Asn Asp Leu Val Lys Pro Val Cys Leu Pro Asn Pro Gly
355 360 365
Met Met Leu Asp Leu Asp Gln Glu Cys Trp Ile Ser Gly Trp Gly Ala
370 375 380
Thr Tyr Glu Lys Gly Lys Thr Ser Asp Val Leu Asn Ala Ala Met Val
385 390 395 400
Pro Leu Ile Glu Pro Ser Lys Cys Asn Ser Lys Tyr Ile Tyr Asn Asn
405 410 415
Leu Ile Thr Pro Ala Met Ile Cys Ala Gly Phe Leu Gln Gly Ser Val
420 425 430
Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Thr Leu Lys Asn
435 440 445
Gly Ile Trp Trp Leu Ile Gly Asp Thr Ser Trp Gly Ser Gly Cys Ala
450 455 460
Lys Ala Leu Arg Pro Gly Val Tyr Gly Asn Val Thr Val Phe Thr Asp
465 470 475 480
Trp Ile Tyr Gln Gln Met Arg Ala Asn Ser
485 490
<210> 3
<211> 3212
<212> DNA
<213> 智人
<400> 3
gagtaggcgc gagctaagca ggaggcggag gcggaggcgg agggcgaggg gcggggagcg 60
ccgcctggag cgcggcaggt catattgaac attccagata cctatcatta ctcgatgctg 120
ttgataacag caagatggct ttgaactcag ggtcaccacc agctattgga ccttactatg 180
aaaaccatgg ataccaaccg gaaaacccct atcccgcaca gcccactgtg gtccccactg 240
tctacgaggt gcatccggct cagtactacc cgtcccccgt gccccagtac gccccgaggg 300
tcctgacgca ggcttccaac cccgtcgtct gcacgcagcc caaatcccca tccgggacag 360
tgtgcacctc aaagactaag aaagcactgt gcatcacctt gaccctgggg accttcctcg 420
tgggagctgc gctggccgct ggcctactct ggaagttcat gggcagcaag tgctccaact 480
ctgggataga gtgcgactcc tcaggtacct gcatcaaccc ctctaactgg tgtgatggcg 540
tgtcacactg ccccggcggg gaggacgaga atcggtgtgt tcgcctctac ggaccaaact 600
tcatccttca ggtgtactca tctcagagga agtcctggca ccctgtgtgc caagacgact 660
ggaacgagaa ctacgggcgg gcggcctgca gggacatggg ctataagaat aatttttact 720
ctagccaagg aatagtggat gacagcggat ccaccagctt tatgaaactg aacacaagtg 780
ccggcaatgt cgatatctat aaaaaactgt accacagtga tgcctgttct tcaaaagcag 840
tggtttcttt acgctgtata gcctgcgggg tcaacttgaa ctcaagccgc cagagcagga 900
ttgtgggcgg cgagagcgcg ctcccggggg cctggccctg gcaggtcagc ctgcacgtcc 960
agaacgtcca cgtgtgcgga ggctccatca tcacccccga gtggatcgtg acagccgccc 1020
actgcgtgga aaaacctctt aacaatccat ggcattggac ggcatttgcg gggattttga 1080
gacaatcttt catgttctat ggagccggat accaagtaga aaaagtgatt tctcatccaa 1140
attatgactc caagaccaag aacaatgaca ttgcgctgat gaagctgcag aagcctctga 1200
ctttcaacga cctagtgaaa ccagtgtgtc tgcccaaccc aggcatgatg ctgcagccag 1260
aacagctctg ctggatttcc gggtgggggg ccaccgagga gaaagggaag acctcagaag 1320
tgctgaacgc tgccaaggtg cttctcattg agacacagag atgcaacagc agatatgtct 1380
atgacaacct gatcacacca gccatgatct gtgccggctt cctgcagggg aacgtcgatt 1440
cttgccaggg tgacagtgga gggcctctgg tcacttcgaa gaacaatatc tggtggctga 1500
taggggatac aagctggggt tctggctgtg ccaaagctta cagaccagga gtgtacggga 1560
atgtgatggt attcacggac tggatttatc gacaaatgag ggcagacggc taatccacat 1620
ggtcttcgtc cttgacgtcg ttttacaaga aaacaatggg gctggttttg cttccccgtg 1680
catgatttac tcttagagat gattcagagg tcacttcatt tttattaaac agtgaacttg 1740
tctggctttg gcactctctg ccattctgtg caggctgcag tggctcccct gcccagcctg 1800
ctctccctaa ccccttgtcc gcaaggggtg atggccggct ggttgtgggc actggcggtc 1860
aagtgtggag gagaggggtg gaggctgccc cattgagatc ttcctgctga gtcctttcca 1920
ggggccaatt ttggatgagc atggagctgt cacctctcag ctgctggatg acttgagatg 1980
aaaaaggaga gacatggaaa gggagacagc caggtggcac ctgcagcggc tgccctctgg 2040
ggccacttgg tagtgtcccc agcctacctc tccacaaggg gattttgctg atgggttctt 2100
agagccttag cagccctgga tggtggccag aaataaaggg accagccctt catgggtggt 2160
gacgtggtag tcacttgtaa ggggaacaga aacatttttg ttcttatggg gtgagaatat 2220
agacagtgcc cttggtgcga gggaagcaat tgaaaaggaa cttgccctga gcactcctgg 2280
tgcaggtctc cacctgcaca ttgggtgggg ctcctgggag ggagactcag ccttcctcct 2340
catcctccct gaccctgctc ctagcaccct ggagagtgca catgcccctt ggtcctggca 2400
gggcgccaag tctggcacca tgttggcctc ttcaggcctg ctagtcactg gaaattgagg 2460
tccatggggg aaatcaagga tgctcagttt aaggtacact gtttccatgt tatgtttcta 2520
cacattgcta cctcagtgct cctggaaact tagcttttga tgtctccaag tagtccacct 2580
tcatttaact ctttgaaact gtatcatctt tgccaagtaa gagtggtggc ctatttcagc 2640
tgctttgaca aaatgactgg ctcctgactt aacgttctat aaatgaatgt gctgaagcaa 2700
agtgcccatg gtggcggcga agaagagaaa gatgtgtttt gttttggact ctctgtggtc 2760
ccttccaatg ctgtgggttt ccaaccaggg gaagggtccc ttttgcattg ccaagtgcca 2820
taaccatgag cactactcta ccatggttct gcctcctggc caagcaggct ggtttgcaag 2880
aatgaaatga atgattctac agctaggact taaccttgaa atggaaagtc atgcaatccc 2940
atttgcagga tctgtctgtg cacatgcctc tgtagagagc agcattccca gggaccttgg 3000
aaacagttgg cactgtaagg tgcttgctcc ccaagacaca tcctaaaagg tgttgtaatg 3060
gtgaaaacgt cttccttctt tattgcccct tcttatttat gtgaacaact gtttgtcttt 3120
ttttgtatct tttttaaact gtaaagttca attgtgaaaa tgaatatcat gcaaataaat 3180
tatgcaattt ttttttcaaa gtaaaaaaaa aa 3212
<210> 4
<211> 492
<212> PRT
<213> 智人
<400> 4
Met Ala Leu Asn Ser Gly Ser Pro Pro Ala Ile Gly Pro Tyr Tyr Glu
1 5 10 15
Asn His Gly Tyr Gln Pro Glu Asn Pro Tyr Pro Ala Gln Pro Thr Val
20 25 30
Val Pro Thr Val Tyr Glu Val His Pro Ala Gln Tyr Tyr Pro Ser Pro
35 40 45
Val Pro Gln Tyr Ala Pro Arg Val Leu Thr Gln Ala Ser Asn Pro Val
50 55 60
Val Cys Thr Gln Pro Lys Ser Pro Ser Gly Thr Val Cys Thr Ser Lys
65 70 75 80
Thr Lys Lys Ala Leu Cys Ile Thr Leu Thr Leu Gly Thr Phe Leu Val
85 90 95
Gly Ala Ala Leu Ala Ala Gly Leu Leu Trp Lys Phe Met Gly Ser Lys
100 105 110
Cys Ser Asn Ser Gly Ile Glu Cys Asp Ser Ser Gly Thr Cys Ile Asn
115 120 125
Pro Ser Asn Trp Cys Asp Gly Val Ser His Cys Pro Gly Gly Glu Asp
130 135 140
Glu Asn Arg Cys Val Arg Leu Tyr Gly Pro Asn Phe Ile Leu Gln Val
145 150 155 160
Tyr Ser Ser Gln Arg Lys Ser Trp His Pro Val Cys Gln Asp Asp Trp
165 170 175
Asn Glu Asn Tyr Gly Arg Ala Ala Cys Arg Asp Met Gly Tyr Lys Asn
180 185 190
Asn Phe Tyr Ser Ser Gln Gly Ile Val Asp Asp Ser Gly Ser Thr Ser
195 200 205
Phe Met Lys Leu Asn Thr Ser Ala Gly Asn Val Asp Ile Tyr Lys Lys
210 215 220
Leu Tyr His Ser Asp Ala Cys Ser Ser Lys Ala Val Val Ser Leu Arg
225 230 235 240
Cys Ile Ala Cys Gly Val Asn Leu Asn Ser Ser Arg Gln Ser Arg Ile
245 250 255
Val Gly Gly Glu Ser Ala Leu Pro Gly Ala Trp Pro Trp Gln Val Ser
260 265 270
Leu His Val Gln Asn Val His Val Cys Gly Gly Ser Ile Ile Thr Pro
275 280 285
Glu Trp Ile Val Thr Ala Ala His Cys Val Glu Lys Pro Leu Asn Asn
290 295 300
Pro Trp His Trp Thr Ala Phe Ala Gly Ile Leu Arg Gln Ser Phe Met
305 310 315 320
Phe Tyr Gly Ala Gly Tyr Gln Val Glu Lys Val Ile Ser His Pro Asn
325 330 335
Tyr Asp Ser Lys Thr Lys Asn Asn Asp Ile Ala Leu Met Lys Leu Gln
340 345 350
Lys Pro Leu Thr Phe Asn Asp Leu Val Lys Pro Val Cys Leu Pro Asn
355 360 365
Pro Gly Met Met Leu Gln Pro Glu Gln Leu Cys Trp Ile Ser Gly Trp
370 375 380
Gly Ala Thr Glu Glu Lys Gly Lys Thr Ser Glu Val Leu Asn Ala Ala
385 390 395 400
Lys Val Leu Leu Ile Glu Thr Gln Arg Cys Asn Ser Arg Tyr Val Tyr
405 410 415
Asp Asn Leu Ile Thr Pro Ala Met Ile Cys Ala Gly Phe Leu Gln Gly
420 425 430
Asn Val Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Thr Ser
435 440 445
Lys Asn Asn Ile Trp Trp Leu Ile Gly Asp Thr Ser Trp Gly Ser Gly
450 455 460
Cys Ala Lys Ala Tyr Arg Pro Gly Val Tyr Gly Asn Val Met Val Phe
465 470 475 480
Thr Asp Trp Ile Tyr Arg Gln Met Arg Ala Asp Gly
485 490
<210> 5
<211> 27947
<212> DNA
<213> 人工序列
<220>
<223> 重组多核苷酸
<400> 5
gcagagtcta agaaatcgct gtgtttagcc ctcgccctgg gcactgtcct cacgggagct 60
gctgtggctg ctgtcttgct ttggaagttc agtaagtgca gggagcctcg atcccaccat 120
gtgctcctgc agtccccagt gctctgagcc agaccctgct ctctgggcta ttgagacctc 180
tggaggccct ccgtgaggtt cctctcttac ataacgaggc tgtctctctt cccttctctt 240
gtttagctat gagattgaca catcatgggg aaagcattta gaatgtaccc agtgctttgg 300
ggtgcttggt gccacccagc actgtgagca caggttcttc taccttgggg ccacacccag 360
ttacctgtat ctcactgcac agcagtggct gttggggacc aggcccaccc ctccatgtcc 420
cacctcctgc aactgcagcc tgagccttcc catcagcctg gggtggtgca gacccatgtg 480
ccattgtgga tccttcaagt tacctgtgtg gcagagagga cgtgtgagtg ccgtccaaac 540
ccaaacactg agagggtcct tcccattgcc cccacggaag taaggtgccc cagtgctaat 600
tccacttata cttgctggtg gcaaggacac ttctcctcct tattaaagtg ggggattggc 660
tgggtgaggt ggctcacgcc tgttatccca gcactttaag aggccaaggc aggtggacca 720
cctgaggtca ggagtttgag accacaagcc tggccaacat gttgaaactc catctctact 780
aaaaatacaa aaattagtca ggcgtggtgg cgtgcacctg taatcccagc tacttaggag 840
gctggggcag gaggatcact tgaacccagg agttggaggt tgcagtgagc caagattgtg 900
cccctgcact ccagcctggg tgacagaatg agacttcatc tcaaaaacaa aacaaaacaa 960
aacacagtgg ggccaggagt tggaggctgc agcgagctac agtaatgcca cggtgttcct 1020
cactccatga ggctcattgc gtttctcagc ctgaagggca cctctcttct gttttctctg 1080
caagtgggca gcaagtgctc caactctggg atagagtgcg actcctcagg tacctgcatc 1140
aacccctcta actggtgtga tggcgtgtca cactgccccg gcggggagga cgagaatcgg 1200
tgtggtgagt cagccttgac cttgggaagg gactcctctg ctcaccttgg agacagcagc 1260
cgggtccagg ggcctttggg tgactgggcc tggcgtgcgt ccagtacgct gacacatgat 1320
gtcattgaat ccctgctcca ggctgagccc tggggctcag agaggttgtg tttccggccc 1380
aacctcaccc agcaggtggg agatgacagg gccaccgagg actgtgtcat tggaaccaca 1440
cgtgctctga actgccacag gaagtcagtt aagatgagca aactgtttat aaagttggag 1500
atgcaggcta ggaacggtgg ctcatgcctg taatcccagc actttgggag gccgaggcag 1560
atggatcacc tgaggtcagg agtttgagac cagcctgacc aatatggtga aaccttatct 1620
ccactaaaaa tacaaaaatt agccaagcgc ggtggcgggt gcctgtaatt ccagctattc 1680
aggaggctga ggcaggagaa tcacttgaac ctgggaggcg gaggttgcag tgagctgaga 1740
tcacgccact gcattccagc ctgggagaca gagctggctc aaaaaataaa ttaattaatt 1800
aaaaacaaaa ttggagatgc actatgttat tttcaaaaca agctgccttt aaagatctat 1860
ctgttgtcac agggtgggct catctgtttc attttatttt ctgtggttta tctatttatt 1920
cattttaatg aactaggaag cattgctcct atttatggca taccacatga tgtttggata 1980
cgtgtatgcc tgtggcatgg ctaagtcaag ctagaacatg ggccttacct catatacgtg 2040
tcttattaag aacacataaa acctactctt gtagtgattt tcaaatatgc aacatatagt 2100
ttattaactg cagtcactat gatgtacaat agattgctcg aacttattcc tcctgtctaa 2160
ctaagatttt gtgacctctg accaacatct ccccagtgtt gtcacccccc gcccccagcc 2220
tctgatagct gcctttctac tctctgcttc tgtgagtttg atgtttatac attccacatg 2280
taagtggcct catgcagtgt ttctgtctct gtgtctggct tgttcactta gcgtaatgtc 2340
ctccagcttc atctatgttg ttggaaatga caggatttcc ttctttcttg tggctgaata 2400
gtattgcctt gtgcatatac accacatttt ctttatccct tcattcactg atggactctt 2460
aggttgatgt catgtcttgg ctgttgtgaa aaatgccgca gtgagcgtgg gcgtgcaggt 2520
ccctcttcaa cacacggatt tcctttcctt tggatataaa cccagcagtg agattgctgg 2580
atcacatggc agttctgttt ctcacctttt gaggaaactc catactgttt tccataatgg 2640
ctgtagcaac ttccactccc acccccacgg tgcaaagtct ccatttctct tctacaacct 2700
caccaactcc tgttattttc catctttctg atagtagcca tttgaagagg tatgagatga 2760
tacctcattg tggttttcat ttgcattttt atttgtattt ttcatgaatt tttgagggtg 2820
atttcaaggg tagttagtga ctcgaacagg gaaacgatcc tgagtatgag ggttgtgcta 2880
atcatccccc tcctgccagc tgcgtacgga atggggctct gcagatggca gggagctggc 2940
tcgtttctct ttaagagctg ccttttactt ttcttcctct tcctttaaaa cttatttcct 3000
ggccggacgc agtggctcat gcctgtaatc ccagcacttt gggaggccga ggtgggcgga 3060
tcacgaggtc aggaattcca gaccagcctg gccaacatgg tgaaaccccg tctctactaa 3120
aaatacaaaa attagccaga cgtggtggtg cgggcctata gtcccagcta ctcgggaggc 3180
tgaggcagga gaatcacttg aacctgggag gagggggttg cagtgagccg agattgcgcc 3240
actgcactcc agcctgggcg acagagccag actccatctc aaaaaacaaa aaaaagttat 3300
ttcccaagca cagccatgta ttccaggctt gtggatcagc gttggtggtg gtgtgtgctc 3360
tcatatctta gttccagcta agcacactct gacatgttta cactagaacc atttgttttt 3420
tctagaaata gaaatttcag aattgtagag tcagaggact taccagaaat ctcttaggta 3480
gttctcctcc cctccctcaa gtgcagtcct aacctcctgg agttttctgt agaaaccaca 3540
agcctcagag ctggccgaga attctagcca aagatttttc catgccaaag taatcccccc 3600
tctcctaagg gccatccttg gtggggactg gtttcctgtt aagccctcgc tgtcagtcct 3660
ggctgtggaa tttcctggtg aggagcactg gcccgtggag ctcggccctc gtgccggcct 3720
tgagcaggcc caagtgttcc gtgttcttga tacctttcct ccagcacagt cttgcttccc 3780
agaaaaaggt ttgcacttga aaatgatgca tttgctgatt aaacatagtt cttttgcttt 3840
atttggtttc taaaataaag tgggagtttt tgagattgag taacgtgagg ttaagatagc 3900
acgtggaatg gctttttctt ttctttctat tttttttttt tttttcctgg agacagggtt 3960
tcactctgtt gcccaggctg gagtgcagag gcatgaccat ggctcactgc aacttcgatg 4020
tcctggggtt aagcgatccc ccagcctcag ccccccaagt ggctgggact acaggtgctc 4080
gccaccacac ctggctaatt tttgtatttt ttgtagaaaa tgggtttcat caatgttgtc 4140
cagactggtc tcgaactcct gacctcaagc aattctcctg cctcagcctc ccagactgct 4200
gggattacag gcgtgaacta ccacgcctgg cctggaatgg cttttgatgt tctcctatgt 4260
gcacatgtgg gtgaataaac accaacaaag tccttatgtt acctgaagag ttgctctctt 4320
cttaatattt aagtcgtatt tatttaaata ctttaatagt tgtacactat taaagtatta 4380
ttaggtcaaa atcaaggaag tacaaaaggg tatgctgtga aaaatctctt cttccttgct 4440
ctgcttactt acctaccccg catcccccca tacaccccag acacacacac acacacacac 4500
acacacacac acacacgcat cactcccata catgcccacc tgtttaccag ccaatcacat 4560
ttcttggggc aactcatctg agttgcttct ctttccagag agtttttgca taaagaagca 4620
caggtatttc tgcgttacca tgaccctatt tcccagtggt tcctagccag ttgactctcc 4680
tgcactggat accatcctgg acagcattcc ttagggaaat gagccccctg ttttttccca 4740
ccatggcaca gttggtcctt tgcatggacg caccattatt gcccctgtct cttcttggtg 4800
gaccttaagg ttttctccat ccttttgctg taacacacac tgctccaagt gtgtgagcat 4860
atcagtagga aacgcttcca ggagtagaac tgctaggtca gagggcgtgt ggatctgtaa 4920
cctgacagac ctagaccggc ttcagtttgg ttttatccag tttccatatt gattattcat 4980
ataaaaggaa acagacaaac ataacgctgt gcatgtattc tctcttagac cagaacaggc 5040
atagggtgca cttttaattt gtccatttcg tagagtagaa attgtttttg ctgaaatgaa 5100
caccttagga tgctgaagaa tatgacccgt cccatggaaa acattcaaaa atgtgtgtag 5160
cgctttcttc ccaagggtgt gtgtgcgcat attttaacac taattcactt tctacttccg 5220
ttgctatcct ttctgtgagt ctttctcaga atctcagaaa agaaactaaa ttgttcactc 5280
tagttatcaa tgctgtactc tatacctgga atttgctaaa agggcagatt ttaagtattc 5340
tcaccacaga aaagagaaaa gaaaatggta attatgtgac gtggtggaca tgttaactag 5400
ctttattatg gtgagcattt cacagcggat atccagtcat cacgctgtac acattaaaca 5460
tgtacaattg ggtttttttg agacaaggtc tccttctgtc acccagtctg gagtgcagtg 5520
gctcagtcat ggctcattgc agcctcgacc tcctgggctc aatccatcct tccccctcag 5580
cctcctgaaa agctggggcc acaggcatgt accatcatgc caggctaatg catatatatt 5640
tatatttttt ggtggagatg gggttggtct cgaactctgg gctcaagtga tcctcccgcc 5700
ttgcccttcc aaagtgctga gattacaggc atgaaccaca gcaccaggcc tacatgtaaa 5760
atttttattt gtcaactata ctttgacaaa gctgagaaaa aaaatcctaa tatttaaaaa 5820
aaaaaaaaaa aggactagct tgagaccttt tccagctctc tggcttatca gctgccgtct 5880
cttccgggtg cagatagctg gaagggaaag aaaatcccta aaattaccca caagccaaga 5940
atgaagtgtc tccctttgag ccacagtggc agttttgttt ttaatcatag aagtgtattt 6000
tgagccgggt gtgctggctc acgcctgtaa tccccgcact ttgggaggcc gaggtggggg 6060
gcggaggggg tggggatcgc ctgaggtcag gagttcgaga ccagcctgac caacatggag 6120
aaaccccgtc tctactaaaa atacaaaatt agccggcgtg gtggtgcatg cctgtaatcc 6180
cagctactca tgaggctgag tcaggagaat ctcttgaacc caggaggtgg aggttgcggt 6240
gagctgagat catgccattg cactccagcc tgggaacaag aaaaaaaaag aagaagaaga 6300
agaagtgtat tcatttcagt tacttttaaa aaagtgaaca gactttatat tttagagcgg 6360
ttttaggttt acagaaaatg aaacagacag ggcagcgagc tccttgtact cctccccagc 6420
acacagttgc cctgttatga acatcccaca tcagtgctgt gcgttcatta acaccgatga 6480
acctgatgca tacattatga tgaactgaag tcctggactt caccctttct cttgtacagt 6540
tctgtgggat ttgacaaatg cataatgctg tacagccaca atgatagtat cgtccagagt 6600
agttctcctg ccttaaaacc tcttttgctg cacctgtttc tctctcccca ctcaccccag 6660
ctatctgatc ttcttagtgc ctccgaagtt ttggtctttt caggatgttg tagcgttgga 6720
atcatggagt atgtagcctt caccacatac accttccttc actttgttgg cttcctttac 6780
ttagtaatat gcattcaagt ttcctccatg ccttttcatg gcttgatagc tcatttcttt 6840
ttagcaccaa ataatattcc gttgtccaga tgtagcacaa tgtttatcca ttcatgtaac 6900
ctgtgaccga ctcacagata ggatgtggaa tcactcacca cagaggcatt agacaataat 6960
cagacccaag tcatttcatg ggggaacaag cccacaggta ccagactgtc cagtgagtca 7020
gggccactcg taggaagtaa gaagagaggc tagagcatag ccaggtcctc actttatact 7080
ttaagcccat gtgtatttct cccaaaccac acagcattgt ttccatgctt tcagctttgc 7140
atgaataacg tgatacttga acgcatcatt tatcacttgc tctctttccc acagcgctgt 7200
tttcaagctt cttcctgttc atgatgctct gcttaaccct taagctgcat gggattctgt 7260
tctgtgaata cgcccacccc atgtattatc ctgcccagca aaaagtcccc aaaactctgg 7320
atggtggtta cctctaggga gggagagaag agattgggaa tagggagcga cttcaacggt 7380
gtttgtaatg ttttgtttct ttaaataaaa gagctgagat catttcagca gaatgttgat 7440
ttagagtctc ctggacaatt tgttgctcaa agtgctctct taaagagcac tttaaaaaaa 7500
aaaacctttt atcttattat ttatttattt atttattgag acggagtttt gctctgtcac 7560
ccaggctgga gtggagtggt gtgatctcag ctcactgcaa cctttacctc ctgggttcaa 7620
gcaattcccc tgcctcagcc tcccaagtag gtgggattac agatgcgtgc caccacactt 7680
ggctaatttt tgcattttag tagagatcgg tttctccatg ttggccaggc tgatctcaaa 7740
cgcctgacct caggtgatct gcccgccttg gcctcccaaa gtgctggtat tacaggcgtg 7800
agctaccatg cctggcttat cttatatatt tttaaaaaca gcttattgag atctaattta 7860
tgtaccataa aattcaagta tataattcag tgcttttata tataaaacat atatatgaaa 7920
tagcttattg agatataatt ttttatataa aacagcttat tgatatgtaa tgtatgtacc 7980
ataaaattta aatatataat tcactggctt ttatatattc acgaatatgt gcaactatca 8040
ccacagtcaa ttttagcata ttttcatcag ctcataaaga aaccccaagc ccttgaacta 8100
tcaccccata tccctcctcc cagcccgtcc ctcctactca taagcaacca ctaatctact 8160
tagtgtctat agatttccta ctctaggcat tccatgtgag cgggatcatg caatacgtgg 8220
gctcacacaa tataagtggc attccatgtg agtcggctca tgcagtatgt ccggctcctt 8280
tcactgagca taaggtcttc agcactcatc caggttgcag cctgtgtctg aatttcattc 8340
cctcttctgg ctgaatcgta ttccattgtg tatcttggac atatcctatt ctgctcaccc 8400
agccgttggt gggcgtttgg agtgttttcg cctttcagct gttttaagag ggttgcagtg 8460
aacatttgta caagttttgg acccaatgcc tgttttcaat tctcttgtgt agagagcact 8520
ttttagcaga aaaagaatag atttgtggcc tccctttgtg tgcggtcagt gccttgagaa 8580
gagtgaactg tgctgccacc tccggagccg tggagagcgc ggggcttggg tagcagctag 8640
gacgatacaa gttgggacaa ggccaggtgc aatggctcac gcctgtaatt ccaacacttt 8700
gggagaccga ggcaggggga tcacctgagg tcaggagttc aagaccagcc tggccaacat 8760
ggtgaaaccc catctctaat aaaacagaaa aattaactgg acggggtggt ggacgcctgt 8820
aatcccagct actcgggagg ctgaggcagg agaatcactt gaacctggga ggcggaggct 8880
gcagtgagtg gagatcagac cactgcactt cagcctaggt gacagagcga gactccgtct 8940
caaaaaaaag aaaaaaaaag aaagaaactc atggataatc ctccctctcg tgcagttcgc 9000
ctctacggac caaacttcat ccttcaggtg tactcatctc agaggaagtc ctggcaccct 9060
gtgtgccaag acgactggaa cgagaactac gggcgggcgg cctgcaggga catgggctat 9120
aagtgagtat ggggcagcac ccgccgagtg acagtaacag acagcagaaa cacgagaaga 9180
ccctctctct gcctccctgt gaaagcaccg gcacatgagt gctggggaca attgtcacct 9240
tccaaaagct gagccctata accagcaggt ggaatttgtc ctgctagggc tgtgcccagc 9300
acacagacct tggctcactg ccaccttgcc ctgcctcctc cttggcctct atagactcct 9360
ggttgctcgg gagtgcccag tgctgtggtc atctggtcag aggggtaggc tgagggcgtt 9420
aggtgcctct ttttccaagg tgcctctcag ccagggtcca ttcacctccc tgggtagagg 9480
ttggaccaga acagctggcg aggagggttg ggctggggag agcagcagag acaaatcctg 9540
tgccagtttc acttcattcg ggagccatgg aagccttttg agctggggag agaatcaatc 9600
aatcagactg atacttaaaa aatgtcattc ctgctcgtag ctctgaggga aggtgggaag 9660
gcttaacagg gtgtgtgtcg cctgacagtg attcctaacg ggggtggggc ggtggttacc 9720
atttaccagc actgcctggg gagatgcggc agccctcagg catcggggga gagggtggta 9780
ggatgctact gccactttgt tttccatggg agggtcccca ggtgatttct atgcaacttt 9840
agggtattca atatgccagt tttcagaatg aattaccact cggtgagaaa gttggcatct 9900
tagctagtca ctgtgacatc cctaaacagc aggggtgaat tacacagcaa agccccccca 9960
tcacagtcca ggaacctggt ggaattgata actggggcca tgttaacatc tgtacctttt 10020
attagattaa atgtgtgtat gattatacaa tcctatgtcc ttctcatagt ttcttgatcc 10080
taacctggat aagaaacacg accaatgaag gaattttgtc tgacacttta gggttattga 10140
atcgaaaaat cgttacaata ttctagcact tggttagaac gtgtgatttt ttttcctaaa 10200
tgctaaggtt tttccctctt attctgaatg tcgtatgagc ggtattatga catagtatag 10260
gatttgtgtt tgcttatgcc ttaaccatta tcacaaataa ggttttcttt tttaggaata 10320
atttttactc tagccaagga atagtggatg acagcggatc caccagcttt atgaaactga 10380
acacaagtgc cggcaatgtc gatatctata aaaaactgta ccacaggtat gcagcaattt 10440
cttcttgaaa aattttggaa tgaaatcaac taggagacac catggggaat cgttgtcctg 10500
agtctgattt ctctgagctg caatactcgg tctggatggg ttttgcattg ggaggagatt 10560
agagtctgac caggcctggt tactctaagc agcccttggt ttattcatag gaagtggctg 10620
aggtttctct gctatttcat tttcagcctc taccgtctgc ccttgttggt agcggctcac 10680
acttgcaaca tcgacattca actctattta gttttctttc ctcttcagac atttagaggt 10740
gtacctattt tgtcagggcg tggttctagg aatccaagat aatgtctcag tgtcccagcc 10800
agggtgaccg gctcattcca gtttgccagg gacttcactg gcttgagcaa gggaagtcct 10860
gctccattcc aggcagctgg gctggctggt cccgttagcc ccaaccccgg gacagcagtg 10920
ccagagggtg ctctgtgagg gatgggcagc attctggcgg cctgggaatg agttgtggtg 10980
tttccagggg gtagaagtgg gtacaagcca caggtcacat gatgagtggc tgacctggct 11040
gggagggcag aagaggggat ggacttaggc tcttcctttt gctttgcaca tatttaggat 11100
gtttgcagac ttgctatgat tgttgctgtt atgtgttttc tgatgtgaaa gatacacagt 11160
gtcctttgcc catgagctct ccttgcctcc caggtcccca gggcttatgc ctggtgtcta 11220
ggcatcacct ccctgcctgc caggtgccag gtgctgcatt tcgggggagg atgaactaat 11280
caccccgcgc cacctttcct ctgagtggga gcctggggca ggtttgcatt cctggaggcc 11340
gctggtggag gggtctgggg gcctgacttc cactgcagcc tgctgtcctg gggaatgtgg 11400
cagggcaagc ccagtgggga gggctgtgca cggccaggtg cacccatcaa aacagcaggg 11460
ctgcggtttg tccctgtgga gaagctaaac acagctgcct gggcactttg taaatgctga 11520
gtggttcttt gtctttctgg gttacacacg gaatcaggga gccaagtcca gccgggcagg 11580
gacgggggga ggggaggagg tgctgccgtc ccttggcaag agccttggga actcacaagg 11640
aggctggagg gcttggaaga aagaagagaa ggccattgtc tggtaggctc tattctatct 11700
cggtggtggt ggtgggggga ggcgcacttc ttttcctctt tctgtgcagc agttgccctt 11760
tgatgcctga gttcttggct tgttttctgt cgggcttctg tgaataacca catgtgccct 11820
ggcgctgtga ccacacaggg ctatccctac cgaccttagg attcttagga aatgtcttct 11880
cttaaagggg acatgtcttc acttggccgt gtcagtgccc cagagccaga gtccacctgg 11940
aatgcacctg tagtcactga gaacccgggg ggtgtgcctt agtaagaagg tgtcaggaag 12000
gacctattat tgtagggcct gggctcctgc aaggtggttt gggggtggtt ggaggaagca 12060
gagatttgct ctggattgga tgctgtcagg aagcaggggt aattctgtga ggctgcttta 12120
ttattttttt tctaggagga ggttggaatg aggctaggct aaagctgtga ttggtaaaga 12180
aacgtccgtc gctcaagtta gccaggacag gaggagacat cagatcgtga ttttgtggtt 12240
gtgagcacaa ggttcctgtt ctgtctgttc agacatcatt tcggaggagg ctccttgtgt 12300
cttgccccat ctcaggcatg gaggggccta gtccgatatt gacgctcagt gaaataattc 12360
aggttccgca gagcacacgg cccagctatc agggcgggcc agctctgcat gccaggggcc 12420
gcgtcttccc ttctcagcat agcctgggaa attcactgca ggacaaaatg catcagttac 12480
ttcctcttca tccataacct gggatgtttg actcccaaat gagtaactct tacgtttctt 12540
ctaatcctag ggaaactatt ggttatattg ctttcaacac tacaaattta aagcagttat 12600
aggagcccag aggtttccaa atggcttcct taaaaattag aagatgattt taaattccaa 12660
gaggaaaaac aaaactagca ttattgtata cttaccctca caaccgtcct aggagctggt 12720
acaattttaa gagaggttaa gtaacttgcc caaggtcaca ctgtggggat gtgagccgcg 12780
taccttggct cagtgtctgg tctttgccac tgtccctata tggatttact taccttattg 12840
gagttgtaac tagcagaccc ttctatgtct cagaagacag gagagggaac atcggaagaa 12900
atgactgatt tctaagcatg tgagaggcag gtgactccgc actatcgtga ccagaatttc 12960
ccctgttctt tttgcagtga tgcctgttct tcaaaagcag tggtttcttt acgctgtata 13020
ggtaagttca tctggagtcc cccttttgat acttctaact aggaaaagct ctctactttc 13080
agaacagtac tccctgtgtc tctgggggcg tgggagggaa gaaggtgggg tcacgggttg 13140
gaatgtgccc agcggcgtct cgctctttcc aaggagctcc tggtttagat ttccatggcc 13200
tgtagacacc ttcagccttg ggtccaaggg acaccccctg agatcaggca cgctcaagaa 13260
gctgacaaag ccctacactt tatgccaccc atgagctgga ggcccggcag gtctctttct 13320
ccagaaagca aaggggggtg gcgttagtga gccctggcag ccacctaacg tggacttgga 13380
gcatctgcgg ggctgtggtc cagcaccacc gtgtggccac caggtgctca tcagccagtg 13440
ggacccggga ggagggacaa gaccagagaa caacagtgct cttgcctctt ctctcctgaa 13500
ttttggacgg tggcttagac ttgggtgtcc ccatctctgt gtttagagtg cttacagttt 13560
ccaaactgtt tgcaaatgtg gaagccaccg tccctctcct ctgggatggc ccagtgctgt 13620
cgtggggccg tggtcctgag ctcagctttt catttgaaga ggtggaagga gctgacaccg 13680
tcccatcccg gcagggctgg ctcaggtctt ctttaggtcc tgagtggggg tccagcacag 13740
ccccaagggt gcgtggcacc cgccctgccc tctgcccatg cactcatctc ctggtggaga 13800
agacactcac acacaggaag cagggaaggc agcagacctc actcacccct caccccctca 13860
ctcaccccct actcaccccc tcaacctctc attcaccacc caccccctcg ccccctcact 13920
caccccctca ctccctcaac cctcactcac ctcctcactc cctcaaccct cactcacctc 13980
ctcacctcct cactctcccc ctcatccctc cctcacccca ccccgtcacc tcctcactca 14040
cctcctcacc ccctcactca cccttcaccc cctcactcac cacctcacct cctcactcac 14100
cccctactca acccctcatt cacccctcac cccctcactc acccctgcac cccctcactc 14160
accccttcat ccactcaccc acctgctcac ctcctcactc aacccctcac cccctcacta 14220
atccctcact ccctcacccc ctcacgccct cactcacacc ttcacctcct cactcacccc 14280
ctcaccccct caacccctta cttaccccct cactcatccc ttcacccctc actcaccccc 14340
tctctcaccc attcaccccc tcactcatgc cttcaccccc tcactcacct cctcactcac 14400
accttcaccc ctcagtcacc ccctcactca ccccttcacc ccctcaatca tgccttcact 14460
ccctcactca ccccttcacc ctctgaatta ctccctcatc ccctcactca ccccctcact 14520
caccccttca ccccctcacc caccacctca cccacccctc acccaccccc tcacctcctt 14580
acccctcacc cccctcactc acccctcacc ccctcactca ccacctcacc cacccctcac 14640
ccaccccctc actcactccc tcatcccctc actcaccccc tcaccccctc actcaccccc 14700
tcacccaccc ctcacccacc ccctcacccc ctcactcacc ccttcacccc ctcactcacc 14760
ccctcactca ccccttcacc ccctcactca ccacctcacc cacccctcac ccaccccctc 14820
actcactccc tcaccccctc actcaccccc tcaccccctc actcaccccc tcatctcctc 14880
actcaccccc tcacctcctc actcacccgc tcacctcctc actcaccccc tcgccccctc 14940
actcacccct caccccctca ccccctcact cacccctcac cccctcgccc cctcactcac 15000
cccctcgccc cctcactcac ccctcacccc ctcaccccct cactcatccc ctcacctcct 15060
cactcacccc ctcacctcct cactcacccc ctcacctcct cactcacccc ctcacctcct 15120
cacccacccc ctcactcact ccctcacccc ctcaccccct cactcacccc ctcacctcct 15180
cactcacccc ctcacctcct cacccacccc ctcactcact ccctcacccc ctcaccccct 15240
cactcacccc ctcacctcct cactcacccc ctcacctcct cactcacccc ctcacctcct 15300
cactcatgcc ctcaccccct cactcaccct ttcacctcct tgctcatccc ctcacttacc 15360
ccctcacttc gtcaatcacc cccccacctc gtcaatcacc ccctcacctt ttcactcacc 15420
ccctcactca cccccttact tcctcactta cctcctcacc ccccactcac cccctcaccc 15480
cccactcacc ccctcacccc acactcaccc cctcaccccc cactcacccc ctcacccctc 15540
tcacctcctc actcaccccc tcacctcctc acttatcccc tcaccccctc aattaccccc 15600
tcaccccctc aattactccc tcatcctttc aattacccac tcaccccctc acctcctcac 15660
tcctcactca ctccctcact caccccttca ccttctcact cacctcctcg tctcctcacc 15720
ccctcactca cttccagccc tgcccctccc atcttccttt tctttgtgtg agaatctggg 15780
gtccctgagt ggtgtcagtc cctccaagac tcaaggagtc cccagggcct tgttatccag 15840
aacaccccca cctgggtccc gggagacccc atgggatcac aggagtgttc agggaagtgg 15900
tgcttcctgg gtctgggtgg gctggagggg catcctccct tccccaagag gagaccccca 15960
ggagccccct aagtccatcc ccagcagtgg tgcccctgcc ctgtccttgc agcctgggag 16020
acccttggga ggggcgggcg ctgggtggct gggcggcttc tgctggtctc accccactgg 16080
cctcctgttt gtcatcctca gcctgcgggg tcaacttgaa ctcaagccgc cagagcagga 16140
ttgtgggcgg cgagagcgcg ctcccggggg cctggccctg gcaggtcagc ctgcacgtcc 16200
agaacgtcca cgtgtgcgga ggctccatca tcacccccga gtggatcgtg acagccgccc 16260
actgcgtgga aaagtatgcc aggggcggcg cgggccgggt gggggctcag ggctggccta 16320
cagccaccct gtgaccttga gcaggtctca acccttgcag ccccggcatc cttgtgttta 16380
aatggggaga gtattgcacc tgcttcctag ggctgtgaga catcaagtgc gctcatgcca 16440
ggcagtgcat ggctgtatgc actgagtgtc ccctgcacgc agggcacagg gtgcaggtgg 16500
aacattctcc acgatgtcgc cgtgaccagc gttccttcca gccactgtcc tctgagctct 16560
gtcctgccct tgagcaaagc ccctgccccc tgaggtatcc tgtctccggg acgctagtcc 16620
caggagaggg cacactcaga caggcttcag gctgccctgc tggaaggtcc ctggggttaa 16680
gcgttcttgg ccacagcatt gctcatgcag agggttaggt aggggtgagg ctagccgtga 16740
cagtattagc atttatggac gctaccaccc cctccccttt tccttaaaca catagtgctt 16800
ttggtcacat gctgctttgg aggaggcctc acttggcgga tgtatttttc tgccttagag 16860
agaggctgaa ctgggtttga ctgttggccc agccctctct tgctgcgtgc ccttagacga 16920
ttcactcaac gtctctgatc catggcatgt acaactataa gatgggcatg cccttctcct 16980
ctcgggctgt tatgaaggtc aaggaagcaa gggctgttac ccaagggtgc tcccttctct 17040
ccccctcttc acacccccag gtgctctggg ccctctagga actgggtttc tctcaagggc 17100
tgttacccaa gggtgctccc ttctctcccc ctcttcacac cactgggtgc tctgggccca 17160
ctaggagctg ggattctctt aagagggaaa ctcttggata aaggaaatgg tttgattgat 17220
atcggacaag tctgttcatt agtatccatt tattaagcac ctaccatgtg ccaggaaatg 17280
ctttggcgta caaaggaaaa taagggccag tcctgctaga aatggccttg aaaccccagg 17340
gagggatgtc ggcccattgt gggtgctgca gattccttga aggtgatgca agagccagaa 17400
agaaggatga tgtggggggc tgaggcaggg agtcggggtt gggggagtgt gggggagaag 17460
gggagaccga gcacctcttc cactatctcc ctgtgtggtt tttggtgaac catcctgcct 17520
ctgggtgtct tgcctccagc ttctgacgtt ggaagttcat ccactgagag ctctgtgttt 17580
atggctctga gatactgagt ccttcttctc tcccagacct cttaacaatc catggcattg 17640
gacggcattt gcggggattt tgagacaatc tttcatgttc tatggagccg gataccaagt 17700
agaaaaagtg atttctcatc caaattatga ctccaagacc aagaacaatg acattgcgct 17760
gatgaagctg cagaagcctc tgactttcaa cggtacgtgt ggctcaggct tggcaagcag 17820
gttggcagaa tcttaaagag atgttgattg gaaatgacac ttgtgctatg ccaaatggaa 17880
gggaggcatt tgcgttgagc gagggtagcg tgcagcgggt ggccaatggg agaggctcac 17940
agaggctaag agcacctgcc gcattttggg ggaggcagca gccaccacat ctgttctgta 18000
ctgtactgag tggtggtgat tcaagccagg catggaaaag gctagaacag ggctttccca 18060
ctgcagcacc cttgacatct gggtggttct ctgttgtagg gctctcttgt gccttgtagg 18120
atgtttaaca gcgtccccag cctctaccca ctggaggcca gtagctacca agctgtgaca 18180
accagtgttg cctgctgaca ttgccaaaca tccgctttga ggcaaagtca cttccagttg 18240
agaactactg gcctaaaatg tgtaaagatc cttgattttt aaagatacat tctaaaacca 18300
agttgcttaa ttcaggacaa acatgctttc tcttagcctc ttattcggtc ccactctggt 18360
ccatccaagg gtctggaatg ttctagcccc atgtggatac agaagaagca aaacctcagc 18420
cctccctaca gcatgtctgt attcacattg ggaaatggtt cacatataga agagcgaatg 18480
cctgagcaat ggcgtggtgc ctctggggcg aaagctgact ccattgactc catcggcttt 18540
ttggctgttg cctcctgtgt gtctttcccg tcttgatcac ctggagatat gtaattttgg 18600
aagcagagct agcaaataat tcctcttata agcagagcta gcaaataatt ctacttataa 18660
gtagcataac gtcttgcctg ccagaaggag aggtctggca gggggagaaa gtgagaatgt 18720
gggacttgtt gggatgcagg gtcctctggg cagggtggcc agggtgccag gcccagcagc 18780
ctgcatgtgg gaaggccagg tggagacata ggtgataccc gcctggctca ctgtgttttc 18840
tcttcttgaa acagacctag tgaaaccagt gtgtctgccc aacccaggca tgatgctgca 18900
gccagaacag ctctgctgga tttccgggtg gggggccacc gaggagaaag gtgaggctgc 18960
tcctgggcac acaggactgc agggcccaca gatggagcat tgggttcgga agtgggaggt 19020
ccaggtttta atcccagttc tactactcaa tgactggatg actttggttg attcccccag 19080
tccttgtgcc tcagtttctc catctgctaa gtgggagaaa tcctgcccag cctacctaat 19140
acactgtgtt cttatcgtga tcacacagag cagcatgtgg aatggctttt gaagtatctg 19200
ggccatacga gtttagaggt gcaggatctc ctgtgttgca ctcattgtga gtttagagct 19260
gccctggaga tcccaccaag gcctgcgtgg ctgagtgaca gggggcttgg tgaggacggg 19320
catcctggac ccatggtggc cacatctaag cctgtcctct gccctgataa ccacagagag 19380
aggctctctc cacccacttc ctttgcaatc tgcatttctc tctgacagtc tttcaaatga 19440
agggagcctg gctgcttcat ttttatggag ggttggaagt gcttagtggc aggcacaaag 19500
gttcatttta catattgttt atatccttct caaaagcgtc taggccatac agacaacaaa 19560
tcctttcaaa caaggggaaa agtacaaagg ttgggtgatt tctggggagc gtcagggaag 19620
gtagtggggg gcatcctggc tcctcatcag cagaaactta ctacagtaga gccacaggct 19680
gggcaaaaga cctcatggaa tccaagatga agggaatatc gacaaatatt tgtgcgcacc 19740
tgcacctagt acaggctggg tgctactcag gtgctgggaa tgcagaagtg aacagagtaa 19800
gacaaatgtc tctgctgtca ggagctttac ctctcttctg gatgtcggtg gtggggacgg 19860
ggcaggtgtg gtcagacaga tgggagacaa acaactgagc gaggtacttc caaacatctg 19920
agggtgggga tcacaaggtc ccggctattt tgaaggggtg gtcaggaaag gcttctcgga 19980
agaggtggca tttgagctga gactcaaatg gcaaaaatgt gtacacatca aaaaggctag 20040
tgcatgtatc ttcaggtgtg gtcaaggggc caaggaggtg ggctggggcc agattgcata 20100
ggtccttgtg gattatggtg aagacaccag cttctcatct gcttgaggtg gggagatcgt 20160
gagccgggga gtgccatgat ctggcagctg cgtggggagt ggggatgaat ggatggagac 20220
gaggatgatg gtgacaagtc cattgctgtg gttccttgag acaggaagcc agctcatagc 20280
agagtgcggg cgtggatgtg aagagatgag ggtacactag ggctagagcc accagactta 20340
ctgatgggtt gcatgtctgt gggagagaga gtgagaagtc agggacgatg gctttccact 20400
ctgtggctga agccccaggg tggcgggtgg tgccattttt caagccagga aatattggtt 20460
ggtgagaatt tggggtggga gaaggtgtga cggagggttc tggttttgca cactaagccc 20520
acggtgccca gaagatgccc gaggggaggc agcaaagcga gagtgggaaa tgcagaggtg 20580
gcaagtgcag gccgtgtctt gagaagctct aatgtgcagg ggagccgaga agcaggcggc 20640
ctagggaggg tcacgtgtgc tccagaagag tgtgtgcatg ccagagggga aacaggcgcc 20700
tgtgtgtcct gggtggggtt cagtgaggag tgggaaattg gttcagcaga accaagccgt 20760
tgggtgaata agagggggat tccatggcac tgatagagcc ctatagtttc agagctggga 20820
atttctttcc ctgaagctga actccagagc tgcattcagc acaggcaccg ccagttgtaa 20880
ggagaatcca ggtttcccag gagaggggtt ggtgctggga tgagctgacc ggggcagggc 20940
tggaaaatag ggctgtgacc atctgtgtag tgcgtgtgga ggtctcaggg agggaagtgt 21000
gctctccctg cgagagctgc aggcaacact gggagctcaa caagtctccc tgtccttagg 21060
gaagacctca gaagtgctga acgctgccaa ggtgcttctc attgagacac agagatgcaa 21120
cagcagatat gtctatgaca acctgatcac accagccatg atctgtgccg gcttcctgca 21180
ggggaacgtc gattcttgcc aggtaattca acatttttat tctacctttg gtccttacca 21240
gatcctactg aaccccccat gagagagagg gcattcttgg ggtcagcaga gcctcctcag 21300
tgacacggag ccagctcggg gcagtcatgg gaagtgacgg ccacaaacag tgcgaacgct 21360
tctggtggca gaaggaagta cagtcaacaa atcacacaca ccctctgaaa aaccggtatt 21420
tggtaaaagt gccagtggaa cagaaacaag tatttagact attttaaatt atgaacggca 21480
atttatttag taacttttag cttgaacaga ttaaaattca ggatgggggc tatctctttg 21540
ggggttacat ctctgttacc atcacccctt gatggtggag attcgaagcc cacacagtca 21600
ctcgtaactc acactgcgac ccccgccccc caactcctct aggcctggtc agtggtgtgc 21660
ggcagattgt gacttgattt tctgctctct gtaccttgct gtgtcccaca gggtgacagt 21720
ggagggcctc tggtcacttc gaagaacaat atctggtggc tgatagggga tacaagctgg 21780
ggttctggct gtgccaaagc ttacagacca ggagtgtacg ggaatgtgat ggtattcacg 21840
gactggattt atcgacaaat gagggtaact atcctgtcct ccttctgact gtgttctccg 21900
attcctcgag ccaaagccag acatctgtta ggcgtggttc tgctgctgga agctgactgg 21960
tgaccactgg tcagcatgaa gcaaactctg cttcctccag ccacagcccc atccccccag 22020
tgtccaccca ttgcccattg cctctcactg gcttcacttg catatttccc ctggtgtttg 22080
gatgaaaagc gctggggctc agcttgtgtg aaattccttg gtgctctgcc aaccacactt 22140
cgttctggct cagctgactc agctgttcca cccaggccac ctcacatcaa actttttttt 22200
tttttttttg agatggagtc tcactgtgtc gcccaggctg gagtgcagtg gcacaatctc 22260
gactcactgc aacctttgcc tcctgggttc aagtgattct cctgcctcag cctcccaagt 22320
agctgggact acaggcatgc gccaccacgc ccagctactt tttgtatttt tagtagagat 22380
ggggtttctc catgttggcc aggctggtct cgaagccctg acctcaggtg attcacccac 22440
ctcagcctcc cacagtgctg ggattacaag tgtgaaccac ggtgcccggc ctcacatgaa 22500
acttttgatt tatagagagc agagggaaga gccggctgtg cccatccttt tctggggcca 22560
tcgagtggct cctgggcagc ccccaaggtt aggaagggca ggagcagcca gggttctctg 22620
atgccccaga ctcaagcacg agggaaggtc tcaggggttc catgtgagcc tcatggatgt 22680
ctctgcttag cagagccctg gctttgggca ttgtccagat agggggtgag aaccagatct 22740
tctcatctcc aggacctcag acgtatagtt ttctcagatt tctgtgcttt ctggggctgg 22800
gctactagtg gaagaaagca gtctattctg tcttctccca aatctcccag atgcccagtc 22860
tgttgaagga ggagcagaac cagggggcct ttcccgctga ggcccgacct gtgtctcctt 22920
caaatgacac gcgggactca gggccttccc atgaccatgg ggcccagggg gcgtcacctg 22980
gcccagggcc cagtgctaga aacagatgac cccaggagga ggaggcaggg caggagggaa 23040
gctggcaggg ctgggatggt cagccaggct gaggggcgga ctcgcaccag gatggagcta 23100
ggaaatgatc caggtgtgtt tggcggctgc aggtgggtcc gcatggctgt gcagggaggg 23160
aagggctgcg tggcaggaga gcagccgggg gaggcccaga ctctgctgaa gagatgcctg 23220
ttgtgccggc ctccacatcc gctgcccgct ccttccggag ctcctgcccc gccatgctca 23280
gcctgactct gaccaacacg ttggagagaa gaatgatccc tttgtgctat taagcttgct 23340
tatttggttt ctaagtgctt catgcgaacc tagaggaaaa aattattttc cacctttgtt 23400
tgtcttaaga aaataacaca cttttttttt tcctatttga acaggcagac ggctaatcca 23460
catggtcttc gtccttgacg tcgttttaca agaaaacaat ggggctggtt ttgcttcccc 23520
gtgcatgatt tactcttaga gatgattcag aggtcacttc atttttatta aacagtgaac 23580
ttgtctggct ttggcactct ctgccattct gtgcaggctg cagtggctcc cctgcccagc 23640
ctgctctccc taaccccttg tccgcaaggg gtgatggccg gctggttgtg ggcactggcg 23700
gtcaagtgtg gaggagaggg gtggaggctg ccccattgag atcttcctgc tgagtccttt 23760
ccaggggcca attttggatg agcatggagc tgtcacctct cagctgctgg atgacttgag 23820
atgaaaaagg agagacatgg aaagggagac agccaggtgg cacctgcagc ggctgccctc 23880
tggggccact tggtagtgtc cccagcctac ctctccacaa ggggattttg ctgatgggtt 23940
cttagagcct tagcagccct ggatggtggc cagaaataaa gggaccagcc cttcatgggt 24000
ggtgacgtgg tagtcacttg taaggggaac agaaacattt ttgttcttat ggggtgagaa 24060
tatagacagt gcccttggtg cgagggaagc aattgaaaag gaacttgccc tgagcactcc 24120
tggtgcaggt ctccacctgc acattgggtg gggctcctgg gagggagact cagccttcct 24180
cctcatcctc cctgaccctg ctcctagcac cctggagagt gcacatgccc cttggtcctg 24240
gcagggcgcc aagtctggca ccatgttggc ctcttcaggc ctgctagtca ctggaaattg 24300
aggtccatgg gggaaatcaa ggatgctcag tttaaggtac actgtttcca tgttatgttt 24360
ctacacattg ctacctcagt gctcctggaa acttagcttt tgatgtctcc aagtagtcca 24420
ccttcattta actctttgaa actgtatcat ctttgccaag taagagtggt ggcctatttc 24480
agctgctttg acaaaatgac tggctcctga cttaacgttc tataaatgaa tgtgctgaag 24540
caaagtgccc atggtggcgg cgaagaagag aaagatgtgt tttgttttgg actctctgtg 24600
gtcccttcca atgctgtggg tttccaacca ggggaagggt cccttttgca ttgccaagtg 24660
ccataaccat gagcactact ctaccatggt tctgcctcct ggccaagcag gctggtttgc 24720
aagaatgaaa tgaatgattc tacagctagg acttaacctt gaaatggaaa gtcatgcaat 24780
cccatttgca ggatctgtct gtgcacatgc ctctgtagag agcagcattc ccagggacct 24840
tggaaacagt tggcactgta aggtgcttgc tccccaagac acatcctaaa aggtgttgta 24900
atggtgaaaa cgtcttcctt ctttattgcc ccttcttatt tatgtgaaca actgtttgtc 24960
tttttttgta tcttttttaa actgtaaagt tcaattgtga aaatgaatat catgcaaata 25020
aattatgcaa tttttttttc aaagtaacta ctgcatcttt gaagttctgc ctggtgagta 25080
ggaccagcct ccatttcctt ataagggggt gatgttgagg ctgctggtca gaggaccaaa 25140
ggtgaggcaa ggccagactt ggtgctcctg tggttctcga gataacttcg tataatgtat 25200
gctatacgaa gttatatgca tggcctccgc gccgggtttt ggcgcctccc gcgggcgccc 25260
ccctcctcac ggcgagcgct gccacgtcag acgaagggcg cagcgagcgt cctgatcctt 25320
ccgcccggac gctcaggaca gcggcccgct gctcataaga ctcggcctta gaaccccagt 25380
atcagcagaa ggacatttta ggacgggact tgggtgactc tagggcactg gttttctttc 25440
cagagagcgg aacaggcgag gaaaagtagt cccttctcgg cgattctgcg gagggatctc 25500
cgtggggcgg tgaacgccga tgattatata aggacgcgcc gggtgtggca cagctagttc 25560
cgtcgcagcc gggatttggg tcgcggttct tgtttgtgga tcgctgtgat cgtcacttgg 25620
tgagtagcgg gctgctgggc tggccggggc tttcgtggcc gccgggccgc tcggtgggac 25680
ggaagcgtgt ggagagaccg ccaagggctg tagtctgggt ccgcgagcaa ggttgccctg 25740
aactgggggt tggggggagc gcagcaaaat ggcggctgtt cccgagtctt gaatggaaga 25800
cgcttgtgag gcgggctgtg aggtcgttga aacaaggtgg ggggcatggt gggcggcaag 25860
aacccaaggt cttgaggcct tcgctaatgc gggaaagctc ttattcgggt gagatgggct 25920
ggggcaccat ctggggaccc tgacgtgaag tttgtcactg actggagaac tcggtttgtc 25980
gtctgttgcg ggggcggcag ttatggcggt gccgttgggc agtgcacccg tacctttggg 26040
agcgcgcgcc ctcgtcgtgt cgtgacgtca cccgttctgt tggcttataa tgcagggtgg 26100
ggccacctgc cggtaggtgt gcggtaggct tttctccgtc gcaggacgca gggttcgggc 26160
ctagggtagg ctctcctgaa tcgacaggcg ccggacctct ggtgagggga gggataagtg 26220
aggcgtcagt ttctttggtc ggttttatgt acctatcttc ttaagtagct gaagctccgg 26280
ttttgaacta tgcgctcggg gttggcgagt gtgttttgtg aagtttttta ggcacctttt 26340
gaaatgtaat catttgggtc aatatgtaat tttcagtgtt agactagtaa attgtccgct 26400
aaattctggc cgtttttggc ttttttgtta gacgtgttga caattaatca tcggcatagt 26460
atatcggcat agtataatac gacaaggtga ggaactaaac catgggatcg gccattgaac 26520
aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc ggctatgact 26580
gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc 26640
gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg caggacgagg 26700
cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg 26760
tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag gatctcctgt 26820
catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg cggcggctgc 26880
atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc atcgagcgag 26940
cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa gagcatcagg 27000
ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac ggcgatgatc 27060
tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt 27120
ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac atagcgttgg 27180
ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt 27240
acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt gacgagttct 27300
tctgagggga tccgctgtaa gtctgcagaa attgatgatc tattaaacaa taaagatgtc 27360
cactaaaatg gaagtttttc ctgtcatact ttgttaagaa gggtgagaac agagtaccta 27420
cattttgaat ggaaggattg gagctacggg ggtgggggtg gggtgggatt agataaatgc 27480
ctgctcttta ctgaaggctc tttactattg ctttatgata atgtttcata gttggatatc 27540
ataatttaaa caagcaaaac caaattaagg gccagctcat tcctcccact catgatctat 27600
agatctatag atctctcgtg ggatcattgt ttttctcttg attcccactt tgtggttcta 27660
agtactgtgg tttccaaatg tgtcagtttc atagcctgaa gaacgagatc agcagcctct 27720
gttccacata cacttcattc tcagtattgt tttgccaagt tctaattcca tcagacctcg 27780
acctgcagcc cctagataac ttcgtataat gtatgctata cgaagttatg ctagtaacta 27840
taacggtcct aaggtagcga gctagctcca cgtggctttg tcccagactt cctttgtctt 27900
caacaacctt ctgcaagaaa accaagggcc tgaattttaa cttcctg 27947
<210> 6
<211> 25333
<212> DNA
<213> 人工序列
<220>
<223> 重组多核苷酸
<400> 6
gcagagtcta agaaatcgct gtgtttagcc ctcgccctgg gcactgtcct cacgggagct 60
gctgtggctg ctgtcttgct ttggaagttc agtaagtgca gggagcctcg atcccaccat 120
gtgctcctgc agtccccagt gctctgagcc agaccctgct ctctgggcta ttgagacctc 180
tggaggccct ccgtgaggtt cctctcttac ataacgaggc tgtctctctt cccttctctt 240
gtttagctat gagattgaca catcatgggg aaagcattta gaatgtaccc agtgctttgg 300
ggtgcttggt gccacccagc actgtgagca caggttcttc taccttgggg ccacacccag 360
ttacctgtat ctcactgcac agcagtggct gttggggacc aggcccaccc ctccatgtcc 420
cacctcctgc aactgcagcc tgagccttcc catcagcctg gggtggtgca gacccatgtg 480
ccattgtgga tccttcaagt tacctgtgtg gcagagagga cgtgtgagtg ccgtccaaac 540
ccaaacactg agagggtcct tcccattgcc cccacggaag taaggtgccc cagtgctaat 600
tccacttata cttgctggtg gcaaggacac ttctcctcct tattaaagtg ggggattggc 660
tgggtgaggt ggctcacgcc tgttatccca gcactttaag aggccaaggc aggtggacca 720
cctgaggtca ggagtttgag accacaagcc tggccaacat gttgaaactc catctctact 780
aaaaatacaa aaattagtca ggcgtggtgg cgtgcacctg taatcccagc tacttaggag 840
gctggggcag gaggatcact tgaacccagg agttggaggt tgcagtgagc caagattgtg 900
cccctgcact ccagcctggg tgacagaatg agacttcatc tcaaaaacaa aacaaaacaa 960
aacacagtgg ggccaggagt tggaggctgc agcgagctac agtaatgcca cggtgttcct 1020
cactccatga ggctcattgc gtttctcagc ctgaagggca cctctcttct gttttctctg 1080
caagtgggca gcaagtgctc caactctggg atagagtgcg actcctcagg tacctgcatc 1140
aacccctcta actggtgtga tggcgtgtca cactgccccg gcggggagga cgagaatcgg 1200
tgtggtgagt cagccttgac cttgggaagg gactcctctg ctcaccttgg agacagcagc 1260
cgggtccagg ggcctttggg tgactgggcc tggcgtgcgt ccagtacgct gacacatgat 1320
gtcattgaat ccctgctcca ggctgagccc tggggctcag agaggttgtg tttccggccc 1380
aacctcaccc agcaggtggg agatgacagg gccaccgagg actgtgtcat tggaaccaca 1440
cgtgctctga actgccacag gaagtcagtt aagatgagca aactgtttat aaagttggag 1500
atgcaggcta ggaacggtgg ctcatgcctg taatcccagc actttgggag gccgaggcag 1560
atggatcacc tgaggtcagg agtttgagac cagcctgacc aatatggtga aaccttatct 1620
ccactaaaaa tacaaaaatt agccaagcgc ggtggcgggt gcctgtaatt ccagctattc 1680
aggaggctga ggcaggagaa tcacttgaac ctgggaggcg gaggttgcag tgagctgaga 1740
tcacgccact gcattccagc ctgggagaca gagctggctc aaaaaataaa ttaattaatt 1800
aaaaacaaaa ttggagatgc actatgttat tttcaaaaca agctgccttt aaagatctat 1860
ctgttgtcac agggtgggct catctgtttc attttatttt ctgtggttta tctatttatt 1920
cattttaatg aactaggaag cattgctcct atttatggca taccacatga tgtttggata 1980
cgtgtatgcc tgtggcatgg ctaagtcaag ctagaacatg ggccttacct catatacgtg 2040
tcttattaag aacacataaa acctactctt gtagtgattt tcaaatatgc aacatatagt 2100
ttattaactg cagtcactat gatgtacaat agattgctcg aacttattcc tcctgtctaa 2160
ctaagatttt gtgacctctg accaacatct ccccagtgtt gtcacccccc gcccccagcc 2220
tctgatagct gcctttctac tctctgcttc tgtgagtttg atgtttatac attccacatg 2280
taagtggcct catgcagtgt ttctgtctct gtgtctggct tgttcactta gcgtaatgtc 2340
ctccagcttc atctatgttg ttggaaatga caggatttcc ttctttcttg tggctgaata 2400
gtattgcctt gtgcatatac accacatttt ctttatccct tcattcactg atggactctt 2460
aggttgatgt catgtcttgg ctgttgtgaa aaatgccgca gtgagcgtgg gcgtgcaggt 2520
ccctcttcaa cacacggatt tcctttcctt tggatataaa cccagcagtg agattgctgg 2580
atcacatggc agttctgttt ctcacctttt gaggaaactc catactgttt tccataatgg 2640
ctgtagcaac ttccactccc acccccacgg tgcaaagtct ccatttctct tctacaacct 2700
caccaactcc tgttattttc catctttctg atagtagcca tttgaagagg tatgagatga 2760
tacctcattg tggttttcat ttgcattttt atttgtattt ttcatgaatt tttgagggtg 2820
atttcaaggg tagttagtga ctcgaacagg gaaacgatcc tgagtatgag ggttgtgcta 2880
atcatccccc tcctgccagc tgcgtacgga atggggctct gcagatggca gggagctggc 2940
tcgtttctct ttaagagctg ccttttactt ttcttcctct tcctttaaaa cttatttcct 3000
ggccggacgc agtggctcat gcctgtaatc ccagcacttt gggaggccga ggtgggcgga 3060
tcacgaggtc aggaattcca gaccagcctg gccaacatgg tgaaaccccg tctctactaa 3120
aaatacaaaa attagccaga cgtggtggtg cgggcctata gtcccagcta ctcgggaggc 3180
tgaggcagga gaatcacttg aacctgggag gagggggttg cagtgagccg agattgcgcc 3240
actgcactcc agcctgggcg acagagccag actccatctc aaaaaacaaa aaaaagttat 3300
ttcccaagca cagccatgta ttccaggctt gtggatcagc gttggtggtg gtgtgtgctc 3360
tcatatctta gttccagcta agcacactct gacatgttta cactagaacc atttgttttt 3420
tctagaaata gaaatttcag aattgtagag tcagaggact taccagaaat ctcttaggta 3480
gttctcctcc cctccctcaa gtgcagtcct aacctcctgg agttttctgt agaaaccaca 3540
agcctcagag ctggccgaga attctagcca aagatttttc catgccaaag taatcccccc 3600
tctcctaagg gccatccttg gtggggactg gtttcctgtt aagccctcgc tgtcagtcct 3660
ggctgtggaa tttcctggtg aggagcactg gcccgtggag ctcggccctc gtgccggcct 3720
tgagcaggcc caagtgttcc gtgttcttga tacctttcct ccagcacagt cttgcttccc 3780
agaaaaaggt ttgcacttga aaatgatgca tttgctgatt aaacatagtt cttttgcttt 3840
atttggtttc taaaataaag tgggagtttt tgagattgag taacgtgagg ttaagatagc 3900
acgtggaatg gctttttctt ttctttctat tttttttttt tttttcctgg agacagggtt 3960
tcactctgtt gcccaggctg gagtgcagag gcatgaccat ggctcactgc aacttcgatg 4020
tcctggggtt aagcgatccc ccagcctcag ccccccaagt ggctgggact acaggtgctc 4080
gccaccacac ctggctaatt tttgtatttt ttgtagaaaa tgggtttcat caatgttgtc 4140
cagactggtc tcgaactcct gacctcaagc aattctcctg cctcagcctc ccagactgct 4200
gggattacag gcgtgaacta ccacgcctgg cctggaatgg cttttgatgt tctcctatgt 4260
gcacatgtgg gtgaataaac accaacaaag tccttatgtt acctgaagag ttgctctctt 4320
cttaatattt aagtcgtatt tatttaaata ctttaatagt tgtacactat taaagtatta 4380
ttaggtcaaa atcaaggaag tacaaaaggg tatgctgtga aaaatctctt cttccttgct 4440
ctgcttactt acctaccccg catcccccca tacaccccag acacacacac acacacacac 4500
acacacacac acacacgcat cactcccata catgcccacc tgtttaccag ccaatcacat 4560
ttcttggggc aactcatctg agttgcttct ctttccagag agtttttgca taaagaagca 4620
caggtatttc tgcgttacca tgaccctatt tcccagtggt tcctagccag ttgactctcc 4680
tgcactggat accatcctgg acagcattcc ttagggaaat gagccccctg ttttttccca 4740
ccatggcaca gttggtcctt tgcatggacg caccattatt gcccctgtct cttcttggtg 4800
gaccttaagg ttttctccat ccttttgctg taacacacac tgctccaagt gtgtgagcat 4860
atcagtagga aacgcttcca ggagtagaac tgctaggtca gagggcgtgt ggatctgtaa 4920
cctgacagac ctagaccggc ttcagtttgg ttttatccag tttccatatt gattattcat 4980
ataaaaggaa acagacaaac ataacgctgt gcatgtattc tctcttagac cagaacaggc 5040
atagggtgca cttttaattt gtccatttcg tagagtagaa attgtttttg ctgaaatgaa 5100
caccttagga tgctgaagaa tatgacccgt cccatggaaa acattcaaaa atgtgtgtag 5160
cgctttcttc ccaagggtgt gtgtgcgcat attttaacac taattcactt tctacttccg 5220
ttgctatcct ttctgtgagt ctttctcaga atctcagaaa agaaactaaa ttgttcactc 5280
tagttatcaa tgctgtactc tatacctgga atttgctaaa agggcagatt ttaagtattc 5340
tcaccacaga aaagagaaaa gaaaatggta attatgtgac gtggtggaca tgttaactag 5400
ctttattatg gtgagcattt cacagcggat atccagtcat cacgctgtac acattaaaca 5460
tgtacaattg ggtttttttg agacaaggtc tccttctgtc acccagtctg gagtgcagtg 5520
gctcagtcat ggctcattgc agcctcgacc tcctgggctc aatccatcct tccccctcag 5580
cctcctgaaa agctggggcc acaggcatgt accatcatgc caggctaatg catatatatt 5640
tatatttttt ggtggagatg gggttggtct cgaactctgg gctcaagtga tcctcccgcc 5700
ttgcccttcc aaagtgctga gattacaggc atgaaccaca gcaccaggcc tacatgtaaa 5760
atttttattt gtcaactata ctttgacaaa gctgagaaaa aaaatcctaa tatttaaaaa 5820
aaaaaaaaaa aggactagct tgagaccttt tccagctctc tggcttatca gctgccgtct 5880
cttccgggtg cagatagctg gaagggaaag aaaatcccta aaattaccca caagccaaga 5940
atgaagtgtc tccctttgag ccacagtggc agttttgttt ttaatcatag aagtgtattt 6000
tgagccgggt gtgctggctc acgcctgtaa tccccgcact ttgggaggcc gaggtggggg 6060
gcggaggggg tggggatcgc ctgaggtcag gagttcgaga ccagcctgac caacatggag 6120
aaaccccgtc tctactaaaa atacaaaatt agccggcgtg gtggtgcatg cctgtaatcc 6180
cagctactca tgaggctgag tcaggagaat ctcttgaacc caggaggtgg aggttgcggt 6240
gagctgagat catgccattg cactccagcc tgggaacaag aaaaaaaaag aagaagaaga 6300
agaagtgtat tcatttcagt tacttttaaa aaagtgaaca gactttatat tttagagcgg 6360
ttttaggttt acagaaaatg aaacagacag ggcagcgagc tccttgtact cctccccagc 6420
acacagttgc cctgttatga acatcccaca tcagtgctgt gcgttcatta acaccgatga 6480
acctgatgca tacattatga tgaactgaag tcctggactt caccctttct cttgtacagt 6540
tctgtgggat ttgacaaatg cataatgctg tacagccaca atgatagtat cgtccagagt 6600
agttctcctg ccttaaaacc tcttttgctg cacctgtttc tctctcccca ctcaccccag 6660
ctatctgatc ttcttagtgc ctccgaagtt ttggtctttt caggatgttg tagcgttgga 6720
atcatggagt atgtagcctt caccacatac accttccttc actttgttgg cttcctttac 6780
ttagtaatat gcattcaagt ttcctccatg ccttttcatg gcttgatagc tcatttcttt 6840
ttagcaccaa ataatattcc gttgtccaga tgtagcacaa tgtttatcca ttcatgtaac 6900
ctgtgaccga ctcacagata ggatgtggaa tcactcacca cagaggcatt agacaataat 6960
cagacccaag tcatttcatg ggggaacaag cccacaggta ccagactgtc cagtgagtca 7020
gggccactcg taggaagtaa gaagagaggc tagagcatag ccaggtcctc actttatact 7080
ttaagcccat gtgtatttct cccaaaccac acagcattgt ttccatgctt tcagctttgc 7140
atgaataacg tgatacttga acgcatcatt tatcacttgc tctctttccc acagcgctgt 7200
tttcaagctt cttcctgttc atgatgctct gcttaaccct taagctgcat gggattctgt 7260
tctgtgaata cgcccacccc atgtattatc ctgcccagca aaaagtcccc aaaactctgg 7320
atggtggtta cctctaggga gggagagaag agattgggaa tagggagcga cttcaacggt 7380
gtttgtaatg ttttgtttct ttaaataaaa gagctgagat catttcagca gaatgttgat 7440
ttagagtctc ctggacaatt tgttgctcaa agtgctctct taaagagcac tttaaaaaaa 7500
aaaacctttt atcttattat ttatttattt atttattgag acggagtttt gctctgtcac 7560
ccaggctgga gtggagtggt gtgatctcag ctcactgcaa cctttacctc ctgggttcaa 7620
gcaattcccc tgcctcagcc tcccaagtag gtgggattac agatgcgtgc caccacactt 7680
ggctaatttt tgcattttag tagagatcgg tttctccatg ttggccaggc tgatctcaaa 7740
cgcctgacct caggtgatct gcccgccttg gcctcccaaa gtgctggtat tacaggcgtg 7800
agctaccatg cctggcttat cttatatatt tttaaaaaca gcttattgag atctaattta 7860
tgtaccataa aattcaagta tataattcag tgcttttata tataaaacat atatatgaaa 7920
tagcttattg agatataatt ttttatataa aacagcttat tgatatgtaa tgtatgtacc 7980
ataaaattta aatatataat tcactggctt ttatatattc acgaatatgt gcaactatca 8040
ccacagtcaa ttttagcata ttttcatcag ctcataaaga aaccccaagc ccttgaacta 8100
tcaccccata tccctcctcc cagcccgtcc ctcctactca taagcaacca ctaatctact 8160
tagtgtctat agatttccta ctctaggcat tccatgtgag cgggatcatg caatacgtgg 8220
gctcacacaa tataagtggc attccatgtg agtcggctca tgcagtatgt ccggctcctt 8280
tcactgagca taaggtcttc agcactcatc caggttgcag cctgtgtctg aatttcattc 8340
cctcttctgg ctgaatcgta ttccattgtg tatcttggac atatcctatt ctgctcaccc 8400
agccgttggt gggcgtttgg agtgttttcg cctttcagct gttttaagag ggttgcagtg 8460
aacatttgta caagttttgg acccaatgcc tgttttcaat tctcttgtgt agagagcact 8520
ttttagcaga aaaagaatag atttgtggcc tccctttgtg tgcggtcagt gccttgagaa 8580
gagtgaactg tgctgccacc tccggagccg tggagagcgc ggggcttggg tagcagctag 8640
gacgatacaa gttgggacaa ggccaggtgc aatggctcac gcctgtaatt ccaacacttt 8700
gggagaccga ggcaggggga tcacctgagg tcaggagttc aagaccagcc tggccaacat 8760
ggtgaaaccc catctctaat aaaacagaaa aattaactgg acggggtggt ggacgcctgt 8820
aatcccagct actcgggagg ctgaggcagg agaatcactt gaacctggga ggcggaggct 8880
gcagtgagtg gagatcagac cactgcactt cagcctaggt gacagagcga gactccgtct 8940
caaaaaaaag aaaaaaaaag aaagaaactc atggataatc ctccctctcg tgcagttcgc 9000
ctctacggac caaacttcat ccttcaggtg tactcatctc agaggaagtc ctggcaccct 9060
gtgtgccaag acgactggaa cgagaactac gggcgggcgg cctgcaggga catgggctat 9120
aagtgagtat ggggcagcac ccgccgagtg acagtaacag acagcagaaa cacgagaaga 9180
ccctctctct gcctccctgt gaaagcaccg gcacatgagt gctggggaca attgtcacct 9240
tccaaaagct gagccctata accagcaggt ggaatttgtc ctgctagggc tgtgcccagc 9300
acacagacct tggctcactg ccaccttgcc ctgcctcctc cttggcctct atagactcct 9360
ggttgctcgg gagtgcccag tgctgtggtc atctggtcag aggggtaggc tgagggcgtt 9420
aggtgcctct ttttccaagg tgcctctcag ccagggtcca ttcacctccc tgggtagagg 9480
ttggaccaga acagctggcg aggagggttg ggctggggag agcagcagag acaaatcctg 9540
tgccagtttc acttcattcg ggagccatgg aagccttttg agctggggag agaatcaatc 9600
aatcagactg atacttaaaa aatgtcattc ctgctcgtag ctctgaggga aggtgggaag 9660
gcttaacagg gtgtgtgtcg cctgacagtg attcctaacg ggggtggggc ggtggttacc 9720
atttaccagc actgcctggg gagatgcggc agccctcagg catcggggga gagggtggta 9780
ggatgctact gccactttgt tttccatggg agggtcccca ggtgatttct atgcaacttt 9840
agggtattca atatgccagt tttcagaatg aattaccact cggtgagaaa gttggcatct 9900
tagctagtca ctgtgacatc cctaaacagc aggggtgaat tacacagcaa agccccccca 9960
tcacagtcca ggaacctggt ggaattgata actggggcca tgttaacatc tgtacctttt 10020
attagattaa atgtgtgtat gattatacaa tcctatgtcc ttctcatagt ttcttgatcc 10080
taacctggat aagaaacacg accaatgaag gaattttgtc tgacacttta gggttattga 10140
atcgaaaaat cgttacaata ttctagcact tggttagaac gtgtgatttt ttttcctaaa 10200
tgctaaggtt tttccctctt attctgaatg tcgtatgagc ggtattatga catagtatag 10260
gatttgtgtt tgcttatgcc ttaaccatta tcacaaataa ggttttcttt tttaggaata 10320
atttttactc tagccaagga atagtggatg acagcggatc caccagcttt atgaaactga 10380
acacaagtgc cggcaatgtc gatatctata aaaaactgta ccacaggtat gcagcaattt 10440
cttcttgaaa aattttggaa tgaaatcaac taggagacac catggggaat cgttgtcctg 10500
agtctgattt ctctgagctg caatactcgg tctggatggg ttttgcattg ggaggagatt 10560
agagtctgac caggcctggt tactctaagc agcccttggt ttattcatag gaagtggctg 10620
aggtttctct gctatttcat tttcagcctc taccgtctgc ccttgttggt agcggctcac 10680
acttgcaaca tcgacattca actctattta gttttctttc ctcttcagac atttagaggt 10740
gtacctattt tgtcagggcg tggttctagg aatccaagat aatgtctcag tgtcccagcc 10800
agggtgaccg gctcattcca gtttgccagg gacttcactg gcttgagcaa gggaagtcct 10860
gctccattcc aggcagctgg gctggctggt cccgttagcc ccaaccccgg gacagcagtg 10920
ccagagggtg ctctgtgagg gatgggcagc attctggcgg cctgggaatg agttgtggtg 10980
tttccagggg gtagaagtgg gtacaagcca caggtcacat gatgagtggc tgacctggct 11040
gggagggcag aagaggggat ggacttaggc tcttcctttt gctttgcaca tatttaggat 11100
gtttgcagac ttgctatgat tgttgctgtt atgtgttttc tgatgtgaaa gatacacagt 11160
gtcctttgcc catgagctct ccttgcctcc caggtcccca gggcttatgc ctggtgtcta 11220
ggcatcacct ccctgcctgc caggtgccag gtgctgcatt tcgggggagg atgaactaat 11280
caccccgcgc cacctttcct ctgagtggga gcctggggca ggtttgcatt cctggaggcc 11340
gctggtggag gggtctgggg gcctgacttc cactgcagcc tgctgtcctg gggaatgtgg 11400
cagggcaagc ccagtgggga gggctgtgca cggccaggtg cacccatcaa aacagcaggg 11460
ctgcggtttg tccctgtgga gaagctaaac acagctgcct gggcactttg taaatgctga 11520
gtggttcttt gtctttctgg gttacacacg gaatcaggga gccaagtcca gccgggcagg 11580
gacgggggga ggggaggagg tgctgccgtc ccttggcaag agccttggga actcacaagg 11640
aggctggagg gcttggaaga aagaagagaa ggccattgtc tggtaggctc tattctatct 11700
cggtggtggt ggtgggggga ggcgcacttc ttttcctctt tctgtgcagc agttgccctt 11760
tgatgcctga gttcttggct tgttttctgt cgggcttctg tgaataacca catgtgccct 11820
ggcgctgtga ccacacaggg ctatccctac cgaccttagg attcttagga aatgtcttct 11880
cttaaagggg acatgtcttc acttggccgt gtcagtgccc cagagccaga gtccacctgg 11940
aatgcacctg tagtcactga gaacccgggg ggtgtgcctt agtaagaagg tgtcaggaag 12000
gacctattat tgtagggcct gggctcctgc aaggtggttt gggggtggtt ggaggaagca 12060
gagatttgct ctggattgga tgctgtcagg aagcaggggt aattctgtga ggctgcttta 12120
ttattttttt tctaggagga ggttggaatg aggctaggct aaagctgtga ttggtaaaga 12180
aacgtccgtc gctcaagtta gccaggacag gaggagacat cagatcgtga ttttgtggtt 12240
gtgagcacaa ggttcctgtt ctgtctgttc agacatcatt tcggaggagg ctccttgtgt 12300
cttgccccat ctcaggcatg gaggggccta gtccgatatt gacgctcagt gaaataattc 12360
aggttccgca gagcacacgg cccagctatc agggcgggcc agctctgcat gccaggggcc 12420
gcgtcttccc ttctcagcat agcctgggaa attcactgca ggacaaaatg catcagttac 12480
ttcctcttca tccataacct gggatgtttg actcccaaat gagtaactct tacgtttctt 12540
ctaatcctag ggaaactatt ggttatattg ctttcaacac tacaaattta aagcagttat 12600
aggagcccag aggtttccaa atggcttcct taaaaattag aagatgattt taaattccaa 12660
gaggaaaaac aaaactagca ttattgtata cttaccctca caaccgtcct aggagctggt 12720
acaattttaa gagaggttaa gtaacttgcc caaggtcaca ctgtggggat gtgagccgcg 12780
taccttggct cagtgtctgg tctttgccac tgtccctata tggatttact taccttattg 12840
gagttgtaac tagcagaccc ttctatgtct cagaagacag gagagggaac atcggaagaa 12900
atgactgatt tctaagcatg tgagaggcag gtgactccgc actatcgtga ccagaatttc 12960
ccctgttctt tttgcagtga tgcctgttct tcaaaagcag tggtttcttt acgctgtata 13020
ggtaagttca tctggagtcc cccttttgat acttctaact aggaaaagct ctctactttc 13080
agaacagtac tccctgtgtc tctgggggcg tgggagggaa gaaggtgggg tcacgggttg 13140
gaatgtgccc agcggcgtct cgctctttcc aaggagctcc tggtttagat ttccatggcc 13200
tgtagacacc ttcagccttg ggtccaaggg acaccccctg agatcaggca cgctcaagaa 13260
gctgacaaag ccctacactt tatgccaccc atgagctgga ggcccggcag gtctctttct 13320
ccagaaagca aaggggggtg gcgttagtga gccctggcag ccacctaacg tggacttgga 13380
gcatctgcgg ggctgtggtc cagcaccacc gtgtggccac caggtgctca tcagccagtg 13440
ggacccggga ggagggacaa gaccagagaa caacagtgct cttgcctctt ctctcctgaa 13500
ttttggacgg tggcttagac ttgggtgtcc ccatctctgt gtttagagtg cttacagttt 13560
ccaaactgtt tgcaaatgtg gaagccaccg tccctctcct ctgggatggc ccagtgctgt 13620
cgtggggccg tggtcctgag ctcagctttt catttgaaga ggtggaagga gctgacaccg 13680
tcccatcccg gcagggctgg ctcaggtctt ctttaggtcc tgagtggggg tccagcacag 13740
ccccaagggt gcgtggcacc cgccctgccc tctgcccatg cactcatctc ctggtggaga 13800
agacactcac acacaggaag cagggaaggc agcagacctc actcacccct caccccctca 13860
ctcaccccct actcaccccc tcaacctctc attcaccacc caccccctcg ccccctcact 13920
caccccctca ctccctcaac cctcactcac ctcctcactc cctcaaccct cactcacctc 13980
ctcacctcct cactctcccc ctcatccctc cctcacccca ccccgtcacc tcctcactca 14040
cctcctcacc ccctcactca cccttcaccc cctcactcac cacctcacct cctcactcac 14100
cccctactca acccctcatt cacccctcac cccctcactc acccctgcac cccctcactc 14160
accccttcat ccactcaccc acctgctcac ctcctcactc aacccctcac cccctcacta 14220
atccctcact ccctcacccc ctcacgccct cactcacacc ttcacctcct cactcacccc 14280
ctcaccccct caacccctta cttaccccct cactcatccc ttcacccctc actcaccccc 14340
tctctcaccc attcaccccc tcactcatgc cttcaccccc tcactcacct cctcactcac 14400
accttcaccc ctcagtcacc ccctcactca ccccttcacc ccctcaatca tgccttcact 14460
ccctcactca ccccttcacc ctctgaatta ctccctcatc ccctcactca ccccctcact 14520
caccccttca ccccctcacc caccacctca cccacccctc acccaccccc tcacctcctt 14580
acccctcacc cccctcactc acccctcacc ccctcactca ccacctcacc cacccctcac 14640
ccaccccctc actcactccc tcatcccctc actcaccccc tcaccccctc actcaccccc 14700
tcacccaccc ctcacccacc ccctcacccc ctcactcacc ccttcacccc ctcactcacc 14760
ccctcactca ccccttcacc ccctcactca ccacctcacc cacccctcac ccaccccctc 14820
actcactccc tcaccccctc actcaccccc tcaccccctc actcaccccc tcatctcctc 14880
actcaccccc tcacctcctc actcacccgc tcacctcctc actcaccccc tcgccccctc 14940
actcacccct caccccctca ccccctcact cacccctcac cccctcgccc cctcactcac 15000
cccctcgccc cctcactcac ccctcacccc ctcaccccct cactcatccc ctcacctcct 15060
cactcacccc ctcacctcct cactcacccc ctcacctcct cactcacccc ctcacctcct 15120
cacccacccc ctcactcact ccctcacccc ctcaccccct cactcacccc ctcacctcct 15180
cactcacccc ctcacctcct cacccacccc ctcactcact ccctcacccc ctcaccccct 15240
cactcacccc ctcacctcct cactcacccc ctcacctcct cactcacccc ctcacctcct 15300
cactcatgcc ctcaccccct cactcaccct ttcacctcct tgctcatccc ctcacttacc 15360
ccctcacttc gtcaatcacc cccccacctc gtcaatcacc ccctcacctt ttcactcacc 15420
ccctcactca cccccttact tcctcactta cctcctcacc ccccactcac cccctcaccc 15480
cccactcacc ccctcacccc acactcaccc cctcaccccc cactcacccc ctcacccctc 15540
tcacctcctc actcaccccc tcacctcctc acttatcccc tcaccccctc aattaccccc 15600
tcaccccctc aattactccc tcatcctttc aattacccac tcaccccctc acctcctcac 15660
tcctcactca ctccctcact caccccttca ccttctcact cacctcctcg tctcctcacc 15720
ccctcactca cttccagccc tgcccctccc atcttccttt tctttgtgtg agaatctggg 15780
gtccctgagt ggtgtcagtc cctccaagac tcaaggagtc cccagggcct tgttatccag 15840
aacaccccca cctgggtccc gggagacccc atgggatcac aggagtgttc agggaagtgg 15900
tgcttcctgg gtctgggtgg gctggagggg catcctccct tccccaagag gagaccccca 15960
ggagccccct aagtccatcc ccagcagtgg tgcccctgcc ctgtccttgc agcctgggag 16020
acccttggga ggggcgggcg ctgggtggct gggcggcttc tgctggtctc accccactgg 16080
cctcctgttt gtcatcctca gcctgcgggg tcaacttgaa ctcaagccgc cagagcagga 16140
ttgtgggcgg cgagagcgcg ctcccggggg cctggccctg gcaggtcagc ctgcacgtcc 16200
agaacgtcca cgtgtgcgga ggctccatca tcacccccga gtggatcgtg acagccgccc 16260
actgcgtgga aaagtatgcc aggggcggcg cgggccgggt gggggctcag ggctggccta 16320
cagccaccct gtgaccttga gcaggtctca acccttgcag ccccggcatc cttgtgttta 16380
aatggggaga gtattgcacc tgcttcctag ggctgtgaga catcaagtgc gctcatgcca 16440
ggcagtgcat ggctgtatgc actgagtgtc ccctgcacgc agggcacagg gtgcaggtgg 16500
aacattctcc acgatgtcgc cgtgaccagc gttccttcca gccactgtcc tctgagctct 16560
gtcctgccct tgagcaaagc ccctgccccc tgaggtatcc tgtctccggg acgctagtcc 16620
caggagaggg cacactcaga caggcttcag gctgccctgc tggaaggtcc ctggggttaa 16680
gcgttcttgg ccacagcatt gctcatgcag agggttaggt aggggtgagg ctagccgtga 16740
cagtattagc atttatggac gctaccaccc cctccccttt tccttaaaca catagtgctt 16800
ttggtcacat gctgctttgg aggaggcctc acttggcgga tgtatttttc tgccttagag 16860
agaggctgaa ctgggtttga ctgttggccc agccctctct tgctgcgtgc ccttagacga 16920
ttcactcaac gtctctgatc catggcatgt acaactataa gatgggcatg cccttctcct 16980
ctcgggctgt tatgaaggtc aaggaagcaa gggctgttac ccaagggtgc tcccttctct 17040
ccccctcttc acacccccag gtgctctggg ccctctagga actgggtttc tctcaagggc 17100
tgttacccaa gggtgctccc ttctctcccc ctcttcacac cactgggtgc tctgggccca 17160
ctaggagctg ggattctctt aagagggaaa ctcttggata aaggaaatgg tttgattgat 17220
atcggacaag tctgttcatt agtatccatt tattaagcac ctaccatgtg ccaggaaatg 17280
ctttggcgta caaaggaaaa taagggccag tcctgctaga aatggccttg aaaccccagg 17340
gagggatgtc ggcccattgt gggtgctgca gattccttga aggtgatgca agagccagaa 17400
agaaggatga tgtggggggc tgaggcaggg agtcggggtt gggggagtgt gggggagaag 17460
gggagaccga gcacctcttc cactatctcc ctgtgtggtt tttggtgaac catcctgcct 17520
ctgggtgtct tgcctccagc ttctgacgtt ggaagttcat ccactgagag ctctgtgttt 17580
atggctctga gatactgagt ccttcttctc tcccagacct cttaacaatc catggcattg 17640
gacggcattt gcggggattt tgagacaatc tttcatgttc tatggagccg gataccaagt 17700
agaaaaagtg atttctcatc caaattatga ctccaagacc aagaacaatg acattgcgct 17760
gatgaagctg cagaagcctc tgactttcaa cggtacgtgt ggctcaggct tggcaagcag 17820
gttggcagaa tcttaaagag atgttgattg gaaatgacac ttgtgctatg ccaaatggaa 17880
gggaggcatt tgcgttgagc gagggtagcg tgcagcgggt ggccaatggg agaggctcac 17940
agaggctaag agcacctgcc gcattttggg ggaggcagca gccaccacat ctgttctgta 18000
ctgtactgag tggtggtgat tcaagccagg catggaaaag gctagaacag ggctttccca 18060
ctgcagcacc cttgacatct gggtggttct ctgttgtagg gctctcttgt gccttgtagg 18120
atgtttaaca gcgtccccag cctctaccca ctggaggcca gtagctacca agctgtgaca 18180
accagtgttg cctgctgaca ttgccaaaca tccgctttga ggcaaagtca cttccagttg 18240
agaactactg gcctaaaatg tgtaaagatc cttgattttt aaagatacat tctaaaacca 18300
agttgcttaa ttcaggacaa acatgctttc tcttagcctc ttattcggtc ccactctggt 18360
ccatccaagg gtctggaatg ttctagcccc atgtggatac agaagaagca aaacctcagc 18420
cctccctaca gcatgtctgt attcacattg ggaaatggtt cacatataga agagcgaatg 18480
cctgagcaat ggcgtggtgc ctctggggcg aaagctgact ccattgactc catcggcttt 18540
ttggctgttg cctcctgtgt gtctttcccg tcttgatcac ctggagatat gtaattttgg 18600
aagcagagct agcaaataat tcctcttata agcagagcta gcaaataatt ctacttataa 18660
gtagcataac gtcttgcctg ccagaaggag aggtctggca gggggagaaa gtgagaatgt 18720
gggacttgtt gggatgcagg gtcctctggg cagggtggcc agggtgccag gcccagcagc 18780
ctgcatgtgg gaaggccagg tggagacata ggtgataccc gcctggctca ctgtgttttc 18840
tcttcttgaa acagacctag tgaaaccagt gtgtctgccc aacccaggca tgatgctgca 18900
gccagaacag ctctgctgga tttccgggtg gggggccacc gaggagaaag gtgaggctgc 18960
tcctgggcac acaggactgc agggcccaca gatggagcat tgggttcgga agtgggaggt 19020
ccaggtttta atcccagttc tactactcaa tgactggatg actttggttg attcccccag 19080
tccttgtgcc tcagtttctc catctgctaa gtgggagaaa tcctgcccag cctacctaat 19140
acactgtgtt cttatcgtga tcacacagag cagcatgtgg aatggctttt gaagtatctg 19200
ggccatacga gtttagaggt gcaggatctc ctgtgttgca ctcattgtga gtttagagct 19260
gccctggaga tcccaccaag gcctgcgtgg ctgagtgaca gggggcttgg tgaggacggg 19320
catcctggac ccatggtggc cacatctaag cctgtcctct gccctgataa ccacagagag 19380
aggctctctc cacccacttc ctttgcaatc tgcatttctc tctgacagtc tttcaaatga 19440
agggagcctg gctgcttcat ttttatggag ggttggaagt gcttagtggc aggcacaaag 19500
gttcatttta catattgttt atatccttct caaaagcgtc taggccatac agacaacaaa 19560
tcctttcaaa caaggggaaa agtacaaagg ttgggtgatt tctggggagc gtcagggaag 19620
gtagtggggg gcatcctggc tcctcatcag cagaaactta ctacagtaga gccacaggct 19680
gggcaaaaga cctcatggaa tccaagatga agggaatatc gacaaatatt tgtgcgcacc 19740
tgcacctagt acaggctggg tgctactcag gtgctgggaa tgcagaagtg aacagagtaa 19800
gacaaatgtc tctgctgtca ggagctttac ctctcttctg gatgtcggtg gtggggacgg 19860
ggcaggtgtg gtcagacaga tgggagacaa acaactgagc gaggtacttc caaacatctg 19920
agggtgggga tcacaaggtc ccggctattt tgaaggggtg gtcaggaaag gcttctcgga 19980
agaggtggca tttgagctga gactcaaatg gcaaaaatgt gtacacatca aaaaggctag 20040
tgcatgtatc ttcaggtgtg gtcaaggggc caaggaggtg ggctggggcc agattgcata 20100
ggtccttgtg gattatggtg aagacaccag cttctcatct gcttgaggtg gggagatcgt 20160
gagccgggga gtgccatgat ctggcagctg cgtggggagt ggggatgaat ggatggagac 20220
gaggatgatg gtgacaagtc cattgctgtg gttccttgag acaggaagcc agctcatagc 20280
agagtgcggg cgtggatgtg aagagatgag ggtacactag ggctagagcc accagactta 20340
ctgatgggtt gcatgtctgt gggagagaga gtgagaagtc agggacgatg gctttccact 20400
ctgtggctga agccccaggg tggcgggtgg tgccattttt caagccagga aatattggtt 20460
ggtgagaatt tggggtggga gaaggtgtga cggagggttc tggttttgca cactaagccc 20520
acggtgccca gaagatgccc gaggggaggc agcaaagcga gagtgggaaa tgcagaggtg 20580
gcaagtgcag gccgtgtctt gagaagctct aatgtgcagg ggagccgaga agcaggcggc 20640
ctagggaggg tcacgtgtgc tccagaagag tgtgtgcatg ccagagggga aacaggcgcc 20700
tgtgtgtcct gggtggggtt cagtgaggag tgggaaattg gttcagcaga accaagccgt 20760
tgggtgaata agagggggat tccatggcac tgatagagcc ctatagtttc agagctggga 20820
atttctttcc ctgaagctga actccagagc tgcattcagc acaggcaccg ccagttgtaa 20880
ggagaatcca ggtttcccag gagaggggtt ggtgctggga tgagctgacc ggggcagggc 20940
tggaaaatag ggctgtgacc atctgtgtag tgcgtgtgga ggtctcaggg agggaagtgt 21000
gctctccctg cgagagctgc aggcaacact gggagctcaa caagtctccc tgtccttagg 21060
gaagacctca gaagtgctga acgctgccaa ggtgcttctc attgagacac agagatgcaa 21120
cagcagatat gtctatgaca acctgatcac accagccatg atctgtgccg gcttcctgca 21180
ggggaacgtc gattcttgcc aggtaattca acatttttat tctacctttg gtccttacca 21240
gatcctactg aaccccccat gagagagagg gcattcttgg ggtcagcaga gcctcctcag 21300
tgacacggag ccagctcggg gcagtcatgg gaagtgacgg ccacaaacag tgcgaacgct 21360
tctggtggca gaaggaagta cagtcaacaa atcacacaca ccctctgaaa aaccggtatt 21420
tggtaaaagt gccagtggaa cagaaacaag tatttagact attttaaatt atgaacggca 21480
atttatttag taacttttag cttgaacaga ttaaaattca ggatgggggc tatctctttg 21540
ggggttacat ctctgttacc atcacccctt gatggtggag attcgaagcc cacacagtca 21600
ctcgtaactc acactgcgac ccccgccccc caactcctct aggcctggtc agtggtgtgc 21660
ggcagattgt gacttgattt tctgctctct gtaccttgct gtgtcccaca gggtgacagt 21720
ggagggcctc tggtcacttc gaagaacaat atctggtggc tgatagggga tacaagctgg 21780
ggttctggct gtgccaaagc ttacagacca ggagtgtacg ggaatgtgat ggtattcacg 21840
gactggattt atcgacaaat gagggtaact atcctgtcct ccttctgact gtgttctccg 21900
attcctcgag ccaaagccag acatctgtta ggcgtggttc tgctgctgga agctgactgg 21960
tgaccactgg tcagcatgaa gcaaactctg cttcctccag ccacagcccc atccccccag 22020
tgtccaccca ttgcccattg cctctcactg gcttcacttg catatttccc ctggtgtttg 22080
gatgaaaagc gctggggctc agcttgtgtg aaattccttg gtgctctgcc aaccacactt 22140
cgttctggct cagctgactc agctgttcca cccaggccac ctcacatcaa actttttttt 22200
tttttttttg agatggagtc tcactgtgtc gcccaggctg gagtgcagtg gcacaatctc 22260
gactcactgc aacctttgcc tcctgggttc aagtgattct cctgcctcag cctcccaagt 22320
agctgggact acaggcatgc gccaccacgc ccagctactt tttgtatttt tagtagagat 22380
ggggtttctc catgttggcc aggctggtct cgaagccctg acctcaggtg attcacccac 22440
ctcagcctcc cacagtgctg ggattacaag tgtgaaccac ggtgcccggc ctcacatgaa 22500
acttttgatt tatagagagc agagggaaga gccggctgtg cccatccttt tctggggcca 22560
tcgagtggct cctgggcagc ccccaaggtt aggaagggca ggagcagcca gggttctctg 22620
atgccccaga ctcaagcacg agggaaggtc tcaggggttc catgtgagcc tcatggatgt 22680
ctctgcttag cagagccctg gctttgggca ttgtccagat agggggtgag aaccagatct 22740
tctcatctcc aggacctcag acgtatagtt ttctcagatt tctgtgcttt ctggggctgg 22800
gctactagtg gaagaaagca gtctattctg tcttctccca aatctcccag atgcccagtc 22860
tgttgaagga ggagcagaac cagggggcct ttcccgctga ggcccgacct gtgtctcctt 22920
caaatgacac gcgggactca gggccttccc atgaccatgg ggcccagggg gcgtcacctg 22980
gcccagggcc cagtgctaga aacagatgac cccaggagga ggaggcaggg caggagggaa 23040
gctggcaggg ctgggatggt cagccaggct gaggggcgga ctcgcaccag gatggagcta 23100
ggaaatgatc caggtgtgtt tggcggctgc aggtgggtcc gcatggctgt gcagggaggg 23160
aagggctgcg tggcaggaga gcagccgggg gaggcccaga ctctgctgaa gagatgcctg 23220
ttgtgccggc ctccacatcc gctgcccgct ccttccggag ctcctgcccc gccatgctca 23280
gcctgactct gaccaacacg ttggagagaa gaatgatccc tttgtgctat taagcttgct 23340
tatttggttt ctaagtgctt catgcgaacc tagaggaaaa aattattttc cacctttgtt 23400
tgtcttaaga aaataacaca cttttttttt tcctatttga acaggcagac ggctaatcca 23460
catggtcttc gtccttgacg tcgttttaca agaaaacaat ggggctggtt ttgcttcccc 23520
gtgcatgatt tactcttaga gatgattcag aggtcacttc atttttatta aacagtgaac 23580
ttgtctggct ttggcactct ctgccattct gtgcaggctg cagtggctcc cctgcccagc 23640
ctgctctccc taaccccttg tccgcaaggg gtgatggccg gctggttgtg ggcactggcg 23700
gtcaagtgtg gaggagaggg gtggaggctg ccccattgag atcttcctgc tgagtccttt 23760
ccaggggcca attttggatg agcatggagc tgtcacctct cagctgctgg atgacttgag 23820
atgaaaaagg agagacatgg aaagggagac agccaggtgg cacctgcagc ggctgccctc 23880
tggggccact tggtagtgtc cccagcctac ctctccacaa ggggattttg ctgatgggtt 23940
cttagagcct tagcagccct ggatggtggc cagaaataaa gggaccagcc cttcatgggt 24000
ggtgacgtgg tagtcacttg taaggggaac agaaacattt ttgttcttat ggggtgagaa 24060
tatagacagt gcccttggtg cgagggaagc aattgaaaag gaacttgccc tgagcactcc 24120
tggtgcaggt ctccacctgc acattgggtg gggctcctgg gagggagact cagccttcct 24180
cctcatcctc cctgaccctg ctcctagcac cctggagagt gcacatgccc cttggtcctg 24240
gcagggcgcc aagtctggca ccatgttggc ctcttcaggc ctgctagtca ctggaaattg 24300
aggtccatgg gggaaatcaa ggatgctcag tttaaggtac actgtttcca tgttatgttt 24360
ctacacattg ctacctcagt gctcctggaa acttagcttt tgatgtctcc aagtagtcca 24420
ccttcattta actctttgaa actgtatcat ctttgccaag taagagtggt ggcctatttc 24480
agctgctttg acaaaatgac tggctcctga cttaacgttc tataaatgaa tgtgctgaag 24540
caaagtgccc atggtggcgg cgaagaagag aaagatgtgt tttgttttgg actctctgtg 24600
gtcccttcca atgctgtggg tttccaacca ggggaagggt cccttttgca ttgccaagtg 24660
ccataaccat gagcactact ctaccatggt tctgcctcct ggccaagcag gctggtttgc 24720
aagaatgaaa tgaatgattc tacagctagg acttaacctt gaaatggaaa gtcatgcaat 24780
cccatttgca ggatctgtct gtgcacatgc ctctgtagag agcagcattc ccagggacct 24840
tggaaacagt tggcactgta aggtgcttgc tccccaagac acatcctaaa aggtgttgta 24900
atggtgaaaa cgtcttcctt ctttattgcc ccttcttatt tatgtgaaca actgtttgtc 24960
tttttttgta tcttttttaa actgtaaagt tcaattgtga aaatgaatat catgcaaata 25020
aattatgcaa tttttttttc aaagtaacta ctgcatcttt gaagttctgc ctggtgagta 25080
ggaccagcct ccatttcctt ataagggggt gatgttgagg ctgctggtca gaggaccaaa 25140
ggtgaggcaa ggccagactt ggtgctcctg tggttctcga gataacttcg tataatgtat 25200
gctatacgaa gttatgctag taactataac ggtcctaagg tagcgagcta gctccacgtg 25260
gctttgtccc agacttcctt tgtcttcaac aaccttctgc aagaaaacca agggcctgaa 25320
ttttaacttc ctg 25333
<210> 7
<211> 491
<212> PRT
<213> 人工序列
<220>
<223> 重组蛋白质
<400> 7
Met Ala Leu Asn Ser Gly Ser Pro Pro Gly Ile Gly Pro Cys Tyr Glu
1 5 10 15
Asn His Gly Tyr Gln Ser Glu His Ile Cys Pro Pro Arg Pro Pro Val
20 25 30
Ala Pro Asn Gly Tyr Asn Leu Tyr Pro Ala Gln Tyr Tyr Pro Ser Pro
35 40 45
Val Pro Gln Tyr Ala Pro Arg Ile Thr Thr Gln Ala Ser Thr Ser Val
50 55 60
Ile His Thr His Pro Lys Ser Ser Gly Ala Leu Cys Thr Ser Lys Ser
65 70 75 80
Lys Lys Ser Leu Cys Leu Ala Leu Ala Leu Gly Thr Val Leu Thr Gly
85 90 95
Ala Ala Val Ala Ala Val Leu Leu Trp Lys Phe Met Gly Ser Lys Cys
100 105 110
Ser Asn Ser Gly Ile Glu Cys Asp Ser Ser Gly Thr Cys Ile Asn Pro
115 120 125
Ser Asn Trp Cys Asp Gly Val Ser His Cys Pro Gly Gly Glu Asp Glu
130 135 140
Asn Arg Cys Val Arg Leu Tyr Gly Pro Asn Phe Ile Leu Gln Val Tyr
145 150 155 160
Ser Ser Gln Arg Lys Ser Trp His Pro Val Cys Gln Asp Asp Trp Asn
165 170 175
Glu Asn Tyr Gly Arg Ala Ala Cys Arg Asp Met Gly Tyr Lys Asn Asn
180 185 190
Phe Tyr Ser Ser Gln Gly Ile Val Asp Asp Ser Gly Ser Thr Ser Phe
195 200 205
Met Lys Leu Asn Thr Ser Ala Gly Asn Val Asp Ile Tyr Lys Lys Leu
210 215 220
Tyr His Ser Asp Ala Cys Ser Ser Lys Ala Val Val Ser Leu Arg Cys
225 230 235 240
Ile Ala Cys Gly Val Asn Leu Asn Ser Ser Arg Gln Ser Arg Ile Val
245 250 255
Gly Gly Glu Ser Ala Leu Pro Gly Ala Trp Pro Trp Gln Val Ser Leu
260 265 270
His Val Gln Asn Val His Val Cys Gly Gly Ser Ile Ile Thr Pro Glu
275 280 285
Trp Ile Val Thr Ala Ala His Cys Val Glu Lys Pro Leu Asn Asn Pro
290 295 300
Trp His Trp Thr Ala Phe Ala Gly Ile Leu Arg Gln Ser Phe Met Phe
305 310 315 320
Tyr Gly Ala Gly Tyr Gln Val Glu Lys Val Ile Ser His Pro Asn Tyr
325 330 335
Asp Ser Lys Thr Lys Asn Asn Asp Ile Ala Leu Met Lys Leu Gln Lys
340 345 350
Pro Leu Thr Phe Asn Asp Leu Val Lys Pro Val Cys Leu Pro Asn Pro
355 360 365
Gly Met Met Leu Gln Pro Glu Gln Leu Cys Trp Ile Ser Gly Trp Gly
370 375 380
Ala Thr Glu Glu Lys Gly Lys Thr Ser Glu Val Leu Asn Ala Ala Lys
385 390 395 400
Val Leu Leu Ile Glu Thr Gln Arg Cys Asn Ser Arg Tyr Val Tyr Asp
405 410 415
Asn Leu Ile Thr Pro Ala Met Ile Cys Ala Gly Phe Leu Gln Gly Asn
420 425 430
Val Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Thr Ser Lys
435 440 445
Asn Asn Ile Trp Trp Leu Ile Gly Asp Thr Ser Trp Gly Ser Gly Cys
450 455 460
Ala Lys Ala Tyr Arg Pro Gly Val Tyr Gly Asn Val Met Val Phe Thr
465 470 475 480
Asp Trp Ile Tyr Arg Gln Met Arg Ala Asp Gly
485 490
<210> 8
<211> 2267
<212> DNA
<213> 小家鼠
<400> 8
ccggttgtgt tataggactt gaccagcccc aatagtcctc aagtcactcc tagatacagt 60
ggcaggtggt agctggcttg cggaaggaag aggaagaaga gaatgtgggc catcaaggag 120
caaggccagc cttgcacttg ggccccctct gctcagtgct gaccagggct ttctgagccg 180
cttcctaatg aggctcattt gaagaccccc ccccaccccc ctcctgctgt cttgggtggc 240
agagctagct ccaggctgta agaaaattag gaggattacc aaagcagtat ggagtcagac 300
agtggccaac ccctcaacaa ccgtgatatt gttccctttc gcaaaccccg aaggccccag 360
gagaccttca aaaaggtggg gatccccatc attgcagtgc tgctgagcct gatagccctc 420
gtgattgtgg cccttctcat caaggtgatt ctggataaat actacttcat ctgcggcagt 480
cccctgacct tcattcagag gggccagttg tgtgacggcc accttgactg cgcctcaggg 540
gaggatgagg aacactgtgt caaggacttc cctgaaaagc ccggagtggc agtccggctc 600
tccaaggaca gatccaccct gcaggtgctg gatgcagcca cagggacctg ggcctcagtc 660
tgtttcgaca acttcacaga agcactggcc aagacagcct gcagacagat gggctatgac 720
agccagcccg ctttcagagc agtggagatc cgtccagatc agaacctccc tgttgctcaa 780
gtcacaggaa acagccagga acttcaggtg cagaatggaa gcagatcctg cctctcaggc 840
tccctggttt ccttgcgctg ccttgactgt ggaaagagcc tgaagactcc tcgtgtggtg 900
ggtggggtgg aggcccctgt ggattcttgg ccgtggcagg tcagcatcca gtacaacaag 960
cagcatgtct gtggtgggag catcctggat ccccactgga tcctcacagc agcccactgc 1020
ttcaggaagt atcttgatgt gtcaagctgg aaggtcaggg caggctcaaa catactgggt 1080
aactctccat ccttgcctgt ggccaagatc ttcatcgctg aacccaatcc tctgtacccc 1140
aaagagaagg acattgccct tgttaagctg cagatgccac tcacattctc aggctcagtc 1200
aggcccatct gcctgccctt ctctgatgag gtgcttgtcc cagccacacc agtctgggtc 1260
attggatggg gctttacaga agaaaacgga ggaaagatgt ctgacatgct actgcaggca 1320
tcagtccagg tcattgacag cacacggtgc aatgcagagg atgcctacga aggggaagtg 1380
accgctgaga tgctgtgtgc aggtacccca cagggtggca aggacacctg ccagggtgac 1440
agtggtgggc ctttgatgta ccattctgac aagtggcagg tagtaggcat cgtgagctgg 1500
ggccatggat gcggcggccc aagtactcct ggagtgtata ccaaggtcac tgcctatctc 1560
aactggatct acaatgttcg gaagtctgag atgtaacgct gccgtccccc acatccagaa 1620
gctgcttccc ttcagaccta cctacggcat gacccctcaa agtcagatat gggacaagag 1680
cctccttgaa caaactctgg tatccctgca gcaagcaagg atacattgca gaggtgcccg 1740
gagtggagtc agatgggcta gctcagccac ccctgcatct cccaaaccct gggagacatg 1800
tggcccatgg gagtaaatcc aggacattga ctcaactctc agaagtgtta ttcagtcaag 1860
gaggctctcc cttccactga aggaaggaaa gtcagctctc tcctgaaagg ccagatcact 1920
ggctgagtag atgagacaag ggtatgaaag gcctttgcca tcttctttgc ccagtcctga 1980
aagcactgac gtaagagacc agtcagttct aatgtaaggt gtatatttta gtgtcagggt 2040
attgcaattg tcacctctgt ggtcaatatc attaaacagg tatgagaatt cgctggcata 2100
gacttcctgg tctgcttaat aagaatccaa ctaaggatgt cacatgacag tttcccagaa 2160
aatgtgaaca agtgtccatc tgacacacgg caccaatgac aaaccaaaga agttattctg 2220
cctgagtctc agttgctgaa ctaataaatt agctgcggtt tcttgca 2267
<210> 9
<211> 435
<212> PRT
<213> 小家鼠
<400> 9
Met Glu Ser Asp Ser Gly Gln Pro Leu Asn Asn Arg Asp Ile Val Pro
1 5 10 15
Phe Arg Lys Pro Arg Arg Pro Gln Glu Thr Phe Lys Lys Val Gly Ile
20 25 30
Pro Ile Ile Ala Val Leu Leu Ser Leu Ile Ala Leu Val Ile Val Ala
35 40 45
Leu Leu Ile Lys Val Ile Leu Asp Lys Tyr Tyr Phe Ile Cys Gly Ser
50 55 60
Pro Leu Thr Phe Ile Gln Arg Gly Gln Leu Cys Asp Gly His Leu Asp
65 70 75 80
Cys Ala Ser Gly Glu Asp Glu Glu His Cys Val Lys Asp Phe Pro Glu
85 90 95
Lys Pro Gly Val Ala Val Arg Leu Ser Lys Asp Arg Ser Thr Leu Gln
100 105 110
Val Leu Asp Ala Ala Thr Gly Thr Trp Ala Ser Val Cys Phe Asp Asn
115 120 125
Phe Thr Glu Ala Leu Ala Lys Thr Ala Cys Arg Gln Met Gly Tyr Asp
130 135 140
Ser Gln Pro Ala Phe Arg Ala Val Glu Ile Arg Pro Asp Gln Asn Leu
145 150 155 160
Pro Val Ala Gln Val Thr Gly Asn Ser Gln Glu Leu Gln Val Gln Asn
165 170 175
Gly Ser Arg Ser Cys Leu Ser Gly Ser Leu Val Ser Leu Arg Cys Leu
180 185 190
Asp Cys Gly Lys Ser Leu Lys Thr Pro Arg Val Val Gly Gly Val Glu
195 200 205
Ala Pro Val Asp Ser Trp Pro Trp Gln Val Ser Ile Gln Tyr Asn Lys
210 215 220
Gln His Val Cys Gly Gly Ser Ile Leu Asp Pro His Trp Ile Leu Thr
225 230 235 240
Ala Ala His Cys Phe Arg Lys Tyr Leu Asp Val Ser Ser Trp Lys Val
245 250 255
Arg Ala Gly Ser Asn Ile Leu Gly Asn Ser Pro Ser Leu Pro Val Ala
260 265 270
Lys Ile Phe Ile Ala Glu Pro Asn Pro Leu Tyr Pro Lys Glu Lys Asp
275 280 285
Ile Ala Leu Val Lys Leu Gln Met Pro Leu Thr Phe Ser Gly Ser Val
290 295 300
Arg Pro Ile Cys Leu Pro Phe Ser Asp Glu Val Leu Val Pro Ala Thr
305 310 315 320
Pro Val Trp Val Ile Gly Trp Gly Phe Thr Glu Glu Asn Gly Gly Lys
325 330 335
Met Ser Asp Met Leu Leu Gln Ala Ser Val Gln Val Ile Asp Ser Thr
340 345 350
Arg Cys Asn Ala Glu Asp Ala Tyr Glu Gly Glu Val Thr Ala Glu Met
355 360 365
Leu Cys Ala Gly Thr Pro Gln Gly Gly Lys Asp Thr Cys Gln Gly Asp
370 375 380
Ser Gly Gly Pro Leu Met Tyr His Ser Asp Lys Trp Gln Val Val Gly
385 390 395 400
Ile Val Ser Trp Gly His Gly Cys Gly Gly Pro Ser Thr Pro Gly Val
405 410 415
Tyr Thr Lys Val Thr Ala Tyr Leu Asn Trp Ile Tyr Asn Val Arg Lys
420 425 430
Ser Glu Met
435
<210> 10
<211> 3543
<212> DNA
<213> 智人
<400> 10
atcattccag tttggcaact tcacttgtag ggctgtttta atcaagctgc ccaaagtccc 60
ccaatcactc ctggaataca cagagagagg cagcagcttg ctcagcggac aaggatgctg 120
ggcgtgaggg accaaggcct gccctgcact cgggcctcct ccagccagtg ctgaccaggg 180
acttctgacc tgctggccag ccaggacctg tgtggggagg ccctcctgct gccttggggt 240
gacaatctca gctccaggct acagggagac cgggaggatc acagagccag catggatcct 300
gacagtgatc aacctctgaa cagcctcgat gtcaaacccc tgcgcaaacc ccgtatcccc 360
atggagacct tcagaaaggt ggggatcccc atcatcatag cactactgag cctggcgagt 420
atcatcattg tggttgtcct catcaaggtg attctggata aatactactt cctctgcggg 480
cagcctctcc acttcatccc gaggaagcag ctgtgtgacg gagagctgga ctgtcccttg 540
ggggaggacg aggagcactg tgtcaagagc ttccccgaag ggcctgcagt ggcagtccgc 600
ctctccaagg accgatccac actgcaggtg ctggactcgg ccacagggaa ctggttctct 660
gcctgtttcg acaacttcac agaagctctc gctgagacag cctgtaggca gatgggctac 720
agcagcaaac ccactttcag agctgtggag attggcccag accaggatct ggatgttgtt 780
gaaatcacag aaaacagcca ggagcttcgc atgcggaact caagtgggcc ctgtctctca 840
ggctccctgg tctccctgca ctgtcttgcc tgtgggaaga gcctgaagac cccccgtgtg 900
gtgggtgggg aggaggcctc tgtggattct tggccttggc aggtcagcat ccagtacgac 960
aaacagcacg tctgtggagg gagcatcctg gacccccact gggtcctcac ggcagcccac 1020
tgcttcagga aacataccga tgtgttcaac tggaaggtgc gggcaggctc agacaaactg 1080
ggcagcttcc catccctggc tgtggccaag atcatcatca ttgaattcaa ccccatgtac 1140
cccaaagaca atgacatcgc cctcatgaag ctgcagttcc cactcacttt ctcaggcaca 1200
gtcaggccca tctgtctgcc cttctttgat gaggagctca ctccagccac cccactctgg 1260
atcattggat ggggctttac gaagcagaat ggagggaaga tgtctgacat actgctgcag 1320
gcgtcagtcc aggtcattga cagcacacgg tgcaatgcag acgatgcgta ccagggggaa 1380
gtcaccgaga agatgatgtg tgcaggcatc ccggaagggg gtgtggacac ctgccagggt 1440
gacagtggtg ggcccctgat gtaccaatct gaccagtggc atgtggtggg catcgttagt 1500
tggggctatg gctgcggggg cccgagcacc ccaggagtat acaccaaggt ctcagcctat 1560
ctcaactgga tctacaatgt ctggaaggct gagctgtaat gctgctgccc ctttgcagtg 1620
ctgggagccg cttccttcct gccctgccca cctggggatc ccccaaagtc agacacagag 1680
caagagtccc cttgggtaca cccctctgcc cacagcctca gcatttcttg gagcagcaaa 1740
gggcctcaat tcctataaga gaccctcgca gcccagaggc gcccagagga agtcagcagc 1800
cctagctcgg ccacacttgg tgctcccagc atcccaggga gagacacagc ccactgaaca 1860
aggtctcagg ggtattgcta agccaagaag gaactttccc acactactga atggaagcag 1920
gctgtcttgt aaaagcccag atcactgtgg gctggagagg agaaggaaag ggtctgcgcc 1980
agccctgtcc gtcttcaccc atccccaagc ctactagagc aagaaaccag ttgtaatata 2040
aaatgcactg ccctactgtt ggtatgacta ccgttaccta ctgttgtcat tgttattaca 2100
gctatggcca ctattattaa agagctgtgt aacatctctg gcataggcta gctggaatgc 2160
ttgataagaa ctgagctggg atgattgaac tttcattctt tggcttgggg agaaaagaag 2220
tcctggggaa gcaattgagt ctcaaagtag aggcagggga aaaaagagtt agggagacca 2280
gatctgctga gtggcagcaa gagtgagctg cagattacag aaaccagggt gagcaagttt 2340
gagtcccaca cagggccttc tccctttgcc tctttccctc cctccctgcc tgtgataatc 2400
agccaggagc cagggataac ctatgacttg ggaaagagat gagttaggca gtcaagggtg 2460
acattcaatc agggatccac aagtggctgg aaagaaatgc tggtcctgtg tcctaacttt 2520
ttccgcctgg agagccctca gtgtggcttc ttacatttaa aaaacaaaaa ggatcagctg 2580
ccaggtgtga ggcagtcccc aagctgagtt gtgaggatgt aagcatgaat aagtccctgc 2640
actcaaaatg gtcaaagaat taaaccccat ggactttttt ggcatctgta tgaaagcttg 2700
ggttttctga ggactgtctt gctatagtta agtcagatcc tagatgaaat atacttgttc 2760
atactgtact aggttcttag gaaacaacag aattcctcaa atgccaaaaa caaagaaaat 2820
agaaacccag aaaacaaaac aaaataaaac aaaaccatca gaactgtgag tggaaactaa 2880
ggtgatgatc tgggagcaat acactaaaat cttgggtcga gacctatatg aaggctggca 2940
gtggagctaa acctggacac actgaagaca agggagctga accagggctc ctacatgaag 3000
cagggataac tgatggcagt aaatgtggtc tcaaattgca gatggtctgg aggaaaattt 3060
cccaaattta gagcctcagg attcccaaag atcctccaaa tatgagctca caatcaaaga 3120
tcagagacgt tgaaaaataa aaaacacctt aagtgggcag cataaaaaac agctaattta 3180
gaaccccaaa ggcttcagat gtcagaatat tagagactta tgataataag caatatttgc 3240
agagtatttg tatgtgccag acactattgt aagtgcttca tcatgtactg attcatttaa 3300
tactcacaga aatctgtgag atgggtatta ttcttatcct cactctatgg attaaaaaaa 3360
ctaaggcaca aagtggttaa gctccttgcc tgagattata gactgtaagt tgaacgtgag 3420
cacttggaat acagagttca tgctgtaaac taccacacta tagggcctcc aatatgataa 3480
tttataaaat atttgaataa aaaatgaata ctagttccac attttaaaaa aaaaaaaaaa 3540
aaa 3543
<210> 11
<211> 437
<212> PRT
<213> 智人
<400> 11
Met Leu Gln Asp Pro Asp Ser Asp Gln Pro Leu Asn Ser Leu Asp Val
1 5 10 15
Lys Pro Leu Arg Lys Pro Arg Ile Pro Met Glu Thr Phe Arg Lys Val
20 25 30
Gly Ile Pro Ile Ile Ile Ala Leu Leu Ser Leu Ala Ser Ile Ile Ile
35 40 45
Val Val Val Leu Ile Lys Val Ile Leu Asp Lys Tyr Tyr Phe Leu Cys
50 55 60
Gly Gln Pro Leu His Phe Ile Pro Arg Lys Gln Leu Cys Asp Gly Glu
65 70 75 80
Leu Asp Cys Pro Leu Gly Glu Asp Glu Glu His Cys Val Lys Ser Phe
85 90 95
Pro Glu Gly Pro Ala Val Ala Val Arg Leu Ser Lys Asp Arg Ser Thr
100 105 110
Leu Gln Val Leu Asp Ser Ala Thr Gly Asn Trp Phe Ser Ala Cys Phe
115 120 125
Asp Asn Phe Thr Glu Ala Leu Ala Glu Thr Ala Cys Arg Gln Met Gly
130 135 140
Tyr Ser Ser Lys Pro Thr Phe Arg Ala Val Glu Ile Gly Pro Asp Gln
145 150 155 160
Asp Leu Asp Val Val Glu Ile Thr Glu Asn Ser Gln Glu Leu Arg Met
165 170 175
Arg Asn Ser Ser Gly Pro Cys Leu Ser Gly Ser Leu Val Ser Leu His
180 185 190
Cys Leu Ala Cys Gly Lys Ser Leu Lys Thr Pro Arg Val Val Gly Gly
195 200 205
Glu Glu Ala Ser Val Asp Ser Trp Pro Trp Gln Val Ser Ile Gln Tyr
210 215 220
Asp Lys Gln His Val Cys Gly Gly Ser Ile Leu Asp Pro His Trp Val
225 230 235 240
Leu Thr Ala Ala His Cys Phe Arg Lys His Thr Asp Val Phe Asn Trp
245 250 255
Lys Val Arg Ala Gly Ser Asp Lys Leu Gly Ser Phe Pro Ser Leu Ala
260 265 270
Val Ala Lys Ile Ile Ile Ile Glu Phe Asn Pro Met Tyr Pro Lys Asp
275 280 285
Asn Asp Ile Ala Leu Met Lys Leu Gln Phe Pro Leu Thr Phe Ser Gly
290 295 300
Thr Val Arg Pro Ile Cys Leu Pro Phe Phe Asp Glu Glu Leu Thr Pro
305 310 315 320
Ala Thr Pro Leu Trp Ile Ile Gly Trp Gly Phe Thr Lys Gln Asn Gly
325 330 335
Gly Lys Met Ser Asp Ile Leu Leu Gln Ala Ser Val Gln Val Ile Asp
340 345 350
Ser Thr Arg Cys Asn Ala Asp Asp Ala Tyr Gln Gly Glu Val Thr Glu
355 360 365
Lys Met Met Cys Ala Gly Ile Pro Glu Gly Gly Val Asp Thr Cys Gln
370 375 380
Gly Asp Ser Gly Gly Pro Leu Met Tyr Gln Ser Asp Gln Trp His Val
385 390 395 400
Val Gly Ile Val Ser Trp Gly Tyr Gly Cys Gly Gly Pro Ser Thr Pro
405 410 415
Gly Val Tyr Thr Lys Val Ser Ala Tyr Leu Asn Trp Ile Tyr Asn Val
420 425 430
Trp Lys Ala Glu Leu
435
<210> 12
<211> 20078
<212> DNA
<213> 人工序列
<220>
<223> 重组多核苷酸
<400> 12
ccacccgcac acactacagt cgagataact tcgtataatg tatgctatac gaagttatat 60
gcatggcctc cgcgccgggt tttggcgcct cccgcgggcg cccccctcct cacggcgagc 120
gctgccacgt cagacgaagg gcgcagcgag cgtcctgatc cttccgcccg gacgctcagg 180
acagcggccc gctgctcata agactcggcc ttagaacccc agtatcagca gaaggacatt 240
ttaggacggg acttgggtga ctctagggca ctggttttct ttccagagag cggaacaggc 300
gaggaaaagt agtcccttct cggcgattct gcggagggat ctccgtgggg cggtgaacgc 360
cgatgattat ataaggacgc gccgggtgtg gcacagctag ttccgtcgca gccgggattt 420
gggtcgcggt tcttgtttgt ggatcgctgt gatcgtcact tggtgagtag cgggctgctg 480
ggctggccgg ggctttcgtg gccgccgggc cgctcggtgg gacggaagcg tgtggagaga 540
ccgccaaggg ctgtagtctg ggtccgcgag caaggttgcc ctgaactggg ggttgggggg 600
agcgcagcaa aatggcggct gttcccgagt cttgaatgga agacgcttgt gaggcgggct 660
gtgaggtcgt tgaaacaagg tggggggcat ggtgggcggc aagaacccaa ggtcttgagg 720
ccttcgctaa tgcgggaaag ctcttattcg ggtgagatgg gctggggcac catctgggga 780
ccctgacgtg aagtttgtca ctgactggag aactcggttt gtcgtctgtt gcgggggcgg 840
cagttatggc ggtgccgttg ggcagtgcac ccgtaccttt gggagcgcgc gccctcgtcg 900
tgtcgtgacg tcacccgttc tgttggctta taatgcaggg tggggccacc tgccggtagg 960
tgtgcggtag gcttttctcc gtcgcaggac gcagggttcg ggcctagggt aggctctcct 1020
gaatcgacag gcgccggacc tctggtgagg ggagggataa gtgaggcgtc agtttctttg 1080
gtcggtttta tgtacctatc ttcttaagta gctgaagctc cggttttgaa ctatgcgctc 1140
ggggttggcg agtgtgtttt gtgaagtttt ttaggcacct tttgaaatgt aatcatttgg 1200
gtcaatatgt aattttcagt gttagactag taaattgtcc gctaaattct ggccgttttt 1260
ggcttttttg ttagacgtgt tgacaattaa tcatcggcat agtatatcgg catagtataa 1320
tacgacaagg tgaggaacta aaccatggga tcggccattg aacaagatgg attgcacgca 1380
ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc 1440
ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc 1500
aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg 1560
ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg 1620
gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatctca ccttgctcct 1680
gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct 1740
acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 1800
gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 1860
ctgttcgcca ggctcaaggc gcgcatgccc gacggcgatg atctcgtcgt gacccatggc 1920
gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt 1980
ggccggctgg gtgtggcgga ccgctatcag gacatagcgt tggctacccg tgatattgct 2040
gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc 2100
gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgagg ggatccgctg 2160
taagtctgca gaaattgatg atctattaaa caataaagat gtccactaaa atggaagttt 2220
ttcctgtcat actttgttaa gaagggtgag aacagagtac ctacattttg aatggaagga 2280
ttggagctac gggggtgggg gtggggtggg attagataaa tgcctgctct ttactgaagg 2340
ctctttacta ttgctttatg ataatgtttc atagttggat atcataattt aaacaagcaa 2400
aaccaaatta agggccagct cattcctccc actcatgatc tatagatcta tagatctctc 2460
gtgggatcat tgtttttctc ttgattccca ctttgtggtt ctaagtactg tggtttccaa 2520
atgtgtcagt ttcatagcct gaagaacgag atcagcagcc tctgttccac atacacttca 2580
ttctcagtat tgttttgcca agttctaatt ccatcagacc tcgacctgca gcccctagcc 2640
cgggcgccag tagcagcacc cacgtccacc ttctgtctag taatgtccaa cacctccctc 2700
agtccaaaca ctgctctgca tccatgtggc tcccatttat acctgaagca cttgatgggg 2760
cctcaatgtt ttactagagc ccacccccct gcaactctga gaccctctgg atttgtctgt 2820
cagtgcctca ctggggcgtt ggataatttc ttaaaaggtc aagttccctc agcagcattc 2880
tctgagcagt ctgaagatgt gtgcttttca cagttcaaat ccatgtggct gtttcaccca 2940
cctgcctggc cttgggttat ctatcaggac ctagcctaga agcaggtgtg tggcacttaa 3000
cacctaagct gagtgactaa ctgaacactc aagtggatgc catctttgtc acttcttgac 3060
tgtgacacaa gcaactcctg atgccaaagc cctgcccacc cctctcatgc ccatatttgg 3120
acatggtaca ggtcctcact ggccatggtc tgtgaggtcc tggtcctctt tgacttcata 3180
attcctaggg gccactagta tctataagag gaagagggtg ctggctccca ggccacagcc 3240
cacaaaattc cacctgctca caggttggct ggctcgaccc aggtggtgtc ccctgctctg 3300
agccagctcc cggccaagcc agcaccatgg gtacccccaa gaagaagagg aaggtgcgta 3360
ccgatttaaa ttccaattta ctgaccgtac accaaaattt gcctgcatta ccggtcgatg 3420
caacgagtga tgaggttcgc aagaacctga tggacatgtt cagggatcgc caggcgtttt 3480
ctgagcatac ctggaaaatg cttctgtccg tttgccggtc gtgggcggca tggtgcaagt 3540
tgaataaccg gaaatggttt cccgcagaac ctgaagatgt tcgcgattat cttctatatc 3600
ttcaggcgcg cggtctggca gtaaaaacta tccagcaaca tttgggccag ctaaacatgc 3660
ttcatcgtcg gtccgggctg ccacgaccaa gtgacagcaa tgctgtttca ctggttatgc 3720
ggcggatccg aaaagaaaac gttgatgccg gtgaacgtgc aaaacaggct ctagcgttcg 3780
aacgcactga tttcgaccag gttcgttcac tcatggaaaa tagtgatcgc tgccaggata 3840
tacgtaatct ggcatttctg gggattgctt ataacaccct gttacgtata gccgaaattg 3900
ccaggatcag ggttaaagat atctcacgta ctgacggtgg gagaatgtta atccatattg 3960
gcagaacgaa aacgctggtt agcaccgcag gtgtagagaa ggcacttagc ctgggggtaa 4020
ctaaactggt cgagcgatgg atttccgtct ctggtgtagc tgatgatccg aataactacc 4080
tgttttgccg ggtcagaaaa aatggtgttg ccgcgccatc tgccaccagc cagctatcaa 4140
ctcgcgccct ggaagggatt tttgaagcaa ctcatcgatt gatttacggc gctaaggtaa 4200
atataaaatt tttaagtgta taatgtgtta aactactgat tctaattgtt tgtgtatttt 4260
aggatgactc tggtcagaga tacctggcct ggtctggaca cagtgcccgt gtcggagccg 4320
cgcgagatat ggcccgcgct ggagtttcaa taccggagat catgcaagct ggtggctgga 4380
ccaatgtaaa tattgtcatg aactatatcc gtaacctgga tagtgaaaca ggggcaatgg 4440
tgcgcctgct ggaagatggc gattgatcta gataagtaat gatcataatc agccatatca 4500
catctgtaga ggttttactt gctttaaaaa acctcccaca cctccccctg aacctgaaac 4560
ataaaatgaa tgcaattgtt gttgttaaac ctgccctagt tgcggccaat tccagctgag 4620
cgtgcctccg caccattacc agttggtctg gtgtcaaaaa taataataac cgggcagggg 4680
ggatctaagc tctagataag taatgatcat aatcagccat atcacatctg tagaggtttt 4740
acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 4800
tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 4860
aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 4920
caatgtatct tatcatgtct ggaataactt cgtataatgt atgctatacg aagttatgct 4980
agtaactata acggtcctaa ggtagcgagc tagccaagtc tgtgtgctac caagtagcaa 5040
aactgagcct ggaactcaca catgcgtgtc tgagagccca gcactatcgc caggaaaacc 5100
cagcgtctcc ctgctcaagc ctgaccctca gccctctctg cctctccctg cacttgcctt 5160
ccagtcaagg tgattctgga taaatactac ttcctctgcg ggcagcctct ccacttcatc 5220
ccgaggaagc agctgtgtga cggagagctg gactgtccct tgggggagga cgaggagcac 5280
tgtgtcaaga gcttccccga agggcctgca gtggcaggtg agtgcagggt ctgaggcaca 5340
agagaagtgg gcccagcagg aggtctgctc aggcccccac ggcccactgc atagtatctg 5400
ccccctactt gtcacttttc atccttgttg tataaggttc tttgtttgtt tgtttgttgt 5460
tgttttgagg cagagtgctc tgtggcccaa gatggagtgc agtgtcttgg tctcggctca 5520
ctgcaacctc tgcctcccag tttcaagtga ttcttctgcc tcagcctcat gagtagctgg 5580
gattacaggt gccagccacc acgcctggct aatttttata tttttagtag agacggggtt 5640
ttgccacatt ggtcaggctg atcttgaact cctgacctca ggtgatctgc ccgcctcagc 5700
ctcccaaagt gctgggatta caggcgtgag ccaccgtgcc cagctgtgta agtttcttga 5760
gagcaggacc ctgtcttgtc tacctttaaa tcctagtact taacacacag caaacagtaa 5820
ctatttgatg accaaatgtg agccagaaag gacaggaaat tgtaactgag gctgccccat 5880
gcgtgctgcg cctggtggat ttcaggcaga gggctagact gggtgacctt ggggcattcc 5940
tcctttctat gaaatttgtt atttcaagga gactagaaaa gagacttctc agccacttcg 6000
ccagctattg gtccttctat tcattagtgt ttgctgagac atgctatgtg acaggactga 6060
gccaggtcct ttcaatggat aggagatgtt ttgagcataa aatccacgtt ctctcttggg 6120
ctgggctctt ctaccttctt ccccctggtg cttgggctct gaagaaaaaa agataggtag 6180
gagatgagtg atggggcttc tgagggcagg gctgagtgac tttctgtgta tttgctcttt 6240
ctttatcaga agtcaaatgc ccacaggcac ctgtcatcct actgccagta ggacttctca 6300
ctcaaccttc ccctctgacc ttacttggag aaggacttag gtccctctct cagacatttc 6360
cccaggctgg gcaagttgtg tggaccatgg atgggtatgt ggtccataca atttaaacaa 6420
gctgtatatg gtcgctgggt agagtgacca cataattgat catcaaaact gatacctgta 6480
agagcaaaag ggggcactat taaccattgg gtcagggcaa caggtcaaaa tggagaccta 6540
ccctgggact tctggtcaca ctagctactg tcaaaatggg gcccaaatag acaaagccaa 6600
atggaagaaa ttcccttgac attgaaagtg ttggggctct gtggcacccc cagttctagg 6660
ttgggggagc ttgggctggt ctcatgatga gttctgaggg ggatgggcca gttgggcccc 6720
ccgttccatc taactcaggt tcctttcctc ccagtccgcc tctccaagga ccgatccaca 6780
ctgcaggtgc tggactcggc cacagggaac tggttctctg cctgtttcga caacttcaca 6840
gaagctctcg ctgagacagc ctgtaggcag atgggctaca gcaggtaacc aacctgggcc 6900
tctctccttt ttccctcctt cctccttcct cctcttcctc ctttccttcc tcccttcttc 6960
tctctttcct aaaaattacg ggcattggag ccaggcagaa tggcttttga atcccagcat 7020
ttcacttata agcaacatga agttaaattt cctaagcctc aggttcctca ggagttaatt 7080
gggggaacta atgccaacct cataggatag ttttgcaatg ccagtgagag aatgtgtgct 7140
gccctccaac acacacacac acacttctag cgtctatgca gtcctctcct ttcctttact 7200
cctcaacctt cactcctttg tgctggcttt gcaagaaact gttcctgccc agtaatacaa 7260
aagctaagtt aacttattca aagtttcgtt agttaagatt tagcttaagt gagcctagtt 7320
tcagtggggc cccatcttca gcaatcccag ctctctctgc aaatttcaaa agcagttcca 7380
aatctggagt ggatgaaaag gtgtaagatg atagtaagag taatttgcat tctatatatt 7440
tatattcact tgattttggc agaaaaccaa aaagatagtt attatatctt atatatagat 7500
atatattata tctatttcat aaataggctc aaacaaagta agtaacttgc tagggtacta 7560
gctgggaggt agagggctag aatttgagcc caagacccct aattcttgcg cattaggagt 7620
tcccacattg tttctgtttc tagactgagt aattctttat tctcatgtag gacatcatct 7680
ctaagggaag gggctaatga gatggttgat cactcagaga gtttagctgg agaggatgga 7740
aaagaaccca tacattcagt tgcagattga gatagcctat ctctggcagg cctcagattt 7800
cttcaggatt ctaacagact ggacccagag actaggccaa acaaacaaac aaacaaaaac 7860
tctactaggc agacatcacc aaccaatcac agaactctct cccatggatc cctaatacag 7920
cctcaaagtc cttttcagta aatgctccag gcagccatta caaatcaatc agaattattt 7980
gcctttctct tctctgctca acgggcttct gctgctctct actttccata gggggcaact 8040
tccattaccc tctagaaagc acaccccacc accttcattt caaggagagt gaggaactca 8100
tgcccagcac ctgctattct cccctcttcc tgcagccacg gagcccagcc tcgctgcagc 8160
cagccctgcc tccccactgt agtccagtca actgctgcat cagccgttcc tggcacagca 8220
ggctgagcct tgattatgaa acctgggtgt ctccaggggt tcttaagatg ataggctcct 8280
ggaatttctg tccttttgga gctcagtaag gcaccaaacc acctgagtct tgtgcttcac 8340
aaaatcaaag ttcatcagaa tcattcattg ggatggaatt ggtgaacaga agttaacttt 8400
cctgggaatg tccatttcca ccatattccg tccttctagg tctcagactt ctctactttc 8460
tttcctctct ctagatcgga ggcccttctt gtcctagaac cataggcatt tcaagatgtg 8520
ggagacccta gggatcatct agtccacgca tctttttttt ttttttttga cagagtctca 8580
ctctgtcacc caggctggag tgcaatggca ccatctctgc ttactgcaac ctccacctcc 8640
caggttcaag tgattctttc gcctcagcct cccaagtagc tgggattaca ggcacgcacc 8700
atcatgccca gctaattttt atatttttgt agagaccgag tttcaccatg ttggccaggc 8760
tggtcttgaa ctcctgacct caggtgatcc acccacctcg gcctcccaaa gtgctgggat 8820
tacaggcgtg agccactgca cccagccccg tgcatctttt tatagagggg gaaactgagg 8880
cttggagaga cccagaaaaa gaatatgacc tgcccaaggc cacacatcaa actagtgcca 8940
gagccaggga cagaacctag atcatgagga ctcttaaaat gcactctagt cctcccaggt 9000
ctgagacttg ggtccttcca ggaagtgcca gcattcctgc ctgagaatgt gccaatccac 9060
cagtattgcc aatgactcag ccctccatgg agagcttcta ctaacattac tagcatagtt 9120
agggatggaa ggaaaagatt tagaagaggc agattcagta aaggaacaat cagagagatg 9180
gaattaatca aggaaggctt cctggaggag gaaaaacttc aacccaaggt ttgaaagtag 9240
caagcatgga ttagcaggga gaaagaggga gagtggtcca gttgagagaa acgtttgtct 9300
ggattcatat gaagacagat ctagtcctgt tctattaaat atctctaagg gggccaaaaa 9360
catacccccg ctatcaaagt cagaccagat gctttgtttg gagaacgaaa tatccacatt 9420
ccaactccct cccaggtgag aagggagcta acctgagccc ctatgcctct ttgtttccct 9480
gctgtgaacc agaagacatt gctgggatat ttgaaatagg gacagagctg ggaatatgga 9540
aaggagaccc ctaacatttc tccagggctc tgggttctgg atttggattc cccacccaag 9600
aaagcaagtt acatcagcaa tgcactgagg gttgagtcct gggatgccaa gggtcggttc 9660
tttattgtat agcaaagcag gccccatctt cactgactaa gaccatctcc actccctggc 9720
cactccccac caagcattct ctgccactct ttctcctgaa agtgggggcc aactctacca 9780
tcttgttcta accccctgcc ccagctcaca actctctctc cctcttgatg tgagcagcaa 9840
acccactttc agagctgtgg agattggccc agaccaggat ctggatgttg ttgaaatcac 9900
agaaaacagc caggagcttc gcatgcggaa ctcaagtggg taagtgaggg gacaccttct 9960
ggcctacaga aggcccccac atggacgctg ctcttcaggt tgcaaccagc tcacctggaa 10020
ccccaagcag ccaggggaat gtaagcagac atcaggaaga actcctagcc agatggatca 10080
ttcaatgcca agagctatag actcacattt tggagaggtt ttctgtgttg acttgttttt 10140
aatacaatgg acagctggac aaagtgtgtt gtcctactca gagccagagg gatggataat 10200
gtgacctttc catcaatctg gatagtaaat agtttttgct actgctgtag gttttctaat 10260
aaattgccca ataggcaaga ttccaaagtc actttgtcct tccctaccac ttacccagcc 10320
agagctcccc accttcttga tgctccaggg aagaggctcc atggcccttg tgggtggcct 10380
gttcctgagc ctcgccaccc tgtgttagag cagagcatcc agatgaaatc tgtcacactg 10440
tggcaaagtg gctcagagag gaggctggct tcctagcatt cagggacgtt gctgagggcc 10500
gcttattcac cgaaaataaa tcttgaaaag gacagggctg gtagcagaat gatcctttac 10560
ctaaaattct atcaaaatcc cattcttcca tttggaaagc ccacagtgtc acagactctg 10620
ttccgggctc tgtcctcttc cctcttgggt cccaggagcc caggctgggc tttgaagcag 10680
gcagggccca gcacacagta ggtactcagc agtgggggtg ttgaatccaa tcaaacggaa 10740
gtgtcaatgc aggaaatgca atggatgtca atgcagtctc caaatgttcc ccactgtgca 10800
gcttccacat tcccgaggta ttgggagggg acttgaatta acagcttcgg gaggcctgag 10860
tccctgcctc ccagctgagg aagaagctta aatcacaggg cgctgtgtct gtcttccagg 10920
ccctgtctct caggctccct ggtctccctg cactgtcttg gtgagtaccc ccaatctctg 10980
agggtttggg gcctgggcca gcaatgagca gggaggaaga ccttcatctt cactcctaaa 11040
tttctgggac tccaagtttc attctgcctt ggtctacagc ccttgggctt gtcggtcaat 11100
gccccctcga gttgttggtg gccttgggca ggtcacattc tttttctggg tctttccaag 11160
ccccagtttc ccccttctac catctgtgca tggctccatg acctaagtgg agacctggga 11220
gagagtgtta ggaagaccga aaagggcagg acggggcctc cactgcctcc catccctggt 11280
ccgggcccac atagccttct ttgtcacaat cagctcaggt atccaagatc agattaccca 11340
cattcattat ttgagcaact attcattgaa cagttagaat atgtctcact ctgtcagttg 11400
ctggctagaa gtagaaagta ccagatgagt gaaataattg gccactatcc ttggtagctg 11460
atgactaagt aagagagaga tgcaagacaa catgtggaaa atgccaaact gagtagcagt 11520
cacagttgac atgctgcaga gagagctggc cgggggtcag aagacctggg caccagtcct 11580
gttcatttcc agtgtggcct cgagtcattc acctgacctc cctgaagttc attttcccaa 11640
gaagttgttt agtccaactg cccatcaagg atctttaggg acccttctag ctctaacaga 11700
ggagatcaga aaagaaaaca agcaatgtgg ctcagctcat cctacaagct tcatagagaa 11760
ctgagactgg cctggaagca tagccagaaa ttagaacgcc taagggaaga aggtcacaac 11820
gctgcctctg caatttagga gtgtatatgc tttcctgcag gatgttgaga gtttcattca 11880
ttatcgtatg ccccctaccc cggccccaca atacctagtg cgtgggatct gacacgtggt 11940
ggctggtcaa tgaatgaatg aatgaatggt cacaccatct gaggttctgc actgagtagc 12000
cctgaaggct tgaagcagca taagtgacag gtcctccctt gaggggcctc tgttttacca 12060
ataagccaag acctaagctc aacaacactg aaagggtggc caatacccag gacagcctgt 12120
gggaattcca gagaaaggga gattcccagg gactgggggc ccaggctaaa cactgaaaaa 12180
tgcatctgta ggctcaagga ggaaaagccc atgtctgtct gtcttgccca ccactctctc 12240
ccagcaccca gcactgcccc aggacagaga gcacttgaca caagttggtt agattaatga 12300
atgatttaga gttcagtggt ccccaacctt tttggcacaa gagactggtt gcatggaaga 12360
caatttttcc gcaaaccaag agggggatag agagcattag attctctctt tttttttttt 12420
ttgagaccaa gtctggctct tgtcactcag cctggagtaa agtgttgcga tctcggctca 12480
ctgcaacctc cgcctcctgg attcaagcga ttctcctgcc tcagccccct aaatagctgg 12540
gattacaggc acccgtcacc agcccagctg ggactatagg catgtgccac catgcccggc 12600
taatttttgt atttttagta gagacggcgt ttcaccatgt tggccaggct agtctcgaac 12660
tcctgacctc aggtgatctg cccgcctgag cctcccaaag tgctgggatt acaggcatga 12720
gctgcctcac ccagcctaaa gtctcataag gaacgtacag catagatccc tcacatgtgc 12780
agttcacaat aaggttgtgc tcctacaaga atctaacgcc acctctgatc tgacaggagg 12840
tgaagctcag gtggtcatgc tcgcttgtcc ctgccactca cttcctaatg tacagccagg 12900
ttcctaacag gccacgaacc agtgggaagg gcatcttttt ggatcaaaaa cagaattact 12960
ttttagagaa ctacaagcag atcaatttgg ctagacagag actttatatg aaacagcagg 13020
aggctgctag gaggagtgga aactctactt tgccctcaag ggagatcccg aagggctttg 13080
caggagcggg caaggtggca tgaagaaagc agtgtttgaa atcaggtggt atttgaaaag 13140
cccagccctt ccccttagaa tggcccttct accatctgtg catggctcca caaccgtggt 13200
ggtggctgcc agaagaattg gaaaggcaga gcatgggtgg agagggggga cctgagggct 13260
ttacaggagt tccgggggtg gtgagggtgt gaaagccagg tcagtcagta ggaagacagg 13320
atgtcagatt gagagactcc cctggccggg gaaacagact tggagaaggg ggagttttgg 13380
atgagacagt ccacttccga gtcacaaaat agcttgtggg tgtctgttta ctgttactca 13440
gtgggagtgg ctggggacac gccacctggg cagggctttc gtaattctgc atcacttgtg 13500
aaggtcacag attcccagca caacggacac acccatgttc atagtctgaa ctcctaaaca 13560
catcttaaac caaaataaaa aaaaaagaaa gaaagaaaga aaaaggagag ggaggtttga 13620
ggaaagccta tggtctggga cactcaatac ctcccatgaa tatctcatat tgggctggtc 13680
ctctctccac tctggcccca gccataaggg ccctgcttag agcagatttt gggtgctgag 13740
tggaggcagc ctcatcccca acagcctgac ttcctgcctc ctccctgcct ctgcctgtgt 13800
ccagcctgtg ggaagagcct gaagaccccc cgtgtggtgg gtgtggagga ggcctctgtg 13860
gattcttggc cttggcaggt cagcatccag tacgacaaac agcacgtctg tggagggagc 13920
atcctggacc cccactgggt cctcacggca gcccactgct tcaggtaaga ccccagctgt 13980
aaggaggtct ctggggacca aggccagtca gggaccagag agcttggggt cctgtctcct 14040
ggcaccgtcc ttctcttcac tctcccacta gagacgtttt ccaggttgtg gtggccccaa 14100
tgagacaatg gccatgatgc cctttgttag gcttttgggt gtctgagcag agggtgctgg 14160
tcaccaagca tggcctcttc ctggtgggac accagcagat acccagagtc ctcaccccac 14220
ccccatatcg ttcaagctac aaaagctctt cccacctgcc tcaacttcca agaactcact 14280
ctctttttgc ttgtttccag gaagttgttc cagggtctag agtcatagcc acgtcctcat 14340
tatgtctgga aactttaaaa aaattaaaga gcataggttc ctttcagtcc acagagaagc 14400
ctggccttac ctcagggaag ggctactccc agaccccctt cacttttttt tttttttttt 14460
tttttttttt ttttgagaca gagtcttgct ctgttgctta ggctggagcg cagcagcatg 14520
atcttggctc actgcaacct ccgcctcctg agttcaagca attctcctgc ctcagcttcc 14580
caagtagctg ggactatagg catgggccac catgcccggc taatttttgt atttttggta 14640
gagacagggt ttcaccatgt tggccaggct gatctctaac tcctgacctc aagtgatctg 14700
cccacctcag cctcccaaac tgctgggatt acaggcatga gccagggcat ccggctttta 14760
tttattcatt cattcaatat ctaatgagca cctaccaggt accaaacacc agatgatgcg 14820
cccaagttca ttagacccca ccgctgtctt caaggcactc atgatctagg ccagcgtttt 14880
ttaaccactt tttttttttt tttttttgag attctggtga gagctataaa ttctttcctg 14940
gaaaaacatc tctgcacact aagctgtgcc tggcattggg aaaaagaaag cacgtaatgt 15000
aactgacagc atgagtaaca cagtgagaaa ggttggagga gagagcgcca ggacctcaga 15060
actcaggcat tagaggagcc ccttccccag ccctccttga ggtttcgttg ggcaggtttc 15120
actgaggaaa aagggtcaaa tccctttttc gaatttgact tcttgtaagt gccagaagac 15180
tgccccttct ccaccatccc tgcctcacca tcatctttcc tcccaaggca gtgacatcca 15240
gcaccccgat ccctagggcc ctggggaccc agcctttggc aaagtctcct caggcttgga 15300
tcaggcctga acccagctgt ctctaccccc aggaaacata ccgatgtgtt caactggaag 15360
gtgcgggcag gctcagacaa actgggcagc ttcccatccc tggctgtggc caagatcatc 15420
atcattgaat tcaaccccat gtaccccaaa gacaatgaca tcgccctcat gaagctgcag 15480
ttcccactca ctttctcagg tgagaagcag ggcccaaggc cactcaagcc tcttacatca 15540
gttttcacgc ccactctgct attagctcac tgaccgccct tggcacataa tgtctcctct 15600
caagtcctca gcttgcccat ttgtctctaa tacgtcagcc taacatcact gatgccatga 15660
ggcctcctca agctgtcagc taacacctcc actccattcc ctgccagaga ttcttccaag 15720
gcctgtcttc cctatgtgga gcccctcgag tgagaactgg agtttcatcc aatcttggag 15780
ttttaggaga ccttttaaaa agattatcga gctaattccc caccactgac caacacgcaa 15840
gagcctgctc agtatccctg ccaaggagtc attgtgcccc tgtttgctct cctccagggg 15900
cagggaaccc attacctgtg aggcagccca cagagtcttt gaacagctct gttggatgcc 15960
ttgtgcttat actgaaatgt atttagatca ggattcccaa ctgtggggtc cacaagacac 16020
tggccccttg gagaagagag gattccattg tcaaataagt ttggggaaca ttttcatact 16080
acagctccct tcttggaaca cattagttta ttaaaggtag gagaagtttt taaaataatc 16140
tgttttattg cgtttaacct acatttttta aatttatttg accacagaat ccttttttca 16200
tgctacttct attagcatcc catagaacaa gtgttctaga gaccctggtg tgaccccttt 16260
cagagagctt aactgccagg ctctcctgag ccctggtgtg tgtttcaaga tttgtgcctg 16320
ggaattgttt taatcaggta tggcaaggtg acagatacag acacagctat ctttgaaaga 16380
agagtttatt atttataatt cctgagagaa agggacatac cccacccccc aacacaggga 16440
cacccgggga agcagctggg tccaccagga ggcaggagtg aggggaaggc atggcccaga 16500
gccacctgtg gcttccatgg gcaggtctgg ccaaggtagg gtaggcaaga ttgagcatgc 16560
tcaggattgg atagtgtgga caattctcta ggctatagat gtcagcctct ggttgtctag 16620
tatctgtccc tggggtgatt tagggcaggg aaaatattgg cttggtgtct gagagtcaga 16680
taaaggaagt ggttggggat atgggctttg ggttggctgg tttgcctatt aaaggcgtgc 16740
ccaaagccaa gttgtttact atctgcagga attagctaac ccagtctctc ccagaccagc 16800
aagatcccca taatcataaa gcatcataat ttacagaaaa ttaacactta tgatgaataa 16860
aagatctcct tcttcctctg tgctcctggc aggcacagtc aggcccatct gtctgccctt 16920
ctttgatgag gagctcactc cagccacccc actctggatc attggatggg gctttacgaa 16980
gcagaatgga ggtaagtcct gggtgcagga ccacagggca ggagatgccc ttgtatgagg 17040
gagcagcttc cagaagtaat gggaaggagg accacccttc agagaaaccc atcctggagg 17100
accaagcacc aaggcgccag gcagaaagca aagtggtttg gcaatccagg gctgggggat 17160
agaaggcaag gatgggaatg tgagtgtttt taccctccca gggaagatgt ctgacatact 17220
gctgcaggcg tcagtccagg tcattgacag cacacggtgc aatgcagacg atgcgtacca 17280
gggggaagtc accgagaaga tgatgtgtgc aggcatcccg gaagggggtg tggacacctg 17340
ccaggtgggg cctccaagaa tcatggggag ttctaagaat agggtttagg tcctagagag 17400
atgagaaaac ccagaggctg catgccctac aggaagcctt gcatatcatg ggcactcaat 17460
gtgtgatgat gggaggaaga gagggaggga aggaaaggat agtcagataa aagtgtacca 17520
atagatgagt gggtggatgg atggatgcag acaagcagag agatttcaaa tgtctctttc 17580
acattcgaag atgatgttac tggcctggca tggtggctca cgcttgtaat cccagcactt 17640
tgggaggctg aggcgggcag gtgatttgag gtcaggaatt caagaccagc ctggccaaca 17700
tggtgaaatc ccatctctac taaaaagaat acaaaaatta gctgggcgtg gtggcacgtg 17760
cctgtaatcc cagctacttg ggaggctgag gcaggagaat tgcttgaacc caggaggcag 17820
aggttgcagt aagctgagat tgcgccactg cactccagcc tgggtgaccc agcaagactc 17880
catctgaaaa caacaacaac aacaaagatg acattactca tccaccccac ccacccttct 17940
cactagctac agaatgatta gccccttgag gtcaggaatc ccaggtctat tttctctgtg 18000
actctcccca agctgctgaa ctacactagg aaagaattac cgcctgcaga atgctggaag 18060
cacatctgtg tgtgccctca ccccggcctc attggccatc aggactgctt agcaatccct 18120
gtagaccttc ttcctccccc atacttccag aggatcttct gaactatttt ctttttttat 18180
tttttctttt atgtttttta acagagacag ggtcactatg ttgcccagtc tggtctcaaa 18240
ctcctgggtt caagggattc tcccacctca gctttccaaa atgctgggat tacaggcatg 18300
agccatcgtg cttggcctga accattttca ttaaaacccc taccctactc tcacctccat 18360
ttccagtcat taaattcctt catttaagag gcatctctta gtcatcgcat gtgtgccatg 18420
aacatggtag tctttggaga cccctcaggg agctcacagt ggttggggga aaggggggca 18480
ttaaacagac atttaagcta tagttttggg ttcagaggga ggaagcccca ggggctaaaa 18540
cagctgataa ggactcccag ataagtgcac ttttcactat ctggcatttt cttgttttgt 18600
tatttgcttg ttcactgtct ctcaccccat ttgatcctaa gctttctgag ggcagggatc 18660
tttgtttttt ttcatcagtt ggatcccaat tgcttagaac actacctggc acaaaatagg 18720
cactctataa gtgattacac aaattttgga acgactaggt taaacaatga taaccaggct 18780
tttttttttt tttttgagac tgagtctcac tctgttgccc aggctagagt gaagtggttt 18840
gatctcggct cactgcagcc tccgcctctg ggttcgaatg attctccacc tcagcctcct 18900
gagtagctgg gattacaggt gcctgccact atgcccagct aatttttgta tttgtagtag 18960
agacgggttt caccatgttg gccaggctgg tcttgaactc ctgacctcaa gtgattcacc 19020
cgcctcagcc tcccaaggtg ctgggattac aggtgtgagc caccgctcct ggccaacaac 19080
caggcttttt taagacatca ctcagagcct ttaatttgct aatgtgagtt gtgaatctct 19140
gagagaaggc taacggcatg cttgcaactt acttgtccac agacaagcct ttctgcccca 19200
gaagagaaga ccattctagg gtgctaatga gcaaagaggg tgagggtgga atatcggaga 19260
gcagcaggga gtgcagggga acagataggc cagttcaggg agcagagaag gagaagcccc 19320
cccacctcac ctgccctccc cagcagtctc tgttctggtc tctcacaggg tgacagtggt 19380
gggcccctga tgtaccaatc tgaccagtgg catgtggtgg gcatcgttag ttggggctat 19440
ggctgcgggg gcccgagcac cccaggagta tacaccaagg tctcagccta tctcaactgg 19500
atctacaatg tctggaaggt aaggtacctt tgccctaccc actgtgcctt ccctccagtc 19560
ctctacctgg ggggtgccaa tccatcctca ggtttgattt aaatggttct gacaactctt 19620
tacatcccaa ataactttcc ctccaagcaa gggacagcct gagattgcac tattaaggct 19680
gaaattcctt aggtcagaga tttctgataa atgcaaatac cttagggaat agaacacacc 19740
aagcctttct ttctcttttc tgacagaatg agactatcag atcctttcta gagagaagat 19800
tctgataagg aagagagtgg aaaggctcat gagacctcct ggccctctgc agggtaggga 19860
gagaagcaaa gtgtttcaga aaaggaagac tcacgttaca catgtcacca ctttgtccag 19920
tttcagataa tctgactttc tcttcatcgg tctctcttat tctaggctga gctgtaacgc 19980
tgccgtcccc cacatccaga agctgcttcc cttcagacct acctacggca tgacccctca 20040
aagtcagata tgggacaaga gcctccttga acaaactc 20078
<210> 13
<211> 15159
<212> DNA
<213> 人工序列
<220>
<223> 重组多核苷酸
<400> 13
ccacccgcac acactacagt cgagataact tcgtataatg tatgctatac gaagttatgc 60
tagtaactat aacggtccta aggtagcgag ctagccaagt ctgtgtgcta ccaagtagca 120
aaactgagcc tggaactcac acatgcgtgt ctgagagccc agcactatcg ccaggaaaac 180
ccagcgtctc cctgctcaag cctgaccctc agccctctct gcctctccct gcacttgcct 240
tccagtcaag gtgattctgg ataaatacta cttcctctgc gggcagcctc tccacttcat 300
cccgaggaag cagctgtgtg acggagagct ggactgtccc ttgggggagg acgaggagca 360
ctgtgtcaag agcttccccg aagggcctgc agtggcaggt gagtgcaggg tctgaggcac 420
aagagaagtg ggcccagcag gaggtctgct caggccccca cggcccactg catagtatct 480
gccccctact tgtcactttt catccttgtt gtataaggtt ctttgtttgt ttgtttgttg 540
ttgttttgag gcagagtgct ctgtggccca agatggagtg cagtgtcttg gtctcggctc 600
actgcaacct ctgcctccca gtttcaagtg attcttctgc ctcagcctca tgagtagctg 660
ggattacagg tgccagccac cacgcctggc taatttttat atttttagta gagacggggt 720
tttgccacat tggtcaggct gatcttgaac tcctgacctc aggtgatctg cccgcctcag 780
cctcccaaag tgctgggatt acaggcgtga gccaccgtgc ccagctgtgt aagtttcttg 840
agagcaggac cctgtcttgt ctacctttaa atcctagtac ttaacacaca gcaaacagta 900
actatttgat gaccaaatgt gagccagaaa ggacaggaaa ttgtaactga ggctgcccca 960
tgcgtgctgc gcctggtgga tttcaggcag agggctagac tgggtgacct tggggcattc 1020
ctcctttcta tgaaatttgt tatttcaagg agactagaaa agagacttct cagccacttc 1080
gccagctatt ggtccttcta ttcattagtg tttgctgaga catgctatgt gacaggactg 1140
agccaggtcc tttcaatgga taggagatgt tttgagcata aaatccacgt tctctcttgg 1200
gctgggctct tctaccttct tccccctggt gcttgggctc tgaagaaaaa aagataggta 1260
ggagatgagt gatggggctt ctgagggcag ggctgagtga ctttctgtgt atttgctctt 1320
tctttatcag aagtcaaatg cccacaggca cctgtcatcc tactgccagt aggacttctc 1380
actcaacctt cccctctgac cttacttgga gaaggactta ggtccctctc tcagacattt 1440
ccccaggctg ggcaagttgt gtggaccatg gatgggtatg tggtccatac aatttaaaca 1500
agctgtatat ggtcgctggg tagagtgacc acataattga tcatcaaaac tgatacctgt 1560
aagagcaaaa gggggcacta ttaaccattg ggtcagggca acaggtcaaa atggagacct 1620
accctgggac ttctggtcac actagctact gtcaaaatgg ggcccaaata gacaaagcca 1680
aatggaagaa attcccttga cattgaaagt gttggggctc tgtggcaccc ccagttctag 1740
gttgggggag cttgggctgg tctcatgatg agttctgagg gggatgggcc agttgggccc 1800
cccgttccat ctaactcagg ttcctttcct cccagtccgc ctctccaagg accgatccac 1860
actgcaggtg ctggactcgg ccacagggaa ctggttctct gcctgtttcg acaacttcac 1920
agaagctctc gctgagacag cctgtaggca gatgggctac agcaggtaac caacctgggc 1980
ctctctcctt tttccctcct tcctccttcc tcctcttcct cctttccttc ctcccttctt 2040
ctctctttcc taaaaattac gggcattgga gccaggcaga atggcttttg aatcccagca 2100
tttcacttat aagcaacatg aagttaaatt tcctaagcct caggttcctc aggagttaat 2160
tgggggaact aatgccaacc tcataggata gttttgcaat gccagtgaga gaatgtgtgc 2220
tgccctccaa cacacacaca cacacttcta gcgtctatgc agtcctctcc tttcctttac 2280
tcctcaacct tcactccttt gtgctggctt tgcaagaaac tgttcctgcc cagtaataca 2340
aaagctaagt taacttattc aaagtttcgt tagttaagat ttagcttaag tgagcctagt 2400
ttcagtgggg ccccatcttc agcaatccca gctctctctg caaatttcaa aagcagttcc 2460
aaatctggag tggatgaaaa ggtgtaagat gatagtaaga gtaatttgca ttctatatat 2520
ttatattcac ttgattttgg cagaaaacca aaaagatagt tattatatct tatatataga 2580
tatatattat atctatttca taaataggct caaacaaagt aagtaacttg ctagggtact 2640
agctgggagg tagagggcta gaatttgagc ccaagacccc taattcttgc gcattaggag 2700
ttcccacatt gtttctgttt ctagactgag taattcttta ttctcatgta ggacatcatc 2760
tctaagggaa ggggctaatg agatggttga tcactcagag agtttagctg gagaggatgg 2820
aaaagaaccc atacattcag ttgcagattg agatagccta tctctggcag gcctcagatt 2880
tcttcaggat tctaacagac tggacccaga gactaggcca aacaaacaaa caaacaaaaa 2940
ctctactagg cagacatcac caaccaatca cagaactctc tcccatggat ccctaataca 3000
gcctcaaagt ccttttcagt aaatgctcca ggcagccatt acaaatcaat cagaattatt 3060
tgcctttctc ttctctgctc aacgggcttc tgctgctctc tactttccat agggggcaac 3120
ttccattacc ctctagaaag cacaccccac caccttcatt tcaaggagag tgaggaactc 3180
atgcccagca cctgctattc tcccctcttc ctgcagccac ggagcccagc ctcgctgcag 3240
ccagccctgc ctccccactg tagtccagtc aactgctgca tcagccgttc ctggcacagc 3300
aggctgagcc ttgattatga aacctgggtg tctccagggg ttcttaagat gataggctcc 3360
tggaatttct gtccttttgg agctcagtaa ggcaccaaac cacctgagtc ttgtgcttca 3420
caaaatcaaa gttcatcaga atcattcatt gggatggaat tggtgaacag aagttaactt 3480
tcctgggaat gtccatttcc accatattcc gtccttctag gtctcagact tctctacttt 3540
ctttcctctc tctagatcgg aggcccttct tgtcctagaa ccataggcat ttcaagatgt 3600
gggagaccct agggatcatc tagtccacgc atcttttttt tttttttttg acagagtctc 3660
actctgtcac ccaggctgga gtgcaatggc accatctctg cttactgcaa cctccacctc 3720
ccaggttcaa gtgattcttt cgcctcagcc tcccaagtag ctgggattac aggcacgcac 3780
catcatgccc agctaatttt tatatttttg tagagaccga gtttcaccat gttggccagg 3840
ctggtcttga actcctgacc tcaggtgatc cacccacctc ggcctcccaa agtgctggga 3900
ttacaggcgt gagccactgc acccagcccc gtgcatcttt ttatagaggg ggaaactgag 3960
gcttggagag acccagaaaa agaatatgac ctgcccaagg ccacacatca aactagtgcc 4020
agagccaggg acagaaccta gatcatgagg actcttaaaa tgcactctag tcctcccagg 4080
tctgagactt gggtccttcc aggaagtgcc agcattcctg cctgagaatg tgccaatcca 4140
ccagtattgc caatgactca gccctccatg gagagcttct actaacatta ctagcatagt 4200
tagggatgga aggaaaagat ttagaagagg cagattcagt aaaggaacaa tcagagagat 4260
ggaattaatc aaggaaggct tcctggagga ggaaaaactt caacccaagg tttgaaagta 4320
gcaagcatgg attagcaggg agaaagaggg agagtggtcc agttgagaga aacgtttgtc 4380
tggattcata tgaagacaga tctagtcctg ttctattaaa tatctctaag ggggccaaaa 4440
acataccccc gctatcaaag tcagaccaga tgctttgttt ggagaacgaa atatccacat 4500
tccaactccc tcccaggtga gaagggagct aacctgagcc cctatgcctc tttgtttccc 4560
tgctgtgaac cagaagacat tgctgggata tttgaaatag ggacagagct gggaatatgg 4620
aaaggagacc cctaacattt ctccagggct ctgggttctg gatttggatt ccccacccaa 4680
gaaagcaagt tacatcagca atgcactgag ggttgagtcc tgggatgcca agggtcggtt 4740
ctttattgta tagcaaagca ggccccatct tcactgacta agaccatctc cactccctgg 4800
ccactcccca ccaagcattc tctgccactc tttctcctga aagtgggggc caactctacc 4860
atcttgttct aaccccctgc cccagctcac aactctctct ccctcttgat gtgagcagca 4920
aacccacttt cagagctgtg gagattggcc cagaccagga tctggatgtt gttgaaatca 4980
cagaaaacag ccaggagctt cgcatgcgga actcaagtgg gtaagtgagg ggacaccttc 5040
tggcctacag aaggccccca catggacgct gctcttcagg ttgcaaccag ctcacctgga 5100
accccaagca gccaggggaa tgtaagcaga catcaggaag aactcctagc cagatggatc 5160
attcaatgcc aagagctata gactcacatt ttggagaggt tttctgtgtt gacttgtttt 5220
taatacaatg gacagctgga caaagtgtgt tgtcctactc agagccagag ggatggataa 5280
tgtgaccttt ccatcaatct ggatagtaaa tagtttttgc tactgctgta ggttttctaa 5340
taaattgccc aataggcaag attccaaagt cactttgtcc ttccctacca cttacccagc 5400
cagagctccc caccttcttg atgctccagg gaagaggctc catggccctt gtgggtggcc 5460
tgttcctgag cctcgccacc ctgtgttaga gcagagcatc cagatgaaat ctgtcacact 5520
gtggcaaagt ggctcagaga ggaggctggc ttcctagcat tcagggacgt tgctgagggc 5580
cgcttattca ccgaaaataa atcttgaaaa ggacagggct ggtagcagaa tgatccttta 5640
cctaaaattc tatcaaaatc ccattcttcc atttggaaag cccacagtgt cacagactct 5700
gttccgggct ctgtcctctt ccctcttggg tcccaggagc ccaggctggg ctttgaagca 5760
ggcagggccc agcacacagt aggtactcag cagtgggggt gttgaatcca atcaaacgga 5820
agtgtcaatg caggaaatgc aatggatgtc aatgcagtct ccaaatgttc cccactgtgc 5880
agcttccaca ttcccgaggt attgggaggg gacttgaatt aacagcttcg ggaggcctga 5940
gtccctgcct cccagctgag gaagaagctt aaatcacagg gcgctgtgtc tgtcttccag 6000
gccctgtctc tcaggctccc tggtctccct gcactgtctt ggtgagtacc cccaatctct 6060
gagggtttgg ggcctgggcc agcaatgagc agggaggaag accttcatct tcactcctaa 6120
atttctggga ctccaagttt cattctgcct tggtctacag cccttgggct tgtcggtcaa 6180
tgccccctcg agttgttggt ggccttgggc aggtcacatt ctttttctgg gtctttccaa 6240
gccccagttt cccccttcta ccatctgtgc atggctccat gacctaagtg gagacctggg 6300
agagagtgtt aggaagaccg aaaagggcag gacggggcct ccactgcctc ccatccctgg 6360
tccgggccca catagccttc tttgtcacaa tcagctcagg tatccaagat cagattaccc 6420
acattcatta tttgagcaac tattcattga acagttagaa tatgtctcac tctgtcagtt 6480
gctggctaga agtagaaagt accagatgag tgaaataatt ggccactatc cttggtagct 6540
gatgactaag taagagagag atgcaagaca acatgtggaa aatgccaaac tgagtagcag 6600
tcacagttga catgctgcag agagagctgg ccgggggtca gaagacctgg gcaccagtcc 6660
tgttcatttc cagtgtggcc tcgagtcatt cacctgacct ccctgaagtt cattttccca 6720
agaagttgtt tagtccaact gcccatcaag gatctttagg gacccttcta gctctaacag 6780
aggagatcag aaaagaaaac aagcaatgtg gctcagctca tcctacaagc ttcatagaga 6840
actgagactg gcctggaagc atagccagaa attagaacgc ctaagggaag aaggtcacaa 6900
cgctgcctct gcaatttagg agtgtatatg ctttcctgca ggatgttgag agtttcattc 6960
attatcgtat gccccctacc ccggccccac aatacctagt gcgtgggatc tgacacgtgg 7020
tggctggtca atgaatgaat gaatgaatgg tcacaccatc tgaggttctg cactgagtag 7080
ccctgaaggc ttgaagcagc ataagtgaca ggtcctccct tgaggggcct ctgttttacc 7140
aataagccaa gacctaagct caacaacact gaaagggtgg ccaataccca ggacagcctg 7200
tgggaattcc agagaaaggg agattcccag ggactggggg cccaggctaa acactgaaaa 7260
atgcatctgt aggctcaagg aggaaaagcc catgtctgtc tgtcttgccc accactctct 7320
cccagcaccc agcactgccc caggacagag agcacttgac acaagttggt tagattaatg 7380
aatgatttag agttcagtgg tccccaacct ttttggcaca agagactggt tgcatggaag 7440
acaatttttc cgcaaaccaa gagggggata gagagcatta gattctctct tttttttttt 7500
tttgagacca agtctggctc ttgtcactca gcctggagta aagtgttgcg atctcggctc 7560
actgcaacct ccgcctcctg gattcaagcg attctcctgc ctcagccccc taaatagctg 7620
ggattacagg cacccgtcac cagcccagct gggactatag gcatgtgcca ccatgcccgg 7680
ctaatttttg tatttttagt agagacggcg tttcaccatg ttggccaggc tagtctcgaa 7740
ctcctgacct caggtgatct gcccgcctga gcctcccaaa gtgctgggat tacaggcatg 7800
agctgcctca cccagcctaa agtctcataa ggaacgtaca gcatagatcc ctcacatgtg 7860
cagttcacaa taaggttgtg ctcctacaag aatctaacgc cacctctgat ctgacaggag 7920
gtgaagctca ggtggtcatg ctcgcttgtc cctgccactc acttcctaat gtacagccag 7980
gttcctaaca ggccacgaac cagtgggaag ggcatctttt tggatcaaaa acagaattac 8040
tttttagaga actacaagca gatcaatttg gctagacaga gactttatat gaaacagcag 8100
gaggctgcta ggaggagtgg aaactctact ttgccctcaa gggagatccc gaagggcttt 8160
gcaggagcgg gcaaggtggc atgaagaaag cagtgtttga aatcaggtgg tatttgaaaa 8220
gcccagccct tccccttaga atggcccttc taccatctgt gcatggctcc acaaccgtgg 8280
tggtggctgc cagaagaatt ggaaaggcag agcatgggtg gagagggggg acctgagggc 8340
tttacaggag ttccgggggt ggtgagggtg tgaaagccag gtcagtcagt aggaagacag 8400
gatgtcagat tgagagactc ccctggccgg ggaaacagac ttggagaagg gggagttttg 8460
gatgagacag tccacttccg agtcacaaaa tagcttgtgg gtgtctgttt actgttactc 8520
agtgggagtg gctggggaca cgccacctgg gcagggcttt cgtaattctg catcacttgt 8580
gaaggtcaca gattcccagc acaacggaca cacccatgtt catagtctga actcctaaac 8640
acatcttaaa ccaaaataaa aaaaaaagaa agaaagaaag aaaaaggaga gggaggtttg 8700
aggaaagcct atggtctggg acactcaata cctcccatga atatctcata ttgggctggt 8760
cctctctcca ctctggcccc agccataagg gccctgctta gagcagattt tgggtgctga 8820
gtggaggcag cctcatcccc aacagcctga cttcctgcct cctccctgcc tctgcctgtg 8880
tccagcctgt gggaagagcc tgaagacccc ccgtgtggtg ggtgtggagg aggcctctgt 8940
ggattcttgg ccttggcagg tcagcatcca gtacgacaaa cagcacgtct gtggagggag 9000
catcctggac ccccactggg tcctcacggc agcccactgc ttcaggtaag accccagctg 9060
taaggaggtc tctggggacc aaggccagtc agggaccaga gagcttgggg tcctgtctcc 9120
tggcaccgtc cttctcttca ctctcccact agagacgttt tccaggttgt ggtggcccca 9180
atgagacaat ggccatgatg ccctttgtta ggcttttggg tgtctgagca gagggtgctg 9240
gtcaccaagc atggcctctt cctggtggga caccagcaga tacccagagt cctcacccca 9300
cccccatatc gttcaagcta caaaagctct tcccacctgc ctcaacttcc aagaactcac 9360
tctctttttg cttgtttcca ggaagttgtt ccagggtcta gagtcatagc cacgtcctca 9420
ttatgtctgg aaactttaaa aaaattaaag agcataggtt cctttcagtc cacagagaag 9480
cctggcctta cctcagggaa gggctactcc cagaccccct tcactttttt tttttttttt 9540
tttttttttt tttttgagac agagtcttgc tctgttgctt aggctggagc gcagcagcat 9600
gatcttggct cactgcaacc tccgcctcct gagttcaagc aattctcctg cctcagcttc 9660
ccaagtagct gggactatag gcatgggcca ccatgcccgg ctaatttttg tatttttggt 9720
agagacaggg tttcaccatg ttggccaggc tgatctctaa ctcctgacct caagtgatct 9780
gcccacctca gcctcccaaa ctgctgggat tacaggcatg agccagggca tccggctttt 9840
atttattcat tcattcaata tctaatgagc acctaccagg taccaaacac cagatgatgc 9900
gcccaagttc attagacccc accgctgtct tcaaggcact catgatctag gccagcgttt 9960
tttaaccact tttttttttt ttttttttga gattctggtg agagctataa attctttcct 10020
ggaaaaacat ctctgcacac taagctgtgc ctggcattgg gaaaaagaaa gcacgtaatg 10080
taactgacag catgagtaac acagtgagaa aggttggagg agagagcgcc aggacctcag 10140
aactcaggca ttagaggagc cccttcccca gccctccttg aggtttcgtt gggcaggttt 10200
cactgaggaa aaagggtcaa atcccttttt cgaatttgac ttcttgtaag tgccagaaga 10260
ctgccccttc tccaccatcc ctgcctcacc atcatctttc ctcccaaggc agtgacatcc 10320
agcaccccga tccctagggc cctggggacc cagcctttgg caaagtctcc tcaggcttgg 10380
atcaggcctg aacccagctg tctctacccc caggaaacat accgatgtgt tcaactggaa 10440
ggtgcgggca ggctcagaca aactgggcag cttcccatcc ctggctgtgg ccaagatcat 10500
catcattgaa ttcaacccca tgtaccccaa agacaatgac atcgccctca tgaagctgca 10560
gttcccactc actttctcag gtgagaagca gggcccaagg ccactcaagc ctcttacatc 10620
agttttcacg cccactctgc tattagctca ctgaccgccc ttggcacata atgtctcctc 10680
tcaagtcctc agcttgccca tttgtctcta atacgtcagc ctaacatcac tgatgccatg 10740
aggcctcctc aagctgtcag ctaacacctc cactccattc cctgccagag attcttccaa 10800
ggcctgtctt ccctatgtgg agcccctcga gtgagaactg gagtttcatc caatcttgga 10860
gttttaggag accttttaaa aagattatcg agctaattcc ccaccactga ccaacacgca 10920
agagcctgct cagtatccct gccaaggagt cattgtgccc ctgtttgctc tcctccaggg 10980
gcagggaacc cattacctgt gaggcagccc acagagtctt tgaacagctc tgttggatgc 11040
cttgtgctta tactgaaatg tatttagatc aggattccca actgtggggt ccacaagaca 11100
ctggcccctt ggagaagaga ggattccatt gtcaaataag tttggggaac attttcatac 11160
tacagctccc ttcttggaac acattagttt attaaaggta ggagaagttt ttaaaataat 11220
ctgttttatt gcgtttaacc tacatttttt aaatttattt gaccacagaa tccttttttc 11280
atgctacttc tattagcatc ccatagaaca agtgttctag agaccctggt gtgacccctt 11340
tcagagagct taactgccag gctctcctga gccctggtgt gtgtttcaag atttgtgcct 11400
gggaattgtt ttaatcaggt atggcaaggt gacagataca gacacagcta tctttgaaag 11460
aagagtttat tatttataat tcctgagaga aagggacata ccccaccccc caacacaggg 11520
acacccgggg aagcagctgg gtccaccagg aggcaggagt gaggggaagg catggcccag 11580
agccacctgt ggcttccatg ggcaggtctg gccaaggtag ggtaggcaag attgagcatg 11640
ctcaggattg gatagtgtgg acaattctct aggctataga tgtcagcctc tggttgtcta 11700
gtatctgtcc ctggggtgat ttagggcagg gaaaatattg gcttggtgtc tgagagtcag 11760
ataaaggaag tggttgggga tatgggcttt gggttggctg gtttgcctat taaaggcgtg 11820
cccaaagcca agttgtttac tatctgcagg aattagctaa cccagtctct cccagaccag 11880
caagatcccc ataatcataa agcatcataa tttacagaaa attaacactt atgatgaata 11940
aaagatctcc ttcttcctct gtgctcctgg caggcacagt caggcccatc tgtctgccct 12000
tctttgatga ggagctcact ccagccaccc cactctggat cattggatgg ggctttacga 12060
agcagaatgg aggtaagtcc tgggtgcagg accacagggc aggagatgcc cttgtatgag 12120
ggagcagctt ccagaagtaa tgggaaggag gaccaccctt cagagaaacc catcctggag 12180
gaccaagcac caaggcgcca ggcagaaagc aaagtggttt ggcaatccag ggctggggga 12240
tagaaggcaa ggatgggaat gtgagtgttt ttaccctccc agggaagatg tctgacatac 12300
tgctgcaggc gtcagtccag gtcattgaca gcacacggtg caatgcagac gatgcgtacc 12360
agggggaagt caccgagaag atgatgtgtg caggcatccc ggaagggggt gtggacacct 12420
gccaggtggg gcctccaaga atcatgggga gttctaagaa tagggtttag gtcctagaga 12480
gatgagaaaa cccagaggct gcatgcccta caggaagcct tgcatatcat gggcactcaa 12540
tgtgtgatga tgggaggaag agagggaggg aaggaaagga tagtcagata aaagtgtacc 12600
aatagatgag tgggtggatg gatggatgca gacaagcaga gagatttcaa atgtctcttt 12660
cacattcgaa gatgatgtta ctggcctggc atggtggctc acgcttgtaa tcccagcact 12720
ttgggaggct gaggcgggca ggtgatttga ggtcaggaat tcaagaccag cctggccaac 12780
atggtgaaat cccatctcta ctaaaaagaa tacaaaaatt agctgggcgt ggtggcacgt 12840
gcctgtaatc ccagctactt gggaggctga ggcaggagaa ttgcttgaac ccaggaggca 12900
gaggttgcag taagctgaga ttgcgccact gcactccagc ctgggtgacc cagcaagact 12960
ccatctgaaa acaacaacaa caacaaagat gacattactc atccacccca cccacccttc 13020
tcactagcta cagaatgatt agccccttga ggtcaggaat cccaggtcta ttttctctgt 13080
gactctcccc aagctgctga actacactag gaaagaatta ccgcctgcag aatgctggaa 13140
gcacatctgt gtgtgccctc accccggcct cattggccat caggactgct tagcaatccc 13200
tgtagacctt cttcctcccc catacttcca gaggatcttc tgaactattt tcttttttta 13260
ttttttcttt tatgtttttt aacagagaca gggtcactat gttgcccagt ctggtctcaa 13320
actcctgggt tcaagggatt ctcccacctc agctttccaa aatgctggga ttacaggcat 13380
gagccatcgt gcttggcctg aaccattttc attaaaaccc ctaccctact ctcacctcca 13440
tttccagtca ttaaattcct tcatttaaga ggcatctctt agtcatcgca tgtgtgccat 13500
gaacatggta gtctttggag acccctcagg gagctcacag tggttggggg aaaggggggc 13560
attaaacaga catttaagct atagttttgg gttcagaggg aggaagcccc aggggctaaa 13620
acagctgata aggactccca gataagtgca cttttcacta tctggcattt tcttgttttg 13680
ttatttgctt gttcactgtc tctcacccca tttgatccta agctttctga gggcagggat 13740
ctttgttttt tttcatcagt tggatcccaa ttgcttagaa cactacctgg cacaaaatag 13800
gcactctata agtgattaca caaattttgg aacgactagg ttaaacaatg ataaccaggc 13860
tttttttttt ttttttgaga ctgagtctca ctctgttgcc caggctagag tgaagtggtt 13920
tgatctcggc tcactgcagc ctccgcctct gggttcgaat gattctccac ctcagcctcc 13980
tgagtagctg ggattacagg tgcctgccac tatgcccagc taatttttgt atttgtagta 14040
gagacgggtt tcaccatgtt ggccaggctg gtcttgaact cctgacctca agtgattcac 14100
ccgcctcagc ctcccaaggt gctgggatta caggtgtgag ccaccgctcc tggccaacaa 14160
ccaggctttt ttaagacatc actcagagcc tttaatttgc taatgtgagt tgtgaatctc 14220
tgagagaagg ctaacggcat gcttgcaact tacttgtcca cagacaagcc tttctgcccc 14280
agaagagaag accattctag ggtgctaatg agcaaagagg gtgagggtgg aatatcggag 14340
agcagcaggg agtgcagggg aacagatagg ccagttcagg gagcagagaa ggagaagccc 14400
ccccacctca cctgccctcc ccagcagtct ctgttctggt ctctcacagg gtgacagtgg 14460
tgggcccctg atgtaccaat ctgaccagtg gcatgtggtg ggcatcgtta gttggggcta 14520
tggctgcggg ggcccgagca ccccaggagt atacaccaag gtctcagcct atctcaactg 14580
gatctacaat gtctggaagg taaggtacct ttgccctacc cactgtgcct tccctccagt 14640
cctctacctg gggggtgcca atccatcctc aggtttgatt taaatggttc tgacaactct 14700
ttacatccca aataactttc cctccaagca agggacagcc tgagattgca ctattaaggc 14760
tgaaattcct taggtcagag atttctgata aatgcaaata ccttagggaa tagaacacac 14820
caagcctttc tttctctttt ctgacagaat gagactatca gatcctttct agagagaaga 14880
ttctgataag gaagagagtg gaaaggctca tgagacctcc tggccctctg cagggtaggg 14940
agagaagcaa agtgtttcag aaaaggaaga ctcacgttac acatgtcacc actttgtcca 15000
gtttcagata atctgacttt ctcttcatcg gtctctctta ttctaggctg agctgtaacg 15060
ctgccgtccc ccacatccag aagctgcttc ccttcagacc tacctacggc atgacccctc 15120
aaagtcagat atgggacaag agcctccttg aacaaactc 15159
<210> 14
<211> 435
<212> PRT
<213> 人工序列
<220>
<223> 重组蛋白质
<400> 14
Met Glu Ser Asp Ser Gly Gln Pro Leu Asn Asn Arg Asp Ile Val Pro
1 5 10 15
Phe Arg Lys Pro Arg Arg Pro Gln Glu Thr Phe Lys Lys Val Gly Ile
20 25 30
Pro Ile Ile Ala Val Leu Leu Ser Leu Ile Ala Leu Val Ile Val Ala
35 40 45
Leu Leu Ile Lys Val Ile Leu Asp Lys Tyr Tyr Phe Leu Cys Gly Gln
50 55 60
Pro Leu His Phe Ile Pro Arg Lys Gln Leu Cys Asp Gly Glu Leu Asp
65 70 75 80
Cys Pro Leu Gly Glu Asp Glu Glu His Cys Val Lys Ser Phe Pro Glu
85 90 95
Gly Pro Ala Val Ala Val Arg Leu Ser Lys Asp Arg Ser Thr Leu Gln
100 105 110
Val Leu Asp Ser Ala Thr Gly Asn Trp Phe Ser Ala Cys Phe Asp Asn
115 120 125
Phe Thr Glu Ala Leu Ala Glu Thr Ala Cys Arg Gln Met Gly Tyr Ser
130 135 140
Ser Lys Pro Thr Phe Arg Ala Val Glu Ile Gly Pro Asp Gln Asp Leu
145 150 155 160
Asp Val Val Glu Ile Thr Glu Asn Ser Gln Glu Leu Arg Met Arg Asn
165 170 175
Ser Ser Gly Pro Cys Leu Ser Gly Ser Leu Val Ser Leu His Cys Leu
180 185 190
Ala Cys Gly Lys Ser Leu Lys Thr Pro Arg Val Val Gly Val Glu Glu
195 200 205
Ala Ser Val Asp Ser Trp Pro Trp Gln Val Ser Ile Gln Tyr Asp Lys
210 215 220
Gln His Val Cys Gly Gly Ser Ile Leu Asp Pro His Trp Val Leu Thr
225 230 235 240
Ala Ala His Cys Phe Arg Lys His Thr Asp Val Phe Asn Trp Lys Val
245 250 255
Arg Ala Gly Ser Asp Lys Leu Gly Ser Phe Pro Ser Leu Ala Val Ala
260 265 270
Lys Ile Ile Ile Ile Glu Phe Asn Pro Met Tyr Pro Lys Asp Asn Asp
275 280 285
Ile Ala Leu Met Lys Leu Gln Phe Pro Leu Thr Phe Ser Gly Thr Val
290 295 300
Arg Pro Ile Cys Leu Pro Phe Phe Asp Glu Glu Leu Thr Pro Ala Thr
305 310 315 320
Pro Leu Trp Ile Ile Gly Trp Gly Phe Thr Lys Gln Asn Gly Gly Lys
325 330 335
Met Ser Asp Ile Leu Leu Gln Ala Ser Val Gln Val Ile Asp Ser Thr
340 345 350
Arg Cys Asn Ala Asp Asp Ala Tyr Gln Gly Glu Val Thr Glu Lys Met
355 360 365
Met Cys Ala Gly Ile Pro Glu Gly Gly Val Asp Thr Cys Gln Gly Asp
370 375 380
Ser Gly Gly Pro Leu Met Tyr Gln Ser Asp Gln Trp His Val Val Gly
385 390 395 400
Ile Val Ser Trp Gly Tyr Gly Cys Gly Gly Pro Ser Thr Pro Gly Val
405 410 415
Tyr Thr Lys Val Ser Ala Tyr Leu Asn Trp Ile Tyr Asn Val Trp Lys
420 425 430
Ala Glu Leu
435
<210> 15
<211> 2046
<212> DNA
<213> 小家鼠
<400> 15
cagaaacaag gacctcttca ttattcaaga gtaaaatgta taggccaaga ccaatgctat 60
caccgtcaag attcttcact ccctttgcag tagctttcgt tgtcataata acggtagggc 120
tcctggccat gatggcaggt ctacttattc actttttagc ttttgacaag aaagcttact 180
tttatcatag cagctttcaa atcctaaacg ttgaatacac tgaggcttta aactcaccag 240
ctacacacga atacagaacc ttgagtgaaa gaattgaggc tatgattact gatgaatttc 300
gaggatcaag tctaaaaagt gagtttatca ggacacatgt tgtcaaacta agaaaagaag 360
ggactggtgt ggttgcggat gttgtcatga aatttcgatc tagtaaacgt aacaacagaa 420
aggtaatgaa aaccagaatt caatctgtgc tacgaagact cagcagctct ggaaacttgg 480
aaatagcccc ttcgaatgag ataacatcac tcactgacca ggatacagaa aatgttttga 540
ctcaagaatg tggagcacgt ccagacctta taacactgtc agaagagaga atcattggag 600
gcatgcaagc tgagcccggt gactggccct ggcaagtcag tctacagctc aataatgtcc 660
accactgtgg aggtgccctg atcagtaaca tgtgggtcct gacagcagct cattgcttca 720
aaagctatcc taatcctcaa tattggacag ccacctttgg ggtttctaca atgagcccta 780
ggctgagagt gagagtaagg gctattttag cccacgacgg gtacagctcc gtaactcgtg 840
acaatgacat cgcagttgta caacttgaca gatctgtcgc cttttccaga aatatccata 900
gggtatgtct cccagcagca acccaaaata tcatccctgg ttctgtcgca tatgttacag 960
gatggggatc tctcacatat ggaggcaacg cagtcacaaa tctacggcaa ggagaggtca 1020
gaataataag ttcagaggaa tgcaatacgc cagctggtta cagtggaagt gtcttgccag 1080
gaatgctgtg tgctggaatg cgttcagggg ccgtggatgc atgccagggt gattcaggtg 1140
gcccgctagt acaagaagac tcaaggcggc tttggtttgt tgtgggcatt gtgagctggg 1200
gatatcagtg tggcctccca aataagccag gcgtgtatac tcgagtgaca gcctaccgca 1260
actggatcag acagcagacg ggaatctagt gcaaccgagg aaaaaacgtg ccatgaggtc 1320
tctgtatcca agtgtgactg actcggatgc catggcttca catttcaact gcaaaggaga 1380
ctggaaatgc cccttctgaa cgtcccatta cataaatatg gtttaactgt ttagtatttc 1440
tttgtcggta cagattttta ctttcttgag gaaaaaaaaa acatgaacat ggctaagtaa 1500
gaattatgtt aggctagtaa caggaagaca tttattacat gggtggtcag gtgtagtagt 1560
gagaagtcag gtaagttaag tcaataattt acagaaaata atgtcaggta gtcctaacgt 1620
taaatatgtg aggccacaga acaaatagtg ttagaactga agccatccca agtatttaac 1680
atttgttttc aagtgaaact aagaaacaga cttacatata gttttaatgg tgaattttca 1740
ttttaaatat tttatctaca tagaaaagac atatctcctt catgaagaag ctgaggtgat 1800
gaatcaacac agcctcttca gctatgtttg caaccacaag atttgtggga aagaaatccc 1860
tactaccaac ttcctactgt tggcattatt ttttagagta acacgacgca caatagcaaa 1920
atttaagtaa caaattaaaa gttaatgatg aagaagaagt aaagagtttg tttgcaaaga 1980
caaaaattaa acagattaat atcaataaat ctggagacag aagggtctca gattcatatt 2040
ctctct 2046
<210> 16
<211> 417
<212> PRT
<213> 小家鼠
<400> 16
Met Tyr Arg Pro Arg Pro Met Leu Ser Pro Ser Arg Phe Phe Thr Pro
1 5 10 15
Phe Ala Val Ala Phe Val Val Ile Ile Thr Val Gly Leu Leu Ala Met
20 25 30
Met Ala Gly Leu Leu Ile His Phe Leu Ala Phe Asp Lys Lys Ala Tyr
35 40 45
Phe Tyr His Ser Ser Phe Gln Ile Leu Asn Val Glu Tyr Thr Glu Ala
50 55 60
Leu Asn Ser Pro Ala Thr His Glu Tyr Arg Thr Leu Ser Glu Arg Ile
65 70 75 80
Glu Ala Met Ile Thr Asp Glu Phe Arg Gly Ser Ser Leu Lys Ser Glu
85 90 95
Phe Ile Arg Thr His Val Val Lys Leu Arg Lys Glu Gly Thr Gly Val
100 105 110
Val Ala Asp Val Val Met Lys Phe Arg Ser Ser Lys Arg Asn Asn Arg
115 120 125
Lys Val Met Lys Thr Arg Ile Gln Ser Val Leu Arg Arg Leu Ser Ser
130 135 140
Ser Gly Asn Leu Glu Ile Ala Pro Ser Asn Glu Ile Thr Ser Leu Thr
145 150 155 160
Asp Gln Asp Thr Glu Asn Val Leu Thr Gln Glu Cys Gly Ala Arg Pro
165 170 175
Asp Leu Ile Thr Leu Ser Glu Glu Arg Ile Ile Gly Gly Met Gln Ala
180 185 190
Glu Pro Gly Asp Trp Pro Trp Gln Val Ser Leu Gln Leu Asn Asn Val
195 200 205
His His Cys Gly Gly Ala Leu Ile Ser Asn Met Trp Val Leu Thr Ala
210 215 220
Ala His Cys Phe Lys Ser Tyr Pro Asn Pro Gln Tyr Trp Thr Ala Thr
225 230 235 240
Phe Gly Val Ser Thr Met Ser Pro Arg Leu Arg Val Arg Val Arg Ala
245 250 255
Ile Leu Ala His Asp Gly Tyr Ser Ser Val Thr Arg Asp Asn Asp Ile
260 265 270
Ala Val Val Gln Leu Asp Arg Ser Val Ala Phe Ser Arg Asn Ile His
275 280 285
Arg Val Cys Leu Pro Ala Ala Thr Gln Asn Ile Ile Pro Gly Ser Val
290 295 300
Ala Tyr Val Thr Gly Trp Gly Ser Leu Thr Tyr Gly Gly Asn Ala Val
305 310 315 320
Thr Asn Leu Arg Gln Gly Glu Val Arg Ile Ile Ser Ser Glu Glu Cys
325 330 335
Asn Thr Pro Ala Gly Tyr Ser Gly Ser Val Leu Pro Gly Met Leu Cys
340 345 350
Ala Gly Met Arg Ser Gly Ala Val Asp Ala Cys Gln Gly Asp Ser Gly
355 360 365
Gly Pro Leu Val Gln Glu Asp Ser Arg Arg Leu Trp Phe Val Val Gly
370 375 380
Ile Val Ser Trp Gly Tyr Gln Cys Gly Leu Pro Asn Lys Pro Gly Val
385 390 395 400
Tyr Thr Arg Val Thr Ala Tyr Arg Asn Trp Ile Arg Gln Gln Thr Gly
405 410 415
Ile
<210> 17
<211> 2800
<212> DNA
<213> 智人
<400> 17
atttgagtgg gaatctcaaa gcagttgagt aggcagaaaa aagaacctct tcattaagga 60
ttaaaatgta taggccagca cgtgtaactt cgacttcaag atttctgaat ccatatgtag 120
tatgtttcat tgtcgtcgca ggggtagtga tcctggcagt caccatagct ctacttgttt 180
actttttagc ttttgatcaa aaatcttact tttataggag cagttttcaa ctcctaaatg 240
ttgaatataa tagtcagtta aattcaccag ctacacagga atacaggact ttgagtggaa 300
gaattgaatc tctgattact aaaacattca aagaatcaaa tttaagaaat cagttcatca 360
gagctcatgt tgccaaactg aggcaagatg gtagtggtgt gagagcggat gttgtcatga 420
aatttcaatt cactagaaat aacaatggag catcaatgaa aagcagaatt gagtctgttt 480
tacgacaaat gctgaataac tctggaaacc tggaaataaa cccttcaact gagataacat 540
cacttactga ccaggctgca gcaaattggc ttattaatga atgtggggcc ggtccagacc 600
taataacatt gtctgagcag agaatccttg gaggcactga ggctgaggag ggaagctggc 660
cgtggcaagt cagtctgcgg ctcaataatg cccaccactg tggaggcagc ctgatcaata 720
acatgtggat cctgacagca gctcactgct tcagaagcaa ctctaatcct cgtgactgga 780
ttgccacgtc tggtatttcc acaacatttc ctaaactaag aatgagagta agaaatattt 840
taattcataa caattataaa tctgcaactc atgaaaatga cattgcactt gtgagacttg 900
agaacagtgt cacctttacc aaagatatcc atagtgtgtg tctcccagct gctacccaga 960
atattccacc tggctctact gcttatgtaa caggatgggg cgctcaagaa tatgctggcc 1020
acacagttcc agagctaagg caaggacagg tcagaataat aagtaatgat gtatgtaatg 1080
caccacatag ttataatgga gccatcttgt ctggaatgct gtgtgctgga gtacctcaag 1140
gtggagtgga cgcatgtcag ggtgactctg gtggcccact agtacaagaa gactcacggc 1200
ggctttggtt tattgtgggg atagtaagct ggggagatca gtgtggcctg ccggataagc 1260
caggagtgta tactcgagtg acagcctacc ttgactggat taggcaacaa actgggatct 1320
agtgcaacaa gtgcatccct gttgcaaagt ctgtatgcag gtgtgcctgt cttaaattcc 1380
aaagctttac atttcaactg aaaaagaaac tagaaatgtc ctaatttaac atcttgttac 1440
ataaatatgg tttaacaaac actgtttaac ctttctttat tattaaaggt tttctatttt 1500
ctccagagaa ctatatgaat gttgcatagt actgtggctg tgtaacagaa gaaacacact 1560
aaactaatta caaagttaac aatttcatta cagttgtgct aaatgcccgt agtgagaaga 1620
acaggaacct tgagcatgta tagtagagga acctgcacag gtctgatggg tcagaggggt 1680
cttctctggg tttcactgag gatgagaagt aagcaaactg tggaaacatg caaaggaaaa 1740
agtgatagaa taatattcaa gacaaaaaga acagtatgag gcaagagaaa taatatgtat 1800
ttaaaatttt tggttactca atatcttata cttagtatga gtcctaaaat taaaaatgtg 1860
aaactgttgt actatacgta taacctaacc ttaattattc tgtaagaaca tgcttccata 1920
ggaaatagtg gataattttc agctatttaa ggcaaaagct aaaatagttc actcctcaac 1980
tgagacccaa agaattatag atatttttca tgatgaccca tgaaaaatat cactcatcta 2040
cataaaggag agactatatc tattttatag agaagctaag aaatatacct acacaaactt 2100
gtcaggtgct ttacaactac atagtacttt ttaacaacaa aataataatt ttaagaatga 2160
aaaatttaat catcgggaag aacgtcccac tacagacttc ctatcactgg cagttatatt 2220
tttgagcgta aaagggtcgt caaacgctaa atctaagtaa cgaattgaaa gtttaaagag 2280
ggggaagagt tggtttgcaa aggaaaagtt taaatagctt aatatcaata gaatgatcct 2340
gaagacagaa aaaactttgt cactcttcct ctctcatttt ctttctctct ctctcccctt 2400
ctcatacaca tgcctccccc accaaagaat ataatgtaaa ttaaatccac taaaatgtaa 2460
tggcatgaaa atctctgtag tctgaatcac taatattcct gagtttttat gagctcctag 2520
tacagctaaa gtttgcctat gcatgatcat ctatgcgtca gagcttcctc cttctacaag 2580
ctaactccct gcatctgggc atcaggactg ctccatacat ttgctgaaaa cttcttgtat 2640
ttcctgatgt aaaattgtgc aaacacctac aataaagcca tctactttta gggaaaggga 2700
gttgaaaatg caaccaactc ttggcgaact gtacaaacaa atctttgcta tactttattt 2760
caaataaatt ctttttaaaa taaaaaaaaa aaaaaaaaaa 2800
<210> 18
<211> 418
<212> PRT
<213> 智人
<400> 18
Met Tyr Arg Pro Ala Arg Val Thr Ser Thr Ser Arg Phe Leu Asn Pro
1 5 10 15
Tyr Val Val Cys Phe Ile Val Val Ala Gly Val Val Ile Leu Ala Val
20 25 30
Thr Ile Ala Leu Leu Val Tyr Phe Leu Ala Phe Asp Gln Lys Ser Tyr
35 40 45
Phe Tyr Arg Ser Ser Phe Gln Leu Leu Asn Val Glu Tyr Asn Ser Gln
50 55 60
Leu Asn Ser Pro Ala Thr Gln Glu Tyr Arg Thr Leu Ser Gly Arg Ile
65 70 75 80
Glu Ser Leu Ile Thr Lys Thr Phe Lys Glu Ser Asn Leu Arg Asn Gln
85 90 95
Phe Ile Arg Ala His Val Ala Lys Leu Arg Gln Asp Gly Ser Gly Val
100 105 110
Arg Ala Asp Val Val Met Lys Phe Gln Phe Thr Arg Asn Asn Asn Gly
115 120 125
Ala Ser Met Lys Ser Arg Ile Glu Ser Val Leu Arg Gln Met Leu Asn
130 135 140
Asn Ser Gly Asn Leu Glu Ile Asn Pro Ser Thr Glu Ile Thr Ser Leu
145 150 155 160
Thr Asp Gln Ala Ala Ala Asn Trp Leu Ile Asn Glu Cys Gly Ala Gly
165 170 175
Pro Asp Leu Ile Thr Leu Ser Glu Gln Arg Ile Leu Gly Gly Thr Glu
180 185 190
Ala Glu Glu Gly Ser Trp Pro Trp Gln Val Ser Leu Arg Leu Asn Asn
195 200 205
Ala His His Cys Gly Gly Ser Leu Ile Asn Asn Met Trp Ile Leu Thr
210 215 220
Ala Ala His Cys Phe Arg Ser Asn Ser Asn Pro Arg Asp Trp Ile Ala
225 230 235 240
Thr Ser Gly Ile Ser Thr Thr Phe Pro Lys Leu Arg Met Arg Val Arg
245 250 255
Asn Ile Leu Ile His Asn Asn Tyr Lys Ser Ala Thr His Glu Asn Asp
260 265 270
Ile Ala Leu Val Arg Leu Glu Asn Ser Val Thr Phe Thr Lys Asp Ile
275 280 285
His Ser Val Cys Leu Pro Ala Ala Thr Gln Asn Ile Pro Pro Gly Ser
290 295 300
Thr Ala Tyr Val Thr Gly Trp Gly Ala Gln Glu Tyr Ala Gly His Thr
305 310 315 320
Val Pro Glu Leu Arg Gln Gly Gln Val Arg Ile Ile Ser Asn Asp Val
325 330 335
Cys Asn Ala Pro His Ser Tyr Asn Gly Ala Ile Leu Ser Gly Met Leu
340 345 350
Cys Ala Gly Val Pro Gln Gly Gly Val Asp Ala Cys Gln Gly Asp Ser
355 360 365
Gly Gly Pro Leu Val Gln Glu Asp Ser Arg Arg Leu Trp Phe Ile Val
370 375 380
Gly Ile Val Ser Trp Gly Asp Gln Cys Gly Leu Pro Asp Lys Pro Gly
385 390 395 400
Val Tyr Thr Arg Val Thr Ala Tyr Leu Asp Trp Ile Arg Gln Gln Thr
405 410 415
Gly Ile
<210> 19
<211> 38992
<212> DNA
<213> 人工序列
<220>
<223> 重组多核苷酸
<400> 19
gagggagggt ggtgctttgc taatggtgaa ttactaactc ctcaataaag aatattattt 60
gaaataattt ttgaaatttc ataattactt tgggttcttt cttaatgata aataaataat 120
agtatattac aaacatacat taatatttcc tgaatgaata caccacaaat ctcccttaaa 180
atatagcaag aataaaaatt atactatttc tgacaatttt taatttctca aataataata 240
ccactctgat ttttaaacat ctacaccact ctggctttgc caatcttttt aaaaattgaa 300
aagataataa ttttatcata attacactga agcatagaac tttttctttc aaggaaagca 360
aatttttgaa attctataat ataacctccc ataatcctga ataaattaaa ggttcaacaa 420
cttagtaaag taagactgac cttccctttt atttcttttt cagatcaaaa atcttacttt 480
tataggagca gttttcaact cctaaatgtt gaatataata gtcagttaaa ttcaccagct 540
acacaggaat acaggacttt gagtggaaga attgaatctc tggtaagtta atatttgtct 600
ttgctcttta ttccattata aaatgaatat gataataaac ctaatgtttt gtaatatatt 660
ttcagttgct aagtgctcta catattttcc ttccttgaat ggtgaaacat gtgtttctct 720
ctgcttttat ccagttagtt tactcatata ctggttctta ttcacatctt tgtcatgagt 780
aaaaagtgtt agaaaggcca cgagtaaata tgcattttat ttgtttatga attcaaatac 840
taaaagtttt ttatttgttt aattaagcat tgacattgtc tttttaaatt cttttcattt 900
taccttcttc cctcttcctt atccaactaa agacgcaaag caggaggtgt taaaaaacag 960
gtttaccata tcagcagtaa catagtttgg acaacattac actttggttc aatgatagac 1020
atagaagttt gaacagaaat atgcaaagca agtttgagct ctaacttgaa gagagcctct 1080
gggtgcctgc caggaaacct cacgagtgga cccttaacat tcatgtgtca ccacaaacta 1140
ggggctgccc tttagttttg accagtctca gtgtcactca cttaccctta ccttttcaaa 1200
aaaaagtcct aagaatataa agtaattcaa tggttctaca attttagcat gtaactgagt 1260
cacctggcag ggttgctttg gtgagctcaa gataaaattt tatcagcatt tctacatttt 1320
ctggaatatt ccttaatcca ggcttttaat cccttggtgc ttttctgaac cactgcaatg 1380
agcttctaac tgttctcact gtgtgcaggc tcttttcctt ctaatctaat ttacacactt 1440
ctgaacacaa atctctcaca gcctgtttcc ttcatgttac ctccagctca agactttttg 1500
cctacaaaat aaaattcaaa cttgttagct aagcaccttc tcatgtctat gctttggctc 1560
atatttcagc catcgtgtgc cccacttatt cttatagcca acctgaaaag ccatctttta 1620
taagaaacta cctctgctct ccatgattgg atataattaa tcctccttcc acatcacctc 1680
gccacaaaat tgtatctgtg ttgatctcat gccacatacc tgtatgtatt ttatattata 1740
aatatttgca gacttgttta atttgccatg ttagactaag ttccatgaag acagctccat 1800
atccattcca tttttatata tccacaacat ttggtcgggt tgatgcttaa taaatgttta 1860
ttgaaggaac aggagtctcc cacttctgac ataatgaact tatttccccc agtgttaacc 1920
ctacatctgg ttcctgtcca agagtctctt cccaaatcat tctgattcaa ctgttcattc 1980
tgatctcatt aaacatttaa atgatatatc taacttcgct tgctttattc tatgctcatc 2040
ctgcagtctc ctcataactt ggtttcaatg atgcttgctt ctagagaaaa aaatgtatta 2100
aataagctta tgattcagtc ctccagctgt gatggttctc actgaacatt agctcagtgg 2160
ttttcgaagt atggtctcta gcataaccta gaaacttgtt agaaatgcaa attcttgggc 2220
tcaccaagac atactaaatc aaaaattctg acattggggc ctagaaatct gtgttttaac 2280
aagcctgcca gtgcagcctg gtcccttttc ttctcggagc cccactcaaa gctttcagtg 2340
ctcatctccc accaatgaca gggtcctcta tggaaaccgg caggacggtt tccaactcta 2400
actacgtttt agagtttgct tcctagggct atccaggcac caagtatcac aggttagttt 2460
cccagggaag cagactctga gacttgcatg cagggagtgt ctctggggtg ctctcaacca 2520
acaccttcag gaagagaagg aagcagcatt gggcagaggc atagtcaaac tacagtgctg 2580
ttggcacaga agactgaagg gagtcagagc cagggggtag aggtgggccc ttagcatcca 2640
tccttcacca ttaggtgtga gttgccccac ctccttgatg gtgtaacctc agtcccaagg 2700
tgggtgggag tgcagcagag cagcccctac aagggccaaa ccagagatac accaggcgcc 2760
agaagtgctg ccagggaata gagaggaaag gatgggctta aggtaggatc cacagaactt 2820
ggcaatggat tagaagacag gatgagaagt gacaggttaa cactaacaca gaaatgtcta 2880
acttcggtag ataatggtgc cattggctag aagaggaaac cgaaatgaaa gcaggttgtt 2940
cagggagaca aaagttcact gtggacatct cagcagagtg attcagtggg gaaaggaatg 3000
gatgcccaga ccacctcaga ggaagatcta agctggagcc agcaataaag atacaagatg 3060
aacaatccct aacgaactgc tcctcagcca tgctccccag acacgctgct tcagatttat 3120
agtccgggtg aggctaggag gtgcgcctcc ctcagtggag gacagcaaag caccagtggc 3180
tccagggagt taaaatcttt tgataatttt tgttctagca tctgtctgca gagctgtctc 3240
tcagccattg cctgccttta cacaggagtg cagtccgaaa ttgggagatg agtgaaattt 3300
attatgccta gagatctgga tccccagttg tttgggagta tattttctga accacttgtt 3360
ggtttaagta atgcagattt attgatgcca cttctcttga atctgtgact ctggacccac 3420
catctaagtg aatgtgcaga gggaacggaa tggctgcaat agatctccat taaaaccagt 3480
gcatcctccc agacacatac agtagtaggg aggtgagtca atgtcaggac agcaccagct 3540
cccgcttcgg tacatttcca aagttctcag tctgtgtaca aaggtttgct ctggggcagc 3600
agaaatagcc ctgggcaggt agtcaaaggc ctggtttgat ttcctccact tccaggcaag 3660
tcactcgaag gctcacaggc tttttcctca cctgccacat gggtccagtg agatctactg 3720
agctgtaaat aatgaaatga gtgtgtgtgc agtcatctat aagttgtaaa gtactagaaa 3780
atggtgaaac tttgggattt gggctattta aggctgaatg ctaaaaatgt caggcattgt 3840
ggagaaagga atttaaatat aagattgatt gactgggatt taaagacaaa tgaaggcaca 3900
cacgcaagtg cacacccaca ctgacactgc acagctcccg ttggaggcat atcctgacca 3960
tgcagacctg gggctctgcc tgtccaagtg cactccttta ctacataaac cctccttctc 4020
ttttggggct gtcaccccac cagagctggc accgagccct tgctgctgcg cttccctggg 4080
gtgtcagctt ttgacagggt gtttcctccc tctgcaggag ccttaacatc ccttggactt 4140
ccttcccccc acccaccccc agcagtttta tctcttccta actcgggacc ctttttttcc 4200
cacacaaagt ttattgtcag ttgctggttt catctgtttg agcggctgca acaaaatacc 4260
atagactggg tggcatatgc acgacaaaaa tttatttctc acaggagaag tcaaagatta 4320
atgcaccagc agatctggtg tctgaggggc caccttctgg tttgtagatg atgctttcta 4380
gttaaaacac ctatttaaca cactattaaa cactaagtgt gttaaatagt gcagttgatg 4440
tatttgtcat gtcaccttta tcatacacta aatccttctt tgtctttttt tctgtactct 4500
aatctctttc tgtaagtaat ctttgcttgc agcagtagga tatttagagt actgtggctt 4560
gacaatatat ttagtatttc aagatttcca tgaaattctt ctgatgtatg agttccctag 4620
ttaatcttac atatgtatcc ctttgtaaaa acactttgaa catttaaaat gatacatgaa 4680
tagtactcta atacaatgcc ataaaaatta taaatcattt gtatagactg gtaagtaaag 4740
attgtgagat taagaaacgc atcaaaggcc attgagctgg aaagtggtat aatgagaatt 4800
caaaccaggg tctcttgact caaaatctaa ggatcatacc atttctcatg ataatatgag 4860
tattattgtt atctctatcc catagacaaa gtgttaacac tgaatgagca gtgaaatagt 4920
ctcagaattt tttattttat ttagcaattc acttgtcatt tctggtcctc agtttattca 4980
cgagtaaaat aaaatagttg gactagataa tttctatagt acattcttac acaaaaaatc 5040
tatgattttg ttatttttaa tgtgatatac tcatggcact cattcacctc attttcccag 5100
cctgcctcac tggtcattac ttctctgtgt tctttacagg ctccccctcc tctacactgc 5160
cattaaatat tgaaacacct caaagcttta cttatgtcca cctctcctct gacactatca 5220
ttctgtctag atgatcccat acatacatgc ccattacttc aacctgtatt tatacgccaa 5280
tgattcacta tatttccagc ctagacattc ttttgtactc tagttaccag cttgatatcc 5340
ttacatggct gtttcaaaac aactcaaata tattatctct caaaatcaaa ctcatgatgt 5400
ccccacacca tcctagcttt ccaccaacaa tacctatccc tattaatagc aataccattt 5460
attcagttat ccaaatcaaa aacctagaat tcatccttaa aattctacta tcattccaaa 5520
tatcctatcc atcagcagcc actgtattct taatcccctg tatttccttc aaatccattc 5580
acctctctcc atatccattg ctgcatgact atccaagcca tcgcctctac cctagggtac 5640
caaaatagca acaaacctaa tctgttcatt tgcattattt tttctccaaa actgattatc 5700
tatatgtagc aagacagatt gttctcaaat tgcaaatccc actatattat cctcttgctt 5760
caaacacttc catggtttcc cattgtttat gataaaacca aatgcttcaa gttcgaagac 5820
cggcatgatt gggaatttcc tgtcacccta gcctacttgc tctccatggt acagttgcac 5880
tggctttctt tcattcctta agtacaacct gtttcctccc acctcaggac tgtgcatgtg 5940
ccattcattc tgctgaggag cctttttcct tccacttcaa tcagctaagt ctgattcttc 6000
ctgacaatct cagctcaata agcatttcct ctaagaaatg tctctaatat cattaattgg 6060
ctcaggtccc tctactgtat tgctgcactt ttcacagtta taattttact taattatgaa 6120
tgattatttg attaggtcta tttccatcca ttagacataa gcttcatgat ggccagatta 6180
ctgttttcta tccatcgttg tattccaata cctgacagaa ggagggcggg aggtggtggc 6240
acacaagaga tgctcaaaaa caattgttga ataagtaaat gaatgaggcc atttagaaat 6300
aacgaaagta cctgtttaca aagtacatgt atcaaaacta tgaatgcatt ctacttacat 6360
ggttttctcc aaataaaaca aaagacttca atcaggatta atacctggga taaactgagt 6420
cattaaatct ctcctttgcc atcaggagtg acattgaaac aaatgtctgc aaacaacaaa 6480
tacttttttc ccaaaatata ttgaatggca tttccataaa caaactagaa catgggagga 6540
gaaagaaagc aatattaatt taaaattaat cttatcacat aacttatacc atcagggatt 6600
tcgggtaaaa ttcctttcag gcacatccat ttaacaagaa ttgattgtta ctgaaagcct 6660
agaagagaat ttggcacata cttggtgttc aaatatttgt tgactgagtg aataaatgat 6720
gcaagtgtct aagaaacaca aaataaggac atgattacag tcacggtgga gttcacagtc 6780
atctccaaaa tgaggatatg catcccaggg aggaccaaca attcattgga gtgctgaaat 6840
aaaatactca aaggtcattt tacatgtatt ttttctctaa attacttttc ttaagacaca 6900
gaaaacaaaa aaagaaactt agctttgtta ctttctaaca aatagttaaa tcattaaaca 6960
ggattgacac tagcatcctt gtttggtctt atgccttagg ggaacatgaa atgtgtgaag 7020
acattctgag atctgaggga agggtagaca gtaatacagt gggactgacc aggcttcagc 7080
acacctttac ctcctctcag cagatttcag tgatgagcag tttacaacta gattgaaaga 7140
ttatattatc tagttctaaa agaaaactaa gcctcccaaa agcaacaagg gaactgagag 7200
gaatcctgca aaacaaaaac aaattttaaa acttgcactt tgtaataacc ctaatatgta 7260
atcacagtaa tgaacagtaa gataatgaca gaactgacat atttccttat ctattaaagc 7320
catattaaca ggtaaagcaa tgccagtcag tggtacactt cttagaagat atttaataca 7380
tactagacac atacacacac acaacatttt ccttcaaggt gtatgtatca gaaaatcact 7440
ttttaaggcc ggatgcagtg gctcaggcct gtaatcccag cactttggga ggccgacgtg 7500
ggcggatcat ctgaggtcag gagttcaaga ccagcctgcc caacatggcg aaaccccatc 7560
tctacaaaaa tacaaaaatt agccagggat gatggtggat gcttgtagtc ccagctactc 7620
aagaggcaga ggcaggagaa tcacttgaac ctgggaggca gaggttgcag tgagccaaga 7680
tcacccattg cactccagcc tgggcaacag agtgagactc tgtctcaaaa aaaaaaaaat 7740
cactttttag ataaaattca tgctatagag agaagactat gaaaatatgt ttagcaatgt 7800
gtccatcatt aggtgattga gtttcctttt gttttgtttt actgaaaatc atataaagta 7860
tgttatctgt aaaagttctc tgacatgcac acataaaaat ttgggagaaa agattaacta 7920
taatgtttaa tagattttgt acacatttct ttaaaaatat ataaaacaca acacctttca 7980
attggtttgc aagaataacc aattgacatc atggaaaatg gaaattcact tgctgaattt 8040
taacaaaaat ttgcatgatg agtgagactg acaacttagt gtcatgattt aatgaattat 8100
gccaatggta aacttcatgc acatggggcc aggtaattat gtggaaactt tttcaatgct 8160
taaagccaag tattgaaatt aaacttagaa tcagaccttt gaaccatttt atgacaatgt 8220
tcaaaaatta taaattctat ccacttatat tataatatta aaaatatcat tacaaaaaaa 8280
acctgtgttt attttataac tcagcctttt taatttctaa tttcataaat atattataat 8340
ggatattgtt agtaatgtag tattattaca tgtatataat ttataagtaa atatacatgt 8400
tttggctact catgcataaa atgtttcacc cataggagca cataatcaga aatgtctgga 8460
gaccattata gtaatagata gatcatattg ccacatattt tatctcctcc ttgacaactg 8520
agctttccag atcttctggt gaaacgaaag agaaagttgt aacagaagag tgattaaaat 8580
gacaaaagca ttacttctat tacttctatt ctaataatat gagcaaagct ataactatca 8640
agtaataatg cactaaagaa ggtgattaat ctgatatatt cacaggcaac taataagacc 8700
tttctattgc agccatgaaa aatatgtgac aattatagat atcctgtgtg cagtgtttca 8760
acctttatgt gacctgttct actaacagat ttagtgatgt tcactttgtt agaattttct 8820
tacacatgcc ataacttgct tcagtctttt gattatgaat attatggata ttaaggattc 8880
tagactattc tagatttaaa aaataatatt gtcacctcaa tcagaaggga aatattaaat 8940
agttctcatt ttttcaatgt ttactcagtt tttgtccaat gtaatgaaag tgtcagcagt 9000
acaggttaca aaataaaatg tgtattaaag taaactcatt tgaacaggtt aataattgta 9060
gagggaggga aaaggctaaa agattgaatg taaaacttat gaaaagtaga tacatcgtct 9120
ctatgatttg cagtagtcaa ctgcatacag atgaatcatt ttaatacacg ttaactactt 9180
tccttttaca gatggagaaa ctgagaggaa gaaagtttat atggttcatt aaactttgtg 9240
atgcaagcta aactaacctg tctctgtatt ttccatctac tgcccttatc actatctcat 9300
tagaatactc ttcaagcatc tccttactga ttttcttacc aagcatttgt taagttctaa 9360
tgagagttgg tagtaacatt ttcacccact ctgtgaaata tgaaatctta ttcataggcc 9420
tcttctttta ttcttgtatt tgcatatcaa ccaattaatc aacttgcttt ctttatgttg 9480
cttattatct tagtccttac taaattgcct cttaatgttg tccacataac agaaatgtta 9540
aggtggatac ttaacatttt agtccagtct agccggtgcc agtgcaatgc caaatcatga 9600
attaaaatat aattacaaga accacttatc aaattttaac aattccttca gctttgtgac 9660
agttttttct acttcgatta aagtcaagta aaattaaagt taaatatttt tattaaaata 9720
tctcctttaa cattccatat taataaacat attaaagctc atgcttctaa gtagattact 9780
agaagttact ttatcgaatt acagcaatgg ttaattctag atcatagaat ttagaatgac 9840
tttttgcctt cttctttttt ttcctttttt ttaaacagag tcttgctctg ttgtccaggc 9900
tggagtgtac tggcgcgatc ttgactcact gcgacctctg ccctgcaggt tcaagtgatt 9960
ctcctgcccc agcctcttaa gtagttggga ttacaggtgc ctgccaccac acctggctaa 10020
tttttttttt gtatttttag gagagacagg gtttcaccat gttggccaga ctggtctcga 10080
actcctgacc tcaagtgatc cacttgcctc agcctcccaa agtgctggga ttacaggtgt 10140
gagccactgt gcctggcctg actttttgct ttcttcttaa tacttactag tatttcttga 10200
atttttaaaa aagaaacata aagtactttg ataaaaccaa cagtctcatt gttcttaaaa 10260
ttgttcaaag gttctctgga aaaaaaaaag aaaattatca tttggttaag aatcatgttg 10320
gtctgacatc aatcatccta taggagtgaa tattgaaaaa gtaagatata ttgtggtata 10380
atcgagattg cataaatttt accatttttg agaagaatct gctccaaatc ctggcttaat 10440
gtaatatcca gcatgctact taattttctt gtcttcacct tttcatatcc acatccacct 10500
aggtgccacc tcacagtata agccagcata atccattctt ctcaatgaaa ccacaataca 10560
tctgaccctg catctcagga gaactgtatc agccacagca cttccagttg actatgaatc 10620
tgaatgttat gcctcaggag aaacatcctt gctgggactg agtagtgatt caaggagata 10680
gttatgattc agtcaagaaa ttaataatta gtgttatttt tattattgag acagagtctc 10740
gttctgtagc ccaggctgga gtacagtggc atgatctcgg ctcactgcaa cctctacctc 10800
cccggttcaa gtgattctcc tgcctcagcc tcccaaataa ctgggacagc aggcacttgc 10860
caccacgcct agctaatttt ttgtattttt agtagagacg gagtttcacc gtgttagcca 10920
ggatggtctc gatctcctga cctcaaggtc cacctgcctc agcctcccaa agtgctggga 10980
ttacaggcgt gagccactgc gcccggccat aaattattaa ctgagccagg cacagtggta 11040
cacacttata gtcccagata ctcaggagac tgaggttgga gtatcctttt ttatgttatt 11100
ttatttttaa ttattatggg tacataatag gtgtacatac ccatggagta caagtcatgt 11160
tctgatacag acacataatg tttaataatc acatcagggt aattgggata tccatcacct 11220
caagcattta tctttctttg tgttaggaac attccacctc cactcttgga ataggcaccc 11280
tgttgtgcta ttaaatacga ggtcttattc atttcatcta actatatttt tctacccatt 11340
aaccatcacc tcttttcccc tcttccccac tacctttcct gtgaggctgc aggattctta 11400
agcacaacag ttagaggcca gcctggacaa catagtgaga ctcaatttct aaaaaataaa 11460
aaagaaatta ccaactaatg ctaaaaaaat agtctctgat gcttaggtat gaattagaaa 11520
tgaccaaaaa aaaaaaaaaa aaaaagactg ccctttgctt ccttctcccc ttctcttcaa 11580
gttttccatt gctactcatt ttagtctggt ttaatcaggt ttcatccatt aaaagcaatt 11640
gttgggatca cacattttga gttgtgtcag tggacttccc tcatgctggc atgattcctg 11700
ccccaagccc ttagtaaaag ccaccaagcc atataacata atctctcatt gagtaaaaca 11760
tctgatgtgt ttagaatgac ttctagcaaa aaaccagcct gtccagcatc atctctgtat 11820
aacagataaa ggaataggta ctgcatcaaa aggttataga acctgcccaa atcaatccca 11880
tgtgttttgc aatggaatta ggttgaacta aagtgaaaat tcagttttct actcctcatt 11940
aacatgtctc atgttgcaag gttgagagga aggagaagaa gaactgtatt tacagagaga 12000
ttccccctct ctttctttct acagattact aaaacattca aagaatcaaa tttaagaaat 12060
cagttcatca gagctcatgt tgccaaactg aggtgagtgg aactgtagaa aaaatattta 12120
agtatagata caatgtggca tacttgactt tttgtcacag aatgaatagt aaatgacatg 12180
ttcagataag ttgttgtaat attatgaaaa tagtatttta gtcagcttaa aaaccaatgc 12240
caaaaaagcc aaacatatga tctatttagc tactaatgta aataaccata ttatatctat 12300
tcttattggg aagaggaaga aggggtggag agagagttgg ggtgaaggta cagtaacaag 12360
gccatcctat tgtaaaactc cagtggatat cattcacagt gcagcctatg taaacagtcc 12420
ctcctggagt tgtacaatgc tgtggtttgg gtgtatccat ccaagatcaa gacactatga 12480
ccaacatcaa aagtggcttt ttggttttat ctgcctgatg tgctataata aaagggtatt 12540
atggccaaat ccaaggcatg tctatcatga attaataata ggaggagtag cagcatgcat 12600
gctagttatt tgccattcct gccttagtta aatatgatgt gataaaacca gcctttccaa 12660
ctgaaatagt cacctttact gactctcccg caaatgtctc aaatgaccac attgctctag 12720
tctttaaata atatgcaata gttctttggt agaagaggaa ttatactaat tctttctcaa 12780
atactagcat cacaagaaaa ttaattcttg ttctctggag agtcacctag taagtatctg 12840
gagcacagat gtctggtcag gtaagttttg atgaggagtt aaagggataa gaagagtcca 12900
tgagaagggt attttccaaa acacctttcg gtcaattcag tgcacattca cttagtactt 12960
tcttgtcagt atctgtatca gccactaatg ttcaaaagtg agtaagccct gaaaacctgt 13020
aggactacat gagccttctg ccttttctct ccttttgttc acttcccact tatcactcaa 13080
tcctctgcaa cctggcttca ataccaccat aaaatatcaa ctgctcttgc cgattcaaca 13140
atgacatcca gataacaaaa tccaaagaaa ccacatcagt cctattcttg gacctttcaa 13200
cagtatttgg tcctgttggc ctgtcactcc ttgaaatagg actatccctt ggtttgcatg 13260
gccttgtata ccctgatttt ccccttacct ccctagctat tccttcttag tttcctttac 13320
taggtcttac ttctttgtat attccttaaa tgttgctgaa catcaggctg tgctctaggc 13380
ctctcatctt ctcaggtcac actctctcct ttccttggcc ttcactgcca cccatatgct 13440
gagtgctctc aaagttgtat ctctaggcca gtcctctttt gcctccaaac atgaatatat 13500
gcagccatct acttggtacc atcacatgga taattctcat gatctcttcc agtatgactg 13560
cttctttatt tttttctggg ctctttttta gcattgcttt acatggaact ttatcatgtc 13620
tctcaacctc tattttatct tttatctatg tatgtagagt ctgtgtaatt tcttcatctc 13680
ttttagataa ctaatatctc ttcagctttg acttgtattc tgtgtaaccc atttattgcg 13740
ttttcaattt caatgagtat gttttcctat ctgcaagttc tatttgtttc ttttgagaat 13800
cttcctggtc ttttaaacac atttcttatt ttaatttttg ggggtaccta gtagttgtat 13860
gtatttttgg agtacatgag atgttttgat acaagcaaac aatgcataat aatcacattg 13920
tgtaaaatgg ggtatccatc ccctcaagca tttatccttt gtgttacaaa caatccaatt 13980
atattctttt agttattttt aaatgtacaa ttaaattatt attgaccata gtgactctgt 14040
tgtgctatca gatactaggt gatcttttaa aaataatgtt ttctacttaa tctcattttt 14100
atgattccct cttttacgtc atttgtcatt tcaaatacag tcacttgtct gttgattcta 14160
ttatgtgaag tttttgagga taatcttttt gttactttga ttccaccttg gtatggtttg 14220
gctgtgcccc cactaaaatc tcatcttgaa ctctggttcc cataataccc acatgttgtg 14280
ggagggacct tgtgggaggt gattagatta tagggacgtt tccccccttt gctctgttct 14340
ttttcctgcc accatgtaag aaagatgtgt ttgcttcccc ttctgccatg attgtaaatt 14400
tcctgaggcc tccgcagcca tgcaggacct cttttctttg taaattaccc agtctccggc 14460
ggttctttat agctccgtga gaaaaaacta atacacacct catgatgtat tgtttaccac 14520
tgaaattgta tgcttaaatt taatctcact tgggaccctg tacaacctag acttaacata 14580
tctacctcca gagcagttac atctgtcaga cattctagag gaatcagcag cacatggact 14640
ttgttgttgt taatttgttg tcgggggagg ggggagggat agcattagga gatacaccta 14700
atgctaaatg acgagttaat gggtgcagca caccaacatg gcacatgtat acatatgtaa 14760
caaacctgca cgttgtgcac atatacccta aaacttaaag tataataata ataaaattaa 14820
aaaaaaaaag gttctgggag tattcaggta gtattaatga agattcagac atcgtgcagc 14880
caggcccatg cttatgaatt ttcaggtgat acttcttttt cttttttctt aatttaaagc 14940
tggatctcgg aaacagataa atttattttt ttatgacatg acgagcattt ttttcattct 15000
agttcatgct gttattgggt gtttagttct ttgagactcc tggccttttt ctaaaacctc 15060
aagttcaact tcctattttg cactggccca aggtcccatc tccagtctct atgtaaatgc 15120
taaacataag cctgtggaat attctagtct caccacatac tattcacatt cttctttgtt 15180
tttggtcttc caggattttc cttacttttc tatgaaccca gtcttgcatt tgaaatggaa 15240
tttattatat attatctatc ctttctattt gttttatgca gaaagtgttt tctaaaatta 15300
tttaggcttc catattgcta gacatggaag ttgtaattat ttgttcagtg cctgtttcta 15360
catctaaact gcaagaccca tatggcaact gtgaatctta gtcccagcta atttctgaag 15420
cttagaatag tgcctagcac aagaagttgt ttatctaaca tttttaaaaa taaatattaa 15480
attcatatct ggaatgaata ttaagttaga gctggtcatt gaggtgagag gaggaagcca 15540
agagagaata tgagagcctc aaagccaaat atctttaatg tactttttca gaaaagaaga 15600
cagccaatgt caggtggagg aactggttta tgaggtaact ttcctggaag aaaatagaaa 15660
ttactgaggt tttagataat ccaaatattt aatcaagtca ccaaggttta ttgtggggaa 15720
tctttattat taattaaaat gagtgatgaa atcttaatat acgacaaaag ttaaaatttg 15780
cttttgcagg cagatgaatg gtctaggtat caaaaaatta agttgagtct ctaactcaca 15840
caaatttaca accctatcac tttatgaatt tgtttaggag attattttta ataacactgg 15900
tgaagtctaa gaatagctaa aatttatagt acacttattg tgtgctattg actcttcttt 15960
gaagttttgc atatagtgat tcatctaatc ttcataaccc attttacatg tgaagaaact 16020
tagatataga aagattaaga aacttacata acttatccaa agttacacag taaaactctg 16080
gcattataac ttcaaaatca gctatcctac agtgagtaca gtgttctgtg cattgaaatc 16140
aaataagtga gatagcatcg tgatatagta ttacgtatgc aaacactgtt acagagatct 16200
gtctaaagtt aaattccaca aatgaattct ttaaaagggt ttaatcaaga agaatatata 16260
aacaggatgg tgaaaaattg tcatattatt tgttttttaa aatatcttta tgatttacag 16320
gcaagatggt agtggtgtga gagcggatgt tgtcatgaaa tttcaattca ctagaaataa 16380
caatggagca tcaatgaaaa gcagaattga gtctgtttta cgacaaatgc tgaataactc 16440
tggaaacctg gaaataaacc cttcaactga gataacatgt aagtataatt tttcataaac 16500
aattttattt caatatatcc ctcaagttta ccaattcaaa ttcatatttt aattgagagg 16560
ctgacttttc tttctttgaa actaaactgt gaaaacaatc cattaaaaag ctaaatatac 16620
catatagctc cctaacgtaa atcattctaa gacttaaaga atcatttggc atttatatag 16680
taaattttat ttgctaaaaa ttctcattaa ttatccctgc aacattcctt atgagtgatg 16740
ttactgtcag atgtcattag tggataggcc ataggagggg tacatagatg ctcaaggtca 16800
gagaactatt taattaatga tccacctcag aggcttcttc atttttcttt gtaacattta 16860
tcacaattga aattacaaag ttatctgtgt aaattttgta ttgtttggct tcatcctaca 16920
ctgtaatcat cctaaaagaa agaaccagtc aaccttcttc atcctactac cctcctacca 16980
cccagtctcc atcatataac acatattcaa taaataattc ttgcatgact gaaagaaaag 17040
aaataatata tgcatagaat ttaaggacat tcctccaagt tggttacatt ctgctagttt 17100
aataagccat tatttcttct cgatgagctc aagattaaaa ggattttgat gattcccata 17160
ctagactggt aggtaccagt tacagatgta ctaactgtta aatattgaaa tgctttccta 17220
tttgttggta aacaattact gcatcaggcc cacaaagttg tcttccgaga tgtttcaaat 17280
ccactgcccc tgctgctaaa gagttatgct tagcaaagca aagcactcta agacactgct 17340
ccaactccat ggcctgattg catcttttat gactggccaa tgctcacgca ctgcagtttg 17400
ttaggtagtt gaatattacc tctgcttcca cacattaagg aatgctcccg aacgcacttc 17460
ccaagtgttt atttatttat cattatacta gacaatatgg tgatacgatg gtcacagaat 17520
agcggtttcc acctccagag cccataatct agttgaaggg aaagatattc caacacaaga 17580
gtgttgacaa tcaagataga atatgatcaa gggcccagtg tgaggcccag gcaatgatca 17640
ctgcaggaat ctggggaaga aagagaccag cgtgcttggg atatctagca aaagtttcat 17700
gaaggagaat ggactttgac tttgaaatat gggtaggatt tacatatttt gagatgagaa 17760
aaagaaagtt cccagagaag gaaagcatga aaaggcaaac agtctgtact gaacgcgatg 17820
ctttgacaga ataatgaaga aagggacctg ctggaatgat tgatcagtgt tcatcattca 17880
caccatcatc atcaaaacac ttatttaatg agaacttact gttttttagg catggcttta 17940
atgccctata tgaatttttt tcttgattaa tccttacaac aaacatatcc catagatagt 18000
tttattgtcc cccttagaaa agataaattg cctaggctga cacagtcagt atatgaggca 18060
gtcaggattc aaactaagtc tgtttgttca aaaaattaag aatggccagc tttttaaaat 18120
tttctgtctc cagaagtatg atttggctcc actgaagttt gcaaaacaaa tgtgataccc 18180
aaaccttgtg aaacttttag tgggaaataa ctttgcataa gtcggtttga gagagcgtgg 18240
aaacctgtct tgaaaagttt taatttaact tgcaggaaat aaaaatgatg ggtttctcaa 18300
ttaaaaattt caatcaagga aggatatgag ctaacataac atttttttaa aaagatcagt 18360
ctggtaaggt agaggtgcat aaactgaaaa ggagcaaaag tggtggaatt cagttagaaa 18420
attattgtaa ctgtactgat gtcaaatgat gaaaccatga actaaagtag taccaaaagg 18480
agtgaggagg atggaataat tcaaaagata gaggacagat gtgcagaacc tggagattat 18540
aagatgtgaa aggaggagtt tgagaaaatt tcagattttg gaagtggtgt cattttacta 18600
aaaggatata ataagtagca aattttggat aaagttgggt cccactgagt ttgagatggc 18660
tgttggacat gcagagaaaa ctgtcttgta tgctgttctt aaattgaaat agacagacct 18720
ttaccctctg atactgacat attttccttt ccaggctcac cctccatttc cctaaacaca 18780
acacatgcac tagctctcct tactttattg ctccacaaac atcttacacc tccaagcatt 18840
tgtgcccact gtaccttcta tctggaatct cttttgtcct cttgtgtgcc tgaaaaattc 18900
ctttcagatc ttcaaaatac agtgcagatg ctatttcttc tagctcaaat attatctcct 18960
ccatataatt taattactct cttttttctt ttctctactt tgcacttaca tttatttgaa 19020
tgattgcttg attaatttct acctgtaaat tatgtgaggg caggtcctct atattttgct 19080
cgcagttaaa tctgcagcac ttattataga gtggtatcat tagagtaata tacatatatt 19140
tgaggacatg ataaattaac ttcccctata gtatttatca cattgcatct caatgacttg 19200
cttatgtttc tgttttccca tataaattga gtaacttgaa aaaagagata tctattaagt 19260
atttaatgag aaattaaagt acaaacttta gtatgcataa caacaaattg ggaaaaggtt 19320
gtaaacaaag agatttgtag ggcccatgag ttagagatcg tttcagcagg tctgaaagga 19380
agcctaggaa tctgcatttt agaggaccac ctcccaaccc caacaagtaa ttctgcttct 19440
tgttgtctgg gtactgtact ttaagaaatt atggtgaaat gatatcagcc tttattgtat 19500
ttatcttatt ctcatttttt aatactagca cttactgacc aggctgcagc aaattggctt 19560
attaatggta agttttaata ttattttgta actgtaattt gccaaatcat aaagagtaaa 19620
agtgcaagtc ttttgtgtac ttttggccaa ggcagtatct atcaagttga tgtctttgtt 19680
cttagttcgc tcaggtggtg ttgaaacaag acagtgctga tcccaagtgt cccatggagt 19740
ggactttagg tttccccttt ccttttagaa aaaggaagaa gttgtagtgg aggactaccc 19800
actctgcact caaaattgcc ctcatgaaaa tttctttggc agctttgaga accttttact 19860
gccctggttc taaggtggca tttctgtaga cttacaaatt atgtttgatg acaccgttta 19920
tgtagcttct cctaaccacc agagtagctt gctttgttgt gaattcaggt taatcacaaa 19980
gtataataaa aaagaattgt cagaagtctt cccagctttg ggtctataac ctgaaggaaa 20040
agtcactact cttcaacatc atcctatgta ctctcaggct aggatagcag aaatgcaatc 20100
cctagaaaac agcaacttac ttctctgacc aaaaaaatgc agttaaaaat tagttcaatg 20160
tacctggtag ctggcctatc ttaggtactt cagtgatttt acaaagtgat ggtagtccta 20220
tgggtgtttt tcagcttcac tacgtattta attcatgctt attgttaatg aaactgtgat 20280
aagcaattta ctagggtatt tgtttgggag atgccacaaa ggaacacatg tatctcttaa 20340
tggaagcctg gtcctccttt atccaggaaa tttgctagga aaaaaaagcc tttaggtggt 20400
tgtgctatta aaccagggca ctacttaaaa gccagcccag caatagttgt gtgatttacc 20460
attaatttct tagtaataga ccacacaaaa gaagaaaatt atgggaatgc gagttgagag 20520
gaattgggtg atcagcctac cccagcccgt ttcagctctg gccagtagac tattcacgag 20580
ctctttgaaa acatttaaat aaaccttatt tagatactag aaaccctctg tcaccctcaa 20640
gaatattctg tggtatagcg actcctttat gagggcatgt ttggtaatac agcatcagtc 20700
ttggaggtgg actggattct acaaggtgaa ctgcagtcac taaggagtct tttggatgag 20760
accagttttc ctccaacttc aatgtgtgca tgaacctcac atcaaaatgt agctttagat 20820
ttgtcccatg atgtggttcc aagaatcagc acttctaata agtttccagg ggatgcccat 20880
gctgcaggcc cacaaaccac actgagcata gcaagactat tgagaaaaag gaaatttccc 20940
aggagtctgt ggcctgagct ggcacatcca ataatgacct atcttaacct caactcatga 21000
ggaattccag ggaactctga agctgctcaa aatttgaagc ctatatgcca actaaattca 21060
gaaatgttct ccaaaatgct atctataagc aacagtagtc acaaatgcat tgtagaaata 21120
tatcgatcat gctttttgga aaatccagca tgtcctgagg aagaatgtat aagacataaa 21180
agtcataaat tatggaaaga ctcttcagct tcttccaaat gtaaaggaat catgatcttc 21240
ccagcacatt aatgcccttt ctcattagaa tgtggggccg gtccagacct aataacattg 21300
tctgagcaga gaatccttgg aggcactgag gctgaggagg gaagctggcc gtggcaagtc 21360
agtctgcggc tcaataatgc ccaccactgt ggaggcagcc tgatcaataa catgtggatc 21420
ctgacagcag ctcactgctt cagaaggtga ggccaccact acctacccat ctgggaacaa 21480
ttagaataga caggtcatga agactgcacc ctctacccta ggattgaatt gagccagaaa 21540
taattcaatg caaaaaaatc agtaagaatt ttcttcctat tcatgaaagg aaaaggattt 21600
ttccccttta gcatgctaat ttagtgctat ttctctgttt caggtaataa tatattagca 21660
cagtaaagaa caaagattta tatgtcagaa tgttttttaa atcctagcta taaaagctta 21720
agaaatttac taaatctcca taagctttat tttttttcca aattaaggga caacactgtt 21780
atctgtgact tagtgttact ggtagcattg agtacactaa tgtaaacata cgttaaatgt 21840
tagcgaaacg aattgctgtg gaagatttgc acattatatc atgggagctg atggctaacc 21900
tagagactgc cccatgccat taatttattc attcataaag attattgagt atctagtatg 21960
agcacagtgt tatatattgt agaagctact agtataaaca aagtattgcc tctgccttca 22020
aagagcttac actcgaatgt tggaatcaga atgcacaaaa ataatgatca attacaatga 22080
gtagcataaa taaaattaat gtaggcaact tacaagaatt cttaattgag gtgactaaac 22140
tattgccaac actagggtga tatgctacca gtggcgagta ggttgcataa acttacctta 22200
ttggtaaaaa gaaaagttca cattgctcat aaaagaagga ttttagattt cagcataact 22260
aaaatctgtt tcaaacctgc cttgttactg gggcatcgca gaccacaaca gttgttggga 22320
acttaactca aaaagttcac ccagaaaaat aatggagatt tgaactcgtg tgcccctgac 22380
catatcaatt ttcttctcag actcttactc taaactggac ctccttatca cacacacaaa 22440
gccttccata ggcagatcaa tccagtctta tttctcaaag catgtacctt gagcttcaga 22500
taaacagcat tgttctcttc ccctggactc ttcctacatt tccctaccta tgagtatctg 22560
atcaatctgc ttatccttga aatgttaata tatttaccac atctctattt gaattttatg 22620
aaatttttga taatttctaa gtagtttttt cagatttata ggcactactt catggtacag 22680
tgactgttac aaacgtattt gttaaattta gaaggaataa agatttaaaa gactagggta 22740
gttactgaac taaagtttta ggaaatccca aattatttca aatttttctt atggtaattt 22800
tatgacttaa tatttttata tgcagtgaac aaatttgaaa ctttaaaaga tactcccaga 22860
attatcagtt ttctgatgta gattggcaaa tttattacta tatcccaaat aacccaagag 22920
acaaaattca caaaaacatt tcaattttca ttgccacttg aaaggccaaa aagcagaaat 22980
ggcacgcatt gatttcaatc gtactcttga gtgtgggaac caggaattaa aatacctgga 23040
cttatcaggc acttagcata accaagaacg gaatagaaac ctccctggat tctaagccct 23100
attcagtccc aatcaccaaa aaccaagtaa acgatatcac tataatgaaa gccacagtta 23160
taaatatcga caacgattac caaaggaatc catggaactt tgaattttgc caccccacat 23220
ccttctattc attaccatga ttgatccact aaagctaaca gactctgtga accttgtatt 23280
ggacccctcc ctaaagacct gattgtcact gagaaccatc agtgaggatt tgtttggggc 23340
atgaccagcc ttacatcaaa gtacatagaa gtgatgaggt cttatcaaag aggattattg 23400
aattatcacc tcttctatgt agctttccct gatactctct ttcctctcca ttgagttcca 23460
cagaaatttt tttatctgcc tttaacagtt gtcctcatga tttgtgatat ttgacttacc 23520
tcttgtcagt ttccttcact agtgtagagt tcctcaaaga aagagaccat aattacttat 23580
atttttattc ctggagactc atactattcc ttatacaaag tagacactta acaatggctt 23640
gttgaactat aattaatgaa aataatagct accttcatga aagttcactt tgtgccaaac 23700
actatagttg acataataca tttgtctcat taatacttaa caattgtgtg agaaggtatc 23760
accaatcaca ttttatatgt aaataaaccc cagagctatt aattaacttg tcataaataa 23820
cacttttcat atgtggcata gccaagattt aaatataaat gttactggtt ccaaaatgat 23880
gctctaattc acttgctgga aagaaggaaa ggaagaaaat aaacgagtgg aaggaagaga 23940
gggagggaag agagaaaagg aaggaaagaa aaaagagtct cttcagaacc ttcactgtaa 24000
agactccgag caaaagaagt tgaatataaa aacaacatag gtttgtttgt tttctaatat 24060
tttttcttca aaatttttaa ctcaggttca ctcttacaca aactactgtg tcttataaaa 24120
gtatttccgg tcatagaatt tttattttct gtattaactc cactatctaa tctccataaa 24180
actcctaaat tggtattatc ggtaacattt tgtttttact caacccttag gaacaatgtt 24240
aagttaatca gccctccaca tcacagatcc ttattttcat cagtctgtac aaggcatttc 24300
tctcatttta attttttttc ctcctgtcat ccctggattt cactttcact gccctccttc 24360
cacccatatg cctcatacta atatattcga aatatacatg tcttaaaggt acatgcacgc 24420
acctacaaaa cctatagtgt ttttttgtat gtatatgtct ttaatttaaa taagtagcat 24480
tgtgtaaaag tctaatattg tttcttactg ttttcactca attcttggaa ttttcatctg 24540
atgcactgct gcatagcacc ccatggtatg cagccaccat atttccttca tccaattagg 24600
ttgcatgacc taccttccca ttgccacaaa gagtacacac aaaatatttg tacttatctt 24660
tctgtaaacc ttcaggaatt tcagaagcac acatgcaggc tgctaaatat accagaatac 24720
tttccagcca cttaaatctt taccagtatt gcaaaagagg ccccatttcc ctccacatca 24780
acatttagta ttattctttt gtttaagttt tatcaatctt ttaaatgtac acaagatgct 24840
catttttata attttaattt ctcagattac tagtttgagt atcttttcat atatctaaga 24900
gctgttttga tctcccctac catgaactgc cactaatatt ctttgcctat tttacaatgg 24960
tttttctgct tatttattac tggtttacag acttttaaaa tatattctac aaaaatttta 25020
gacattaaac attaccaata ttttcccatg gttcctcatc catctggtaa acttgtctat 25080
ggtatatcta attttgattt aatagaattc attctatttt taccttttag tttgtgtttt 25140
tgttgtttag ccaaaaagtc cccattccta ggtcataaag gtaatgtcct tttttttttt 25200
ttaacgctac tgttctctct ctgtctcccc ctatgtatat aggtgcacat atacttgtac 25260
acacatacat atacctatat atgaggggag ttcgataagt ttatggaaaa taaaattaaa 25320
agataaaata aaaaattata aactttattt ctcaacataa gctccttcaa gttcaagaca 25380
cttttgtaag caataatacc agccatatcg tccatcccta aagaactgag ggtcctgaga 25440
atttaactat gtcaatgcag tcttttttac attacttttt tacagtactt attgatgaaa 25500
aatgggtgcc ttttaaagat tgttttaaga ttagggaaca aaaataagtc agaggaagtc 25560
aaatcaggac tgaaaggtgg atgcctagtg atttattgct gaaactttca taaaactaac 25620
cttatttgat gagaggaatg agcatgagca tggttgtgat ggagaagaac tctggtggag 25680
ctttcctgga cactttttct actaaagctt tggctaactt tcttactctc ataagaagaa 25740
gatgttattt ttcactgacc ctttagaagg tcaacaagca aaatgccttc agcatcccaa 25800
atgtctgttg tcatgacttt tgttcttgac tagtctggtt ttgctttgac tggaccactt 25860
ctacctcttt atagccattg ctttgatggt gctttgtctt caagattgta ttagtaaagc 25920
catatttcat cttctgttac aattcttcaa agaaatactt cagaatcttg atctgacatg 25980
tttaaaattt ctattggaag ctctgacctt gggtgcagct gatctgggcg aaacagtttt 26040
ggcatccatc aagtagaaag tttgctcaac tttagttttt cagtcagaat tgtataagct 26100
gaaccagttg agatgtctat ggtgttgtct attgtttctc acagttaatt gttggtcctc 26160
tttgagacat gaacaagatg aaatttttcc tagcaaactg atgtggatga tctgttgctg 26220
cgggcttcac cctcaacaac atctctttct ttcttgaaac aaattatcca ttagtaaact 26280
gatgattggg ggagatgctg tccccataaa ctttttgtaa ggcataaata atttcaccat 26340
tcttccagtt tcaccataaa tttgacgttt ttttgcttca attttagcag cattcatgtt 26400
gctttgataa gagctctttt caaattcatg tcttattcct cttagtgcct caaactagat 26460
cttgttcagt atgacaagtt agtatgagtt tatctgcatg caaaaatctt tgaaatccat 26520
gcatagtttg tttataatat acattttcaa tgaacttttg aagaccccat acatacatat 26580
gtatatatat gcacacacac acacacacac acaccaaaat cttcaaccat tatcagactt 26640
agtgcagaaa aattattcat ccattaacaa gataagaatg ccccttatca tcactactat 26700
ttaaatggag ctcctggcta aaggaaaaga cagggattga aaaaaattag ttaaatctaa 26760
aatgtttatt atttcaggtt tcttagttgc ttaaatggga agggaggtat ggacaaaaga 26820
gaaatcaaag atatttgtgt tatgctactt atcattaaag tatcagaata acttcattgg 26880
aatagaaaaa caccaagatc accccacgat atgttttcta aaatcttctc catttcttta 26940
gacaagtgac catgtattcg gccagtgaag aattaaactc acttgccagc ttataatgca 27000
ggaaaatata gcaaagagat gtggatccaa tagtttctag atagtggtac aggatggcta 27060
agatgaattt atatatctga aatgttcaca aattccctac tcatatagca tgttttcata 27120
atgttttagc aactctaatc ctcgtgactg gattgccacg tctggtattt ccacaacatt 27180
tcctaaacta agaatgagag taagaaatat tttaattcat aacaattata aatctgcaac 27240
tcatgaaaat gacattgcac ttgtgagact tgagaacagt gtcaccttta ccaaagatat 27300
ccatagtgtg tgtctcccag ctgctaccca gaatattcca cctggctcta ctgcttatgt 27360
aacaggatgg ggcgctcaag aatatgctgg taagtgtctc ggaaaaaaaa attaacaata 27420
gaaatgtctt atatttgcta ttaggtaatt ttttaaatta ggaaacatct ggaataggtg 27480
tttctattct tctacagaca gaaccattct atattctgct cagcccaagc tctggctacc 27540
cctgagtctc cttagcaaag caaagcaatg ctccagaaac tatgggaatt ctcaaatata 27600
gtaataggaa aatgtaaaag aaagttatga agacacgagt tctttaataa tccagagatt 27660
ctataagatt caaatagctt ccctataaac aataaaaaag attttgtttg tttgtttgtt 27720
tgcttgtttt ttagagacaa agactttctc agactggagt gcagtggtgc aatcatggct 27780
tactgcagcc tcaaactctg gtcttaagaa atcctcttgc ttcagcctcc caagtagcta 27840
gaattataaa taagtgtgta ccaccatacc cagctttttt tttttttttc tacagacagg 27900
ttcttgctct gttgcccagg ctggtctgga attcctgccc tcaagccatc ctcctgcctt 27960
gttggcctcc caaagcaatg ggaggattta gattagacat tgtatgaggg cttaataatc 28020
cttaaggtat taactgccct ttaaagtatt ctgggatatg gcaaaaactc gatgtgtata 28080
taaacattgg tcatatttgt ttattgaatg aataaaatgg aaactaaaat gaggacaatg 28140
cacaagagct actagaacca gtaagagtat cagcgaagga gtggaagggt agcattgaca 28200
atttccctgg gcttttaccc atgttgtaga ttgtctctcc aaggaataat acaaagcctt 28260
aatagtccta gaacacattc tattgtgttc ttatggccca aagtaaattg gtgtagtaga 28320
taacatttgc accagtcatg aaaaactatt ggtgtcattc tgagagtaca tcaatataaa 28380
atagactagt tctttagcct tgaaactaga ctggtttctc ttttgctgct aggttaaagg 28440
ttattcaata tgtaatcttc caatccaaaa tctgtcagtg gataatttaa aagcttttag 28500
tcaattttaa gatatttgtt ttcttaaaat tttaaggggc actgtgtcac aaagctaaag 28560
aaaaaaaaga aaaaaaaact gatctgtgaa aggggttatc ctcatctact tggggaattt 28620
tggctgcgaa gaaactccaa agtaaatctt tagaagcctt cattgttaaa tatgaaataa 28680
tgtttggagt acatttattt cttctcaaat ttattatagg gtcaataatg tacacatctt 28740
gaagtccatt tttttcctgc ttttataaca aacaggccac acagttccag agctaaggca 28800
aggacaggtc agaataataa gtaatgatgt atgtaatgca ccacatagtt ataatggagc 28860
catcttgtct ggaatgctgt gtgctggagt acctcaaggt ggagtggacg catgtcaggt 28920
aagctcaaga caatctcatc catgtcatca tccaagaagt gtataagcac ttcctagtat 28980
gtgataatgt gatagacata agtgtaacag ttacaataca cagccctgtt cctctaaaat 29040
ttataatcta gattttagaa ataaattttt ttatgaatga agtttatcta tcatgaaagc 29100
attaactctg agaggccaaa ttacagagta gttaaccatc caaagctcaa gaatcagaaa 29160
gacctcgatt tgaattcctt aacctctatt accaagtctc taactaaaag ctggggataa 29220
tcataatagc acctaacttt ttgggtacta agaaaagtta aatgaagact aaatatatca 29280
ggcacatggt aaacaacaaa gaaatctcat ctatttcact attattaatg tagaccatgg 29340
tcactcgtgt taataacttt aacctcaacc ttttaactgc tgtgaaggat taaataaaaa 29400
attaatcact atattataaa aattaattga tatataataa atgaatttta agagatacgt 29460
aataattcat ggactccttg aagatagaaa atttatacaa aatcctagta atttgagtca 29520
caaaagctcc tacaataatg aaacagtatg aatgaaaaag aaaagaaata actattatat 29580
ttggatctag cccataattt ttaaccaaat gcacaaaaac aaacaacaaa tatgaaattc 29640
tcactgtaaa gtgattaaaa tcaaatttga attctaaaat tttaaattaa attatctaaa 29700
cataattgat gcagttatat gttttaatag gttttgttca catatctgaa atccaactcc 29760
acacagtagc aggaacagct ggtgtcagaa attaaatatt cttttagtct ggagttttaa 29820
aaaatcaatc tgtttacttg agtaatttgt tgctgttttc atgggtgaat tgtatacaga 29880
aggataagaa ttattcttcg catcaaaagg tcactgactt tcatatttag tgctcatggt 29940
ctttaaaaag tggataaaaa gtagttctca catttcatgg aaagccccca atccatgagc 30000
acatttccca aaatgaaaca tttttatcaa ctgcaagttg tgtgtaggtg gagatttgtt 30060
tttcaattgt caagatactg ttaattaccc agtcctttat ctccttttgg tggagatgtc 30120
tctgtgctag gaaacccttc ttgctctcct tcctgtttct cttttactac tggccctgaa 30180
acaacaaatt ctcaagtttc atgacagctt tccaaagaat ccatcaatca aataagcaac 30240
acaactcgac actgacaatt ccagacctac taagagcatt aattaagact taaaaataaa 30300
catgagtttt aaaagggtgt tattcattat tttcccattt ataacgtccc ttaccttctg 30360
tccttcagtg catacaaatt attatcttcc ttgaagccca gttcaagccg tacctcacca 30420
tgataccttc catgtatatt ccactctagg cctcactgat ttttaactga aatactataa 30480
tgcatagttc acacttaaaa aaaaaaaaaa aacacagcac tttacataag agcttacagg 30540
atcctatttg ttttatccat tcttttgttc atttttacaa tcattaattc aaaggaatta 30600
tattaattac tttctatgca cccgacgttg tgttaacaca acaatactat ccctgcattc 30660
agcaagtcta tggtctacaa gagaggacac aaattcaaat gtctgtagtc aagcagtgaa 30720
gctggctaga tatggaaaaa ttacaagtcc ctcttgcttt aacatttgct tgcccacatt 30780
tggtcagaca tcatgcaaaa taatttctca ctatagaaaa aaaaacacta caaaaacaat 30840
aatataaaga actgagaact ggttaactga agcatgcata tgtcatctaa aagaagcagg 30900
tgacgaccag cttcatgaag tacttgccat gcatattggc acttcacaca ctgacccttc 30960
tccccaccta gaccagtaat taaacaggta tggatgagct agctactaag agcagccaac 31020
tgaatagctg actaacttag aagcacactt ggtaataata gctgactttt attagtactg 31080
actatactat atgctaagct gtactcaaag tgctttgagt tttaaactga tacaaacatt 31140
atatgaggaa acagaggtac agagagctat tcaccagctt accaaaggtc acatagctgg 31200
taagtggagg acttaaaccc agactatcta gtttcagaac ccacagactt aatccatcgt 31260
gcagaacata agacatactc catctgtctc cccaactagg ttattatgtg cacaaatatt 31320
tattggttgg ttggttcatt attatgactg ggtggtaagt atgtcattag gagtgttttg 31380
cttatgacta tataaatttc ttcaccaaaa gaagactttc tgatgatata ctatgcatca 31440
gacaccacgc agggtgctaa ggttaggaag ataagtgaga cttctagaaa ctcattcatt 31500
caacaaatat ctcctaaggg ctagaagctt aggtttcagc agtgaacaga ataggtatgt 31560
tctctttcgt gttggacctt atagtatatc tgggaaaaca gacattgaat aaatatcaca 31620
aatgcaagtg agtgtttcag agacatgcag ctgctacatc aaaacaaaac agaacaaaac 31680
aaacaaacaa aaactgacca gtgggattaa gtgtaaatag gcacacaaat gcacaaatat 31740
gcttttataa aatagtgaag cagtgacaga gacacacaca agatataaag acacaatgaa 31800
gaacaattga gcccaaagct ggaaagggtg agagtgtgaa ggaaaaaggt tgatcagaga 31860
agttttcccg aaggagagaa agcctggatg attaggaggc aaccactcgg tgactgaggg 31920
aaatctgaaa aatgtatttg tcatcttctc agacttgctg aaggaatgac ttgggtactt 31980
tgaggatttc agtaattttt ccatgacttg gtataatatt tcaaaaggaa ataggctgac 32040
tttatttgta taatgaatgt gactccttcc tcgactgcca tagaaataaa ctccttaata 32100
ttttgggttt gtctttgcac ttaagtaatc agtcattctg tttttttaca gggtgactct 32160
ggtggcccac tagtacaaga agactcacgg cggctttggt ttattgtggg gatagtaagc 32220
tggggagatc agtgtggcct gccggataag ccaggagtgt atactcgagt gacagcctac 32280
cttgactgga ttaggcaaca aactgggatc tagtgcaaca agtgcatccc tgttgcaaag 32340
tctgtatgca ggtgtgcctg tcttaaattc caaagcttta catttcaact gaaaaagaaa 32400
ctagaaatgt cctaatttaa catcttgtta cataaatatg gtttaacaaa cactgtttaa 32460
cctttcttta ttattaaagg ttttctattt tctccagaga actatatgaa tgttgcatag 32520
tactgtggct gtgtaacaga agaaacacac taaactaatt acaaagttaa caatttcatt 32580
acagttgtgc taaatgcccg tagtgagaag aacaggaacc ttgagcatgt atagtagagg 32640
aacctgcaca ggtctgatgg gtcagagggg tcttctctgg gtttcactga ggatgagaag 32700
taagcaaact gtggaaacat gcaaaggaaa aagtgataga ataatattca agacaaaaag 32760
aacagtatga ggcaagagaa ataatatgta tttaaaattt ttggttactc aatatcttat 32820
acttagtatg agtcctaaaa ttaaaaatgt gaaactgttg tactatacgt ataacctaac 32880
cttaattatt ctgtaagaac atgcttccat aggaaatagt ggataatttt cagctattta 32940
aggcaaaagc taaaatagtt cactcctcaa ctgagaccca aagaattata gatatttttc 33000
atgatgaccc atgaaaaata tcactcatct acataaagga gagactatat ctattttata 33060
gagaagctaa gaaatatacc tacacaaact tgtcaggtgc tttacaacta catagtactt 33120
tttaacaaca aaataataat tttaagaatg aaaaatttaa tcatcgggaa gaacgtccca 33180
ctacagactt cctatcactg gcagttatat ttttgagcgt aaaagggtcg tcaaacgcta 33240
aatctaagta acgaattgaa agtttaaaga gggggaagag ttggtttgca aaggaaaagt 33300
ttaaatagct taatatcaat agaatgatcc tgaagacaga aaaaactttg tcactcttcc 33360
tctctcattt tctttctctc tctctcccct tctcatacac atgcctcccc caccaaagaa 33420
tataatgtaa attaaatcca ctaaaatgta atggcatgaa aatctctgta gtctgaatca 33480
ctaatattcc tgagttttta tgagctccta gtacagctaa agtttgccta tgcatgatca 33540
tctatgcgtc agagcttcct ccttctacaa gctaactccc tgcatctggg catcaggact 33600
gctccataca tttgctgaaa acttcttgta tttcctgatg taaaattgtg caaacaccta 33660
caataaagcc atctactttt agggaaaggg agttgaaaat gcaaccaact cttggcgaac 33720
tgtacaaaca aatctttgct atactttatt tcaaataaat tctttttaaa ataatttccc 33780
tgcctaatta tttatggaag ttatgacttt tgaaggacaa ttcaaaacca tttatttaat 33840
tggttctgca atgaaagaac tgccccatat actctactaa aggcttggca ctttctgctg 33900
ccttttaatc cagcgctata attgaggcaa gcgtccagct tgacacctcg agataacttc 33960
gtataatgta tgctatacga agttatatgc atggcctccg cgccgggttt tggcgcctcc 34020
cgcgggcgcc cccctcctca cggcgagcgc tgccacgtca gacgaagggc gcagcgagcg 34080
tcctgatcct tccgcccgga cgctcaggac agcggcccgc tgctcataag actcggcctt 34140
agaaccccag tatcagcaga aggacatttt aggacgggac ttgggtgact ctagggcact 34200
ggttttcttt ccagagagcg gaacaggcga ggaaaagtag tcccttctcg gcgattctgc 34260
ggagggatct ccgtggggcg gtgaacgccg atgattatat aaggacgcgc cgggtgtggc 34320
acagctagtt ccgtcgcagc cgggatttgg gtcgcggttc ttgtttgtgg atcgctgtga 34380
tcgtcacttg gtgagtagcg ggctgctggg ctggccgggg ctttcgtggc cgccgggccg 34440
ctcggtggga cggaagcgtg tggagagacc gccaagggct gtagtctggg tccgcgagca 34500
aggttgccct gaactggggg ttggggggag cgcagcaaaa tggcggctgt tcccgagtct 34560
tgaatggaag acgcttgtga ggcgggctgt gaggtcgttg aaacaaggtg gggggcatgg 34620
tgggcggcaa gaacccaagg tcttgaggcc ttcgctaatg cgggaaagct cttattcggg 34680
tgagatgggc tggggcacca tctggggacc ctgacgtgaa gtttgtcact gactggagaa 34740
ctcggtttgt cgtctgttgc gggggcggca gttatggcgg tgccgttggg cagtgcaccc 34800
gtacctttgg gagcgcgcgc cctcgtcgtg tcgtgacgtc acccgttctg ttggcttata 34860
atgcagggtg gggccacctg ccggtaggtg tgcggtaggc ttttctccgt cgcaggacgc 34920
agggttcggg cctagggtag gctctcctga atcgacaggc gccggacctc tggtgagggg 34980
agggataagt gaggcgtcag tttctttggt cggttttatg tacctatctt cttaagtagc 35040
tgaagctccg gttttgaact atgcgctcgg ggttggcgag tgtgttttgt gaagtttttt 35100
aggcaccttt tgaaatgtaa tcatttgggt caatatgtaa ttttcagtgt tagactagta 35160
aattgtccgc taaattctgg ccgtttttgg cttttttgtt agacgtgttg acaattaatc 35220
atcggcatag tatatcggca tagtataata cgacaaggtg aggaactaaa ccatgggatc 35280
ggccattgaa caagatggat tgcacgcagg ttctccggcc gcttgggtgg agaggctatt 35340
cggctatgac tgggcacaac agacaatcgg ctgctctgat gccgccgtgt tccggctgtc 35400
agcgcagggg cgcccggttc tttttgtcaa gaccgacctg tccggtgccc tgaatgaact 35460
gcaggacgag gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt 35520
gctcgacgtt gtcactgaag cgggaaggga ctggctgcta ttgggcgaag tgccggggca 35580
ggatctcctg tcatctcacc ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat 35640
gcggcggctg catacgcttg atccggctac ctgcccattc gaccaccaag cgaaacatcg 35700
catcgagcga gcacgtactc ggatggaagc cggtcttgtc gatcaggatg atctggacga 35760
agagcatcag gggctcgcgc cagccgaact gttcgccagg ctcaaggcgc gcatgcccga 35820
cggcgatgat ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca tggtggaaaa 35880
tggccgcttt tctggattca tcgactgtgg ccggctgggt gtggcggacc gctatcagga 35940
catagcgttg gctacccgtg atattgctga agagcttggc ggcgaatggg ctgaccgctt 36000
cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc atcgccttct atcgccttct 36060
tgacgagttc ttctgagggg atccgctgta agtctgcaga aattgatgat ctattaaaca 36120
ataaagatgt ccactaaaat ggaagttttt cctgtcatac tttgttaaga agggtgagaa 36180
cagagtacct acattttgaa tggaaggatt ggagctacgg gggtgggggt ggggtgggat 36240
tagataaatg cctgctcttt actgaaggct ctttactatt gctttatgat aatgtttcat 36300
agttggatat cataatttaa acaagcaaaa ccaaattaag ggccagctca ttcctcccac 36360
tcatgatcta tagatctata gatctctcgt gggatcattg tttttctctt gattcccact 36420
ttgtggttct aagtactgtg gtttccaaat gtgtcagttt catagcctga agaacgagat 36480
cagcagcctc tgttccacat acacttcatt ctcagtattg ttttgccaag ttctaattcc 36540
atcagacctc gacctgcagc ccctagcccg ggcgccagta gcagcaccca cgtccacctt 36600
ctgtctagta atgtccaaca cctccctcag tccaaacact gctctgcatc catgtggctc 36660
ccatttatac ctgaagcact tgatggggcc tcaatgtttt actagagccc acccccctgc 36720
aactctgaga ccctctggat ttgtctgtca gtgcctcact ggggcgttgg ataatttctt 36780
aaaaggtcaa gttccctcag cagcattctc tgagcagtct gaagatgtgt gcttttcaca 36840
gttcaaatcc atgtggctgt ttcacccacc tgcctggcct tgggttatct atcaggacct 36900
agcctagaag caggtgtgtg gcacttaaca cctaagctga gtgactaact gaacactcaa 36960
gtggatgcca tctttgtcac ttcttgactg tgacacaagc aactcctgat gccaaagccc 37020
tgcccacccc tctcatgccc atatttggac atggtacagg tcctcactgg ccatggtctg 37080
tgaggtcctg gtcctctttg acttcataat tcctaggggc cactagtatc tataagagga 37140
agagggtgct ggctcccagg ccacagccca caaaattcca cctgctcaca ggttggctgg 37200
ctcgacccag gtggtgtccc ctgctctgag ccagctcccg gccaagccag caccatgggt 37260
acccccaaga agaagaggaa ggtgcgtacc gatttaaatt ccaatttact gaccgtacac 37320
caaaatttgc ctgcattacc ggtcgatgca acgagtgatg aggttcgcaa gaacctgatg 37380
gacatgttca gggatcgcca ggcgttttct gagcatacct ggaaaatgct tctgtccgtt 37440
tgccggtcgt gggcggcatg gtgcaagttg aataaccgga aatggtttcc cgcagaacct 37500
gaagatgttc gcgattatct tctatatctt caggcgcgcg gtctggcagt aaaaactatc 37560
cagcaacatt tgggccagct aaacatgctt catcgtcggt ccgggctgcc acgaccaagt 37620
gacagcaatg ctgtttcact ggttatgcgg cggatccgaa aagaaaacgt tgatgccggt 37680
gaacgtgcaa aacaggctct agcgttcgaa cgcactgatt tcgaccaggt tcgttcactc 37740
atggaaaata gtgatcgctg ccaggatata cgtaatctgg catttctggg gattgcttat 37800
aacaccctgt tacgtatagc cgaaattgcc aggatcaggg ttaaagatat ctcacgtact 37860
gacggtggga gaatgttaat ccatattggc agaacgaaaa cgctggttag caccgcaggt 37920
gtagagaagg cacttagcct gggggtaact aaactggtcg agcgatggat ttccgtctct 37980
ggtgtagctg atgatccgaa taactacctg ttttgccggg tcagaaaaaa tggtgttgcc 38040
gcgccatctg ccaccagcca gctatcaact cgcgccctgg aagggatttt tgaagcaact 38100
catcgattga tttacggcgc taaggtaaat ataaaatttt taagtgtata atgtgttaaa 38160
ctactgattc taattgtttg tgtattttag gatgactctg gtcagagata cctggcctgg 38220
tctggacaca gtgcccgtgt cggagccgcg cgagatatgg cccgcgctgg agtttcaata 38280
ccggagatca tgcaagctgg tggctggacc aatgtaaata ttgtcatgaa ctatatccgt 38340
aacctggata gtgaaacagg ggcaatggtg cgcctgctgg aagatggcga ttgatctaga 38400
taagtaatga tcataatcag ccatatcaca tctgtagagg ttttacttgc tttaaaaaac 38460
ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaaacct 38520
gccctagttg cggccaattc cagctgagcg tgcctccgca ccattaccag ttggtctggt 38580
gtcaaaaata ataataaccg ggcagggggg atctaagctc tagataagta atgatcataa 38640
tcagccatat cacatctgta gaggttttac ttgctttaaa aaacctccca cacctccccc 38700
tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata 38760
atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 38820
attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg aataacttcg 38880
tataatgtat gctatacgaa gttatgctag taactataac ggtcctaagg tagcgagcta 38940
gctgcaaccg aggaaaaaac gtgccatgag gtctctgtat ccaagtgtga ct 38992
<210> 20
<211> 34073
<212> DNA
<213> 人工序列
<220>
<223> 重组多核苷酸
<400> 20
gagggagggt ggtgctttgc taatggtgaa ttactaactc ctcaataaag aatattattt 60
gaaataattt ttgaaatttc ataattactt tgggttcttt cttaatgata aataaataat 120
agtatattac aaacatacat taatatttcc tgaatgaata caccacaaat ctcccttaaa 180
atatagcaag aataaaaatt atactatttc tgacaatttt taatttctca aataataata 240
ccactctgat ttttaaacat ctacaccact ctggctttgc caatcttttt aaaaattgaa 300
aagataataa ttttatcata attacactga agcatagaac tttttctttc aaggaaagca 360
aatttttgaa attctataat ataacctccc ataatcctga ataaattaaa ggttcaacaa 420
cttagtaaag taagactgac cttccctttt atttcttttt cagatcaaaa atcttacttt 480
tataggagca gttttcaact cctaaatgtt gaatataata gtcagttaaa ttcaccagct 540
acacaggaat acaggacttt gagtggaaga attgaatctc tggtaagtta atatttgtct 600
ttgctcttta ttccattata aaatgaatat gataataaac ctaatgtttt gtaatatatt 660
ttcagttgct aagtgctcta catattttcc ttccttgaat ggtgaaacat gtgtttctct 720
ctgcttttat ccagttagtt tactcatata ctggttctta ttcacatctt tgtcatgagt 780
aaaaagtgtt agaaaggcca cgagtaaata tgcattttat ttgtttatga attcaaatac 840
taaaagtttt ttatttgttt aattaagcat tgacattgtc tttttaaatt cttttcattt 900
taccttcttc cctcttcctt atccaactaa agacgcaaag caggaggtgt taaaaaacag 960
gtttaccata tcagcagtaa catagtttgg acaacattac actttggttc aatgatagac 1020
atagaagttt gaacagaaat atgcaaagca agtttgagct ctaacttgaa gagagcctct 1080
gggtgcctgc caggaaacct cacgagtgga cccttaacat tcatgtgtca ccacaaacta 1140
ggggctgccc tttagttttg accagtctca gtgtcactca cttaccctta ccttttcaaa 1200
aaaaagtcct aagaatataa agtaattcaa tggttctaca attttagcat gtaactgagt 1260
cacctggcag ggttgctttg gtgagctcaa gataaaattt tatcagcatt tctacatttt 1320
ctggaatatt ccttaatcca ggcttttaat cccttggtgc ttttctgaac cactgcaatg 1380
agcttctaac tgttctcact gtgtgcaggc tcttttcctt ctaatctaat ttacacactt 1440
ctgaacacaa atctctcaca gcctgtttcc ttcatgttac ctccagctca agactttttg 1500
cctacaaaat aaaattcaaa cttgttagct aagcaccttc tcatgtctat gctttggctc 1560
atatttcagc catcgtgtgc cccacttatt cttatagcca acctgaaaag ccatctttta 1620
taagaaacta cctctgctct ccatgattgg atataattaa tcctccttcc acatcacctc 1680
gccacaaaat tgtatctgtg ttgatctcat gccacatacc tgtatgtatt ttatattata 1740
aatatttgca gacttgttta atttgccatg ttagactaag ttccatgaag acagctccat 1800
atccattcca tttttatata tccacaacat ttggtcgggt tgatgcttaa taaatgttta 1860
ttgaaggaac aggagtctcc cacttctgac ataatgaact tatttccccc agtgttaacc 1920
ctacatctgg ttcctgtcca agagtctctt cccaaatcat tctgattcaa ctgttcattc 1980
tgatctcatt aaacatttaa atgatatatc taacttcgct tgctttattc tatgctcatc 2040
ctgcagtctc ctcataactt ggtttcaatg atgcttgctt ctagagaaaa aaatgtatta 2100
aataagctta tgattcagtc ctccagctgt gatggttctc actgaacatt agctcagtgg 2160
ttttcgaagt atggtctcta gcataaccta gaaacttgtt agaaatgcaa attcttgggc 2220
tcaccaagac atactaaatc aaaaattctg acattggggc ctagaaatct gtgttttaac 2280
aagcctgcca gtgcagcctg gtcccttttc ttctcggagc cccactcaaa gctttcagtg 2340
ctcatctccc accaatgaca gggtcctcta tggaaaccgg caggacggtt tccaactcta 2400
actacgtttt agagtttgct tcctagggct atccaggcac caagtatcac aggttagttt 2460
cccagggaag cagactctga gacttgcatg cagggagtgt ctctggggtg ctctcaacca 2520
acaccttcag gaagagaagg aagcagcatt gggcagaggc atagtcaaac tacagtgctg 2580
ttggcacaga agactgaagg gagtcagagc cagggggtag aggtgggccc ttagcatcca 2640
tccttcacca ttaggtgtga gttgccccac ctccttgatg gtgtaacctc agtcccaagg 2700
tgggtgggag tgcagcagag cagcccctac aagggccaaa ccagagatac accaggcgcc 2760
agaagtgctg ccagggaata gagaggaaag gatgggctta aggtaggatc cacagaactt 2820
ggcaatggat tagaagacag gatgagaagt gacaggttaa cactaacaca gaaatgtcta 2880
acttcggtag ataatggtgc cattggctag aagaggaaac cgaaatgaaa gcaggttgtt 2940
cagggagaca aaagttcact gtggacatct cagcagagtg attcagtggg gaaaggaatg 3000
gatgcccaga ccacctcaga ggaagatcta agctggagcc agcaataaag atacaagatg 3060
aacaatccct aacgaactgc tcctcagcca tgctccccag acacgctgct tcagatttat 3120
agtccgggtg aggctaggag gtgcgcctcc ctcagtggag gacagcaaag caccagtggc 3180
tccagggagt taaaatcttt tgataatttt tgttctagca tctgtctgca gagctgtctc 3240
tcagccattg cctgccttta cacaggagtg cagtccgaaa ttgggagatg agtgaaattt 3300
attatgccta gagatctgga tccccagttg tttgggagta tattttctga accacttgtt 3360
ggtttaagta atgcagattt attgatgcca cttctcttga atctgtgact ctggacccac 3420
catctaagtg aatgtgcaga gggaacggaa tggctgcaat agatctccat taaaaccagt 3480
gcatcctccc agacacatac agtagtaggg aggtgagtca atgtcaggac agcaccagct 3540
cccgcttcgg tacatttcca aagttctcag tctgtgtaca aaggtttgct ctggggcagc 3600
agaaatagcc ctgggcaggt agtcaaaggc ctggtttgat ttcctccact tccaggcaag 3660
tcactcgaag gctcacaggc tttttcctca cctgccacat gggtccagtg agatctactg 3720
agctgtaaat aatgaaatga gtgtgtgtgc agtcatctat aagttgtaaa gtactagaaa 3780
atggtgaaac tttgggattt gggctattta aggctgaatg ctaaaaatgt caggcattgt 3840
ggagaaagga atttaaatat aagattgatt gactgggatt taaagacaaa tgaaggcaca 3900
cacgcaagtg cacacccaca ctgacactgc acagctcccg ttggaggcat atcctgacca 3960
tgcagacctg gggctctgcc tgtccaagtg cactccttta ctacataaac cctccttctc 4020
ttttggggct gtcaccccac cagagctggc accgagccct tgctgctgcg cttccctggg 4080
gtgtcagctt ttgacagggt gtttcctccc tctgcaggag ccttaacatc ccttggactt 4140
ccttcccccc acccaccccc agcagtttta tctcttccta actcgggacc ctttttttcc 4200
cacacaaagt ttattgtcag ttgctggttt catctgtttg agcggctgca acaaaatacc 4260
atagactggg tggcatatgc acgacaaaaa tttatttctc acaggagaag tcaaagatta 4320
atgcaccagc agatctggtg tctgaggggc caccttctgg tttgtagatg atgctttcta 4380
gttaaaacac ctatttaaca cactattaaa cactaagtgt gttaaatagt gcagttgatg 4440
tatttgtcat gtcaccttta tcatacacta aatccttctt tgtctttttt tctgtactct 4500
aatctctttc tgtaagtaat ctttgcttgc agcagtagga tatttagagt actgtggctt 4560
gacaatatat ttagtatttc aagatttcca tgaaattctt ctgatgtatg agttccctag 4620
ttaatcttac atatgtatcc ctttgtaaaa acactttgaa catttaaaat gatacatgaa 4680
tagtactcta atacaatgcc ataaaaatta taaatcattt gtatagactg gtaagtaaag 4740
attgtgagat taagaaacgc atcaaaggcc attgagctgg aaagtggtat aatgagaatt 4800
caaaccaggg tctcttgact caaaatctaa ggatcatacc atttctcatg ataatatgag 4860
tattattgtt atctctatcc catagacaaa gtgttaacac tgaatgagca gtgaaatagt 4920
ctcagaattt tttattttat ttagcaattc acttgtcatt tctggtcctc agtttattca 4980
cgagtaaaat aaaatagttg gactagataa tttctatagt acattcttac acaaaaaatc 5040
tatgattttg ttatttttaa tgtgatatac tcatggcact cattcacctc attttcccag 5100
cctgcctcac tggtcattac ttctctgtgt tctttacagg ctccccctcc tctacactgc 5160
cattaaatat tgaaacacct caaagcttta cttatgtcca cctctcctct gacactatca 5220
ttctgtctag atgatcccat acatacatgc ccattacttc aacctgtatt tatacgccaa 5280
tgattcacta tatttccagc ctagacattc ttttgtactc tagttaccag cttgatatcc 5340
ttacatggct gtttcaaaac aactcaaata tattatctct caaaatcaaa ctcatgatgt 5400
ccccacacca tcctagcttt ccaccaacaa tacctatccc tattaatagc aataccattt 5460
attcagttat ccaaatcaaa aacctagaat tcatccttaa aattctacta tcattccaaa 5520
tatcctatcc atcagcagcc actgtattct taatcccctg tatttccttc aaatccattc 5580
acctctctcc atatccattg ctgcatgact atccaagcca tcgcctctac cctagggtac 5640
caaaatagca acaaacctaa tctgttcatt tgcattattt tttctccaaa actgattatc 5700
tatatgtagc aagacagatt gttctcaaat tgcaaatccc actatattat cctcttgctt 5760
caaacacttc catggtttcc cattgtttat gataaaacca aatgcttcaa gttcgaagac 5820
cggcatgatt gggaatttcc tgtcacccta gcctacttgc tctccatggt acagttgcac 5880
tggctttctt tcattcctta agtacaacct gtttcctccc acctcaggac tgtgcatgtg 5940
ccattcattc tgctgaggag cctttttcct tccacttcaa tcagctaagt ctgattcttc 6000
ctgacaatct cagctcaata agcatttcct ctaagaaatg tctctaatat cattaattgg 6060
ctcaggtccc tctactgtat tgctgcactt ttcacagtta taattttact taattatgaa 6120
tgattatttg attaggtcta tttccatcca ttagacataa gcttcatgat ggccagatta 6180
ctgttttcta tccatcgttg tattccaata cctgacagaa ggagggcggg aggtggtggc 6240
acacaagaga tgctcaaaaa caattgttga ataagtaaat gaatgaggcc atttagaaat 6300
aacgaaagta cctgtttaca aagtacatgt atcaaaacta tgaatgcatt ctacttacat 6360
ggttttctcc aaataaaaca aaagacttca atcaggatta atacctggga taaactgagt 6420
cattaaatct ctcctttgcc atcaggagtg acattgaaac aaatgtctgc aaacaacaaa 6480
tacttttttc ccaaaatata ttgaatggca tttccataaa caaactagaa catgggagga 6540
gaaagaaagc aatattaatt taaaattaat cttatcacat aacttatacc atcagggatt 6600
tcgggtaaaa ttcctttcag gcacatccat ttaacaagaa ttgattgtta ctgaaagcct 6660
agaagagaat ttggcacata cttggtgttc aaatatttgt tgactgagtg aataaatgat 6720
gcaagtgtct aagaaacaca aaataaggac atgattacag tcacggtgga gttcacagtc 6780
atctccaaaa tgaggatatg catcccaggg aggaccaaca attcattgga gtgctgaaat 6840
aaaatactca aaggtcattt tacatgtatt ttttctctaa attacttttc ttaagacaca 6900
gaaaacaaaa aaagaaactt agctttgtta ctttctaaca aatagttaaa tcattaaaca 6960
ggattgacac tagcatcctt gtttggtctt atgccttagg ggaacatgaa atgtgtgaag 7020
acattctgag atctgaggga agggtagaca gtaatacagt gggactgacc aggcttcagc 7080
acacctttac ctcctctcag cagatttcag tgatgagcag tttacaacta gattgaaaga 7140
ttatattatc tagttctaaa agaaaactaa gcctcccaaa agcaacaagg gaactgagag 7200
gaatcctgca aaacaaaaac aaattttaaa acttgcactt tgtaataacc ctaatatgta 7260
atcacagtaa tgaacagtaa gataatgaca gaactgacat atttccttat ctattaaagc 7320
catattaaca ggtaaagcaa tgccagtcag tggtacactt cttagaagat atttaataca 7380
tactagacac atacacacac acaacatttt ccttcaaggt gtatgtatca gaaaatcact 7440
ttttaaggcc ggatgcagtg gctcaggcct gtaatcccag cactttggga ggccgacgtg 7500
ggcggatcat ctgaggtcag gagttcaaga ccagcctgcc caacatggcg aaaccccatc 7560
tctacaaaaa tacaaaaatt agccagggat gatggtggat gcttgtagtc ccagctactc 7620
aagaggcaga ggcaggagaa tcacttgaac ctgggaggca gaggttgcag tgagccaaga 7680
tcacccattg cactccagcc tgggcaacag agtgagactc tgtctcaaaa aaaaaaaaat 7740
cactttttag ataaaattca tgctatagag agaagactat gaaaatatgt ttagcaatgt 7800
gtccatcatt aggtgattga gtttcctttt gttttgtttt actgaaaatc atataaagta 7860
tgttatctgt aaaagttctc tgacatgcac acataaaaat ttgggagaaa agattaacta 7920
taatgtttaa tagattttgt acacatttct ttaaaaatat ataaaacaca acacctttca 7980
attggtttgc aagaataacc aattgacatc atggaaaatg gaaattcact tgctgaattt 8040
taacaaaaat ttgcatgatg agtgagactg acaacttagt gtcatgattt aatgaattat 8100
gccaatggta aacttcatgc acatggggcc aggtaattat gtggaaactt tttcaatgct 8160
taaagccaag tattgaaatt aaacttagaa tcagaccttt gaaccatttt atgacaatgt 8220
tcaaaaatta taaattctat ccacttatat tataatatta aaaatatcat tacaaaaaaa 8280
acctgtgttt attttataac tcagcctttt taatttctaa tttcataaat atattataat 8340
ggatattgtt agtaatgtag tattattaca tgtatataat ttataagtaa atatacatgt 8400
tttggctact catgcataaa atgtttcacc cataggagca cataatcaga aatgtctgga 8460
gaccattata gtaatagata gatcatattg ccacatattt tatctcctcc ttgacaactg 8520
agctttccag atcttctggt gaaacgaaag agaaagttgt aacagaagag tgattaaaat 8580
gacaaaagca ttacttctat tacttctatt ctaataatat gagcaaagct ataactatca 8640
agtaataatg cactaaagaa ggtgattaat ctgatatatt cacaggcaac taataagacc 8700
tttctattgc agccatgaaa aatatgtgac aattatagat atcctgtgtg cagtgtttca 8760
acctttatgt gacctgttct actaacagat ttagtgatgt tcactttgtt agaattttct 8820
tacacatgcc ataacttgct tcagtctttt gattatgaat attatggata ttaaggattc 8880
tagactattc tagatttaaa aaataatatt gtcacctcaa tcagaaggga aatattaaat 8940
agttctcatt ttttcaatgt ttactcagtt tttgtccaat gtaatgaaag tgtcagcagt 9000
acaggttaca aaataaaatg tgtattaaag taaactcatt tgaacaggtt aataattgta 9060
gagggaggga aaaggctaaa agattgaatg taaaacttat gaaaagtaga tacatcgtct 9120
ctatgatttg cagtagtcaa ctgcatacag atgaatcatt ttaatacacg ttaactactt 9180
tccttttaca gatggagaaa ctgagaggaa gaaagtttat atggttcatt aaactttgtg 9240
atgcaagcta aactaacctg tctctgtatt ttccatctac tgcccttatc actatctcat 9300
tagaatactc ttcaagcatc tccttactga ttttcttacc aagcatttgt taagttctaa 9360
tgagagttgg tagtaacatt ttcacccact ctgtgaaata tgaaatctta ttcataggcc 9420
tcttctttta ttcttgtatt tgcatatcaa ccaattaatc aacttgcttt ctttatgttg 9480
cttattatct tagtccttac taaattgcct cttaatgttg tccacataac agaaatgtta 9540
aggtggatac ttaacatttt agtccagtct agccggtgcc agtgcaatgc caaatcatga 9600
attaaaatat aattacaaga accacttatc aaattttaac aattccttca gctttgtgac 9660
agttttttct acttcgatta aagtcaagta aaattaaagt taaatatttt tattaaaata 9720
tctcctttaa cattccatat taataaacat attaaagctc atgcttctaa gtagattact 9780
agaagttact ttatcgaatt acagcaatgg ttaattctag atcatagaat ttagaatgac 9840
tttttgcctt cttctttttt ttcctttttt ttaaacagag tcttgctctg ttgtccaggc 9900
tggagtgtac tggcgcgatc ttgactcact gcgacctctg ccctgcaggt tcaagtgatt 9960
ctcctgcccc agcctcttaa gtagttggga ttacaggtgc ctgccaccac acctggctaa 10020
tttttttttt gtatttttag gagagacagg gtttcaccat gttggccaga ctggtctcga 10080
actcctgacc tcaagtgatc cacttgcctc agcctcccaa agtgctggga ttacaggtgt 10140
gagccactgt gcctggcctg actttttgct ttcttcttaa tacttactag tatttcttga 10200
atttttaaaa aagaaacata aagtactttg ataaaaccaa cagtctcatt gttcttaaaa 10260
ttgttcaaag gttctctgga aaaaaaaaag aaaattatca tttggttaag aatcatgttg 10320
gtctgacatc aatcatccta taggagtgaa tattgaaaaa gtaagatata ttgtggtata 10380
atcgagattg cataaatttt accatttttg agaagaatct gctccaaatc ctggcttaat 10440
gtaatatcca gcatgctact taattttctt gtcttcacct tttcatatcc acatccacct 10500
aggtgccacc tcacagtata agccagcata atccattctt ctcaatgaaa ccacaataca 10560
tctgaccctg catctcagga gaactgtatc agccacagca cttccagttg actatgaatc 10620
tgaatgttat gcctcaggag aaacatcctt gctgggactg agtagtgatt caaggagata 10680
gttatgattc agtcaagaaa ttaataatta gtgttatttt tattattgag acagagtctc 10740
gttctgtagc ccaggctgga gtacagtggc atgatctcgg ctcactgcaa cctctacctc 10800
cccggttcaa gtgattctcc tgcctcagcc tcccaaataa ctgggacagc aggcacttgc 10860
caccacgcct agctaatttt ttgtattttt agtagagacg gagtttcacc gtgttagcca 10920
ggatggtctc gatctcctga cctcaaggtc cacctgcctc agcctcccaa agtgctggga 10980
ttacaggcgt gagccactgc gcccggccat aaattattaa ctgagccagg cacagtggta 11040
cacacttata gtcccagata ctcaggagac tgaggttgga gtatcctttt ttatgttatt 11100
ttatttttaa ttattatggg tacataatag gtgtacatac ccatggagta caagtcatgt 11160
tctgatacag acacataatg tttaataatc acatcagggt aattgggata tccatcacct 11220
caagcattta tctttctttg tgttaggaac attccacctc cactcttgga ataggcaccc 11280
tgttgtgcta ttaaatacga ggtcttattc atttcatcta actatatttt tctacccatt 11340
aaccatcacc tcttttcccc tcttccccac tacctttcct gtgaggctgc aggattctta 11400
agcacaacag ttagaggcca gcctggacaa catagtgaga ctcaatttct aaaaaataaa 11460
aaagaaatta ccaactaatg ctaaaaaaat agtctctgat gcttaggtat gaattagaaa 11520
tgaccaaaaa aaaaaaaaaa aaaaagactg ccctttgctt ccttctcccc ttctcttcaa 11580
gttttccatt gctactcatt ttagtctggt ttaatcaggt ttcatccatt aaaagcaatt 11640
gttgggatca cacattttga gttgtgtcag tggacttccc tcatgctggc atgattcctg 11700
ccccaagccc ttagtaaaag ccaccaagcc atataacata atctctcatt gagtaaaaca 11760
tctgatgtgt ttagaatgac ttctagcaaa aaaccagcct gtccagcatc atctctgtat 11820
aacagataaa ggaataggta ctgcatcaaa aggttataga acctgcccaa atcaatccca 11880
tgtgttttgc aatggaatta ggttgaacta aagtgaaaat tcagttttct actcctcatt 11940
aacatgtctc atgttgcaag gttgagagga aggagaagaa gaactgtatt tacagagaga 12000
ttccccctct ctttctttct acagattact aaaacattca aagaatcaaa tttaagaaat 12060
cagttcatca gagctcatgt tgccaaactg aggtgagtgg aactgtagaa aaaatattta 12120
agtatagata caatgtggca tacttgactt tttgtcacag aatgaatagt aaatgacatg 12180
ttcagataag ttgttgtaat attatgaaaa tagtatttta gtcagcttaa aaaccaatgc 12240
caaaaaagcc aaacatatga tctatttagc tactaatgta aataaccata ttatatctat 12300
tcttattggg aagaggaaga aggggtggag agagagttgg ggtgaaggta cagtaacaag 12360
gccatcctat tgtaaaactc cagtggatat cattcacagt gcagcctatg taaacagtcc 12420
ctcctggagt tgtacaatgc tgtggtttgg gtgtatccat ccaagatcaa gacactatga 12480
ccaacatcaa aagtggcttt ttggttttat ctgcctgatg tgctataata aaagggtatt 12540
atggccaaat ccaaggcatg tctatcatga attaataata ggaggagtag cagcatgcat 12600
gctagttatt tgccattcct gccttagtta aatatgatgt gataaaacca gcctttccaa 12660
ctgaaatagt cacctttact gactctcccg caaatgtctc aaatgaccac attgctctag 12720
tctttaaata atatgcaata gttctttggt agaagaggaa ttatactaat tctttctcaa 12780
atactagcat cacaagaaaa ttaattcttg ttctctggag agtcacctag taagtatctg 12840
gagcacagat gtctggtcag gtaagttttg atgaggagtt aaagggataa gaagagtcca 12900
tgagaagggt attttccaaa acacctttcg gtcaattcag tgcacattca cttagtactt 12960
tcttgtcagt atctgtatca gccactaatg ttcaaaagtg agtaagccct gaaaacctgt 13020
aggactacat gagccttctg ccttttctct ccttttgttc acttcccact tatcactcaa 13080
tcctctgcaa cctggcttca ataccaccat aaaatatcaa ctgctcttgc cgattcaaca 13140
atgacatcca gataacaaaa tccaaagaaa ccacatcagt cctattcttg gacctttcaa 13200
cagtatttgg tcctgttggc ctgtcactcc ttgaaatagg actatccctt ggtttgcatg 13260
gccttgtata ccctgatttt ccccttacct ccctagctat tccttcttag tttcctttac 13320
taggtcttac ttctttgtat attccttaaa tgttgctgaa catcaggctg tgctctaggc 13380
ctctcatctt ctcaggtcac actctctcct ttccttggcc ttcactgcca cccatatgct 13440
gagtgctctc aaagttgtat ctctaggcca gtcctctttt gcctccaaac atgaatatat 13500
gcagccatct acttggtacc atcacatgga taattctcat gatctcttcc agtatgactg 13560
cttctttatt tttttctggg ctctttttta gcattgcttt acatggaact ttatcatgtc 13620
tctcaacctc tattttatct tttatctatg tatgtagagt ctgtgtaatt tcttcatctc 13680
ttttagataa ctaatatctc ttcagctttg acttgtattc tgtgtaaccc atttattgcg 13740
ttttcaattt caatgagtat gttttcctat ctgcaagttc tatttgtttc ttttgagaat 13800
cttcctggtc ttttaaacac atttcttatt ttaatttttg ggggtaccta gtagttgtat 13860
gtatttttgg agtacatgag atgttttgat acaagcaaac aatgcataat aatcacattg 13920
tgtaaaatgg ggtatccatc ccctcaagca tttatccttt gtgttacaaa caatccaatt 13980
atattctttt agttattttt aaatgtacaa ttaaattatt attgaccata gtgactctgt 14040
tgtgctatca gatactaggt gatcttttaa aaataatgtt ttctacttaa tctcattttt 14100
atgattccct cttttacgtc atttgtcatt tcaaatacag tcacttgtct gttgattcta 14160
ttatgtgaag tttttgagga taatcttttt gttactttga ttccaccttg gtatggtttg 14220
gctgtgcccc cactaaaatc tcatcttgaa ctctggttcc cataataccc acatgttgtg 14280
ggagggacct tgtgggaggt gattagatta tagggacgtt tccccccttt gctctgttct 14340
ttttcctgcc accatgtaag aaagatgtgt ttgcttcccc ttctgccatg attgtaaatt 14400
tcctgaggcc tccgcagcca tgcaggacct cttttctttg taaattaccc agtctccggc 14460
ggttctttat agctccgtga gaaaaaacta atacacacct catgatgtat tgtttaccac 14520
tgaaattgta tgcttaaatt taatctcact tgggaccctg tacaacctag acttaacata 14580
tctacctcca gagcagttac atctgtcaga cattctagag gaatcagcag cacatggact 14640
ttgttgttgt taatttgttg tcgggggagg ggggagggat agcattagga gatacaccta 14700
atgctaaatg acgagttaat gggtgcagca caccaacatg gcacatgtat acatatgtaa 14760
caaacctgca cgttgtgcac atatacccta aaacttaaag tataataata ataaaattaa 14820
aaaaaaaaag gttctgggag tattcaggta gtattaatga agattcagac atcgtgcagc 14880
caggcccatg cttatgaatt ttcaggtgat acttcttttt cttttttctt aatttaaagc 14940
tggatctcgg aaacagataa atttattttt ttatgacatg acgagcattt ttttcattct 15000
agttcatgct gttattgggt gtttagttct ttgagactcc tggccttttt ctaaaacctc 15060
aagttcaact tcctattttg cactggccca aggtcccatc tccagtctct atgtaaatgc 15120
taaacataag cctgtggaat attctagtct caccacatac tattcacatt cttctttgtt 15180
tttggtcttc caggattttc cttacttttc tatgaaccca gtcttgcatt tgaaatggaa 15240
tttattatat attatctatc ctttctattt gttttatgca gaaagtgttt tctaaaatta 15300
tttaggcttc catattgcta gacatggaag ttgtaattat ttgttcagtg cctgtttcta 15360
catctaaact gcaagaccca tatggcaact gtgaatctta gtcccagcta atttctgaag 15420
cttagaatag tgcctagcac aagaagttgt ttatctaaca tttttaaaaa taaatattaa 15480
attcatatct ggaatgaata ttaagttaga gctggtcatt gaggtgagag gaggaagcca 15540
agagagaata tgagagcctc aaagccaaat atctttaatg tactttttca gaaaagaaga 15600
cagccaatgt caggtggagg aactggttta tgaggtaact ttcctggaag aaaatagaaa 15660
ttactgaggt tttagataat ccaaatattt aatcaagtca ccaaggttta ttgtggggaa 15720
tctttattat taattaaaat gagtgatgaa atcttaatat acgacaaaag ttaaaatttg 15780
cttttgcagg cagatgaatg gtctaggtat caaaaaatta agttgagtct ctaactcaca 15840
caaatttaca accctatcac tttatgaatt tgtttaggag attattttta ataacactgg 15900
tgaagtctaa gaatagctaa aatttatagt acacttattg tgtgctattg actcttcttt 15960
gaagttttgc atatagtgat tcatctaatc ttcataaccc attttacatg tgaagaaact 16020
tagatataga aagattaaga aacttacata acttatccaa agttacacag taaaactctg 16080
gcattataac ttcaaaatca gctatcctac agtgagtaca gtgttctgtg cattgaaatc 16140
aaataagtga gatagcatcg tgatatagta ttacgtatgc aaacactgtt acagagatct 16200
gtctaaagtt aaattccaca aatgaattct ttaaaagggt ttaatcaaga agaatatata 16260
aacaggatgg tgaaaaattg tcatattatt tgttttttaa aatatcttta tgatttacag 16320
gcaagatggt agtggtgtga gagcggatgt tgtcatgaaa tttcaattca ctagaaataa 16380
caatggagca tcaatgaaaa gcagaattga gtctgtttta cgacaaatgc tgaataactc 16440
tggaaacctg gaaataaacc cttcaactga gataacatgt aagtataatt tttcataaac 16500
aattttattt caatatatcc ctcaagttta ccaattcaaa ttcatatttt aattgagagg 16560
ctgacttttc tttctttgaa actaaactgt gaaaacaatc cattaaaaag ctaaatatac 16620
catatagctc cctaacgtaa atcattctaa gacttaaaga atcatttggc atttatatag 16680
taaattttat ttgctaaaaa ttctcattaa ttatccctgc aacattcctt atgagtgatg 16740
ttactgtcag atgtcattag tggataggcc ataggagggg tacatagatg ctcaaggtca 16800
gagaactatt taattaatga tccacctcag aggcttcttc atttttcttt gtaacattta 16860
tcacaattga aattacaaag ttatctgtgt aaattttgta ttgtttggct tcatcctaca 16920
ctgtaatcat cctaaaagaa agaaccagtc aaccttcttc atcctactac cctcctacca 16980
cccagtctcc atcatataac acatattcaa taaataattc ttgcatgact gaaagaaaag 17040
aaataatata tgcatagaat ttaaggacat tcctccaagt tggttacatt ctgctagttt 17100
aataagccat tatttcttct cgatgagctc aagattaaaa ggattttgat gattcccata 17160
ctagactggt aggtaccagt tacagatgta ctaactgtta aatattgaaa tgctttccta 17220
tttgttggta aacaattact gcatcaggcc cacaaagttg tcttccgaga tgtttcaaat 17280
ccactgcccc tgctgctaaa gagttatgct tagcaaagca aagcactcta agacactgct 17340
ccaactccat ggcctgattg catcttttat gactggccaa tgctcacgca ctgcagtttg 17400
ttaggtagtt gaatattacc tctgcttcca cacattaagg aatgctcccg aacgcacttc 17460
ccaagtgttt atttatttat cattatacta gacaatatgg tgatacgatg gtcacagaat 17520
agcggtttcc acctccagag cccataatct agttgaaggg aaagatattc caacacaaga 17580
gtgttgacaa tcaagataga atatgatcaa gggcccagtg tgaggcccag gcaatgatca 17640
ctgcaggaat ctggggaaga aagagaccag cgtgcttggg atatctagca aaagtttcat 17700
gaaggagaat ggactttgac tttgaaatat gggtaggatt tacatatttt gagatgagaa 17760
aaagaaagtt cccagagaag gaaagcatga aaaggcaaac agtctgtact gaacgcgatg 17820
ctttgacaga ataatgaaga aagggacctg ctggaatgat tgatcagtgt tcatcattca 17880
caccatcatc atcaaaacac ttatttaatg agaacttact gttttttagg catggcttta 17940
atgccctata tgaatttttt tcttgattaa tccttacaac aaacatatcc catagatagt 18000
tttattgtcc cccttagaaa agataaattg cctaggctga cacagtcagt atatgaggca 18060
gtcaggattc aaactaagtc tgtttgttca aaaaattaag aatggccagc tttttaaaat 18120
tttctgtctc cagaagtatg atttggctcc actgaagttt gcaaaacaaa tgtgataccc 18180
aaaccttgtg aaacttttag tgggaaataa ctttgcataa gtcggtttga gagagcgtgg 18240
aaacctgtct tgaaaagttt taatttaact tgcaggaaat aaaaatgatg ggtttctcaa 18300
ttaaaaattt caatcaagga aggatatgag ctaacataac atttttttaa aaagatcagt 18360
ctggtaaggt agaggtgcat aaactgaaaa ggagcaaaag tggtggaatt cagttagaaa 18420
attattgtaa ctgtactgat gtcaaatgat gaaaccatga actaaagtag taccaaaagg 18480
agtgaggagg atggaataat tcaaaagata gaggacagat gtgcagaacc tggagattat 18540
aagatgtgaa aggaggagtt tgagaaaatt tcagattttg gaagtggtgt cattttacta 18600
aaaggatata ataagtagca aattttggat aaagttgggt cccactgagt ttgagatggc 18660
tgttggacat gcagagaaaa ctgtcttgta tgctgttctt aaattgaaat agacagacct 18720
ttaccctctg atactgacat attttccttt ccaggctcac cctccatttc cctaaacaca 18780
acacatgcac tagctctcct tactttattg ctccacaaac atcttacacc tccaagcatt 18840
tgtgcccact gtaccttcta tctggaatct cttttgtcct cttgtgtgcc tgaaaaattc 18900
ctttcagatc ttcaaaatac agtgcagatg ctatttcttc tagctcaaat attatctcct 18960
ccatataatt taattactct cttttttctt ttctctactt tgcacttaca tttatttgaa 19020
tgattgcttg attaatttct acctgtaaat tatgtgaggg caggtcctct atattttgct 19080
cgcagttaaa tctgcagcac ttattataga gtggtatcat tagagtaata tacatatatt 19140
tgaggacatg ataaattaac ttcccctata gtatttatca cattgcatct caatgacttg 19200
cttatgtttc tgttttccca tataaattga gtaacttgaa aaaagagata tctattaagt 19260
atttaatgag aaattaaagt acaaacttta gtatgcataa caacaaattg ggaaaaggtt 19320
gtaaacaaag agatttgtag ggcccatgag ttagagatcg tttcagcagg tctgaaagga 19380
agcctaggaa tctgcatttt agaggaccac ctcccaaccc caacaagtaa ttctgcttct 19440
tgttgtctgg gtactgtact ttaagaaatt atggtgaaat gatatcagcc tttattgtat 19500
ttatcttatt ctcatttttt aatactagca cttactgacc aggctgcagc aaattggctt 19560
attaatggta agttttaata ttattttgta actgtaattt gccaaatcat aaagagtaaa 19620
agtgcaagtc ttttgtgtac ttttggccaa ggcagtatct atcaagttga tgtctttgtt 19680
cttagttcgc tcaggtggtg ttgaaacaag acagtgctga tcccaagtgt cccatggagt 19740
ggactttagg tttccccttt ccttttagaa aaaggaagaa gttgtagtgg aggactaccc 19800
actctgcact caaaattgcc ctcatgaaaa tttctttggc agctttgaga accttttact 19860
gccctggttc taaggtggca tttctgtaga cttacaaatt atgtttgatg acaccgttta 19920
tgtagcttct cctaaccacc agagtagctt gctttgttgt gaattcaggt taatcacaaa 19980
gtataataaa aaagaattgt cagaagtctt cccagctttg ggtctataac ctgaaggaaa 20040
agtcactact cttcaacatc atcctatgta ctctcaggct aggatagcag aaatgcaatc 20100
cctagaaaac agcaacttac ttctctgacc aaaaaaatgc agttaaaaat tagttcaatg 20160
tacctggtag ctggcctatc ttaggtactt cagtgatttt acaaagtgat ggtagtccta 20220
tgggtgtttt tcagcttcac tacgtattta attcatgctt attgttaatg aaactgtgat 20280
aagcaattta ctagggtatt tgtttgggag atgccacaaa ggaacacatg tatctcttaa 20340
tggaagcctg gtcctccttt atccaggaaa tttgctagga aaaaaaagcc tttaggtggt 20400
tgtgctatta aaccagggca ctacttaaaa gccagcccag caatagttgt gtgatttacc 20460
attaatttct tagtaataga ccacacaaaa gaagaaaatt atgggaatgc gagttgagag 20520
gaattgggtg atcagcctac cccagcccgt ttcagctctg gccagtagac tattcacgag 20580
ctctttgaaa acatttaaat aaaccttatt tagatactag aaaccctctg tcaccctcaa 20640
gaatattctg tggtatagcg actcctttat gagggcatgt ttggtaatac agcatcagtc 20700
ttggaggtgg actggattct acaaggtgaa ctgcagtcac taaggagtct tttggatgag 20760
accagttttc ctccaacttc aatgtgtgca tgaacctcac atcaaaatgt agctttagat 20820
ttgtcccatg atgtggttcc aagaatcagc acttctaata agtttccagg ggatgcccat 20880
gctgcaggcc cacaaaccac actgagcata gcaagactat tgagaaaaag gaaatttccc 20940
aggagtctgt ggcctgagct ggcacatcca ataatgacct atcttaacct caactcatga 21000
ggaattccag ggaactctga agctgctcaa aatttgaagc ctatatgcca actaaattca 21060
gaaatgttct ccaaaatgct atctataagc aacagtagtc acaaatgcat tgtagaaata 21120
tatcgatcat gctttttgga aaatccagca tgtcctgagg aagaatgtat aagacataaa 21180
agtcataaat tatggaaaga ctcttcagct tcttccaaat gtaaaggaat catgatcttc 21240
ccagcacatt aatgcccttt ctcattagaa tgtggggccg gtccagacct aataacattg 21300
tctgagcaga gaatccttgg aggcactgag gctgaggagg gaagctggcc gtggcaagtc 21360
agtctgcggc tcaataatgc ccaccactgt ggaggcagcc tgatcaataa catgtggatc 21420
ctgacagcag ctcactgctt cagaaggtga ggccaccact acctacccat ctgggaacaa 21480
ttagaataga caggtcatga agactgcacc ctctacccta ggattgaatt gagccagaaa 21540
taattcaatg caaaaaaatc agtaagaatt ttcttcctat tcatgaaagg aaaaggattt 21600
ttccccttta gcatgctaat ttagtgctat ttctctgttt caggtaataa tatattagca 21660
cagtaaagaa caaagattta tatgtcagaa tgttttttaa atcctagcta taaaagctta 21720
agaaatttac taaatctcca taagctttat tttttttcca aattaaggga caacactgtt 21780
atctgtgact tagtgttact ggtagcattg agtacactaa tgtaaacata cgttaaatgt 21840
tagcgaaacg aattgctgtg gaagatttgc acattatatc atgggagctg atggctaacc 21900
tagagactgc cccatgccat taatttattc attcataaag attattgagt atctagtatg 21960
agcacagtgt tatatattgt agaagctact agtataaaca aagtattgcc tctgccttca 22020
aagagcttac actcgaatgt tggaatcaga atgcacaaaa ataatgatca attacaatga 22080
gtagcataaa taaaattaat gtaggcaact tacaagaatt cttaattgag gtgactaaac 22140
tattgccaac actagggtga tatgctacca gtggcgagta ggttgcataa acttacctta 22200
ttggtaaaaa gaaaagttca cattgctcat aaaagaagga ttttagattt cagcataact 22260
aaaatctgtt tcaaacctgc cttgttactg gggcatcgca gaccacaaca gttgttggga 22320
acttaactca aaaagttcac ccagaaaaat aatggagatt tgaactcgtg tgcccctgac 22380
catatcaatt ttcttctcag actcttactc taaactggac ctccttatca cacacacaaa 22440
gccttccata ggcagatcaa tccagtctta tttctcaaag catgtacctt gagcttcaga 22500
taaacagcat tgttctcttc ccctggactc ttcctacatt tccctaccta tgagtatctg 22560
atcaatctgc ttatccttga aatgttaata tatttaccac atctctattt gaattttatg 22620
aaatttttga taatttctaa gtagtttttt cagatttata ggcactactt catggtacag 22680
tgactgttac aaacgtattt gttaaattta gaaggaataa agatttaaaa gactagggta 22740
gttactgaac taaagtttta ggaaatccca aattatttca aatttttctt atggtaattt 22800
tatgacttaa tatttttata tgcagtgaac aaatttgaaa ctttaaaaga tactcccaga 22860
attatcagtt ttctgatgta gattggcaaa tttattacta tatcccaaat aacccaagag 22920
acaaaattca caaaaacatt tcaattttca ttgccacttg aaaggccaaa aagcagaaat 22980
ggcacgcatt gatttcaatc gtactcttga gtgtgggaac caggaattaa aatacctgga 23040
cttatcaggc acttagcata accaagaacg gaatagaaac ctccctggat tctaagccct 23100
attcagtccc aatcaccaaa aaccaagtaa acgatatcac tataatgaaa gccacagtta 23160
taaatatcga caacgattac caaaggaatc catggaactt tgaattttgc caccccacat 23220
ccttctattc attaccatga ttgatccact aaagctaaca gactctgtga accttgtatt 23280
ggacccctcc ctaaagacct gattgtcact gagaaccatc agtgaggatt tgtttggggc 23340
atgaccagcc ttacatcaaa gtacatagaa gtgatgaggt cttatcaaag aggattattg 23400
aattatcacc tcttctatgt agctttccct gatactctct ttcctctcca ttgagttcca 23460
cagaaatttt tttatctgcc tttaacagtt gtcctcatga tttgtgatat ttgacttacc 23520
tcttgtcagt ttccttcact agtgtagagt tcctcaaaga aagagaccat aattacttat 23580
atttttattc ctggagactc atactattcc ttatacaaag tagacactta acaatggctt 23640
gttgaactat aattaatgaa aataatagct accttcatga aagttcactt tgtgccaaac 23700
actatagttg acataataca tttgtctcat taatacttaa caattgtgtg agaaggtatc 23760
accaatcaca ttttatatgt aaataaaccc cagagctatt aattaacttg tcataaataa 23820
cacttttcat atgtggcata gccaagattt aaatataaat gttactggtt ccaaaatgat 23880
gctctaattc acttgctgga aagaaggaaa ggaagaaaat aaacgagtgg aaggaagaga 23940
gggagggaag agagaaaagg aaggaaagaa aaaagagtct cttcagaacc ttcactgtaa 24000
agactccgag caaaagaagt tgaatataaa aacaacatag gtttgtttgt tttctaatat 24060
tttttcttca aaatttttaa ctcaggttca ctcttacaca aactactgtg tcttataaaa 24120
gtatttccgg tcatagaatt tttattttct gtattaactc cactatctaa tctccataaa 24180
actcctaaat tggtattatc ggtaacattt tgtttttact caacccttag gaacaatgtt 24240
aagttaatca gccctccaca tcacagatcc ttattttcat cagtctgtac aaggcatttc 24300
tctcatttta attttttttc ctcctgtcat ccctggattt cactttcact gccctccttc 24360
cacccatatg cctcatacta atatattcga aatatacatg tcttaaaggt acatgcacgc 24420
acctacaaaa cctatagtgt ttttttgtat gtatatgtct ttaatttaaa taagtagcat 24480
tgtgtaaaag tctaatattg tttcttactg ttttcactca attcttggaa ttttcatctg 24540
atgcactgct gcatagcacc ccatggtatg cagccaccat atttccttca tccaattagg 24600
ttgcatgacc taccttccca ttgccacaaa gagtacacac aaaatatttg tacttatctt 24660
tctgtaaacc ttcaggaatt tcagaagcac acatgcaggc tgctaaatat accagaatac 24720
tttccagcca cttaaatctt taccagtatt gcaaaagagg ccccatttcc ctccacatca 24780
acatttagta ttattctttt gtttaagttt tatcaatctt ttaaatgtac acaagatgct 24840
catttttata attttaattt ctcagattac tagtttgagt atcttttcat atatctaaga 24900
gctgttttga tctcccctac catgaactgc cactaatatt ctttgcctat tttacaatgg 24960
tttttctgct tatttattac tggtttacag acttttaaaa tatattctac aaaaatttta 25020
gacattaaac attaccaata ttttcccatg gttcctcatc catctggtaa acttgtctat 25080
ggtatatcta attttgattt aatagaattc attctatttt taccttttag tttgtgtttt 25140
tgttgtttag ccaaaaagtc cccattccta ggtcataaag gtaatgtcct tttttttttt 25200
ttaacgctac tgttctctct ctgtctcccc ctatgtatat aggtgcacat atacttgtac 25260
acacatacat atacctatat atgaggggag ttcgataagt ttatggaaaa taaaattaaa 25320
agataaaata aaaaattata aactttattt ctcaacataa gctccttcaa gttcaagaca 25380
cttttgtaag caataatacc agccatatcg tccatcccta aagaactgag ggtcctgaga 25440
atttaactat gtcaatgcag tcttttttac attacttttt tacagtactt attgatgaaa 25500
aatgggtgcc ttttaaagat tgttttaaga ttagggaaca aaaataagtc agaggaagtc 25560
aaatcaggac tgaaaggtgg atgcctagtg atttattgct gaaactttca taaaactaac 25620
cttatttgat gagaggaatg agcatgagca tggttgtgat ggagaagaac tctggtggag 25680
ctttcctgga cactttttct actaaagctt tggctaactt tcttactctc ataagaagaa 25740
gatgttattt ttcactgacc ctttagaagg tcaacaagca aaatgccttc agcatcccaa 25800
atgtctgttg tcatgacttt tgttcttgac tagtctggtt ttgctttgac tggaccactt 25860
ctacctcttt atagccattg ctttgatggt gctttgtctt caagattgta ttagtaaagc 25920
catatttcat cttctgttac aattcttcaa agaaatactt cagaatcttg atctgacatg 25980
tttaaaattt ctattggaag ctctgacctt gggtgcagct gatctgggcg aaacagtttt 26040
ggcatccatc aagtagaaag tttgctcaac tttagttttt cagtcagaat tgtataagct 26100
gaaccagttg agatgtctat ggtgttgtct attgtttctc acagttaatt gttggtcctc 26160
tttgagacat gaacaagatg aaatttttcc tagcaaactg atgtggatga tctgttgctg 26220
cgggcttcac cctcaacaac atctctttct ttcttgaaac aaattatcca ttagtaaact 26280
gatgattggg ggagatgctg tccccataaa ctttttgtaa ggcataaata atttcaccat 26340
tcttccagtt tcaccataaa tttgacgttt ttttgcttca attttagcag cattcatgtt 26400
gctttgataa gagctctttt caaattcatg tcttattcct cttagtgcct caaactagat 26460
cttgttcagt atgacaagtt agtatgagtt tatctgcatg caaaaatctt tgaaatccat 26520
gcatagtttg tttataatat acattttcaa tgaacttttg aagaccccat acatacatat 26580
gtatatatat gcacacacac acacacacac acaccaaaat cttcaaccat tatcagactt 26640
agtgcagaaa aattattcat ccattaacaa gataagaatg ccccttatca tcactactat 26700
ttaaatggag ctcctggcta aaggaaaaga cagggattga aaaaaattag ttaaatctaa 26760
aatgtttatt atttcaggtt tcttagttgc ttaaatggga agggaggtat ggacaaaaga 26820
gaaatcaaag atatttgtgt tatgctactt atcattaaag tatcagaata acttcattgg 26880
aatagaaaaa caccaagatc accccacgat atgttttcta aaatcttctc catttcttta 26940
gacaagtgac catgtattcg gccagtgaag aattaaactc acttgccagc ttataatgca 27000
ggaaaatata gcaaagagat gtggatccaa tagtttctag atagtggtac aggatggcta 27060
agatgaattt atatatctga aatgttcaca aattccctac tcatatagca tgttttcata 27120
atgttttagc aactctaatc ctcgtgactg gattgccacg tctggtattt ccacaacatt 27180
tcctaaacta agaatgagag taagaaatat tttaattcat aacaattata aatctgcaac 27240
tcatgaaaat gacattgcac ttgtgagact tgagaacagt gtcaccttta ccaaagatat 27300
ccatagtgtg tgtctcccag ctgctaccca gaatattcca cctggctcta ctgcttatgt 27360
aacaggatgg ggcgctcaag aatatgctgg taagtgtctc ggaaaaaaaa attaacaata 27420
gaaatgtctt atatttgcta ttaggtaatt ttttaaatta ggaaacatct ggaataggtg 27480
tttctattct tctacagaca gaaccattct atattctgct cagcccaagc tctggctacc 27540
cctgagtctc cttagcaaag caaagcaatg ctccagaaac tatgggaatt ctcaaatata 27600
gtaataggaa aatgtaaaag aaagttatga agacacgagt tctttaataa tccagagatt 27660
ctataagatt caaatagctt ccctataaac aataaaaaag attttgtttg tttgtttgtt 27720
tgcttgtttt ttagagacaa agactttctc agactggagt gcagtggtgc aatcatggct 27780
tactgcagcc tcaaactctg gtcttaagaa atcctcttgc ttcagcctcc caagtagcta 27840
gaattataaa taagtgtgta ccaccatacc cagctttttt tttttttttc tacagacagg 27900
ttcttgctct gttgcccagg ctggtctgga attcctgccc tcaagccatc ctcctgcctt 27960
gttggcctcc caaagcaatg ggaggattta gattagacat tgtatgaggg cttaataatc 28020
cttaaggtat taactgccct ttaaagtatt ctgggatatg gcaaaaactc gatgtgtata 28080
taaacattgg tcatatttgt ttattgaatg aataaaatgg aaactaaaat gaggacaatg 28140
cacaagagct actagaacca gtaagagtat cagcgaagga gtggaagggt agcattgaca 28200
atttccctgg gcttttaccc atgttgtaga ttgtctctcc aaggaataat acaaagcctt 28260
aatagtccta gaacacattc tattgtgttc ttatggccca aagtaaattg gtgtagtaga 28320
taacatttgc accagtcatg aaaaactatt ggtgtcattc tgagagtaca tcaatataaa 28380
atagactagt tctttagcct tgaaactaga ctggtttctc ttttgctgct aggttaaagg 28440
ttattcaata tgtaatcttc caatccaaaa tctgtcagtg gataatttaa aagcttttag 28500
tcaattttaa gatatttgtt ttcttaaaat tttaaggggc actgtgtcac aaagctaaag 28560
aaaaaaaaga aaaaaaaact gatctgtgaa aggggttatc ctcatctact tggggaattt 28620
tggctgcgaa gaaactccaa agtaaatctt tagaagcctt cattgttaaa tatgaaataa 28680
tgtttggagt acatttattt cttctcaaat ttattatagg gtcaataatg tacacatctt 28740
gaagtccatt tttttcctgc ttttataaca aacaggccac acagttccag agctaaggca 28800
aggacaggtc agaataataa gtaatgatgt atgtaatgca ccacatagtt ataatggagc 28860
catcttgtct ggaatgctgt gtgctggagt acctcaaggt ggagtggacg catgtcaggt 28920
aagctcaaga caatctcatc catgtcatca tccaagaagt gtataagcac ttcctagtat 28980
gtgataatgt gatagacata agtgtaacag ttacaataca cagccctgtt cctctaaaat 29040
ttataatcta gattttagaa ataaattttt ttatgaatga agtttatcta tcatgaaagc 29100
attaactctg agaggccaaa ttacagagta gttaaccatc caaagctcaa gaatcagaaa 29160
gacctcgatt tgaattcctt aacctctatt accaagtctc taactaaaag ctggggataa 29220
tcataatagc acctaacttt ttgggtacta agaaaagtta aatgaagact aaatatatca 29280
ggcacatggt aaacaacaaa gaaatctcat ctatttcact attattaatg tagaccatgg 29340
tcactcgtgt taataacttt aacctcaacc ttttaactgc tgtgaaggat taaataaaaa 29400
attaatcact atattataaa aattaattga tatataataa atgaatttta agagatacgt 29460
aataattcat ggactccttg aagatagaaa atttatacaa aatcctagta atttgagtca 29520
caaaagctcc tacaataatg aaacagtatg aatgaaaaag aaaagaaata actattatat 29580
ttggatctag cccataattt ttaaccaaat gcacaaaaac aaacaacaaa tatgaaattc 29640
tcactgtaaa gtgattaaaa tcaaatttga attctaaaat tttaaattaa attatctaaa 29700
cataattgat gcagttatat gttttaatag gttttgttca catatctgaa atccaactcc 29760
acacagtagc aggaacagct ggtgtcagaa attaaatatt cttttagtct ggagttttaa 29820
aaaatcaatc tgtttacttg agtaatttgt tgctgttttc atgggtgaat tgtatacaga 29880
aggataagaa ttattcttcg catcaaaagg tcactgactt tcatatttag tgctcatggt 29940
ctttaaaaag tggataaaaa gtagttctca catttcatgg aaagccccca atccatgagc 30000
acatttccca aaatgaaaca tttttatcaa ctgcaagttg tgtgtaggtg gagatttgtt 30060
tttcaattgt caagatactg ttaattaccc agtcctttat ctccttttgg tggagatgtc 30120
tctgtgctag gaaacccttc ttgctctcct tcctgtttct cttttactac tggccctgaa 30180
acaacaaatt ctcaagtttc atgacagctt tccaaagaat ccatcaatca aataagcaac 30240
acaactcgac actgacaatt ccagacctac taagagcatt aattaagact taaaaataaa 30300
catgagtttt aaaagggtgt tattcattat tttcccattt ataacgtccc ttaccttctg 30360
tccttcagtg catacaaatt attatcttcc ttgaagccca gttcaagccg tacctcacca 30420
tgataccttc catgtatatt ccactctagg cctcactgat ttttaactga aatactataa 30480
tgcatagttc acacttaaaa aaaaaaaaaa aacacagcac tttacataag agcttacagg 30540
atcctatttg ttttatccat tcttttgttc atttttacaa tcattaattc aaaggaatta 30600
tattaattac tttctatgca cccgacgttg tgttaacaca acaatactat ccctgcattc 30660
agcaagtcta tggtctacaa gagaggacac aaattcaaat gtctgtagtc aagcagtgaa 30720
gctggctaga tatggaaaaa ttacaagtcc ctcttgcttt aacatttgct tgcccacatt 30780
tggtcagaca tcatgcaaaa taatttctca ctatagaaaa aaaaacacta caaaaacaat 30840
aatataaaga actgagaact ggttaactga agcatgcata tgtcatctaa aagaagcagg 30900
tgacgaccag cttcatgaag tacttgccat gcatattggc acttcacaca ctgacccttc 30960
tccccaccta gaccagtaat taaacaggta tggatgagct agctactaag agcagccaac 31020
tgaatagctg actaacttag aagcacactt ggtaataata gctgactttt attagtactg 31080
actatactat atgctaagct gtactcaaag tgctttgagt tttaaactga tacaaacatt 31140
atatgaggaa acagaggtac agagagctat tcaccagctt accaaaggtc acatagctgg 31200
taagtggagg acttaaaccc agactatcta gtttcagaac ccacagactt aatccatcgt 31260
gcagaacata agacatactc catctgtctc cccaactagg ttattatgtg cacaaatatt 31320
tattggttgg ttggttcatt attatgactg ggtggtaagt atgtcattag gagtgttttg 31380
cttatgacta tataaatttc ttcaccaaaa gaagactttc tgatgatata ctatgcatca 31440
gacaccacgc agggtgctaa ggttaggaag ataagtgaga cttctagaaa ctcattcatt 31500
caacaaatat ctcctaaggg ctagaagctt aggtttcagc agtgaacaga ataggtatgt 31560
tctctttcgt gttggacctt atagtatatc tgggaaaaca gacattgaat aaatatcaca 31620
aatgcaagtg agtgtttcag agacatgcag ctgctacatc aaaacaaaac agaacaaaac 31680
aaacaaacaa aaactgacca gtgggattaa gtgtaaatag gcacacaaat gcacaaatat 31740
gcttttataa aatagtgaag cagtgacaga gacacacaca agatataaag acacaatgaa 31800
gaacaattga gcccaaagct ggaaagggtg agagtgtgaa ggaaaaaggt tgatcagaga 31860
agttttcccg aaggagagaa agcctggatg attaggaggc aaccactcgg tgactgaggg 31920
aaatctgaaa aatgtatttg tcatcttctc agacttgctg aaggaatgac ttgggtactt 31980
tgaggatttc agtaattttt ccatgacttg gtataatatt tcaaaaggaa ataggctgac 32040
tttatttgta taatgaatgt gactccttcc tcgactgcca tagaaataaa ctccttaata 32100
ttttgggttt gtctttgcac ttaagtaatc agtcattctg tttttttaca gggtgactct 32160
ggtggcccac tagtacaaga agactcacgg cggctttggt ttattgtggg gatagtaagc 32220
tggggagatc agtgtggcct gccggataag ccaggagtgt atactcgagt gacagcctac 32280
cttgactgga ttaggcaaca aactgggatc tagtgcaaca agtgcatccc tgttgcaaag 32340
tctgtatgca ggtgtgcctg tcttaaattc caaagcttta catttcaact gaaaaagaaa 32400
ctagaaatgt cctaatttaa catcttgtta cataaatatg gtttaacaaa cactgtttaa 32460
cctttcttta ttattaaagg ttttctattt tctccagaga actatatgaa tgttgcatag 32520
tactgtggct gtgtaacaga agaaacacac taaactaatt acaaagttaa caatttcatt 32580
acagttgtgc taaatgcccg tagtgagaag aacaggaacc ttgagcatgt atagtagagg 32640
aacctgcaca ggtctgatgg gtcagagggg tcttctctgg gtttcactga ggatgagaag 32700
taagcaaact gtggaaacat gcaaaggaaa aagtgataga ataatattca agacaaaaag 32760
aacagtatga ggcaagagaa ataatatgta tttaaaattt ttggttactc aatatcttat 32820
acttagtatg agtcctaaaa ttaaaaatgt gaaactgttg tactatacgt ataacctaac 32880
cttaattatt ctgtaagaac atgcttccat aggaaatagt ggataatttt cagctattta 32940
aggcaaaagc taaaatagtt cactcctcaa ctgagaccca aagaattata gatatttttc 33000
atgatgaccc atgaaaaata tcactcatct acataaagga gagactatat ctattttata 33060
gagaagctaa gaaatatacc tacacaaact tgtcaggtgc tttacaacta catagtactt 33120
tttaacaaca aaataataat tttaagaatg aaaaatttaa tcatcgggaa gaacgtccca 33180
ctacagactt cctatcactg gcagttatat ttttgagcgt aaaagggtcg tcaaacgcta 33240
aatctaagta acgaattgaa agtttaaaga gggggaagag ttggtttgca aaggaaaagt 33300
ttaaatagct taatatcaat agaatgatcc tgaagacaga aaaaactttg tcactcttcc 33360
tctctcattt tctttctctc tctctcccct tctcatacac atgcctcccc caccaaagaa 33420
tataatgtaa attaaatcca ctaaaatgta atggcatgaa aatctctgta gtctgaatca 33480
ctaatattcc tgagttttta tgagctccta gtacagctaa agtttgccta tgcatgatca 33540
tctatgcgtc agagcttcct ccttctacaa gctaactccc tgcatctggg catcaggact 33600
gctccataca tttgctgaaa acttcttgta tttcctgatg taaaattgtg caaacaccta 33660
caataaagcc atctactttt agggaaaggg agttgaaaat gcaaccaact cttggcgaac 33720
tgtacaaaca aatctttgct atactttatt tcaaataaat tctttttaaa ataatttccc 33780
tgcctaatta tttatggaag ttatgacttt tgaaggacaa ttcaaaacca tttatttaat 33840
tggttctgca atgaaagaac tgccccatat actctactaa aggcttggca ctttctgctg 33900
ccttttaatc cagcgctata attgaggcaa gcgtccagct tgacacctcg agataacttc 33960
gtataatgta tgctatacga agttatgcta gtaactataa cggtcctaag gtagcgagct 34020
agctgcaacc gaggaaaaaa cgtgccatga ggtctctgta tccaagtgtg act 34073
<210> 21
<211> 418
<212> PRT
<213> 人工序列
<220>
<223> 重组蛋白质
<400> 21
Met Tyr Arg Pro Arg Pro Met Leu Ser Pro Ser Arg Phe Phe Thr Pro
1 5 10 15
Phe Ala Val Ala Phe Val Val Ile Ile Thr Val Gly Leu Leu Ala Met
20 25 30
Met Ala Gly Leu Leu Ile His Phe Leu Ala Phe Asp Gln Lys Ser Tyr
35 40 45
Phe Tyr Arg Ser Ser Phe Gln Leu Leu Asn Val Glu Tyr Asn Ser Gln
50 55 60
Leu Asn Ser Pro Ala Thr Gln Glu Tyr Arg Thr Leu Ser Gly Arg Ile
65 70 75 80
Glu Ser Leu Ile Thr Lys Thr Phe Lys Glu Ser Asn Leu Arg Asn Gln
85 90 95
Phe Ile Arg Ala His Val Ala Lys Leu Arg Gln Asp Gly Ser Gly Val
100 105 110
Arg Ala Asp Val Val Met Lys Phe Gln Phe Thr Arg Asn Asn Asn Gly
115 120 125
Ala Ser Met Lys Ser Arg Ile Glu Ser Val Leu Arg Gln Met Leu Asn
130 135 140
Asn Ser Gly Asn Leu Glu Ile Asn Pro Ser Thr Glu Ile Thr Ser Leu
145 150 155 160
Thr Asp Gln Ala Ala Ala Asn Trp Leu Ile Asn Glu Cys Gly Ala Gly
165 170 175
Pro Asp Leu Ile Thr Leu Ser Glu Gln Arg Ile Leu Gly Gly Thr Glu
180 185 190
Ala Glu Glu Gly Ser Trp Pro Trp Gln Val Ser Leu Arg Leu Asn Asn
195 200 205
Ala His His Cys Gly Gly Ser Leu Ile Asn Asn Met Trp Ile Leu Thr
210 215 220
Ala Ala His Cys Phe Arg Ser Asn Ser Asn Pro Arg Asp Trp Ile Ala
225 230 235 240
Thr Ser Gly Ile Ser Thr Thr Phe Pro Lys Leu Arg Met Arg Val Arg
245 250 255
Asn Ile Leu Ile His Asn Asn Tyr Lys Ser Ala Thr His Glu Asn Asp
260 265 270
Ile Ala Leu Val Arg Leu Glu Asn Ser Val Thr Phe Thr Lys Asp Ile
275 280 285
His Ser Val Cys Leu Pro Ala Ala Thr Gln Asn Ile Pro Pro Gly Ser
290 295 300
Thr Ala Tyr Val Thr Gly Trp Gly Ala Gln Glu Tyr Ala Gly His Thr
305 310 315 320
Val Pro Glu Leu Arg Gln Gly Gln Val Arg Ile Ile Ser Asn Asp Val
325 330 335
Cys Asn Ala Pro His Ser Tyr Asn Gly Ala Ile Leu Ser Gly Met Leu
340 345 350
Cys Ala Gly Val Pro Gln Gly Gly Val Asp Ala Cys Gln Gly Asp Ser
355 360 365
Gly Gly Pro Leu Val Gln Glu Asp Ser Arg Arg Leu Trp Phe Ile Val
370 375 380
Gly Ile Val Ser Trp Gly Asp Gln Cys Gly Leu Pro Asp Lys Pro Gly
385 390 395 400
Val Tyr Thr Arg Val Thr Ala Tyr Leu Asp Trp Ile Arg Gln Gln Thr
405 410 415
Gly Ile
<210> 22
<211> 257
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 22
agcacccctc tcttccgcag agtctaagaa atcgctgtgt ttagccctcg ccctgggcac 60
tgtcctcacg ggagctgctg tggctgctgt cttgctttgg aagttcagta agtgcaggga 120
gcctcgatcc caccatgtgc tcctgcagtc cccagtgctc tgagccagac cctgctctct 180
gggctattga gacctctgga ggccctccgt gaggttcctc tcttacataa cgaggctgtc 240
tctcttccct tctcttg 257
<210> 23
<211> 190
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 23
ggtcagagga ccaaaggtga ggcaaggcca gacttggtgc tcctgtggtt ctcgagataa 60
cttcgtataa tgtatgctat acgaagttat atgcatggcc tccgcgccgg gttttggcgc 120
ctcccgcggg cgcccccctc ctcacggcga gcgctgccac gtcagacgaa gggcgcagcg 180
agcgtcctga 190
<210> 24
<211> 171
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 24
attgttttgc caagttctaa ttccatcaga cctcgacctg cagcccctag ataacttcgt 60
ataatgtatg ctatacgaag ttatgctagt aactataacg gtcctaaggt agcgagctag 120
ctccacgtgg ctttgtccca gacttccttt gtcttcaaca accttctgca a 171
<210> 25
<211> 177
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 25
ggtcagagga ccaaaggtga ggcaaggcca gacttggtgc tcctgtggtt ctcgagataa 60
cttcgtataa tgtatgctat acgaagttat gctagtaact ataacggtcc taaggtagcg 120
agctagctcc acgtggcttt gtcccagact tcctttgtct tcaacaacct tctgcaa 177
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 26
gccgtgactg tgaccttctc 20
<210> 27
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 27
tggaggagcc acctgatgcc tc 22
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 28
gccttgccct caatggaaac 20
<210> 29
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 29
ggttgcacag caaggaagaa g 21
<210> 30
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 30
ccaggagttc ctgtgagcct accc 24
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 31
tggaatggaa ggagctggag 20
<210> 32
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 32
gtcccacctc ctgcaactg 19
<210> 33
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 33
tgagccttcc catcagcctg gg 22
<210> 34
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 34
ccacaatggc acatgggtct g 21
<210> 35
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 35
ggtgcttgct ccccaaga 18
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 36
cctaaaaggt gttgtaatgg 20
<210> 37
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 37
ggcaataaag aaggaagacg tttt 24
<210> 38
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 38
ccagtcaggg acacacatgc tcacacgccc gcccacccgc acacactaca gtcgagataa 60
cttcgtataa tgtatgctat acgaagttat atgcatggcc tccgcgccgg gttttggcgc 120
<210> 39
<211> 198
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 39
attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg aataacttcg 60
tataatgtat gctatacgaa gttatgctag taactataac ggtcctaagg tagcgagcta 120
gccaagtctg tgtgctacca agtagcaaaa ctgagcctgg aactcacaca tgcgtgtctg 180
agagcccagc actatcgc 198
<210> 40
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 40
taatctgact ttctcttcat cggtctctct tattctaggc tgagctgtaa cgctgccgtc 60
ccccacatcc agaagctgct tcccttcaga cctacctacg 100
<210> 41
<211> 177
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 41
ccagtcaggg acacacatgc tcacacgccc gcccacccgc acacactaca gtcgagataa 60
cttcgtataa tgtatgctat acgaagttat gctagtaact ataacggtcc taaggtagcg 120
agctagccaa gtctgtgtgc taccaagtag caaaactgag cctggaactc acacatg 177
<210> 42
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 42
gagcagggcc atgacacat 19
<210> 43
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 43
accattagat cccagcactg gaca 24
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 44
aaacccttcc cgagagagaa 20
<210> 45
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 45
gaggaacact gtgtcaagga ctt 23
<210> 46
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 46
cctgaaaagc ccggagtggc ag 22
<210> 47
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 47
gggcagagac cacatctga 19
<210> 48
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 48
ggaagccctc tctcgatact tg 22
<210> 49
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 49
ttctaccctg agggcatgca gc 22
<210> 50
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 50
tgggatgtag aaggttgtca ga 22
<210> 51
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 51
ctgagcctgg aactcacaca tg 22
<210> 52
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 52
tctgagagcc cagcactatc gcc 23
<210> 53
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 53
gctgagggtc aggcttgag 19
<210> 54
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 54
tctgcagggt agggagagaa g 21
<210> 55
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 55
tgtttcagaa aaggaagact cacgttaca 29
<210> 56
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 56
gagaccgatg aagagaaagt caga 24
<210> 57
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 57
gaccatttta aggttttgct tggttgtttt ggagggaggg tggtgctttg ctaatggtga 60
attactaact cctcaataaa gaatattatt tgaaataatt 100
<210> 58
<211> 190
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 58
gctgcctttt aatccagcgc tataattgag gcaagcgtcc agcttgacac ctcgagataa 60
cttcgtataa tgtatgctat acgaagttat atgcatggcc tccgcgccgg gttttggcgc 120
ctcccgcggg cgcccccctc ctcacggcga gcgctgccac gtcagacgaa gggcgcagcg 180
agcgtcctga 190
<210> 59
<211> 171
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 59
attgttttgc caagttctaa ttccatcaga cctcgacctg cagcccctag ataacttcgt 60
ataatgtatg ctatacgaag ttatgctagt aactataacg gtcctaaggt agcgagctag 120
ctgcaaccga ggaaaaaacg tgccatgagg tctctgtatc caagtgtgac t 171
<210> 60
<211> 177
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 60
ccagtcaggg acacacatgc tcacacgccc gcccacccgc acacactaca ctcgagataa 60
cttcgtataa tgtatgctat acgaagttat gctagtaact ataacggtcc taaggtagcg 120
agctagctgc aaccgaggaa aaaacgtgcc atgaggtctc tgtatccaag tgtgact 177
<210> 61
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 61
tcctctccag acaagaaagc t 21
<210> 62
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 62
tcatagcagc tttcaaatcc taaacgttga 30
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 63
tcgtgtgtag ctggtgagtt 20
<210> 64
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 64
catgcgatca caggaggaga tc 22
<210> 65
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 65
aattgggccc gaagccagat gc 22
<210> 66
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 66
cggaaggctt ctgtgacttc 20
<210> 67
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 67
gtctcccact tctgacataa tgaac 25
<210> 68
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 68
cccagtgtta accctacatc tggttcc 27
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 69
tgggaagaga ctcttggaca 20
<210> 70
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 70
atgagctcct agtacagcta aagtt 25
<210> 71
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 71
atgcatgatc atctatgcgt cagagc 26
<210> 72
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 72
tgcccagatg cagggagtta g 21

Claims (67)

1.一种包含人源化的Tmprss基因的啮齿类动物,所述人源化的Tmprss基因包含内源性啮齿类动物Tmprss基因的核苷酸序列和同源人TMPRSS基因的核苷酸序列,其中所述人源化的Tmprss基因处于所述内源性啮齿类动物Tmprss基因的启动子的控制下。
2.根据权利要求1所述的啮齿类动物,其中所述人源化的Tmprss基因编码人源化的Tmprss蛋白质,所述人源化的Tmprss蛋白质包含与由所述同源人TMPRSS基因编码的人TMPRSS蛋白质的胞外域基本上相同的胞外域。
3.根据权利要求2所述的啮齿类动物,其中所述人源化的Tmprss蛋白质还包含与由所述内源性啮齿类动物Tmprss基因编码的内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜部分基本上相同的细胞质和跨膜部分。
4.根据权利要求1所述的啮齿类动物,其中所述同源人TMPRSS基因的核苷酸序列编码多肽,所述多肽与由所述同源人TMPRSS基因编码的人TMPRSS蛋白质的胞外域基本上相同。
5.根据权利要求1所述的啮齿类动物,其中所述内源性啮齿类动物Tmprss基因的核苷酸序列编码多肽,所述多肽与由所述内源性啮齿类动物Tmprss基因编码的内源性啮齿类动物Tmprss蛋白质的细胞质和跨膜部分基本上相同。
6.根据权利要求1所述的啮齿类动物,其中所述人源化的Tmprss基因位于内源性啮齿类动物Tmprss基因座处,并且来源于所述内源性啮齿类动物Tmprss基因的基因组序列由所述同源人TMPRSS基因的核苷酸序列的替换。
7.根据权利要求1所述的啮齿类动物,其中所述人源化的Tmprss基因是人源化的Tmprss2基因,所述内源性啮齿类动物Tmprss基因是内源性啮齿类动物Tmprss2基因,并且所述同源人TMPRSS基因是人TMPRSS2基因。
8.根据权利要求7所述的啮齿类动物,其中所述人源化的Tmprss2基因编码人源化的Tmprss2蛋白质,所述人源化的Tmprss2蛋白质包含与由所述人TMPRSS2基因编码的人TMPRSS2蛋白质的胞外域基本上相同的胞外域。
9.根据权利要求8所述的啮齿类动物,其中所述人TMPRSS2蛋白质包含与如SEQ ID NO:4中所示的氨基酸序列至少85%相同的氨基酸序列。
10.根据权利要求8所述的啮齿类动物,其中所述人源化的Tmprss2蛋白质的胞外域包含与由SEQ ID NO:4的残基W106至G492组成的氨基酸序列基本上相同的氨基酸序列。
11.根据权利要求8所述的啮齿类动物,其中所述人源化的Tmprss2蛋白质还包含细胞质和跨膜部分,所述细胞质和跨膜部分与由所述内源性啮齿类动物Tmprss2基因编码的内源性啮齿类动物Tmprss2蛋白质的细胞质和跨膜部分基本上相同。
12.根据权利要求7所述的啮齿类动物,其中所述人TMPRSS2基因的核苷酸序列编码多肽,所述多肽与由所述人TMPRSS2基因编码的人TMPRSS2蛋白质的胞外域基本上相同。
13.根据权利要求12所述的啮齿类动物,其中所述人TMPRSS2基因的核苷酸序列包含所述人TMPRSS2基因的编码外显子4直到编码外显子13中的终止密码子。
14.根据权利要求13所述的啮齿类动物,其还包含所述人TMPRSS2基因的3’UTR。
15.根据权利要求7所述的啮齿类动物,其中所述内源性啮齿类动物Tmprss2基因的核苷酸序列编码细胞质和跨膜部分,所述细胞质和跨膜部分与由所述内源性啮齿类动物Tmprss2基因编码的内源性啮齿类动物Tmprss2蛋白质的细胞质和跨膜部分基本上相同。
16.根据权利要求7所述的啮齿类动物,其中所述人源化的Tmprss2基因包含所述内源性啮齿类动物Tmprss2基因的编码外显子1-2、以及人TMPRSS2基因的编码外显子4直到编码外显子13,其中所述人源化的Tmprss2基因编码人源化的Tmprss2蛋白质,所述人源化的Tmprss2蛋白质包含细胞质和跨膜部分以及胞外域,所述细胞质和跨膜部分与由所述内源性啮齿类动物Tmprss2基因编码的啮齿类动物Tmprss2蛋白质的细胞质和跨膜部分基本上相同,且所述胞外域与由所述人TMPRSS2基因编码的人TMPRSS2蛋白质的胞外域基本上相同。
17.根据权利要求16所述的啮齿类动物,其中所述人源化的Tmprss2基因包含外显子3,所述外显子3包含所述内源性啮齿类动物Tmprss2基因的编码外显子3的5'部分和所述人TMPRSS2基因的编码外显子3的3'部分。
18.根据权利要求1所述的啮齿类动物,其中所述人源化的Tmprss基因是人源化的Tmprss4基因,所述内源性啮齿类动物Tmprss基因是内源性啮齿类动物Tmprss4基因,并且所述同源人TMPRSS基因是人TMPRSS4基因。
19.根据权利要求18所述的啮齿类动物,其中所述人源化的Tmprss4基因编码人源化的Tmprss4蛋白质,所述人源化的Tmprss4蛋白质包含与由所述人TMPRSS4基因编码的人TMPRSS4蛋白质的胞外域基本上相同的胞外域。
20.根据权利要求19所述的啮齿类动物,其中所述人TMPRSS4蛋白质包含与如SEQ IDNO:11中所示的氨基酸序列至少85%相同的氨基酸序列。
21.根据权利要求19所述的啮齿类动物,其中所述胞外域包含与由SEQ ID NO:11的残基K54-L437组成的氨基酸序列基本上相同的氨基酸序列。
22.根据权利要求19所述的啮齿类动物,其中所述人源化的Tmprss4蛋白质还包含细胞质和跨膜部分,所述细胞质和跨膜部分与由所述内源性啮齿类动物Tmprss4基因编码的内源性啮齿类动物Tmprss4蛋白质的细胞质和跨膜部分基本上相同。
23.根据权利要求18所述的啮齿类动物,其中所述人TMPRSS4基因的核苷酸序列编码胞外域,所述胞外域与由所述人TMPRSS4基因编码的人TMPRSS4蛋白质的胞外域基本上相同。
24.根据权利要求23所述的啮齿类动物,其中所述人TMPRSS4基因的核苷酸序列包含所述人TMPRSS4基因的编码外显子4直到编码外显子13中的终止密码子。
25.根据权利要求24所述的啮齿类动物,其中所述人TMPRSS4基因的终止密码子随后为所述内源性啮齿类动物Tmprss4基因的3'UTR。
26.根据权利要求18所述的啮齿类动物,其中所述内源性啮齿类动物Tmprss4基因的核苷酸序列编码的细胞质和跨膜部分与由所述内源性啮齿类动物Tmprss4基因编码的内源性啮齿类动物Tmprss4蛋白质的细胞质和跨膜部分基本上相同。
27.根据权利要求18所述的啮齿类动物,其中所述人源化的Tmprss4基因包含所述内源性啮齿类动物Tmprss4基因的编码外显子1直到编码外显子3,以及所述人TMPRSS4基因的编码外显子4直到编码外显子13中的终止密码子。
28.根据权利要求1所述的啮齿类动物,其中所述人源化的Tmprss基因是人源化的Tmprss11d基因,所述内源性啮齿类动物Tmprss基因是内源性啮齿类动物Tmprss11d基因,并且所述同源人TMPRSS基因是人TMPRSS11D基因。
29.根据权利要求28所述的啮齿类动物,其中所述人源化的Tmprss11d基因编码人源化的Tmprss11d蛋白质,所述人源化的Tmprss11d蛋白质包含与由所述人TMPRSS11D基因编码的人TMPRSS11D蛋白质的胞外域基本上相同的胞外域。
30.根据权利要求29所述的啮齿类动物,其中所述人TMPRSS11D蛋白质包含与如SEQ IDNO:18中所示的氨基酸序列至少85%相同的氨基酸序列。
31.根据权利要求29所述的啮齿类动物,其中所述胞外域包含与由SEQ ID NO:18的残基A42至I418组成的氨基酸序列基本上相同的氨基酸序列。
32.根据权利要求29所述的啮齿类动物,其中所述人源化的Tmprss11d蛋白质还包含与由所述内源性啮齿类动物Tmprss11d基因编码的内源性啮齿类动物Tmprss11d蛋白质的细胞质和跨膜部分基本上相同的细胞质和跨膜部分。
33.根据权利要求28所述的啮齿类动物,其中所述人TMPRSS11D基因的核苷酸序列编码的胞外域与由所述人TMPRSS11D基因编码的人TMPRSS11D蛋白质的胞外域基本上相同。
34.根据权利要求33所述的啮齿类动物,其中所述人TMPRSS11D基因的核苷酸序列包含所述人TMPRSS11D基因的编码外显子3直到编码外显子10中的终止密码子。
35.根据权利要求34所述的啮齿类动物,其还包含人TMPRSS11D基因的3’UTR。
36.根据权利要求28所述的啮齿类动物,其中所述内源性啮齿类动物Tmprss11d基因的核苷酸序列编码的细胞质和跨膜部分与由所述内源性啮齿类动物Tmprss11d基因编码的内源性啮齿类动物Tmprss11d蛋白质的细胞质和跨膜部分基本上相同。
37.根据权利要求28所述的啮齿类动物,其中所述人源化的Tmprss11d基因包含所述内源性啮齿类动物Tmprss11d基因的编码外显子1-2、以及所述人TMPRSS11D基因的编码外显子3直到编码外显子10。
38.根据权利要求1所述的啮齿类动物,其中所述啮齿类动物是小鼠或大鼠。
39.根据权利要求1所述的啮齿类动物,其中所述啮齿类动物对于所述人源化的Tmprss基因是杂合的。
40.根据权利要求1所述的啮齿类动物,其中所述啮齿类动物对于所述人源化的Tmprss基因是纯合的。
41.根据权利要求1所述的啮齿类动物,其中所述啮齿类动物包含在同源内源性Tmprss基因基因座处的至少两种人源化的Tmprss基因。
42.一种分离的啮齿类动物细胞或组织,所述分离的啮齿类动物细胞或组织的基因组包含人源化的Tmprss基因,所述人源化的Tmprss基因包含内源性啮齿类动物Tmprss基因的核苷酸序列和同源人TMPRSS基因的核苷酸序列,其中所述人源化的Tmprss基因处于所述内源性啮齿类动物Tmprss基因的启动子的控制下。
43.根据权利要求42所述的分离的啮齿类动物细胞或组织,其中所述人源化的Tmprss基因选自人源化的Tmprss2基因、人源化的Tmprss4基因和人源化的Tmprss11d基因。
44.一种啮齿类动物胚胎干细胞,所述啮齿类动物胚胎干细胞的基因组包含人源化的Tmprss基因,所述人源化的Tmprss基因包含内源性啮齿类动物Tmprss基因的核苷酸序列和同源人TMPRSS基因的核苷酸序列,其中所述人源化的Tmprss基因处于所述内源性啮齿类动物Tmprss基因的启动子的控制下。
45.根据权利要求44所述的啮齿类动物胚胎干细胞,其中所述人源化的Tmprss基因选自人源化的Tmprss2基因、人源化的Tmprss4基因和人源化的Tmprss11d基因。
46.一种啮齿类动物胚胎,其由根据权利要求44所述的啮齿类动物胚胎干细胞生成。
47.一种载体,所述载体包含编码人TMPRSS蛋白质的胞外域的人基因组DNA,侧面为5'核苷酸序列和3'核苷酸序列,其与编码同源啮齿类动物Tmprss蛋白质的胞外域在啮齿类动物Tmprss基因座处侧接啮齿类动物基因组DNA的基因组DNA序列同源。
48.一种提供啮齿类动物的方法,所述啮齿类动物的基因组包含人源化的Tmprss基因,所述方法包括:
修饰啮齿类动物的基因组,以用同源人TMPRSS基因的基因组序列替换内源性Tmprss基因的基因组序列,从而形成人源化的Tmprss基因。
49.一种制备具有人源化的Tmprss基因的啮齿类动物的方法,其包括:
(a)将基因组片段插入啮齿类动物胚胎干细胞中的内源性啮齿类动物Tmprss基因座内,所述基因组片段包含同源人TMPRSS基因的核苷酸序列,由此形成人源化的Tmprss基因,其中所述人源化的Tmprss基因处于在所述内源性啮齿类动物Tmprss基因座处的所述啮齿类动物Tmprss基因的启动子的控制下;
(b)获得包含(a)的人源化的Tmprss基因的啮齿类动物胚胎干细胞;和
(c)使用(b)的啮齿类动物胚胎干细胞产生啮齿类动物。
50.根据权利要求49所述的方法,其中所述人源化的Tmprss基因编码人源化的Tmprss蛋白质,所述人源化的Tmprss蛋白质包含与由所述同源人TMPRSS基因编码的人TMPRSS蛋白质的胞外域基本上相同的胞外域。
51.根据权利要求50所述的方法,其中所述人源化的Tmprss蛋白质还包含细胞质和跨膜部分,所述细胞质和跨膜部分与在所述内源性啮齿类动物Tmprss基因座处由所述啮齿类动物Tmprss基因编码的啮齿类动物Tmprss蛋白质的细胞质和跨膜部分基本上相同。
52.根据权利要求49所述的方法,其中所述人源化的Tmprss基因选自人源化的Tmprss2基因、人源化的Tmprss4基因和人源化的Tmprss11d基因。
53.根据权利要求52所述的方法,其中所述人源化的Tmprss2基因包含所述内源性啮齿类动物Tmprss2基因的编码外显子1-2、以及所述人TMPRSS2基因的编码外显子4直到编码外显子13。
54.根据权利要求53所述的方法,其中所述人源化的Tmprss2基因包含外显子3,所述外显子3包含所述内源性啮齿类动物Tmprss2基因的编码外显子3的5'部分和所述人TMPRSS2基因的编码外显子3的3'部分。
55.根据权利要求52所述的方法,其中所述人源化的Tmprss4基因包括所述内源性啮齿类动物Tmprss4基因的编码外显子1直到编码外显子3、以及所述人TMPRSS4基因的编码外显子4直到编码外显子13中的终止密码子。
56.根据权利要求52所述的方法,其中所述人源化的Tmprss11d基因包含所述内源性啮齿类动物Tmprss11d基因的编码外显子1-2、以及所述人TMPRSS11D基因的编码外显子3直到编码外显子10。
57.根据权利要求52所述的方法,其中所述人源化的Tmprss基因编码人源化的Tmprss蛋白质,所述人源化的Tmprss蛋白质包含选自人TMPRSS2蛋白质、人TMPRSS4蛋白质和人TMPRSS11D蛋白质的人TMPRSS蛋白质的胞外域。
58.根据权利要求57所述的方法,其中所述人源化的Tmprss蛋白质是包含人TMPRSS2蛋白质的W106至G492或C末端387个氨基酸的人源化的Tmprss2蛋白质。
59.根据权利要求57所述的方法,其中所述人源化的Tmprss蛋白质是包含人TMPRSS4蛋白质的K54-L437或C末端384个氨基酸的人源化的Tmprss4蛋白质。
60.根据权利要求57所述的方法,其中所述人源化的Tmprss蛋白质是包含人TMPRSS11D蛋白质的A42-I418或C末端377个氨基酸的人源化的Tmprss11d蛋白质。
61.根据权利要求49所述的方法,其中所述啮齿类动物是小鼠或大鼠。
62.一种评价化合物在治疗流感病毒感染中的治疗功效的方法,其包括:
提供根据权利要求1-41中任一项所述的啮齿类动物;
向所述啮齿类动物施用流感病毒和候选化合物;和
监测所述啮齿类动物中的流感病毒感染的存在和严重程度,以确定所述候选化合物的治疗功效。
63.根据权利要求62所述的方法,其中所述流感病毒在所述候选化合物之前施用于所述啮齿类动物。
64.根据权利要求62所述的方法,其中所述流感病毒在所述候选化合物之后施用于所述啮齿类动物。
65.根据权利要求62所述的方法,其中所述候选化合物是对人TMPRSS蛋白质特异性的抗体或其抗原结合片段。
66.根据权利要求65所述的方法,其中所述人TMPRSS蛋白质选自人TMPRSS2蛋白质、人TMPRSS4蛋白质和人TMPRSS11D蛋白质。
67.根据权利要求62所述的方法,其中所述啮齿类动物是小鼠或大鼠。
CN201780010404.0A 2016-02-29 2017-02-27 具有人源化的tmprss基因的啮齿类动物 Active CN109068621B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662301023P 2016-02-29 2016-02-29
US62/301,023 2016-02-29
PCT/US2017/019574 WO2017151453A1 (en) 2016-02-29 2017-02-27 Rodents having a humanized tmprss gene

Publications (2)

Publication Number Publication Date
CN109068621A true CN109068621A (zh) 2018-12-21
CN109068621B CN109068621B (zh) 2021-07-20

Family

ID=58264641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780010404.0A Active CN109068621B (zh) 2016-02-29 2017-02-27 具有人源化的tmprss基因的啮齿类动物

Country Status (14)

Country Link
US (5) US10070632B2 (zh)
EP (2) EP3895529A1 (zh)
JP (1) JP6980674B2 (zh)
KR (2) KR20230021759A (zh)
CN (1) CN109068621B (zh)
AU (1) AU2017228293B2 (zh)
CA (1) CA3014645C (zh)
DK (1) DK3422845T3 (zh)
ES (1) ES2886958T3 (zh)
IL (1) IL261139B (zh)
PT (1) PT3422845T (zh)
RU (1) RU2749715C2 (zh)
SG (2) SG11201807038UA (zh)
WO (1) WO2017151453A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113423266A (zh) * 2019-01-17 2021-09-21 雷杰纳荣制药公司 情绪障碍的啮齿动物模型

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3422845T3 (da) 2016-02-29 2021-08-30 Regeneron Pharma Gnavere med et humaniseret tmprss-gen
US20190098879A1 (en) * 2017-09-29 2019-04-04 Regeneron Pharmaceuticals, Inc. Non-Human Animals Comprising A Humanized TTR Locus And Methods Of Use
ES2864529T3 (es) 2018-01-26 2021-10-14 Regeneron Pharma Anticuerpos y fragmentos de unión a antígeno anti-TMPRSS2
SG11202011284RA (en) 2018-07-16 2020-12-30 Regeneron Pharma Non-human animal models of ditra disease and uses thereof
AU2021219671A1 (en) 2020-02-10 2022-07-14 Regeneron Pharmaceuticals, Inc. Anti-Tmprss2 Antibodies and Antigen-Binding Fragments
CN115161326A (zh) * 2021-06-21 2022-10-11 百奥赛图(北京)医药科技股份有限公司 Sost基因人源化非人动物及其构建方法和应用
WO2023122506A1 (en) * 2021-12-20 2023-06-29 Regeneron Pharmaceuticals, Inc. Non-human animals comprising humanized ace2 and tmprss loci

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101443348A (zh) * 2006-05-23 2009-05-27 Irm责任有限公司 作为通道活化蛋白酶抑制剂的化合物和组合物
CN102482347A (zh) * 2009-01-12 2012-05-30 希托马克斯医疗有限责任公司 修饰抗体组合物及其制备和使用方法
CN103547148A (zh) * 2011-02-15 2014-01-29 再生元制药公司 人源化m-csf小鼠
CN104661677A (zh) * 2012-06-22 2015-05-27 西托姆克斯治疗公司 抗Jagged 1/Jagged 2交叉反应抗体、可活化的抗Jagged抗体及其使用方法
EP3003387A1 (en) * 2013-06-04 2016-04-13 Cytomx Therapeutics Inc. Compositions and methods for conjugating activatable antibodies

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002065266A (ja) * 2000-08-28 2002-03-05 Teijin Ltd 気道特異的トリプシン様酵素およびその利用法
US6586251B2 (en) 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
WO2003053136A2 (en) * 2001-12-20 2003-07-03 The Regents Of The University Of California Triple transgenic mouse model of alzheimer's disease
US20050026255A1 (en) * 2002-06-25 2005-02-03 Morser John Michael Corin, a serine protease
WO2004033630A2 (en) * 2002-10-04 2004-04-22 Schering Aktiengesellschaft Modified hepsin molecules having a substitute activation sequence and uses thereof
CA2527361A1 (en) * 2003-06-11 2004-12-23 Schering Aktiengesellschaft Novel modified corin molecules having substitute activation sequences and uses thereof
US7491865B2 (en) * 2004-08-19 2009-02-17 Fred Hutchinson Cancer Research Center Mouse models of prostate cancer development and metastasis through expression of a hepsin transgene
EP2767161B1 (en) 2004-10-19 2018-02-07 Regeneron Pharmaceuticals, Inc. Method for generating an non-human animal homozygous for a genetic modification
GB0821624D0 (en) * 2008-11-26 2008-12-31 Eisai London Res Lab Ltd Assay
RU2425880C2 (ru) * 2009-07-30 2011-08-10 Учреждение Российской академии наук Институт общей генетики им. Н.И. Вавилова РАН Способ получения трансгенных мышей
JP5874881B2 (ja) 2009-10-06 2016-03-02 リジェネロン・ファーマシューティカルズ・インコーポレイテッド 遺伝子改変されたマウスおよび移植方法
HUE035652T2 (en) 2011-10-28 2018-05-28 Regeneron Pharma Genetically Modified Major Histocompatibility Complex Mice
RS63220B1 (sr) 2011-10-28 2022-06-30 Regeneron Pharma Genetski modifikovani miševi sa ekspresijom himernih molekula klase ii glavnog kompleksa histokompatibilnosti (mhc)
MY172726A (en) 2011-10-28 2019-12-11 Regeneron Pharma Humanized il-6 and il-6 receptor
SG11201405163RA (en) * 2012-04-16 2014-09-26 Regeneron Pharma Methods for treating or preventing influenza virus infection by administering a serine protease inhibitor
US8962913B2 (en) 2012-06-18 2015-02-24 Regeneron Pharmaceuticals, Inc. Humanized IL-7 rodents
JP6283031B2 (ja) 2012-09-07 2018-02-21 イエール ユニバーシティ 遺伝学的に修飾された非ヒト動物およびその使用法
WO2014071397A2 (en) 2012-11-05 2014-05-08 Regeneron Pharmaceuticals Genetically modified non-human animals and methods of use thereof
MX2015010841A (es) 2013-02-20 2016-05-09 Regeneron Pharma Modificacion genetica de ratas.
KR102313047B1 (ko) 2013-02-20 2021-10-19 리제너론 파아마슈티컬스, 인크. 사람화된 t-세포 보조-수용체를 발현하는 마우스
US20150342163A1 (en) 2013-02-22 2015-12-03 Regeneron Pharmaceuticals, Inc. Genetically modified major histocompatibility complex mice
PL2958937T3 (pl) 2013-02-22 2019-01-31 Regeneron Pharmaceuticals, Inc. Myszy ekspresjonujące humanizowany główny układ zgodności tkankowej
DK2986729T3 (en) 2013-04-16 2018-10-29 Regeneron Pharma TARGETED MODIFICATION OF ROOT THROUGH
KR102407354B1 (ko) 2013-09-23 2022-06-10 리제너론 파마슈티칼스 인코포레이티드 인간화된 신호-조절 단백질 유전자를 가지는 비-인간 동물
PL2908626T3 (pl) 2013-10-15 2017-05-31 Regeneron Pharmaceuticals, Inc. Zwierzęta z humanizowaną
AU2014353346B2 (en) * 2013-11-19 2020-05-14 Regeneron Pharmaceuticals, Inc. Non-human animals having a humanized B-cell activating factor gene
SG10201811701YA (en) 2013-11-19 2019-01-30 Regeneron Pharma Non-human animals having a humanized a proliferation-inducing ligand gene
PL3129400T3 (pl) 2014-04-08 2020-09-07 Regeneron Pharmaceuticals, Inc. Zwierzęta inne niż człowiek mające humanizowane receptory fc-gamma
NO2785538T3 (zh) 2014-05-07 2018-08-04
FI3841877T3 (fi) 2014-05-19 2023-12-01 Regeneron Pharma Ihmisen epo:a ilmentäviä geneettisesti muunneltuja hiiriä
KR102482295B1 (ko) 2014-06-19 2022-12-30 리제너론 파마슈티칼스 인코포레이티드 인간화 프로그램화 세포 사멸 1 유전자를 가지는 비인간 동물
CN113016720B (zh) 2014-11-24 2023-02-21 瑞泽恩制药公司 表达人源化cd3复合物的非人类动物
LT3086637T (lt) 2014-12-05 2019-04-10 Regeneron Pharmaceuticals, Inc. Gyvūnai, išskyrus žmogų, turintys humanizuota diferenciacijos klasterio 47 geną
KR102457921B1 (ko) 2014-12-09 2022-10-25 리제너론 파마슈티칼스 인코포레이티드 인간화 분화 클러스터 274 유전자를 갖는 비인간 동물
NZ736031A (en) 2015-04-06 2022-07-29 Regeneron Pharma Humanized t cell mediated immune responses in non-human animals
JP6997708B2 (ja) 2015-11-20 2022-02-04 リジェネロン・ファーマシューティカルズ・インコーポレイテッド ヒト化されたlymphocyte-activation gene 3遺伝子を有する非ヒト動物
DK3422845T3 (da) 2016-02-29 2021-08-30 Regeneron Pharma Gnavere med et humaniseret tmprss-gen
KR101693243B1 (ko) * 2016-06-15 2017-01-05 재단법인 한국파스퇴르연구소 인플루엔자 바이러스의 복제에 관여하는 신규 인간 유전자 및 이의 용도

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101443348A (zh) * 2006-05-23 2009-05-27 Irm责任有限公司 作为通道活化蛋白酶抑制剂的化合物和组合物
CN102482347A (zh) * 2009-01-12 2012-05-30 希托马克斯医疗有限责任公司 修饰抗体组合物及其制备和使用方法
CN103547148A (zh) * 2011-02-15 2014-01-29 再生元制药公司 人源化m-csf小鼠
CN104661677A (zh) * 2012-06-22 2015-05-27 西托姆克斯治疗公司 抗Jagged 1/Jagged 2交叉反应抗体、可活化的抗Jagged抗体及其使用方法
EP3003387A1 (en) * 2013-06-04 2016-04-13 Cytomx Therapeutics Inc. Compositions and methods for conjugating activatable antibodies

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113423266A (zh) * 2019-01-17 2021-09-21 雷杰纳荣制药公司 情绪障碍的啮齿动物模型
US11470828B2 (en) 2019-01-17 2022-10-18 Regeneran Pharmaceuticals, Inc. Rodent model of mood disorders

Also Published As

Publication number Publication date
EP3422845B1 (en) 2021-06-02
CA3014645C (en) 2022-10-25
US10070632B2 (en) 2018-09-11
SG11201807038UA (en) 2018-09-27
US20170245482A1 (en) 2017-08-31
IL261139A (en) 2018-10-31
KR102493894B1 (ko) 2023-01-31
JP6980674B2 (ja) 2021-12-15
WO2017151453A1 (en) 2017-09-08
KR20230021759A (ko) 2023-02-14
RU2018131152A3 (zh) 2020-07-13
US20170290308A1 (en) 2017-10-12
DK3422845T3 (da) 2021-08-30
CA3014645A1 (en) 2017-09-08
JP2019511918A (ja) 2019-05-09
US20210068377A1 (en) 2021-03-11
KR20180117122A (ko) 2018-10-26
AU2017228293B2 (en) 2023-05-25
US10070631B2 (en) 2018-09-11
AU2017228293A1 (en) 2018-08-23
RU2018131152A (ru) 2020-04-01
US20180332831A1 (en) 2018-11-22
RU2749715C2 (ru) 2021-06-16
PT3422845T (pt) 2021-08-26
US11910787B2 (en) 2024-02-27
CN109068621B (zh) 2021-07-20
IL261139B (en) 2022-04-01
EP3422845A1 (en) 2019-01-09
US20240147971A1 (en) 2024-05-09
ES2886958T3 (es) 2021-12-21
EP3895529A1 (en) 2021-10-20
US10863729B2 (en) 2020-12-15
SG10202001578RA (en) 2020-04-29

Similar Documents

Publication Publication Date Title
RU2749715C2 (ru) Грызуны, характеризующиеся гуманизированным геном tmprss
ES2744098T3 (es) Composiciones y sus usos dirigidos a la huntingtina
KR20230110373A (ko) 질환을 치료하기 위한 유전적으로 변형된 세포, 조직,및 장기
AU2019377115A1 (en) Use of adeno-associated viral vectors to correct gene defects/ express proteins in hair cells and supporting cells in the inner ear
CN107223159A (zh) 源自特定细胞类型的dna的检测及相关方法
KR20180093902A (ko) 태아와 임신 여성간에 상이하게 메틸화된 디엔에이 영역을 이용한 태아 염색체 이수성의 검출
WO2001012659A2 (en) Human dna sequences
KR20120099363A (ko) 탯줄 혈액으로부터의 유도 만능 줄기 세포의 생성
AU2023202878A1 (en) Methods for targeted insertion of DNA in genes
AU2016325030A1 (en) Novel biomarkers and methods of treating cancer
RU2744831C2 (ru) Не относящееся к человеку животное, у которого проявляется снижение функции верхних и нижних моторных нейронов и чувственного восприятия
KR102661616B1 (ko) Gpr156 변이체 및 이들의 용도
PT1939287T (pt) Método de transferência de genes específico para células trofectodérmicas
WO1999055915A2 (en) IDENTIFICATION OF POLYMORPHISMS IN THE PCTG4 REGION OF Xq13
KR102624979B1 (ko) B4galt1 변이체 및 이의 용도
CN112501205B (zh) Ceacam1基因人源化非人动物的构建方法及应用
KR20230124973A (ko) 인간화 tslp 유전자, 인간화 tslp 수용체 유전자, 및/또는인간화 il7ra 유전자를 갖는 비인간 동물
WO2006022638A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
RU2805557C2 (ru) Варианты b4galt1 и их применение
CA2887830A1 (en) Genetic polymorphisms associated with liver fibrosis methods of detection and uses thereof
JP2003259875A (ja) ヒト遺伝子の一塩基多型(4)
KR20210116480A (ko) 기분 장애의 설치류 모델
US20020142381A1 (en) Isolated nucleic acid molecules encoding human transporter proteins, and uses thereof
CN116355923A (zh) 先天性心脏病相关dgkd基因新发变异位点及其应用
JP2001321175A (ja) 予後良好及び不良なヒト神経芽細胞腫との比較において、予後良好なヒト神経芽細胞腫で発現が増強していることを特徴とする核酸配列

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: New York State, USA

Applicant after: First drugmaker of regenerating

Address before: New York State, USA

Applicant before: Ray Jenner pharmaceuticals

GR01 Patent grant
GR01 Patent grant