RU2749715C2 - Грызуны, характеризующиеся гуманизированным геном tmprss - Google Patents

Грызуны, характеризующиеся гуманизированным геном tmprss Download PDF

Info

Publication number
RU2749715C2
RU2749715C2 RU2018131152A RU2018131152A RU2749715C2 RU 2749715 C2 RU2749715 C2 RU 2749715C2 RU 2018131152 A RU2018131152 A RU 2018131152A RU 2018131152 A RU2018131152 A RU 2018131152A RU 2749715 C2 RU2749715 C2 RU 2749715C2
Authority
RU
Russia
Prior art keywords
gene
rodent
tmprss
humanized
human
Prior art date
Application number
RU2018131152A
Other languages
English (en)
Other versions
RU2018131152A3 (ru
RU2018131152A (ru
Inventor
НГАМБО Лиса ПУРСЕЛЛ
Александер О. МУДЖИКА
Яцзюнь ТАН
Original Assignee
Регенерон Фармасьютикалз, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Регенерон Фармасьютикалз, Инк. filed Critical Регенерон Фармасьютикалз, Инк.
Publication of RU2018131152A publication Critical patent/RU2018131152A/ru
Publication of RU2018131152A3 publication Critical patent/RU2018131152A3/ru
Application granted granted Critical
Publication of RU2749715C2 publication Critical patent/RU2749715C2/ru

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Knock-in vertebrates, e.g. humanised vertebrates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0603Embryonic cells ; Embryoid bodies
    • C12N5/0606Pluripotent embryonic cells, e.g. embryonic stem cells [ES]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0337Animal models for infectious diseases
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10332Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Environmental Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gynecology & Obstetrics (AREA)
  • Reproductive Health (AREA)
  • Developmental Biology & Embryology (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

Изобретение относится к области биотехнологии, в частности к грызуну, который экспрессирует гуманизированный белок Tmprss, а также к его клетке и ткани. Также раскрыт эмбрион грызуна для получения грызуна, который экспрессирует гуманизированный белок Tmprss. Изобретение также относится к способу получения грызуна, имеющего гуманизированный ген Tmprss. Изобретение позволяет эффективно осуществлять оценку терапевтической эффективности соединения в лечении инфекции, вызванной вирусом гриппа. 7 н. и 25 з.п. ф-лы, 4 табл., 3 пр., 4 ил.

Description

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННУЮ ЗАЯВКУ
[001] Настоящая заявка испрашивает приоритет предварительной заявки на патент США № 62/301023, поданной 29 февраля 2016 г., полное содержание которой включено в данный документ посредством ссылки.
ВКЛЮЧЕНИЕ ПЕРЕЧНЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ПОСРЕДСТВОМ ССЫЛКИ
[002] Перечень последовательностей в виде текстового файла ASCII размером 275 Кб под названием 33093_10234US01_SequenceListing.txt, созданный 13 февраля 2017 г. и поданный в Ведомство по патентам и товарным знакам США через EFS-Web, включен в данный документ посредством ссылки.
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
[003] Трансмембранные сериновые протеазы II типа представляют собой семейство протеаз, характеризующихся N-концевым трансмембранным доменом (Bugge et al., J. Biol. Chem. 284 (35): 23177-23181, 2009; Hooper et al., J. Biol. Chem. 272(2): 857-860, 2001). Все члены данного семейство экспрессируются в виде одноцепочечных зимогенов и протеолитически активируются посредством расщепления в высококонсервативном мотиве R/(IV)VGG. Было показано, что один член семейства, трансмембранная протеаза 4 серинового типа (TMPRSS4), активирует эпителиальный натриевый канал (ENaC), регулирующий прохождение натрия и воды через эпителий (Guipponi et al. 2002 Hum. Mol. Genet. 11:2829; Vuagniaux et al. 2002 J. Gen. Physiol. 120:191). Протеолитические активаторы TMPRSS4 неизвестны; однако данные, доступные на сегодняшний день, позволяют предположить, что белок является самоактивируемым. В активированном состоянии каталитический домен TMPRSS4 сохраняет связь с N-концом белка посредством дисульфидной связи. Было показано, что TMPRSS4, TMPRSS2 и TMPRSS11D (или трипсиноподобная протеаза респираторного тракта человека; «HAT») расщепляют in vitro гемагглютинин вируса гриппа A (HA), который представляет собой первую необходимую стадию в жизненном цикле вируса. Данное расщепление является необходимым для активности HA, поскольку белок синтезируется в виде белка-предшественника (HA0) и требует расщепления до HA1 и HA2 для получения активности. Нокдаун TMPRSS4 посредством RNAi в клетках Caco-2 приводил к уменьшению распространения вируса. Кроме того, было показано, что в легких мышей, зараженных гриппом, сильно повышена экспрессия TMPRSS4 (Böttcher et al. 2006 J. Virol. 80:9896; Böttcher et al. 2009 Vaccine 27: 6324; Böttcher-Friebershäusser et al. 2010 J. Virol. 84: 5604; Bertam et al. 2010 J. Virol. 84:10016; Bertam et al. 2010 J. Virol. 84:10016; Böttcher-Friebershäusser et al. 2011 J. Virol. 85: 1554; Bahgat et al. 2011 Virol. J. 8:27).
[004] Разработка системы in vivo, например, модели инфекции на грызунах, необходима для того, чтобы определить и тестировать соединения, включая антитела, которые специфически целенаправленно воздействуют на трансмембранные сериновые протеазы человека II типа для лечения и предупреждения вирусной инфекции и других заболеваний.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[005] Настоящее изобретение охватывает понимание того, что для обеспечения систем in vivo для идентификации и разработки новых терапевтических средств необходимо получение с помощью генной инженерии животных, относящихся к грызунам. Например, настоящее изобретение охватывает понимание того, что грызуны, характеризующиеся гуманизированным геном Tmprss, необходимы для применения в идентификации и разработке терапевтических средств для лечения и предупреждения вирусных инфекций.
[006] В одном аспекте настоящего изобретения предусмотрен грызун, геном которого содержит гуманизированный ген Tmprss, который содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека, где гуманизированный ген Tmprss находится под контролем регуляторной 5'-последовательности (регуляторных последовательностей), таких как промотор и/или энхансер(энхансеры) эндогенного гена Tmprss грызуна.
[007] В некоторых вариантах осуществления гуманизированный ген Tmprss у грызунов, раскрытых в данном документе, кодирует гуманизированный белок Tmprss, который содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS человека. В некоторых вариантах осуществления гуманизированный белок Tmprss содержит цитоплазматический и трансмембранный участки, которые практически идентичны (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичны по последовательности) цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна.
[008] В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss, который содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека, где нуклеотидная последовательность родственного гена TMPRSS человека кодирует полипептид, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS человека, кодируемого родственным геном TMPRSS человека. В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss, который содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека, где нуклеотидная последовательность эндогенного гена Tmprss грызуна кодирует полипептид, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна.
[009] В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss, расположенный в эндогенном локусе Tmprss грызуна, что является результатом замены непрерывной геномной последовательности эндогенного гена Tmprss грызуна непрерывной геномной последовательностью родственного гена TMPRSS человека. В конкретных вариантах осуществления непрерывная геномная последовательность родственного гена TMPRSS человека, которая является вставленной, содержит последовательности экзонов, кодирующих эктодомен, практически идентичный эктодомену белка TMPRSS человека, кодируемого геном TMPRSS человека. В некоторых вариантах осуществления непрерывная геномная последовательность родственного гена TMPRSS человека также содержит 3'-UTR родственного гена TMPRSS человека.
[0010] В некоторых вариантах осуществления грызун, раскрытый в данном документе, является гетерозиготным по гуманизированному гену Tmprss в эндогенном локусе Tmprss грызуна. В других вариантах осуществления грызун является гомозиготным по гуманизированному гену Tmprss в эндогенном локусе Tmprss грызуна.
[0011] В дополнительных вариантах осуществления грызун содержит два или более гуманизированных генов Tmprss в различных эндогенных локусах Tmprss грызуна, причем каждый эндогенный локус Tmprss грызуна гуманизирован с помощью соответствующего родственного гена TMPRSS человека; например, два или более гуманизированных генов Tmprss2, гуманизированных генов Tmprss4 и гуманизированных генов Tmprss11d.
[0012] В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss2, который содержит нуклеотидную последовательность эндогенного гена Tmprss2 грызуна и нуклеотидную последовательность гена TMPRSS2 человека, где гуманизированный ген Tmprss2 находится под контролем промотора эндогенного гена Tmprss2 грызуна.
[0013] В некоторых вариантах осуществления гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS2 человека, кодируемого геном TMPRSS2 человека, применяемым в гуманизации. Белок TMPRSS2 человека содержит, в некоторых вариантах осуществления, аминокислотную последовательность, по меньшей мере на 85% идентичную (например, по меньшей мере на 90%, 95%, 98%, 99% или 100% идентичную) аминокислотной последовательности, изложенной под SEQ ID NO: 4. В некоторых вариантах осуществления гуманизированный белок Tmprss2 содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный) аминокислотной последовательности, состоящей из остатков W106 - G492 или C-концевых 387 аминокислот белка TMPRSS2 человека, изложенного под, например, SEQ ID NO: 4. В некоторых вариантах осуществления гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичны) цитоплазматическому и трансмембранному участкам белка Tmprss2 грызуна, кодируемого эндогенным геном Tmprss2 грызуна, который подлежит гуманизации. Иллюстративный эндогенный белок Tmprss2 грызуна изложен под SEQ ID NO: 2.
[0014] В некоторых вариантах осуществления грызун содержит гуманизированный ген Tmprss2, который содержит нуклеотидную последовательность эндогенного гена Tmprss2 грызуна и нуклеотидную последовательность гена TMPRSS2 человека, где нуклеотидная последовательность гена TMPRSS2 человека кодирует эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS2 человека, кодируемого геном TMPRSS2 человека. В конкретных вариантах осуществления нуклеотидная последовательность гена TMPRSS2 человека представляет собой непрерывную геномную последовательность гена TMPRSS2 человека, содержащую область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS2 человека. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека дополнительно содержит 3'-UTR гена TMPRSS2 человека. В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss2 грызуна, включенная в гуманизированный ген Tmprss2, кодирует цитоплазматический и трансмембранный участки, которые практически идентичны (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичны) цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss2 грызуна, кодируемого эндогенным геном Tmprss2 грызуна.
[0015] В конкретных вариантах осуществления гуманизированный ген Tmprss2 содержит кодирующие экзоны 1-2 эндогенного гена Tmprss2 грызуна и область от кодирующего экзона 4 до кодирующего экзона 13 гена TMPRSS2 человека, где гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам белка Tmprss2 грызуна, кодируемого эндогенным геном Tmprss2 грызуна, и эктодомен, который практически идентичен эктодомену белка TMPRSS2 человека, кодируемого геном TMPRSS2 человека. Гуманизированный ген Tmprss2 содержит экзон 3, который, в некоторых вариантах осуществления, представляет собой кодирующий экзон 3 гена TMPRSS2 человека и, в других вариантах осуществления, представляет собой кодирующий экзон 3 эндогенного гена Tmprss2 грызуна. В некоторых вариантах осуществления гуманизированный ген Tmprss2 содержит экзон 3, который содержит 5'-участок кодирующего экзона 3 эндогенного гена Tmprss2 грызуна и 3'-участок кодирующего экзона 3 гена TMPRSS2 человека.
[0016] В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss4, который содержит нуклеотидную последовательность эндогенного гена Tmprss4 грызуна и нуклеотидную последовательность гена TMPRSS4 человека, где гуманизированный ген Tmprss4 находится под контролем промотора эндогенного гена Tmprss4 грызуна.
[0017] В некоторых вариантах осуществления гуманизированный ген Tmprss4 кодирует гуманизированный белок Tmprss4, который содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS4 человека, кодируемого геном TMPRSS4 человека, применяемым в гуманизации. Белок TMPRSS4 человека содержит, в некоторых вариантах осуществления, аминокислотную последовательность, по меньшей мере на 85% идентичную (например, по меньшей мере на 90%, 95%, 98%, 99% или 100% идентичную) аминокислотной последовательности, изложенной под SEQ ID NO: 11. В некоторых вариантах осуществления гуманизированный белок Tmprss4 содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный) аминокислотной последовательности, состоящей из остатков K54 - L437 или C-концевых 384 аминокислот белка TMPRSS4 человека, изложенного под, например, SEQ ID NO: 11. В некоторых вариантах осуществления гуманизированный ген Tmprss4 кодирует гуманизированный белок Tmprss4, который дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичны) цитоплазматическому и трансмембранному участкам белка Tmprss4 грызуна, кодируемого эндогенным геном Tmprss4 грызуна, который подлежит гуманизации. Иллюстративный эндогенный белок Tmprss4 грызуна изложен под SEQ ID NO: 9.
[0018] В некоторых вариантах осуществления грызун содержит гуманизированный ген Tmprss4, который содержит нуклеотидную последовательность эндогенного гена Tmprss4 грызуна и нуклеотидную последовательность гена TMPRSS4 человека, где нуклеотидная последовательность гена TMPRSS4 человека кодирует эктодомен, практически идентичный эктодомену белка TMPRSS4 человека, кодируемого геном TMPRSS4 человека. В конкретных вариантах осуществления нуклеотидная последовательность гена TMPRSS4 человека представляет собой непрерывную геномную последовательность, содержащую область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека. В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss4 грызуна, включенная в гуманизированный ген Tmprss4, кодирует цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам белка Tmprss4 грызуна, кодируемого эндогенным геном Tmprss4 грызуна.
[0019] В конкретных вариантах осуществления гуманизированный ген Tmprss4 содержит область от кодирующего экзона 1 до кодирующего экзона 3 эндогенного гена Tmprss4 грызуна и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека.
[0020] В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss11d, который содержит нуклеотидную последовательность эндогенного гена Tmprss11d грызуна и нуклеотидную последовательность гена TMPRSS11D человека, где гуманизированный ген Tmprss11d находится под контролем промотора эндогенного гена Tmprss11d грызуна.
[0021] В некоторых вариантах осуществления гуманизированный ген Tmprss11d кодирует гуманизированный белок Tmprss11d, который содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS11D человека, кодируемого геном TMPRSS11D человека, применяемым в гуманизации. Белок TMPRSS11D человека содержит, в некоторых вариантах осуществления, аминокислотную последовательность, по меньшей мере на 85% идентичную (например, по меньшей мере на 90%, 95%, 98%, 99% или 100% идентичную) аминокислотной последовательности, изложенной под SEQ ID NO: 18. В некоторых вариантах осуществления гуманизированный белок Tmprss11d содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный) аминокислотной последовательности, состоящей из остатков A42-I418 или 377 C-концевых аминокислот белка TMPRSS11D человека, изложенного в, например, SEQ ID NO: 18. В некоторых вариантах осуществления гуманизированный ген Tmprss11d кодирует гуманизированный белок Tmprss11d, который дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичны) цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss11d грызуна, кодируемого эндогенным геном Tmprss11d грызуна, который подлежит гуманизации. Иллюстративный эндогенный белок Tmprss11d грызуна изложен под SEQ ID NO: 16.
[0022] В некоторых вариантах осуществления грызун содержит гуманизированный ген Tmprss11d, который содержит нуклеотидную последовательность эндогенного гена Tmprss11d грызуна и нуклеотидную последовательность гена TMPRSS11D человека, где нуклеотидная последовательность гена TMPRSS11D человека кодирует эктодомен, практически идентичный эктодомену белка TMPRSS11D человека, кодируемого геном TMPRSS11D человека. В конкретных вариантах осуществления нуклеотидная последовательность гена TMPRSS11d человека представляет собой непрерывную геномную последовательность, содержащую область от кодирующего экзона 3 до стоп-кодона в кодирующем экзоне 10 гена TMPRSS11D человека. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS11D человека дополнительно содержит 3'-UTR гена TMPRSS11D человека. В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss11d грызуна, включенная в гуманизированный ген Tmprss11d, кодирует цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам белка Tmprss11d грызуна, кодируемого эндогенным геном Tmprss11d грызуна.
[0023] В конкретных вариантах осуществления гуманизированный ген Tmprss11d содержит кодирующие экзоны 1-2 эндогенного гена Tmprss11d грызуна и область от кодирующего экзона 3 до кодирующего экзона 13 гена TMPRSS11D человека.
[0024] В другом аспекте настоящее изобретение предусматривает выделенные клетку или ткань грызуна, в геноме которых содержится гуманизированный ген Tmprss, как описано в данном документе. В конкретных вариантах осуществления гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d.
[0025] В еще другом аспекте настоящего изобретения предусмотрена эмбриональная стволовая клетка грызуна, в геноме которой содержится гуманизированный ген Tmprss, как описано в данном документе. В конкретных вариантах осуществления гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d.
[0026] В другом аспекте также предусмотрен эмбрион грызуна, полученный с помощью эмбриональной стволовой клетки грызуна, раскрытой в данном документе.
[0027] В одном аспекте настоящего изобретения предусмотрен вектор на основе нуклеиновой кислоты, подходящий для применения в гуманизации эндогенного гена Tmprss у грызуна. В некоторых вариантах осуществления вектор на основе нуклеиновой кислоты содержит последовательность нуклеиновой кислоты Tmprss человека (например, геномную ДНК человека, кодирующую эктодомен белка TMPRSS человека), фланкированную гомологичным 5'-участком и гомологичным 3'-участком. Гомологичные 5'- и 3'-участки представляют собой последовательности нуклеиновой кислоты, которые находятся в положениях 5' и 3' соответственно в отношении последовательности нуклеиновой кислоты Tmprss человека и являются гомологичными последовательностям геномной ДНК в эндогенном локусе Tmprss у грызуна, которые фланкируют геномную ДНК грызуна, кодирующую эктодомен родственного белка Tmprss грызуна. Таким образом, 5'- и 3'-гомологичные участки способны опосредовать гомологичную рекомбинацию и замену геномной ДНК грызуна, кодирующей эктодомен родственного белка Tmprss грызуна, последовательностью нуклеиновой кислоты Tmprss человека с образованием гуманизированного гена Tmprss, как описано в данном документе.
[0028] В дополнительном аспекте настоящее изобретение направлено на способ получения грызуна, в геноме которого содержится гуманизированный ген Tmprss. Способ включает модифицирование генома грызуна с заменой геномной последовательности эндогенного гена Tmprss грызуна на геномную последовательность родственного гена TMPRSS человека с образованием гуманизированного гена Tmprss.
[0029] В некоторых вариантах осуществления настоящего изобретения предусмотрен способ получения грызуна (такого, как мышь или крыса), характеризующегося гуманизированным геном Tmprss, при этом способ включает стадии (a) вставки геномного фрагмента в эндогенный локус Tmprss грызуна в эмбриональной стволовой клетке грызуна, где геномный фрагмент содержит нуклеотидную последовательность родственного гена TMPRSS человека, за счет чего обеспечивается образование гуманизированного гена Tmprss (такого, как описанный в данном документе); (b) получения эмбриональной стволовой клетки грызуна, содержащей гуманизированный ген Tmprss (a); и (c) получения грызуна с применением эмбриональной стволовой клетки грызуна из (b).
[0030] В некоторых вариантах осуществления гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d. В различных вариантах осуществления гуманизированный ген Tmprss кодирует гуманизированный белок Tmprss, который содержит эктодомен, практически идентичный (например, по меньшей мере на 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS человека, кодируемого геном TMPRSS человека, применяемым для гуманизации. В конкретных вариантах осуществления гуманизированный белок Tmprss содержит эктодомен белка TMPRSS человека, выбранного из группы, состоящей из белка TMPRSS2 человека, белка TMPRSS4 человека и белка TMPRSS11D человека. В конкретных вариантах осуществления гуманизированный белок Tmprss дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна, который подлежит гуманизации.
[0031] В другом аспекте настоящего изобретения предусмотрен способ применения грызуна, раскрытого в данном документе, для оценки терапевтической эффективности соединения (например, кандидатных ингибиторов, которые специфически целенаправленно воздействуют на белок TMPRSS человека) в лечении вирусной инфекции гриппа. Способ может включать стадии получения грызуна, описанного в данном документе, введения грызуну вируса гриппа и кандидатного соединения и мониторинга наличия и тяжести инфекции, вызванной вирусом гриппа, у грызуна для определения терапевтической эффективности кандидатного лекарственного средства.
[0032] В некоторых вариантах осуществления вирус гриппа вводят грызуну до введения соединения. В других вариантах осуществления вирус гриппа вводят грызуну после введения соединения.
[0033] В некоторых вариантах осуществления кандидатное соединение представляет собой антитело или его антигенсвязывающий фрагмент, специфичный в отношении белка TMPRSS человека. В конкретных вариантах осуществления кандидатное соединение представляет собой антитело или его антигенсвязывающий фрагмент, специфичный в отношении белка TMPRSS человека, выбранного из группы, состоящей из белка TMPRSS2 человека, белка TMPRSS4 человека и белка TMPRSS11D человека.
[0034] Другие признаки, цели и преимущества настоящего изобретения очевидны из нижеследующего подробного описания. Следует, однако, понимать, что подробное описание, хоть и указывает на варианты осуществления настоящего изобретения, приведено только в целях иллюстрации, а не ограничения. Различные изменения и модификации в пределах объема настоящего изобретения станут очевидными специалистам в данной области из подробного описания.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
[0035] Графические материалы, включенные в данный документ, которые содержат следующие фигуры, приведены только в иллюстративных целях, а не для ограничения.
[0036] Фигуры 1A-1D. Иллюстративная стратегия гуманизации Tmprss2 мыши.
[0037] На фигуре 1A без соблюдения масштаба показана схема геномной организации генов Tmprss2 мыши и TMPRSS2 человека. Экзоны представлены тонкими полосами, расположенными поперек геномных последовательностей, причем первый кодирующий экзон для обоих генов обозначен старт-кодоном «ATG» над экзоном и последний кодирующий экзон обозначен кодоном «Стоп» над экзоном. Указаны геномный фрагмент мыши размером приблизительно 25291 п. о., который должен быть удален, и геномный фрагмент человека размером 25091 п. о., который должен быть вставлен. Указаны местоположения зондов, использованных в анализе, описанном в примере 1. TM: трансмембранный домен; SRCR: домен, подобный богатому цистеином домену фагоцитарных рецепторов; LDLRa: рецептор липопротеинов низкой плотности класса А.
[0038] На фигуре 1B без соблюдения масштаба проиллюстрирован иллюстративный модифицированный BAC-вектор для гуманизации эндогенного гена Tmprss2 мыши вместе с соединительными последовательностями (SEQ ID NO: 22, 23 и 24).
[0039] На фигуре 1C проиллюстрирована без соблюдения масштаба гуманизированная аллель Tmprss2 после удаления кассеты устойчивости к неомицину вместе с соединительными последовательностями (SEQ ID NO: 22 и 25).
[0040] На фигуре 1D представлено выравнивание последовательностей белка TMPRSS2 человека (SEQ ID NO: 4), белка Tmprss2 мыши (SEQ ID NO: 2) и гуманизированного белка Tmprss2 («мутантного белка 7010») (SEQ ID NO: 7).
[0041] Фигуры 2A-2D. Иллюстративная стратегия гуманизации Tmprss4 мыши.
[0042] На фигуре 2A без соблюдения масштаба показана схема геномной организации генов Tmprss4 мыши и TMPRSS4 человека. Экзоны представлены тонкими полосами, расположенными поперек геномных последовательностей, причем первый экзон (также первый кодирующий экзон) для обоих генов обозначен старт-кодоном «ATG» над экзоном и последний кодирующий экзон обозначен кодоном «Стоп» над экзоном. Указаны геномный фрагмент мыши размером приблизительно 11074 п. о., который должен быть удален, и геномный фрагмент человека размером 14963 п. о., который должен быть вставлен. Указаны местоположения зондов, использованных в анализе, описанном в примере 2. TM: трансмембранный домен; SRCR: домен, подобный богатому цистеином домену фагоцитарных рецепторов; LDLRa: рецептор липопротеинов низкой плотности класса А.
[0043] На фигуре 2B без соблюдения масштаба проиллюстрирован иллюстративный модифицированный BAC-вектор для гуманизации эндогенного гена Tmprss4 мыши вместе с соединительными последовательностями (SEQ ID NO: 38, 39 и 40).
[0044] На фигуре 2C проиллюстрирована без соблюдения масштаба гуманизированная аллель Tmprss4 после удаления кассеты устойчивости к неомицину вместе с соединительными последовательностями (SEQ ID NO: 41 и 40).
[0045] На фигуре 2D представлено выравнивание последовательностей белка TMPRSS4 человека (SEQ ID NO: 11), белка Tmprss4 мыши (SEQ ID NO: 9) и гуманизированного белка Tmprss4 («мутантного белка 7224») (SEQ ID NO: 14).
[0046] Фигуры 3A-3D. Иллюстративная стратегия гуманизации Tmprss11d мыши.
[0047] На фигуре 3A без соблюдения масштаба показана схема геномной организации генов Tmprss11d мыши и TMPRSS11D человека. Экзоны представлены тонкими полосами, расположенными поперек геномных последовательностей, причем первый экзон (также первый кодонный экзон) для обоих генов обозначен старт-кодоном «ATG» над экзоном и последний кодирующий экзон обозначен кодоном «Стоп» над экзоном. Указаны геномный фрагмент мыши размером приблизительно 35667 п. о., который должен быть удален, и геномный фрагмент человека размером 33927 п. о., который должен быть вставлен. Указаны местоположения зондов, использованных в анализе, описанном в примере 3. TM: трансмембранный домен; SEA: домен, находящийся в белке спермы морского ежа, энтерокиназе и агрине.
[0048] На фигуре 3B без соблюдения масштаба проиллюстрирован иллюстративный модифицированный BAC-вектор для гуманизации эндогенного гена Tmprss11d мыши вместе с соединительными последовательностями (SEQ ID NO: 57, 58 и 59).
[0049] На фигуре 3C проиллюстрирована без соблюдения масштаба гуманизированная аллель Tmprss11 после удаления кассеты устойчивости к неомицину вместе с соединительными последовательностями (SEQ ID NO: 57 и 60).
[0050] На фигуре 3D представлено выравнивание последовательностей белка TMPRSS11D человека (SEQ ID NO: 18), белка Tmprss11d мыши (SEQ ID NO: 16) и гуманизированного белка Tmprss11d («мутантного белка 7226») (SEQ ID NO: 21).
[0051] На фигуре 4 показаны результаты эксперимента, демонстрирующие, что мыши MAID7225 HumInTMPRSS4 не отличались в своей восприимчивости к заражению высокими дозами тяжелого гриппа A H1N1 или тяжелого, адаптированного для мышей H3N2. Мыши MAID7225 HumIn TMRPSS4, которых заражали A/Puerto Rico/08/1934 (H1N1) (светло-серые круги, пунктирная линия), демонстрировали сходный уровень выживаемости при сравнении с мышами дикого типа (светло-серые квадраты, пунктирная линия). Аналогичным образом мыши MAID7225 HumIn TMRPSS4, которых заражали A/Aichi/02/1968-X31 (H3N2) (темно-серые треугольники, пунктирная линия), демонстрировали сходный уровень выживаемости при сравнении с мышами дикого типа (светло-серые перевернутые треугольники, пунктирная линия). Мышей инфицировали IN в 0 день или с помощью 1150 PFU A/Puerto Rico/08/1934 (H1N1), или с помощью 10000 PFU A/Aichi/02/1968-X31 (H3N2). Контрольная группа включала неинфицированных мышей MAID7225 HumIn TMPRSS4, и дикого типа в качестве отрицательного контроля (черные ромбы, жирная линия).
ПОДРОБНОЕ ОПИСАНИЕ КОНКРЕТНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ
[0052] Настоящее изобретение относится к генетически модифицированным грызунам (например, мышам и крысам), характеризующимся гуманизированным геном, кодирующим трансмембранные сериновые протеазы II типа (или «Tmprss» для трансмембранной протеазы/серина). Генетически модифицированные грызуны подходят для применения в скрининге кандидатных соединений, которые специфически целенаправленно воздействуют на молекулу TMPRSS человека для лечения и предупреждения заболеваний, таких как инфекция, вызванная вирусом гриппа. Соответственно, в настоящем изобретении предусмотрены генетически модифицированные грызуны, характеризующиеся гуманизированным геном Tmprss, клетки и ткани, выделенные из генетически модифицированных грызунов, способы и композиции для получения генетически модифицированных грызунов и применение генетически модифицированных грызунов для скрининга и тестирования терапевтических соединений. Различные варианты осуществления настоящего изобретения дополнительно описаны ниже.
Трансмембранные сериновые протеазы II типа («Tmprss»)
[0053] Трансмембранные сериновые протеазы II типа, также называемые в данном документе «Tmprss» в отношении молекул, отличных от молекул человека, или «TMPRSS» в отношении молекул человека («трансмембранные протеазы/серин»), представляют собой семейство белков, характеризующихся N-концевым трансмембранным доменом и C-концевым внеклеточным доменом сериновой протеазы. Были идентифицированы по меньшей мере 18 членов в семействе, которое распределено на четыре подсемейства (Bugge et al. (2009), выше). Все члены разделяют несколько общих структурных признаков, которые определяют семейство, включая (i) короткий N-концевой цитоплазматический домен, (ii) трансмембранный домен и (iii) эктодомен, который содержит домен протеазы и стеблевую область, которая связывает трансмембранный домен с доменом протеазы. Стеблевая область содержит комбинацию модульных структурных доменов шести разных типов: SEA-домен (белок спермы морского ежа/энтеропептидаза/агрин), домен фагоцитарных рецепторов группы A, LDLA-домен (рецептор липопротеинов низкой плотности класса A), CUB-домен (Cls/Clr эмбриональный фактор роста морских ежей, костный морфогенетический белок 1), MAM-домен (меприн/A5 антиген/рецепторная протеинфосфатаза мю) и Frizzled-домен. См. обзор Bugge et al. (2009), выше. Например, TMPRSS2 и TMPRSS4, оба из которых принадлежат к подсемейству гепсина/TMPRSS, характеризуются доменом фагоцитарных рецепторов группы A c предшествующим одним LDLA-доменом в стеблевой области. TMPRSS11D, также известный как «HAT» в отношении трипсиноподобной протеазы дыхательных путей человека, которая принадлежит к подсемейству HAT/DESC, характеризуется одним SEA-доменом. См. фигуру 1 Bugge et al. (2009), выше.
[0054] Трансмембранные сериновые протеазы II типа изначально продуцируются в виде неактивных проферментов, которым необходима активация посредством расщепления последующего основного аминокислотного остатка в консенсусном активационном мотиве, предшествующем домену протеазы. Некоторые из активированных протеаз остаются мембраносвязанными в результате дисульфидной связи между продоменом и доменом протеазы. Внеклеточные домены считаются критически важными для клеточной локализации, активации, ингибирования и/или субстратной специфичности таких протеаз (Bugge et al. (2009), выше; Szabo et al., Int. J. Biochem. Cell Biol. 40: 1297-1316 (2008)).
[0055] Была задокументирована различная биохимическая и патофизиологическая информация в отношении членов трансмембранных сериновых протеаз II типа. Было показано, что TMPRSS2, TMPRSS4 и TMPRSS11D расщепляют in vitro гемагглютинин вируса гриппа A (HA), который представляет собой первую необходимую стадию в жизненном цикле вируса. Предусмотрены генетически модифицированные животные, относящиеся к грызунам, характеризующиеся гуманизированным геном Tmprss, раскрытым в данном документе, пригодные для систем in vivo, которые обеспечивают обстоятельное понимание биологических функций молекул TMPRSS, а также скрининг терапевтических соединений, которые специфически целенаправленно воздействуют на молекулы TMPRSS человека.
[0056] Иллюстративные последовательности Tmprss, включая мышиные, человеческие и гуманизированные последовательности нуклеиновой кислоты и последовательности белка Tmprss, предусмотрены в настоящей заявке и обобщены в следующей таблице. Последовательности праймеров и зондов, применяемых в анализах, описанных в разделе примеров, и вставные соединительные последовательности иллюстративных гуманизированных аллелей Tmprss также включены в таблицу.
Краткое описание последовательностей
SEQ ID NO Описание Признаки
1 Tmprss2 Mus musculus, mRNA, NM_015775.2 Длина: 3175 п. о.
CDS: 231-1703
Экзоны: 1-177; 178-245 (второй экзон и первый кодирующий экзон); 246-465; 466-552; 553-672; 673-799; 800-910; 911-954; 955-1123; 1124-1299; 1300-1395; 1396-1538; 1539-1691; 1692-3161.
2 Tmprss2 Mus musculus, белок Длина: 490 ак
3 TMPRSS2 Homo sapiens, вариант транскрипта 2, mRNA, NM_005656.3 Длина: 3212 п. о.
CDS: 135-1613
Экзоны: 1-78; 79-149 (второй экзон и первый кодирующий экзон); 150-372; 373-459; 460-579; 580-706; 707-817; 818-861; 862-1033; 1034-1209; 1210-1305; 1306-1448; 1449-1601; 1602-3204.
4 TMPRSS2 Homo sapiens, вариант транскрипта 2, белок Длина: 492 ак
Эктодомен: начинается с W106.
5 Геномный фрагмент Tmprss2 для гуманизации Длина: 27947 п. о.
1-84: последовательность мыши
85-25175: последовательность человека (всего 25091 п. о.)
25176-27866: XhoI-LoxP-Cassette-loxP-ICeUI-NheI (всего 2691 п. о.)
27867-27947: последовательность мыши
6 Геномный фрагмент Tmprss2 для гуманизации с удаленной кассетой Длина: 25333 п. о.
1-84: последовательность мыши
85-25175: последовательность человека (всего 25091 п. о.)
25176-25252: XhoI-loxP-ICeUI-NheI (77 п. о.)
25253-25333: последовательность мыши
7 Гуманизированный белок Tmprss2 Длина: 491 aк
8 Tmprss4 Mus musculus, mRNA, NM_145403.2 Длина: 2267 п. о.
CDS: 289-1596
Экзоны: 1-291 (первый экзон и первый кодирующий экзон); 292-325; 326-439; 440-592; 593-722; 723-824; 825-865; 866-1025; 1026-1192; 1193-1291; 1292-1434; 1435-1584; 1585-2267.
9 Tmprss4 Mus musculus, белок Длина: 435 ак
10 TMPRSS4 Homo sapiens, вариант транскрипта 4, mRNA, NM_001173551.1 Длина: 3543 п. о.
CDS: 292-1599
Экзоны: 1-294 (первый экзон и первый кодирующий экзон); 295-328; 329-442; 443-595; 596-725; 726-827; 828-868; 869-1028; 1029-1195; 1196-1294; 1295-1437; 1438-1587; 1588-3529.
11 TMPRSS4 Homo sapiens, вариант транскрипта 4, белок Длина: 437 aк
Эктодомен: начинается с K54.
12 Геномный фрагмент Tmprss4 для гуманизации, содержащий кассету Длина: 20078 п. о.
1-18: последовательность мыши
19-5014: SalI/XhoI-LoxP-hUbi-EM7-Neo-Pm-Cre-loxP-ICeuI-NheI (всего 4996 п. о.)
5015-19977: Последовательность человека (всего 14963 п. о.)
19978-20078: последовательность мыши
13 Геномный фрагмент Tmprss4 для гуманизации с удаленной кассетой Длина: 15159 п. о.
1-18: последовательность мыши
19-95: SalI/XhoI-LoxP-ICeuI-NheI (всего 77 п. о.)
96-15058: Последовательность человека (всего 14963 п. о.)
15059-15159: последовательность мыши
14 Гуманизированный белок Tmprss4 Длина: 435 aк
15 Tmprss11d Mus musculus, mRNA, NM_145561.2 Длина: 2046 п. о.
CDS: 36-1289
Экзоны: 1-43 (первый экзон и первый кодирующий экзон), 44-165, 166-284; 285-352; 353-507;508-546; 547-724; 725-984; 985-1127; 1128-2046.
16 Tmprss11d Mus musculus, белок Длина: 417 aк
17 TMPRSS11D Homo sapiens, mRNA, NM_004262.2 Длина: 2800 п. о.
CDS: 66-1322
Экзоны: 1-73 (первый экзон и первый кодирующий экзон); 74-195; 196-314; 315-382; 383-540; 541-579; 580-757; 758-1017; 1018-1160; 1161-2783.
18 TMPRSS11D Homo sapiens, белок Длина: 418 aк
Эктодомен: начинается с A42.
19 Геномный фрагмент Tmprss11d для гуманизации, содержащий кассету Длина: 38992
1-19: последовательность мыши
20-33946: Последовательность ЧЕЛОВЕКА (всего 33927 п. о.)
33947-38942: XhoI-LoxP-hUbi-EM7-Neo-Pm-Cre-loxP-ICeuI-NheI (всего 4996 п. о.)
38943-38992: последовательность мыши
20 Геномный фрагмент Tmprss11d для гуманизации с удаленной кассетой Длина: 34073 п. о.
1-19: последовательность мыши
20-33946: Последовательность человека (всего 33927 п. о.)
33947-34023: XhoI-LoxP-ICeuI-NheI (77 п. о.)
34024-34073: последовательность мыши
21 Гуманизированный белок Tmprss11d 418 aк
22 Соединительная 5'-последовательность мыши/5'-последовательность человека для гуманизации Tmprss2 5'-Последовательность мыши//5'-последовательность человека
23 Соединительная 3'-последовательность человека/последовательность кассеты для гуманизации Tmprss2 Последовательность человека//XhoI//кассета loxP
24 Соединительная последовательность кассеты/3'-последовательность мыши для гуманизации Tmprss2 Кассета (loxP)/ICEUI//NheI//мыши
25 Соединительная 3'-последовательность человека/loxP/3'-последовательность мыши для гуманизации Tmprss2 3'-Последовательность человека//XhoI//(loxP)/ICEUI//NheI//3'-последовательность мыши
26-37 Праймеры и зонды для анализов с приобретением аллели или потерей аллели для гуманизации Tmprss2 Таблица 1
38 Соединительная 5'-последовательность мыши/последовательность кассеты для гуманизации Tmprss4 5'-Последовательность мыши//SalI-XhoI// кассета (loxP)
39 Соединительная последовательность кассеты/5'-последовательность человека для гуманизации Tmprss4 Кассета (loxP)/ICEUI//NheI//5'-последовательность человека
40 Соединительная 3'-последовательность человека/3'-последовательность мыши для гуманизации Tmprss4 3'-последовательность человека/3'-последовательность мыши
41 Соединительная 5'-последовательность мыши/loxP/5'-последовательность человека для гуманизации Tmprss4 5'-последовательность мыши//SalI/XhoI//(loxP)/ICEUI//NheI//5'-последовательность человека
42-56 Праймеры и зонды для анализов с приобретением аллели или потерей аллели для гуманизации Tmprss4 Таблица 2
57 Соединительная 5'-последовательность мыши/5'-последовательность человека для гуманизации Tmprss11d 5'-последовательность мыши//5'-последовательность человека
58 Соединительная 3'-последовательность человека/последовательность кассеты для гуманизации Tmprss11d 3'-последовательность человека//XhoI//кассета (loxP)
59 Соединительная последовательность кассеты/3'-последовательность мыши для гуманизации Tmprss11d Кассета (loxP)/ICEUI//NheI//3'-мыши
60 Соединительная 3'-последовательность человека/loxP/3'-последовательность мыши для гуманизации Tmprss11d 3'-Последовательность человека//XhoI//(loxP)/ICEUI//NheI//3'-последовательность мыши
61-72 Праймеры и зонды для анализов с приобретением аллели или потерей аллели для гуманизации Tmprss11d Таблица 3
Гуманизированные животные Tmprss, относящиеся к грызунам
[0057] В одном аспекте настоящего изобретения предусмотрены животные, относящиеся к грызунам, которые содержат в зародышевой линии гуманизированный ген Tmprss, кодирующий белок Tmprss человека.
[0058] Термин «гуманизированный», применяемый в контексте нуклеиновых кислот или белков, относится к нуклеиновым кислотам или белкам, чьи структуры (т.е. нуклеотидные или аминокислотные последовательности) содержат части, практически соответствующие или идентичные структурам конкретного гена или белка, обнаруженных в природе у животного, относящегося к грызунам, а также содержат части, отличающиеся от обнаруженных в релевантных гене или белке грызуна, и вместо этого более близко соответствующие или идентичные структурам, обнаруженным в соответствующем гене или белке человека. Грызун, содержащий гуманизированный ген или экспрессирующий гуманизированный белок, является «гуманизированным» грызуном.
[0059] В некоторых вариантах осуществления грызун по настоящему изобретению выбран из мыши, крысы и хомяка. В некоторых вариантах осуществления грызун по настоящему изобретению выбран из надсемейства Muroidea. В некоторых вариантах осуществления генетически модифицированный грызун по настоящему изобретению принадлежит к семейству, выбранному из Calomyscidae (например, мышевидные хомячки), Cricetidae (например, хомяки, крысы и мыши Нового света, полевки), Muridae (настоящие мыши и крысы, песчанки, иглистые мыши, косматые хомяки), Nesomyidae (лазающие мыши, скальные мыши, белохвостые крысы, малагасийские крысы и мыши), Platacanthomyidae (например, колючие соневидные хомяки) и Spalacidae (например, слепыши, бамбуковые крысы и цокоры). В некоторых определенных вариантах осуществления генетически модифицированный грызун по настоящему изобретению выбран из настоящей мыши или крысы (семейство Muridae), песчанки, иглистой мыши и косматого хомяка. В некоторых определенных вариантах осуществления генетически модифицированная мышь по настоящему изобретению является представителем семейства Muridae.
[0060] В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss в геноме, который содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность гена TMPRSS человека, где нуклеотидная последовательность эндогенного гена Tmprss грызуна и нуклеотидная последовательность гена TMPRSS человека функционально связаны друг с другом так, что гуманизированный ген Tmprss кодирует белок Tmprss и находится под контролем 5'-регуляторного элемента(регуляторных элементов), таких как промотор и/или энхансер(энхансеры) эндогенного гена Tmprss грызуна.
[0061] Настоящее изобретение, в частности, направлено на гуманизацию с использованием схожей последовательности; другими словами, нуклеотидная последовательность эндогенного гена Tmprss грызуна функционально связана с нуклеотидной последовательностью родственного гена TMPRSS человека с образованием гуманизированного гена. Например, в некоторых вариантах осуществления, нуклеотидная последовательность эндогенного гена Tmprss2 грызуна функционально связана с нуклеотидной последовательностью гена TMPRSS2 человека с образованием гуманизированного гена Tmprss2. В других вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss4 грызуна функционально связана с нуклеотидной последовательностью гена TMPRSS4 человека с образованием гуманизированного гена Tmprss4. В еще других вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss11d грызуна функционально связана с нуклеотидной последовательностью гена TMPRSS11D человека с образованием гуманизированного гена Tmprss11d.
[0062] В некоторых вариантах осуществления генетически модифицированный грызун по настоящему изобретению содержит гуманизированный ген Tmprss в своем геноме, где гуманизированный ген Tmprss кодирует гуманизированный белок Tmprss, который содержит эктодомен, практически идентичный эктодомену белка TMPRSS человека. Термин «эктодомен» относится к участку трансмембранного белка, который распространяется за пределы клеточной мембраны, т.е. к внеклеточному участку трансмембранного белка. Эктодомен молекулы TMPRSS содержит домен протеазы и стеблевую область, которая связывает трансмембранный домен с доменом протеазы. Под эктодоменом или полипептидом, который является «практически идентичным эктодомену белка TMPRSS человека», в некоторых вариантах осуществления подразумевается полипептид, который по меньшей мере на 85%, 90%, 95%, 95%, 99% или 100% идентичен по последовательности эктодомену белка TMPRSS человека; в некоторых вариантах осуществления полипептид, который отличается от эктодомена белка TMPRSS человека не более чем на 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 аминокислоту(аминокислот); в некоторых вариантах осуществления полипептид, который отличается от эктодомена белка TMPRSS человека только на N- или C- конце эктодомена, например, отсутствием аминокислот или наличием дополнительных аминокислот на N- или C-конце эктодомена; и в некоторых вариантах осуществления полипептид практически идентичен эктодомену белка TMPRSS человека. Под «по сути эктодоменом» белка TMPRSS человека подразумевают полипептид, который идентичен эктодомену или отличается от эктодомена отсутствием 1-5 (т.е. 1, 2, 3, 4 или 5) аминокислот или наличием дополнительных 1-5 аминокислот на N- или C-конце.
[0063] В некоторых вариантах осуществления гуманизированный ген Tmprss кодирует гуманизированный белок Tmprss, который дополнительно содержит цитоплазматический и трансмембранный участки, которые являются практически идентичными цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна. Под цитоплазматическим и трансмембранным участками или полипептидами, которые «практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна» в некоторых вариантах осуществления подразумевают полипептид, который по меньшей мере на 85%, 90%, 95%, 95%, 99% или 100% идентичен по последовательности цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна; в некоторых вариантах осуществления - полипептид, который отличается от цитоплазматического и трансмембранного участков эндогенного белка Tmprss грызуна не более чем на 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 аминокислоту(аминокислот); в некоторых вариантах осуществления - полипептид, который отличается от цитоплазматического и трансмембранного участков эндогенного белка Tmprss грызуна только на C- конце, например, отсутствием аминокислот или наличием дополнительных аминокислот на C-конце трансмембранного домена; и в некоторых вариантах осуществления - полипептид, состоящий из цитоплазматического домена и по сути из трансмембранного домена эндогенного белка Tmprss грызуна. Под «по сути трансмембранным доменом» эндогенного белка Tmprss грызуна подразумевают полипептид, который идентичен трансмембранному домену или отличается от трансмембранного домена отсутствием 1-5 аминокислот или наличием дополнительных 1-5 аминокислот на C-конце.
[0064] В некоторых вариантах осуществления гуманизированный ген Tmprss в геноме генетически модифицированного грызуна содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека, где нуклеотидная последовательность родственного гена TMPRSS человека кодирует полипептид, практически идентичный эктодомену белка TMPRSS человека, кодируемого геном TMPRSS человека. В определенных вариантах осуществления нуклеотидная последовательность родственного гена TMPRSS человека в гуманизированном гене Tmprss кодирует эктодомен белка TMPRSS человека, кодируемого геном TMPRSS человека.
[0065] В некоторых вариантах осуществления гуманизированный ген Tmprss в геноме генетически модифицированного грызуна содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека, где нуклеотидная последовательность эндогенного гена Tmprss грызуна кодирует полипептид, практически идентичный цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого геном Tmprss грызуна. В конкретных вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss грызуна, присутствующая в гуманизированном гене Tmprss, кодирует цитоплазматические и трансмембранные домены эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна.
[0066] В некоторых вариантах осуществления гуманизированный ген Tmprss образован в результате замены нуклеотидной последовательности эндогенного гена Tmprss грызуна в эндогенном локусе Tmprss грызуна нуклеотидной последовательностью родственного гена TMPRSS человека.
[0067] В некоторых вариантах осуществления непрерывная геномная последовательность гена Tmprss грызуна в эндогенном локусе Tmprss грызуна была замещена непрерывной геномной последовательностью родственного гена TMPRSS человека с образованием гуманизированного гена Tmprss.
[0068] В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS человека, вставленная в эндогенный ген Tmprss грызуна, содержит экзоны, полностью или частично, гена TMPRSS человека, который кодирует эктодомен, который практически идентичен эктодомену белка TMPRSS человека, кодируемого геном TMPRSS человека.
[0069] В определенных вариантах осуществления геномная последовательность эндогенного гена Tmprss грызуна, которая остается в эндогенном локусе Tmprss грызуна после замены для гуманизации, функционально связана со вставленной непрерывной геномной последовательностью TMPRSS человека и кодирует цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна.
[0070] В случаях, когда эндогенный белок Tmprss и белок TMPRSS человека делят общие аминокислоты около точки соединения между трансмембранным доменом и эктодоменом, можно необязательно вставлять геномную последовательность TMPRSS человека, которая точно кодирует эктодомен белка TMPRSS человека. Можно вставить немного более длинную или более короткую геномную последовательность гена TMPRSS человека, которая кодирует по сути эктодомен белка TMPRSS человека, в функциональную связь с геномной последовательностью эндогенного гена Tmprss грызуна, которая кодирует цитоплазматический домен и по сути трансмембранный домен эндогенного белка Tmprss грызуна, таким образом, что гуманизированный белок Tmprss, кодируемый образованным в результате гуманизированным геном Tmprss, содержит эктодомен, который идентичен эктодомену белка TMPRSS человека, и трансмембранный домен, который идентичен трансмембранному домену эндогенного белка Tmprss грызуна.
[0071] В некоторых вариантах осуществления нуклеотидная последовательность гена TMPRSS человека, включенная в гуманизированный ген Tmprss, также содержит нетранслируемую 3'-область («UTR») гена TMPRSS человека. В определенных вариантах осуществления, кроме 3'-UTR гена TMPRSS человека, гуманизированный ген Tmprss также содержит дополнительную геномную последовательность человека из локуса гена TMPRSS человека, следующего за 3'-UTR TMPRSS человека. Дополнительная геномная последовательность человека может состоять по меньшей мере из 10-200 п. о., например, 50 п. о., 75 п. о., 100 п. о., 125 п. о., 150 п. о., 175 п. о., 200 п. о. или больше, находящихся в локусе гена TMPRSS человека непосредственно после 3'-UTR гена TMPRSS человека. В других вариантах осуществления нуклеотидная последовательность гена TMPRSS человека, присутствующая в гуманизированном гене Tmprss, не содержит 3'-UTR человека; вместо этого включена 3'-UTR эндогенного гена Tmprss грызуна и следует непосредственно за стоп-кодоном гуманизированного гена Tmprss. Например, гуманизированный ген Tmprss может содержать нуклеотидную последовательность эндогенного гена Tmprss грызуна, содержащую последовательности экзонов, кодирующие цитоплазматические и трансмембранные домены эндогенного белка Tmprss грызуна, за которой следует нуклеотидная последовательность гена TMPRSS человека, содержащая область от последовательностей экзонов, кодирующих эктодомен, до стоп-кодона белка TMPRSS человека с 3'-UTR эндогенного гена Tmprss грызуна, следующей непосредственно после стоп-кодона.
[0072] В некоторых вариантах осуществления гуманизированный ген Tmprss приводит к экспрессии кодируемого гуманизированного белка Tmprss у грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss экспрессируется по паттерну, сравнимому с соответствующим белком Tmprss грызуна или практически такому же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss). В некоторых вариантах осуществления гуманизированный белок Tmprss экспрессируется на уровне, сравнимом с уровнем соответствующего белка Tmprss грызуна или практически таком же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss). В определенных вариантах осуществления гуманизированный белок Tmprss экспрессируется и выявляется на клеточной поверхности. В определенных вариантах осуществления гуманизированный белок Tmprss или растворимая форма (например, форма белка, характеризующаяся отсеченным эктодоменом) экспрессируется и выявляется в сыворотке крови грызуна, например, на уровне, сравнимом с уровнем соответствующего белка Tmprss грызуна или его растворимой формы или практически таком же, у контрольного грызуна. В контексте сравнения гуманизированного гена или белка у гуманизированного грызуна с эндогенным геном или белком грызуна у контрольного грызуна термин «сравнимый» означает, что сравниваемые молекулы или уровни могут не являться идентичными друг другу, но являться достаточно сходными для обеспечения возможности их сравнения, чтобы можно было сделать обоснованные выводы на основании наблюдаемых различий или сходств; и термин «практически такой же» в отношении уровней экспрессии означает, что сравниваемые уровни не отличаются друг от друга более чем на 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% или 1%.
[0073] В некоторых вариантах осуществления настоящее изобретение дополнительно предусматривает выделенную клетку или ткань животного, относящегося к грызунам, описанного в данном документе. В некоторых вариантах осуществления клетка выбрана из дендритной клетки, лимфоцита (например, B- или T-клетки), макрофага и моноцита. В некоторых вариантах осуществления ткань выбрана из жировой ткани, ткани мочевого пузыря, головного мозга, молочной железы, костного мозга, глаза, сердца, кишечника, почки, печени, легкого, лимфатического узла, мышцы, поджелудочной железы, плазмы крови, сыворотки крови, кожи, селезенки, желудка, вилочковой железы, яичка, яйцеклетки и их комбинации.
[0074] В некоторых вариантах осуществления настоящего изобретения предусмотрена эмбриональная стволовая клетка грызуна, геном которой содержит гуманизированный ген Tmprss, описанный в данном документе. В некоторых вариантах осуществления эмбриональная стволовая клетка грызуна представляет собой эмбриональную стволовую клетку мыши. В других вариантах осуществления эмбриональная стволовая клетка грызуна представляет собой эмбриональную стволовую клетку крысы. Эмбриональную стволовую клетку грызуна, содержащую гуманизированный ген Tmprss в своем геноме, можно применять для получения гуманизированного животного, относящегося к грызунам, дополнительно описанного ниже в данном документе.
[0075] В некоторых вариантах осуществления грызун, предусмотренный в данном документе, является гетерозиготным по гуманизированному гену Tmprss в своем геноме. В других вариантах осуществления грызун, предусмотренный в данном документе, является гомозиготным по гуманизированному гену Tmprss в своем геноме.
[0076] В определенных вариантах осуществления грызун содержит множество, т.е. два или более гуманизированных генов Tmprss в своем геноме. Другими словами, два или более разных эндогенных локусов Tmprss у грызуна были гуманизированы с применением нуклеотидных последовательностей родственных генов TMPRSS человека. Например, грызун был гуманизирован в двух или более локусов генов, выбранных из: Tmprss2, Tmprss4 и Tmprss11d.
[0077] Иллюстративные гуманизированные грызуны Tmprss2 (такие, как мыши), гуманизированные грызуны Tmprss4 (такие, как мыши) и гуманизированные грызуны Tmprss11d (такие, как мыши) дополнительно описаны ниже.
Гуманизированные грызуны Tmprss2
[0078] В некоторых вариантах осуществления настоящего изобретения предусмотрен грызун, геном которого содержит гуманизированный ген Tmprss2, который содержит нуклеотидную последовательность эндогенного гена Tmprss2 грызуна и нуклеотидную последовательность гена TMPRSS2 человека, и который находится под контролем регуляторного 5'-элемента(регуляторных элементов), таких как промотор и/или энхансер(энхансеры) эндогенного гена Tmprss2 грызуна. Примеры грызунов включают мышей и крыс.
[0079] В некоторых вариантах осуществления гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который содержит эктодомен, практически идентичный эктодомену белка TMPRSS2 человека.
[0080] В конкретных вариантах осуществления белок TMPRSS2 человека имеет аминокислотную последовательность, характеризующуюся по меньшей мере 85%, 90%, 95%, 98%, 99% или 100% идентичностью аминокислотной последовательности, изложенной под SEQ ID NO: 4.
[0081] В некоторых вариантах осуществления гуманизированный белок Tmprss2 содержит 387 C-концевых аминокислот белка TMPRSS2 человека, например, аминокислоты 106-492 белка TMPRSS2 человека. В некоторых вариантах осуществления гуманизированный белок Tmprss2 содержит эктодомен, который практически идентичен аминокислотной последовательности, состоящей из W106-G492 под SEQ ID NO: 4. В конкретных вариантах осуществления гуманизированный белок Tmprss2 содержит эктодомен, характеризующийся по меньшей мере 85%, 90%, 95%, 98%, 99% или 100% идентичностью аминокислотной последовательности, состоящей из W106-G492 под SEQ ID NO: 4; эктодомен, который отличается от аминокислотной последовательности, состоящей из W106-G492 под SEQ ID NO: 4, не более чем на 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 аминокислоту(аминокислот); или эктодомен, который отличается от аминокислотной последовательности, состоящей из W106-G492 под SEQ ID NO: 4, только на N- или C-конце эктодомена, например, отсутствием 1-5 аминокислот или наличием дополнительных 1-5 аминокислот на N- или C-конце.
[0082] В некоторых вариантах осуществления гуманизированный белок Tmprss2 дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss2 грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss2 дополнительно содержит трансмембранный домен и цитоплазматический домен эндогенного белка Tmprss2 грызуна.
[0083] В конкретных вариантах осуществления гуманизированный белок Tmprss2 содержит трансмембранный домен и цитоплазматический домен эндогенного белка Tmprss2 грызуна и эктодомен белка TMPRSS2 человека. В конкретных вариантах осуществления гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, характеризующийся аминокислотной последовательностью, изложенной под SEQ ID NO: 7.
[0084] В некоторых вариантах осуществления гуманизированный ген Tmprss2 образован в результате замены нуклеотидной последовательности эндогенного гена Tmprss2 грызуна в эндогенном локусе Tmprss2 грызуна нуклеотидной последовательностью гена TMPRSS2 человека.
[0085] В некоторых вариантах осуществления непрерывная геномная последовательность эндогенного гена Tmprss2 грызуна в эндогенном локусе Tmprss2 грызуна была замещена непрерывной геномной последовательностью гена TMPRSS2 человека с образованием гуманизированного гена Tmprss2.
[0086] В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека, вставленная в эндогенный ген Tmprss2 грызуна, содержит последовательности экзонов, т.е., экзоны, полностью или частично, гена TMPRSS2 человека, который кодируют эктодомен, который практически идентичен эктодомену белка TMPRSS2 человека, кодируемым геном TMPRSS2 человека. В случаях, когда эндогенный белок Tmprss2 и белок TMPRSS2 человека делят общие аминокислоты около точки соединения трансмембранного домена с эктодоменом, можно необязательно вставлять геномную последовательность TMPRSS2 человека, которая точно кодирует эктодомен белка TMPRSS2 человека, при этом можно применять немного более длинную или более короткую геномную последовательность TMPRSS2 человека, которая кодирует по сути эктодомен белка TMPRSS2 человека, чтобы получить гуманизированный белок Tmprss2, характеризующийся эктодоменом, который идентичен эктодомену белка TMPRSS2 человека.
[0087] В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека, вставляемая в эндогенный ген Tmprss2 грызуна, содержит по меньшей мере область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS2 человека.
[0088] В определенных вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека, вставляемая в эндогенный ген Tmprss2 грызуна, содержит интрон 3 и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS2 человека. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека, вставляемая в эндогенный ген Tmprss 2 грызуна, содержит 3'-часть кодирующего экзона 3, интрон 3 и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS2 человека. В конкретных вариантах осуществления 3'-часть кодирующего экзона 3 гена TMPRSS2 человека, применяемая в гуманизации, составляет приблизительно 5-10 пар оснований в длину, т.е. приблизительно 5, 6, 7, 8, 9 или 10 пар оснований 3'-конца кодирующего экзона 3.
[0089] В некоторых вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека, вставляемая в эндогенный ген Tmprss2 грызуна, также содержит 3'-UTR гена TMPRSS2 человека. В конкретных вариантах осуществления полный кодирующий экзон 13 гена TMPRSS2 человека включен в непрерывную геномную последовательность TMPRSS2 человека для гуманизации, которая содержит 3'-UTR гена TMPRSS2 человека. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека содержит дополнительную геномную последовательность человека после 3'-UTR гена TMPRSS2 человека. Дополнительная геномная последовательность человека может представлять собой последовательность по меньшей мере из 10-200 п. о. или по меньшей мере из 10, 20, 30, 40, 50, 75, 100, 125, 150, 175 или 200 п. о., которая находится непосредственно после 3'-UTR гена TMPRSS2 человека в локусе TMPRSS2 человека.
[0090] В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss2 грызуна, остающаяся в локусе гуманизированного Tmprss2, кодирует полипептид, который практически идентичен цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss2 грызуна. В случаях, когда эндогенный белок Tmprss2 и белок TMPRSS2 человека делят общие аминокислоты около точки соединения трансмембранного домена с эктодоменом, можно необязательно сохранять эндогенную геномную последовательность Tmprss2 грызуна, которая точно кодирует трансмембранный домен эндогенного белка Tmprss2 грызуна, и можно сохранить немного более длинную или более короткую геномную последовательность Tmprss2 грызуна, которая кодирует по сути трансмембранный домен эндогенного белка Tmprss2 грызуна при замене для гуманизации, чтобы кодировать гуманизированный белок Tmprss2, характеризующийся трансмембранным доменом, который идентичен трансмембранному эндогенного белка Tmprss2 грызуна. В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss2 грызуна, остающаяся в локусе гуманизированного Tmprss2, содержит экзоны 1-2 и 5'-часть кодирующего экзона 3 эндогенного гена Tmprss2 грызуна, где 5'-часть кодирующего экзона 3 представляет собой существенную часть экзона 3, состоящего из кодонов, например, полный кодирующий экзон 3, за исключением 5-10 пар оснований на 3'-конце кодирующего экзона 3.
[0091] В конкретных вариантах осуществления гуманизированный ген Tmprss2 содержит кодирующие экзоны 1-2, и 5'-часть кодирующего экзона 3 эндогенного гена Tmprss2 грызуна, и 3'-часть кодирующего экзона 3 и область от кодирующего экзона 4 до кодирующего экзона 13 гена TMPRSS2 человека, где гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам белка Tmprss2 грызуна, и эктодомен, который практически идентичен эктодомену белка TMPRSS2 человека. В определенных вариантах осуществления гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который содержит цитоплазматический домен и трансмембранный домены белка Tmprss2 грызуна, кодируемого эндогенным геном Tmprss2 грызуна, и эктодомен белка TMPRSS2 человека, кодируемого геном TMPRSS2 человека. В конкретных вариантах осуществления гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, характеризующийся аминокислотной последовательностью, изложенной под SEQ ID NO: 7.
[0092] В некоторых вариантах осуществления экзоны и интроны гена TMPRSS2 человека и гена Tmprss2 грызуна, применяемых в гуманизации, представляют собой находящиеся в SEQ ID NO: 1, 3 и 5-6.
[0093] В некоторых вариантах осуществления гуманизированный ген Tmprss2 приводит к экспрессии кодируемого гуманизированного белка Tmprss2 у грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss2 экспрессируется по паттерну, сравнимому с соответствующим белком Tmprss2 грызуна или практически такому же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss2). В некоторых вариантах осуществления гуманизированный белок Tmprss2 экспрессируется на уровне, сравнимом с соответствующим белком Tmprss2 грызуна или практически таком же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss2). В определенных вариантах осуществления белок Tmprss2 человека экспрессируется и выявляется на клеточной поверхности. В определенных вариантах осуществления белок Tmprss2 человека или растворимая форма (например, форма белка, характеризующаяся отсеченным эктодоменом) экспрессируется и выявляется в сыворотке крови грызуна, например, на уровне, сравнимом с уровнем соответствующего белка Tmprss2 грызуна или его растворимой формы или практически таком же, у контрольного грызуна.
Гуманизированные грызуны Tmprss4
[0094] В некоторых вариантах осуществления настоящего изобретения предусмотрен грызун, в геноме которого содержится гуманизированный ген Tmprss4, который содержит нуклеотидную последовательность эндогенного гена Tmprss4 грызуна и нуклеотидную последовательность гена TMPRSS4 человека, и который находится под контролем регуляторного 5'-элемента(регуляторных элементов), таких как промотор и/или энхансер(энхансеры) эндогенного гена Tmprss4 грызуна. Примеры грызунов включают мышей и крыс.
[0095] В некоторых вариантах осуществления гуманизированный ген Tmprss4 кодирует гуманизированный белок Tmprss4, который содержит эктодомен, практически идентичный эктодомену белка TMPRSS4 человека. В конкретных вариантах осуществления белок TMPRSS4 человека имеет аминокислотную последовательность, характеризующуюся по меньшей мере 85%, 90%, 95%, 98%, 99% или 100% идентичностью аминокислотной последовательности, изложенной под SEQ ID NO: 11.
[0096] В некоторых вариантах осуществления гуманизированный белок Tmprss4 содержит 384 C-концевых аминокислот белка TMPRSS4 человека, например аминокислоты 54-437 белка TMPRSS4 человека. В некоторых вариантах осуществления гуманизированный белок Tmprss4 содержит эктодомен, который практически идентичен аминокислотной последовательности, состоящей из K54-L437 под SEQ ID NO: 11. В конкретных вариантах осуществления гуманизированный белок Tmprss4 содержит эктодомен, характеризующийся по меньшей мере 85%, 90%, 95%, 98%, 99% или 100% идентичностью аминокислотной последовательности, состоящей из K54-L437 под SEQ ID NO: 11; эктодомен, который отличается от аминокислотной последовательности, состоящей из K54-L437 под SEQ ID NO: 11, не более чем на 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 аминокислоту(аминокислот); или эктодомен, который отличается от аминокислотной последовательности, состоящей из K54-L437 под SEQ ID NO: 11, только на N- или C-конце эктодомена, например, отсутствием 1-5 аминокислот или наличием дополнительных 1-5 аминокислот на N- или C-конце.
[0097] В некоторых вариантах осуществления гуманизированный белок Tmprss4 дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss4 грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss4 дополнительно содержит трансмембранный домен и цитоплазматический домен эндогенного белка Tmprss4 грызуна.
[0098] В конкретных вариантах осуществления гуманизированный белок Tmprss4 содержит трансмембранный домен и цитоплазматический домен эндогенного белка Tmprss4 грызуна и эктодомен белка TMPRSS4 человека. В конкретных вариантах осуществления гуманизированный ген Tmprss4 кодирует гуманизированный белок Tmprss4, характеризующийся аминокислотной последовательностью, изложенной под SEQ ID NO: 14.
[0099] В некоторых вариантах осуществления гуманизированный ген Tmprss4 образован в результате замены нуклеотидной последовательности эндогенного гена Tmprss4 грызуна в эндогенном локусе Tmprss4 грызуна нуклеотидной последовательностью гена TMPRSS4 человека.
[00100] В некоторых вариантах осуществления непрерывная геномная последовательность эндогенного гена Tmprss4 грызуна в эндогенном локусе Tmprss4 грызуна была замещена непрерывной геномной последовательностью гена TMPRSS4 человека с образованием гуманизированного гена Tmprss4.
[00101] В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS4 человека, вставленная в эндогенный ген Tmprss4 грызуна, содержит последовательности экзонов, т.е. экзоны, полностью или частично, гена TMPRSS4 человека, которые кодируют эктодомен, который практически идентичен эктодомену белка TMPRSS4 человека, кодируемому геном TMPRSS4 человека. В случаях, когда эндогенный белок Tmprss4 и белок TMPRSS4 человека делят общие аминокислоты около точки соединения трансмембранного домена с эктодоменом, можно необязательно вставлять геномную последовательность TMPRSS4 человека, которая точно кодирует эктодомен белка TMPRSS4 человека, при этом можно применять немного более длинную или более короткую геномную последовательность TMPRSS4 человека, которая кодирует по сути эктодомен белка TMPRSS4 человека, чтобы получить гуманизированный белок Tmprss4, характеризующийся эктодоменом, который идентичен эктодомену белка TMPRSS4 человека.
[00102] В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS4 человека, вставляемая в эндогенный ген Tmprss4 грызуна, содержит по меньшей мере область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека.
[00103] В определенных вариантах осуществления непрерывная геномная последовательность гена TMPRSS4 человека, вставляемая в эндогенный ген Tmprss4 грызуна, содержит 3'-часть интрона 3 и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека. В конкретных вариантах осуществления 3'-часть интрона 3 гена TMPRSS4 человека, применяемая в гуманизации, составляет приблизительно 140-160 пар оснований в длину, т.е. приблизительно 140, 145, 150, 155, 160 пар оснований 3'-конца интрона 3.
[00104] В некоторых вариантах осуществления непрерывная геномная последовательность гена TMPRSS4 человека, вставляемая в эндогенный ген Tmprss4 грызуна, содержит 3'-UTR гена TMPRSS4 человека. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS4 человека, вставляемая в эндогенный ген Tmprss4 грызуна, не содержит 3'-UTR гена TMPRSS4 человека и 3'-UTR эндогенного гена Tmprss4 грызуна, следующего непосредственно после стоп-кодона в гуманизированном гене Tmprss4.
[00105] В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss4 грызуна, остающаяся в локусе гуманизированного Tmprss4, кодирует полипептид, который практически идентичен цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss4 грызуна. В случаях, когда эндогенный белок Tmprss4 и белок TMPRSS4 человека делят общие аминокислоты около точки соединения трансмембранного домена с эктодоменом, можно необязательно сохранять эндогенную геномную последовательность Tmprss4 грызуна, которая точно кодирует трансмембранный домен эндогенного белка Tmprss4 грызуна, и можно сохранить немного более длинную или более короткую геномную последовательность Tmprss4 грызуна, которая кодирует по сути трансмембранный домен эндогенного белка Tmprss4 грызуна при замене для гуманизации, чтобы кодировать гуманизированный белок Tmprss4, характеризующийся трансмембранным доменом, который идентичен трансмембранному эндогенного белка Tmprss4 грызуна.
[00106] В конкретных вариантах осуществления гуманизированный ген Tmprss4 содержит кодирующие экзоны 1-3 эндогенного гена Tmprss4 грызуна и область от кодирующего экзона 4 до стоп-кодона кодирующего экзона 13 гена TMPRSS4 человека. В конкретных вариантах осуществления гуманизированный ген Tmprss4 содержит кодирующие экзоны 1-3 и 5'-часть интрона 3 эндогенного гена Tmprss4 грызуна и 3'-часть интрона 3 и область от кодирующего экзона 4 до стоп-кодона кодирующего экзона 13 гена TMPRSS4 человека. В определенных вариантах осуществления гуманизированный ген Tmprss4 кодирует гуманизированный белок Tmprss4, который содержит цитоплазматический домен и трансмембранный домен белка Tmprss4 грызуна, кодирумого эндогенным геном Tmprss4 грызуна, и эктодомен белка TMPRSS4 человека, кодируемого геном TMPRSS4 человека. В конкретных вариантах осуществления гуманизированный ген Tmprss4 кодирует гуманизированный белок Tmprss4, характеризующийся аминокислотной последовательностью, изложенной под SEQ ID NO: 14.
[00107] В некоторых вариантах осуществления экзоны и интроны гена TMPRSS4 человека и гена Tmprss4 грызуна, применяемые в гуманизации, представляют собой находящиеся в SEQ ID NO: 8, 10 и 12-13.
[00108] В некоторых вариантах осуществления гуманизированный ген Tmprss4 приводит к экспрессии кодируемого белка Tmprss4 человека у грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss4 экспрессируется по паттерну, сравнимому с соответствующим белком Tmprss4 грызуна или практически такому же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss4, кодирующего гуманизированный белок Tmprss4). В некоторых вариантах осуществления гуманизированный белок Tmprss4 экспрессируется на уровне, сравнимом с соответствующим белком Tmprss4 грызуна или практически таком же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss4, кодирующего гуманизированный белок Tmprss4). В определенных вариантах осуществления белок Tmprss4 человека экспрессируется и выявляется на клеточной поверхности. В определенных вариантах осуществления гуманизированный белок Tmprss4 или растворимая форма (например, форма белка, характеризующаяся отсеченным эктодоменом) экспрессируется и выявляется в сыворотке крови грызуна, например, на уровне, сравнимом с уровнем соответствующего белка Tmprss4 грызуна или растворимой формы или практически таком же, у контрольного грызуна.
Гуманизированные грызуны Tmprss11d
[00109] В некоторых вариантах осуществления настоящего изобретения предусмотрен грызун, геном которого содержит гуманизированный ген Tmprss11d, который содержит нуклеотидную последовательность эндогенного гена Tmprss11d грызуна и нуклеотидную последовательность гена TMPRSS11D человека, и который находится под контролем регуляторного 5'-элемента (регуляторных элементов), таких как промотор и/или энхансер(энхансеры) эндогенного гена Tmprss11d грызуна. Примеры грызунов включают мышей и крыс.
[00110] В некоторых вариантах осуществления гуманизированный ген Tmprss11d кодирует гуманизированный белок Tmprss11d, который содержит эктодомен, практически идентичный эктодомену белка TMPRSS11D человека.
[00111] В конкретных вариантах осуществления белок TMPRSS11D человека имеет аминокислотную последовательность, характеризующуюся по меньшей мере 85%, 90%, 95%, 98%, 99% или 100% идентичностью аминокислотной последовательности, изложенной под SEQ ID NO: 18.
[00112] В некоторых вариантах осуществления гуманизированный белок Tmprss11d содержит 377 C-концевых аминокислот белка TMPRSS11D человека, например, аминокислоты 42-418 белка TMPRSS11D человека. В некоторых вариантах осуществления гуманизированный белок Tmprss11d содержит эктодомен, который практически идентичен аминокислотной последовательности, состоящей из A42-I418 SEQ ID NO: 18. В конкретных вариантах осуществления гуманизированный белок Tmprss11d содержит эктодомен, характеризующийся по меньшей мере 85%, 90%, 95%, 98%, 99% или 100% идентичностью аминокислотной последовательности, состоящей из A42-I418 SEQ ID NO: 18; эктодомен, который отличается от аминокислотной последовательности, состоящей из A42-I418 SEQ ID NO: 18, не более чем на 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 аминокислоту (аминокислот); или эктодомен, который отличается от аминокислотной последовательности, состоящей из A42-I418 SEQ ID NO: 18, только на N- или C-конце, например, отсутствием 1-5 аминокислот или наличием дополнительных 1-5 аминокислот на N- или C-конце.
[00113] В некоторых вариантах осуществления гуманизированный белок Tmprss11d дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss11d грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss11d содержит трансмембранный домен и цитоплазматический домен эндогенного белка Tmprss11d грызуна.
[00114] В конкретных вариантах осуществления гуманизированный белок Tmprss11d содержит трансмембранный домен и цитоплазматический домен эндогенного белка Tmprss11d грызуна и эктодомен белка TMPRSS11D человека. В конкретных вариантах осуществления гуманизированный ген Tmprss11d кодирует гуманизированный белок Tmprss11d, характеризующийся аминокислотной последовательностью, изложенной под SEQ ID NO: 21.
[00115] В некоторых вариантах осуществления гуманизированный ген Tmprss11d образован в результате замены нуклеотидной последовательности эндогенного гена Tmprss11d грызуна в эндогенном локусе Tmprss11d грызуна нуклеотидной последовательностью гена TMPRSS11D человека.
[00116] В некоторых вариантах осуществления непрерывная геномная последовательность эндогенного гена Tmprss11d грызуна в эндогенном локусе Tmprss11d грызуна была замещена непрерывной геномной последовательностью гена TMPRSS11D человека с образованием гуманизированного гена Tmprss11d. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS11D человека, вставленная в эндогенный ген Tmprss11d грызуна и содержит последовательности экзонов, т.е. экзоны, полностью или частично, гена TMPRSS11D человека, которые кодируют эктодомен, который практически идентичен эктодомену белка TMPRSS11D человека, кодируемого геном TMPRSS11D человека. В случаях, когда эндогенный белок Tmprss11d и белок TMPRSS11D человека делят общие аминокислоты около точки соединения трансмембранного домена с эктодоменом, можно необязательно вставлять геномную последовательность TMPRSS11D человека, которая точно кодирует эктодомен белка TMPRSS11D человека, при этом можно применять немного более длинную или более короткую геномную последовательность TMPRSS11D человека, которая кодирует по сути эктодомен белка TMPRSS11D человека, чтобы получить гуманизированный белок Tmprss11d, характеризующийся эктодоменом, который идентичен эктодомену белка TMPRSS11D человека.
[00117] В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS11D человека, вставленная в эндогенный ген Tmprss11d грызуна, содержит область по меньшей мере от кодирующего экзона 3 до стоп-кодона в кодирующем экзоне 10 гена TMPRSS11D человека.
[00118] В определенных вариантах осуществления непрерывная геномная последовательность гена TMPRSS11D человека, вставляемая в эндогенный ген Tmprss11d грызуна, содержит по меньшей мере 3'-часть интрона 2 и область от кодирующего экзона 3 до стоп-кодона в кодирующем экзоне 10 гена TMPRSS11D человека. В конкретных вариантах осуществления 3'-часть интрона 2 гена TMPRSS2 человека, применяемая в гуманизации, состоит из приблизительно 444 пар оснований в длину.
[00119] В некоторых вариантах осуществления непрерывная геномная последовательность гена TMPRSS11D человека, вставляемая в эндогенный ген Tmprss11d грызуна, содержит 3'-UTR гена TMPRSS11D человека. В конкретных вариантах осуществления полный кодирующий экзон 10 гена TMPRSS11D человека включен в непрерывную геномную последовательность TMPRSS11D человека для гуманизации, которая содержит 3'-UTR гена TMPRSS11D человека. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS11D человека содержит дополнительную геномную последовательность человека после 3'-UTR гена TMPRSS11D человека. Дополнительная геномная последовательность человека может представлять собой последовательность из 10-200 п. о., 50-200 п. о. или приблизительно из 150, 160, 170, 180 п. о., которая находится непосредственно после 3'-UTR гена TMPRSS11D человека в локусе TMPRSS11D человека.
[00120] В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss11d грызуна, остающаяся в гуманизированном локусе Tmprss11d, кодирует полипептид, который практически идентичен цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss11d грызуна, кодируемого эндогенным геном Tmprss11d грызуна. В случаях, когда эндогенный белок Tmprss11d и белок TMPRSS11D человека делят общие аминокислоты около точки соединения трансмембранного домена с эктодоменом, можно необязательно сохранять эндогенную геномную последовательность Tmprss11d грызуна, которая точно кодирует трансмембранный домен эндогенного белка Tmprss11d грызуна, и можно сохранить немного более длинную или более короткую геномную последовательность Tmprss11d грызуна, которая кодирует по сути трансмембранный домен эндогенного белка Tmprss11d грызуна при замене для гуманизации, чтобы кодировать гуманизированный белок Tmprss11d, характеризующийся трансмембранным доменом, который идентичен трансмембранному эндогенного белка Tmprss11d грызуна.
[00121] В конкретных вариантах осуществления гуманизированный ген Tmprss11d содержит кодирующие экзоны 1-2 эндогенного гена Tmprss11d грызуна и область от кодирующего экзона 3 до кодирующего экзона 10 гена TMPRSS11D человека. В определенных вариантах осуществления гуманизированный ген Tmprss11d кодирует гуманизированный белок Tmprss11d, который содержит цитоплазматический домен и трансмембранный домен белка Tmprss11d грызуна, кодируемый эндогенным геном Tmprss11d грызуна, и эктодомен белка TMPRSS11D человека, кодируемого геном TMPRSS11D человека. В конкретных вариантах осуществления гуманизированный ген Tmprss11d кодирует гуманизированный белок Tmprss11d, характеризующийся аминокислотной последовательностью, изложенной под SEQ ID NO: 21.
[00122] В некоторых вариантах осуществления экзоны и интроны гена TMPRSS11D человека и гена Tmprss11d грызуна, применяемые в гуманизации, представляют собой находящиеся в SEQ ID NO: 15, 17 и 19-20.
[00123] В некоторых вариантах осуществления гуманизированный ген Tmprss11D приводит к экспрессии кодируемого гуманизированного белка Tmprss11d у грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss11d экспрессируется по паттерну, сравнимому с соответствующим белком Tmprss11d грызуна или практически такому же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss11d, кодирующего гуманизированный белок Tmprss11d). В некоторых вариантах осуществления гуманизированный белок Tmprss11d экспрессируется на уровне, сравнимом с соответствующим белком Tmprss11d грызуна или практически таком же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss11d, кодирующего гуманизированный белок Tmprss11d). В определенных вариантах осуществления белок Tmprss11d человека экспрессируется и выявляется на клеточной поверхности. В определенных вариантах осуществления гуманизированный белок Tmprss11d или растворимая форма (например, форма белка, характеризующаяся отсеченным эктодоменом) экспрессируется и выявляется в сыворотке крови грызуна, например, на уровне, сравнимом с уровнем соответствующего белка Tmprss11d грызуна или растворимой формы или практически таком же, у контрольного грызуна.
Способы получения гуманизированных животных Tmprss, относящихся к грызунам
[00124] Дополнительные аспекты настоящего изобретения направлены на способы получения гуманизированных грызунов Tmprss, описанных выше, а также векторов на основе нуклеиновой кислоты и эмбриональных стволовых клеток, отличных от человеческих, подходящих для применения в получении гуманизированного грызуна Tmprss.
[00125] Грызунов, предусмотренных в данном документе, можно получать с применением способов, известных из уровня техники. В иллюстративных вариантах осуществления клон бактериальной искусственной хромосомы (BAC), несущий ген Tmprss грызуна, можно модифицировать с применением бактериальной гомологичной рекомбинации и технологии VELOCIGENE® (см., например, U.S. 6586251 и Valenzuela et al. (2003), High-throughput engineering of the mouse genome coupled with high-resolution expression analysis, Nature Biotech. 21(6):652-659). В результате нуклеотидная последовательность Tmprss грызуна была удалена из исходного клона BAC и была вставлена нуклеотидная последовательность Tmprss человека, что привело к образованию модифицированного клона BAC, несущего гуманизированный ген Tmprss, фланкированный гомологичными 5'-и 3'-участками грызуна. Модифицированный клон BAC при достижении линеаризации можно вводить в эмбриональную стволовую клетку (ES) грызуна посредством, например, электропорации. Как клетки ES мыши, так и клетки ES крысы были описаны в уровне техники. См., например, US 7576259, 7659442, 7294754 и 2008-0078000 A1 (которые включены в данный документ посредством ссылки), в которых описаны клетки ES мыши и способ VELOCIMOUSE® для получения генетически модифицированной мыши; US 2014/0235933 A1, US 2014/0310828 A1, Tong et al. (2010) Nature 467:211-215, and Tong et al. (2011) Nat Protoc. 6(6): doi:10.1038/nprot.2011.338 (которые включены в данный документ посредством ссылки), где описаны клетки ES крысы и способы получения генетически модифицированной крысы.
[00126] Можно выбрать клетки ES, характеризующиеся гуманизированным геном Tmprss интегрированным в геном. В некоторых вариантах осуществления клетки ES, характеризующиеся гуманизированным геном Tmprss, интегрированным в эндогенный локус Tmprss грызуна, можно выбрать на основании результатов анализов потери аллели грызуна и/или приобретения аллели человека. Выбранные клетки ES затем применяют в качестве донорных клеток ES для инъекции в эмбрион на стадии развития, предшествующей моруле (например, эмбрион на стадии 8 клеток) путем применения способа VELOCIMOUSE® (см., например, US 7576259, US 7659442, US 7294754 и US 2008-0078000 A1), или способов, описанных в US 2014/0235933 A1 и US 2014/0310828 A1. Эмбрион, содержащий донорные клетки ES, инкубируют до стадии бластоцисты и затем имплантируют суррогатной матери, чтобы получить грызуна F0, полностью полученного из донорных клеток ES. Детенышей грызунов, несущих гуманизированный ген Tmprss, можно идентифицировать посредством генотипирования ДНК, выделенной из отрезанных фрагментов хвостов потери аллели грызуна и/или приобретения аллели человека.
[00127] Грызунов, гетерозиготных по гуманизированному гену Tmprss, можно скрещивать с получением гомозиготных грызунов. Грызунов, содержащих один гуманизированный ген Tmprss, можно скрещивать с грызунами, содержащими другой гуманизированный ген Tmprss, с получением грызунов, содержащих множество гуманизированных генов Tmprss. Например, грызунов, содержащих гуманизированный ген Tmprss2, можно скрещивать с грызунами, содержащими гуманизированный ген Tmprss4, с получением грызунов, содержащих гуманизированный ген Tmprss2 и гуманизированный ген Tmprss4.
Способы применения грызунов, характеризующихся гуманизированными генами Tmprss
[00128] Грызуны, раскрытые в данном документе, обеспечивают применимую систему in vivo и источник биологических материалов (например, клеток), экспрессирующих гуманизированные белки Tmprss человека для идентификации и тестирования соединений, которые специфически целенаправленно воздействуют на белки TMPRSS человека.
[00129] В одном аспекте грызуна, раскрытого в данном документе, применяют для определения способности кандидатного соединения, такого как ингибитор белка TMPRSS человека, лечить и/или предупреждать инфекцию, вызванную вирусом гриппа.
[00130] В некоторых вариантах осуществления грызуну, содержащему гуманизированный ген Tmprss и экспрессирующему белок Tmprss человека, раскрытые в данном документе, вводят кандидатное соединение перед экспериментальной инфекцией вирусом гриппа. Профилактическую эффективность соединения можно оценивать путем определения, демонстрирует ли грызун меньшее количество симптомов инфекции, вызванной вирусом гриппа, и/или их меньшую тяжесть и/или улучшенную жизнеспособность по сравнению с контрольным грызуном (контрольными грызунами).
[00131] В других вариантах осуществления грызуну, содержащему гуманизированный ген Tmprss и экспрессирующему белок Tmprss человека, содержащий эктодомен белка TMPRSS человека, вводят кандидатный ингибитор этого белка TMPRSS человека после экспериментальной инфекции вирусом гриппа. Эффективность лечения с помощью кандидатного ингибитора можно оценивать путем определения, демонстрирует ли грызун меньшее количество симптомов инфекции, вызванной вирусом гриппа, и/или их меньшую тяжесть и/или улучшенную жизнеспособность по сравнению с контрольным грызуном (контрольными грызунами).
[00132] Подходящие контрольные грызуны включают, например, грызунов, содержащих гуманизированный ген Tmprss, не подвергавшихся экспериментальной инфекции; и грызунов, содержащих гуманизированный ген Tmprss, подвергавшихся экспериментальной инфекции без введения какого-либо соединения; и грызунов, содержащих гуманизированный ген Tmprss, подвергавшихся экспериментальной инфекции и введению соединения, известного как терапевтически эффективное.
[00133] Соединения, которые можно оценивать с помощью способов по настоящему изобретению, включают кандидатные ингибиторы TMPRSS, например низмолекулярный ингибитор протеазы, ингибитор на основе нуклеиновых кислот (например, siRNA, рибозим, антисмысловая конструкция и т.д.), антигенсвязывающий белок (например, антитело или его антигенсвязывающий фрагмент) или блокирующий пептид/пептидный ингибитор. Ингибитор TMPRSS может функционировать путем ингибирования или снижения способности белка TMPRSS протеолитически расщеплять белок-предшественник гемагглютинина (HA0) на субъединицы HA1 и HA2.
[00134] В некоторых вариантах осуществления кандидатный ингибитор представляет собой антитело или его антигенсвязывающий фрагмент. Как моноклональные, так и поликлональные антитела подходят для целей настоящего изобретения. В конкретных вариантах осуществления антитело специфически связывает белок TMPRSS и ингибирует протеазную активность данного белка TMPRSS и практически не ингибирует протеазную активность другого белка TMPRSS. Например, ингибитор, представляющий собой антитело к TMPRSS2, специфически связывает белок TMPRSS2 и ингибирует протеазную активность белка TMPRSS2 и не оказывает эффекта на протеолитическую активность TMPRSS4 или TMPRSS11D, или снижает протеолитическую активность TMPRSS4 или TMPRSS11D не более чем на 25% (например, на 20%, 15%, 10%, 5% или меньше) по сравнению с неингибиторной контрольной молекулой, протестированной в идентичных или практически идентичных условиях эксперимента.
[00135] В некоторых вариантах осуществления ингибитор представляет собой антитело к TMPRSS2 или его антигенсвязывающий фрагмент. В некоторых вариантах осуществления ингибитор представляет собой антитело к TMPRSS4 или его антигенсвязывающий фрагмент. В других вариантах осуществления ингибитор представляет собой антитело к TMPRSS11D или его антигенсвязывающий фрагмент.
[00136] Экспериментальную инфекцию, вызванную вирусом гриппа, можно индуцировать и контролировать, следуя известным протоколам. См., например, US 2013/0273070 A1. Например, животным, относящимся к грызунам, вирус гриппа можно ввести интраназально. Инфицированных животных можно оценивать с помощью определения симптомов и тяжести инфекции. Например, животных можно анализировать по (1) изменению массы тела и выживаемости, (2) клеточным изменениям посредством проточной цитометрии, (3) иммунохимии, окрашиваний PAS и H&E целых легких и (4) уровням цитокинов в сыворотке крови. Контрольные животные, про которых известно, что они восприимчивы к вирусу, демонстрируют существенное увеличение уровня дендритных клеток, грипп-позитивных альвеолярных макрофагов, нейтрофилов или эпителиальных клеток в легких и уровней IFNγ по сравнению с неинфицированными животными.
ПРИМЕРЫ
[00137] Следующие примеры приведены для того, чтобы обеспечить специалистов в данной области описанием того, как создавать и применять способы и композиции по настоящему изобретению, и не предназначены для ограничения объема того, что авторы настоящего изобретения рассматривают в качестве своего изобретения. Если не указано иное, температура указана по Цельсию, а давление является атмосферным или близким к нему.
Пример 1. Гуманизация эндогенного гена Tmprss2
[00138] В данном примере показаны иллюстративные способы гуманизации эндогенного гена, кодирующего Tmprss2 у грызуна (например, мыши). Способы, описанные в данном примере, при необходимости можно применять для гуманизации эндогенного гена Tmprss2 грызуна с применением любой последовательности человека или комбинации последовательностей человека (или фрагментов последовательностей).
[00139] Нацеливающий вектор для гуманизации эндогенного гена Tmprss2 конструировали с применением клонов бактериальной искусственной хромосомы (BAC) и технологии VELOCIGENE® (см., например, патент США № 6586251 и Valenzuela et al. (2003) High-throughput engineering of the mouse genome coupled with high-resolution expression analysis, Nature Biotech. 21(6):652-659; включенные в данный документ посредством ссылки).
[00140] Вкратце, клон бактериальной искусственной хромосомы (BAC) мыши bMQ-264A15, содержащий ген Tmprss2 мыши, применяли и модифицировали следующим образом. Получали фрагмент ДНК, содержащий гомологичную нуклеотидную 5'-последовательность мыши, геномную ДНК TMPRSS2 человека, состоящую из приблизительно 25091 п. о. (содержащую последние 7 п. о. кодирующего экзона 3, интрон 3 и область от кодирующего экзон 4 до кодирующего экзона 13 (включая 3'-UTR, которая представляет собой часть кодирующего экзона 13) гена TMPRSS2 человека), самоудаляющуюся кассету устойчивости к неомицину, состоящую из приблизительно 2691 п. о., и гомологичную 3'-последовательность мыши. Данный фрагмент ДНК применяли для модификации клона BAC bMQ-264A15 посредством гомологичной рекомбинации в бактериальных клетках. В результате геномный фрагмент Tmprss2 мыши (состоящий из приблизительно 25291 п. о.), кодирующий эктодомен в клоне BAC, замещали геномным фрагментом TMPRSS2 человека, состоящим из приблизительно 25091 п. о., после которого расположена самоудаляющаяся кассета устойчивости к неомицину, состоящая из приблизительно 2691 п. о. В частности, геномный фрагмент Tmprss2 мыши, который замещали, содержал последние 7 п. о. кодирующего экзона 3, интрон 3 и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена Tmprss2 мыши (фигуры 1A-1B). Геномный фрагмент TMPRSS2 человека, который вставляли, содержал последние 7 п. о. кодирующего экзона 3, интрон 3 и область от кодирующего экзона 4 до кодирующего экзона 13 гена TMPRSS2 человека (включая 3'-UTR TMPRSS2 человека) и геномную 3'-последовательность человека, состоящую из 131 п. о., после 3'-UTR TMPRSS2 человека (фигуры 1A-1B). Полученный модифицированный клон BAC содержал в направлении от 5’ до 3' (i) гомологичный 5'-участок, содержащий приблизительно 12 т. о. геномной ДНК мыши, содержащей 5'-UTR Tmprss2 мыши, экзон 1 Tmprss2 мыши (некодирующий), кодирующие экзоны 1-3 (за исключением последних 7 п. о. кодирующего экзона 3); (ii) геномный фрагмент TMPRSS2 человека, состоящий из приблизительно 25091 п. о., содержащий последние 7 п. о. кодирующего экзона 3 человека, интрон 3, область от кодирующего экзона 4 до 13 человека (в том числе 3'-UTR TMPRSS2 человека) и геномную 3'-последовательность человека; (iii) самоудаляющуюся кассету устойчивости к неомицину, состоящую из приблизительно 2691 п. о., после которой расположен (iv) гомологичный 3'-участок мыши, составляющий 45 т. о., содержащий 3'-UTR Tmprss2 мыши, и остающуюся геномную ДНК в исходном клоне BAC. (См. фигуры 1A-1B.) Соединительные последовательности также изложены в нижней части фигуры 1B. Часть модифицированного клона BAC, содержащая геномный фрагмент TMPRSS2 человека и кассету устойчивости к неомицину, а также расположенные до и после соединительные вставки, изложена под SEQ ID NO: 5. Аминокислотная последовательность белка, кодируемого гуманизированным геном Tmprss2, изложена под SEQ ID NO: 7. Выравнивание данного гуманизированного белка Tmprss2 («мутантного белка 7010»), белка Tmprss2 мыши (SEQ ID NO: 2) и белка TMPRSS2 человека (SEQ ID NO: 4) показано на фигуре 1D.
[00141] Модифицированный клон BAC, содержащий гуманизированный ген Tmprss2, описанный выше, применяли для электропорации эмбриональных стволовых клеток (ES) мыши для создания модифицированных клеток ES, содержащих гуманизированный ген Tmprss2. Подвергнутые положительному целенаправленному воздействию клетки ES, содержащие гуманизированный ген Tmprss2, идентифицировали с помощью анализа (Valenzuela et al., выше), в котором выявляли наличие последовательностей TMPRSS2 человека (например, кодирующих экзонов 4-13 TMPRSS2 человека) и подтверждали потерю и/или сохранение последовательностей Tmprss2 мыши (например, потерю кодирующих экзонов 4-13 Tmprss2 мыши). В таблице 1 представлены праймеры и зонды, которые применяли для подтверждения гуманизации эндогенного гена Tmprss2, описанного выше (фигуры 1A-1B). Как только правильно подвергнутый целенаправленному воздействию клон клеток ES был выбран, селективную кассету устойчивости к неомицину можно вырезать путем введения рекомбиназы Cre, например, посредством электропорации. В качестве альтернативы селективную кассету устойчивости к неомицину можно удалять путем скрещивания потомства, полученного от клона ES, с делеторным грызуном, относящемуся к породе, которая экспрессирует рекомбиназу Cre. На фигуре 1C изображен гуманизированный локус Tmprss2 после делеции кассеты с соединительными последовательностями, показанными в нижней части фигуры 1C.
[00142] Выбранные клоны клеток ES (с кассетой или без нее) применяли для имплантации самкам мышей с применением способа VELOCIMOUSE® (см., например, патент США № 7294754 и Poueymirou et al., F0 generation mice that are essentially fully derived from the donor gene-targeted ES cells allowing immediate phenotypic analyses, 2007, Nature Biotech. 25(1):91-99) для получения выводка детенышей, содержащих в геноме гуманизированную аллель Tmprss2. Для мышей, несущих гуманизированную аллель Tmprss2, можно вновь проводить подтверждение и идентификацию путем генотипирования ДНК, выделенной из отрезанных фрагментов хвостов, с применением модификации анализа аллели (Valenzuela et al., выше), в котором выявляют наличие последовательностей гена TMPRSS2 человека. Детенышей генотипировали и отбирали когорты животных, гетерозиготных по гуманизированному локусу Tmprss2, для определения характеристик. Животных, гомозиготных по гуманизированному локусу Tmprss2, получали путем скрещивания гетерозиготных животных.
ТАБЛИЦА 1
Название Праймер Последовательность (5'–3') SEQ ID NO
7010U Прямой GCCGTGACTGTGACCTTCTC (SEQ ID NO:26)
Зонд (BHQ) TGGAGGAGCCACCTGATGCCTC (SEQ ID NO:27)
Обратный GCCTTGCCCTCAATGGAAAC (SEQ ID NO:28)
7010D Прямой GGTTGCACAGCAAGGAAGAAG (SEQ ID NO:29)
Зонд (BHQ) CCAGGAGTTCCTGTGAGCCTACCC (SEQ ID NO:30)
Обратный TGGAATGGAAGGAGCTGGAG (SEQ ID NO:31)
7010hU Прямой GTCCCACCTCCTGCAACTG (SEQ ID NO:32)
Зонд (BHQ) TGAGCCTTCCCATCAGCCTGGG (SEQ ID NO:33)
Обратный CCACAATGGCACATGGGTCTG (SEQ ID NO:34)
7010hTD Прямой GGTGCTTGCTCCCCAAGA (SEQ ID NO:35)
Зонд (BHQ) CCTAAAAGGTGTTGTAATGG (SEQ ID NO:36)
Обратный GGCAATAAAGAAGGAAGACGTTTT (SEQ ID NO:37)
Пример 2. Гуманизация эндогенного гена Tmprss4
[00143] В данном примере показаны иллюстративные способы гуманизации эндогенного гена, кодирующего Tmprss4 у грызуна (например, мыши). Способы, описанные в данном примере, при необходимости можно применять для гуманизации эндогенного гена Tmprss4 грызуна с применением любой последовательности человека или комбинации последовательностей человека (или фрагментов последовательностей).
[00144] Нацеливающий вектор для гуманизации эндогенного гена Tmprss4 конструировали с применением клонов бактериальной искусственной хромосомы (BAC) и технологии VELOCIGENE® (см., например, патент США № 6586251 и Valenzuela et al. (2003), выше).
[00145] Вкратце, клон бактериальной искусственной хромосомы (BAC) мыши RP23-71M15, содержащий ген Tmprss4 мыши, применяли и модифицировали следующим образом. Получали фрагмент ДНК, содержащий гомологичную нуклеотидную 5'-последовательность мыши, самоудаляющуюся кассету устойчивости к неомицину, состоящую из приблизительно 4996 п. о., геномную ДНК человека, состоящую из приблизительно 14963 п. о. (содержащую область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека) и гомологичную 3'-последовательность мыши. Данный фрагмент ДНК применяли для модификации клона BAC RP23-71M15 путем гомологичной рекомбинации в бактериальных клетках. В результате геномный фрагмент (состоящий из приблизительно 11074 п. о.), кодирующий эктодомен, в клоне BAC замещали самоудаляющейся кассетой устойчивости к неомицину, состоящей из приблизительно 4996 п. о., после которой расположена геномная ДНК, состоящая из приблизительно 14963 п. о. В частности, геномный фрагмент мыши, который удаляли и замещали, содержал 130 п. о. 3'-части интрона 3 мыши, область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена Tmprss4 мыши (фигуры 2A-2B). Геномный фрагмент человека, который вставляли, содержал 3'-часть интрона 3 TMPRSS4 человека, состоящую из приблизительно 150 п. о., и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека (фигуры 2A-2B). Полученный модифицированный клон BAC содержит в направлении от 5’ до 3' гомологичный 5'-участок мыши, содержащий приблизительно 44,8 т. о. геномной ДНК мыши (в том числе 5'-UTR Tmprss4 мыши, область от кодирующего экзона 1 до кодирующего экзона 3 Tmprss4 мыши, частично интрон 3 Tmprss4 мыши (без 130 п. о. 3'-части), самоудаляющуюся кассету устойчивости к неомицину, состоящую из приблизительно 4996 п. о., 3'-часть интрона 3 TMPRSS4 человека, состоящую из приблизительно 150 п. о., область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 TMPRSS4 человека, после которой непосредственно расположена 3'-UTR Tmprss4 мыши и остающаяся геномная ДНК мыши в исходном клоне BAC (гомологичный 3'-участок мыши, состоящий в общем из приблизительно 118 т. о.). (См. фигуры 2A-2B.) Соединительные последовательности также изложены в нижней части фигуры 2B. Часть модифицированного клона BAC, содержащая кассету устойчивости к неомицину, геномный фрагмент TMPRSS4 человека, а также расположенные до и после соединительные вставки, изложена под SEQ ID NO: 12. Аминокислотная последовательность белка, кодируемого гуманизированным геном Tmprss4, изложена под SEQ ID NO: 14. Выравнивание данного гуманизированного белка Tmprss4 («мутантного белка 7224»), белка Tmprss4 мыши (SEQ ID NO: 9) и белка TMPRSS4 человека (SEQ ID NO: 11) показано на фигуре 2D.
[00146] Модифицированный клон BAC, содержащий гуманизированный ген Tmprss4, описанный выше, применяли для электропорации эмбриональных стволовых клеток (ES) мыши для получения модифицированных клеток ES, содержащих гуманизированный ген Tmprss4. Подвергнутые положительному целенаправленному воздействию клетки ES, содержащие гуманизированный ген Tmprss4, идентифицировали с помощью анализа (Valenzuela et al., выше), в котором выявляли наличие последовательностей TMPRSS4 человека (например, кодирующих экзонов 4-13 TMPRSS4 человека) и подтверждали потерю и/или сохранение последовательностей Tmprss4 мыши (например, потерю кодирующих экзонов 4-13 Tmprss4 мыши). В таблице 2 представлены праймеры и зонды, которые применяли для подтверждения гуманизации эндогенного гена Tmprss4, описанного выше (фигуры 2A-2B). Как только правильно подвергнутый целенаправленному воздействию клон клеток ES был выбран, селективную кассету устойчивости к неомицину можно вырезать путем введения рекомбиназы Cre, например, посредством электропорации. В качестве альтернативы селективную кассету устойчивости к неомицину можно удалять путем скрещивания потомства, полученного от клона ES, с делеторным грызуном, относящемуся к породе, которая экспрессирует рекомбиназу Cre. На фигуре 2C изображен гуманизированный локус Tmprss4 после делеции кассеты с соединительными последовательностями, показанными в нижней части фигуры 2C.
[00147] Выбранные клоны клеток ES (с кассетой устойчивости или без нее) применяли для имплантации самкам мышей с применением способа VELOCIMOUSE® (см., например, патент США № 7294754 и Poueymirou et al. (2007), выше) для создания выводка детенышей, содержащих в геноме гуманизированную аллель Tmprss4. Для мышей, несущих гуманизированную аллель Tmprss4, вновь проводили подтверждение и идентификацию путем генотипирования ДНК, выделенной из отрезанных фрагментов хвостов, с применением модификации анализа аллели (Valenzuela et al., выше), в котором выявляют наличие последовательностей гена TMPRSS4 человека. Детенышей генотипировали и отбирали когорты животных, гетерозиготных по гуманизированному локусу Tmprss4, для определения характеристик. Животных, гомозиготных по гуманизированному локусу Tmprss4, получали путем скрещивания гетерозиготных животных.
ТАБЛИЦА 2
Название Праймер Последовательность (5'–3') SEQ ID NO
7224mTU Прямой GAGCAGGGCCATGACACAT (SEQ ID NO:42)
Зонд (BHQ) ACCATTAGATCCCAGCACTGGACA (SEQ ID NO:43)
Обратный AAACCCTTCCCGAGAGAGAA (SEQ ID NO:44)
7224mTU2 Прямой GAGGAACACTGTGTCAAGGACTT (SEQ ID NO:45)
Зонд (BHQ) CCTGAAAAGCCCGGAGTGGCAG (SEQ ID NO:46)
Обратный GGGCAGAGACCACATCTGA (SEQ ID NO:47)
7224mTD Прямой GGAAGCCCTCTCTCGATACTTG (SEQ ID NO:48)
Зонд (BHQ) TTCTACCCTGAGGGCATGCAGC (SEQ ID NO:49)
Обратный TGGGATGTAGAAGGTTGTCAGA (SEQ ID NO:50)
7224hTU Прямой CTGAGCCTGGAACTCACACATG (SEQ ID NO:51)
Зонд (BHQ) TCTGAGAGCCCAGCACTATCGCC (SEQ ID NO:52)
Обратный GCTGAGGGTCAGGCTTGAG (SEQ ID NO:53)
7224hTD Прямой TCTGCAGGGTAGGGAGAGAAG (SEQ ID NO:54)
Зонд (BHQ) TGTTTCAGAAAAGGAAGACTCACGTTACA (SEQ ID NO:55)
Обратный GAGACCGATGAAGAGAAAGTCAGA (SEQ ID NO:56)
Пример 3. Гуманизация эндогенного гена Tmprss11d
[00148] В данном примере показаны иллюстративные способы гуманизации эндогенного гена, кодирующего Tmprss11d у грызуна (например, мыши). Способы, описанные в данном примере, при необходимости можно применять для гуманизации эндогенного гена Tmprss11d грызуна с применением любой последовательности человека или комбинации последовательностей человека (или фрагментов последовательностей).
[00149] Нацеливающий вектор для гуманизации эндогенного гена Tmprss11d конструировали с применением клонов бактериальной искусственной хромосомы (BAC) и технологии VELOCIGENE® (см., например, патент США № 6586251 и Valenzuela et al. (2003), выше).
[00150] Вкратце, клон бактериальной искусственной хромосомы (BAC) мыши RP23-95N22, содержащий ген Tmprss11d мыши, применяли и модифицировали следующим образом. Получали фрагмент ДНК, содержащий гомологичную нуклеотидную 5'-последовательность мыши, геномную ДНК TMPRSS11D человека, состоящую из приблизительно 33927 п. о. (содержащую 444 п. о. на 3'-конце интрона 2 и область от кодирующего экзона 3 до кодирующего экзона 10 (в том числе 3'-UTR, которая представляет собой часть кодирующего экзона 10) гена TMPRSS11D человека), самоудаляющуюся кассету устойчивости к неомицину, состоящую из приблизительно 4996 п. о., и гомологичную 3'-последовательность мыши. Данный фрагмент ДНК применяли для модификации клона BAC RP23-95N22 путем гомологичной рекомбинации в бактериальных клетках. В результате геномный фрагмент Tmprss11d мыши (состоящий из приблизительно 35667 п. о.), кодирующий эктодомен в клоне BAC, замещали геномным фрагментом TMPRSS11D человека, состоящим из приблизительно 33927 п. о., после которого расположена самоудаляющаяся кассета устойчивости к неомицину, состоящая из приблизительно 4996 п. о. В частности, геномный фрагмент Tmprss11d мыши, который замещали, содержал 3'-часть интрона 2 и область от кодирующего экзона 3 до стоп-кодона в кодирующем экзоне 10 гена Tmprss11d мыши (фигуры 3A-3B). Геномный фрагмент TMPRSS11D человека, который вставляли, содержал 444 п. о. на 3'-конце интрона 2 и область от кодирующего экзона 3 до кодирующего экзона 10 гена TMPRSS11D человека (в том числе 3'-UTR TMPRSS11D человека) и геномную 3'-последовательность человека, состоящую из приблизительно 172 п. о., после 3'-UTR TMPRSS11D человека (фигуры 3A-3B). Полученный модифицированный клон BAC содержал в направлении от 5' до 3' (i) гомологичный 5'-участок мыши, содержащий приблизительно 143 т. о. геномной ДНК мыши, в том числе 5'-UTR Tmprss11d мыши, кодирующие экзоны 1-2 и 5'-часть интрона 2 Tmprss11d мыши; (ii) геномный фрагмент TMPRSS11D человека, содержащий 3'-часть интрона 2 и область от кодирующего экзона 3 до кодирующего экзона 10 (в том числе 3'-UTR) TMPRSS11D человека, и геномную 3'-последовательность человека; (iii) самоудаляющуюся кассету устойчивости к неомицину, состоящую из приблизительно 4996 п. о., после которой расположен (iv) гомологичный 3'-участок мыши, составляющий 10 т. о., содержащий 3'-UTR Tmprss11d мыши и остающуюся геномную ДНК мыши в исходном клоне BAC. (См. фигуры 3A-3B.) Соединительные последовательности также изложены в нижней части фигуры 3B. Часть модифицированного клона BAC, содержащая геномный фрагмент TMPRSS11D человека и кассету устойчивости к неомицину, а также расположенные до и после соединительные вставки, изложена под SEQ ID NO: 19. Аминокислотная последовательность белка, кодируемого гуманизированным геном Tmprss11d, изложена под SEQ ID NO: 21. Выравнивание данного гуманизированного белка Tmprss11d («мутантного белка 7226»), белка Tmprss11d мыши (SEQ ID NO: 16) и белка TMPRSS11D человека (SEQ ID NO: 18) показано на фигуре 3D.
[00151] Модифицированный клон BAC, содержащий гуманизированный ген Tmprss11d, описанный выше, применяли для электропорации эмбриональных стволовых клеток (ES) мыши для получения модифицированных клеток ES, содержащих гуманизированный ген Tmprss11d. Подвергнутые положительному целенаправленному воздействию клетки ES, содержащие гуманизированный ген Tmprss11d, идентифицировали с помощью анализа (Valenzuela et al., выше), в котором выявляли наличие последовательностей TMPRSS11D человека (например, кодирующих экзонов 3-10 TMPRSS11D человека) и подтверждали потерю и/или сохранение последовательностей Tmprss11d мыши (например, потерю кодирующих экзонов 3-10 Tmprss11d мыши). В таблице 3 представлены праймеры и зонды, которые применяли для подтверждения гуманизации эндогенного гена Tmprss11d, описанного выше (фигуры 3A-3B). Как только правильно подвергнутый целенаправленному воздействию клон клеток ES был выбран, селективную кассету устойчивости к неомицину можно вырезать путем введения рекомбиназы Cre, например, посредством электропорации. В качестве альтернативы селективную кассету устойчивости к неомицину можно удалять путем скрещивания потомства, полученного от клона ES, с делеторным грызуном, относящемуся к породе, которая экспрессирует рекомбиназу Cre. На фигуре 3C изображен гуманизированный локус Tmprss11d после делеции кассеты с соединительными последовательностями, показанными в нижней части фигуры 3C.
[00152] Выбранные клоны клеток ES (с кассетой или без нее) применяли для имплантации самкам мышей с применением способа VELOCIMOUSE® (см., например, патент США № 7294754 и Poueymirou et al. (2007), выше) для создания выводка детенышей, содержащих в геноме гуманизированную аллель Tmprss11d. Для мышей, несущих гуманизированную аллель Tmprss11d, вновь проводили подтверждение и идентификацию путем генотипирования ДНК, выделенной из отрезанных фрагментов хвостов, с применением модификации анализа аллели (Valenzuela et al., выше), в котором выявляют наличие последовательностей гена TMPRSS11D человека. Детенышей генотипировали и отбирали когорты животных, гетерозиготных по гуманизированному локусу Tmprss11d, для определения характеристик. Животных, гомозиготных по гуманизированному локусу Tmprss11d, получали путем скрещивания гетерозиготных животных.
ТАБЛИЦА 3
Название Праймер Последовательность (5'–3') SEQ ID NO
7226mTU Прямой TCCTCTCCAGACAAGAAAGCT (SEQ ID NO:61)
Зонд (BHQ) TCATAGCAGCTTTCAAATCCTAAACGTTGA (SEQ ID NO:62)
Обратный TCGTGTGTAGCTGGTGAGTT (SEQ ID NO:63)
7226mTD Прямой CATGCGATCACAGGAGGAGATC (SEQ ID NO:64)
Зонд (BHQ) AATTGGGCCCGAAGCCAGATGC (SEQ ID NO:65)
Обратный CGGAAGGCTTCTGTGACTTC (SEQ ID NO:66)
7226hTU Прямой GTCTCCCACTTCTGACATAATGAAC (SEQ ID NO:67)
Зонд (BHQ) CCCAGTGTTAACCCTACATCTGGTTCC (SEQ ID NO:68)
Обратный TGGGAAGAGACTCTTGGACA (SEQ ID NO:69)
7226hTD Прямой ATGAGCTCCTAGTACAGCTAAAGTT (SEQ ID NO:70)
Зонд (MGB) ATGCATGATCATCTATGCGTCAGAGC (SEQ ID NO:71)
Обратный TGCCCAGATGCAGGGAGTTAG (SEQ ID NO:72)
Пример 4. Оценка группы 1 и группы 2 заражения вирусами гриппа A мышей Tmprss4 MAID7225 HumIn по сравнению с мышами дикого типа
[00153] Чтобы подтвердить применение гуманизированных грызунов Tmprss в качестве модели инфекции на животных, проводили эксперименты с оценкой выживаемости мышей MAID7225 HumIn TMPRSS4 по сравнению с мышами дикого типа (WT) из одного помета в группе 1 и группе 2 гриппа A в модели тяжелой инфекции гриппа.
[00154] Мыши MAID7225 HumIn TMPRSS4 являлись гомозиготными по гуманизированному гену Tmprss4 в их геноме, и их получали, как описано в примере 2. Вирусные штаммы, которые применяли в данных исследованиях, включали изолят исторического вируса гриппа A группы 1 A/Puerto Rico/08/1934 (H1N1) и изолят собственного адаптированного для мышей вируса гриппа A группы 2 A/Aichi/02/1968 (HA, NA) X-31 (H3N2). Все эксперименты выполняли на самцах и самках мышей MAID7225 HumIn TMPRSS4 или мышах WT из одного помета возрастом 6-8 недель. Мышей заражали с помощью 1150 бляшкообразующих единиц (PFU) A/Puerto Rico/08/1934 (H1N1) или 10000 PFU A/Aichi/02/1968-X31 (H3N2). В данных моделях выживаемости мышей заражали интраназально (IN) в день 0 после инфицирования (p.i.). Мышей взвешивали и наблюдали ежедневно до дня 14 p.i., и умерщвляли, когда они теряли 20% их первоначального веса. Результаты представляли в виде процента выживаемости (таблица 4).
Таблица 4
ID группы Количество мышей в группе Процент выживаемости (к-во выживших мышей/общее к-во мышей в группе)
Неинфицированный контроль (2 HumIn, 2 мыши WT) 4 100 (4/4)
TMPRSS4 WT; инфицированные H1_PR34 10 20 (2/10)
TMPRSS4 HumIn; инфицированные H1_PR34 8 25 (2/8)
TMPRSS4 WT; инфицированные H3_X31 9 11.1 (1/9)
TMPRSS4 HumIn; инфицированные H3_X31 8 25 (2/8)
[00155] Выживаемость мышей, характеризующихся TMPRSS4 MAID7225 HumIn, сравнивали с мышами WT одного помета после заражения как вирусом тяжелого гриппа A группы 1 [A/Puerto Rico/08/1934 (H1N1)], так и адаптированным для мышей вируса тяжелого гриппа A группы 2 [A/Aichi/02/1968-X31 (H3N2)] (фигура 4). Выживаемость мышей, характеризующихся MAID7225 HumIn TMPRSS4, не отличались от мышей дикого типа, которых заражали либо H1N1 (25%; n=8 и 20%; n=10 соответственно), либо H3N2 (25%; n=8 и 11,1%; n=9 соответственно).
[00156] Публикации, веб-сайты и другие справочные материалы, упоминаемые в данном документе для описания предпосылок настоящего изобретения и для предоставления дополнительных подробностей, относящихся к его практическому осуществлению, включены в данный документ посредством ссылки.
--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> РЕДЖЕНЕРОН ФАРМАСЬИТИКАЛЗ, ИНК.
<120> ГРЫЗУНЫ, ХАРАКТЕРИЗУЮЩИЕСЯ ГУМАНИЗИРОВАННЫМ ГЕНОМ TMPRSS
<130> 33093PCT (10234WO01)
<150> 62/301023
<151> 29.02.2016
<160> 72
<170> PatentIn версия 3.5
<210> 1
<211> 3175
<212> ДНК
<213> Mus musculus
<400> 1
gcctttcctg gccgttccct ccttctggcc gaggtgcctg cgtttagggg tgtcaccctg 60
gctcccggga cgccgcctcc ggagatttaa gcgagaactg gagtaggtcg tgtacttgga 120
gcggacgagg aagccaagag ctcggacaga ggcggagagg ggcgggaagc gcaacaggtc 180
acctggagga agccccatac tgacctcctc atgctgctga cacaggcagg atggcattga 240
actcagggtc acctccagga atcggacctt gctatgagaa ccacgggtat cagtctgagc 300
acatctgtcc tccgagacca ccagtggctc ccaatggcta caacttgtat ccagcccagt 360
actacccatc tccagtgcct cagtatgctc cgaggattac aacgcaagcc tcaacatctg 420
tcatccacac acatcccaag tcctcaggag cactgtgcac ctcaaagtct aagaaatcgc 480
tgtgtttagc cctcgccctg ggcactgtcc tcacgggagc tgctgtggct gctgtcttgc 540
tttggaggtt ctgggacagc aactgttcta cgtctgagat ggagtgtggg tcttcaggca 600
catgcatcag ctcttctctc tggtgtgacg gggtagcaca ttgtcccaac ggagaagatg 660
agaaccgttg tgttcgtctc tacggacaaa gcttcatcct ccaggtttac tcatctcaga 720
ggaaagcctg gtatcccgtg tgccaggatg attggagtga gagctacggg agagcagcat 780
gtaaagacat gggatacaag aacaattttt attctagcca agggatacca gaccagagcg 840
gggcaacgag ctttatgaag ctgaatgtga gctcaggcaa cgttgacctc tataaaaaac 900
tctaccacag tgactcatgt tcatcccgca tggtggtttc tttgcgctgt atagaatgcg 960
gggttcgctc agtgaaacgc cagagcagga ttgtgggtgg attgaatgcc tcaccaggag 1020
actggccctg gcaggtcagc ctgcacgtcc aaggcgtcca cgtctgcgga ggctccatca 1080
tcacccccga gtggattgtg acggccgccc actgtgtgga agaacccctc agcagcccga 1140
ggtactggac ggcatttgcg ggaattctga gacagtctct catgttctat ggaagtagac 1200
accaggtaga aaaagtaatt tcccatccaa attacgactc taagaccaag aataacgaca 1260
ttgctctcat gaagctgcag acacctttgg cttttaatga tctagtgaag ccagtgtgtc 1320
tgccgaaccc aggcatgatg ctagacctag accaggaatg ctggatttcg gggtgggggg 1380
ccacctatga gaaagggaag acctcggacg tgttgaatgc tgccatggta cccttgatcg 1440
agccctccaa atgtaatagt aaatacatat acaacaacct aatcacacca gccatgatct 1500
gtgccggctt cctccagggg tctgtcgact cttgccaggg agacagtgga gggccgctgg 1560
ttactttgaa gaatgggatc tggtggctga ttggggacac gagctggggc tcgggctgtg 1620
ccaaggcact cagacctgga gtatacggga acgtgacggt atttacagat tggatctacc 1680
agcaaatgag ggcgaacagc taatccacgt ggctttgtcc cagacttcct ttgtcttcaa 1740
caaccttctg caagaaaacc aagggcctga attttaactt cctgtgcaca atgtaccttt 1800
tgagatgatt cgaagggcct ttcactttta ttaaacagtg acttgtttga ctgtgctccc 1860
tggtcctgtg agggcttcag tgccccaccc ctgggccact tctgcagctc ccaccagaat 1920
ggatgaccag attctgttgg gtttgggcac atagggccaa aggcagagga gggtggcact 1980
ctcatgttgg aacttctttt gggctcatgc tcaggccttt tttggatcac taaggactat 2040
gacctctgag taacctgatg acctgagaaa gagtaaggag gccaggcagg gccttgggcc 2100
caggaacagg taccttgaga gtgagagcta cccattgcct gtggcctaaa tctgctgtgc 2160
aggttgggct ggtcatactg tcatgatttc attaacagcc tgggtgaaca tggctgggag 2220
taaagggctt gctctcctgc atgttgacat gacggccctt tccaagggtg atggaggctt 2280
tcccaagcta agggcctagg cagatctctc agagcaagaa gctaatgccg gcatgtccct 2340
tgggtgagct ctacatggtg ttattcagtc tggttcttgg ctccccacta ctgtttctct 2400
cagcctctca gagcctgaaa cttacctctt agctttggct acaggcatgg cctagtacct 2460
gatggagcct gtatagctca gctaatcaaa tggaggctca ggtccatcag aatcagggac 2520
ttgtgatttc agtcaccttg cttctgggtt gtgtttcttc tcttactacc tcactgcacc 2580
tggacactag agtggatgaa tgtctggagt tcacctgcat ttggactgtg tgattgtgcc 2640
tcagacacta gacctcttcc agatggttag gttgttctgt agactggcaa tgagattaga 2700
agttcctagc ttcagataaa gatgaaagag aggagatcat tgtcttctgt cttcttctgg 2760
ccctgggttt ataccaggaa agccatgcca gaattaccaa atatgaagta tgaatgtctt 2820
acccacggtg aggctctgcc tccttctctc tgcctggttc ttcagaaggc agtgaatggg 2880
tcataactgg gactccatct ttgctgggga aagtctccca cctagggaat ggttaccact 2940
ccatgtaaag aaaactccct catgcgtcct ctgggacctt cttagatgct gtaaggtacc 3000
tacatacaga ctaaatgtgc aagcaccttg aagtgtgaga acctgtcccc tccttagctc 3060
tccttgtctt tgctgttggt tggttatttc ctgctttgtg tctgttctga gctgtgagat 3120
tccactgtga aatatatgaa taaagtatat aattctttta aaaaaaaaaa aaaaa 3175
<210> 2
<211> 490
<212> БЕЛОК
<213> Mus musculus
<400> 2
Met Ala Leu Asn Ser Gly Ser Pro Pro Gly Ile Gly Pro Cys Tyr Glu
1 5 10 15
Asn His Gly Tyr Gln Ser Glu His Ile Cys Pro Pro Arg Pro Pro Val
20 25 30
Ala Pro Asn Gly Tyr Asn Leu Tyr Pro Ala Gln Tyr Tyr Pro Ser Pro
35 40 45
Val Pro Gln Tyr Ala Pro Arg Ile Thr Thr Gln Ala Ser Thr Ser Val
50 55 60
Ile His Thr His Pro Lys Ser Ser Gly Ala Leu Cys Thr Ser Lys Ser
65 70 75 80
Lys Lys Ser Leu Cys Leu Ala Leu Ala Leu Gly Thr Val Leu Thr Gly
85 90 95
Ala Ala Val Ala Ala Val Leu Leu Trp Arg Phe Trp Asp Ser Asn Cys
100 105 110
Ser Thr Ser Glu Met Glu Cys Gly Ser Ser Gly Thr Cys Ile Ser Ser
115 120 125
Ser Leu Trp Cys Asp Gly Val Ala His Cys Pro Asn Gly Glu Asp Glu
130 135 140
Asn Arg Cys Val Arg Leu Tyr Gly Gln Ser Phe Ile Leu Gln Val Tyr
145 150 155 160
Ser Ser Gln Arg Lys Ala Trp Tyr Pro Val Cys Gln Asp Asp Trp Ser
165 170 175
Glu Ser Tyr Gly Arg Ala Ala Cys Lys Asp Met Gly Tyr Lys Asn Asn
180 185 190
Phe Tyr Ser Ser Gln Gly Ile Pro Asp Gln Ser Gly Ala Thr Ser Phe
195 200 205
Met Lys Leu Asn Val Ser Ser Gly Asn Val Asp Leu Tyr Lys Lys Leu
210 215 220
Tyr His Ser Asp Ser Cys Ser Ser Arg Met Val Val Ser Leu Arg Cys
225 230 235 240
Ile Glu Cys Gly Val Arg Ser Val Lys Arg Gln Ser Arg Ile Val Gly
245 250 255
Gly Leu Asn Ala Ser Pro Gly Asp Trp Pro Trp Gln Val Ser Leu His
260 265 270
Val Gln Gly Val His Val Cys Gly Gly Ser Ile Ile Thr Pro Glu Trp
275 280 285
Ile Val Thr Ala Ala His Cys Val Glu Glu Pro Leu Ser Ser Pro Arg
290 295 300
Tyr Trp Thr Ala Phe Ala Gly Ile Leu Arg Gln Ser Leu Met Phe Tyr
305 310 315 320
Gly Ser Arg His Gln Val Glu Lys Val Ile Ser His Pro Asn Tyr Asp
325 330 335
Ser Lys Thr Lys Asn Asn Asp Ile Ala Leu Met Lys Leu Gln Thr Pro
340 345 350
Leu Ala Phe Asn Asp Leu Val Lys Pro Val Cys Leu Pro Asn Pro Gly
355 360 365
Met Met Leu Asp Leu Asp Gln Glu Cys Trp Ile Ser Gly Trp Gly Ala
370 375 380
Thr Tyr Glu Lys Gly Lys Thr Ser Asp Val Leu Asn Ala Ala Met Val
385 390 395 400
Pro Leu Ile Glu Pro Ser Lys Cys Asn Ser Lys Tyr Ile Tyr Asn Asn
405 410 415
Leu Ile Thr Pro Ala Met Ile Cys Ala Gly Phe Leu Gln Gly Ser Val
420 425 430
Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Thr Leu Lys Asn
435 440 445
Gly Ile Trp Trp Leu Ile Gly Asp Thr Ser Trp Gly Ser Gly Cys Ala
450 455 460
Lys Ala Leu Arg Pro Gly Val Tyr Gly Asn Val Thr Val Phe Thr Asp
465 470 475 480
Trp Ile Tyr Gln Gln Met Arg Ala Asn Ser
485 490
<210> 3
<211> 3212
<212> ДНК
<213> Homo sapiens
<400> 3
gagtaggcgc gagctaagca ggaggcggag gcggaggcgg agggcgaggg gcggggagcg 60
ccgcctggag cgcggcaggt catattgaac attccagata cctatcatta ctcgatgctg 120
ttgataacag caagatggct ttgaactcag ggtcaccacc agctattgga ccttactatg 180
aaaaccatgg ataccaaccg gaaaacccct atcccgcaca gcccactgtg gtccccactg 240
tctacgaggt gcatccggct cagtactacc cgtcccccgt gccccagtac gccccgaggg 300
tcctgacgca ggcttccaac cccgtcgtct gcacgcagcc caaatcccca tccgggacag 360
tgtgcacctc aaagactaag aaagcactgt gcatcacctt gaccctgggg accttcctcg 420
tgggagctgc gctggccgct ggcctactct ggaagttcat gggcagcaag tgctccaact 480
ctgggataga gtgcgactcc tcaggtacct gcatcaaccc ctctaactgg tgtgatggcg 540
tgtcacactg ccccggcggg gaggacgaga atcggtgtgt tcgcctctac ggaccaaact 600
tcatccttca ggtgtactca tctcagagga agtcctggca ccctgtgtgc caagacgact 660
ggaacgagaa ctacgggcgg gcggcctgca gggacatggg ctataagaat aatttttact 720
ctagccaagg aatagtggat gacagcggat ccaccagctt tatgaaactg aacacaagtg 780
ccggcaatgt cgatatctat aaaaaactgt accacagtga tgcctgttct tcaaaagcag 840
tggtttcttt acgctgtata gcctgcgggg tcaacttgaa ctcaagccgc cagagcagga 900
ttgtgggcgg cgagagcgcg ctcccggggg cctggccctg gcaggtcagc ctgcacgtcc 960
agaacgtcca cgtgtgcgga ggctccatca tcacccccga gtggatcgtg acagccgccc 1020
actgcgtgga aaaacctctt aacaatccat ggcattggac ggcatttgcg gggattttga 1080
gacaatcttt catgttctat ggagccggat accaagtaga aaaagtgatt tctcatccaa 1140
attatgactc caagaccaag aacaatgaca ttgcgctgat gaagctgcag aagcctctga 1200
ctttcaacga cctagtgaaa ccagtgtgtc tgcccaaccc aggcatgatg ctgcagccag 1260
aacagctctg ctggatttcc gggtgggggg ccaccgagga gaaagggaag acctcagaag 1320
tgctgaacgc tgccaaggtg cttctcattg agacacagag atgcaacagc agatatgtct 1380
atgacaacct gatcacacca gccatgatct gtgccggctt cctgcagggg aacgtcgatt 1440
cttgccaggg tgacagtgga gggcctctgg tcacttcgaa gaacaatatc tggtggctga 1500
taggggatac aagctggggt tctggctgtg ccaaagctta cagaccagga gtgtacggga 1560
atgtgatggt attcacggac tggatttatc gacaaatgag ggcagacggc taatccacat 1620
ggtcttcgtc cttgacgtcg ttttacaaga aaacaatggg gctggttttg cttccccgtg 1680
catgatttac tcttagagat gattcagagg tcacttcatt tttattaaac agtgaacttg 1740
tctggctttg gcactctctg ccattctgtg caggctgcag tggctcccct gcccagcctg 1800
ctctccctaa ccccttgtcc gcaaggggtg atggccggct ggttgtgggc actggcggtc 1860
aagtgtggag gagaggggtg gaggctgccc cattgagatc ttcctgctga gtcctttcca 1920
ggggccaatt ttggatgagc atggagctgt cacctctcag ctgctggatg acttgagatg 1980
aaaaaggaga gacatggaaa gggagacagc caggtggcac ctgcagcggc tgccctctgg 2040
ggccacttgg tagtgtcccc agcctacctc tccacaaggg gattttgctg atgggttctt 2100
agagccttag cagccctgga tggtggccag aaataaaggg accagccctt catgggtggt 2160
gacgtggtag tcacttgtaa ggggaacaga aacatttttg ttcttatggg gtgagaatat 2220
agacagtgcc cttggtgcga gggaagcaat tgaaaaggaa cttgccctga gcactcctgg 2280
tgcaggtctc cacctgcaca ttgggtgggg ctcctgggag ggagactcag ccttcctcct 2340
catcctccct gaccctgctc ctagcaccct ggagagtgca catgcccctt ggtcctggca 2400
gggcgccaag tctggcacca tgttggcctc ttcaggcctg ctagtcactg gaaattgagg 2460
tccatggggg aaatcaagga tgctcagttt aaggtacact gtttccatgt tatgtttcta 2520
cacattgcta cctcagtgct cctggaaact tagcttttga tgtctccaag tagtccacct 2580
tcatttaact ctttgaaact gtatcatctt tgccaagtaa gagtggtggc ctatttcagc 2640
tgctttgaca aaatgactgg ctcctgactt aacgttctat aaatgaatgt gctgaagcaa 2700
agtgcccatg gtggcggcga agaagagaaa gatgtgtttt gttttggact ctctgtggtc 2760
ccttccaatg ctgtgggttt ccaaccaggg gaagggtccc ttttgcattg ccaagtgcca 2820
taaccatgag cactactcta ccatggttct gcctcctggc caagcaggct ggtttgcaag 2880
aatgaaatga atgattctac agctaggact taaccttgaa atggaaagtc atgcaatccc 2940
atttgcagga tctgtctgtg cacatgcctc tgtagagagc agcattccca gggaccttgg 3000
aaacagttgg cactgtaagg tgcttgctcc ccaagacaca tcctaaaagg tgttgtaatg 3060
gtgaaaacgt cttccttctt tattgcccct tcttatttat gtgaacaact gtttgtcttt 3120
ttttgtatct tttttaaact gtaaagttca attgtgaaaa tgaatatcat gcaaataaat 3180
tatgcaattt ttttttcaaa gtaaaaaaaa aa 3212
<210> 4
<211> 492
<212> БЕЛОК
<213> Homo sapiens
<400> 4
Met Ala Leu Asn Ser Gly Ser Pro Pro Ala Ile Gly Pro Tyr Tyr Glu
1 5 10 15
Asn His Gly Tyr Gln Pro Glu Asn Pro Tyr Pro Ala Gln Pro Thr Val
20 25 30
Val Pro Thr Val Tyr Glu Val His Pro Ala Gln Tyr Tyr Pro Ser Pro
35 40 45
Val Pro Gln Tyr Ala Pro Arg Val Leu Thr Gln Ala Ser Asn Pro Val
50 55 60
Val Cys Thr Gln Pro Lys Ser Pro Ser Gly Thr Val Cys Thr Ser Lys
65 70 75 80
Thr Lys Lys Ala Leu Cys Ile Thr Leu Thr Leu Gly Thr Phe Leu Val
85 90 95
Gly Ala Ala Leu Ala Ala Gly Leu Leu Trp Lys Phe Met Gly Ser Lys
100 105 110
Cys Ser Asn Ser Gly Ile Glu Cys Asp Ser Ser Gly Thr Cys Ile Asn
115 120 125
Pro Ser Asn Trp Cys Asp Gly Val Ser His Cys Pro Gly Gly Glu Asp
130 135 140
Glu Asn Arg Cys Val Arg Leu Tyr Gly Pro Asn Phe Ile Leu Gln Val
145 150 155 160
Tyr Ser Ser Gln Arg Lys Ser Trp His Pro Val Cys Gln Asp Asp Trp
165 170 175
Asn Glu Asn Tyr Gly Arg Ala Ala Cys Arg Asp Met Gly Tyr Lys Asn
180 185 190
Asn Phe Tyr Ser Ser Gln Gly Ile Val Asp Asp Ser Gly Ser Thr Ser
195 200 205
Phe Met Lys Leu Asn Thr Ser Ala Gly Asn Val Asp Ile Tyr Lys Lys
210 215 220
Leu Tyr His Ser Asp Ala Cys Ser Ser Lys Ala Val Val Ser Leu Arg
225 230 235 240
Cys Ile Ala Cys Gly Val Asn Leu Asn Ser Ser Arg Gln Ser Arg Ile
245 250 255
Val Gly Gly Glu Ser Ala Leu Pro Gly Ala Trp Pro Trp Gln Val Ser
260 265 270
Leu His Val Gln Asn Val His Val Cys Gly Gly Ser Ile Ile Thr Pro
275 280 285
Glu Trp Ile Val Thr Ala Ala His Cys Val Glu Lys Pro Leu Asn Asn
290 295 300
Pro Trp His Trp Thr Ala Phe Ala Gly Ile Leu Arg Gln Ser Phe Met
305 310 315 320
Phe Tyr Gly Ala Gly Tyr Gln Val Glu Lys Val Ile Ser His Pro Asn
325 330 335
Tyr Asp Ser Lys Thr Lys Asn Asn Asp Ile Ala Leu Met Lys Leu Gln
340 345 350
Lys Pro Leu Thr Phe Asn Asp Leu Val Lys Pro Val Cys Leu Pro Asn
355 360 365
Pro Gly Met Met Leu Gln Pro Glu Gln Leu Cys Trp Ile Ser Gly Trp
370 375 380
Gly Ala Thr Glu Glu Lys Gly Lys Thr Ser Glu Val Leu Asn Ala Ala
385 390 395 400
Lys Val Leu Leu Ile Glu Thr Gln Arg Cys Asn Ser Arg Tyr Val Tyr
405 410 415
Asp Asn Leu Ile Thr Pro Ala Met Ile Cys Ala Gly Phe Leu Gln Gly
420 425 430
Asn Val Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Thr Ser
435 440 445
Lys Asn Asn Ile Trp Trp Leu Ile Gly Asp Thr Ser Trp Gly Ser Gly
450 455 460
Cys Ala Lys Ala Tyr Arg Pro Gly Val Tyr Gly Asn Val Met Val Phe
465 470 475 480
Thr Asp Trp Ile Tyr Arg Gln Met Arg Ala Asp Gly
485 490
<210> 5
<211> 27947
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Рекомбинантный полинуклеотид
<400> 5
gcagagtcta agaaatcgct gtgtttagcc ctcgccctgg gcactgtcct cacgggagct 60
gctgtggctg ctgtcttgct ttggaagttc agtaagtgca gggagcctcg atcccaccat 120
gtgctcctgc agtccccagt gctctgagcc agaccctgct ctctgggcta ttgagacctc 180
tggaggccct ccgtgaggtt cctctcttac ataacgaggc tgtctctctt cccttctctt 240
gtttagctat gagattgaca catcatgggg aaagcattta gaatgtaccc agtgctttgg 300
ggtgcttggt gccacccagc actgtgagca caggttcttc taccttgggg ccacacccag 360
ttacctgtat ctcactgcac agcagtggct gttggggacc aggcccaccc ctccatgtcc 420
cacctcctgc aactgcagcc tgagccttcc catcagcctg gggtggtgca gacccatgtg 480
ccattgtgga tccttcaagt tacctgtgtg gcagagagga cgtgtgagtg ccgtccaaac 540
ccaaacactg agagggtcct tcccattgcc cccacggaag taaggtgccc cagtgctaat 600
tccacttata cttgctggtg gcaaggacac ttctcctcct tattaaagtg ggggattggc 660
tgggtgaggt ggctcacgcc tgttatccca gcactttaag aggccaaggc aggtggacca 720
cctgaggtca ggagtttgag accacaagcc tggccaacat gttgaaactc catctctact 780
aaaaatacaa aaattagtca ggcgtggtgg cgtgcacctg taatcccagc tacttaggag 840
gctggggcag gaggatcact tgaacccagg agttggaggt tgcagtgagc caagattgtg 900
cccctgcact ccagcctggg tgacagaatg agacttcatc tcaaaaacaa aacaaaacaa 960
aacacagtgg ggccaggagt tggaggctgc agcgagctac agtaatgcca cggtgttcct 1020
cactccatga ggctcattgc gtttctcagc ctgaagggca cctctcttct gttttctctg 1080
caagtgggca gcaagtgctc caactctggg atagagtgcg actcctcagg tacctgcatc 1140
aacccctcta actggtgtga tggcgtgtca cactgccccg gcggggagga cgagaatcgg 1200
tgtggtgagt cagccttgac cttgggaagg gactcctctg ctcaccttgg agacagcagc 1260
cgggtccagg ggcctttggg tgactgggcc tggcgtgcgt ccagtacgct gacacatgat 1320
gtcattgaat ccctgctcca ggctgagccc tggggctcag agaggttgtg tttccggccc 1380
aacctcaccc agcaggtggg agatgacagg gccaccgagg actgtgtcat tggaaccaca 1440
cgtgctctga actgccacag gaagtcagtt aagatgagca aactgtttat aaagttggag 1500
atgcaggcta ggaacggtgg ctcatgcctg taatcccagc actttgggag gccgaggcag 1560
atggatcacc tgaggtcagg agtttgagac cagcctgacc aatatggtga aaccttatct 1620
ccactaaaaa tacaaaaatt agccaagcgc ggtggcgggt gcctgtaatt ccagctattc 1680
aggaggctga ggcaggagaa tcacttgaac ctgggaggcg gaggttgcag tgagctgaga 1740
tcacgccact gcattccagc ctgggagaca gagctggctc aaaaaataaa ttaattaatt 1800
aaaaacaaaa ttggagatgc actatgttat tttcaaaaca agctgccttt aaagatctat 1860
ctgttgtcac agggtgggct catctgtttc attttatttt ctgtggttta tctatttatt 1920
cattttaatg aactaggaag cattgctcct atttatggca taccacatga tgtttggata 1980
cgtgtatgcc tgtggcatgg ctaagtcaag ctagaacatg ggccttacct catatacgtg 2040
tcttattaag aacacataaa acctactctt gtagtgattt tcaaatatgc aacatatagt 2100
ttattaactg cagtcactat gatgtacaat agattgctcg aacttattcc tcctgtctaa 2160
ctaagatttt gtgacctctg accaacatct ccccagtgtt gtcacccccc gcccccagcc 2220
tctgatagct gcctttctac tctctgcttc tgtgagtttg atgtttatac attccacatg 2280
taagtggcct catgcagtgt ttctgtctct gtgtctggct tgttcactta gcgtaatgtc 2340
ctccagcttc atctatgttg ttggaaatga caggatttcc ttctttcttg tggctgaata 2400
gtattgcctt gtgcatatac accacatttt ctttatccct tcattcactg atggactctt 2460
aggttgatgt catgtcttgg ctgttgtgaa aaatgccgca gtgagcgtgg gcgtgcaggt 2520
ccctcttcaa cacacggatt tcctttcctt tggatataaa cccagcagtg agattgctgg 2580
atcacatggc agttctgttt ctcacctttt gaggaaactc catactgttt tccataatgg 2640
ctgtagcaac ttccactccc acccccacgg tgcaaagtct ccatttctct tctacaacct 2700
caccaactcc tgttattttc catctttctg atagtagcca tttgaagagg tatgagatga 2760
tacctcattg tggttttcat ttgcattttt atttgtattt ttcatgaatt tttgagggtg 2820
atttcaaggg tagttagtga ctcgaacagg gaaacgatcc tgagtatgag ggttgtgcta 2880
atcatccccc tcctgccagc tgcgtacgga atggggctct gcagatggca gggagctggc 2940
tcgtttctct ttaagagctg ccttttactt ttcttcctct tcctttaaaa cttatttcct 3000
ggccggacgc agtggctcat gcctgtaatc ccagcacttt gggaggccga ggtgggcgga 3060
tcacgaggtc aggaattcca gaccagcctg gccaacatgg tgaaaccccg tctctactaa 3120
aaatacaaaa attagccaga cgtggtggtg cgggcctata gtcccagcta ctcgggaggc 3180
tgaggcagga gaatcacttg aacctgggag gagggggttg cagtgagccg agattgcgcc 3240
actgcactcc agcctgggcg acagagccag actccatctc aaaaaacaaa aaaaagttat 3300
ttcccaagca cagccatgta ttccaggctt gtggatcagc gttggtggtg gtgtgtgctc 3360
tcatatctta gttccagcta agcacactct gacatgttta cactagaacc atttgttttt 3420
tctagaaata gaaatttcag aattgtagag tcagaggact taccagaaat ctcttaggta 3480
gttctcctcc cctccctcaa gtgcagtcct aacctcctgg agttttctgt agaaaccaca 3540
agcctcagag ctggccgaga attctagcca aagatttttc catgccaaag taatcccccc 3600
tctcctaagg gccatccttg gtggggactg gtttcctgtt aagccctcgc tgtcagtcct 3660
ggctgtggaa tttcctggtg aggagcactg gcccgtggag ctcggccctc gtgccggcct 3720
tgagcaggcc caagtgttcc gtgttcttga tacctttcct ccagcacagt cttgcttccc 3780
agaaaaaggt ttgcacttga aaatgatgca tttgctgatt aaacatagtt cttttgcttt 3840
atttggtttc taaaataaag tgggagtttt tgagattgag taacgtgagg ttaagatagc 3900
acgtggaatg gctttttctt ttctttctat tttttttttt tttttcctgg agacagggtt 3960
tcactctgtt gcccaggctg gagtgcagag gcatgaccat ggctcactgc aacttcgatg 4020
tcctggggtt aagcgatccc ccagcctcag ccccccaagt ggctgggact acaggtgctc 4080
gccaccacac ctggctaatt tttgtatttt ttgtagaaaa tgggtttcat caatgttgtc 4140
cagactggtc tcgaactcct gacctcaagc aattctcctg cctcagcctc ccagactgct 4200
gggattacag gcgtgaacta ccacgcctgg cctggaatgg cttttgatgt tctcctatgt 4260
gcacatgtgg gtgaataaac accaacaaag tccttatgtt acctgaagag ttgctctctt 4320
cttaatattt aagtcgtatt tatttaaata ctttaatagt tgtacactat taaagtatta 4380
ttaggtcaaa atcaaggaag tacaaaaggg tatgctgtga aaaatctctt cttccttgct 4440
ctgcttactt acctaccccg catcccccca tacaccccag acacacacac acacacacac 4500
acacacacac acacacgcat cactcccata catgcccacc tgtttaccag ccaatcacat 4560
ttcttggggc aactcatctg agttgcttct ctttccagag agtttttgca taaagaagca 4620
caggtatttc tgcgttacca tgaccctatt tcccagtggt tcctagccag ttgactctcc 4680
tgcactggat accatcctgg acagcattcc ttagggaaat gagccccctg ttttttccca 4740
ccatggcaca gttggtcctt tgcatggacg caccattatt gcccctgtct cttcttggtg 4800
gaccttaagg ttttctccat ccttttgctg taacacacac tgctccaagt gtgtgagcat 4860
atcagtagga aacgcttcca ggagtagaac tgctaggtca gagggcgtgt ggatctgtaa 4920
cctgacagac ctagaccggc ttcagtttgg ttttatccag tttccatatt gattattcat 4980
ataaaaggaa acagacaaac ataacgctgt gcatgtattc tctcttagac cagaacaggc 5040
atagggtgca cttttaattt gtccatttcg tagagtagaa attgtttttg ctgaaatgaa 5100
caccttagga tgctgaagaa tatgacccgt cccatggaaa acattcaaaa atgtgtgtag 5160
cgctttcttc ccaagggtgt gtgtgcgcat attttaacac taattcactt tctacttccg 5220
ttgctatcct ttctgtgagt ctttctcaga atctcagaaa agaaactaaa ttgttcactc 5280
tagttatcaa tgctgtactc tatacctgga atttgctaaa agggcagatt ttaagtattc 5340
tcaccacaga aaagagaaaa gaaaatggta attatgtgac gtggtggaca tgttaactag 5400
ctttattatg gtgagcattt cacagcggat atccagtcat cacgctgtac acattaaaca 5460
tgtacaattg ggtttttttg agacaaggtc tccttctgtc acccagtctg gagtgcagtg 5520
gctcagtcat ggctcattgc agcctcgacc tcctgggctc aatccatcct tccccctcag 5580
cctcctgaaa agctggggcc acaggcatgt accatcatgc caggctaatg catatatatt 5640
tatatttttt ggtggagatg gggttggtct cgaactctgg gctcaagtga tcctcccgcc 5700
ttgcccttcc aaagtgctga gattacaggc atgaaccaca gcaccaggcc tacatgtaaa 5760
atttttattt gtcaactata ctttgacaaa gctgagaaaa aaaatcctaa tatttaaaaa 5820
aaaaaaaaaa aggactagct tgagaccttt tccagctctc tggcttatca gctgccgtct 5880
cttccgggtg cagatagctg gaagggaaag aaaatcccta aaattaccca caagccaaga 5940
atgaagtgtc tccctttgag ccacagtggc agttttgttt ttaatcatag aagtgtattt 6000
tgagccgggt gtgctggctc acgcctgtaa tccccgcact ttgggaggcc gaggtggggg 6060
gcggaggggg tggggatcgc ctgaggtcag gagttcgaga ccagcctgac caacatggag 6120
aaaccccgtc tctactaaaa atacaaaatt agccggcgtg gtggtgcatg cctgtaatcc 6180
cagctactca tgaggctgag tcaggagaat ctcttgaacc caggaggtgg aggttgcggt 6240
gagctgagat catgccattg cactccagcc tgggaacaag aaaaaaaaag aagaagaaga 6300
agaagtgtat tcatttcagt tacttttaaa aaagtgaaca gactttatat tttagagcgg 6360
ttttaggttt acagaaaatg aaacagacag ggcagcgagc tccttgtact cctccccagc 6420
acacagttgc cctgttatga acatcccaca tcagtgctgt gcgttcatta acaccgatga 6480
acctgatgca tacattatga tgaactgaag tcctggactt caccctttct cttgtacagt 6540
tctgtgggat ttgacaaatg cataatgctg tacagccaca atgatagtat cgtccagagt 6600
agttctcctg ccttaaaacc tcttttgctg cacctgtttc tctctcccca ctcaccccag 6660
ctatctgatc ttcttagtgc ctccgaagtt ttggtctttt caggatgttg tagcgttgga 6720
atcatggagt atgtagcctt caccacatac accttccttc actttgttgg cttcctttac 6780
ttagtaatat gcattcaagt ttcctccatg ccttttcatg gcttgatagc tcatttcttt 6840
ttagcaccaa ataatattcc gttgtccaga tgtagcacaa tgtttatcca ttcatgtaac 6900
ctgtgaccga ctcacagata ggatgtggaa tcactcacca cagaggcatt agacaataat 6960
cagacccaag tcatttcatg ggggaacaag cccacaggta ccagactgtc cagtgagtca 7020
gggccactcg taggaagtaa gaagagaggc tagagcatag ccaggtcctc actttatact 7080
ttaagcccat gtgtatttct cccaaaccac acagcattgt ttccatgctt tcagctttgc 7140
atgaataacg tgatacttga acgcatcatt tatcacttgc tctctttccc acagcgctgt 7200
tttcaagctt cttcctgttc atgatgctct gcttaaccct taagctgcat gggattctgt 7260
tctgtgaata cgcccacccc atgtattatc ctgcccagca aaaagtcccc aaaactctgg 7320
atggtggtta cctctaggga gggagagaag agattgggaa tagggagcga cttcaacggt 7380
gtttgtaatg ttttgtttct ttaaataaaa gagctgagat catttcagca gaatgttgat 7440
ttagagtctc ctggacaatt tgttgctcaa agtgctctct taaagagcac tttaaaaaaa 7500
aaaacctttt atcttattat ttatttattt atttattgag acggagtttt gctctgtcac 7560
ccaggctgga gtggagtggt gtgatctcag ctcactgcaa cctttacctc ctgggttcaa 7620
gcaattcccc tgcctcagcc tcccaagtag gtgggattac agatgcgtgc caccacactt 7680
ggctaatttt tgcattttag tagagatcgg tttctccatg ttggccaggc tgatctcaaa 7740
cgcctgacct caggtgatct gcccgccttg gcctcccaaa gtgctggtat tacaggcgtg 7800
agctaccatg cctggcttat cttatatatt tttaaaaaca gcttattgag atctaattta 7860
tgtaccataa aattcaagta tataattcag tgcttttata tataaaacat atatatgaaa 7920
tagcttattg agatataatt ttttatataa aacagcttat tgatatgtaa tgtatgtacc 7980
ataaaattta aatatataat tcactggctt ttatatattc acgaatatgt gcaactatca 8040
ccacagtcaa ttttagcata ttttcatcag ctcataaaga aaccccaagc ccttgaacta 8100
tcaccccata tccctcctcc cagcccgtcc ctcctactca taagcaacca ctaatctact 8160
tagtgtctat agatttccta ctctaggcat tccatgtgag cgggatcatg caatacgtgg 8220
gctcacacaa tataagtggc attccatgtg agtcggctca tgcagtatgt ccggctcctt 8280
tcactgagca taaggtcttc agcactcatc caggttgcag cctgtgtctg aatttcattc 8340
cctcttctgg ctgaatcgta ttccattgtg tatcttggac atatcctatt ctgctcaccc 8400
agccgttggt gggcgtttgg agtgttttcg cctttcagct gttttaagag ggttgcagtg 8460
aacatttgta caagttttgg acccaatgcc tgttttcaat tctcttgtgt agagagcact 8520
ttttagcaga aaaagaatag atttgtggcc tccctttgtg tgcggtcagt gccttgagaa 8580
gagtgaactg tgctgccacc tccggagccg tggagagcgc ggggcttggg tagcagctag 8640
gacgatacaa gttgggacaa ggccaggtgc aatggctcac gcctgtaatt ccaacacttt 8700
gggagaccga ggcaggggga tcacctgagg tcaggagttc aagaccagcc tggccaacat 8760
ggtgaaaccc catctctaat aaaacagaaa aattaactgg acggggtggt ggacgcctgt 8820
aatcccagct actcgggagg ctgaggcagg agaatcactt gaacctggga ggcggaggct 8880
gcagtgagtg gagatcagac cactgcactt cagcctaggt gacagagcga gactccgtct 8940
caaaaaaaag aaaaaaaaag aaagaaactc atggataatc ctccctctcg tgcagttcgc 9000
ctctacggac caaacttcat ccttcaggtg tactcatctc agaggaagtc ctggcaccct 9060
gtgtgccaag acgactggaa cgagaactac gggcgggcgg cctgcaggga catgggctat 9120
aagtgagtat ggggcagcac ccgccgagtg acagtaacag acagcagaaa cacgagaaga 9180
ccctctctct gcctccctgt gaaagcaccg gcacatgagt gctggggaca attgtcacct 9240
tccaaaagct gagccctata accagcaggt ggaatttgtc ctgctagggc tgtgcccagc 9300
acacagacct tggctcactg ccaccttgcc ctgcctcctc cttggcctct atagactcct 9360
ggttgctcgg gagtgcccag tgctgtggtc atctggtcag aggggtaggc tgagggcgtt 9420
aggtgcctct ttttccaagg tgcctctcag ccagggtcca ttcacctccc tgggtagagg 9480
ttggaccaga acagctggcg aggagggttg ggctggggag agcagcagag acaaatcctg 9540
tgccagtttc acttcattcg ggagccatgg aagccttttg agctggggag agaatcaatc 9600
aatcagactg atacttaaaa aatgtcattc ctgctcgtag ctctgaggga aggtgggaag 9660
gcttaacagg gtgtgtgtcg cctgacagtg attcctaacg ggggtggggc ggtggttacc 9720
atttaccagc actgcctggg gagatgcggc agccctcagg catcggggga gagggtggta 9780
ggatgctact gccactttgt tttccatggg agggtcccca ggtgatttct atgcaacttt 9840
agggtattca atatgccagt tttcagaatg aattaccact cggtgagaaa gttggcatct 9900
tagctagtca ctgtgacatc cctaaacagc aggggtgaat tacacagcaa agccccccca 9960
tcacagtcca ggaacctggt ggaattgata actggggcca tgttaacatc tgtacctttt 10020
attagattaa atgtgtgtat gattatacaa tcctatgtcc ttctcatagt ttcttgatcc 10080
taacctggat aagaaacacg accaatgaag gaattttgtc tgacacttta gggttattga 10140
atcgaaaaat cgttacaata ttctagcact tggttagaac gtgtgatttt ttttcctaaa 10200
tgctaaggtt tttccctctt attctgaatg tcgtatgagc ggtattatga catagtatag 10260
gatttgtgtt tgcttatgcc ttaaccatta tcacaaataa ggttttcttt tttaggaata 10320
atttttactc tagccaagga atagtggatg acagcggatc caccagcttt atgaaactga 10380
acacaagtgc cggcaatgtc gatatctata aaaaactgta ccacaggtat gcagcaattt 10440
cttcttgaaa aattttggaa tgaaatcaac taggagacac catggggaat cgttgtcctg 10500
agtctgattt ctctgagctg caatactcgg tctggatggg ttttgcattg ggaggagatt 10560
agagtctgac caggcctggt tactctaagc agcccttggt ttattcatag gaagtggctg 10620
aggtttctct gctatttcat tttcagcctc taccgtctgc ccttgttggt agcggctcac 10680
acttgcaaca tcgacattca actctattta gttttctttc ctcttcagac atttagaggt 10740
gtacctattt tgtcagggcg tggttctagg aatccaagat aatgtctcag tgtcccagcc 10800
agggtgaccg gctcattcca gtttgccagg gacttcactg gcttgagcaa gggaagtcct 10860
gctccattcc aggcagctgg gctggctggt cccgttagcc ccaaccccgg gacagcagtg 10920
ccagagggtg ctctgtgagg gatgggcagc attctggcgg cctgggaatg agttgtggtg 10980
tttccagggg gtagaagtgg gtacaagcca caggtcacat gatgagtggc tgacctggct 11040
gggagggcag aagaggggat ggacttaggc tcttcctttt gctttgcaca tatttaggat 11100
gtttgcagac ttgctatgat tgttgctgtt atgtgttttc tgatgtgaaa gatacacagt 11160
gtcctttgcc catgagctct ccttgcctcc caggtcccca gggcttatgc ctggtgtcta 11220
ggcatcacct ccctgcctgc caggtgccag gtgctgcatt tcgggggagg atgaactaat 11280
caccccgcgc cacctttcct ctgagtggga gcctggggca ggtttgcatt cctggaggcc 11340
gctggtggag gggtctgggg gcctgacttc cactgcagcc tgctgtcctg gggaatgtgg 11400
cagggcaagc ccagtgggga gggctgtgca cggccaggtg cacccatcaa aacagcaggg 11460
ctgcggtttg tccctgtgga gaagctaaac acagctgcct gggcactttg taaatgctga 11520
gtggttcttt gtctttctgg gttacacacg gaatcaggga gccaagtcca gccgggcagg 11580
gacgggggga ggggaggagg tgctgccgtc ccttggcaag agccttggga actcacaagg 11640
aggctggagg gcttggaaga aagaagagaa ggccattgtc tggtaggctc tattctatct 11700
cggtggtggt ggtgggggga ggcgcacttc ttttcctctt tctgtgcagc agttgccctt 11760
tgatgcctga gttcttggct tgttttctgt cgggcttctg tgaataacca catgtgccct 11820
ggcgctgtga ccacacaggg ctatccctac cgaccttagg attcttagga aatgtcttct 11880
cttaaagggg acatgtcttc acttggccgt gtcagtgccc cagagccaga gtccacctgg 11940
aatgcacctg tagtcactga gaacccgggg ggtgtgcctt agtaagaagg tgtcaggaag 12000
gacctattat tgtagggcct gggctcctgc aaggtggttt gggggtggtt ggaggaagca 12060
gagatttgct ctggattgga tgctgtcagg aagcaggggt aattctgtga ggctgcttta 12120
ttattttttt tctaggagga ggttggaatg aggctaggct aaagctgtga ttggtaaaga 12180
aacgtccgtc gctcaagtta gccaggacag gaggagacat cagatcgtga ttttgtggtt 12240
gtgagcacaa ggttcctgtt ctgtctgttc agacatcatt tcggaggagg ctccttgtgt 12300
cttgccccat ctcaggcatg gaggggccta gtccgatatt gacgctcagt gaaataattc 12360
aggttccgca gagcacacgg cccagctatc agggcgggcc agctctgcat gccaggggcc 12420
gcgtcttccc ttctcagcat agcctgggaa attcactgca ggacaaaatg catcagttac 12480
ttcctcttca tccataacct gggatgtttg actcccaaat gagtaactct tacgtttctt 12540
ctaatcctag ggaaactatt ggttatattg ctttcaacac tacaaattta aagcagttat 12600
aggagcccag aggtttccaa atggcttcct taaaaattag aagatgattt taaattccaa 12660
gaggaaaaac aaaactagca ttattgtata cttaccctca caaccgtcct aggagctggt 12720
acaattttaa gagaggttaa gtaacttgcc caaggtcaca ctgtggggat gtgagccgcg 12780
taccttggct cagtgtctgg tctttgccac tgtccctata tggatttact taccttattg 12840
gagttgtaac tagcagaccc ttctatgtct cagaagacag gagagggaac atcggaagaa 12900
atgactgatt tctaagcatg tgagaggcag gtgactccgc actatcgtga ccagaatttc 12960
ccctgttctt tttgcagtga tgcctgttct tcaaaagcag tggtttcttt acgctgtata 13020
ggtaagttca tctggagtcc cccttttgat acttctaact aggaaaagct ctctactttc 13080
agaacagtac tccctgtgtc tctgggggcg tgggagggaa gaaggtgggg tcacgggttg 13140
gaatgtgccc agcggcgtct cgctctttcc aaggagctcc tggtttagat ttccatggcc 13200
tgtagacacc ttcagccttg ggtccaaggg acaccccctg agatcaggca cgctcaagaa 13260
gctgacaaag ccctacactt tatgccaccc atgagctgga ggcccggcag gtctctttct 13320
ccagaaagca aaggggggtg gcgttagtga gccctggcag ccacctaacg tggacttgga 13380
gcatctgcgg ggctgtggtc cagcaccacc gtgtggccac caggtgctca tcagccagtg 13440
ggacccggga ggagggacaa gaccagagaa caacagtgct cttgcctctt ctctcctgaa 13500
ttttggacgg tggcttagac ttgggtgtcc ccatctctgt gtttagagtg cttacagttt 13560
ccaaactgtt tgcaaatgtg gaagccaccg tccctctcct ctgggatggc ccagtgctgt 13620
cgtggggccg tggtcctgag ctcagctttt catttgaaga ggtggaagga gctgacaccg 13680
tcccatcccg gcagggctgg ctcaggtctt ctttaggtcc tgagtggggg tccagcacag 13740
ccccaagggt gcgtggcacc cgccctgccc tctgcccatg cactcatctc ctggtggaga 13800
agacactcac acacaggaag cagggaaggc agcagacctc actcacccct caccccctca 13860
ctcaccccct actcaccccc tcaacctctc attcaccacc caccccctcg ccccctcact 13920
caccccctca ctccctcaac cctcactcac ctcctcactc cctcaaccct cactcacctc 13980
ctcacctcct cactctcccc ctcatccctc cctcacccca ccccgtcacc tcctcactca 14040
cctcctcacc ccctcactca cccttcaccc cctcactcac cacctcacct cctcactcac 14100
cccctactca acccctcatt cacccctcac cccctcactc acccctgcac cccctcactc 14160
accccttcat ccactcaccc acctgctcac ctcctcactc aacccctcac cccctcacta 14220
atccctcact ccctcacccc ctcacgccct cactcacacc ttcacctcct cactcacccc 14280
ctcaccccct caacccctta cttaccccct cactcatccc ttcacccctc actcaccccc 14340
tctctcaccc attcaccccc tcactcatgc cttcaccccc tcactcacct cctcactcac 14400
accttcaccc ctcagtcacc ccctcactca ccccttcacc ccctcaatca tgccttcact 14460
ccctcactca ccccttcacc ctctgaatta ctccctcatc ccctcactca ccccctcact 14520
caccccttca ccccctcacc caccacctca cccacccctc acccaccccc tcacctcctt 14580
acccctcacc cccctcactc acccctcacc ccctcactca ccacctcacc cacccctcac 14640
ccaccccctc actcactccc tcatcccctc actcaccccc tcaccccctc actcaccccc 14700
tcacccaccc ctcacccacc ccctcacccc ctcactcacc ccttcacccc ctcactcacc 14760
ccctcactca ccccttcacc ccctcactca ccacctcacc cacccctcac ccaccccctc 14820
actcactccc tcaccccctc actcaccccc tcaccccctc actcaccccc tcatctcctc 14880
actcaccccc tcacctcctc actcacccgc tcacctcctc actcaccccc tcgccccctc 14940
actcacccct caccccctca ccccctcact cacccctcac cccctcgccc cctcactcac 15000
cccctcgccc cctcactcac ccctcacccc ctcaccccct cactcatccc ctcacctcct 15060
cactcacccc ctcacctcct cactcacccc ctcacctcct cactcacccc ctcacctcct 15120
cacccacccc ctcactcact ccctcacccc ctcaccccct cactcacccc ctcacctcct 15180
cactcacccc ctcacctcct cacccacccc ctcactcact ccctcacccc ctcaccccct 15240
cactcacccc ctcacctcct cactcacccc ctcacctcct cactcacccc ctcacctcct 15300
cactcatgcc ctcaccccct cactcaccct ttcacctcct tgctcatccc ctcacttacc 15360
ccctcacttc gtcaatcacc cccccacctc gtcaatcacc ccctcacctt ttcactcacc 15420
ccctcactca cccccttact tcctcactta cctcctcacc ccccactcac cccctcaccc 15480
cccactcacc ccctcacccc acactcaccc cctcaccccc cactcacccc ctcacccctc 15540
tcacctcctc actcaccccc tcacctcctc acttatcccc tcaccccctc aattaccccc 15600
tcaccccctc aattactccc tcatcctttc aattacccac tcaccccctc acctcctcac 15660
tcctcactca ctccctcact caccccttca ccttctcact cacctcctcg tctcctcacc 15720
ccctcactca cttccagccc tgcccctccc atcttccttt tctttgtgtg agaatctggg 15780
gtccctgagt ggtgtcagtc cctccaagac tcaaggagtc cccagggcct tgttatccag 15840
aacaccccca cctgggtccc gggagacccc atgggatcac aggagtgttc agggaagtgg 15900
tgcttcctgg gtctgggtgg gctggagggg catcctccct tccccaagag gagaccccca 15960
ggagccccct aagtccatcc ccagcagtgg tgcccctgcc ctgtccttgc agcctgggag 16020
acccttggga ggggcgggcg ctgggtggct gggcggcttc tgctggtctc accccactgg 16080
cctcctgttt gtcatcctca gcctgcgggg tcaacttgaa ctcaagccgc cagagcagga 16140
ttgtgggcgg cgagagcgcg ctcccggggg cctggccctg gcaggtcagc ctgcacgtcc 16200
agaacgtcca cgtgtgcgga ggctccatca tcacccccga gtggatcgtg acagccgccc 16260
actgcgtgga aaagtatgcc aggggcggcg cgggccgggt gggggctcag ggctggccta 16320
cagccaccct gtgaccttga gcaggtctca acccttgcag ccccggcatc cttgtgttta 16380
aatggggaga gtattgcacc tgcttcctag ggctgtgaga catcaagtgc gctcatgcca 16440
ggcagtgcat ggctgtatgc actgagtgtc ccctgcacgc agggcacagg gtgcaggtgg 16500
aacattctcc acgatgtcgc cgtgaccagc gttccttcca gccactgtcc tctgagctct 16560
gtcctgccct tgagcaaagc ccctgccccc tgaggtatcc tgtctccggg acgctagtcc 16620
caggagaggg cacactcaga caggcttcag gctgccctgc tggaaggtcc ctggggttaa 16680
gcgttcttgg ccacagcatt gctcatgcag agggttaggt aggggtgagg ctagccgtga 16740
cagtattagc atttatggac gctaccaccc cctccccttt tccttaaaca catagtgctt 16800
ttggtcacat gctgctttgg aggaggcctc acttggcgga tgtatttttc tgccttagag 16860
agaggctgaa ctgggtttga ctgttggccc agccctctct tgctgcgtgc ccttagacga 16920
ttcactcaac gtctctgatc catggcatgt acaactataa gatgggcatg cccttctcct 16980
ctcgggctgt tatgaaggtc aaggaagcaa gggctgttac ccaagggtgc tcccttctct 17040
ccccctcttc acacccccag gtgctctggg ccctctagga actgggtttc tctcaagggc 17100
tgttacccaa gggtgctccc ttctctcccc ctcttcacac cactgggtgc tctgggccca 17160
ctaggagctg ggattctctt aagagggaaa ctcttggata aaggaaatgg tttgattgat 17220
atcggacaag tctgttcatt agtatccatt tattaagcac ctaccatgtg ccaggaaatg 17280
ctttggcgta caaaggaaaa taagggccag tcctgctaga aatggccttg aaaccccagg 17340
gagggatgtc ggcccattgt gggtgctgca gattccttga aggtgatgca agagccagaa 17400
agaaggatga tgtggggggc tgaggcaggg agtcggggtt gggggagtgt gggggagaag 17460
gggagaccga gcacctcttc cactatctcc ctgtgtggtt tttggtgaac catcctgcct 17520
ctgggtgtct tgcctccagc ttctgacgtt ggaagttcat ccactgagag ctctgtgttt 17580
atggctctga gatactgagt ccttcttctc tcccagacct cttaacaatc catggcattg 17640
gacggcattt gcggggattt tgagacaatc tttcatgttc tatggagccg gataccaagt 17700
agaaaaagtg atttctcatc caaattatga ctccaagacc aagaacaatg acattgcgct 17760
gatgaagctg cagaagcctc tgactttcaa cggtacgtgt ggctcaggct tggcaagcag 17820
gttggcagaa tcttaaagag atgttgattg gaaatgacac ttgtgctatg ccaaatggaa 17880
gggaggcatt tgcgttgagc gagggtagcg tgcagcgggt ggccaatggg agaggctcac 17940
agaggctaag agcacctgcc gcattttggg ggaggcagca gccaccacat ctgttctgta 18000
ctgtactgag tggtggtgat tcaagccagg catggaaaag gctagaacag ggctttccca 18060
ctgcagcacc cttgacatct gggtggttct ctgttgtagg gctctcttgt gccttgtagg 18120
atgtttaaca gcgtccccag cctctaccca ctggaggcca gtagctacca agctgtgaca 18180
accagtgttg cctgctgaca ttgccaaaca tccgctttga ggcaaagtca cttccagttg 18240
agaactactg gcctaaaatg tgtaaagatc cttgattttt aaagatacat tctaaaacca 18300
agttgcttaa ttcaggacaa acatgctttc tcttagcctc ttattcggtc ccactctggt 18360
ccatccaagg gtctggaatg ttctagcccc atgtggatac agaagaagca aaacctcagc 18420
cctccctaca gcatgtctgt attcacattg ggaaatggtt cacatataga agagcgaatg 18480
cctgagcaat ggcgtggtgc ctctggggcg aaagctgact ccattgactc catcggcttt 18540
ttggctgttg cctcctgtgt gtctttcccg tcttgatcac ctggagatat gtaattttgg 18600
aagcagagct agcaaataat tcctcttata agcagagcta gcaaataatt ctacttataa 18660
gtagcataac gtcttgcctg ccagaaggag aggtctggca gggggagaaa gtgagaatgt 18720
gggacttgtt gggatgcagg gtcctctggg cagggtggcc agggtgccag gcccagcagc 18780
ctgcatgtgg gaaggccagg tggagacata ggtgataccc gcctggctca ctgtgttttc 18840
tcttcttgaa acagacctag tgaaaccagt gtgtctgccc aacccaggca tgatgctgca 18900
gccagaacag ctctgctgga tttccgggtg gggggccacc gaggagaaag gtgaggctgc 18960
tcctgggcac acaggactgc agggcccaca gatggagcat tgggttcgga agtgggaggt 19020
ccaggtttta atcccagttc tactactcaa tgactggatg actttggttg attcccccag 19080
tccttgtgcc tcagtttctc catctgctaa gtgggagaaa tcctgcccag cctacctaat 19140
acactgtgtt cttatcgtga tcacacagag cagcatgtgg aatggctttt gaagtatctg 19200
ggccatacga gtttagaggt gcaggatctc ctgtgttgca ctcattgtga gtttagagct 19260
gccctggaga tcccaccaag gcctgcgtgg ctgagtgaca gggggcttgg tgaggacggg 19320
catcctggac ccatggtggc cacatctaag cctgtcctct gccctgataa ccacagagag 19380
aggctctctc cacccacttc ctttgcaatc tgcatttctc tctgacagtc tttcaaatga 19440
agggagcctg gctgcttcat ttttatggag ggttggaagt gcttagtggc aggcacaaag 19500
gttcatttta catattgttt atatccttct caaaagcgtc taggccatac agacaacaaa 19560
tcctttcaaa caaggggaaa agtacaaagg ttgggtgatt tctggggagc gtcagggaag 19620
gtagtggggg gcatcctggc tcctcatcag cagaaactta ctacagtaga gccacaggct 19680
gggcaaaaga cctcatggaa tccaagatga agggaatatc gacaaatatt tgtgcgcacc 19740
tgcacctagt acaggctggg tgctactcag gtgctgggaa tgcagaagtg aacagagtaa 19800
gacaaatgtc tctgctgtca ggagctttac ctctcttctg gatgtcggtg gtggggacgg 19860
ggcaggtgtg gtcagacaga tgggagacaa acaactgagc gaggtacttc caaacatctg 19920
agggtgggga tcacaaggtc ccggctattt tgaaggggtg gtcaggaaag gcttctcgga 19980
agaggtggca tttgagctga gactcaaatg gcaaaaatgt gtacacatca aaaaggctag 20040
tgcatgtatc ttcaggtgtg gtcaaggggc caaggaggtg ggctggggcc agattgcata 20100
ggtccttgtg gattatggtg aagacaccag cttctcatct gcttgaggtg gggagatcgt 20160
gagccgggga gtgccatgat ctggcagctg cgtggggagt ggggatgaat ggatggagac 20220
gaggatgatg gtgacaagtc cattgctgtg gttccttgag acaggaagcc agctcatagc 20280
agagtgcggg cgtggatgtg aagagatgag ggtacactag ggctagagcc accagactta 20340
ctgatgggtt gcatgtctgt gggagagaga gtgagaagtc agggacgatg gctttccact 20400
ctgtggctga agccccaggg tggcgggtgg tgccattttt caagccagga aatattggtt 20460
ggtgagaatt tggggtggga gaaggtgtga cggagggttc tggttttgca cactaagccc 20520
acggtgccca gaagatgccc gaggggaggc agcaaagcga gagtgggaaa tgcagaggtg 20580
gcaagtgcag gccgtgtctt gagaagctct aatgtgcagg ggagccgaga agcaggcggc 20640
ctagggaggg tcacgtgtgc tccagaagag tgtgtgcatg ccagagggga aacaggcgcc 20700
tgtgtgtcct gggtggggtt cagtgaggag tgggaaattg gttcagcaga accaagccgt 20760
tgggtgaata agagggggat tccatggcac tgatagagcc ctatagtttc agagctggga 20820
atttctttcc ctgaagctga actccagagc tgcattcagc acaggcaccg ccagttgtaa 20880
ggagaatcca ggtttcccag gagaggggtt ggtgctggga tgagctgacc ggggcagggc 20940
tggaaaatag ggctgtgacc atctgtgtag tgcgtgtgga ggtctcaggg agggaagtgt 21000
gctctccctg cgagagctgc aggcaacact gggagctcaa caagtctccc tgtccttagg 21060
gaagacctca gaagtgctga acgctgccaa ggtgcttctc attgagacac agagatgcaa 21120
cagcagatat gtctatgaca acctgatcac accagccatg atctgtgccg gcttcctgca 21180
ggggaacgtc gattcttgcc aggtaattca acatttttat tctacctttg gtccttacca 21240
gatcctactg aaccccccat gagagagagg gcattcttgg ggtcagcaga gcctcctcag 21300
tgacacggag ccagctcggg gcagtcatgg gaagtgacgg ccacaaacag tgcgaacgct 21360
tctggtggca gaaggaagta cagtcaacaa atcacacaca ccctctgaaa aaccggtatt 21420
tggtaaaagt gccagtggaa cagaaacaag tatttagact attttaaatt atgaacggca 21480
atttatttag taacttttag cttgaacaga ttaaaattca ggatgggggc tatctctttg 21540
ggggttacat ctctgttacc atcacccctt gatggtggag attcgaagcc cacacagtca 21600
ctcgtaactc acactgcgac ccccgccccc caactcctct aggcctggtc agtggtgtgc 21660
ggcagattgt gacttgattt tctgctctct gtaccttgct gtgtcccaca gggtgacagt 21720
ggagggcctc tggtcacttc gaagaacaat atctggtggc tgatagggga tacaagctgg 21780
ggttctggct gtgccaaagc ttacagacca ggagtgtacg ggaatgtgat ggtattcacg 21840
gactggattt atcgacaaat gagggtaact atcctgtcct ccttctgact gtgttctccg 21900
attcctcgag ccaaagccag acatctgtta ggcgtggttc tgctgctgga agctgactgg 21960
tgaccactgg tcagcatgaa gcaaactctg cttcctccag ccacagcccc atccccccag 22020
tgtccaccca ttgcccattg cctctcactg gcttcacttg catatttccc ctggtgtttg 22080
gatgaaaagc gctggggctc agcttgtgtg aaattccttg gtgctctgcc aaccacactt 22140
cgttctggct cagctgactc agctgttcca cccaggccac ctcacatcaa actttttttt 22200
tttttttttg agatggagtc tcactgtgtc gcccaggctg gagtgcagtg gcacaatctc 22260
gactcactgc aacctttgcc tcctgggttc aagtgattct cctgcctcag cctcccaagt 22320
agctgggact acaggcatgc gccaccacgc ccagctactt tttgtatttt tagtagagat 22380
ggggtttctc catgttggcc aggctggtct cgaagccctg acctcaggtg attcacccac 22440
ctcagcctcc cacagtgctg ggattacaag tgtgaaccac ggtgcccggc ctcacatgaa 22500
acttttgatt tatagagagc agagggaaga gccggctgtg cccatccttt tctggggcca 22560
tcgagtggct cctgggcagc ccccaaggtt aggaagggca ggagcagcca gggttctctg 22620
atgccccaga ctcaagcacg agggaaggtc tcaggggttc catgtgagcc tcatggatgt 22680
ctctgcttag cagagccctg gctttgggca ttgtccagat agggggtgag aaccagatct 22740
tctcatctcc aggacctcag acgtatagtt ttctcagatt tctgtgcttt ctggggctgg 22800
gctactagtg gaagaaagca gtctattctg tcttctccca aatctcccag atgcccagtc 22860
tgttgaagga ggagcagaac cagggggcct ttcccgctga ggcccgacct gtgtctcctt 22920
caaatgacac gcgggactca gggccttccc atgaccatgg ggcccagggg gcgtcacctg 22980
gcccagggcc cagtgctaga aacagatgac cccaggagga ggaggcaggg caggagggaa 23040
gctggcaggg ctgggatggt cagccaggct gaggggcgga ctcgcaccag gatggagcta 23100
ggaaatgatc caggtgtgtt tggcggctgc aggtgggtcc gcatggctgt gcagggaggg 23160
aagggctgcg tggcaggaga gcagccgggg gaggcccaga ctctgctgaa gagatgcctg 23220
ttgtgccggc ctccacatcc gctgcccgct ccttccggag ctcctgcccc gccatgctca 23280
gcctgactct gaccaacacg ttggagagaa gaatgatccc tttgtgctat taagcttgct 23340
tatttggttt ctaagtgctt catgcgaacc tagaggaaaa aattattttc cacctttgtt 23400
tgtcttaaga aaataacaca cttttttttt tcctatttga acaggcagac ggctaatcca 23460
catggtcttc gtccttgacg tcgttttaca agaaaacaat ggggctggtt ttgcttcccc 23520
gtgcatgatt tactcttaga gatgattcag aggtcacttc atttttatta aacagtgaac 23580
ttgtctggct ttggcactct ctgccattct gtgcaggctg cagtggctcc cctgcccagc 23640
ctgctctccc taaccccttg tccgcaaggg gtgatggccg gctggttgtg ggcactggcg 23700
gtcaagtgtg gaggagaggg gtggaggctg ccccattgag atcttcctgc tgagtccttt 23760
ccaggggcca attttggatg agcatggagc tgtcacctct cagctgctgg atgacttgag 23820
atgaaaaagg agagacatgg aaagggagac agccaggtgg cacctgcagc ggctgccctc 23880
tggggccact tggtagtgtc cccagcctac ctctccacaa ggggattttg ctgatgggtt 23940
cttagagcct tagcagccct ggatggtggc cagaaataaa gggaccagcc cttcatgggt 24000
ggtgacgtgg tagtcacttg taaggggaac agaaacattt ttgttcttat ggggtgagaa 24060
tatagacagt gcccttggtg cgagggaagc aattgaaaag gaacttgccc tgagcactcc 24120
tggtgcaggt ctccacctgc acattgggtg gggctcctgg gagggagact cagccttcct 24180
cctcatcctc cctgaccctg ctcctagcac cctggagagt gcacatgccc cttggtcctg 24240
gcagggcgcc aagtctggca ccatgttggc ctcttcaggc ctgctagtca ctggaaattg 24300
aggtccatgg gggaaatcaa ggatgctcag tttaaggtac actgtttcca tgttatgttt 24360
ctacacattg ctacctcagt gctcctggaa acttagcttt tgatgtctcc aagtagtcca 24420
ccttcattta actctttgaa actgtatcat ctttgccaag taagagtggt ggcctatttc 24480
agctgctttg acaaaatgac tggctcctga cttaacgttc tataaatgaa tgtgctgaag 24540
caaagtgccc atggtggcgg cgaagaagag aaagatgtgt tttgttttgg actctctgtg 24600
gtcccttcca atgctgtggg tttccaacca ggggaagggt cccttttgca ttgccaagtg 24660
ccataaccat gagcactact ctaccatggt tctgcctcct ggccaagcag gctggtttgc 24720
aagaatgaaa tgaatgattc tacagctagg acttaacctt gaaatggaaa gtcatgcaat 24780
cccatttgca ggatctgtct gtgcacatgc ctctgtagag agcagcattc ccagggacct 24840
tggaaacagt tggcactgta aggtgcttgc tccccaagac acatcctaaa aggtgttgta 24900
atggtgaaaa cgtcttcctt ctttattgcc ccttcttatt tatgtgaaca actgtttgtc 24960
tttttttgta tcttttttaa actgtaaagt tcaattgtga aaatgaatat catgcaaata 25020
aattatgcaa tttttttttc aaagtaacta ctgcatcttt gaagttctgc ctggtgagta 25080
ggaccagcct ccatttcctt ataagggggt gatgttgagg ctgctggtca gaggaccaaa 25140
ggtgaggcaa ggccagactt ggtgctcctg tggttctcga gataacttcg tataatgtat 25200
gctatacgaa gttatatgca tggcctccgc gccgggtttt ggcgcctccc gcgggcgccc 25260
ccctcctcac ggcgagcgct gccacgtcag acgaagggcg cagcgagcgt cctgatcctt 25320
ccgcccggac gctcaggaca gcggcccgct gctcataaga ctcggcctta gaaccccagt 25380
atcagcagaa ggacatttta ggacgggact tgggtgactc tagggcactg gttttctttc 25440
cagagagcgg aacaggcgag gaaaagtagt cccttctcgg cgattctgcg gagggatctc 25500
cgtggggcgg tgaacgccga tgattatata aggacgcgcc gggtgtggca cagctagttc 25560
cgtcgcagcc gggatttggg tcgcggttct tgtttgtgga tcgctgtgat cgtcacttgg 25620
tgagtagcgg gctgctgggc tggccggggc tttcgtggcc gccgggccgc tcggtgggac 25680
ggaagcgtgt ggagagaccg ccaagggctg tagtctgggt ccgcgagcaa ggttgccctg 25740
aactgggggt tggggggagc gcagcaaaat ggcggctgtt cccgagtctt gaatggaaga 25800
cgcttgtgag gcgggctgtg aggtcgttga aacaaggtgg ggggcatggt gggcggcaag 25860
aacccaaggt cttgaggcct tcgctaatgc gggaaagctc ttattcgggt gagatgggct 25920
ggggcaccat ctggggaccc tgacgtgaag tttgtcactg actggagaac tcggtttgtc 25980
gtctgttgcg ggggcggcag ttatggcggt gccgttgggc agtgcacccg tacctttggg 26040
agcgcgcgcc ctcgtcgtgt cgtgacgtca cccgttctgt tggcttataa tgcagggtgg 26100
ggccacctgc cggtaggtgt gcggtaggct tttctccgtc gcaggacgca gggttcgggc 26160
ctagggtagg ctctcctgaa tcgacaggcg ccggacctct ggtgagggga gggataagtg 26220
aggcgtcagt ttctttggtc ggttttatgt acctatcttc ttaagtagct gaagctccgg 26280
ttttgaacta tgcgctcggg gttggcgagt gtgttttgtg aagtttttta ggcacctttt 26340
gaaatgtaat catttgggtc aatatgtaat tttcagtgtt agactagtaa attgtccgct 26400
aaattctggc cgtttttggc ttttttgtta gacgtgttga caattaatca tcggcatagt 26460
atatcggcat agtataatac gacaaggtga ggaactaaac catgggatcg gccattgaac 26520
aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc ggctatgact 26580
gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc 26640
gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg caggacgagg 26700
cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg 26760
tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag gatctcctgt 26820
catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg cggcggctgc 26880
atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc atcgagcgag 26940
cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa gagcatcagg 27000
ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac ggcgatgatc 27060
tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt 27120
ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac atagcgttgg 27180
ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt 27240
acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt gacgagttct 27300
tctgagggga tccgctgtaa gtctgcagaa attgatgatc tattaaacaa taaagatgtc 27360
cactaaaatg gaagtttttc ctgtcatact ttgttaagaa gggtgagaac agagtaccta 27420
cattttgaat ggaaggattg gagctacggg ggtgggggtg gggtgggatt agataaatgc 27480
ctgctcttta ctgaaggctc tttactattg ctttatgata atgtttcata gttggatatc 27540
ataatttaaa caagcaaaac caaattaagg gccagctcat tcctcccact catgatctat 27600
agatctatag atctctcgtg ggatcattgt ttttctcttg attcccactt tgtggttcta 27660
agtactgtgg tttccaaatg tgtcagtttc atagcctgaa gaacgagatc agcagcctct 27720
gttccacata cacttcattc tcagtattgt tttgccaagt tctaattcca tcagacctcg 27780
acctgcagcc cctagataac ttcgtataat gtatgctata cgaagttatg ctagtaacta 27840
taacggtcct aaggtagcga gctagctcca cgtggctttg tcccagactt cctttgtctt 27900
caacaacctt ctgcaagaaa accaagggcc tgaattttaa cttcctg 27947
<210> 6
<211> 25333
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Рекомбинантный полинуклеотид
<400> 6
gcagagtcta agaaatcgct gtgtttagcc ctcgccctgg gcactgtcct cacgggagct 60
gctgtggctg ctgtcttgct ttggaagttc agtaagtgca gggagcctcg atcccaccat 120
gtgctcctgc agtccccagt gctctgagcc agaccctgct ctctgggcta ttgagacctc 180
tggaggccct ccgtgaggtt cctctcttac ataacgaggc tgtctctctt cccttctctt 240
gtttagctat gagattgaca catcatgggg aaagcattta gaatgtaccc agtgctttgg 300
ggtgcttggt gccacccagc actgtgagca caggttcttc taccttgggg ccacacccag 360
ttacctgtat ctcactgcac agcagtggct gttggggacc aggcccaccc ctccatgtcc 420
cacctcctgc aactgcagcc tgagccttcc catcagcctg gggtggtgca gacccatgtg 480
ccattgtgga tccttcaagt tacctgtgtg gcagagagga cgtgtgagtg ccgtccaaac 540
ccaaacactg agagggtcct tcccattgcc cccacggaag taaggtgccc cagtgctaat 600
tccacttata cttgctggtg gcaaggacac ttctcctcct tattaaagtg ggggattggc 660
tgggtgaggt ggctcacgcc tgttatccca gcactttaag aggccaaggc aggtggacca 720
cctgaggtca ggagtttgag accacaagcc tggccaacat gttgaaactc catctctact 780
aaaaatacaa aaattagtca ggcgtggtgg cgtgcacctg taatcccagc tacttaggag 840
gctggggcag gaggatcact tgaacccagg agttggaggt tgcagtgagc caagattgtg 900
cccctgcact ccagcctggg tgacagaatg agacttcatc tcaaaaacaa aacaaaacaa 960
aacacagtgg ggccaggagt tggaggctgc agcgagctac agtaatgcca cggtgttcct 1020
cactccatga ggctcattgc gtttctcagc ctgaagggca cctctcttct gttttctctg 1080
caagtgggca gcaagtgctc caactctggg atagagtgcg actcctcagg tacctgcatc 1140
aacccctcta actggtgtga tggcgtgtca cactgccccg gcggggagga cgagaatcgg 1200
tgtggtgagt cagccttgac cttgggaagg gactcctctg ctcaccttgg agacagcagc 1260
cgggtccagg ggcctttggg tgactgggcc tggcgtgcgt ccagtacgct gacacatgat 1320
gtcattgaat ccctgctcca ggctgagccc tggggctcag agaggttgtg tttccggccc 1380
aacctcaccc agcaggtggg agatgacagg gccaccgagg actgtgtcat tggaaccaca 1440
cgtgctctga actgccacag gaagtcagtt aagatgagca aactgtttat aaagttggag 1500
atgcaggcta ggaacggtgg ctcatgcctg taatcccagc actttgggag gccgaggcag 1560
atggatcacc tgaggtcagg agtttgagac cagcctgacc aatatggtga aaccttatct 1620
ccactaaaaa tacaaaaatt agccaagcgc ggtggcgggt gcctgtaatt ccagctattc 1680
aggaggctga ggcaggagaa tcacttgaac ctgggaggcg gaggttgcag tgagctgaga 1740
tcacgccact gcattccagc ctgggagaca gagctggctc aaaaaataaa ttaattaatt 1800
aaaaacaaaa ttggagatgc actatgttat tttcaaaaca agctgccttt aaagatctat 1860
ctgttgtcac agggtgggct catctgtttc attttatttt ctgtggttta tctatttatt 1920
cattttaatg aactaggaag cattgctcct atttatggca taccacatga tgtttggata 1980
cgtgtatgcc tgtggcatgg ctaagtcaag ctagaacatg ggccttacct catatacgtg 2040
tcttattaag aacacataaa acctactctt gtagtgattt tcaaatatgc aacatatagt 2100
ttattaactg cagtcactat gatgtacaat agattgctcg aacttattcc tcctgtctaa 2160
ctaagatttt gtgacctctg accaacatct ccccagtgtt gtcacccccc gcccccagcc 2220
tctgatagct gcctttctac tctctgcttc tgtgagtttg atgtttatac attccacatg 2280
taagtggcct catgcagtgt ttctgtctct gtgtctggct tgttcactta gcgtaatgtc 2340
ctccagcttc atctatgttg ttggaaatga caggatttcc ttctttcttg tggctgaata 2400
gtattgcctt gtgcatatac accacatttt ctttatccct tcattcactg atggactctt 2460
aggttgatgt catgtcttgg ctgttgtgaa aaatgccgca gtgagcgtgg gcgtgcaggt 2520
ccctcttcaa cacacggatt tcctttcctt tggatataaa cccagcagtg agattgctgg 2580
atcacatggc agttctgttt ctcacctttt gaggaaactc catactgttt tccataatgg 2640
ctgtagcaac ttccactccc acccccacgg tgcaaagtct ccatttctct tctacaacct 2700
caccaactcc tgttattttc catctttctg atagtagcca tttgaagagg tatgagatga 2760
tacctcattg tggttttcat ttgcattttt atttgtattt ttcatgaatt tttgagggtg 2820
atttcaaggg tagttagtga ctcgaacagg gaaacgatcc tgagtatgag ggttgtgcta 2880
atcatccccc tcctgccagc tgcgtacgga atggggctct gcagatggca gggagctggc 2940
tcgtttctct ttaagagctg ccttttactt ttcttcctct tcctttaaaa cttatttcct 3000
ggccggacgc agtggctcat gcctgtaatc ccagcacttt gggaggccga ggtgggcgga 3060
tcacgaggtc aggaattcca gaccagcctg gccaacatgg tgaaaccccg tctctactaa 3120
aaatacaaaa attagccaga cgtggtggtg cgggcctata gtcccagcta ctcgggaggc 3180
tgaggcagga gaatcacttg aacctgggag gagggggttg cagtgagccg agattgcgcc 3240
actgcactcc agcctgggcg acagagccag actccatctc aaaaaacaaa aaaaagttat 3300
ttcccaagca cagccatgta ttccaggctt gtggatcagc gttggtggtg gtgtgtgctc 3360
tcatatctta gttccagcta agcacactct gacatgttta cactagaacc atttgttttt 3420
tctagaaata gaaatttcag aattgtagag tcagaggact taccagaaat ctcttaggta 3480
gttctcctcc cctccctcaa gtgcagtcct aacctcctgg agttttctgt agaaaccaca 3540
agcctcagag ctggccgaga attctagcca aagatttttc catgccaaag taatcccccc 3600
tctcctaagg gccatccttg gtggggactg gtttcctgtt aagccctcgc tgtcagtcct 3660
ggctgtggaa tttcctggtg aggagcactg gcccgtggag ctcggccctc gtgccggcct 3720
tgagcaggcc caagtgttcc gtgttcttga tacctttcct ccagcacagt cttgcttccc 3780
agaaaaaggt ttgcacttga aaatgatgca tttgctgatt aaacatagtt cttttgcttt 3840
atttggtttc taaaataaag tgggagtttt tgagattgag taacgtgagg ttaagatagc 3900
acgtggaatg gctttttctt ttctttctat tttttttttt tttttcctgg agacagggtt 3960
tcactctgtt gcccaggctg gagtgcagag gcatgaccat ggctcactgc aacttcgatg 4020
tcctggggtt aagcgatccc ccagcctcag ccccccaagt ggctgggact acaggtgctc 4080
gccaccacac ctggctaatt tttgtatttt ttgtagaaaa tgggtttcat caatgttgtc 4140
cagactggtc tcgaactcct gacctcaagc aattctcctg cctcagcctc ccagactgct 4200
gggattacag gcgtgaacta ccacgcctgg cctggaatgg cttttgatgt tctcctatgt 4260
gcacatgtgg gtgaataaac accaacaaag tccttatgtt acctgaagag ttgctctctt 4320
cttaatattt aagtcgtatt tatttaaata ctttaatagt tgtacactat taaagtatta 4380
ttaggtcaaa atcaaggaag tacaaaaggg tatgctgtga aaaatctctt cttccttgct 4440
ctgcttactt acctaccccg catcccccca tacaccccag acacacacac acacacacac 4500
acacacacac acacacgcat cactcccata catgcccacc tgtttaccag ccaatcacat 4560
ttcttggggc aactcatctg agttgcttct ctttccagag agtttttgca taaagaagca 4620
caggtatttc tgcgttacca tgaccctatt tcccagtggt tcctagccag ttgactctcc 4680
tgcactggat accatcctgg acagcattcc ttagggaaat gagccccctg ttttttccca 4740
ccatggcaca gttggtcctt tgcatggacg caccattatt gcccctgtct cttcttggtg 4800
gaccttaagg ttttctccat ccttttgctg taacacacac tgctccaagt gtgtgagcat 4860
atcagtagga aacgcttcca ggagtagaac tgctaggtca gagggcgtgt ggatctgtaa 4920
cctgacagac ctagaccggc ttcagtttgg ttttatccag tttccatatt gattattcat 4980
ataaaaggaa acagacaaac ataacgctgt gcatgtattc tctcttagac cagaacaggc 5040
atagggtgca cttttaattt gtccatttcg tagagtagaa attgtttttg ctgaaatgaa 5100
caccttagga tgctgaagaa tatgacccgt cccatggaaa acattcaaaa atgtgtgtag 5160
cgctttcttc ccaagggtgt gtgtgcgcat attttaacac taattcactt tctacttccg 5220
ttgctatcct ttctgtgagt ctttctcaga atctcagaaa agaaactaaa ttgttcactc 5280
tagttatcaa tgctgtactc tatacctgga atttgctaaa agggcagatt ttaagtattc 5340
tcaccacaga aaagagaaaa gaaaatggta attatgtgac gtggtggaca tgttaactag 5400
ctttattatg gtgagcattt cacagcggat atccagtcat cacgctgtac acattaaaca 5460
tgtacaattg ggtttttttg agacaaggtc tccttctgtc acccagtctg gagtgcagtg 5520
gctcagtcat ggctcattgc agcctcgacc tcctgggctc aatccatcct tccccctcag 5580
cctcctgaaa agctggggcc acaggcatgt accatcatgc caggctaatg catatatatt 5640
tatatttttt ggtggagatg gggttggtct cgaactctgg gctcaagtga tcctcccgcc 5700
ttgcccttcc aaagtgctga gattacaggc atgaaccaca gcaccaggcc tacatgtaaa 5760
atttttattt gtcaactata ctttgacaaa gctgagaaaa aaaatcctaa tatttaaaaa 5820
aaaaaaaaaa aggactagct tgagaccttt tccagctctc tggcttatca gctgccgtct 5880
cttccgggtg cagatagctg gaagggaaag aaaatcccta aaattaccca caagccaaga 5940
atgaagtgtc tccctttgag ccacagtggc agttttgttt ttaatcatag aagtgtattt 6000
tgagccgggt gtgctggctc acgcctgtaa tccccgcact ttgggaggcc gaggtggggg 6060
gcggaggggg tggggatcgc ctgaggtcag gagttcgaga ccagcctgac caacatggag 6120
aaaccccgtc tctactaaaa atacaaaatt agccggcgtg gtggtgcatg cctgtaatcc 6180
cagctactca tgaggctgag tcaggagaat ctcttgaacc caggaggtgg aggttgcggt 6240
gagctgagat catgccattg cactccagcc tgggaacaag aaaaaaaaag aagaagaaga 6300
agaagtgtat tcatttcagt tacttttaaa aaagtgaaca gactttatat tttagagcgg 6360
ttttaggttt acagaaaatg aaacagacag ggcagcgagc tccttgtact cctccccagc 6420
acacagttgc cctgttatga acatcccaca tcagtgctgt gcgttcatta acaccgatga 6480
acctgatgca tacattatga tgaactgaag tcctggactt caccctttct cttgtacagt 6540
tctgtgggat ttgacaaatg cataatgctg tacagccaca atgatagtat cgtccagagt 6600
agttctcctg ccttaaaacc tcttttgctg cacctgtttc tctctcccca ctcaccccag 6660
ctatctgatc ttcttagtgc ctccgaagtt ttggtctttt caggatgttg tagcgttgga 6720
atcatggagt atgtagcctt caccacatac accttccttc actttgttgg cttcctttac 6780
ttagtaatat gcattcaagt ttcctccatg ccttttcatg gcttgatagc tcatttcttt 6840
ttagcaccaa ataatattcc gttgtccaga tgtagcacaa tgtttatcca ttcatgtaac 6900
ctgtgaccga ctcacagata ggatgtggaa tcactcacca cagaggcatt agacaataat 6960
cagacccaag tcatttcatg ggggaacaag cccacaggta ccagactgtc cagtgagtca 7020
gggccactcg taggaagtaa gaagagaggc tagagcatag ccaggtcctc actttatact 7080
ttaagcccat gtgtatttct cccaaaccac acagcattgt ttccatgctt tcagctttgc 7140
atgaataacg tgatacttga acgcatcatt tatcacttgc tctctttccc acagcgctgt 7200
tttcaagctt cttcctgttc atgatgctct gcttaaccct taagctgcat gggattctgt 7260
tctgtgaata cgcccacccc atgtattatc ctgcccagca aaaagtcccc aaaactctgg 7320
atggtggtta cctctaggga gggagagaag agattgggaa tagggagcga cttcaacggt 7380
gtttgtaatg ttttgtttct ttaaataaaa gagctgagat catttcagca gaatgttgat 7440
ttagagtctc ctggacaatt tgttgctcaa agtgctctct taaagagcac tttaaaaaaa 7500
aaaacctttt atcttattat ttatttattt atttattgag acggagtttt gctctgtcac 7560
ccaggctgga gtggagtggt gtgatctcag ctcactgcaa cctttacctc ctgggttcaa 7620
gcaattcccc tgcctcagcc tcccaagtag gtgggattac agatgcgtgc caccacactt 7680
ggctaatttt tgcattttag tagagatcgg tttctccatg ttggccaggc tgatctcaaa 7740
cgcctgacct caggtgatct gcccgccttg gcctcccaaa gtgctggtat tacaggcgtg 7800
agctaccatg cctggcttat cttatatatt tttaaaaaca gcttattgag atctaattta 7860
tgtaccataa aattcaagta tataattcag tgcttttata tataaaacat atatatgaaa 7920
tagcttattg agatataatt ttttatataa aacagcttat tgatatgtaa tgtatgtacc 7980
ataaaattta aatatataat tcactggctt ttatatattc acgaatatgt gcaactatca 8040
ccacagtcaa ttttagcata ttttcatcag ctcataaaga aaccccaagc ccttgaacta 8100
tcaccccata tccctcctcc cagcccgtcc ctcctactca taagcaacca ctaatctact 8160
tagtgtctat agatttccta ctctaggcat tccatgtgag cgggatcatg caatacgtgg 8220
gctcacacaa tataagtggc attccatgtg agtcggctca tgcagtatgt ccggctcctt 8280
tcactgagca taaggtcttc agcactcatc caggttgcag cctgtgtctg aatttcattc 8340
cctcttctgg ctgaatcgta ttccattgtg tatcttggac atatcctatt ctgctcaccc 8400
agccgttggt gggcgtttgg agtgttttcg cctttcagct gttttaagag ggttgcagtg 8460
aacatttgta caagttttgg acccaatgcc tgttttcaat tctcttgtgt agagagcact 8520
ttttagcaga aaaagaatag atttgtggcc tccctttgtg tgcggtcagt gccttgagaa 8580
gagtgaactg tgctgccacc tccggagccg tggagagcgc ggggcttggg tagcagctag 8640
gacgatacaa gttgggacaa ggccaggtgc aatggctcac gcctgtaatt ccaacacttt 8700
gggagaccga ggcaggggga tcacctgagg tcaggagttc aagaccagcc tggccaacat 8760
ggtgaaaccc catctctaat aaaacagaaa aattaactgg acggggtggt ggacgcctgt 8820
aatcccagct actcgggagg ctgaggcagg agaatcactt gaacctggga ggcggaggct 8880
gcagtgagtg gagatcagac cactgcactt cagcctaggt gacagagcga gactccgtct 8940
caaaaaaaag aaaaaaaaag aaagaaactc atggataatc ctccctctcg tgcagttcgc 9000
ctctacggac caaacttcat ccttcaggtg tactcatctc agaggaagtc ctggcaccct 9060
gtgtgccaag acgactggaa cgagaactac gggcgggcgg cctgcaggga catgggctat 9120
aagtgagtat ggggcagcac ccgccgagtg acagtaacag acagcagaaa cacgagaaga 9180
ccctctctct gcctccctgt gaaagcaccg gcacatgagt gctggggaca attgtcacct 9240
tccaaaagct gagccctata accagcaggt ggaatttgtc ctgctagggc tgtgcccagc 9300
acacagacct tggctcactg ccaccttgcc ctgcctcctc cttggcctct atagactcct 9360
ggttgctcgg gagtgcccag tgctgtggtc atctggtcag aggggtaggc tgagggcgtt 9420
aggtgcctct ttttccaagg tgcctctcag ccagggtcca ttcacctccc tgggtagagg 9480
ttggaccaga acagctggcg aggagggttg ggctggggag agcagcagag acaaatcctg 9540
tgccagtttc acttcattcg ggagccatgg aagccttttg agctggggag agaatcaatc 9600
aatcagactg atacttaaaa aatgtcattc ctgctcgtag ctctgaggga aggtgggaag 9660
gcttaacagg gtgtgtgtcg cctgacagtg attcctaacg ggggtggggc ggtggttacc 9720
atttaccagc actgcctggg gagatgcggc agccctcagg catcggggga gagggtggta 9780
ggatgctact gccactttgt tttccatggg agggtcccca ggtgatttct atgcaacttt 9840
agggtattca atatgccagt tttcagaatg aattaccact cggtgagaaa gttggcatct 9900
tagctagtca ctgtgacatc cctaaacagc aggggtgaat tacacagcaa agccccccca 9960
tcacagtcca ggaacctggt ggaattgata actggggcca tgttaacatc tgtacctttt 10020
attagattaa atgtgtgtat gattatacaa tcctatgtcc ttctcatagt ttcttgatcc 10080
taacctggat aagaaacacg accaatgaag gaattttgtc tgacacttta gggttattga 10140
atcgaaaaat cgttacaata ttctagcact tggttagaac gtgtgatttt ttttcctaaa 10200
tgctaaggtt tttccctctt attctgaatg tcgtatgagc ggtattatga catagtatag 10260
gatttgtgtt tgcttatgcc ttaaccatta tcacaaataa ggttttcttt tttaggaata 10320
atttttactc tagccaagga atagtggatg acagcggatc caccagcttt atgaaactga 10380
acacaagtgc cggcaatgtc gatatctata aaaaactgta ccacaggtat gcagcaattt 10440
cttcttgaaa aattttggaa tgaaatcaac taggagacac catggggaat cgttgtcctg 10500
agtctgattt ctctgagctg caatactcgg tctggatggg ttttgcattg ggaggagatt 10560
agagtctgac caggcctggt tactctaagc agcccttggt ttattcatag gaagtggctg 10620
aggtttctct gctatttcat tttcagcctc taccgtctgc ccttgttggt agcggctcac 10680
acttgcaaca tcgacattca actctattta gttttctttc ctcttcagac atttagaggt 10740
gtacctattt tgtcagggcg tggttctagg aatccaagat aatgtctcag tgtcccagcc 10800
agggtgaccg gctcattcca gtttgccagg gacttcactg gcttgagcaa gggaagtcct 10860
gctccattcc aggcagctgg gctggctggt cccgttagcc ccaaccccgg gacagcagtg 10920
ccagagggtg ctctgtgagg gatgggcagc attctggcgg cctgggaatg agttgtggtg 10980
tttccagggg gtagaagtgg gtacaagcca caggtcacat gatgagtggc tgacctggct 11040
gggagggcag aagaggggat ggacttaggc tcttcctttt gctttgcaca tatttaggat 11100
gtttgcagac ttgctatgat tgttgctgtt atgtgttttc tgatgtgaaa gatacacagt 11160
gtcctttgcc catgagctct ccttgcctcc caggtcccca gggcttatgc ctggtgtcta 11220
ggcatcacct ccctgcctgc caggtgccag gtgctgcatt tcgggggagg atgaactaat 11280
caccccgcgc cacctttcct ctgagtggga gcctggggca ggtttgcatt cctggaggcc 11340
gctggtggag gggtctgggg gcctgacttc cactgcagcc tgctgtcctg gggaatgtgg 11400
cagggcaagc ccagtgggga gggctgtgca cggccaggtg cacccatcaa aacagcaggg 11460
ctgcggtttg tccctgtgga gaagctaaac acagctgcct gggcactttg taaatgctga 11520
gtggttcttt gtctttctgg gttacacacg gaatcaggga gccaagtcca gccgggcagg 11580
gacgggggga ggggaggagg tgctgccgtc ccttggcaag agccttggga actcacaagg 11640
aggctggagg gcttggaaga aagaagagaa ggccattgtc tggtaggctc tattctatct 11700
cggtggtggt ggtgggggga ggcgcacttc ttttcctctt tctgtgcagc agttgccctt 11760
tgatgcctga gttcttggct tgttttctgt cgggcttctg tgaataacca catgtgccct 11820
ggcgctgtga ccacacaggg ctatccctac cgaccttagg attcttagga aatgtcttct 11880
cttaaagggg acatgtcttc acttggccgt gtcagtgccc cagagccaga gtccacctgg 11940
aatgcacctg tagtcactga gaacccgggg ggtgtgcctt agtaagaagg tgtcaggaag 12000
gacctattat tgtagggcct gggctcctgc aaggtggttt gggggtggtt ggaggaagca 12060
gagatttgct ctggattgga tgctgtcagg aagcaggggt aattctgtga ggctgcttta 12120
ttattttttt tctaggagga ggttggaatg aggctaggct aaagctgtga ttggtaaaga 12180
aacgtccgtc gctcaagtta gccaggacag gaggagacat cagatcgtga ttttgtggtt 12240
gtgagcacaa ggttcctgtt ctgtctgttc agacatcatt tcggaggagg ctccttgtgt 12300
cttgccccat ctcaggcatg gaggggccta gtccgatatt gacgctcagt gaaataattc 12360
aggttccgca gagcacacgg cccagctatc agggcgggcc agctctgcat gccaggggcc 12420
gcgtcttccc ttctcagcat agcctgggaa attcactgca ggacaaaatg catcagttac 12480
ttcctcttca tccataacct gggatgtttg actcccaaat gagtaactct tacgtttctt 12540
ctaatcctag ggaaactatt ggttatattg ctttcaacac tacaaattta aagcagttat 12600
aggagcccag aggtttccaa atggcttcct taaaaattag aagatgattt taaattccaa 12660
gaggaaaaac aaaactagca ttattgtata cttaccctca caaccgtcct aggagctggt 12720
acaattttaa gagaggttaa gtaacttgcc caaggtcaca ctgtggggat gtgagccgcg 12780
taccttggct cagtgtctgg tctttgccac tgtccctata tggatttact taccttattg 12840
gagttgtaac tagcagaccc ttctatgtct cagaagacag gagagggaac atcggaagaa 12900
atgactgatt tctaagcatg tgagaggcag gtgactccgc actatcgtga ccagaatttc 12960
ccctgttctt tttgcagtga tgcctgttct tcaaaagcag tggtttcttt acgctgtata 13020
ggtaagttca tctggagtcc cccttttgat acttctaact aggaaaagct ctctactttc 13080
agaacagtac tccctgtgtc tctgggggcg tgggagggaa gaaggtgggg tcacgggttg 13140
gaatgtgccc agcggcgtct cgctctttcc aaggagctcc tggtttagat ttccatggcc 13200
tgtagacacc ttcagccttg ggtccaaggg acaccccctg agatcaggca cgctcaagaa 13260
gctgacaaag ccctacactt tatgccaccc atgagctgga ggcccggcag gtctctttct 13320
ccagaaagca aaggggggtg gcgttagtga gccctggcag ccacctaacg tggacttgga 13380
gcatctgcgg ggctgtggtc cagcaccacc gtgtggccac caggtgctca tcagccagtg 13440
ggacccggga ggagggacaa gaccagagaa caacagtgct cttgcctctt ctctcctgaa 13500
ttttggacgg tggcttagac ttgggtgtcc ccatctctgt gtttagagtg cttacagttt 13560
ccaaactgtt tgcaaatgtg gaagccaccg tccctctcct ctgggatggc ccagtgctgt 13620
cgtggggccg tggtcctgag ctcagctttt catttgaaga ggtggaagga gctgacaccg 13680
tcccatcccg gcagggctgg ctcaggtctt ctttaggtcc tgagtggggg tccagcacag 13740
ccccaagggt gcgtggcacc cgccctgccc tctgcccatg cactcatctc ctggtggaga 13800
agacactcac acacaggaag cagggaaggc agcagacctc actcacccct caccccctca 13860
ctcaccccct actcaccccc tcaacctctc attcaccacc caccccctcg ccccctcact 13920
caccccctca ctccctcaac cctcactcac ctcctcactc cctcaaccct cactcacctc 13980
ctcacctcct cactctcccc ctcatccctc cctcacccca ccccgtcacc tcctcactca 14040
cctcctcacc ccctcactca cccttcaccc cctcactcac cacctcacct cctcactcac 14100
cccctactca acccctcatt cacccctcac cccctcactc acccctgcac cccctcactc 14160
accccttcat ccactcaccc acctgctcac ctcctcactc aacccctcac cccctcacta 14220
atccctcact ccctcacccc ctcacgccct cactcacacc ttcacctcct cactcacccc 14280
ctcaccccct caacccctta cttaccccct cactcatccc ttcacccctc actcaccccc 14340
tctctcaccc attcaccccc tcactcatgc cttcaccccc tcactcacct cctcactcac 14400
accttcaccc ctcagtcacc ccctcactca ccccttcacc ccctcaatca tgccttcact 14460
ccctcactca ccccttcacc ctctgaatta ctccctcatc ccctcactca ccccctcact 14520
caccccttca ccccctcacc caccacctca cccacccctc acccaccccc tcacctcctt 14580
acccctcacc cccctcactc acccctcacc ccctcactca ccacctcacc cacccctcac 14640
ccaccccctc actcactccc tcatcccctc actcaccccc tcaccccctc actcaccccc 14700
tcacccaccc ctcacccacc ccctcacccc ctcactcacc ccttcacccc ctcactcacc 14760
ccctcactca ccccttcacc ccctcactca ccacctcacc cacccctcac ccaccccctc 14820
actcactccc tcaccccctc actcaccccc tcaccccctc actcaccccc tcatctcctc 14880
actcaccccc tcacctcctc actcacccgc tcacctcctc actcaccccc tcgccccctc 14940
actcacccct caccccctca ccccctcact cacccctcac cccctcgccc cctcactcac 15000
cccctcgccc cctcactcac ccctcacccc ctcaccccct cactcatccc ctcacctcct 15060
cactcacccc ctcacctcct cactcacccc ctcacctcct cactcacccc ctcacctcct 15120
cacccacccc ctcactcact ccctcacccc ctcaccccct cactcacccc ctcacctcct 15180
cactcacccc ctcacctcct cacccacccc ctcactcact ccctcacccc ctcaccccct 15240
cactcacccc ctcacctcct cactcacccc ctcacctcct cactcacccc ctcacctcct 15300
cactcatgcc ctcaccccct cactcaccct ttcacctcct tgctcatccc ctcacttacc 15360
ccctcacttc gtcaatcacc cccccacctc gtcaatcacc ccctcacctt ttcactcacc 15420
ccctcactca cccccttact tcctcactta cctcctcacc ccccactcac cccctcaccc 15480
cccactcacc ccctcacccc acactcaccc cctcaccccc cactcacccc ctcacccctc 15540
tcacctcctc actcaccccc tcacctcctc acttatcccc tcaccccctc aattaccccc 15600
tcaccccctc aattactccc tcatcctttc aattacccac tcaccccctc acctcctcac 15660
tcctcactca ctccctcact caccccttca ccttctcact cacctcctcg tctcctcacc 15720
ccctcactca cttccagccc tgcccctccc atcttccttt tctttgtgtg agaatctggg 15780
gtccctgagt ggtgtcagtc cctccaagac tcaaggagtc cccagggcct tgttatccag 15840
aacaccccca cctgggtccc gggagacccc atgggatcac aggagtgttc agggaagtgg 15900
tgcttcctgg gtctgggtgg gctggagggg catcctccct tccccaagag gagaccccca 15960
ggagccccct aagtccatcc ccagcagtgg tgcccctgcc ctgtccttgc agcctgggag 16020
acccttggga ggggcgggcg ctgggtggct gggcggcttc tgctggtctc accccactgg 16080
cctcctgttt gtcatcctca gcctgcgggg tcaacttgaa ctcaagccgc cagagcagga 16140
ttgtgggcgg cgagagcgcg ctcccggggg cctggccctg gcaggtcagc ctgcacgtcc 16200
agaacgtcca cgtgtgcgga ggctccatca tcacccccga gtggatcgtg acagccgccc 16260
actgcgtgga aaagtatgcc aggggcggcg cgggccgggt gggggctcag ggctggccta 16320
cagccaccct gtgaccttga gcaggtctca acccttgcag ccccggcatc cttgtgttta 16380
aatggggaga gtattgcacc tgcttcctag ggctgtgaga catcaagtgc gctcatgcca 16440
ggcagtgcat ggctgtatgc actgagtgtc ccctgcacgc agggcacagg gtgcaggtgg 16500
aacattctcc acgatgtcgc cgtgaccagc gttccttcca gccactgtcc tctgagctct 16560
gtcctgccct tgagcaaagc ccctgccccc tgaggtatcc tgtctccggg acgctagtcc 16620
caggagaggg cacactcaga caggcttcag gctgccctgc tggaaggtcc ctggggttaa 16680
gcgttcttgg ccacagcatt gctcatgcag agggttaggt aggggtgagg ctagccgtga 16740
cagtattagc atttatggac gctaccaccc cctccccttt tccttaaaca catagtgctt 16800
ttggtcacat gctgctttgg aggaggcctc acttggcgga tgtatttttc tgccttagag 16860
agaggctgaa ctgggtttga ctgttggccc agccctctct tgctgcgtgc ccttagacga 16920
ttcactcaac gtctctgatc catggcatgt acaactataa gatgggcatg cccttctcct 16980
ctcgggctgt tatgaaggtc aaggaagcaa gggctgttac ccaagggtgc tcccttctct 17040
ccccctcttc acacccccag gtgctctggg ccctctagga actgggtttc tctcaagggc 17100
tgttacccaa gggtgctccc ttctctcccc ctcttcacac cactgggtgc tctgggccca 17160
ctaggagctg ggattctctt aagagggaaa ctcttggata aaggaaatgg tttgattgat 17220
atcggacaag tctgttcatt agtatccatt tattaagcac ctaccatgtg ccaggaaatg 17280
ctttggcgta caaaggaaaa taagggccag tcctgctaga aatggccttg aaaccccagg 17340
gagggatgtc ggcccattgt gggtgctgca gattccttga aggtgatgca agagccagaa 17400
agaaggatga tgtggggggc tgaggcaggg agtcggggtt gggggagtgt gggggagaag 17460
gggagaccga gcacctcttc cactatctcc ctgtgtggtt tttggtgaac catcctgcct 17520
ctgggtgtct tgcctccagc ttctgacgtt ggaagttcat ccactgagag ctctgtgttt 17580
atggctctga gatactgagt ccttcttctc tcccagacct cttaacaatc catggcattg 17640
gacggcattt gcggggattt tgagacaatc tttcatgttc tatggagccg gataccaagt 17700
agaaaaagtg atttctcatc caaattatga ctccaagacc aagaacaatg acattgcgct 17760
gatgaagctg cagaagcctc tgactttcaa cggtacgtgt ggctcaggct tggcaagcag 17820
gttggcagaa tcttaaagag atgttgattg gaaatgacac ttgtgctatg ccaaatggaa 17880
gggaggcatt tgcgttgagc gagggtagcg tgcagcgggt ggccaatggg agaggctcac 17940
agaggctaag agcacctgcc gcattttggg ggaggcagca gccaccacat ctgttctgta 18000
ctgtactgag tggtggtgat tcaagccagg catggaaaag gctagaacag ggctttccca 18060
ctgcagcacc cttgacatct gggtggttct ctgttgtagg gctctcttgt gccttgtagg 18120
atgtttaaca gcgtccccag cctctaccca ctggaggcca gtagctacca agctgtgaca 18180
accagtgttg cctgctgaca ttgccaaaca tccgctttga ggcaaagtca cttccagttg 18240
agaactactg gcctaaaatg tgtaaagatc cttgattttt aaagatacat tctaaaacca 18300
agttgcttaa ttcaggacaa acatgctttc tcttagcctc ttattcggtc ccactctggt 18360
ccatccaagg gtctggaatg ttctagcccc atgtggatac agaagaagca aaacctcagc 18420
cctccctaca gcatgtctgt attcacattg ggaaatggtt cacatataga agagcgaatg 18480
cctgagcaat ggcgtggtgc ctctggggcg aaagctgact ccattgactc catcggcttt 18540
ttggctgttg cctcctgtgt gtctttcccg tcttgatcac ctggagatat gtaattttgg 18600
aagcagagct agcaaataat tcctcttata agcagagcta gcaaataatt ctacttataa 18660
gtagcataac gtcttgcctg ccagaaggag aggtctggca gggggagaaa gtgagaatgt 18720
gggacttgtt gggatgcagg gtcctctggg cagggtggcc agggtgccag gcccagcagc 18780
ctgcatgtgg gaaggccagg tggagacata ggtgataccc gcctggctca ctgtgttttc 18840
tcttcttgaa acagacctag tgaaaccagt gtgtctgccc aacccaggca tgatgctgca 18900
gccagaacag ctctgctgga tttccgggtg gggggccacc gaggagaaag gtgaggctgc 18960
tcctgggcac acaggactgc agggcccaca gatggagcat tgggttcgga agtgggaggt 19020
ccaggtttta atcccagttc tactactcaa tgactggatg actttggttg attcccccag 19080
tccttgtgcc tcagtttctc catctgctaa gtgggagaaa tcctgcccag cctacctaat 19140
acactgtgtt cttatcgtga tcacacagag cagcatgtgg aatggctttt gaagtatctg 19200
ggccatacga gtttagaggt gcaggatctc ctgtgttgca ctcattgtga gtttagagct 19260
gccctggaga tcccaccaag gcctgcgtgg ctgagtgaca gggggcttgg tgaggacggg 19320
catcctggac ccatggtggc cacatctaag cctgtcctct gccctgataa ccacagagag 19380
aggctctctc cacccacttc ctttgcaatc tgcatttctc tctgacagtc tttcaaatga 19440
agggagcctg gctgcttcat ttttatggag ggttggaagt gcttagtggc aggcacaaag 19500
gttcatttta catattgttt atatccttct caaaagcgtc taggccatac agacaacaaa 19560
tcctttcaaa caaggggaaa agtacaaagg ttgggtgatt tctggggagc gtcagggaag 19620
gtagtggggg gcatcctggc tcctcatcag cagaaactta ctacagtaga gccacaggct 19680
gggcaaaaga cctcatggaa tccaagatga agggaatatc gacaaatatt tgtgcgcacc 19740
tgcacctagt acaggctggg tgctactcag gtgctgggaa tgcagaagtg aacagagtaa 19800
gacaaatgtc tctgctgtca ggagctttac ctctcttctg gatgtcggtg gtggggacgg 19860
ggcaggtgtg gtcagacaga tgggagacaa acaactgagc gaggtacttc caaacatctg 19920
agggtgggga tcacaaggtc ccggctattt tgaaggggtg gtcaggaaag gcttctcgga 19980
agaggtggca tttgagctga gactcaaatg gcaaaaatgt gtacacatca aaaaggctag 20040
tgcatgtatc ttcaggtgtg gtcaaggggc caaggaggtg ggctggggcc agattgcata 20100
ggtccttgtg gattatggtg aagacaccag cttctcatct gcttgaggtg gggagatcgt 20160
gagccgggga gtgccatgat ctggcagctg cgtggggagt ggggatgaat ggatggagac 20220
gaggatgatg gtgacaagtc cattgctgtg gttccttgag acaggaagcc agctcatagc 20280
agagtgcggg cgtggatgtg aagagatgag ggtacactag ggctagagcc accagactta 20340
ctgatgggtt gcatgtctgt gggagagaga gtgagaagtc agggacgatg gctttccact 20400
ctgtggctga agccccaggg tggcgggtgg tgccattttt caagccagga aatattggtt 20460
ggtgagaatt tggggtggga gaaggtgtga cggagggttc tggttttgca cactaagccc 20520
acggtgccca gaagatgccc gaggggaggc agcaaagcga gagtgggaaa tgcagaggtg 20580
gcaagtgcag gccgtgtctt gagaagctct aatgtgcagg ggagccgaga agcaggcggc 20640
ctagggaggg tcacgtgtgc tccagaagag tgtgtgcatg ccagagggga aacaggcgcc 20700
tgtgtgtcct gggtggggtt cagtgaggag tgggaaattg gttcagcaga accaagccgt 20760
tgggtgaata agagggggat tccatggcac tgatagagcc ctatagtttc agagctggga 20820
atttctttcc ctgaagctga actccagagc tgcattcagc acaggcaccg ccagttgtaa 20880
ggagaatcca ggtttcccag gagaggggtt ggtgctggga tgagctgacc ggggcagggc 20940
tggaaaatag ggctgtgacc atctgtgtag tgcgtgtgga ggtctcaggg agggaagtgt 21000
gctctccctg cgagagctgc aggcaacact gggagctcaa caagtctccc tgtccttagg 21060
gaagacctca gaagtgctga acgctgccaa ggtgcttctc attgagacac agagatgcaa 21120
cagcagatat gtctatgaca acctgatcac accagccatg atctgtgccg gcttcctgca 21180
ggggaacgtc gattcttgcc aggtaattca acatttttat tctacctttg gtccttacca 21240
gatcctactg aaccccccat gagagagagg gcattcttgg ggtcagcaga gcctcctcag 21300
tgacacggag ccagctcggg gcagtcatgg gaagtgacgg ccacaaacag tgcgaacgct 21360
tctggtggca gaaggaagta cagtcaacaa atcacacaca ccctctgaaa aaccggtatt 21420
tggtaaaagt gccagtggaa cagaaacaag tatttagact attttaaatt atgaacggca 21480
atttatttag taacttttag cttgaacaga ttaaaattca ggatgggggc tatctctttg 21540
ggggttacat ctctgttacc atcacccctt gatggtggag attcgaagcc cacacagtca 21600
ctcgtaactc acactgcgac ccccgccccc caactcctct aggcctggtc agtggtgtgc 21660
ggcagattgt gacttgattt tctgctctct gtaccttgct gtgtcccaca gggtgacagt 21720
ggagggcctc tggtcacttc gaagaacaat atctggtggc tgatagggga tacaagctgg 21780
ggttctggct gtgccaaagc ttacagacca ggagtgtacg ggaatgtgat ggtattcacg 21840
gactggattt atcgacaaat gagggtaact atcctgtcct ccttctgact gtgttctccg 21900
attcctcgag ccaaagccag acatctgtta ggcgtggttc tgctgctgga agctgactgg 21960
tgaccactgg tcagcatgaa gcaaactctg cttcctccag ccacagcccc atccccccag 22020
tgtccaccca ttgcccattg cctctcactg gcttcacttg catatttccc ctggtgtttg 22080
gatgaaaagc gctggggctc agcttgtgtg aaattccttg gtgctctgcc aaccacactt 22140
cgttctggct cagctgactc agctgttcca cccaggccac ctcacatcaa actttttttt 22200
tttttttttg agatggagtc tcactgtgtc gcccaggctg gagtgcagtg gcacaatctc 22260
gactcactgc aacctttgcc tcctgggttc aagtgattct cctgcctcag cctcccaagt 22320
agctgggact acaggcatgc gccaccacgc ccagctactt tttgtatttt tagtagagat 22380
ggggtttctc catgttggcc aggctggtct cgaagccctg acctcaggtg attcacccac 22440
ctcagcctcc cacagtgctg ggattacaag tgtgaaccac ggtgcccggc ctcacatgaa 22500
acttttgatt tatagagagc agagggaaga gccggctgtg cccatccttt tctggggcca 22560
tcgagtggct cctgggcagc ccccaaggtt aggaagggca ggagcagcca gggttctctg 22620
atgccccaga ctcaagcacg agggaaggtc tcaggggttc catgtgagcc tcatggatgt 22680
ctctgcttag cagagccctg gctttgggca ttgtccagat agggggtgag aaccagatct 22740
tctcatctcc aggacctcag acgtatagtt ttctcagatt tctgtgcttt ctggggctgg 22800
gctactagtg gaagaaagca gtctattctg tcttctccca aatctcccag atgcccagtc 22860
tgttgaagga ggagcagaac cagggggcct ttcccgctga ggcccgacct gtgtctcctt 22920
caaatgacac gcgggactca gggccttccc atgaccatgg ggcccagggg gcgtcacctg 22980
gcccagggcc cagtgctaga aacagatgac cccaggagga ggaggcaggg caggagggaa 23040
gctggcaggg ctgggatggt cagccaggct gaggggcgga ctcgcaccag gatggagcta 23100
ggaaatgatc caggtgtgtt tggcggctgc aggtgggtcc gcatggctgt gcagggaggg 23160
aagggctgcg tggcaggaga gcagccgggg gaggcccaga ctctgctgaa gagatgcctg 23220
ttgtgccggc ctccacatcc gctgcccgct ccttccggag ctcctgcccc gccatgctca 23280
gcctgactct gaccaacacg ttggagagaa gaatgatccc tttgtgctat taagcttgct 23340
tatttggttt ctaagtgctt catgcgaacc tagaggaaaa aattattttc cacctttgtt 23400
tgtcttaaga aaataacaca cttttttttt tcctatttga acaggcagac ggctaatcca 23460
catggtcttc gtccttgacg tcgttttaca agaaaacaat ggggctggtt ttgcttcccc 23520
gtgcatgatt tactcttaga gatgattcag aggtcacttc atttttatta aacagtgaac 23580
ttgtctggct ttggcactct ctgccattct gtgcaggctg cagtggctcc cctgcccagc 23640
ctgctctccc taaccccttg tccgcaaggg gtgatggccg gctggttgtg ggcactggcg 23700
gtcaagtgtg gaggagaggg gtggaggctg ccccattgag atcttcctgc tgagtccttt 23760
ccaggggcca attttggatg agcatggagc tgtcacctct cagctgctgg atgacttgag 23820
atgaaaaagg agagacatgg aaagggagac agccaggtgg cacctgcagc ggctgccctc 23880
tggggccact tggtagtgtc cccagcctac ctctccacaa ggggattttg ctgatgggtt 23940
cttagagcct tagcagccct ggatggtggc cagaaataaa gggaccagcc cttcatgggt 24000
ggtgacgtgg tagtcacttg taaggggaac agaaacattt ttgttcttat ggggtgagaa 24060
tatagacagt gcccttggtg cgagggaagc aattgaaaag gaacttgccc tgagcactcc 24120
tggtgcaggt ctccacctgc acattgggtg gggctcctgg gagggagact cagccttcct 24180
cctcatcctc cctgaccctg ctcctagcac cctggagagt gcacatgccc cttggtcctg 24240
gcagggcgcc aagtctggca ccatgttggc ctcttcaggc ctgctagtca ctggaaattg 24300
aggtccatgg gggaaatcaa ggatgctcag tttaaggtac actgtttcca tgttatgttt 24360
ctacacattg ctacctcagt gctcctggaa acttagcttt tgatgtctcc aagtagtcca 24420
ccttcattta actctttgaa actgtatcat ctttgccaag taagagtggt ggcctatttc 24480
agctgctttg acaaaatgac tggctcctga cttaacgttc tataaatgaa tgtgctgaag 24540
caaagtgccc atggtggcgg cgaagaagag aaagatgtgt tttgttttgg actctctgtg 24600
gtcccttcca atgctgtggg tttccaacca ggggaagggt cccttttgca ttgccaagtg 24660
ccataaccat gagcactact ctaccatggt tctgcctcct ggccaagcag gctggtttgc 24720
aagaatgaaa tgaatgattc tacagctagg acttaacctt gaaatggaaa gtcatgcaat 24780
cccatttgca ggatctgtct gtgcacatgc ctctgtagag agcagcattc ccagggacct 24840
tggaaacagt tggcactgta aggtgcttgc tccccaagac acatcctaaa aggtgttgta 24900
atggtgaaaa cgtcttcctt ctttattgcc ccttcttatt tatgtgaaca actgtttgtc 24960
tttttttgta tcttttttaa actgtaaagt tcaattgtga aaatgaatat catgcaaata 25020
aattatgcaa tttttttttc aaagtaacta ctgcatcttt gaagttctgc ctggtgagta 25080
ggaccagcct ccatttcctt ataagggggt gatgttgagg ctgctggtca gaggaccaaa 25140
ggtgaggcaa ggccagactt ggtgctcctg tggttctcga gataacttcg tataatgtat 25200
gctatacgaa gttatgctag taactataac ggtcctaagg tagcgagcta gctccacgtg 25260
gctttgtccc agacttcctt tgtcttcaac aaccttctgc aagaaaacca agggcctgaa 25320
ttttaacttc ctg 25333
<210> 7
<211> 491
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Рекомбинантный белок
<400> 7
Met Ala Leu Asn Ser Gly Ser Pro Pro Gly Ile Gly Pro Cys Tyr Glu
1 5 10 15
Asn His Gly Tyr Gln Ser Glu His Ile Cys Pro Pro Arg Pro Pro Val
20 25 30
Ala Pro Asn Gly Tyr Asn Leu Tyr Pro Ala Gln Tyr Tyr Pro Ser Pro
35 40 45
Val Pro Gln Tyr Ala Pro Arg Ile Thr Thr Gln Ala Ser Thr Ser Val
50 55 60
Ile His Thr His Pro Lys Ser Ser Gly Ala Leu Cys Thr Ser Lys Ser
65 70 75 80
Lys Lys Ser Leu Cys Leu Ala Leu Ala Leu Gly Thr Val Leu Thr Gly
85 90 95
Ala Ala Val Ala Ala Val Leu Leu Trp Lys Phe Met Gly Ser Lys Cys
100 105 110
Ser Asn Ser Gly Ile Glu Cys Asp Ser Ser Gly Thr Cys Ile Asn Pro
115 120 125
Ser Asn Trp Cys Asp Gly Val Ser His Cys Pro Gly Gly Glu Asp Glu
130 135 140
Asn Arg Cys Val Arg Leu Tyr Gly Pro Asn Phe Ile Leu Gln Val Tyr
145 150 155 160
Ser Ser Gln Arg Lys Ser Trp His Pro Val Cys Gln Asp Asp Trp Asn
165 170 175
Glu Asn Tyr Gly Arg Ala Ala Cys Arg Asp Met Gly Tyr Lys Asn Asn
180 185 190
Phe Tyr Ser Ser Gln Gly Ile Val Asp Asp Ser Gly Ser Thr Ser Phe
195 200 205
Met Lys Leu Asn Thr Ser Ala Gly Asn Val Asp Ile Tyr Lys Lys Leu
210 215 220
Tyr His Ser Asp Ala Cys Ser Ser Lys Ala Val Val Ser Leu Arg Cys
225 230 235 240
Ile Ala Cys Gly Val Asn Leu Asn Ser Ser Arg Gln Ser Arg Ile Val
245 250 255
Gly Gly Glu Ser Ala Leu Pro Gly Ala Trp Pro Trp Gln Val Ser Leu
260 265 270
His Val Gln Asn Val His Val Cys Gly Gly Ser Ile Ile Thr Pro Glu
275 280 285
Trp Ile Val Thr Ala Ala His Cys Val Glu Lys Pro Leu Asn Asn Pro
290 295 300
Trp His Trp Thr Ala Phe Ala Gly Ile Leu Arg Gln Ser Phe Met Phe
305 310 315 320
Tyr Gly Ala Gly Tyr Gln Val Glu Lys Val Ile Ser His Pro Asn Tyr
325 330 335
Asp Ser Lys Thr Lys Asn Asn Asp Ile Ala Leu Met Lys Leu Gln Lys
340 345 350
Pro Leu Thr Phe Asn Asp Leu Val Lys Pro Val Cys Leu Pro Asn Pro
355 360 365
Gly Met Met Leu Gln Pro Glu Gln Leu Cys Trp Ile Ser Gly Trp Gly
370 375 380
Ala Thr Glu Glu Lys Gly Lys Thr Ser Glu Val Leu Asn Ala Ala Lys
385 390 395 400
Val Leu Leu Ile Glu Thr Gln Arg Cys Asn Ser Arg Tyr Val Tyr Asp
405 410 415
Asn Leu Ile Thr Pro Ala Met Ile Cys Ala Gly Phe Leu Gln Gly Asn
420 425 430
Val Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Thr Ser Lys
435 440 445
Asn Asn Ile Trp Trp Leu Ile Gly Asp Thr Ser Trp Gly Ser Gly Cys
450 455 460
Ala Lys Ala Tyr Arg Pro Gly Val Tyr Gly Asn Val Met Val Phe Thr
465 470 475 480
Asp Trp Ile Tyr Arg Gln Met Arg Ala Asp Gly
485 490
<210> 8
<211> 2267
<212> ДНК
<213> Mus musculus
<400> 8
ccggttgtgt tataggactt gaccagcccc aatagtcctc aagtcactcc tagatacagt 60
ggcaggtggt agctggcttg cggaaggaag aggaagaaga gaatgtgggc catcaaggag 120
caaggccagc cttgcacttg ggccccctct gctcagtgct gaccagggct ttctgagccg 180
cttcctaatg aggctcattt gaagaccccc ccccaccccc ctcctgctgt cttgggtggc 240
agagctagct ccaggctgta agaaaattag gaggattacc aaagcagtat ggagtcagac 300
agtggccaac ccctcaacaa ccgtgatatt gttccctttc gcaaaccccg aaggccccag 360
gagaccttca aaaaggtggg gatccccatc attgcagtgc tgctgagcct gatagccctc 420
gtgattgtgg cccttctcat caaggtgatt ctggataaat actacttcat ctgcggcagt 480
cccctgacct tcattcagag gggccagttg tgtgacggcc accttgactg cgcctcaggg 540
gaggatgagg aacactgtgt caaggacttc cctgaaaagc ccggagtggc agtccggctc 600
tccaaggaca gatccaccct gcaggtgctg gatgcagcca cagggacctg ggcctcagtc 660
tgtttcgaca acttcacaga agcactggcc aagacagcct gcagacagat gggctatgac 720
agccagcccg ctttcagagc agtggagatc cgtccagatc agaacctccc tgttgctcaa 780
gtcacaggaa acagccagga acttcaggtg cagaatggaa gcagatcctg cctctcaggc 840
tccctggttt ccttgcgctg ccttgactgt ggaaagagcc tgaagactcc tcgtgtggtg 900
ggtggggtgg aggcccctgt ggattcttgg ccgtggcagg tcagcatcca gtacaacaag 960
cagcatgtct gtggtgggag catcctggat ccccactgga tcctcacagc agcccactgc 1020
ttcaggaagt atcttgatgt gtcaagctgg aaggtcaggg caggctcaaa catactgggt 1080
aactctccat ccttgcctgt ggccaagatc ttcatcgctg aacccaatcc tctgtacccc 1140
aaagagaagg acattgccct tgttaagctg cagatgccac tcacattctc aggctcagtc 1200
aggcccatct gcctgccctt ctctgatgag gtgcttgtcc cagccacacc agtctgggtc 1260
attggatggg gctttacaga agaaaacgga ggaaagatgt ctgacatgct actgcaggca 1320
tcagtccagg tcattgacag cacacggtgc aatgcagagg atgcctacga aggggaagtg 1380
accgctgaga tgctgtgtgc aggtacccca cagggtggca aggacacctg ccagggtgac 1440
agtggtgggc ctttgatgta ccattctgac aagtggcagg tagtaggcat cgtgagctgg 1500
ggccatggat gcggcggccc aagtactcct ggagtgtata ccaaggtcac tgcctatctc 1560
aactggatct acaatgttcg gaagtctgag atgtaacgct gccgtccccc acatccagaa 1620
gctgcttccc ttcagaccta cctacggcat gacccctcaa agtcagatat gggacaagag 1680
cctccttgaa caaactctgg tatccctgca gcaagcaagg atacattgca gaggtgcccg 1740
gagtggagtc agatgggcta gctcagccac ccctgcatct cccaaaccct gggagacatg 1800
tggcccatgg gagtaaatcc aggacattga ctcaactctc agaagtgtta ttcagtcaag 1860
gaggctctcc cttccactga aggaaggaaa gtcagctctc tcctgaaagg ccagatcact 1920
ggctgagtag atgagacaag ggtatgaaag gcctttgcca tcttctttgc ccagtcctga 1980
aagcactgac gtaagagacc agtcagttct aatgtaaggt gtatatttta gtgtcagggt 2040
attgcaattg tcacctctgt ggtcaatatc attaaacagg tatgagaatt cgctggcata 2100
gacttcctgg tctgcttaat aagaatccaa ctaaggatgt cacatgacag tttcccagaa 2160
aatgtgaaca agtgtccatc tgacacacgg caccaatgac aaaccaaaga agttattctg 2220
cctgagtctc agttgctgaa ctaataaatt agctgcggtt tcttgca 2267
<210> 9
<211> 435
<212> БЕЛОК
<213> Mus musculus
<400> 9
Met Glu Ser Asp Ser Gly Gln Pro Leu Asn Asn Arg Asp Ile Val Pro
1 5 10 15
Phe Arg Lys Pro Arg Arg Pro Gln Glu Thr Phe Lys Lys Val Gly Ile
20 25 30
Pro Ile Ile Ala Val Leu Leu Ser Leu Ile Ala Leu Val Ile Val Ala
35 40 45
Leu Leu Ile Lys Val Ile Leu Asp Lys Tyr Tyr Phe Ile Cys Gly Ser
50 55 60
Pro Leu Thr Phe Ile Gln Arg Gly Gln Leu Cys Asp Gly His Leu Asp
65 70 75 80
Cys Ala Ser Gly Glu Asp Glu Glu His Cys Val Lys Asp Phe Pro Glu
85 90 95
Lys Pro Gly Val Ala Val Arg Leu Ser Lys Asp Arg Ser Thr Leu Gln
100 105 110
Val Leu Asp Ala Ala Thr Gly Thr Trp Ala Ser Val Cys Phe Asp Asn
115 120 125
Phe Thr Glu Ala Leu Ala Lys Thr Ala Cys Arg Gln Met Gly Tyr Asp
130 135 140
Ser Gln Pro Ala Phe Arg Ala Val Glu Ile Arg Pro Asp Gln Asn Leu
145 150 155 160
Pro Val Ala Gln Val Thr Gly Asn Ser Gln Glu Leu Gln Val Gln Asn
165 170 175
Gly Ser Arg Ser Cys Leu Ser Gly Ser Leu Val Ser Leu Arg Cys Leu
180 185 190
Asp Cys Gly Lys Ser Leu Lys Thr Pro Arg Val Val Gly Gly Val Glu
195 200 205
Ala Pro Val Asp Ser Trp Pro Trp Gln Val Ser Ile Gln Tyr Asn Lys
210 215 220
Gln His Val Cys Gly Gly Ser Ile Leu Asp Pro His Trp Ile Leu Thr
225 230 235 240
Ala Ala His Cys Phe Arg Lys Tyr Leu Asp Val Ser Ser Trp Lys Val
245 250 255
Arg Ala Gly Ser Asn Ile Leu Gly Asn Ser Pro Ser Leu Pro Val Ala
260 265 270
Lys Ile Phe Ile Ala Glu Pro Asn Pro Leu Tyr Pro Lys Glu Lys Asp
275 280 285
Ile Ala Leu Val Lys Leu Gln Met Pro Leu Thr Phe Ser Gly Ser Val
290 295 300
Arg Pro Ile Cys Leu Pro Phe Ser Asp Glu Val Leu Val Pro Ala Thr
305 310 315 320
Pro Val Trp Val Ile Gly Trp Gly Phe Thr Glu Glu Asn Gly Gly Lys
325 330 335
Met Ser Asp Met Leu Leu Gln Ala Ser Val Gln Val Ile Asp Ser Thr
340 345 350
Arg Cys Asn Ala Glu Asp Ala Tyr Glu Gly Glu Val Thr Ala Glu Met
355 360 365
Leu Cys Ala Gly Thr Pro Gln Gly Gly Lys Asp Thr Cys Gln Gly Asp
370 375 380
Ser Gly Gly Pro Leu Met Tyr His Ser Asp Lys Trp Gln Val Val Gly
385 390 395 400
Ile Val Ser Trp Gly His Gly Cys Gly Gly Pro Ser Thr Pro Gly Val
405 410 415
Tyr Thr Lys Val Thr Ala Tyr Leu Asn Trp Ile Tyr Asn Val Arg Lys
420 425 430
Ser Glu Met
435
<210> 10
<211> 3543
<212> ДНК
<213> Homo sapiens
<400> 10
atcattccag tttggcaact tcacttgtag ggctgtttta atcaagctgc ccaaagtccc 60
ccaatcactc ctggaataca cagagagagg cagcagcttg ctcagcggac aaggatgctg 120
ggcgtgaggg accaaggcct gccctgcact cgggcctcct ccagccagtg ctgaccaggg 180
acttctgacc tgctggccag ccaggacctg tgtggggagg ccctcctgct gccttggggt 240
gacaatctca gctccaggct acagggagac cgggaggatc acagagccag catggatcct 300
gacagtgatc aacctctgaa cagcctcgat gtcaaacccc tgcgcaaacc ccgtatcccc 360
atggagacct tcagaaaggt ggggatcccc atcatcatag cactactgag cctggcgagt 420
atcatcattg tggttgtcct catcaaggtg attctggata aatactactt cctctgcggg 480
cagcctctcc acttcatccc gaggaagcag ctgtgtgacg gagagctgga ctgtcccttg 540
ggggaggacg aggagcactg tgtcaagagc ttccccgaag ggcctgcagt ggcagtccgc 600
ctctccaagg accgatccac actgcaggtg ctggactcgg ccacagggaa ctggttctct 660
gcctgtttcg acaacttcac agaagctctc gctgagacag cctgtaggca gatgggctac 720
agcagcaaac ccactttcag agctgtggag attggcccag accaggatct ggatgttgtt 780
gaaatcacag aaaacagcca ggagcttcgc atgcggaact caagtgggcc ctgtctctca 840
ggctccctgg tctccctgca ctgtcttgcc tgtgggaaga gcctgaagac cccccgtgtg 900
gtgggtgggg aggaggcctc tgtggattct tggccttggc aggtcagcat ccagtacgac 960
aaacagcacg tctgtggagg gagcatcctg gacccccact gggtcctcac ggcagcccac 1020
tgcttcagga aacataccga tgtgttcaac tggaaggtgc gggcaggctc agacaaactg 1080
ggcagcttcc catccctggc tgtggccaag atcatcatca ttgaattcaa ccccatgtac 1140
cccaaagaca atgacatcgc cctcatgaag ctgcagttcc cactcacttt ctcaggcaca 1200
gtcaggccca tctgtctgcc cttctttgat gaggagctca ctccagccac cccactctgg 1260
atcattggat ggggctttac gaagcagaat ggagggaaga tgtctgacat actgctgcag 1320
gcgtcagtcc aggtcattga cagcacacgg tgcaatgcag acgatgcgta ccagggggaa 1380
gtcaccgaga agatgatgtg tgcaggcatc ccggaagggg gtgtggacac ctgccagggt 1440
gacagtggtg ggcccctgat gtaccaatct gaccagtggc atgtggtggg catcgttagt 1500
tggggctatg gctgcggggg cccgagcacc ccaggagtat acaccaaggt ctcagcctat 1560
ctcaactgga tctacaatgt ctggaaggct gagctgtaat gctgctgccc ctttgcagtg 1620
ctgggagccg cttccttcct gccctgccca cctggggatc ccccaaagtc agacacagag 1680
caagagtccc cttgggtaca cccctctgcc cacagcctca gcatttcttg gagcagcaaa 1740
gggcctcaat tcctataaga gaccctcgca gcccagaggc gcccagagga agtcagcagc 1800
cctagctcgg ccacacttgg tgctcccagc atcccaggga gagacacagc ccactgaaca 1860
aggtctcagg ggtattgcta agccaagaag gaactttccc acactactga atggaagcag 1920
gctgtcttgt aaaagcccag atcactgtgg gctggagagg agaaggaaag ggtctgcgcc 1980
agccctgtcc gtcttcaccc atccccaagc ctactagagc aagaaaccag ttgtaatata 2040
aaatgcactg ccctactgtt ggtatgacta ccgttaccta ctgttgtcat tgttattaca 2100
gctatggcca ctattattaa agagctgtgt aacatctctg gcataggcta gctggaatgc 2160
ttgataagaa ctgagctggg atgattgaac tttcattctt tggcttgggg agaaaagaag 2220
tcctggggaa gcaattgagt ctcaaagtag aggcagggga aaaaagagtt agggagacca 2280
gatctgctga gtggcagcaa gagtgagctg cagattacag aaaccagggt gagcaagttt 2340
gagtcccaca cagggccttc tccctttgcc tctttccctc cctccctgcc tgtgataatc 2400
agccaggagc cagggataac ctatgacttg ggaaagagat gagttaggca gtcaagggtg 2460
acattcaatc agggatccac aagtggctgg aaagaaatgc tggtcctgtg tcctaacttt 2520
ttccgcctgg agagccctca gtgtggcttc ttacatttaa aaaacaaaaa ggatcagctg 2580
ccaggtgtga ggcagtcccc aagctgagtt gtgaggatgt aagcatgaat aagtccctgc 2640
actcaaaatg gtcaaagaat taaaccccat ggactttttt ggcatctgta tgaaagcttg 2700
ggttttctga ggactgtctt gctatagtta agtcagatcc tagatgaaat atacttgttc 2760
atactgtact aggttcttag gaaacaacag aattcctcaa atgccaaaaa caaagaaaat 2820
agaaacccag aaaacaaaac aaaataaaac aaaaccatca gaactgtgag tggaaactaa 2880
ggtgatgatc tgggagcaat acactaaaat cttgggtcga gacctatatg aaggctggca 2940
gtggagctaa acctggacac actgaagaca agggagctga accagggctc ctacatgaag 3000
cagggataac tgatggcagt aaatgtggtc tcaaattgca gatggtctgg aggaaaattt 3060
cccaaattta gagcctcagg attcccaaag atcctccaaa tatgagctca caatcaaaga 3120
tcagagacgt tgaaaaataa aaaacacctt aagtgggcag cataaaaaac agctaattta 3180
gaaccccaaa ggcttcagat gtcagaatat tagagactta tgataataag caatatttgc 3240
agagtatttg tatgtgccag acactattgt aagtgcttca tcatgtactg attcatttaa 3300
tactcacaga aatctgtgag atgggtatta ttcttatcct cactctatgg attaaaaaaa 3360
ctaaggcaca aagtggttaa gctccttgcc tgagattata gactgtaagt tgaacgtgag 3420
cacttggaat acagagttca tgctgtaaac taccacacta tagggcctcc aatatgataa 3480
tttataaaat atttgaataa aaaatgaata ctagttccac attttaaaaa aaaaaaaaaa 3540
aaa 3543
<210> 11
<211> 437
<212> БЕЛОК
<213> Homo sapiens
<400> 11
Met Leu Gln Asp Pro Asp Ser Asp Gln Pro Leu Asn Ser Leu Asp Val
1 5 10 15
Lys Pro Leu Arg Lys Pro Arg Ile Pro Met Glu Thr Phe Arg Lys Val
20 25 30
Gly Ile Pro Ile Ile Ile Ala Leu Leu Ser Leu Ala Ser Ile Ile Ile
35 40 45
Val Val Val Leu Ile Lys Val Ile Leu Asp Lys Tyr Tyr Phe Leu Cys
50 55 60
Gly Gln Pro Leu His Phe Ile Pro Arg Lys Gln Leu Cys Asp Gly Glu
65 70 75 80
Leu Asp Cys Pro Leu Gly Glu Asp Glu Glu His Cys Val Lys Ser Phe
85 90 95
Pro Glu Gly Pro Ala Val Ala Val Arg Leu Ser Lys Asp Arg Ser Thr
100 105 110
Leu Gln Val Leu Asp Ser Ala Thr Gly Asn Trp Phe Ser Ala Cys Phe
115 120 125
Asp Asn Phe Thr Glu Ala Leu Ala Glu Thr Ala Cys Arg Gln Met Gly
130 135 140
Tyr Ser Ser Lys Pro Thr Phe Arg Ala Val Glu Ile Gly Pro Asp Gln
145 150 155 160
Asp Leu Asp Val Val Glu Ile Thr Glu Asn Ser Gln Glu Leu Arg Met
165 170 175
Arg Asn Ser Ser Gly Pro Cys Leu Ser Gly Ser Leu Val Ser Leu His
180 185 190
Cys Leu Ala Cys Gly Lys Ser Leu Lys Thr Pro Arg Val Val Gly Gly
195 200 205
Glu Glu Ala Ser Val Asp Ser Trp Pro Trp Gln Val Ser Ile Gln Tyr
210 215 220
Asp Lys Gln His Val Cys Gly Gly Ser Ile Leu Asp Pro His Trp Val
225 230 235 240
Leu Thr Ala Ala His Cys Phe Arg Lys His Thr Asp Val Phe Asn Trp
245 250 255
Lys Val Arg Ala Gly Ser Asp Lys Leu Gly Ser Phe Pro Ser Leu Ala
260 265 270
Val Ala Lys Ile Ile Ile Ile Glu Phe Asn Pro Met Tyr Pro Lys Asp
275 280 285
Asn Asp Ile Ala Leu Met Lys Leu Gln Phe Pro Leu Thr Phe Ser Gly
290 295 300
Thr Val Arg Pro Ile Cys Leu Pro Phe Phe Asp Glu Glu Leu Thr Pro
305 310 315 320
Ala Thr Pro Leu Trp Ile Ile Gly Trp Gly Phe Thr Lys Gln Asn Gly
325 330 335
Gly Lys Met Ser Asp Ile Leu Leu Gln Ala Ser Val Gln Val Ile Asp
340 345 350
Ser Thr Arg Cys Asn Ala Asp Asp Ala Tyr Gln Gly Glu Val Thr Glu
355 360 365
Lys Met Met Cys Ala Gly Ile Pro Glu Gly Gly Val Asp Thr Cys Gln
370 375 380
Gly Asp Ser Gly Gly Pro Leu Met Tyr Gln Ser Asp Gln Trp His Val
385 390 395 400
Val Gly Ile Val Ser Trp Gly Tyr Gly Cys Gly Gly Pro Ser Thr Pro
405 410 415
Gly Val Tyr Thr Lys Val Ser Ala Tyr Leu Asn Trp Ile Tyr Asn Val
420 425 430
Trp Lys Ala Glu Leu
435
<210> 12
<211> 20078
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Рекомбинантный полинуклеотид
<400> 12
ccacccgcac acactacagt cgagataact tcgtataatg tatgctatac gaagttatat 60
gcatggcctc cgcgccgggt tttggcgcct cccgcgggcg cccccctcct cacggcgagc 120
gctgccacgt cagacgaagg gcgcagcgag cgtcctgatc cttccgcccg gacgctcagg 180
acagcggccc gctgctcata agactcggcc ttagaacccc agtatcagca gaaggacatt 240
ttaggacggg acttgggtga ctctagggca ctggttttct ttccagagag cggaacaggc 300
gaggaaaagt agtcccttct cggcgattct gcggagggat ctccgtgggg cggtgaacgc 360
cgatgattat ataaggacgc gccgggtgtg gcacagctag ttccgtcgca gccgggattt 420
gggtcgcggt tcttgtttgt ggatcgctgt gatcgtcact tggtgagtag cgggctgctg 480
ggctggccgg ggctttcgtg gccgccgggc cgctcggtgg gacggaagcg tgtggagaga 540
ccgccaaggg ctgtagtctg ggtccgcgag caaggttgcc ctgaactggg ggttgggggg 600
agcgcagcaa aatggcggct gttcccgagt cttgaatgga agacgcttgt gaggcgggct 660
gtgaggtcgt tgaaacaagg tggggggcat ggtgggcggc aagaacccaa ggtcttgagg 720
ccttcgctaa tgcgggaaag ctcttattcg ggtgagatgg gctggggcac catctgggga 780
ccctgacgtg aagtttgtca ctgactggag aactcggttt gtcgtctgtt gcgggggcgg 840
cagttatggc ggtgccgttg ggcagtgcac ccgtaccttt gggagcgcgc gccctcgtcg 900
tgtcgtgacg tcacccgttc tgttggctta taatgcaggg tggggccacc tgccggtagg 960
tgtgcggtag gcttttctcc gtcgcaggac gcagggttcg ggcctagggt aggctctcct 1020
gaatcgacag gcgccggacc tctggtgagg ggagggataa gtgaggcgtc agtttctttg 1080
gtcggtttta tgtacctatc ttcttaagta gctgaagctc cggttttgaa ctatgcgctc 1140
ggggttggcg agtgtgtttt gtgaagtttt ttaggcacct tttgaaatgt aatcatttgg 1200
gtcaatatgt aattttcagt gttagactag taaattgtcc gctaaattct ggccgttttt 1260
ggcttttttg ttagacgtgt tgacaattaa tcatcggcat agtatatcgg catagtataa 1320
tacgacaagg tgaggaacta aaccatggga tcggccattg aacaagatgg attgcacgca 1380
ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc 1440
ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc 1500
aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg 1560
ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg 1620
gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatctca ccttgctcct 1680
gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct 1740
acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 1800
gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 1860
ctgttcgcca ggctcaaggc gcgcatgccc gacggcgatg atctcgtcgt gacccatggc 1920
gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt 1980
ggccggctgg gtgtggcgga ccgctatcag gacatagcgt tggctacccg tgatattgct 2040
gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc 2100
gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgagg ggatccgctg 2160
taagtctgca gaaattgatg atctattaaa caataaagat gtccactaaa atggaagttt 2220
ttcctgtcat actttgttaa gaagggtgag aacagagtac ctacattttg aatggaagga 2280
ttggagctac gggggtgggg gtggggtggg attagataaa tgcctgctct ttactgaagg 2340
ctctttacta ttgctttatg ataatgtttc atagttggat atcataattt aaacaagcaa 2400
aaccaaatta agggccagct cattcctccc actcatgatc tatagatcta tagatctctc 2460
gtgggatcat tgtttttctc ttgattccca ctttgtggtt ctaagtactg tggtttccaa 2520
atgtgtcagt ttcatagcct gaagaacgag atcagcagcc tctgttccac atacacttca 2580
ttctcagtat tgttttgcca agttctaatt ccatcagacc tcgacctgca gcccctagcc 2640
cgggcgccag tagcagcacc cacgtccacc ttctgtctag taatgtccaa cacctccctc 2700
agtccaaaca ctgctctgca tccatgtggc tcccatttat acctgaagca cttgatgggg 2760
cctcaatgtt ttactagagc ccacccccct gcaactctga gaccctctgg atttgtctgt 2820
cagtgcctca ctggggcgtt ggataatttc ttaaaaggtc aagttccctc agcagcattc 2880
tctgagcagt ctgaagatgt gtgcttttca cagttcaaat ccatgtggct gtttcaccca 2940
cctgcctggc cttgggttat ctatcaggac ctagcctaga agcaggtgtg tggcacttaa 3000
cacctaagct gagtgactaa ctgaacactc aagtggatgc catctttgtc acttcttgac 3060
tgtgacacaa gcaactcctg atgccaaagc cctgcccacc cctctcatgc ccatatttgg 3120
acatggtaca ggtcctcact ggccatggtc tgtgaggtcc tggtcctctt tgacttcata 3180
attcctaggg gccactagta tctataagag gaagagggtg ctggctccca ggccacagcc 3240
cacaaaattc cacctgctca caggttggct ggctcgaccc aggtggtgtc ccctgctctg 3300
agccagctcc cggccaagcc agcaccatgg gtacccccaa gaagaagagg aaggtgcgta 3360
ccgatttaaa ttccaattta ctgaccgtac accaaaattt gcctgcatta ccggtcgatg 3420
caacgagtga tgaggttcgc aagaacctga tggacatgtt cagggatcgc caggcgtttt 3480
ctgagcatac ctggaaaatg cttctgtccg tttgccggtc gtgggcggca tggtgcaagt 3540
tgaataaccg gaaatggttt cccgcagaac ctgaagatgt tcgcgattat cttctatatc 3600
ttcaggcgcg cggtctggca gtaaaaacta tccagcaaca tttgggccag ctaaacatgc 3660
ttcatcgtcg gtccgggctg ccacgaccaa gtgacagcaa tgctgtttca ctggttatgc 3720
ggcggatccg aaaagaaaac gttgatgccg gtgaacgtgc aaaacaggct ctagcgttcg 3780
aacgcactga tttcgaccag gttcgttcac tcatggaaaa tagtgatcgc tgccaggata 3840
tacgtaatct ggcatttctg gggattgctt ataacaccct gttacgtata gccgaaattg 3900
ccaggatcag ggttaaagat atctcacgta ctgacggtgg gagaatgtta atccatattg 3960
gcagaacgaa aacgctggtt agcaccgcag gtgtagagaa ggcacttagc ctgggggtaa 4020
ctaaactggt cgagcgatgg atttccgtct ctggtgtagc tgatgatccg aataactacc 4080
tgttttgccg ggtcagaaaa aatggtgttg ccgcgccatc tgccaccagc cagctatcaa 4140
ctcgcgccct ggaagggatt tttgaagcaa ctcatcgatt gatttacggc gctaaggtaa 4200
atataaaatt tttaagtgta taatgtgtta aactactgat tctaattgtt tgtgtatttt 4260
aggatgactc tggtcagaga tacctggcct ggtctggaca cagtgcccgt gtcggagccg 4320
cgcgagatat ggcccgcgct ggagtttcaa taccggagat catgcaagct ggtggctgga 4380
ccaatgtaaa tattgtcatg aactatatcc gtaacctgga tagtgaaaca ggggcaatgg 4440
tgcgcctgct ggaagatggc gattgatcta gataagtaat gatcataatc agccatatca 4500
catctgtaga ggttttactt gctttaaaaa acctcccaca cctccccctg aacctgaaac 4560
ataaaatgaa tgcaattgtt gttgttaaac ctgccctagt tgcggccaat tccagctgag 4620
cgtgcctccg caccattacc agttggtctg gtgtcaaaaa taataataac cgggcagggg 4680
ggatctaagc tctagataag taatgatcat aatcagccat atcacatctg tagaggtttt 4740
acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 4800
tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 4860
aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 4920
caatgtatct tatcatgtct ggaataactt cgtataatgt atgctatacg aagttatgct 4980
agtaactata acggtcctaa ggtagcgagc tagccaagtc tgtgtgctac caagtagcaa 5040
aactgagcct ggaactcaca catgcgtgtc tgagagccca gcactatcgc caggaaaacc 5100
cagcgtctcc ctgctcaagc ctgaccctca gccctctctg cctctccctg cacttgcctt 5160
ccagtcaagg tgattctgga taaatactac ttcctctgcg ggcagcctct ccacttcatc 5220
ccgaggaagc agctgtgtga cggagagctg gactgtccct tgggggagga cgaggagcac 5280
tgtgtcaaga gcttccccga agggcctgca gtggcaggtg agtgcagggt ctgaggcaca 5340
agagaagtgg gcccagcagg aggtctgctc aggcccccac ggcccactgc atagtatctg 5400
ccccctactt gtcacttttc atccttgttg tataaggttc tttgtttgtt tgtttgttgt 5460
tgttttgagg cagagtgctc tgtggcccaa gatggagtgc agtgtcttgg tctcggctca 5520
ctgcaacctc tgcctcccag tttcaagtga ttcttctgcc tcagcctcat gagtagctgg 5580
gattacaggt gccagccacc acgcctggct aatttttata tttttagtag agacggggtt 5640
ttgccacatt ggtcaggctg atcttgaact cctgacctca ggtgatctgc ccgcctcagc 5700
ctcccaaagt gctgggatta caggcgtgag ccaccgtgcc cagctgtgta agtttcttga 5760
gagcaggacc ctgtcttgtc tacctttaaa tcctagtact taacacacag caaacagtaa 5820
ctatttgatg accaaatgtg agccagaaag gacaggaaat tgtaactgag gctgccccat 5880
gcgtgctgcg cctggtggat ttcaggcaga gggctagact gggtgacctt ggggcattcc 5940
tcctttctat gaaatttgtt atttcaagga gactagaaaa gagacttctc agccacttcg 6000
ccagctattg gtccttctat tcattagtgt ttgctgagac atgctatgtg acaggactga 6060
gccaggtcct ttcaatggat aggagatgtt ttgagcataa aatccacgtt ctctcttggg 6120
ctgggctctt ctaccttctt ccccctggtg cttgggctct gaagaaaaaa agataggtag 6180
gagatgagtg atggggcttc tgagggcagg gctgagtgac tttctgtgta tttgctcttt 6240
ctttatcaga agtcaaatgc ccacaggcac ctgtcatcct actgccagta ggacttctca 6300
ctcaaccttc ccctctgacc ttacttggag aaggacttag gtccctctct cagacatttc 6360
cccaggctgg gcaagttgtg tggaccatgg atgggtatgt ggtccataca atttaaacaa 6420
gctgtatatg gtcgctgggt agagtgacca cataattgat catcaaaact gatacctgta 6480
agagcaaaag ggggcactat taaccattgg gtcagggcaa caggtcaaaa tggagaccta 6540
ccctgggact tctggtcaca ctagctactg tcaaaatggg gcccaaatag acaaagccaa 6600
atggaagaaa ttcccttgac attgaaagtg ttggggctct gtggcacccc cagttctagg 6660
ttgggggagc ttgggctggt ctcatgatga gttctgaggg ggatgggcca gttgggcccc 6720
ccgttccatc taactcaggt tcctttcctc ccagtccgcc tctccaagga ccgatccaca 6780
ctgcaggtgc tggactcggc cacagggaac tggttctctg cctgtttcga caacttcaca 6840
gaagctctcg ctgagacagc ctgtaggcag atgggctaca gcaggtaacc aacctgggcc 6900
tctctccttt ttccctcctt cctccttcct cctcttcctc ctttccttcc tcccttcttc 6960
tctctttcct aaaaattacg ggcattggag ccaggcagaa tggcttttga atcccagcat 7020
ttcacttata agcaacatga agttaaattt cctaagcctc aggttcctca ggagttaatt 7080
gggggaacta atgccaacct cataggatag ttttgcaatg ccagtgagag aatgtgtgct 7140
gccctccaac acacacacac acacttctag cgtctatgca gtcctctcct ttcctttact 7200
cctcaacctt cactcctttg tgctggcttt gcaagaaact gttcctgccc agtaatacaa 7260
aagctaagtt aacttattca aagtttcgtt agttaagatt tagcttaagt gagcctagtt 7320
tcagtggggc cccatcttca gcaatcccag ctctctctgc aaatttcaaa agcagttcca 7380
aatctggagt ggatgaaaag gtgtaagatg atagtaagag taatttgcat tctatatatt 7440
tatattcact tgattttggc agaaaaccaa aaagatagtt attatatctt atatatagat 7500
atatattata tctatttcat aaataggctc aaacaaagta agtaacttgc tagggtacta 7560
gctgggaggt agagggctag aatttgagcc caagacccct aattcttgcg cattaggagt 7620
tcccacattg tttctgtttc tagactgagt aattctttat tctcatgtag gacatcatct 7680
ctaagggaag gggctaatga gatggttgat cactcagaga gtttagctgg agaggatgga 7740
aaagaaccca tacattcagt tgcagattga gatagcctat ctctggcagg cctcagattt 7800
cttcaggatt ctaacagact ggacccagag actaggccaa acaaacaaac aaacaaaaac 7860
tctactaggc agacatcacc aaccaatcac agaactctct cccatggatc cctaatacag 7920
cctcaaagtc cttttcagta aatgctccag gcagccatta caaatcaatc agaattattt 7980
gcctttctct tctctgctca acgggcttct gctgctctct actttccata gggggcaact 8040
tccattaccc tctagaaagc acaccccacc accttcattt caaggagagt gaggaactca 8100
tgcccagcac ctgctattct cccctcttcc tgcagccacg gagcccagcc tcgctgcagc 8160
cagccctgcc tccccactgt agtccagtca actgctgcat cagccgttcc tggcacagca 8220
ggctgagcct tgattatgaa acctgggtgt ctccaggggt tcttaagatg ataggctcct 8280
ggaatttctg tccttttgga gctcagtaag gcaccaaacc acctgagtct tgtgcttcac 8340
aaaatcaaag ttcatcagaa tcattcattg ggatggaatt ggtgaacaga agttaacttt 8400
cctgggaatg tccatttcca ccatattccg tccttctagg tctcagactt ctctactttc 8460
tttcctctct ctagatcgga ggcccttctt gtcctagaac cataggcatt tcaagatgtg 8520
ggagacccta gggatcatct agtccacgca tctttttttt ttttttttga cagagtctca 8580
ctctgtcacc caggctggag tgcaatggca ccatctctgc ttactgcaac ctccacctcc 8640
caggttcaag tgattctttc gcctcagcct cccaagtagc tgggattaca ggcacgcacc 8700
atcatgccca gctaattttt atatttttgt agagaccgag tttcaccatg ttggccaggc 8760
tggtcttgaa ctcctgacct caggtgatcc acccacctcg gcctcccaaa gtgctgggat 8820
tacaggcgtg agccactgca cccagccccg tgcatctttt tatagagggg gaaactgagg 8880
cttggagaga cccagaaaaa gaatatgacc tgcccaaggc cacacatcaa actagtgcca 8940
gagccaggga cagaacctag atcatgagga ctcttaaaat gcactctagt cctcccaggt 9000
ctgagacttg ggtccttcca ggaagtgcca gcattcctgc ctgagaatgt gccaatccac 9060
cagtattgcc aatgactcag ccctccatgg agagcttcta ctaacattac tagcatagtt 9120
agggatggaa ggaaaagatt tagaagaggc agattcagta aaggaacaat cagagagatg 9180
gaattaatca aggaaggctt cctggaggag gaaaaacttc aacccaaggt ttgaaagtag 9240
caagcatgga ttagcaggga gaaagaggga gagtggtcca gttgagagaa acgtttgtct 9300
ggattcatat gaagacagat ctagtcctgt tctattaaat atctctaagg gggccaaaaa 9360
catacccccg ctatcaaagt cagaccagat gctttgtttg gagaacgaaa tatccacatt 9420
ccaactccct cccaggtgag aagggagcta acctgagccc ctatgcctct ttgtttccct 9480
gctgtgaacc agaagacatt gctgggatat ttgaaatagg gacagagctg ggaatatgga 9540
aaggagaccc ctaacatttc tccagggctc tgggttctgg atttggattc cccacccaag 9600
aaagcaagtt acatcagcaa tgcactgagg gttgagtcct gggatgccaa gggtcggttc 9660
tttattgtat agcaaagcag gccccatctt cactgactaa gaccatctcc actccctggc 9720
cactccccac caagcattct ctgccactct ttctcctgaa agtgggggcc aactctacca 9780
tcttgttcta accccctgcc ccagctcaca actctctctc cctcttgatg tgagcagcaa 9840
acccactttc agagctgtgg agattggccc agaccaggat ctggatgttg ttgaaatcac 9900
agaaaacagc caggagcttc gcatgcggaa ctcaagtggg taagtgaggg gacaccttct 9960
ggcctacaga aggcccccac atggacgctg ctcttcaggt tgcaaccagc tcacctggaa 10020
ccccaagcag ccaggggaat gtaagcagac atcaggaaga actcctagcc agatggatca 10080
ttcaatgcca agagctatag actcacattt tggagaggtt ttctgtgttg acttgttttt 10140
aatacaatgg acagctggac aaagtgtgtt gtcctactca gagccagagg gatggataat 10200
gtgacctttc catcaatctg gatagtaaat agtttttgct actgctgtag gttttctaat 10260
aaattgccca ataggcaaga ttccaaagtc actttgtcct tccctaccac ttacccagcc 10320
agagctcccc accttcttga tgctccaggg aagaggctcc atggcccttg tgggtggcct 10380
gttcctgagc ctcgccaccc tgtgttagag cagagcatcc agatgaaatc tgtcacactg 10440
tggcaaagtg gctcagagag gaggctggct tcctagcatt cagggacgtt gctgagggcc 10500
gcttattcac cgaaaataaa tcttgaaaag gacagggctg gtagcagaat gatcctttac 10560
ctaaaattct atcaaaatcc cattcttcca tttggaaagc ccacagtgtc acagactctg 10620
ttccgggctc tgtcctcttc cctcttgggt cccaggagcc caggctgggc tttgaagcag 10680
gcagggccca gcacacagta ggtactcagc agtgggggtg ttgaatccaa tcaaacggaa 10740
gtgtcaatgc aggaaatgca atggatgtca atgcagtctc caaatgttcc ccactgtgca 10800
gcttccacat tcccgaggta ttgggagggg acttgaatta acagcttcgg gaggcctgag 10860
tccctgcctc ccagctgagg aagaagctta aatcacaggg cgctgtgtct gtcttccagg 10920
ccctgtctct caggctccct ggtctccctg cactgtcttg gtgagtaccc ccaatctctg 10980
agggtttggg gcctgggcca gcaatgagca gggaggaaga ccttcatctt cactcctaaa 11040
tttctgggac tccaagtttc attctgcctt ggtctacagc ccttgggctt gtcggtcaat 11100
gccccctcga gttgttggtg gccttgggca ggtcacattc tttttctggg tctttccaag 11160
ccccagtttc ccccttctac catctgtgca tggctccatg acctaagtgg agacctggga 11220
gagagtgtta ggaagaccga aaagggcagg acggggcctc cactgcctcc catccctggt 11280
ccgggcccac atagccttct ttgtcacaat cagctcaggt atccaagatc agattaccca 11340
cattcattat ttgagcaact attcattgaa cagttagaat atgtctcact ctgtcagttg 11400
ctggctagaa gtagaaagta ccagatgagt gaaataattg gccactatcc ttggtagctg 11460
atgactaagt aagagagaga tgcaagacaa catgtggaaa atgccaaact gagtagcagt 11520
cacagttgac atgctgcaga gagagctggc cgggggtcag aagacctggg caccagtcct 11580
gttcatttcc agtgtggcct cgagtcattc acctgacctc cctgaagttc attttcccaa 11640
gaagttgttt agtccaactg cccatcaagg atctttaggg acccttctag ctctaacaga 11700
ggagatcaga aaagaaaaca agcaatgtgg ctcagctcat cctacaagct tcatagagaa 11760
ctgagactgg cctggaagca tagccagaaa ttagaacgcc taagggaaga aggtcacaac 11820
gctgcctctg caatttagga gtgtatatgc tttcctgcag gatgttgaga gtttcattca 11880
ttatcgtatg ccccctaccc cggccccaca atacctagtg cgtgggatct gacacgtggt 11940
ggctggtcaa tgaatgaatg aatgaatggt cacaccatct gaggttctgc actgagtagc 12000
cctgaaggct tgaagcagca taagtgacag gtcctccctt gaggggcctc tgttttacca 12060
ataagccaag acctaagctc aacaacactg aaagggtggc caatacccag gacagcctgt 12120
gggaattcca gagaaaggga gattcccagg gactgggggc ccaggctaaa cactgaaaaa 12180
tgcatctgta ggctcaagga ggaaaagccc atgtctgtct gtcttgccca ccactctctc 12240
ccagcaccca gcactgcccc aggacagaga gcacttgaca caagttggtt agattaatga 12300
atgatttaga gttcagtggt ccccaacctt tttggcacaa gagactggtt gcatggaaga 12360
caatttttcc gcaaaccaag agggggatag agagcattag attctctctt tttttttttt 12420
ttgagaccaa gtctggctct tgtcactcag cctggagtaa agtgttgcga tctcggctca 12480
ctgcaacctc cgcctcctgg attcaagcga ttctcctgcc tcagccccct aaatagctgg 12540
gattacaggc acccgtcacc agcccagctg ggactatagg catgtgccac catgcccggc 12600
taatttttgt atttttagta gagacggcgt ttcaccatgt tggccaggct agtctcgaac 12660
tcctgacctc aggtgatctg cccgcctgag cctcccaaag tgctgggatt acaggcatga 12720
gctgcctcac ccagcctaaa gtctcataag gaacgtacag catagatccc tcacatgtgc 12780
agttcacaat aaggttgtgc tcctacaaga atctaacgcc acctctgatc tgacaggagg 12840
tgaagctcag gtggtcatgc tcgcttgtcc ctgccactca cttcctaatg tacagccagg 12900
ttcctaacag gccacgaacc agtgggaagg gcatcttttt ggatcaaaaa cagaattact 12960
ttttagagaa ctacaagcag atcaatttgg ctagacagag actttatatg aaacagcagg 13020
aggctgctag gaggagtgga aactctactt tgccctcaag ggagatcccg aagggctttg 13080
caggagcggg caaggtggca tgaagaaagc agtgtttgaa atcaggtggt atttgaaaag 13140
cccagccctt ccccttagaa tggcccttct accatctgtg catggctcca caaccgtggt 13200
ggtggctgcc agaagaattg gaaaggcaga gcatgggtgg agagggggga cctgagggct 13260
ttacaggagt tccgggggtg gtgagggtgt gaaagccagg tcagtcagta ggaagacagg 13320
atgtcagatt gagagactcc cctggccggg gaaacagact tggagaaggg ggagttttgg 13380
atgagacagt ccacttccga gtcacaaaat agcttgtggg tgtctgttta ctgttactca 13440
gtgggagtgg ctggggacac gccacctggg cagggctttc gtaattctgc atcacttgtg 13500
aaggtcacag attcccagca caacggacac acccatgttc atagtctgaa ctcctaaaca 13560
catcttaaac caaaataaaa aaaaaagaaa gaaagaaaga aaaaggagag ggaggtttga 13620
ggaaagccta tggtctggga cactcaatac ctcccatgaa tatctcatat tgggctggtc 13680
ctctctccac tctggcccca gccataaggg ccctgcttag agcagatttt gggtgctgag 13740
tggaggcagc ctcatcccca acagcctgac ttcctgcctc ctccctgcct ctgcctgtgt 13800
ccagcctgtg ggaagagcct gaagaccccc cgtgtggtgg gtgtggagga ggcctctgtg 13860
gattcttggc cttggcaggt cagcatccag tacgacaaac agcacgtctg tggagggagc 13920
atcctggacc cccactgggt cctcacggca gcccactgct tcaggtaaga ccccagctgt 13980
aaggaggtct ctggggacca aggccagtca gggaccagag agcttggggt cctgtctcct 14040
ggcaccgtcc ttctcttcac tctcccacta gagacgtttt ccaggttgtg gtggccccaa 14100
tgagacaatg gccatgatgc cctttgttag gcttttgggt gtctgagcag agggtgctgg 14160
tcaccaagca tggcctcttc ctggtgggac accagcagat acccagagtc ctcaccccac 14220
ccccatatcg ttcaagctac aaaagctctt cccacctgcc tcaacttcca agaactcact 14280
ctctttttgc ttgtttccag gaagttgttc cagggtctag agtcatagcc acgtcctcat 14340
tatgtctgga aactttaaaa aaattaaaga gcataggttc ctttcagtcc acagagaagc 14400
ctggccttac ctcagggaag ggctactccc agaccccctt cacttttttt tttttttttt 14460
tttttttttt ttttgagaca gagtcttgct ctgttgctta ggctggagcg cagcagcatg 14520
atcttggctc actgcaacct ccgcctcctg agttcaagca attctcctgc ctcagcttcc 14580
caagtagctg ggactatagg catgggccac catgcccggc taatttttgt atttttggta 14640
gagacagggt ttcaccatgt tggccaggct gatctctaac tcctgacctc aagtgatctg 14700
cccacctcag cctcccaaac tgctgggatt acaggcatga gccagggcat ccggctttta 14760
tttattcatt cattcaatat ctaatgagca cctaccaggt accaaacacc agatgatgcg 14820
cccaagttca ttagacccca ccgctgtctt caaggcactc atgatctagg ccagcgtttt 14880
ttaaccactt tttttttttt tttttttgag attctggtga gagctataaa ttctttcctg 14940
gaaaaacatc tctgcacact aagctgtgcc tggcattggg aaaaagaaag cacgtaatgt 15000
aactgacagc atgagtaaca cagtgagaaa ggttggagga gagagcgcca ggacctcaga 15060
actcaggcat tagaggagcc ccttccccag ccctccttga ggtttcgttg ggcaggtttc 15120
actgaggaaa aagggtcaaa tccctttttc gaatttgact tcttgtaagt gccagaagac 15180
tgccccttct ccaccatccc tgcctcacca tcatctttcc tcccaaggca gtgacatcca 15240
gcaccccgat ccctagggcc ctggggaccc agcctttggc aaagtctcct caggcttgga 15300
tcaggcctga acccagctgt ctctaccccc aggaaacata ccgatgtgtt caactggaag 15360
gtgcgggcag gctcagacaa actgggcagc ttcccatccc tggctgtggc caagatcatc 15420
atcattgaat tcaaccccat gtaccccaaa gacaatgaca tcgccctcat gaagctgcag 15480
ttcccactca ctttctcagg tgagaagcag ggcccaaggc cactcaagcc tcttacatca 15540
gttttcacgc ccactctgct attagctcac tgaccgccct tggcacataa tgtctcctct 15600
caagtcctca gcttgcccat ttgtctctaa tacgtcagcc taacatcact gatgccatga 15660
ggcctcctca agctgtcagc taacacctcc actccattcc ctgccagaga ttcttccaag 15720
gcctgtcttc cctatgtgga gcccctcgag tgagaactgg agtttcatcc aatcttggag 15780
ttttaggaga ccttttaaaa agattatcga gctaattccc caccactgac caacacgcaa 15840
gagcctgctc agtatccctg ccaaggagtc attgtgcccc tgtttgctct cctccagggg 15900
cagggaaccc attacctgtg aggcagccca cagagtcttt gaacagctct gttggatgcc 15960
ttgtgcttat actgaaatgt atttagatca ggattcccaa ctgtggggtc cacaagacac 16020
tggccccttg gagaagagag gattccattg tcaaataagt ttggggaaca ttttcatact 16080
acagctccct tcttggaaca cattagttta ttaaaggtag gagaagtttt taaaataatc 16140
tgttttattg cgtttaacct acatttttta aatttatttg accacagaat ccttttttca 16200
tgctacttct attagcatcc catagaacaa gtgttctaga gaccctggtg tgaccccttt 16260
cagagagctt aactgccagg ctctcctgag ccctggtgtg tgtttcaaga tttgtgcctg 16320
ggaattgttt taatcaggta tggcaaggtg acagatacag acacagctat ctttgaaaga 16380
agagtttatt atttataatt cctgagagaa agggacatac cccacccccc aacacaggga 16440
cacccgggga agcagctggg tccaccagga ggcaggagtg aggggaaggc atggcccaga 16500
gccacctgtg gcttccatgg gcaggtctgg ccaaggtagg gtaggcaaga ttgagcatgc 16560
tcaggattgg atagtgtgga caattctcta ggctatagat gtcagcctct ggttgtctag 16620
tatctgtccc tggggtgatt tagggcaggg aaaatattgg cttggtgtct gagagtcaga 16680
taaaggaagt ggttggggat atgggctttg ggttggctgg tttgcctatt aaaggcgtgc 16740
ccaaagccaa gttgtttact atctgcagga attagctaac ccagtctctc ccagaccagc 16800
aagatcccca taatcataaa gcatcataat ttacagaaaa ttaacactta tgatgaataa 16860
aagatctcct tcttcctctg tgctcctggc aggcacagtc aggcccatct gtctgccctt 16920
ctttgatgag gagctcactc cagccacccc actctggatc attggatggg gctttacgaa 16980
gcagaatgga ggtaagtcct gggtgcagga ccacagggca ggagatgccc ttgtatgagg 17040
gagcagcttc cagaagtaat gggaaggagg accacccttc agagaaaccc atcctggagg 17100
accaagcacc aaggcgccag gcagaaagca aagtggtttg gcaatccagg gctgggggat 17160
agaaggcaag gatgggaatg tgagtgtttt taccctccca gggaagatgt ctgacatact 17220
gctgcaggcg tcagtccagg tcattgacag cacacggtgc aatgcagacg atgcgtacca 17280
gggggaagtc accgagaaga tgatgtgtgc aggcatcccg gaagggggtg tggacacctg 17340
ccaggtgggg cctccaagaa tcatggggag ttctaagaat agggtttagg tcctagagag 17400
atgagaaaac ccagaggctg catgccctac aggaagcctt gcatatcatg ggcactcaat 17460
gtgtgatgat gggaggaaga gagggaggga aggaaaggat agtcagataa aagtgtacca 17520
atagatgagt gggtggatgg atggatgcag acaagcagag agatttcaaa tgtctctttc 17580
acattcgaag atgatgttac tggcctggca tggtggctca cgcttgtaat cccagcactt 17640
tgggaggctg aggcgggcag gtgatttgag gtcaggaatt caagaccagc ctggccaaca 17700
tggtgaaatc ccatctctac taaaaagaat acaaaaatta gctgggcgtg gtggcacgtg 17760
cctgtaatcc cagctacttg ggaggctgag gcaggagaat tgcttgaacc caggaggcag 17820
aggttgcagt aagctgagat tgcgccactg cactccagcc tgggtgaccc agcaagactc 17880
catctgaaaa caacaacaac aacaaagatg acattactca tccaccccac ccacccttct 17940
cactagctac agaatgatta gccccttgag gtcaggaatc ccaggtctat tttctctgtg 18000
actctcccca agctgctgaa ctacactagg aaagaattac cgcctgcaga atgctggaag 18060
cacatctgtg tgtgccctca ccccggcctc attggccatc aggactgctt agcaatccct 18120
gtagaccttc ttcctccccc atacttccag aggatcttct gaactatttt ctttttttat 18180
tttttctttt atgtttttta acagagacag ggtcactatg ttgcccagtc tggtctcaaa 18240
ctcctgggtt caagggattc tcccacctca gctttccaaa atgctgggat tacaggcatg 18300
agccatcgtg cttggcctga accattttca ttaaaacccc taccctactc tcacctccat 18360
ttccagtcat taaattcctt catttaagag gcatctctta gtcatcgcat gtgtgccatg 18420
aacatggtag tctttggaga cccctcaggg agctcacagt ggttggggga aaggggggca 18480
ttaaacagac atttaagcta tagttttggg ttcagaggga ggaagcccca ggggctaaaa 18540
cagctgataa ggactcccag ataagtgcac ttttcactat ctggcatttt cttgttttgt 18600
tatttgcttg ttcactgtct ctcaccccat ttgatcctaa gctttctgag ggcagggatc 18660
tttgtttttt ttcatcagtt ggatcccaat tgcttagaac actacctggc acaaaatagg 18720
cactctataa gtgattacac aaattttgga acgactaggt taaacaatga taaccaggct 18780
tttttttttt tttttgagac tgagtctcac tctgttgccc aggctagagt gaagtggttt 18840
gatctcggct cactgcagcc tccgcctctg ggttcgaatg attctccacc tcagcctcct 18900
gagtagctgg gattacaggt gcctgccact atgcccagct aatttttgta tttgtagtag 18960
agacgggttt caccatgttg gccaggctgg tcttgaactc ctgacctcaa gtgattcacc 19020
cgcctcagcc tcccaaggtg ctgggattac aggtgtgagc caccgctcct ggccaacaac 19080
caggcttttt taagacatca ctcagagcct ttaatttgct aatgtgagtt gtgaatctct 19140
gagagaaggc taacggcatg cttgcaactt acttgtccac agacaagcct ttctgcccca 19200
gaagagaaga ccattctagg gtgctaatga gcaaagaggg tgagggtgga atatcggaga 19260
gcagcaggga gtgcagggga acagataggc cagttcaggg agcagagaag gagaagcccc 19320
cccacctcac ctgccctccc cagcagtctc tgttctggtc tctcacaggg tgacagtggt 19380
gggcccctga tgtaccaatc tgaccagtgg catgtggtgg gcatcgttag ttggggctat 19440
ggctgcgggg gcccgagcac cccaggagta tacaccaagg tctcagccta tctcaactgg 19500
atctacaatg tctggaaggt aaggtacctt tgccctaccc actgtgcctt ccctccagtc 19560
ctctacctgg ggggtgccaa tccatcctca ggtttgattt aaatggttct gacaactctt 19620
tacatcccaa ataactttcc ctccaagcaa gggacagcct gagattgcac tattaaggct 19680
gaaattcctt aggtcagaga tttctgataa atgcaaatac cttagggaat agaacacacc 19740
aagcctttct ttctcttttc tgacagaatg agactatcag atcctttcta gagagaagat 19800
tctgataagg aagagagtgg aaaggctcat gagacctcct ggccctctgc agggtaggga 19860
gagaagcaaa gtgtttcaga aaaggaagac tcacgttaca catgtcacca ctttgtccag 19920
tttcagataa tctgactttc tcttcatcgg tctctcttat tctaggctga gctgtaacgc 19980
tgccgtcccc cacatccaga agctgcttcc cttcagacct acctacggca tgacccctca 20040
aagtcagata tgggacaaga gcctccttga acaaactc 20078
<210> 13
<211> 15159
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Рекомбинантный полинуклеотид
<400> 13
ccacccgcac acactacagt cgagataact tcgtataatg tatgctatac gaagttatgc 60
tagtaactat aacggtccta aggtagcgag ctagccaagt ctgtgtgcta ccaagtagca 120
aaactgagcc tggaactcac acatgcgtgt ctgagagccc agcactatcg ccaggaaaac 180
ccagcgtctc cctgctcaag cctgaccctc agccctctct gcctctccct gcacttgcct 240
tccagtcaag gtgattctgg ataaatacta cttcctctgc gggcagcctc tccacttcat 300
cccgaggaag cagctgtgtg acggagagct ggactgtccc ttgggggagg acgaggagca 360
ctgtgtcaag agcttccccg aagggcctgc agtggcaggt gagtgcaggg tctgaggcac 420
aagagaagtg ggcccagcag gaggtctgct caggccccca cggcccactg catagtatct 480
gccccctact tgtcactttt catccttgtt gtataaggtt ctttgtttgt ttgtttgttg 540
ttgttttgag gcagagtgct ctgtggccca agatggagtg cagtgtcttg gtctcggctc 600
actgcaacct ctgcctccca gtttcaagtg attcttctgc ctcagcctca tgagtagctg 660
ggattacagg tgccagccac cacgcctggc taatttttat atttttagta gagacggggt 720
tttgccacat tggtcaggct gatcttgaac tcctgacctc aggtgatctg cccgcctcag 780
cctcccaaag tgctgggatt acaggcgtga gccaccgtgc ccagctgtgt aagtttcttg 840
agagcaggac cctgtcttgt ctacctttaa atcctagtac ttaacacaca gcaaacagta 900
actatttgat gaccaaatgt gagccagaaa ggacaggaaa ttgtaactga ggctgcccca 960
tgcgtgctgc gcctggtgga tttcaggcag agggctagac tgggtgacct tggggcattc 1020
ctcctttcta tgaaatttgt tatttcaagg agactagaaa agagacttct cagccacttc 1080
gccagctatt ggtccttcta ttcattagtg tttgctgaga catgctatgt gacaggactg 1140
agccaggtcc tttcaatgga taggagatgt tttgagcata aaatccacgt tctctcttgg 1200
gctgggctct tctaccttct tccccctggt gcttgggctc tgaagaaaaa aagataggta 1260
ggagatgagt gatggggctt ctgagggcag ggctgagtga ctttctgtgt atttgctctt 1320
tctttatcag aagtcaaatg cccacaggca cctgtcatcc tactgccagt aggacttctc 1380
actcaacctt cccctctgac cttacttgga gaaggactta ggtccctctc tcagacattt 1440
ccccaggctg ggcaagttgt gtggaccatg gatgggtatg tggtccatac aatttaaaca 1500
agctgtatat ggtcgctggg tagagtgacc acataattga tcatcaaaac tgatacctgt 1560
aagagcaaaa gggggcacta ttaaccattg ggtcagggca acaggtcaaa atggagacct 1620
accctgggac ttctggtcac actagctact gtcaaaatgg ggcccaaata gacaaagcca 1680
aatggaagaa attcccttga cattgaaagt gttggggctc tgtggcaccc ccagttctag 1740
gttgggggag cttgggctgg tctcatgatg agttctgagg gggatgggcc agttgggccc 1800
cccgttccat ctaactcagg ttcctttcct cccagtccgc ctctccaagg accgatccac 1860
actgcaggtg ctggactcgg ccacagggaa ctggttctct gcctgtttcg acaacttcac 1920
agaagctctc gctgagacag cctgtaggca gatgggctac agcaggtaac caacctgggc 1980
ctctctcctt tttccctcct tcctccttcc tcctcttcct cctttccttc ctcccttctt 2040
ctctctttcc taaaaattac gggcattgga gccaggcaga atggcttttg aatcccagca 2100
tttcacttat aagcaacatg aagttaaatt tcctaagcct caggttcctc aggagttaat 2160
tgggggaact aatgccaacc tcataggata gttttgcaat gccagtgaga gaatgtgtgc 2220
tgccctccaa cacacacaca cacacttcta gcgtctatgc agtcctctcc tttcctttac 2280
tcctcaacct tcactccttt gtgctggctt tgcaagaaac tgttcctgcc cagtaataca 2340
aaagctaagt taacttattc aaagtttcgt tagttaagat ttagcttaag tgagcctagt 2400
ttcagtgggg ccccatcttc agcaatccca gctctctctg caaatttcaa aagcagttcc 2460
aaatctggag tggatgaaaa ggtgtaagat gatagtaaga gtaatttgca ttctatatat 2520
ttatattcac ttgattttgg cagaaaacca aaaagatagt tattatatct tatatataga 2580
tatatattat atctatttca taaataggct caaacaaagt aagtaacttg ctagggtact 2640
agctgggagg tagagggcta gaatttgagc ccaagacccc taattcttgc gcattaggag 2700
ttcccacatt gtttctgttt ctagactgag taattcttta ttctcatgta ggacatcatc 2760
tctaagggaa ggggctaatg agatggttga tcactcagag agtttagctg gagaggatgg 2820
aaaagaaccc atacattcag ttgcagattg agatagccta tctctggcag gcctcagatt 2880
tcttcaggat tctaacagac tggacccaga gactaggcca aacaaacaaa caaacaaaaa 2940
ctctactagg cagacatcac caaccaatca cagaactctc tcccatggat ccctaataca 3000
gcctcaaagt ccttttcagt aaatgctcca ggcagccatt acaaatcaat cagaattatt 3060
tgcctttctc ttctctgctc aacgggcttc tgctgctctc tactttccat agggggcaac 3120
ttccattacc ctctagaaag cacaccccac caccttcatt tcaaggagag tgaggaactc 3180
atgcccagca cctgctattc tcccctcttc ctgcagccac ggagcccagc ctcgctgcag 3240
ccagccctgc ctccccactg tagtccagtc aactgctgca tcagccgttc ctggcacagc 3300
aggctgagcc ttgattatga aacctgggtg tctccagggg ttcttaagat gataggctcc 3360
tggaatttct gtccttttgg agctcagtaa ggcaccaaac cacctgagtc ttgtgcttca 3420
caaaatcaaa gttcatcaga atcattcatt gggatggaat tggtgaacag aagttaactt 3480
tcctgggaat gtccatttcc accatattcc gtccttctag gtctcagact tctctacttt 3540
ctttcctctc tctagatcgg aggcccttct tgtcctagaa ccataggcat ttcaagatgt 3600
gggagaccct agggatcatc tagtccacgc atcttttttt tttttttttg acagagtctc 3660
actctgtcac ccaggctgga gtgcaatggc accatctctg cttactgcaa cctccacctc 3720
ccaggttcaa gtgattcttt cgcctcagcc tcccaagtag ctgggattac aggcacgcac 3780
catcatgccc agctaatttt tatatttttg tagagaccga gtttcaccat gttggccagg 3840
ctggtcttga actcctgacc tcaggtgatc cacccacctc ggcctcccaa agtgctggga 3900
ttacaggcgt gagccactgc acccagcccc gtgcatcttt ttatagaggg ggaaactgag 3960
gcttggagag acccagaaaa agaatatgac ctgcccaagg ccacacatca aactagtgcc 4020
agagccaggg acagaaccta gatcatgagg actcttaaaa tgcactctag tcctcccagg 4080
tctgagactt gggtccttcc aggaagtgcc agcattcctg cctgagaatg tgccaatcca 4140
ccagtattgc caatgactca gccctccatg gagagcttct actaacatta ctagcatagt 4200
tagggatgga aggaaaagat ttagaagagg cagattcagt aaaggaacaa tcagagagat 4260
ggaattaatc aaggaaggct tcctggagga ggaaaaactt caacccaagg tttgaaagta 4320
gcaagcatgg attagcaggg agaaagaggg agagtggtcc agttgagaga aacgtttgtc 4380
tggattcata tgaagacaga tctagtcctg ttctattaaa tatctctaag ggggccaaaa 4440
acataccccc gctatcaaag tcagaccaga tgctttgttt ggagaacgaa atatccacat 4500
tccaactccc tcccaggtga gaagggagct aacctgagcc cctatgcctc tttgtttccc 4560
tgctgtgaac cagaagacat tgctgggata tttgaaatag ggacagagct gggaatatgg 4620
aaaggagacc cctaacattt ctccagggct ctgggttctg gatttggatt ccccacccaa 4680
gaaagcaagt tacatcagca atgcactgag ggttgagtcc tgggatgcca agggtcggtt 4740
ctttattgta tagcaaagca ggccccatct tcactgacta agaccatctc cactccctgg 4800
ccactcccca ccaagcattc tctgccactc tttctcctga aagtgggggc caactctacc 4860
atcttgttct aaccccctgc cccagctcac aactctctct ccctcttgat gtgagcagca 4920
aacccacttt cagagctgtg gagattggcc cagaccagga tctggatgtt gttgaaatca 4980
cagaaaacag ccaggagctt cgcatgcgga actcaagtgg gtaagtgagg ggacaccttc 5040
tggcctacag aaggccccca catggacgct gctcttcagg ttgcaaccag ctcacctgga 5100
accccaagca gccaggggaa tgtaagcaga catcaggaag aactcctagc cagatggatc 5160
attcaatgcc aagagctata gactcacatt ttggagaggt tttctgtgtt gacttgtttt 5220
taatacaatg gacagctgga caaagtgtgt tgtcctactc agagccagag ggatggataa 5280
tgtgaccttt ccatcaatct ggatagtaaa tagtttttgc tactgctgta ggttttctaa 5340
taaattgccc aataggcaag attccaaagt cactttgtcc ttccctacca cttacccagc 5400
cagagctccc caccttcttg atgctccagg gaagaggctc catggccctt gtgggtggcc 5460
tgttcctgag cctcgccacc ctgtgttaga gcagagcatc cagatgaaat ctgtcacact 5520
gtggcaaagt ggctcagaga ggaggctggc ttcctagcat tcagggacgt tgctgagggc 5580
cgcttattca ccgaaaataa atcttgaaaa ggacagggct ggtagcagaa tgatccttta 5640
cctaaaattc tatcaaaatc ccattcttcc atttggaaag cccacagtgt cacagactct 5700
gttccgggct ctgtcctctt ccctcttggg tcccaggagc ccaggctggg ctttgaagca 5760
ggcagggccc agcacacagt aggtactcag cagtgggggt gttgaatcca atcaaacgga 5820
agtgtcaatg caggaaatgc aatggatgtc aatgcagtct ccaaatgttc cccactgtgc 5880
agcttccaca ttcccgaggt attgggaggg gacttgaatt aacagcttcg ggaggcctga 5940
gtccctgcct cccagctgag gaagaagctt aaatcacagg gcgctgtgtc tgtcttccag 6000
gccctgtctc tcaggctccc tggtctccct gcactgtctt ggtgagtacc cccaatctct 6060
gagggtttgg ggcctgggcc agcaatgagc agggaggaag accttcatct tcactcctaa 6120
atttctggga ctccaagttt cattctgcct tggtctacag cccttgggct tgtcggtcaa 6180
tgccccctcg agttgttggt ggccttgggc aggtcacatt ctttttctgg gtctttccaa 6240
gccccagttt cccccttcta ccatctgtgc atggctccat gacctaagtg gagacctggg 6300
agagagtgtt aggaagaccg aaaagggcag gacggggcct ccactgcctc ccatccctgg 6360
tccgggccca catagccttc tttgtcacaa tcagctcagg tatccaagat cagattaccc 6420
acattcatta tttgagcaac tattcattga acagttagaa tatgtctcac tctgtcagtt 6480
gctggctaga agtagaaagt accagatgag tgaaataatt ggccactatc cttggtagct 6540
gatgactaag taagagagag atgcaagaca acatgtggaa aatgccaaac tgagtagcag 6600
tcacagttga catgctgcag agagagctgg ccgggggtca gaagacctgg gcaccagtcc 6660
tgttcatttc cagtgtggcc tcgagtcatt cacctgacct ccctgaagtt cattttccca 6720
agaagttgtt tagtccaact gcccatcaag gatctttagg gacccttcta gctctaacag 6780
aggagatcag aaaagaaaac aagcaatgtg gctcagctca tcctacaagc ttcatagaga 6840
actgagactg gcctggaagc atagccagaa attagaacgc ctaagggaag aaggtcacaa 6900
cgctgcctct gcaatttagg agtgtatatg ctttcctgca ggatgttgag agtttcattc 6960
attatcgtat gccccctacc ccggccccac aatacctagt gcgtgggatc tgacacgtgg 7020
tggctggtca atgaatgaat gaatgaatgg tcacaccatc tgaggttctg cactgagtag 7080
ccctgaaggc ttgaagcagc ataagtgaca ggtcctccct tgaggggcct ctgttttacc 7140
aataagccaa gacctaagct caacaacact gaaagggtgg ccaataccca ggacagcctg 7200
tgggaattcc agagaaaggg agattcccag ggactggggg cccaggctaa acactgaaaa 7260
atgcatctgt aggctcaagg aggaaaagcc catgtctgtc tgtcttgccc accactctct 7320
cccagcaccc agcactgccc caggacagag agcacttgac acaagttggt tagattaatg 7380
aatgatttag agttcagtgg tccccaacct ttttggcaca agagactggt tgcatggaag 7440
acaatttttc cgcaaaccaa gagggggata gagagcatta gattctctct tttttttttt 7500
tttgagacca agtctggctc ttgtcactca gcctggagta aagtgttgcg atctcggctc 7560
actgcaacct ccgcctcctg gattcaagcg attctcctgc ctcagccccc taaatagctg 7620
ggattacagg cacccgtcac cagcccagct gggactatag gcatgtgcca ccatgcccgg 7680
ctaatttttg tatttttagt agagacggcg tttcaccatg ttggccaggc tagtctcgaa 7740
ctcctgacct caggtgatct gcccgcctga gcctcccaaa gtgctgggat tacaggcatg 7800
agctgcctca cccagcctaa agtctcataa ggaacgtaca gcatagatcc ctcacatgtg 7860
cagttcacaa taaggttgtg ctcctacaag aatctaacgc cacctctgat ctgacaggag 7920
gtgaagctca ggtggtcatg ctcgcttgtc cctgccactc acttcctaat gtacagccag 7980
gttcctaaca ggccacgaac cagtgggaag ggcatctttt tggatcaaaa acagaattac 8040
tttttagaga actacaagca gatcaatttg gctagacaga gactttatat gaaacagcag 8100
gaggctgcta ggaggagtgg aaactctact ttgccctcaa gggagatccc gaagggcttt 8160
gcaggagcgg gcaaggtggc atgaagaaag cagtgtttga aatcaggtgg tatttgaaaa 8220
gcccagccct tccccttaga atggcccttc taccatctgt gcatggctcc acaaccgtgg 8280
tggtggctgc cagaagaatt ggaaaggcag agcatgggtg gagagggggg acctgagggc 8340
tttacaggag ttccgggggt ggtgagggtg tgaaagccag gtcagtcagt aggaagacag 8400
gatgtcagat tgagagactc ccctggccgg ggaaacagac ttggagaagg gggagttttg 8460
gatgagacag tccacttccg agtcacaaaa tagcttgtgg gtgtctgttt actgttactc 8520
agtgggagtg gctggggaca cgccacctgg gcagggcttt cgtaattctg catcacttgt 8580
gaaggtcaca gattcccagc acaacggaca cacccatgtt catagtctga actcctaaac 8640
acatcttaaa ccaaaataaa aaaaaaagaa agaaagaaag aaaaaggaga gggaggtttg 8700
aggaaagcct atggtctggg acactcaata cctcccatga atatctcata ttgggctggt 8760
cctctctcca ctctggcccc agccataagg gccctgctta gagcagattt tgggtgctga 8820
gtggaggcag cctcatcccc aacagcctga cttcctgcct cctccctgcc tctgcctgtg 8880
tccagcctgt gggaagagcc tgaagacccc ccgtgtggtg ggtgtggagg aggcctctgt 8940
ggattcttgg ccttggcagg tcagcatcca gtacgacaaa cagcacgtct gtggagggag 9000
catcctggac ccccactggg tcctcacggc agcccactgc ttcaggtaag accccagctg 9060
taaggaggtc tctggggacc aaggccagtc agggaccaga gagcttgggg tcctgtctcc 9120
tggcaccgtc cttctcttca ctctcccact agagacgttt tccaggttgt ggtggcccca 9180
atgagacaat ggccatgatg ccctttgtta ggcttttggg tgtctgagca gagggtgctg 9240
gtcaccaagc atggcctctt cctggtggga caccagcaga tacccagagt cctcacccca 9300
cccccatatc gttcaagcta caaaagctct tcccacctgc ctcaacttcc aagaactcac 9360
tctctttttg cttgtttcca ggaagttgtt ccagggtcta gagtcatagc cacgtcctca 9420
ttatgtctgg aaactttaaa aaaattaaag agcataggtt cctttcagtc cacagagaag 9480
cctggcctta cctcagggaa gggctactcc cagaccccct tcactttttt tttttttttt 9540
tttttttttt tttttgagac agagtcttgc tctgttgctt aggctggagc gcagcagcat 9600
gatcttggct cactgcaacc tccgcctcct gagttcaagc aattctcctg cctcagcttc 9660
ccaagtagct gggactatag gcatgggcca ccatgcccgg ctaatttttg tatttttggt 9720
agagacaggg tttcaccatg ttggccaggc tgatctctaa ctcctgacct caagtgatct 9780
gcccacctca gcctcccaaa ctgctgggat tacaggcatg agccagggca tccggctttt 9840
atttattcat tcattcaata tctaatgagc acctaccagg taccaaacac cagatgatgc 9900
gcccaagttc attagacccc accgctgtct tcaaggcact catgatctag gccagcgttt 9960
tttaaccact tttttttttt ttttttttga gattctggtg agagctataa attctttcct 10020
ggaaaaacat ctctgcacac taagctgtgc ctggcattgg gaaaaagaaa gcacgtaatg 10080
taactgacag catgagtaac acagtgagaa aggttggagg agagagcgcc aggacctcag 10140
aactcaggca ttagaggagc cccttcccca gccctccttg aggtttcgtt gggcaggttt 10200
cactgaggaa aaagggtcaa atcccttttt cgaatttgac ttcttgtaag tgccagaaga 10260
ctgccccttc tccaccatcc ctgcctcacc atcatctttc ctcccaaggc agtgacatcc 10320
agcaccccga tccctagggc cctggggacc cagcctttgg caaagtctcc tcaggcttgg 10380
atcaggcctg aacccagctg tctctacccc caggaaacat accgatgtgt tcaactggaa 10440
ggtgcgggca ggctcagaca aactgggcag cttcccatcc ctggctgtgg ccaagatcat 10500
catcattgaa ttcaacccca tgtaccccaa agacaatgac atcgccctca tgaagctgca 10560
gttcccactc actttctcag gtgagaagca gggcccaagg ccactcaagc ctcttacatc 10620
agttttcacg cccactctgc tattagctca ctgaccgccc ttggcacata atgtctcctc 10680
tcaagtcctc agcttgccca tttgtctcta atacgtcagc ctaacatcac tgatgccatg 10740
aggcctcctc aagctgtcag ctaacacctc cactccattc cctgccagag attcttccaa 10800
ggcctgtctt ccctatgtgg agcccctcga gtgagaactg gagtttcatc caatcttgga 10860
gttttaggag accttttaaa aagattatcg agctaattcc ccaccactga ccaacacgca 10920
agagcctgct cagtatccct gccaaggagt cattgtgccc ctgtttgctc tcctccaggg 10980
gcagggaacc cattacctgt gaggcagccc acagagtctt tgaacagctc tgttggatgc 11040
cttgtgctta tactgaaatg tatttagatc aggattccca actgtggggt ccacaagaca 11100
ctggcccctt ggagaagaga ggattccatt gtcaaataag tttggggaac attttcatac 11160
tacagctccc ttcttggaac acattagttt attaaaggta ggagaagttt ttaaaataat 11220
ctgttttatt gcgtttaacc tacatttttt aaatttattt gaccacagaa tccttttttc 11280
atgctacttc tattagcatc ccatagaaca agtgttctag agaccctggt gtgacccctt 11340
tcagagagct taactgccag gctctcctga gccctggtgt gtgtttcaag atttgtgcct 11400
gggaattgtt ttaatcaggt atggcaaggt gacagataca gacacagcta tctttgaaag 11460
aagagtttat tatttataat tcctgagaga aagggacata ccccaccccc caacacaggg 11520
acacccgggg aagcagctgg gtccaccagg aggcaggagt gaggggaagg catggcccag 11580
agccacctgt ggcttccatg ggcaggtctg gccaaggtag ggtaggcaag attgagcatg 11640
ctcaggattg gatagtgtgg acaattctct aggctataga tgtcagcctc tggttgtcta 11700
gtatctgtcc ctggggtgat ttagggcagg gaaaatattg gcttggtgtc tgagagtcag 11760
ataaaggaag tggttgggga tatgggcttt gggttggctg gtttgcctat taaaggcgtg 11820
cccaaagcca agttgtttac tatctgcagg aattagctaa cccagtctct cccagaccag 11880
caagatcccc ataatcataa agcatcataa tttacagaaa attaacactt atgatgaata 11940
aaagatctcc ttcttcctct gtgctcctgg caggcacagt caggcccatc tgtctgccct 12000
tctttgatga ggagctcact ccagccaccc cactctggat cattggatgg ggctttacga 12060
agcagaatgg aggtaagtcc tgggtgcagg accacagggc aggagatgcc cttgtatgag 12120
ggagcagctt ccagaagtaa tgggaaggag gaccaccctt cagagaaacc catcctggag 12180
gaccaagcac caaggcgcca ggcagaaagc aaagtggttt ggcaatccag ggctggggga 12240
tagaaggcaa ggatgggaat gtgagtgttt ttaccctccc agggaagatg tctgacatac 12300
tgctgcaggc gtcagtccag gtcattgaca gcacacggtg caatgcagac gatgcgtacc 12360
agggggaagt caccgagaag atgatgtgtg caggcatccc ggaagggggt gtggacacct 12420
gccaggtggg gcctccaaga atcatgggga gttctaagaa tagggtttag gtcctagaga 12480
gatgagaaaa cccagaggct gcatgcccta caggaagcct tgcatatcat gggcactcaa 12540
tgtgtgatga tgggaggaag agagggaggg aaggaaagga tagtcagata aaagtgtacc 12600
aatagatgag tgggtggatg gatggatgca gacaagcaga gagatttcaa atgtctcttt 12660
cacattcgaa gatgatgtta ctggcctggc atggtggctc acgcttgtaa tcccagcact 12720
ttgggaggct gaggcgggca ggtgatttga ggtcaggaat tcaagaccag cctggccaac 12780
atggtgaaat cccatctcta ctaaaaagaa tacaaaaatt agctgggcgt ggtggcacgt 12840
gcctgtaatc ccagctactt gggaggctga ggcaggagaa ttgcttgaac ccaggaggca 12900
gaggttgcag taagctgaga ttgcgccact gcactccagc ctgggtgacc cagcaagact 12960
ccatctgaaa acaacaacaa caacaaagat gacattactc atccacccca cccacccttc 13020
tcactagcta cagaatgatt agccccttga ggtcaggaat cccaggtcta ttttctctgt 13080
gactctcccc aagctgctga actacactag gaaagaatta ccgcctgcag aatgctggaa 13140
gcacatctgt gtgtgccctc accccggcct cattggccat caggactgct tagcaatccc 13200
tgtagacctt cttcctcccc catacttcca gaggatcttc tgaactattt tcttttttta 13260
ttttttcttt tatgtttttt aacagagaca gggtcactat gttgcccagt ctggtctcaa 13320
actcctgggt tcaagggatt ctcccacctc agctttccaa aatgctggga ttacaggcat 13380
gagccatcgt gcttggcctg aaccattttc attaaaaccc ctaccctact ctcacctcca 13440
tttccagtca ttaaattcct tcatttaaga ggcatctctt agtcatcgca tgtgtgccat 13500
gaacatggta gtctttggag acccctcagg gagctcacag tggttggggg aaaggggggc 13560
attaaacaga catttaagct atagttttgg gttcagaggg aggaagcccc aggggctaaa 13620
acagctgata aggactccca gataagtgca cttttcacta tctggcattt tcttgttttg 13680
ttatttgctt gttcactgtc tctcacccca tttgatccta agctttctga gggcagggat 13740
ctttgttttt tttcatcagt tggatcccaa ttgcttagaa cactacctgg cacaaaatag 13800
gcactctata agtgattaca caaattttgg aacgactagg ttaaacaatg ataaccaggc 13860
tttttttttt ttttttgaga ctgagtctca ctctgttgcc caggctagag tgaagtggtt 13920
tgatctcggc tcactgcagc ctccgcctct gggttcgaat gattctccac ctcagcctcc 13980
tgagtagctg ggattacagg tgcctgccac tatgcccagc taatttttgt atttgtagta 14040
gagacgggtt tcaccatgtt ggccaggctg gtcttgaact cctgacctca agtgattcac 14100
ccgcctcagc ctcccaaggt gctgggatta caggtgtgag ccaccgctcc tggccaacaa 14160
ccaggctttt ttaagacatc actcagagcc tttaatttgc taatgtgagt tgtgaatctc 14220
tgagagaagg ctaacggcat gcttgcaact tacttgtcca cagacaagcc tttctgcccc 14280
agaagagaag accattctag ggtgctaatg agcaaagagg gtgagggtgg aatatcggag 14340
agcagcaggg agtgcagggg aacagatagg ccagttcagg gagcagagaa ggagaagccc 14400
ccccacctca cctgccctcc ccagcagtct ctgttctggt ctctcacagg gtgacagtgg 14460
tgggcccctg atgtaccaat ctgaccagtg gcatgtggtg ggcatcgtta gttggggcta 14520
tggctgcggg ggcccgagca ccccaggagt atacaccaag gtctcagcct atctcaactg 14580
gatctacaat gtctggaagg taaggtacct ttgccctacc cactgtgcct tccctccagt 14640
cctctacctg gggggtgcca atccatcctc aggtttgatt taaatggttc tgacaactct 14700
ttacatccca aataactttc cctccaagca agggacagcc tgagattgca ctattaaggc 14760
tgaaattcct taggtcagag atttctgata aatgcaaata ccttagggaa tagaacacac 14820
caagcctttc tttctctttt ctgacagaat gagactatca gatcctttct agagagaaga 14880
ttctgataag gaagagagtg gaaaggctca tgagacctcc tggccctctg cagggtaggg 14940
agagaagcaa agtgtttcag aaaaggaaga ctcacgttac acatgtcacc actttgtcca 15000
gtttcagata atctgacttt ctcttcatcg gtctctctta ttctaggctg agctgtaacg 15060
ctgccgtccc ccacatccag aagctgcttc ccttcagacc tacctacggc atgacccctc 15120
aaagtcagat atgggacaag agcctccttg aacaaactc 15159
<210> 14
<211> 435
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Рекомбинантный белок
<400> 14
Met Glu Ser Asp Ser Gly Gln Pro Leu Asn Asn Arg Asp Ile Val Pro
1 5 10 15
Phe Arg Lys Pro Arg Arg Pro Gln Glu Thr Phe Lys Lys Val Gly Ile
20 25 30
Pro Ile Ile Ala Val Leu Leu Ser Leu Ile Ala Leu Val Ile Val Ala
35 40 45
Leu Leu Ile Lys Val Ile Leu Asp Lys Tyr Tyr Phe Leu Cys Gly Gln
50 55 60
Pro Leu His Phe Ile Pro Arg Lys Gln Leu Cys Asp Gly Glu Leu Asp
65 70 75 80
Cys Pro Leu Gly Glu Asp Glu Glu His Cys Val Lys Ser Phe Pro Glu
85 90 95
Gly Pro Ala Val Ala Val Arg Leu Ser Lys Asp Arg Ser Thr Leu Gln
100 105 110
Val Leu Asp Ser Ala Thr Gly Asn Trp Phe Ser Ala Cys Phe Asp Asn
115 120 125
Phe Thr Glu Ala Leu Ala Glu Thr Ala Cys Arg Gln Met Gly Tyr Ser
130 135 140
Ser Lys Pro Thr Phe Arg Ala Val Glu Ile Gly Pro Asp Gln Asp Leu
145 150 155 160
Asp Val Val Glu Ile Thr Glu Asn Ser Gln Glu Leu Arg Met Arg Asn
165 170 175
Ser Ser Gly Pro Cys Leu Ser Gly Ser Leu Val Ser Leu His Cys Leu
180 185 190
Ala Cys Gly Lys Ser Leu Lys Thr Pro Arg Val Val Gly Val Glu Glu
195 200 205
Ala Ser Val Asp Ser Trp Pro Trp Gln Val Ser Ile Gln Tyr Asp Lys
210 215 220
Gln His Val Cys Gly Gly Ser Ile Leu Asp Pro His Trp Val Leu Thr
225 230 235 240
Ala Ala His Cys Phe Arg Lys His Thr Asp Val Phe Asn Trp Lys Val
245 250 255
Arg Ala Gly Ser Asp Lys Leu Gly Ser Phe Pro Ser Leu Ala Val Ala
260 265 270
Lys Ile Ile Ile Ile Glu Phe Asn Pro Met Tyr Pro Lys Asp Asn Asp
275 280 285
Ile Ala Leu Met Lys Leu Gln Phe Pro Leu Thr Phe Ser Gly Thr Val
290 295 300
Arg Pro Ile Cys Leu Pro Phe Phe Asp Glu Glu Leu Thr Pro Ala Thr
305 310 315 320
Pro Leu Trp Ile Ile Gly Trp Gly Phe Thr Lys Gln Asn Gly Gly Lys
325 330 335
Met Ser Asp Ile Leu Leu Gln Ala Ser Val Gln Val Ile Asp Ser Thr
340 345 350
Arg Cys Asn Ala Asp Asp Ala Tyr Gln Gly Glu Val Thr Glu Lys Met
355 360 365
Met Cys Ala Gly Ile Pro Glu Gly Gly Val Asp Thr Cys Gln Gly Asp
370 375 380
Ser Gly Gly Pro Leu Met Tyr Gln Ser Asp Gln Trp His Val Val Gly
385 390 395 400
Ile Val Ser Trp Gly Tyr Gly Cys Gly Gly Pro Ser Thr Pro Gly Val
405 410 415
Tyr Thr Lys Val Ser Ala Tyr Leu Asn Trp Ile Tyr Asn Val Trp Lys
420 425 430
Ala Glu Leu
435
<210> 15
<211> 2046
<212> ДНК
<213> Mus musculus
<400> 15
cagaaacaag gacctcttca ttattcaaga gtaaaatgta taggccaaga ccaatgctat 60
caccgtcaag attcttcact ccctttgcag tagctttcgt tgtcataata acggtagggc 120
tcctggccat gatggcaggt ctacttattc actttttagc ttttgacaag aaagcttact 180
tttatcatag cagctttcaa atcctaaacg ttgaatacac tgaggcttta aactcaccag 240
ctacacacga atacagaacc ttgagtgaaa gaattgaggc tatgattact gatgaatttc 300
gaggatcaag tctaaaaagt gagtttatca ggacacatgt tgtcaaacta agaaaagaag 360
ggactggtgt ggttgcggat gttgtcatga aatttcgatc tagtaaacgt aacaacagaa 420
aggtaatgaa aaccagaatt caatctgtgc tacgaagact cagcagctct ggaaacttgg 480
aaatagcccc ttcgaatgag ataacatcac tcactgacca ggatacagaa aatgttttga 540
ctcaagaatg tggagcacgt ccagacctta taacactgtc agaagagaga atcattggag 600
gcatgcaagc tgagcccggt gactggccct ggcaagtcag tctacagctc aataatgtcc 660
accactgtgg aggtgccctg atcagtaaca tgtgggtcct gacagcagct cattgcttca 720
aaagctatcc taatcctcaa tattggacag ccacctttgg ggtttctaca atgagcccta 780
ggctgagagt gagagtaagg gctattttag cccacgacgg gtacagctcc gtaactcgtg 840
acaatgacat cgcagttgta caacttgaca gatctgtcgc cttttccaga aatatccata 900
gggtatgtct cccagcagca acccaaaata tcatccctgg ttctgtcgca tatgttacag 960
gatggggatc tctcacatat ggaggcaacg cagtcacaaa tctacggcaa ggagaggtca 1020
gaataataag ttcagaggaa tgcaatacgc cagctggtta cagtggaagt gtcttgccag 1080
gaatgctgtg tgctggaatg cgttcagggg ccgtggatgc atgccagggt gattcaggtg 1140
gcccgctagt acaagaagac tcaaggcggc tttggtttgt tgtgggcatt gtgagctggg 1200
gatatcagtg tggcctccca aataagccag gcgtgtatac tcgagtgaca gcctaccgca 1260
actggatcag acagcagacg ggaatctagt gcaaccgagg aaaaaacgtg ccatgaggtc 1320
tctgtatcca agtgtgactg actcggatgc catggcttca catttcaact gcaaaggaga 1380
ctggaaatgc cccttctgaa cgtcccatta cataaatatg gtttaactgt ttagtatttc 1440
tttgtcggta cagattttta ctttcttgag gaaaaaaaaa acatgaacat ggctaagtaa 1500
gaattatgtt aggctagtaa caggaagaca tttattacat gggtggtcag gtgtagtagt 1560
gagaagtcag gtaagttaag tcaataattt acagaaaata atgtcaggta gtcctaacgt 1620
taaatatgtg aggccacaga acaaatagtg ttagaactga agccatccca agtatttaac 1680
atttgttttc aagtgaaact aagaaacaga cttacatata gttttaatgg tgaattttca 1740
ttttaaatat tttatctaca tagaaaagac atatctcctt catgaagaag ctgaggtgat 1800
gaatcaacac agcctcttca gctatgtttg caaccacaag atttgtggga aagaaatccc 1860
tactaccaac ttcctactgt tggcattatt ttttagagta acacgacgca caatagcaaa 1920
atttaagtaa caaattaaaa gttaatgatg aagaagaagt aaagagtttg tttgcaaaga 1980
caaaaattaa acagattaat atcaataaat ctggagacag aagggtctca gattcatatt 2040
ctctct 2046
<210> 16
<211> 417
<212> БЕЛОК
<213> Mus musculus
<400> 16
Met Tyr Arg Pro Arg Pro Met Leu Ser Pro Ser Arg Phe Phe Thr Pro
1 5 10 15
Phe Ala Val Ala Phe Val Val Ile Ile Thr Val Gly Leu Leu Ala Met
20 25 30
Met Ala Gly Leu Leu Ile His Phe Leu Ala Phe Asp Lys Lys Ala Tyr
35 40 45
Phe Tyr His Ser Ser Phe Gln Ile Leu Asn Val Glu Tyr Thr Glu Ala
50 55 60
Leu Asn Ser Pro Ala Thr His Glu Tyr Arg Thr Leu Ser Glu Arg Ile
65 70 75 80
Glu Ala Met Ile Thr Asp Glu Phe Arg Gly Ser Ser Leu Lys Ser Glu
85 90 95
Phe Ile Arg Thr His Val Val Lys Leu Arg Lys Glu Gly Thr Gly Val
100 105 110
Val Ala Asp Val Val Met Lys Phe Arg Ser Ser Lys Arg Asn Asn Arg
115 120 125
Lys Val Met Lys Thr Arg Ile Gln Ser Val Leu Arg Arg Leu Ser Ser
130 135 140
Ser Gly Asn Leu Glu Ile Ala Pro Ser Asn Glu Ile Thr Ser Leu Thr
145 150 155 160
Asp Gln Asp Thr Glu Asn Val Leu Thr Gln Glu Cys Gly Ala Arg Pro
165 170 175
Asp Leu Ile Thr Leu Ser Glu Glu Arg Ile Ile Gly Gly Met Gln Ala
180 185 190
Glu Pro Gly Asp Trp Pro Trp Gln Val Ser Leu Gln Leu Asn Asn Val
195 200 205
His His Cys Gly Gly Ala Leu Ile Ser Asn Met Trp Val Leu Thr Ala
210 215 220
Ala His Cys Phe Lys Ser Tyr Pro Asn Pro Gln Tyr Trp Thr Ala Thr
225 230 235 240
Phe Gly Val Ser Thr Met Ser Pro Arg Leu Arg Val Arg Val Arg Ala
245 250 255
Ile Leu Ala His Asp Gly Tyr Ser Ser Val Thr Arg Asp Asn Asp Ile
260 265 270
Ala Val Val Gln Leu Asp Arg Ser Val Ala Phe Ser Arg Asn Ile His
275 280 285
Arg Val Cys Leu Pro Ala Ala Thr Gln Asn Ile Ile Pro Gly Ser Val
290 295 300
Ala Tyr Val Thr Gly Trp Gly Ser Leu Thr Tyr Gly Gly Asn Ala Val
305 310 315 320
Thr Asn Leu Arg Gln Gly Glu Val Arg Ile Ile Ser Ser Glu Glu Cys
325 330 335
Asn Thr Pro Ala Gly Tyr Ser Gly Ser Val Leu Pro Gly Met Leu Cys
340 345 350
Ala Gly Met Arg Ser Gly Ala Val Asp Ala Cys Gln Gly Asp Ser Gly
355 360 365
Gly Pro Leu Val Gln Glu Asp Ser Arg Arg Leu Trp Phe Val Val Gly
370 375 380
Ile Val Ser Trp Gly Tyr Gln Cys Gly Leu Pro Asn Lys Pro Gly Val
385 390 395 400
Tyr Thr Arg Val Thr Ala Tyr Arg Asn Trp Ile Arg Gln Gln Thr Gly
405 410 415
Ile
<210> 17
<211> 2800
<212> ДНК
<213> Homo sapiens
<400> 17
atttgagtgg gaatctcaaa gcagttgagt aggcagaaaa aagaacctct tcattaagga 60
ttaaaatgta taggccagca cgtgtaactt cgacttcaag atttctgaat ccatatgtag 120
tatgtttcat tgtcgtcgca ggggtagtga tcctggcagt caccatagct ctacttgttt 180
actttttagc ttttgatcaa aaatcttact tttataggag cagttttcaa ctcctaaatg 240
ttgaatataa tagtcagtta aattcaccag ctacacagga atacaggact ttgagtggaa 300
gaattgaatc tctgattact aaaacattca aagaatcaaa tttaagaaat cagttcatca 360
gagctcatgt tgccaaactg aggcaagatg gtagtggtgt gagagcggat gttgtcatga 420
aatttcaatt cactagaaat aacaatggag catcaatgaa aagcagaatt gagtctgttt 480
tacgacaaat gctgaataac tctggaaacc tggaaataaa cccttcaact gagataacat 540
cacttactga ccaggctgca gcaaattggc ttattaatga atgtggggcc ggtccagacc 600
taataacatt gtctgagcag agaatccttg gaggcactga ggctgaggag ggaagctggc 660
cgtggcaagt cagtctgcgg ctcaataatg cccaccactg tggaggcagc ctgatcaata 720
acatgtggat cctgacagca gctcactgct tcagaagcaa ctctaatcct cgtgactgga 780
ttgccacgtc tggtatttcc acaacatttc ctaaactaag aatgagagta agaaatattt 840
taattcataa caattataaa tctgcaactc atgaaaatga cattgcactt gtgagacttg 900
agaacagtgt cacctttacc aaagatatcc atagtgtgtg tctcccagct gctacccaga 960
atattccacc tggctctact gcttatgtaa caggatgggg cgctcaagaa tatgctggcc 1020
acacagttcc agagctaagg caaggacagg tcagaataat aagtaatgat gtatgtaatg 1080
caccacatag ttataatgga gccatcttgt ctggaatgct gtgtgctgga gtacctcaag 1140
gtggagtgga cgcatgtcag ggtgactctg gtggcccact agtacaagaa gactcacggc 1200
ggctttggtt tattgtgggg atagtaagct ggggagatca gtgtggcctg ccggataagc 1260
caggagtgta tactcgagtg acagcctacc ttgactggat taggcaacaa actgggatct 1320
agtgcaacaa gtgcatccct gttgcaaagt ctgtatgcag gtgtgcctgt cttaaattcc 1380
aaagctttac atttcaactg aaaaagaaac tagaaatgtc ctaatttaac atcttgttac 1440
ataaatatgg tttaacaaac actgtttaac ctttctttat tattaaaggt tttctatttt 1500
ctccagagaa ctatatgaat gttgcatagt actgtggctg tgtaacagaa gaaacacact 1560
aaactaatta caaagttaac aatttcatta cagttgtgct aaatgcccgt agtgagaaga 1620
acaggaacct tgagcatgta tagtagagga acctgcacag gtctgatggg tcagaggggt 1680
cttctctggg tttcactgag gatgagaagt aagcaaactg tggaaacatg caaaggaaaa 1740
agtgatagaa taatattcaa gacaaaaaga acagtatgag gcaagagaaa taatatgtat 1800
ttaaaatttt tggttactca atatcttata cttagtatga gtcctaaaat taaaaatgtg 1860
aaactgttgt actatacgta taacctaacc ttaattattc tgtaagaaca tgcttccata 1920
ggaaatagtg gataattttc agctatttaa ggcaaaagct aaaatagttc actcctcaac 1980
tgagacccaa agaattatag atatttttca tgatgaccca tgaaaaatat cactcatcta 2040
cataaaggag agactatatc tattttatag agaagctaag aaatatacct acacaaactt 2100
gtcaggtgct ttacaactac atagtacttt ttaacaacaa aataataatt ttaagaatga 2160
aaaatttaat catcgggaag aacgtcccac tacagacttc ctatcactgg cagttatatt 2220
tttgagcgta aaagggtcgt caaacgctaa atctaagtaa cgaattgaaa gtttaaagag 2280
ggggaagagt tggtttgcaa aggaaaagtt taaatagctt aatatcaata gaatgatcct 2340
gaagacagaa aaaactttgt cactcttcct ctctcatttt ctttctctct ctctcccctt 2400
ctcatacaca tgcctccccc accaaagaat ataatgtaaa ttaaatccac taaaatgtaa 2460
tggcatgaaa atctctgtag tctgaatcac taatattcct gagtttttat gagctcctag 2520
tacagctaaa gtttgcctat gcatgatcat ctatgcgtca gagcttcctc cttctacaag 2580
ctaactccct gcatctgggc atcaggactg ctccatacat ttgctgaaaa cttcttgtat 2640
ttcctgatgt aaaattgtgc aaacacctac aataaagcca tctactttta gggaaaggga 2700
gttgaaaatg caaccaactc ttggcgaact gtacaaacaa atctttgcta tactttattt 2760
caaataaatt ctttttaaaa taaaaaaaaa aaaaaaaaaa 2800
<210> 18
<211> 418
<212> БЕЛОК
<213> Homo sapiens
<400> 18
Met Tyr Arg Pro Ala Arg Val Thr Ser Thr Ser Arg Phe Leu Asn Pro
1 5 10 15
Tyr Val Val Cys Phe Ile Val Val Ala Gly Val Val Ile Leu Ala Val
20 25 30
Thr Ile Ala Leu Leu Val Tyr Phe Leu Ala Phe Asp Gln Lys Ser Tyr
35 40 45
Phe Tyr Arg Ser Ser Phe Gln Leu Leu Asn Val Glu Tyr Asn Ser Gln
50 55 60
Leu Asn Ser Pro Ala Thr Gln Glu Tyr Arg Thr Leu Ser Gly Arg Ile
65 70 75 80
Glu Ser Leu Ile Thr Lys Thr Phe Lys Glu Ser Asn Leu Arg Asn Gln
85 90 95
Phe Ile Arg Ala His Val Ala Lys Leu Arg Gln Asp Gly Ser Gly Val
100 105 110
Arg Ala Asp Val Val Met Lys Phe Gln Phe Thr Arg Asn Asn Asn Gly
115 120 125
Ala Ser Met Lys Ser Arg Ile Glu Ser Val Leu Arg Gln Met Leu Asn
130 135 140
Asn Ser Gly Asn Leu Glu Ile Asn Pro Ser Thr Glu Ile Thr Ser Leu
145 150 155 160
Thr Asp Gln Ala Ala Ala Asn Trp Leu Ile Asn Glu Cys Gly Ala Gly
165 170 175
Pro Asp Leu Ile Thr Leu Ser Glu Gln Arg Ile Leu Gly Gly Thr Glu
180 185 190
Ala Glu Glu Gly Ser Trp Pro Trp Gln Val Ser Leu Arg Leu Asn Asn
195 200 205
Ala His His Cys Gly Gly Ser Leu Ile Asn Asn Met Trp Ile Leu Thr
210 215 220
Ala Ala His Cys Phe Arg Ser Asn Ser Asn Pro Arg Asp Trp Ile Ala
225 230 235 240
Thr Ser Gly Ile Ser Thr Thr Phe Pro Lys Leu Arg Met Arg Val Arg
245 250 255
Asn Ile Leu Ile His Asn Asn Tyr Lys Ser Ala Thr His Glu Asn Asp
260 265 270
Ile Ala Leu Val Arg Leu Glu Asn Ser Val Thr Phe Thr Lys Asp Ile
275 280 285
His Ser Val Cys Leu Pro Ala Ala Thr Gln Asn Ile Pro Pro Gly Ser
290 295 300
Thr Ala Tyr Val Thr Gly Trp Gly Ala Gln Glu Tyr Ala Gly His Thr
305 310 315 320
Val Pro Glu Leu Arg Gln Gly Gln Val Arg Ile Ile Ser Asn Asp Val
325 330 335
Cys Asn Ala Pro His Ser Tyr Asn Gly Ala Ile Leu Ser Gly Met Leu
340 345 350
Cys Ala Gly Val Pro Gln Gly Gly Val Asp Ala Cys Gln Gly Asp Ser
355 360 365
Gly Gly Pro Leu Val Gln Glu Asp Ser Arg Arg Leu Trp Phe Ile Val
370 375 380
Gly Ile Val Ser Trp Gly Asp Gln Cys Gly Leu Pro Asp Lys Pro Gly
385 390 395 400
Val Tyr Thr Arg Val Thr Ala Tyr Leu Asp Trp Ile Arg Gln Gln Thr
405 410 415
Gly Ile
<210> 19
<211> 38992
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Рекомбинантный полинуклеотид
<400> 19
gagggagggt ggtgctttgc taatggtgaa ttactaactc ctcaataaag aatattattt 60
gaaataattt ttgaaatttc ataattactt tgggttcttt cttaatgata aataaataat 120
agtatattac aaacatacat taatatttcc tgaatgaata caccacaaat ctcccttaaa 180
atatagcaag aataaaaatt atactatttc tgacaatttt taatttctca aataataata 240
ccactctgat ttttaaacat ctacaccact ctggctttgc caatcttttt aaaaattgaa 300
aagataataa ttttatcata attacactga agcatagaac tttttctttc aaggaaagca 360
aatttttgaa attctataat ataacctccc ataatcctga ataaattaaa ggttcaacaa 420
cttagtaaag taagactgac cttccctttt atttcttttt cagatcaaaa atcttacttt 480
tataggagca gttttcaact cctaaatgtt gaatataata gtcagttaaa ttcaccagct 540
acacaggaat acaggacttt gagtggaaga attgaatctc tggtaagtta atatttgtct 600
ttgctcttta ttccattata aaatgaatat gataataaac ctaatgtttt gtaatatatt 660
ttcagttgct aagtgctcta catattttcc ttccttgaat ggtgaaacat gtgtttctct 720
ctgcttttat ccagttagtt tactcatata ctggttctta ttcacatctt tgtcatgagt 780
aaaaagtgtt agaaaggcca cgagtaaata tgcattttat ttgtttatga attcaaatac 840
taaaagtttt ttatttgttt aattaagcat tgacattgtc tttttaaatt cttttcattt 900
taccttcttc cctcttcctt atccaactaa agacgcaaag caggaggtgt taaaaaacag 960
gtttaccata tcagcagtaa catagtttgg acaacattac actttggttc aatgatagac 1020
atagaagttt gaacagaaat atgcaaagca agtttgagct ctaacttgaa gagagcctct 1080
gggtgcctgc caggaaacct cacgagtgga cccttaacat tcatgtgtca ccacaaacta 1140
ggggctgccc tttagttttg accagtctca gtgtcactca cttaccctta ccttttcaaa 1200
aaaaagtcct aagaatataa agtaattcaa tggttctaca attttagcat gtaactgagt 1260
cacctggcag ggttgctttg gtgagctcaa gataaaattt tatcagcatt tctacatttt 1320
ctggaatatt ccttaatcca ggcttttaat cccttggtgc ttttctgaac cactgcaatg 1380
agcttctaac tgttctcact gtgtgcaggc tcttttcctt ctaatctaat ttacacactt 1440
ctgaacacaa atctctcaca gcctgtttcc ttcatgttac ctccagctca agactttttg 1500
cctacaaaat aaaattcaaa cttgttagct aagcaccttc tcatgtctat gctttggctc 1560
atatttcagc catcgtgtgc cccacttatt cttatagcca acctgaaaag ccatctttta 1620
taagaaacta cctctgctct ccatgattgg atataattaa tcctccttcc acatcacctc 1680
gccacaaaat tgtatctgtg ttgatctcat gccacatacc tgtatgtatt ttatattata 1740
aatatttgca gacttgttta atttgccatg ttagactaag ttccatgaag acagctccat 1800
atccattcca tttttatata tccacaacat ttggtcgggt tgatgcttaa taaatgttta 1860
ttgaaggaac aggagtctcc cacttctgac ataatgaact tatttccccc agtgttaacc 1920
ctacatctgg ttcctgtcca agagtctctt cccaaatcat tctgattcaa ctgttcattc 1980
tgatctcatt aaacatttaa atgatatatc taacttcgct tgctttattc tatgctcatc 2040
ctgcagtctc ctcataactt ggtttcaatg atgcttgctt ctagagaaaa aaatgtatta 2100
aataagctta tgattcagtc ctccagctgt gatggttctc actgaacatt agctcagtgg 2160
ttttcgaagt atggtctcta gcataaccta gaaacttgtt agaaatgcaa attcttgggc 2220
tcaccaagac atactaaatc aaaaattctg acattggggc ctagaaatct gtgttttaac 2280
aagcctgcca gtgcagcctg gtcccttttc ttctcggagc cccactcaaa gctttcagtg 2340
ctcatctccc accaatgaca gggtcctcta tggaaaccgg caggacggtt tccaactcta 2400
actacgtttt agagtttgct tcctagggct atccaggcac caagtatcac aggttagttt 2460
cccagggaag cagactctga gacttgcatg cagggagtgt ctctggggtg ctctcaacca 2520
acaccttcag gaagagaagg aagcagcatt gggcagaggc atagtcaaac tacagtgctg 2580
ttggcacaga agactgaagg gagtcagagc cagggggtag aggtgggccc ttagcatcca 2640
tccttcacca ttaggtgtga gttgccccac ctccttgatg gtgtaacctc agtcccaagg 2700
tgggtgggag tgcagcagag cagcccctac aagggccaaa ccagagatac accaggcgcc 2760
agaagtgctg ccagggaata gagaggaaag gatgggctta aggtaggatc cacagaactt 2820
ggcaatggat tagaagacag gatgagaagt gacaggttaa cactaacaca gaaatgtcta 2880
acttcggtag ataatggtgc cattggctag aagaggaaac cgaaatgaaa gcaggttgtt 2940
cagggagaca aaagttcact gtggacatct cagcagagtg attcagtggg gaaaggaatg 3000
gatgcccaga ccacctcaga ggaagatcta agctggagcc agcaataaag atacaagatg 3060
aacaatccct aacgaactgc tcctcagcca tgctccccag acacgctgct tcagatttat 3120
agtccgggtg aggctaggag gtgcgcctcc ctcagtggag gacagcaaag caccagtggc 3180
tccagggagt taaaatcttt tgataatttt tgttctagca tctgtctgca gagctgtctc 3240
tcagccattg cctgccttta cacaggagtg cagtccgaaa ttgggagatg agtgaaattt 3300
attatgccta gagatctgga tccccagttg tttgggagta tattttctga accacttgtt 3360
ggtttaagta atgcagattt attgatgcca cttctcttga atctgtgact ctggacccac 3420
catctaagtg aatgtgcaga gggaacggaa tggctgcaat agatctccat taaaaccagt 3480
gcatcctccc agacacatac agtagtaggg aggtgagtca atgtcaggac agcaccagct 3540
cccgcttcgg tacatttcca aagttctcag tctgtgtaca aaggtttgct ctggggcagc 3600
agaaatagcc ctgggcaggt agtcaaaggc ctggtttgat ttcctccact tccaggcaag 3660
tcactcgaag gctcacaggc tttttcctca cctgccacat gggtccagtg agatctactg 3720
agctgtaaat aatgaaatga gtgtgtgtgc agtcatctat aagttgtaaa gtactagaaa 3780
atggtgaaac tttgggattt gggctattta aggctgaatg ctaaaaatgt caggcattgt 3840
ggagaaagga atttaaatat aagattgatt gactgggatt taaagacaaa tgaaggcaca 3900
cacgcaagtg cacacccaca ctgacactgc acagctcccg ttggaggcat atcctgacca 3960
tgcagacctg gggctctgcc tgtccaagtg cactccttta ctacataaac cctccttctc 4020
ttttggggct gtcaccccac cagagctggc accgagccct tgctgctgcg cttccctggg 4080
gtgtcagctt ttgacagggt gtttcctccc tctgcaggag ccttaacatc ccttggactt 4140
ccttcccccc acccaccccc agcagtttta tctcttccta actcgggacc ctttttttcc 4200
cacacaaagt ttattgtcag ttgctggttt catctgtttg agcggctgca acaaaatacc 4260
atagactggg tggcatatgc acgacaaaaa tttatttctc acaggagaag tcaaagatta 4320
atgcaccagc agatctggtg tctgaggggc caccttctgg tttgtagatg atgctttcta 4380
gttaaaacac ctatttaaca cactattaaa cactaagtgt gttaaatagt gcagttgatg 4440
tatttgtcat gtcaccttta tcatacacta aatccttctt tgtctttttt tctgtactct 4500
aatctctttc tgtaagtaat ctttgcttgc agcagtagga tatttagagt actgtggctt 4560
gacaatatat ttagtatttc aagatttcca tgaaattctt ctgatgtatg agttccctag 4620
ttaatcttac atatgtatcc ctttgtaaaa acactttgaa catttaaaat gatacatgaa 4680
tagtactcta atacaatgcc ataaaaatta taaatcattt gtatagactg gtaagtaaag 4740
attgtgagat taagaaacgc atcaaaggcc attgagctgg aaagtggtat aatgagaatt 4800
caaaccaggg tctcttgact caaaatctaa ggatcatacc atttctcatg ataatatgag 4860
tattattgtt atctctatcc catagacaaa gtgttaacac tgaatgagca gtgaaatagt 4920
ctcagaattt tttattttat ttagcaattc acttgtcatt tctggtcctc agtttattca 4980
cgagtaaaat aaaatagttg gactagataa tttctatagt acattcttac acaaaaaatc 5040
tatgattttg ttatttttaa tgtgatatac tcatggcact cattcacctc attttcccag 5100
cctgcctcac tggtcattac ttctctgtgt tctttacagg ctccccctcc tctacactgc 5160
cattaaatat tgaaacacct caaagcttta cttatgtcca cctctcctct gacactatca 5220
ttctgtctag atgatcccat acatacatgc ccattacttc aacctgtatt tatacgccaa 5280
tgattcacta tatttccagc ctagacattc ttttgtactc tagttaccag cttgatatcc 5340
ttacatggct gtttcaaaac aactcaaata tattatctct caaaatcaaa ctcatgatgt 5400
ccccacacca tcctagcttt ccaccaacaa tacctatccc tattaatagc aataccattt 5460
attcagttat ccaaatcaaa aacctagaat tcatccttaa aattctacta tcattccaaa 5520
tatcctatcc atcagcagcc actgtattct taatcccctg tatttccttc aaatccattc 5580
acctctctcc atatccattg ctgcatgact atccaagcca tcgcctctac cctagggtac 5640
caaaatagca acaaacctaa tctgttcatt tgcattattt tttctccaaa actgattatc 5700
tatatgtagc aagacagatt gttctcaaat tgcaaatccc actatattat cctcttgctt 5760
caaacacttc catggtttcc cattgtttat gataaaacca aatgcttcaa gttcgaagac 5820
cggcatgatt gggaatttcc tgtcacccta gcctacttgc tctccatggt acagttgcac 5880
tggctttctt tcattcctta agtacaacct gtttcctccc acctcaggac tgtgcatgtg 5940
ccattcattc tgctgaggag cctttttcct tccacttcaa tcagctaagt ctgattcttc 6000
ctgacaatct cagctcaata agcatttcct ctaagaaatg tctctaatat cattaattgg 6060
ctcaggtccc tctactgtat tgctgcactt ttcacagtta taattttact taattatgaa 6120
tgattatttg attaggtcta tttccatcca ttagacataa gcttcatgat ggccagatta 6180
ctgttttcta tccatcgttg tattccaata cctgacagaa ggagggcggg aggtggtggc 6240
acacaagaga tgctcaaaaa caattgttga ataagtaaat gaatgaggcc atttagaaat 6300
aacgaaagta cctgtttaca aagtacatgt atcaaaacta tgaatgcatt ctacttacat 6360
ggttttctcc aaataaaaca aaagacttca atcaggatta atacctggga taaactgagt 6420
cattaaatct ctcctttgcc atcaggagtg acattgaaac aaatgtctgc aaacaacaaa 6480
tacttttttc ccaaaatata ttgaatggca tttccataaa caaactagaa catgggagga 6540
gaaagaaagc aatattaatt taaaattaat cttatcacat aacttatacc atcagggatt 6600
tcgggtaaaa ttcctttcag gcacatccat ttaacaagaa ttgattgtta ctgaaagcct 6660
agaagagaat ttggcacata cttggtgttc aaatatttgt tgactgagtg aataaatgat 6720
gcaagtgtct aagaaacaca aaataaggac atgattacag tcacggtgga gttcacagtc 6780
atctccaaaa tgaggatatg catcccaggg aggaccaaca attcattgga gtgctgaaat 6840
aaaatactca aaggtcattt tacatgtatt ttttctctaa attacttttc ttaagacaca 6900
gaaaacaaaa aaagaaactt agctttgtta ctttctaaca aatagttaaa tcattaaaca 6960
ggattgacac tagcatcctt gtttggtctt atgccttagg ggaacatgaa atgtgtgaag 7020
acattctgag atctgaggga agggtagaca gtaatacagt gggactgacc aggcttcagc 7080
acacctttac ctcctctcag cagatttcag tgatgagcag tttacaacta gattgaaaga 7140
ttatattatc tagttctaaa agaaaactaa gcctcccaaa agcaacaagg gaactgagag 7200
gaatcctgca aaacaaaaac aaattttaaa acttgcactt tgtaataacc ctaatatgta 7260
atcacagtaa tgaacagtaa gataatgaca gaactgacat atttccttat ctattaaagc 7320
catattaaca ggtaaagcaa tgccagtcag tggtacactt cttagaagat atttaataca 7380
tactagacac atacacacac acaacatttt ccttcaaggt gtatgtatca gaaaatcact 7440
ttttaaggcc ggatgcagtg gctcaggcct gtaatcccag cactttggga ggccgacgtg 7500
ggcggatcat ctgaggtcag gagttcaaga ccagcctgcc caacatggcg aaaccccatc 7560
tctacaaaaa tacaaaaatt agccagggat gatggtggat gcttgtagtc ccagctactc 7620
aagaggcaga ggcaggagaa tcacttgaac ctgggaggca gaggttgcag tgagccaaga 7680
tcacccattg cactccagcc tgggcaacag agtgagactc tgtctcaaaa aaaaaaaaat 7740
cactttttag ataaaattca tgctatagag agaagactat gaaaatatgt ttagcaatgt 7800
gtccatcatt aggtgattga gtttcctttt gttttgtttt actgaaaatc atataaagta 7860
tgttatctgt aaaagttctc tgacatgcac acataaaaat ttgggagaaa agattaacta 7920
taatgtttaa tagattttgt acacatttct ttaaaaatat ataaaacaca acacctttca 7980
attggtttgc aagaataacc aattgacatc atggaaaatg gaaattcact tgctgaattt 8040
taacaaaaat ttgcatgatg agtgagactg acaacttagt gtcatgattt aatgaattat 8100
gccaatggta aacttcatgc acatggggcc aggtaattat gtggaaactt tttcaatgct 8160
taaagccaag tattgaaatt aaacttagaa tcagaccttt gaaccatttt atgacaatgt 8220
tcaaaaatta taaattctat ccacttatat tataatatta aaaatatcat tacaaaaaaa 8280
acctgtgttt attttataac tcagcctttt taatttctaa tttcataaat atattataat 8340
ggatattgtt agtaatgtag tattattaca tgtatataat ttataagtaa atatacatgt 8400
tttggctact catgcataaa atgtttcacc cataggagca cataatcaga aatgtctgga 8460
gaccattata gtaatagata gatcatattg ccacatattt tatctcctcc ttgacaactg 8520
agctttccag atcttctggt gaaacgaaag agaaagttgt aacagaagag tgattaaaat 8580
gacaaaagca ttacttctat tacttctatt ctaataatat gagcaaagct ataactatca 8640
agtaataatg cactaaagaa ggtgattaat ctgatatatt cacaggcaac taataagacc 8700
tttctattgc agccatgaaa aatatgtgac aattatagat atcctgtgtg cagtgtttca 8760
acctttatgt gacctgttct actaacagat ttagtgatgt tcactttgtt agaattttct 8820
tacacatgcc ataacttgct tcagtctttt gattatgaat attatggata ttaaggattc 8880
tagactattc tagatttaaa aaataatatt gtcacctcaa tcagaaggga aatattaaat 8940
agttctcatt ttttcaatgt ttactcagtt tttgtccaat gtaatgaaag tgtcagcagt 9000
acaggttaca aaataaaatg tgtattaaag taaactcatt tgaacaggtt aataattgta 9060
gagggaggga aaaggctaaa agattgaatg taaaacttat gaaaagtaga tacatcgtct 9120
ctatgatttg cagtagtcaa ctgcatacag atgaatcatt ttaatacacg ttaactactt 9180
tccttttaca gatggagaaa ctgagaggaa gaaagtttat atggttcatt aaactttgtg 9240
atgcaagcta aactaacctg tctctgtatt ttccatctac tgcccttatc actatctcat 9300
tagaatactc ttcaagcatc tccttactga ttttcttacc aagcatttgt taagttctaa 9360
tgagagttgg tagtaacatt ttcacccact ctgtgaaata tgaaatctta ttcataggcc 9420
tcttctttta ttcttgtatt tgcatatcaa ccaattaatc aacttgcttt ctttatgttg 9480
cttattatct tagtccttac taaattgcct cttaatgttg tccacataac agaaatgtta 9540
aggtggatac ttaacatttt agtccagtct agccggtgcc agtgcaatgc caaatcatga 9600
attaaaatat aattacaaga accacttatc aaattttaac aattccttca gctttgtgac 9660
agttttttct acttcgatta aagtcaagta aaattaaagt taaatatttt tattaaaata 9720
tctcctttaa cattccatat taataaacat attaaagctc atgcttctaa gtagattact 9780
agaagttact ttatcgaatt acagcaatgg ttaattctag atcatagaat ttagaatgac 9840
tttttgcctt cttctttttt ttcctttttt ttaaacagag tcttgctctg ttgtccaggc 9900
tggagtgtac tggcgcgatc ttgactcact gcgacctctg ccctgcaggt tcaagtgatt 9960
ctcctgcccc agcctcttaa gtagttggga ttacaggtgc ctgccaccac acctggctaa 10020
tttttttttt gtatttttag gagagacagg gtttcaccat gttggccaga ctggtctcga 10080
actcctgacc tcaagtgatc cacttgcctc agcctcccaa agtgctggga ttacaggtgt 10140
gagccactgt gcctggcctg actttttgct ttcttcttaa tacttactag tatttcttga 10200
atttttaaaa aagaaacata aagtactttg ataaaaccaa cagtctcatt gttcttaaaa 10260
ttgttcaaag gttctctgga aaaaaaaaag aaaattatca tttggttaag aatcatgttg 10320
gtctgacatc aatcatccta taggagtgaa tattgaaaaa gtaagatata ttgtggtata 10380
atcgagattg cataaatttt accatttttg agaagaatct gctccaaatc ctggcttaat 10440
gtaatatcca gcatgctact taattttctt gtcttcacct tttcatatcc acatccacct 10500
aggtgccacc tcacagtata agccagcata atccattctt ctcaatgaaa ccacaataca 10560
tctgaccctg catctcagga gaactgtatc agccacagca cttccagttg actatgaatc 10620
tgaatgttat gcctcaggag aaacatcctt gctgggactg agtagtgatt caaggagata 10680
gttatgattc agtcaagaaa ttaataatta gtgttatttt tattattgag acagagtctc 10740
gttctgtagc ccaggctgga gtacagtggc atgatctcgg ctcactgcaa cctctacctc 10800
cccggttcaa gtgattctcc tgcctcagcc tcccaaataa ctgggacagc aggcacttgc 10860
caccacgcct agctaatttt ttgtattttt agtagagacg gagtttcacc gtgttagcca 10920
ggatggtctc gatctcctga cctcaaggtc cacctgcctc agcctcccaa agtgctggga 10980
ttacaggcgt gagccactgc gcccggccat aaattattaa ctgagccagg cacagtggta 11040
cacacttata gtcccagata ctcaggagac tgaggttgga gtatcctttt ttatgttatt 11100
ttatttttaa ttattatggg tacataatag gtgtacatac ccatggagta caagtcatgt 11160
tctgatacag acacataatg tttaataatc acatcagggt aattgggata tccatcacct 11220
caagcattta tctttctttg tgttaggaac attccacctc cactcttgga ataggcaccc 11280
tgttgtgcta ttaaatacga ggtcttattc atttcatcta actatatttt tctacccatt 11340
aaccatcacc tcttttcccc tcttccccac tacctttcct gtgaggctgc aggattctta 11400
agcacaacag ttagaggcca gcctggacaa catagtgaga ctcaatttct aaaaaataaa 11460
aaagaaatta ccaactaatg ctaaaaaaat agtctctgat gcttaggtat gaattagaaa 11520
tgaccaaaaa aaaaaaaaaa aaaaagactg ccctttgctt ccttctcccc ttctcttcaa 11580
gttttccatt gctactcatt ttagtctggt ttaatcaggt ttcatccatt aaaagcaatt 11640
gttgggatca cacattttga gttgtgtcag tggacttccc tcatgctggc atgattcctg 11700
ccccaagccc ttagtaaaag ccaccaagcc atataacata atctctcatt gagtaaaaca 11760
tctgatgtgt ttagaatgac ttctagcaaa aaaccagcct gtccagcatc atctctgtat 11820
aacagataaa ggaataggta ctgcatcaaa aggttataga acctgcccaa atcaatccca 11880
tgtgttttgc aatggaatta ggttgaacta aagtgaaaat tcagttttct actcctcatt 11940
aacatgtctc atgttgcaag gttgagagga aggagaagaa gaactgtatt tacagagaga 12000
ttccccctct ctttctttct acagattact aaaacattca aagaatcaaa tttaagaaat 12060
cagttcatca gagctcatgt tgccaaactg aggtgagtgg aactgtagaa aaaatattta 12120
agtatagata caatgtggca tacttgactt tttgtcacag aatgaatagt aaatgacatg 12180
ttcagataag ttgttgtaat attatgaaaa tagtatttta gtcagcttaa aaaccaatgc 12240
caaaaaagcc aaacatatga tctatttagc tactaatgta aataaccata ttatatctat 12300
tcttattggg aagaggaaga aggggtggag agagagttgg ggtgaaggta cagtaacaag 12360
gccatcctat tgtaaaactc cagtggatat cattcacagt gcagcctatg taaacagtcc 12420
ctcctggagt tgtacaatgc tgtggtttgg gtgtatccat ccaagatcaa gacactatga 12480
ccaacatcaa aagtggcttt ttggttttat ctgcctgatg tgctataata aaagggtatt 12540
atggccaaat ccaaggcatg tctatcatga attaataata ggaggagtag cagcatgcat 12600
gctagttatt tgccattcct gccttagtta aatatgatgt gataaaacca gcctttccaa 12660
ctgaaatagt cacctttact gactctcccg caaatgtctc aaatgaccac attgctctag 12720
tctttaaata atatgcaata gttctttggt agaagaggaa ttatactaat tctttctcaa 12780
atactagcat cacaagaaaa ttaattcttg ttctctggag agtcacctag taagtatctg 12840
gagcacagat gtctggtcag gtaagttttg atgaggagtt aaagggataa gaagagtcca 12900
tgagaagggt attttccaaa acacctttcg gtcaattcag tgcacattca cttagtactt 12960
tcttgtcagt atctgtatca gccactaatg ttcaaaagtg agtaagccct gaaaacctgt 13020
aggactacat gagccttctg ccttttctct ccttttgttc acttcccact tatcactcaa 13080
tcctctgcaa cctggcttca ataccaccat aaaatatcaa ctgctcttgc cgattcaaca 13140
atgacatcca gataacaaaa tccaaagaaa ccacatcagt cctattcttg gacctttcaa 13200
cagtatttgg tcctgttggc ctgtcactcc ttgaaatagg actatccctt ggtttgcatg 13260
gccttgtata ccctgatttt ccccttacct ccctagctat tccttcttag tttcctttac 13320
taggtcttac ttctttgtat attccttaaa tgttgctgaa catcaggctg tgctctaggc 13380
ctctcatctt ctcaggtcac actctctcct ttccttggcc ttcactgcca cccatatgct 13440
gagtgctctc aaagttgtat ctctaggcca gtcctctttt gcctccaaac atgaatatat 13500
gcagccatct acttggtacc atcacatgga taattctcat gatctcttcc agtatgactg 13560
cttctttatt tttttctggg ctctttttta gcattgcttt acatggaact ttatcatgtc 13620
tctcaacctc tattttatct tttatctatg tatgtagagt ctgtgtaatt tcttcatctc 13680
ttttagataa ctaatatctc ttcagctttg acttgtattc tgtgtaaccc atttattgcg 13740
ttttcaattt caatgagtat gttttcctat ctgcaagttc tatttgtttc ttttgagaat 13800
cttcctggtc ttttaaacac atttcttatt ttaatttttg ggggtaccta gtagttgtat 13860
gtatttttgg agtacatgag atgttttgat acaagcaaac aatgcataat aatcacattg 13920
tgtaaaatgg ggtatccatc ccctcaagca tttatccttt gtgttacaaa caatccaatt 13980
atattctttt agttattttt aaatgtacaa ttaaattatt attgaccata gtgactctgt 14040
tgtgctatca gatactaggt gatcttttaa aaataatgtt ttctacttaa tctcattttt 14100
atgattccct cttttacgtc atttgtcatt tcaaatacag tcacttgtct gttgattcta 14160
ttatgtgaag tttttgagga taatcttttt gttactttga ttccaccttg gtatggtttg 14220
gctgtgcccc cactaaaatc tcatcttgaa ctctggttcc cataataccc acatgttgtg 14280
ggagggacct tgtgggaggt gattagatta tagggacgtt tccccccttt gctctgttct 14340
ttttcctgcc accatgtaag aaagatgtgt ttgcttcccc ttctgccatg attgtaaatt 14400
tcctgaggcc tccgcagcca tgcaggacct cttttctttg taaattaccc agtctccggc 14460
ggttctttat agctccgtga gaaaaaacta atacacacct catgatgtat tgtttaccac 14520
tgaaattgta tgcttaaatt taatctcact tgggaccctg tacaacctag acttaacata 14580
tctacctcca gagcagttac atctgtcaga cattctagag gaatcagcag cacatggact 14640
ttgttgttgt taatttgttg tcgggggagg ggggagggat agcattagga gatacaccta 14700
atgctaaatg acgagttaat gggtgcagca caccaacatg gcacatgtat acatatgtaa 14760
caaacctgca cgttgtgcac atatacccta aaacttaaag tataataata ataaaattaa 14820
aaaaaaaaag gttctgggag tattcaggta gtattaatga agattcagac atcgtgcagc 14880
caggcccatg cttatgaatt ttcaggtgat acttcttttt cttttttctt aatttaaagc 14940
tggatctcgg aaacagataa atttattttt ttatgacatg acgagcattt ttttcattct 15000
agttcatgct gttattgggt gtttagttct ttgagactcc tggccttttt ctaaaacctc 15060
aagttcaact tcctattttg cactggccca aggtcccatc tccagtctct atgtaaatgc 15120
taaacataag cctgtggaat attctagtct caccacatac tattcacatt cttctttgtt 15180
tttggtcttc caggattttc cttacttttc tatgaaccca gtcttgcatt tgaaatggaa 15240
tttattatat attatctatc ctttctattt gttttatgca gaaagtgttt tctaaaatta 15300
tttaggcttc catattgcta gacatggaag ttgtaattat ttgttcagtg cctgtttcta 15360
catctaaact gcaagaccca tatggcaact gtgaatctta gtcccagcta atttctgaag 15420
cttagaatag tgcctagcac aagaagttgt ttatctaaca tttttaaaaa taaatattaa 15480
attcatatct ggaatgaata ttaagttaga gctggtcatt gaggtgagag gaggaagcca 15540
agagagaata tgagagcctc aaagccaaat atctttaatg tactttttca gaaaagaaga 15600
cagccaatgt caggtggagg aactggttta tgaggtaact ttcctggaag aaaatagaaa 15660
ttactgaggt tttagataat ccaaatattt aatcaagtca ccaaggttta ttgtggggaa 15720
tctttattat taattaaaat gagtgatgaa atcttaatat acgacaaaag ttaaaatttg 15780
cttttgcagg cagatgaatg gtctaggtat caaaaaatta agttgagtct ctaactcaca 15840
caaatttaca accctatcac tttatgaatt tgtttaggag attattttta ataacactgg 15900
tgaagtctaa gaatagctaa aatttatagt acacttattg tgtgctattg actcttcttt 15960
gaagttttgc atatagtgat tcatctaatc ttcataaccc attttacatg tgaagaaact 16020
tagatataga aagattaaga aacttacata acttatccaa agttacacag taaaactctg 16080
gcattataac ttcaaaatca gctatcctac agtgagtaca gtgttctgtg cattgaaatc 16140
aaataagtga gatagcatcg tgatatagta ttacgtatgc aaacactgtt acagagatct 16200
gtctaaagtt aaattccaca aatgaattct ttaaaagggt ttaatcaaga agaatatata 16260
aacaggatgg tgaaaaattg tcatattatt tgttttttaa aatatcttta tgatttacag 16320
gcaagatggt agtggtgtga gagcggatgt tgtcatgaaa tttcaattca ctagaaataa 16380
caatggagca tcaatgaaaa gcagaattga gtctgtttta cgacaaatgc tgaataactc 16440
tggaaacctg gaaataaacc cttcaactga gataacatgt aagtataatt tttcataaac 16500
aattttattt caatatatcc ctcaagttta ccaattcaaa ttcatatttt aattgagagg 16560
ctgacttttc tttctttgaa actaaactgt gaaaacaatc cattaaaaag ctaaatatac 16620
catatagctc cctaacgtaa atcattctaa gacttaaaga atcatttggc atttatatag 16680
taaattttat ttgctaaaaa ttctcattaa ttatccctgc aacattcctt atgagtgatg 16740
ttactgtcag atgtcattag tggataggcc ataggagggg tacatagatg ctcaaggtca 16800
gagaactatt taattaatga tccacctcag aggcttcttc atttttcttt gtaacattta 16860
tcacaattga aattacaaag ttatctgtgt aaattttgta ttgtttggct tcatcctaca 16920
ctgtaatcat cctaaaagaa agaaccagtc aaccttcttc atcctactac cctcctacca 16980
cccagtctcc atcatataac acatattcaa taaataattc ttgcatgact gaaagaaaag 17040
aaataatata tgcatagaat ttaaggacat tcctccaagt tggttacatt ctgctagttt 17100
aataagccat tatttcttct cgatgagctc aagattaaaa ggattttgat gattcccata 17160
ctagactggt aggtaccagt tacagatgta ctaactgtta aatattgaaa tgctttccta 17220
tttgttggta aacaattact gcatcaggcc cacaaagttg tcttccgaga tgtttcaaat 17280
ccactgcccc tgctgctaaa gagttatgct tagcaaagca aagcactcta agacactgct 17340
ccaactccat ggcctgattg catcttttat gactggccaa tgctcacgca ctgcagtttg 17400
ttaggtagtt gaatattacc tctgcttcca cacattaagg aatgctcccg aacgcacttc 17460
ccaagtgttt atttatttat cattatacta gacaatatgg tgatacgatg gtcacagaat 17520
agcggtttcc acctccagag cccataatct agttgaaggg aaagatattc caacacaaga 17580
gtgttgacaa tcaagataga atatgatcaa gggcccagtg tgaggcccag gcaatgatca 17640
ctgcaggaat ctggggaaga aagagaccag cgtgcttggg atatctagca aaagtttcat 17700
gaaggagaat ggactttgac tttgaaatat gggtaggatt tacatatttt gagatgagaa 17760
aaagaaagtt cccagagaag gaaagcatga aaaggcaaac agtctgtact gaacgcgatg 17820
ctttgacaga ataatgaaga aagggacctg ctggaatgat tgatcagtgt tcatcattca 17880
caccatcatc atcaaaacac ttatttaatg agaacttact gttttttagg catggcttta 17940
atgccctata tgaatttttt tcttgattaa tccttacaac aaacatatcc catagatagt 18000
tttattgtcc cccttagaaa agataaattg cctaggctga cacagtcagt atatgaggca 18060
gtcaggattc aaactaagtc tgtttgttca aaaaattaag aatggccagc tttttaaaat 18120
tttctgtctc cagaagtatg atttggctcc actgaagttt gcaaaacaaa tgtgataccc 18180
aaaccttgtg aaacttttag tgggaaataa ctttgcataa gtcggtttga gagagcgtgg 18240
aaacctgtct tgaaaagttt taatttaact tgcaggaaat aaaaatgatg ggtttctcaa 18300
ttaaaaattt caatcaagga aggatatgag ctaacataac atttttttaa aaagatcagt 18360
ctggtaaggt agaggtgcat aaactgaaaa ggagcaaaag tggtggaatt cagttagaaa 18420
attattgtaa ctgtactgat gtcaaatgat gaaaccatga actaaagtag taccaaaagg 18480
agtgaggagg atggaataat tcaaaagata gaggacagat gtgcagaacc tggagattat 18540
aagatgtgaa aggaggagtt tgagaaaatt tcagattttg gaagtggtgt cattttacta 18600
aaaggatata ataagtagca aattttggat aaagttgggt cccactgagt ttgagatggc 18660
tgttggacat gcagagaaaa ctgtcttgta tgctgttctt aaattgaaat agacagacct 18720
ttaccctctg atactgacat attttccttt ccaggctcac cctccatttc cctaaacaca 18780
acacatgcac tagctctcct tactttattg ctccacaaac atcttacacc tccaagcatt 18840
tgtgcccact gtaccttcta tctggaatct cttttgtcct cttgtgtgcc tgaaaaattc 18900
ctttcagatc ttcaaaatac agtgcagatg ctatttcttc tagctcaaat attatctcct 18960
ccatataatt taattactct cttttttctt ttctctactt tgcacttaca tttatttgaa 19020
tgattgcttg attaatttct acctgtaaat tatgtgaggg caggtcctct atattttgct 19080
cgcagttaaa tctgcagcac ttattataga gtggtatcat tagagtaata tacatatatt 19140
tgaggacatg ataaattaac ttcccctata gtatttatca cattgcatct caatgacttg 19200
cttatgtttc tgttttccca tataaattga gtaacttgaa aaaagagata tctattaagt 19260
atttaatgag aaattaaagt acaaacttta gtatgcataa caacaaattg ggaaaaggtt 19320
gtaaacaaag agatttgtag ggcccatgag ttagagatcg tttcagcagg tctgaaagga 19380
agcctaggaa tctgcatttt agaggaccac ctcccaaccc caacaagtaa ttctgcttct 19440
tgttgtctgg gtactgtact ttaagaaatt atggtgaaat gatatcagcc tttattgtat 19500
ttatcttatt ctcatttttt aatactagca cttactgacc aggctgcagc aaattggctt 19560
attaatggta agttttaata ttattttgta actgtaattt gccaaatcat aaagagtaaa 19620
agtgcaagtc ttttgtgtac ttttggccaa ggcagtatct atcaagttga tgtctttgtt 19680
cttagttcgc tcaggtggtg ttgaaacaag acagtgctga tcccaagtgt cccatggagt 19740
ggactttagg tttccccttt ccttttagaa aaaggaagaa gttgtagtgg aggactaccc 19800
actctgcact caaaattgcc ctcatgaaaa tttctttggc agctttgaga accttttact 19860
gccctggttc taaggtggca tttctgtaga cttacaaatt atgtttgatg acaccgttta 19920
tgtagcttct cctaaccacc agagtagctt gctttgttgt gaattcaggt taatcacaaa 19980
gtataataaa aaagaattgt cagaagtctt cccagctttg ggtctataac ctgaaggaaa 20040
agtcactact cttcaacatc atcctatgta ctctcaggct aggatagcag aaatgcaatc 20100
cctagaaaac agcaacttac ttctctgacc aaaaaaatgc agttaaaaat tagttcaatg 20160
tacctggtag ctggcctatc ttaggtactt cagtgatttt acaaagtgat ggtagtccta 20220
tgggtgtttt tcagcttcac tacgtattta attcatgctt attgttaatg aaactgtgat 20280
aagcaattta ctagggtatt tgtttgggag atgccacaaa ggaacacatg tatctcttaa 20340
tggaagcctg gtcctccttt atccaggaaa tttgctagga aaaaaaagcc tttaggtggt 20400
tgtgctatta aaccagggca ctacttaaaa gccagcccag caatagttgt gtgatttacc 20460
attaatttct tagtaataga ccacacaaaa gaagaaaatt atgggaatgc gagttgagag 20520
gaattgggtg atcagcctac cccagcccgt ttcagctctg gccagtagac tattcacgag 20580
ctctttgaaa acatttaaat aaaccttatt tagatactag aaaccctctg tcaccctcaa 20640
gaatattctg tggtatagcg actcctttat gagggcatgt ttggtaatac agcatcagtc 20700
ttggaggtgg actggattct acaaggtgaa ctgcagtcac taaggagtct tttggatgag 20760
accagttttc ctccaacttc aatgtgtgca tgaacctcac atcaaaatgt agctttagat 20820
ttgtcccatg atgtggttcc aagaatcagc acttctaata agtttccagg ggatgcccat 20880
gctgcaggcc cacaaaccac actgagcata gcaagactat tgagaaaaag gaaatttccc 20940
aggagtctgt ggcctgagct ggcacatcca ataatgacct atcttaacct caactcatga 21000
ggaattccag ggaactctga agctgctcaa aatttgaagc ctatatgcca actaaattca 21060
gaaatgttct ccaaaatgct atctataagc aacagtagtc acaaatgcat tgtagaaata 21120
tatcgatcat gctttttgga aaatccagca tgtcctgagg aagaatgtat aagacataaa 21180
agtcataaat tatggaaaga ctcttcagct tcttccaaat gtaaaggaat catgatcttc 21240
ccagcacatt aatgcccttt ctcattagaa tgtggggccg gtccagacct aataacattg 21300
tctgagcaga gaatccttgg aggcactgag gctgaggagg gaagctggcc gtggcaagtc 21360
agtctgcggc tcaataatgc ccaccactgt ggaggcagcc tgatcaataa catgtggatc 21420
ctgacagcag ctcactgctt cagaaggtga ggccaccact acctacccat ctgggaacaa 21480
ttagaataga caggtcatga agactgcacc ctctacccta ggattgaatt gagccagaaa 21540
taattcaatg caaaaaaatc agtaagaatt ttcttcctat tcatgaaagg aaaaggattt 21600
ttccccttta gcatgctaat ttagtgctat ttctctgttt caggtaataa tatattagca 21660
cagtaaagaa caaagattta tatgtcagaa tgttttttaa atcctagcta taaaagctta 21720
agaaatttac taaatctcca taagctttat tttttttcca aattaaggga caacactgtt 21780
atctgtgact tagtgttact ggtagcattg agtacactaa tgtaaacata cgttaaatgt 21840
tagcgaaacg aattgctgtg gaagatttgc acattatatc atgggagctg atggctaacc 21900
tagagactgc cccatgccat taatttattc attcataaag attattgagt atctagtatg 21960
agcacagtgt tatatattgt agaagctact agtataaaca aagtattgcc tctgccttca 22020
aagagcttac actcgaatgt tggaatcaga atgcacaaaa ataatgatca attacaatga 22080
gtagcataaa taaaattaat gtaggcaact tacaagaatt cttaattgag gtgactaaac 22140
tattgccaac actagggtga tatgctacca gtggcgagta ggttgcataa acttacctta 22200
ttggtaaaaa gaaaagttca cattgctcat aaaagaagga ttttagattt cagcataact 22260
aaaatctgtt tcaaacctgc cttgttactg gggcatcgca gaccacaaca gttgttggga 22320
acttaactca aaaagttcac ccagaaaaat aatggagatt tgaactcgtg tgcccctgac 22380
catatcaatt ttcttctcag actcttactc taaactggac ctccttatca cacacacaaa 22440
gccttccata ggcagatcaa tccagtctta tttctcaaag catgtacctt gagcttcaga 22500
taaacagcat tgttctcttc ccctggactc ttcctacatt tccctaccta tgagtatctg 22560
atcaatctgc ttatccttga aatgttaata tatttaccac atctctattt gaattttatg 22620
aaatttttga taatttctaa gtagtttttt cagatttata ggcactactt catggtacag 22680
tgactgttac aaacgtattt gttaaattta gaaggaataa agatttaaaa gactagggta 22740
gttactgaac taaagtttta ggaaatccca aattatttca aatttttctt atggtaattt 22800
tatgacttaa tatttttata tgcagtgaac aaatttgaaa ctttaaaaga tactcccaga 22860
attatcagtt ttctgatgta gattggcaaa tttattacta tatcccaaat aacccaagag 22920
acaaaattca caaaaacatt tcaattttca ttgccacttg aaaggccaaa aagcagaaat 22980
ggcacgcatt gatttcaatc gtactcttga gtgtgggaac caggaattaa aatacctgga 23040
cttatcaggc acttagcata accaagaacg gaatagaaac ctccctggat tctaagccct 23100
attcagtccc aatcaccaaa aaccaagtaa acgatatcac tataatgaaa gccacagtta 23160
taaatatcga caacgattac caaaggaatc catggaactt tgaattttgc caccccacat 23220
ccttctattc attaccatga ttgatccact aaagctaaca gactctgtga accttgtatt 23280
ggacccctcc ctaaagacct gattgtcact gagaaccatc agtgaggatt tgtttggggc 23340
atgaccagcc ttacatcaaa gtacatagaa gtgatgaggt cttatcaaag aggattattg 23400
aattatcacc tcttctatgt agctttccct gatactctct ttcctctcca ttgagttcca 23460
cagaaatttt tttatctgcc tttaacagtt gtcctcatga tttgtgatat ttgacttacc 23520
tcttgtcagt ttccttcact agtgtagagt tcctcaaaga aagagaccat aattacttat 23580
atttttattc ctggagactc atactattcc ttatacaaag tagacactta acaatggctt 23640
gttgaactat aattaatgaa aataatagct accttcatga aagttcactt tgtgccaaac 23700
actatagttg acataataca tttgtctcat taatacttaa caattgtgtg agaaggtatc 23760
accaatcaca ttttatatgt aaataaaccc cagagctatt aattaacttg tcataaataa 23820
cacttttcat atgtggcata gccaagattt aaatataaat gttactggtt ccaaaatgat 23880
gctctaattc acttgctgga aagaaggaaa ggaagaaaat aaacgagtgg aaggaagaga 23940
gggagggaag agagaaaagg aaggaaagaa aaaagagtct cttcagaacc ttcactgtaa 24000
agactccgag caaaagaagt tgaatataaa aacaacatag gtttgtttgt tttctaatat 24060
tttttcttca aaatttttaa ctcaggttca ctcttacaca aactactgtg tcttataaaa 24120
gtatttccgg tcatagaatt tttattttct gtattaactc cactatctaa tctccataaa 24180
actcctaaat tggtattatc ggtaacattt tgtttttact caacccttag gaacaatgtt 24240
aagttaatca gccctccaca tcacagatcc ttattttcat cagtctgtac aaggcatttc 24300
tctcatttta attttttttc ctcctgtcat ccctggattt cactttcact gccctccttc 24360
cacccatatg cctcatacta atatattcga aatatacatg tcttaaaggt acatgcacgc 24420
acctacaaaa cctatagtgt ttttttgtat gtatatgtct ttaatttaaa taagtagcat 24480
tgtgtaaaag tctaatattg tttcttactg ttttcactca attcttggaa ttttcatctg 24540
atgcactgct gcatagcacc ccatggtatg cagccaccat atttccttca tccaattagg 24600
ttgcatgacc taccttccca ttgccacaaa gagtacacac aaaatatttg tacttatctt 24660
tctgtaaacc ttcaggaatt tcagaagcac acatgcaggc tgctaaatat accagaatac 24720
tttccagcca cttaaatctt taccagtatt gcaaaagagg ccccatttcc ctccacatca 24780
acatttagta ttattctttt gtttaagttt tatcaatctt ttaaatgtac acaagatgct 24840
catttttata attttaattt ctcagattac tagtttgagt atcttttcat atatctaaga 24900
gctgttttga tctcccctac catgaactgc cactaatatt ctttgcctat tttacaatgg 24960
tttttctgct tatttattac tggtttacag acttttaaaa tatattctac aaaaatttta 25020
gacattaaac attaccaata ttttcccatg gttcctcatc catctggtaa acttgtctat 25080
ggtatatcta attttgattt aatagaattc attctatttt taccttttag tttgtgtttt 25140
tgttgtttag ccaaaaagtc cccattccta ggtcataaag gtaatgtcct tttttttttt 25200
ttaacgctac tgttctctct ctgtctcccc ctatgtatat aggtgcacat atacttgtac 25260
acacatacat atacctatat atgaggggag ttcgataagt ttatggaaaa taaaattaaa 25320
agataaaata aaaaattata aactttattt ctcaacataa gctccttcaa gttcaagaca 25380
cttttgtaag caataatacc agccatatcg tccatcccta aagaactgag ggtcctgaga 25440
atttaactat gtcaatgcag tcttttttac attacttttt tacagtactt attgatgaaa 25500
aatgggtgcc ttttaaagat tgttttaaga ttagggaaca aaaataagtc agaggaagtc 25560
aaatcaggac tgaaaggtgg atgcctagtg atttattgct gaaactttca taaaactaac 25620
cttatttgat gagaggaatg agcatgagca tggttgtgat ggagaagaac tctggtggag 25680
ctttcctgga cactttttct actaaagctt tggctaactt tcttactctc ataagaagaa 25740
gatgttattt ttcactgacc ctttagaagg tcaacaagca aaatgccttc agcatcccaa 25800
atgtctgttg tcatgacttt tgttcttgac tagtctggtt ttgctttgac tggaccactt 25860
ctacctcttt atagccattg ctttgatggt gctttgtctt caagattgta ttagtaaagc 25920
catatttcat cttctgttac aattcttcaa agaaatactt cagaatcttg atctgacatg 25980
tttaaaattt ctattggaag ctctgacctt gggtgcagct gatctgggcg aaacagtttt 26040
ggcatccatc aagtagaaag tttgctcaac tttagttttt cagtcagaat tgtataagct 26100
gaaccagttg agatgtctat ggtgttgtct attgtttctc acagttaatt gttggtcctc 26160
tttgagacat gaacaagatg aaatttttcc tagcaaactg atgtggatga tctgttgctg 26220
cgggcttcac cctcaacaac atctctttct ttcttgaaac aaattatcca ttagtaaact 26280
gatgattggg ggagatgctg tccccataaa ctttttgtaa ggcataaata atttcaccat 26340
tcttccagtt tcaccataaa tttgacgttt ttttgcttca attttagcag cattcatgtt 26400
gctttgataa gagctctttt caaattcatg tcttattcct cttagtgcct caaactagat 26460
cttgttcagt atgacaagtt agtatgagtt tatctgcatg caaaaatctt tgaaatccat 26520
gcatagtttg tttataatat acattttcaa tgaacttttg aagaccccat acatacatat 26580
gtatatatat gcacacacac acacacacac acaccaaaat cttcaaccat tatcagactt 26640
agtgcagaaa aattattcat ccattaacaa gataagaatg ccccttatca tcactactat 26700
ttaaatggag ctcctggcta aaggaaaaga cagggattga aaaaaattag ttaaatctaa 26760
aatgtttatt atttcaggtt tcttagttgc ttaaatggga agggaggtat ggacaaaaga 26820
gaaatcaaag atatttgtgt tatgctactt atcattaaag tatcagaata acttcattgg 26880
aatagaaaaa caccaagatc accccacgat atgttttcta aaatcttctc catttcttta 26940
gacaagtgac catgtattcg gccagtgaag aattaaactc acttgccagc ttataatgca 27000
ggaaaatata gcaaagagat gtggatccaa tagtttctag atagtggtac aggatggcta 27060
agatgaattt atatatctga aatgttcaca aattccctac tcatatagca tgttttcata 27120
atgttttagc aactctaatc ctcgtgactg gattgccacg tctggtattt ccacaacatt 27180
tcctaaacta agaatgagag taagaaatat tttaattcat aacaattata aatctgcaac 27240
tcatgaaaat gacattgcac ttgtgagact tgagaacagt gtcaccttta ccaaagatat 27300
ccatagtgtg tgtctcccag ctgctaccca gaatattcca cctggctcta ctgcttatgt 27360
aacaggatgg ggcgctcaag aatatgctgg taagtgtctc ggaaaaaaaa attaacaata 27420
gaaatgtctt atatttgcta ttaggtaatt ttttaaatta ggaaacatct ggaataggtg 27480
tttctattct tctacagaca gaaccattct atattctgct cagcccaagc tctggctacc 27540
cctgagtctc cttagcaaag caaagcaatg ctccagaaac tatgggaatt ctcaaatata 27600
gtaataggaa aatgtaaaag aaagttatga agacacgagt tctttaataa tccagagatt 27660
ctataagatt caaatagctt ccctataaac aataaaaaag attttgtttg tttgtttgtt 27720
tgcttgtttt ttagagacaa agactttctc agactggagt gcagtggtgc aatcatggct 27780
tactgcagcc tcaaactctg gtcttaagaa atcctcttgc ttcagcctcc caagtagcta 27840
gaattataaa taagtgtgta ccaccatacc cagctttttt tttttttttc tacagacagg 27900
ttcttgctct gttgcccagg ctggtctgga attcctgccc tcaagccatc ctcctgcctt 27960
gttggcctcc caaagcaatg ggaggattta gattagacat tgtatgaggg cttaataatc 28020
cttaaggtat taactgccct ttaaagtatt ctgggatatg gcaaaaactc gatgtgtata 28080
taaacattgg tcatatttgt ttattgaatg aataaaatgg aaactaaaat gaggacaatg 28140
cacaagagct actagaacca gtaagagtat cagcgaagga gtggaagggt agcattgaca 28200
atttccctgg gcttttaccc atgttgtaga ttgtctctcc aaggaataat acaaagcctt 28260
aatagtccta gaacacattc tattgtgttc ttatggccca aagtaaattg gtgtagtaga 28320
taacatttgc accagtcatg aaaaactatt ggtgtcattc tgagagtaca tcaatataaa 28380
atagactagt tctttagcct tgaaactaga ctggtttctc ttttgctgct aggttaaagg 28440
ttattcaata tgtaatcttc caatccaaaa tctgtcagtg gataatttaa aagcttttag 28500
tcaattttaa gatatttgtt ttcttaaaat tttaaggggc actgtgtcac aaagctaaag 28560
aaaaaaaaga aaaaaaaact gatctgtgaa aggggttatc ctcatctact tggggaattt 28620
tggctgcgaa gaaactccaa agtaaatctt tagaagcctt cattgttaaa tatgaaataa 28680
tgtttggagt acatttattt cttctcaaat ttattatagg gtcaataatg tacacatctt 28740
gaagtccatt tttttcctgc ttttataaca aacaggccac acagttccag agctaaggca 28800
aggacaggtc agaataataa gtaatgatgt atgtaatgca ccacatagtt ataatggagc 28860
catcttgtct ggaatgctgt gtgctggagt acctcaaggt ggagtggacg catgtcaggt 28920
aagctcaaga caatctcatc catgtcatca tccaagaagt gtataagcac ttcctagtat 28980
gtgataatgt gatagacata agtgtaacag ttacaataca cagccctgtt cctctaaaat 29040
ttataatcta gattttagaa ataaattttt ttatgaatga agtttatcta tcatgaaagc 29100
attaactctg agaggccaaa ttacagagta gttaaccatc caaagctcaa gaatcagaaa 29160
gacctcgatt tgaattcctt aacctctatt accaagtctc taactaaaag ctggggataa 29220
tcataatagc acctaacttt ttgggtacta agaaaagtta aatgaagact aaatatatca 29280
ggcacatggt aaacaacaaa gaaatctcat ctatttcact attattaatg tagaccatgg 29340
tcactcgtgt taataacttt aacctcaacc ttttaactgc tgtgaaggat taaataaaaa 29400
attaatcact atattataaa aattaattga tatataataa atgaatttta agagatacgt 29460
aataattcat ggactccttg aagatagaaa atttatacaa aatcctagta atttgagtca 29520
caaaagctcc tacaataatg aaacagtatg aatgaaaaag aaaagaaata actattatat 29580
ttggatctag cccataattt ttaaccaaat gcacaaaaac aaacaacaaa tatgaaattc 29640
tcactgtaaa gtgattaaaa tcaaatttga attctaaaat tttaaattaa attatctaaa 29700
cataattgat gcagttatat gttttaatag gttttgttca catatctgaa atccaactcc 29760
acacagtagc aggaacagct ggtgtcagaa attaaatatt cttttagtct ggagttttaa 29820
aaaatcaatc tgtttacttg agtaatttgt tgctgttttc atgggtgaat tgtatacaga 29880
aggataagaa ttattcttcg catcaaaagg tcactgactt tcatatttag tgctcatggt 29940
ctttaaaaag tggataaaaa gtagttctca catttcatgg aaagccccca atccatgagc 30000
acatttccca aaatgaaaca tttttatcaa ctgcaagttg tgtgtaggtg gagatttgtt 30060
tttcaattgt caagatactg ttaattaccc agtcctttat ctccttttgg tggagatgtc 30120
tctgtgctag gaaacccttc ttgctctcct tcctgtttct cttttactac tggccctgaa 30180
acaacaaatt ctcaagtttc atgacagctt tccaaagaat ccatcaatca aataagcaac 30240
acaactcgac actgacaatt ccagacctac taagagcatt aattaagact taaaaataaa 30300
catgagtttt aaaagggtgt tattcattat tttcccattt ataacgtccc ttaccttctg 30360
tccttcagtg catacaaatt attatcttcc ttgaagccca gttcaagccg tacctcacca 30420
tgataccttc catgtatatt ccactctagg cctcactgat ttttaactga aatactataa 30480
tgcatagttc acacttaaaa aaaaaaaaaa aacacagcac tttacataag agcttacagg 30540
atcctatttg ttttatccat tcttttgttc atttttacaa tcattaattc aaaggaatta 30600
tattaattac tttctatgca cccgacgttg tgttaacaca acaatactat ccctgcattc 30660
agcaagtcta tggtctacaa gagaggacac aaattcaaat gtctgtagtc aagcagtgaa 30720
gctggctaga tatggaaaaa ttacaagtcc ctcttgcttt aacatttgct tgcccacatt 30780
tggtcagaca tcatgcaaaa taatttctca ctatagaaaa aaaaacacta caaaaacaat 30840
aatataaaga actgagaact ggttaactga agcatgcata tgtcatctaa aagaagcagg 30900
tgacgaccag cttcatgaag tacttgccat gcatattggc acttcacaca ctgacccttc 30960
tccccaccta gaccagtaat taaacaggta tggatgagct agctactaag agcagccaac 31020
tgaatagctg actaacttag aagcacactt ggtaataata gctgactttt attagtactg 31080
actatactat atgctaagct gtactcaaag tgctttgagt tttaaactga tacaaacatt 31140
atatgaggaa acagaggtac agagagctat tcaccagctt accaaaggtc acatagctgg 31200
taagtggagg acttaaaccc agactatcta gtttcagaac ccacagactt aatccatcgt 31260
gcagaacata agacatactc catctgtctc cccaactagg ttattatgtg cacaaatatt 31320
tattggttgg ttggttcatt attatgactg ggtggtaagt atgtcattag gagtgttttg 31380
cttatgacta tataaatttc ttcaccaaaa gaagactttc tgatgatata ctatgcatca 31440
gacaccacgc agggtgctaa ggttaggaag ataagtgaga cttctagaaa ctcattcatt 31500
caacaaatat ctcctaaggg ctagaagctt aggtttcagc agtgaacaga ataggtatgt 31560
tctctttcgt gttggacctt atagtatatc tgggaaaaca gacattgaat aaatatcaca 31620
aatgcaagtg agtgtttcag agacatgcag ctgctacatc aaaacaaaac agaacaaaac 31680
aaacaaacaa aaactgacca gtgggattaa gtgtaaatag gcacacaaat gcacaaatat 31740
gcttttataa aatagtgaag cagtgacaga gacacacaca agatataaag acacaatgaa 31800
gaacaattga gcccaaagct ggaaagggtg agagtgtgaa ggaaaaaggt tgatcagaga 31860
agttttcccg aaggagagaa agcctggatg attaggaggc aaccactcgg tgactgaggg 31920
aaatctgaaa aatgtatttg tcatcttctc agacttgctg aaggaatgac ttgggtactt 31980
tgaggatttc agtaattttt ccatgacttg gtataatatt tcaaaaggaa ataggctgac 32040
tttatttgta taatgaatgt gactccttcc tcgactgcca tagaaataaa ctccttaata 32100
ttttgggttt gtctttgcac ttaagtaatc agtcattctg tttttttaca gggtgactct 32160
ggtggcccac tagtacaaga agactcacgg cggctttggt ttattgtggg gatagtaagc 32220
tggggagatc agtgtggcct gccggataag ccaggagtgt atactcgagt gacagcctac 32280
cttgactgga ttaggcaaca aactgggatc tagtgcaaca agtgcatccc tgttgcaaag 32340
tctgtatgca ggtgtgcctg tcttaaattc caaagcttta catttcaact gaaaaagaaa 32400
ctagaaatgt cctaatttaa catcttgtta cataaatatg gtttaacaaa cactgtttaa 32460
cctttcttta ttattaaagg ttttctattt tctccagaga actatatgaa tgttgcatag 32520
tactgtggct gtgtaacaga agaaacacac taaactaatt acaaagttaa caatttcatt 32580
acagttgtgc taaatgcccg tagtgagaag aacaggaacc ttgagcatgt atagtagagg 32640
aacctgcaca ggtctgatgg gtcagagggg tcttctctgg gtttcactga ggatgagaag 32700
taagcaaact gtggaaacat gcaaaggaaa aagtgataga ataatattca agacaaaaag 32760
aacagtatga ggcaagagaa ataatatgta tttaaaattt ttggttactc aatatcttat 32820
acttagtatg agtcctaaaa ttaaaaatgt gaaactgttg tactatacgt ataacctaac 32880
cttaattatt ctgtaagaac atgcttccat aggaaatagt ggataatttt cagctattta 32940
aggcaaaagc taaaatagtt cactcctcaa ctgagaccca aagaattata gatatttttc 33000
atgatgaccc atgaaaaata tcactcatct acataaagga gagactatat ctattttata 33060
gagaagctaa gaaatatacc tacacaaact tgtcaggtgc tttacaacta catagtactt 33120
tttaacaaca aaataataat tttaagaatg aaaaatttaa tcatcgggaa gaacgtccca 33180
ctacagactt cctatcactg gcagttatat ttttgagcgt aaaagggtcg tcaaacgcta 33240
aatctaagta acgaattgaa agtttaaaga gggggaagag ttggtttgca aaggaaaagt 33300
ttaaatagct taatatcaat agaatgatcc tgaagacaga aaaaactttg tcactcttcc 33360
tctctcattt tctttctctc tctctcccct tctcatacac atgcctcccc caccaaagaa 33420
tataatgtaa attaaatcca ctaaaatgta atggcatgaa aatctctgta gtctgaatca 33480
ctaatattcc tgagttttta tgagctccta gtacagctaa agtttgccta tgcatgatca 33540
tctatgcgtc agagcttcct ccttctacaa gctaactccc tgcatctggg catcaggact 33600
gctccataca tttgctgaaa acttcttgta tttcctgatg taaaattgtg caaacaccta 33660
caataaagcc atctactttt agggaaaggg agttgaaaat gcaaccaact cttggcgaac 33720
tgtacaaaca aatctttgct atactttatt tcaaataaat tctttttaaa ataatttccc 33780
tgcctaatta tttatggaag ttatgacttt tgaaggacaa ttcaaaacca tttatttaat 33840
tggttctgca atgaaagaac tgccccatat actctactaa aggcttggca ctttctgctg 33900
ccttttaatc cagcgctata attgaggcaa gcgtccagct tgacacctcg agataacttc 33960
gtataatgta tgctatacga agttatatgc atggcctccg cgccgggttt tggcgcctcc 34020
cgcgggcgcc cccctcctca cggcgagcgc tgccacgtca gacgaagggc gcagcgagcg 34080
tcctgatcct tccgcccgga cgctcaggac agcggcccgc tgctcataag actcggcctt 34140
agaaccccag tatcagcaga aggacatttt aggacgggac ttgggtgact ctagggcact 34200
ggttttcttt ccagagagcg gaacaggcga ggaaaagtag tcccttctcg gcgattctgc 34260
ggagggatct ccgtggggcg gtgaacgccg atgattatat aaggacgcgc cgggtgtggc 34320
acagctagtt ccgtcgcagc cgggatttgg gtcgcggttc ttgtttgtgg atcgctgtga 34380
tcgtcacttg gtgagtagcg ggctgctggg ctggccgggg ctttcgtggc cgccgggccg 34440
ctcggtggga cggaagcgtg tggagagacc gccaagggct gtagtctggg tccgcgagca 34500
aggttgccct gaactggggg ttggggggag cgcagcaaaa tggcggctgt tcccgagtct 34560
tgaatggaag acgcttgtga ggcgggctgt gaggtcgttg aaacaaggtg gggggcatgg 34620
tgggcggcaa gaacccaagg tcttgaggcc ttcgctaatg cgggaaagct cttattcggg 34680
tgagatgggc tggggcacca tctggggacc ctgacgtgaa gtttgtcact gactggagaa 34740
ctcggtttgt cgtctgttgc gggggcggca gttatggcgg tgccgttggg cagtgcaccc 34800
gtacctttgg gagcgcgcgc cctcgtcgtg tcgtgacgtc acccgttctg ttggcttata 34860
atgcagggtg gggccacctg ccggtaggtg tgcggtaggc ttttctccgt cgcaggacgc 34920
agggttcggg cctagggtag gctctcctga atcgacaggc gccggacctc tggtgagggg 34980
agggataagt gaggcgtcag tttctttggt cggttttatg tacctatctt cttaagtagc 35040
tgaagctccg gttttgaact atgcgctcgg ggttggcgag tgtgttttgt gaagtttttt 35100
aggcaccttt tgaaatgtaa tcatttgggt caatatgtaa ttttcagtgt tagactagta 35160
aattgtccgc taaattctgg ccgtttttgg cttttttgtt agacgtgttg acaattaatc 35220
atcggcatag tatatcggca tagtataata cgacaaggtg aggaactaaa ccatgggatc 35280
ggccattgaa caagatggat tgcacgcagg ttctccggcc gcttgggtgg agaggctatt 35340
cggctatgac tgggcacaac agacaatcgg ctgctctgat gccgccgtgt tccggctgtc 35400
agcgcagggg cgcccggttc tttttgtcaa gaccgacctg tccggtgccc tgaatgaact 35460
gcaggacgag gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt 35520
gctcgacgtt gtcactgaag cgggaaggga ctggctgcta ttgggcgaag tgccggggca 35580
ggatctcctg tcatctcacc ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat 35640
gcggcggctg catacgcttg atccggctac ctgcccattc gaccaccaag cgaaacatcg 35700
catcgagcga gcacgtactc ggatggaagc cggtcttgtc gatcaggatg atctggacga 35760
agagcatcag gggctcgcgc cagccgaact gttcgccagg ctcaaggcgc gcatgcccga 35820
cggcgatgat ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca tggtggaaaa 35880
tggccgcttt tctggattca tcgactgtgg ccggctgggt gtggcggacc gctatcagga 35940
catagcgttg gctacccgtg atattgctga agagcttggc ggcgaatggg ctgaccgctt 36000
cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc atcgccttct atcgccttct 36060
tgacgagttc ttctgagggg atccgctgta agtctgcaga aattgatgat ctattaaaca 36120
ataaagatgt ccactaaaat ggaagttttt cctgtcatac tttgttaaga agggtgagaa 36180
cagagtacct acattttgaa tggaaggatt ggagctacgg gggtgggggt ggggtgggat 36240
tagataaatg cctgctcttt actgaaggct ctttactatt gctttatgat aatgtttcat 36300
agttggatat cataatttaa acaagcaaaa ccaaattaag ggccagctca ttcctcccac 36360
tcatgatcta tagatctata gatctctcgt gggatcattg tttttctctt gattcccact 36420
ttgtggttct aagtactgtg gtttccaaat gtgtcagttt catagcctga agaacgagat 36480
cagcagcctc tgttccacat acacttcatt ctcagtattg ttttgccaag ttctaattcc 36540
atcagacctc gacctgcagc ccctagcccg ggcgccagta gcagcaccca cgtccacctt 36600
ctgtctagta atgtccaaca cctccctcag tccaaacact gctctgcatc catgtggctc 36660
ccatttatac ctgaagcact tgatggggcc tcaatgtttt actagagccc acccccctgc 36720
aactctgaga ccctctggat ttgtctgtca gtgcctcact ggggcgttgg ataatttctt 36780
aaaaggtcaa gttccctcag cagcattctc tgagcagtct gaagatgtgt gcttttcaca 36840
gttcaaatcc atgtggctgt ttcacccacc tgcctggcct tgggttatct atcaggacct 36900
agcctagaag caggtgtgtg gcacttaaca cctaagctga gtgactaact gaacactcaa 36960
gtggatgcca tctttgtcac ttcttgactg tgacacaagc aactcctgat gccaaagccc 37020
tgcccacccc tctcatgccc atatttggac atggtacagg tcctcactgg ccatggtctg 37080
tgaggtcctg gtcctctttg acttcataat tcctaggggc cactagtatc tataagagga 37140
agagggtgct ggctcccagg ccacagccca caaaattcca cctgctcaca ggttggctgg 37200
ctcgacccag gtggtgtccc ctgctctgag ccagctcccg gccaagccag caccatgggt 37260
acccccaaga agaagaggaa ggtgcgtacc gatttaaatt ccaatttact gaccgtacac 37320
caaaatttgc ctgcattacc ggtcgatgca acgagtgatg aggttcgcaa gaacctgatg 37380
gacatgttca gggatcgcca ggcgttttct gagcatacct ggaaaatgct tctgtccgtt 37440
tgccggtcgt gggcggcatg gtgcaagttg aataaccgga aatggtttcc cgcagaacct 37500
gaagatgttc gcgattatct tctatatctt caggcgcgcg gtctggcagt aaaaactatc 37560
cagcaacatt tgggccagct aaacatgctt catcgtcggt ccgggctgcc acgaccaagt 37620
gacagcaatg ctgtttcact ggttatgcgg cggatccgaa aagaaaacgt tgatgccggt 37680
gaacgtgcaa aacaggctct agcgttcgaa cgcactgatt tcgaccaggt tcgttcactc 37740
atggaaaata gtgatcgctg ccaggatata cgtaatctgg catttctggg gattgcttat 37800
aacaccctgt tacgtatagc cgaaattgcc aggatcaggg ttaaagatat ctcacgtact 37860
gacggtggga gaatgttaat ccatattggc agaacgaaaa cgctggttag caccgcaggt 37920
gtagagaagg cacttagcct gggggtaact aaactggtcg agcgatggat ttccgtctct 37980
ggtgtagctg atgatccgaa taactacctg ttttgccggg tcagaaaaaa tggtgttgcc 38040
gcgccatctg ccaccagcca gctatcaact cgcgccctgg aagggatttt tgaagcaact 38100
catcgattga tttacggcgc taaggtaaat ataaaatttt taagtgtata atgtgttaaa 38160
ctactgattc taattgtttg tgtattttag gatgactctg gtcagagata cctggcctgg 38220
tctggacaca gtgcccgtgt cggagccgcg cgagatatgg cccgcgctgg agtttcaata 38280
ccggagatca tgcaagctgg tggctggacc aatgtaaata ttgtcatgaa ctatatccgt 38340
aacctggata gtgaaacagg ggcaatggtg cgcctgctgg aagatggcga ttgatctaga 38400
taagtaatga tcataatcag ccatatcaca tctgtagagg ttttacttgc tttaaaaaac 38460
ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaaacct 38520
gccctagttg cggccaattc cagctgagcg tgcctccgca ccattaccag ttggtctggt 38580
gtcaaaaata ataataaccg ggcagggggg atctaagctc tagataagta atgatcataa 38640
tcagccatat cacatctgta gaggttttac ttgctttaaa aaacctccca cacctccccc 38700
tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata 38760
atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 38820
attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg aataacttcg 38880
tataatgtat gctatacgaa gttatgctag taactataac ggtcctaagg tagcgagcta 38940
gctgcaaccg aggaaaaaac gtgccatgag gtctctgtat ccaagtgtga ct 38992
<210> 20
<211> 34073
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Рекомбинантный полинуклеотид
<400> 20
gagggagggt ggtgctttgc taatggtgaa ttactaactc ctcaataaag aatattattt 60
gaaataattt ttgaaatttc ataattactt tgggttcttt cttaatgata aataaataat 120
agtatattac aaacatacat taatatttcc tgaatgaata caccacaaat ctcccttaaa 180
atatagcaag aataaaaatt atactatttc tgacaatttt taatttctca aataataata 240
ccactctgat ttttaaacat ctacaccact ctggctttgc caatcttttt aaaaattgaa 300
aagataataa ttttatcata attacactga agcatagaac tttttctttc aaggaaagca 360
aatttttgaa attctataat ataacctccc ataatcctga ataaattaaa ggttcaacaa 420
cttagtaaag taagactgac cttccctttt atttcttttt cagatcaaaa atcttacttt 480
tataggagca gttttcaact cctaaatgtt gaatataata gtcagttaaa ttcaccagct 540
acacaggaat acaggacttt gagtggaaga attgaatctc tggtaagtta atatttgtct 600
ttgctcttta ttccattata aaatgaatat gataataaac ctaatgtttt gtaatatatt 660
ttcagttgct aagtgctcta catattttcc ttccttgaat ggtgaaacat gtgtttctct 720
ctgcttttat ccagttagtt tactcatata ctggttctta ttcacatctt tgtcatgagt 780
aaaaagtgtt agaaaggcca cgagtaaata tgcattttat ttgtttatga attcaaatac 840
taaaagtttt ttatttgttt aattaagcat tgacattgtc tttttaaatt cttttcattt 900
taccttcttc cctcttcctt atccaactaa agacgcaaag caggaggtgt taaaaaacag 960
gtttaccata tcagcagtaa catagtttgg acaacattac actttggttc aatgatagac 1020
atagaagttt gaacagaaat atgcaaagca agtttgagct ctaacttgaa gagagcctct 1080
gggtgcctgc caggaaacct cacgagtgga cccttaacat tcatgtgtca ccacaaacta 1140
ggggctgccc tttagttttg accagtctca gtgtcactca cttaccctta ccttttcaaa 1200
aaaaagtcct aagaatataa agtaattcaa tggttctaca attttagcat gtaactgagt 1260
cacctggcag ggttgctttg gtgagctcaa gataaaattt tatcagcatt tctacatttt 1320
ctggaatatt ccttaatcca ggcttttaat cccttggtgc ttttctgaac cactgcaatg 1380
agcttctaac tgttctcact gtgtgcaggc tcttttcctt ctaatctaat ttacacactt 1440
ctgaacacaa atctctcaca gcctgtttcc ttcatgttac ctccagctca agactttttg 1500
cctacaaaat aaaattcaaa cttgttagct aagcaccttc tcatgtctat gctttggctc 1560
atatttcagc catcgtgtgc cccacttatt cttatagcca acctgaaaag ccatctttta 1620
taagaaacta cctctgctct ccatgattgg atataattaa tcctccttcc acatcacctc 1680
gccacaaaat tgtatctgtg ttgatctcat gccacatacc tgtatgtatt ttatattata 1740
aatatttgca gacttgttta atttgccatg ttagactaag ttccatgaag acagctccat 1800
atccattcca tttttatata tccacaacat ttggtcgggt tgatgcttaa taaatgttta 1860
ttgaaggaac aggagtctcc cacttctgac ataatgaact tatttccccc agtgttaacc 1920
ctacatctgg ttcctgtcca agagtctctt cccaaatcat tctgattcaa ctgttcattc 1980
tgatctcatt aaacatttaa atgatatatc taacttcgct tgctttattc tatgctcatc 2040
ctgcagtctc ctcataactt ggtttcaatg atgcttgctt ctagagaaaa aaatgtatta 2100
aataagctta tgattcagtc ctccagctgt gatggttctc actgaacatt agctcagtgg 2160
ttttcgaagt atggtctcta gcataaccta gaaacttgtt agaaatgcaa attcttgggc 2220
tcaccaagac atactaaatc aaaaattctg acattggggc ctagaaatct gtgttttaac 2280
aagcctgcca gtgcagcctg gtcccttttc ttctcggagc cccactcaaa gctttcagtg 2340
ctcatctccc accaatgaca gggtcctcta tggaaaccgg caggacggtt tccaactcta 2400
actacgtttt agagtttgct tcctagggct atccaggcac caagtatcac aggttagttt 2460
cccagggaag cagactctga gacttgcatg cagggagtgt ctctggggtg ctctcaacca 2520
acaccttcag gaagagaagg aagcagcatt gggcagaggc atagtcaaac tacagtgctg 2580
ttggcacaga agactgaagg gagtcagagc cagggggtag aggtgggccc ttagcatcca 2640
tccttcacca ttaggtgtga gttgccccac ctccttgatg gtgtaacctc agtcccaagg 2700
tgggtgggag tgcagcagag cagcccctac aagggccaaa ccagagatac accaggcgcc 2760
agaagtgctg ccagggaata gagaggaaag gatgggctta aggtaggatc cacagaactt 2820
ggcaatggat tagaagacag gatgagaagt gacaggttaa cactaacaca gaaatgtcta 2880
acttcggtag ataatggtgc cattggctag aagaggaaac cgaaatgaaa gcaggttgtt 2940
cagggagaca aaagttcact gtggacatct cagcagagtg attcagtggg gaaaggaatg 3000
gatgcccaga ccacctcaga ggaagatcta agctggagcc agcaataaag atacaagatg 3060
aacaatccct aacgaactgc tcctcagcca tgctccccag acacgctgct tcagatttat 3120
agtccgggtg aggctaggag gtgcgcctcc ctcagtggag gacagcaaag caccagtggc 3180
tccagggagt taaaatcttt tgataatttt tgttctagca tctgtctgca gagctgtctc 3240
tcagccattg cctgccttta cacaggagtg cagtccgaaa ttgggagatg agtgaaattt 3300
attatgccta gagatctgga tccccagttg tttgggagta tattttctga accacttgtt 3360
ggtttaagta atgcagattt attgatgcca cttctcttga atctgtgact ctggacccac 3420
catctaagtg aatgtgcaga gggaacggaa tggctgcaat agatctccat taaaaccagt 3480
gcatcctccc agacacatac agtagtaggg aggtgagtca atgtcaggac agcaccagct 3540
cccgcttcgg tacatttcca aagttctcag tctgtgtaca aaggtttgct ctggggcagc 3600
agaaatagcc ctgggcaggt agtcaaaggc ctggtttgat ttcctccact tccaggcaag 3660
tcactcgaag gctcacaggc tttttcctca cctgccacat gggtccagtg agatctactg 3720
agctgtaaat aatgaaatga gtgtgtgtgc agtcatctat aagttgtaaa gtactagaaa 3780
atggtgaaac tttgggattt gggctattta aggctgaatg ctaaaaatgt caggcattgt 3840
ggagaaagga atttaaatat aagattgatt gactgggatt taaagacaaa tgaaggcaca 3900
cacgcaagtg cacacccaca ctgacactgc acagctcccg ttggaggcat atcctgacca 3960
tgcagacctg gggctctgcc tgtccaagtg cactccttta ctacataaac cctccttctc 4020
ttttggggct gtcaccccac cagagctggc accgagccct tgctgctgcg cttccctggg 4080
gtgtcagctt ttgacagggt gtttcctccc tctgcaggag ccttaacatc ccttggactt 4140
ccttcccccc acccaccccc agcagtttta tctcttccta actcgggacc ctttttttcc 4200
cacacaaagt ttattgtcag ttgctggttt catctgtttg agcggctgca acaaaatacc 4260
atagactggg tggcatatgc acgacaaaaa tttatttctc acaggagaag tcaaagatta 4320
atgcaccagc agatctggtg tctgaggggc caccttctgg tttgtagatg atgctttcta 4380
gttaaaacac ctatttaaca cactattaaa cactaagtgt gttaaatagt gcagttgatg 4440
tatttgtcat gtcaccttta tcatacacta aatccttctt tgtctttttt tctgtactct 4500
aatctctttc tgtaagtaat ctttgcttgc agcagtagga tatttagagt actgtggctt 4560
gacaatatat ttagtatttc aagatttcca tgaaattctt ctgatgtatg agttccctag 4620
ttaatcttac atatgtatcc ctttgtaaaa acactttgaa catttaaaat gatacatgaa 4680
tagtactcta atacaatgcc ataaaaatta taaatcattt gtatagactg gtaagtaaag 4740
attgtgagat taagaaacgc atcaaaggcc attgagctgg aaagtggtat aatgagaatt 4800
caaaccaggg tctcttgact caaaatctaa ggatcatacc atttctcatg ataatatgag 4860
tattattgtt atctctatcc catagacaaa gtgttaacac tgaatgagca gtgaaatagt 4920
ctcagaattt tttattttat ttagcaattc acttgtcatt tctggtcctc agtttattca 4980
cgagtaaaat aaaatagttg gactagataa tttctatagt acattcttac acaaaaaatc 5040
tatgattttg ttatttttaa tgtgatatac tcatggcact cattcacctc attttcccag 5100
cctgcctcac tggtcattac ttctctgtgt tctttacagg ctccccctcc tctacactgc 5160
cattaaatat tgaaacacct caaagcttta cttatgtcca cctctcctct gacactatca 5220
ttctgtctag atgatcccat acatacatgc ccattacttc aacctgtatt tatacgccaa 5280
tgattcacta tatttccagc ctagacattc ttttgtactc tagttaccag cttgatatcc 5340
ttacatggct gtttcaaaac aactcaaata tattatctct caaaatcaaa ctcatgatgt 5400
ccccacacca tcctagcttt ccaccaacaa tacctatccc tattaatagc aataccattt 5460
attcagttat ccaaatcaaa aacctagaat tcatccttaa aattctacta tcattccaaa 5520
tatcctatcc atcagcagcc actgtattct taatcccctg tatttccttc aaatccattc 5580
acctctctcc atatccattg ctgcatgact atccaagcca tcgcctctac cctagggtac 5640
caaaatagca acaaacctaa tctgttcatt tgcattattt tttctccaaa actgattatc 5700
tatatgtagc aagacagatt gttctcaaat tgcaaatccc actatattat cctcttgctt 5760
caaacacttc catggtttcc cattgtttat gataaaacca aatgcttcaa gttcgaagac 5820
cggcatgatt gggaatttcc tgtcacccta gcctacttgc tctccatggt acagttgcac 5880
tggctttctt tcattcctta agtacaacct gtttcctccc acctcaggac tgtgcatgtg 5940
ccattcattc tgctgaggag cctttttcct tccacttcaa tcagctaagt ctgattcttc 6000
ctgacaatct cagctcaata agcatttcct ctaagaaatg tctctaatat cattaattgg 6060
ctcaggtccc tctactgtat tgctgcactt ttcacagtta taattttact taattatgaa 6120
tgattatttg attaggtcta tttccatcca ttagacataa gcttcatgat ggccagatta 6180
ctgttttcta tccatcgttg tattccaata cctgacagaa ggagggcggg aggtggtggc 6240
acacaagaga tgctcaaaaa caattgttga ataagtaaat gaatgaggcc atttagaaat 6300
aacgaaagta cctgtttaca aagtacatgt atcaaaacta tgaatgcatt ctacttacat 6360
ggttttctcc aaataaaaca aaagacttca atcaggatta atacctggga taaactgagt 6420
cattaaatct ctcctttgcc atcaggagtg acattgaaac aaatgtctgc aaacaacaaa 6480
tacttttttc ccaaaatata ttgaatggca tttccataaa caaactagaa catgggagga 6540
gaaagaaagc aatattaatt taaaattaat cttatcacat aacttatacc atcagggatt 6600
tcgggtaaaa ttcctttcag gcacatccat ttaacaagaa ttgattgtta ctgaaagcct 6660
agaagagaat ttggcacata cttggtgttc aaatatttgt tgactgagtg aataaatgat 6720
gcaagtgtct aagaaacaca aaataaggac atgattacag tcacggtgga gttcacagtc 6780
atctccaaaa tgaggatatg catcccaggg aggaccaaca attcattgga gtgctgaaat 6840
aaaatactca aaggtcattt tacatgtatt ttttctctaa attacttttc ttaagacaca 6900
gaaaacaaaa aaagaaactt agctttgtta ctttctaaca aatagttaaa tcattaaaca 6960
ggattgacac tagcatcctt gtttggtctt atgccttagg ggaacatgaa atgtgtgaag 7020
acattctgag atctgaggga agggtagaca gtaatacagt gggactgacc aggcttcagc 7080
acacctttac ctcctctcag cagatttcag tgatgagcag tttacaacta gattgaaaga 7140
ttatattatc tagttctaaa agaaaactaa gcctcccaaa agcaacaagg gaactgagag 7200
gaatcctgca aaacaaaaac aaattttaaa acttgcactt tgtaataacc ctaatatgta 7260
atcacagtaa tgaacagtaa gataatgaca gaactgacat atttccttat ctattaaagc 7320
catattaaca ggtaaagcaa tgccagtcag tggtacactt cttagaagat atttaataca 7380
tactagacac atacacacac acaacatttt ccttcaaggt gtatgtatca gaaaatcact 7440
ttttaaggcc ggatgcagtg gctcaggcct gtaatcccag cactttggga ggccgacgtg 7500
ggcggatcat ctgaggtcag gagttcaaga ccagcctgcc caacatggcg aaaccccatc 7560
tctacaaaaa tacaaaaatt agccagggat gatggtggat gcttgtagtc ccagctactc 7620
aagaggcaga ggcaggagaa tcacttgaac ctgggaggca gaggttgcag tgagccaaga 7680
tcacccattg cactccagcc tgggcaacag agtgagactc tgtctcaaaa aaaaaaaaat 7740
cactttttag ataaaattca tgctatagag agaagactat gaaaatatgt ttagcaatgt 7800
gtccatcatt aggtgattga gtttcctttt gttttgtttt actgaaaatc atataaagta 7860
tgttatctgt aaaagttctc tgacatgcac acataaaaat ttgggagaaa agattaacta 7920
taatgtttaa tagattttgt acacatttct ttaaaaatat ataaaacaca acacctttca 7980
attggtttgc aagaataacc aattgacatc atggaaaatg gaaattcact tgctgaattt 8040
taacaaaaat ttgcatgatg agtgagactg acaacttagt gtcatgattt aatgaattat 8100
gccaatggta aacttcatgc acatggggcc aggtaattat gtggaaactt tttcaatgct 8160
taaagccaag tattgaaatt aaacttagaa tcagaccttt gaaccatttt atgacaatgt 8220
tcaaaaatta taaattctat ccacttatat tataatatta aaaatatcat tacaaaaaaa 8280
acctgtgttt attttataac tcagcctttt taatttctaa tttcataaat atattataat 8340
ggatattgtt agtaatgtag tattattaca tgtatataat ttataagtaa atatacatgt 8400
tttggctact catgcataaa atgtttcacc cataggagca cataatcaga aatgtctgga 8460
gaccattata gtaatagata gatcatattg ccacatattt tatctcctcc ttgacaactg 8520
agctttccag atcttctggt gaaacgaaag agaaagttgt aacagaagag tgattaaaat 8580
gacaaaagca ttacttctat tacttctatt ctaataatat gagcaaagct ataactatca 8640
agtaataatg cactaaagaa ggtgattaat ctgatatatt cacaggcaac taataagacc 8700
tttctattgc agccatgaaa aatatgtgac aattatagat atcctgtgtg cagtgtttca 8760
acctttatgt gacctgttct actaacagat ttagtgatgt tcactttgtt agaattttct 8820
tacacatgcc ataacttgct tcagtctttt gattatgaat attatggata ttaaggattc 8880
tagactattc tagatttaaa aaataatatt gtcacctcaa tcagaaggga aatattaaat 8940
agttctcatt ttttcaatgt ttactcagtt tttgtccaat gtaatgaaag tgtcagcagt 9000
acaggttaca aaataaaatg tgtattaaag taaactcatt tgaacaggtt aataattgta 9060
gagggaggga aaaggctaaa agattgaatg taaaacttat gaaaagtaga tacatcgtct 9120
ctatgatttg cagtagtcaa ctgcatacag atgaatcatt ttaatacacg ttaactactt 9180
tccttttaca gatggagaaa ctgagaggaa gaaagtttat atggttcatt aaactttgtg 9240
atgcaagcta aactaacctg tctctgtatt ttccatctac tgcccttatc actatctcat 9300
tagaatactc ttcaagcatc tccttactga ttttcttacc aagcatttgt taagttctaa 9360
tgagagttgg tagtaacatt ttcacccact ctgtgaaata tgaaatctta ttcataggcc 9420
tcttctttta ttcttgtatt tgcatatcaa ccaattaatc aacttgcttt ctttatgttg 9480
cttattatct tagtccttac taaattgcct cttaatgttg tccacataac agaaatgtta 9540
aggtggatac ttaacatttt agtccagtct agccggtgcc agtgcaatgc caaatcatga 9600
attaaaatat aattacaaga accacttatc aaattttaac aattccttca gctttgtgac 9660
agttttttct acttcgatta aagtcaagta aaattaaagt taaatatttt tattaaaata 9720
tctcctttaa cattccatat taataaacat attaaagctc atgcttctaa gtagattact 9780
agaagttact ttatcgaatt acagcaatgg ttaattctag atcatagaat ttagaatgac 9840
tttttgcctt cttctttttt ttcctttttt ttaaacagag tcttgctctg ttgtccaggc 9900
tggagtgtac tggcgcgatc ttgactcact gcgacctctg ccctgcaggt tcaagtgatt 9960
ctcctgcccc agcctcttaa gtagttggga ttacaggtgc ctgccaccac acctggctaa 10020
tttttttttt gtatttttag gagagacagg gtttcaccat gttggccaga ctggtctcga 10080
actcctgacc tcaagtgatc cacttgcctc agcctcccaa agtgctggga ttacaggtgt 10140
gagccactgt gcctggcctg actttttgct ttcttcttaa tacttactag tatttcttga 10200
atttttaaaa aagaaacata aagtactttg ataaaaccaa cagtctcatt gttcttaaaa 10260
ttgttcaaag gttctctgga aaaaaaaaag aaaattatca tttggttaag aatcatgttg 10320
gtctgacatc aatcatccta taggagtgaa tattgaaaaa gtaagatata ttgtggtata 10380
atcgagattg cataaatttt accatttttg agaagaatct gctccaaatc ctggcttaat 10440
gtaatatcca gcatgctact taattttctt gtcttcacct tttcatatcc acatccacct 10500
aggtgccacc tcacagtata agccagcata atccattctt ctcaatgaaa ccacaataca 10560
tctgaccctg catctcagga gaactgtatc agccacagca cttccagttg actatgaatc 10620
tgaatgttat gcctcaggag aaacatcctt gctgggactg agtagtgatt caaggagata 10680
gttatgattc agtcaagaaa ttaataatta gtgttatttt tattattgag acagagtctc 10740
gttctgtagc ccaggctgga gtacagtggc atgatctcgg ctcactgcaa cctctacctc 10800
cccggttcaa gtgattctcc tgcctcagcc tcccaaataa ctgggacagc aggcacttgc 10860
caccacgcct agctaatttt ttgtattttt agtagagacg gagtttcacc gtgttagcca 10920
ggatggtctc gatctcctga cctcaaggtc cacctgcctc agcctcccaa agtgctggga 10980
ttacaggcgt gagccactgc gcccggccat aaattattaa ctgagccagg cacagtggta 11040
cacacttata gtcccagata ctcaggagac tgaggttgga gtatcctttt ttatgttatt 11100
ttatttttaa ttattatggg tacataatag gtgtacatac ccatggagta caagtcatgt 11160
tctgatacag acacataatg tttaataatc acatcagggt aattgggata tccatcacct 11220
caagcattta tctttctttg tgttaggaac attccacctc cactcttgga ataggcaccc 11280
tgttgtgcta ttaaatacga ggtcttattc atttcatcta actatatttt tctacccatt 11340
aaccatcacc tcttttcccc tcttccccac tacctttcct gtgaggctgc aggattctta 11400
agcacaacag ttagaggcca gcctggacaa catagtgaga ctcaatttct aaaaaataaa 11460
aaagaaatta ccaactaatg ctaaaaaaat agtctctgat gcttaggtat gaattagaaa 11520
tgaccaaaaa aaaaaaaaaa aaaaagactg ccctttgctt ccttctcccc ttctcttcaa 11580
gttttccatt gctactcatt ttagtctggt ttaatcaggt ttcatccatt aaaagcaatt 11640
gttgggatca cacattttga gttgtgtcag tggacttccc tcatgctggc atgattcctg 11700
ccccaagccc ttagtaaaag ccaccaagcc atataacata atctctcatt gagtaaaaca 11760
tctgatgtgt ttagaatgac ttctagcaaa aaaccagcct gtccagcatc atctctgtat 11820
aacagataaa ggaataggta ctgcatcaaa aggttataga acctgcccaa atcaatccca 11880
tgtgttttgc aatggaatta ggttgaacta aagtgaaaat tcagttttct actcctcatt 11940
aacatgtctc atgttgcaag gttgagagga aggagaagaa gaactgtatt tacagagaga 12000
ttccccctct ctttctttct acagattact aaaacattca aagaatcaaa tttaagaaat 12060
cagttcatca gagctcatgt tgccaaactg aggtgagtgg aactgtagaa aaaatattta 12120
agtatagata caatgtggca tacttgactt tttgtcacag aatgaatagt aaatgacatg 12180
ttcagataag ttgttgtaat attatgaaaa tagtatttta gtcagcttaa aaaccaatgc 12240
caaaaaagcc aaacatatga tctatttagc tactaatgta aataaccata ttatatctat 12300
tcttattggg aagaggaaga aggggtggag agagagttgg ggtgaaggta cagtaacaag 12360
gccatcctat tgtaaaactc cagtggatat cattcacagt gcagcctatg taaacagtcc 12420
ctcctggagt tgtacaatgc tgtggtttgg gtgtatccat ccaagatcaa gacactatga 12480
ccaacatcaa aagtggcttt ttggttttat ctgcctgatg tgctataata aaagggtatt 12540
atggccaaat ccaaggcatg tctatcatga attaataata ggaggagtag cagcatgcat 12600
gctagttatt tgccattcct gccttagtta aatatgatgt gataaaacca gcctttccaa 12660
ctgaaatagt cacctttact gactctcccg caaatgtctc aaatgaccac attgctctag 12720
tctttaaata atatgcaata gttctttggt agaagaggaa ttatactaat tctttctcaa 12780
atactagcat cacaagaaaa ttaattcttg ttctctggag agtcacctag taagtatctg 12840
gagcacagat gtctggtcag gtaagttttg atgaggagtt aaagggataa gaagagtcca 12900
tgagaagggt attttccaaa acacctttcg gtcaattcag tgcacattca cttagtactt 12960
tcttgtcagt atctgtatca gccactaatg ttcaaaagtg agtaagccct gaaaacctgt 13020
aggactacat gagccttctg ccttttctct ccttttgttc acttcccact tatcactcaa 13080
tcctctgcaa cctggcttca ataccaccat aaaatatcaa ctgctcttgc cgattcaaca 13140
atgacatcca gataacaaaa tccaaagaaa ccacatcagt cctattcttg gacctttcaa 13200
cagtatttgg tcctgttggc ctgtcactcc ttgaaatagg actatccctt ggtttgcatg 13260
gccttgtata ccctgatttt ccccttacct ccctagctat tccttcttag tttcctttac 13320
taggtcttac ttctttgtat attccttaaa tgttgctgaa catcaggctg tgctctaggc 13380
ctctcatctt ctcaggtcac actctctcct ttccttggcc ttcactgcca cccatatgct 13440
gagtgctctc aaagttgtat ctctaggcca gtcctctttt gcctccaaac atgaatatat 13500
gcagccatct acttggtacc atcacatgga taattctcat gatctcttcc agtatgactg 13560
cttctttatt tttttctggg ctctttttta gcattgcttt acatggaact ttatcatgtc 13620
tctcaacctc tattttatct tttatctatg tatgtagagt ctgtgtaatt tcttcatctc 13680
ttttagataa ctaatatctc ttcagctttg acttgtattc tgtgtaaccc atttattgcg 13740
ttttcaattt caatgagtat gttttcctat ctgcaagttc tatttgtttc ttttgagaat 13800
cttcctggtc ttttaaacac atttcttatt ttaatttttg ggggtaccta gtagttgtat 13860
gtatttttgg agtacatgag atgttttgat acaagcaaac aatgcataat aatcacattg 13920
tgtaaaatgg ggtatccatc ccctcaagca tttatccttt gtgttacaaa caatccaatt 13980
atattctttt agttattttt aaatgtacaa ttaaattatt attgaccata gtgactctgt 14040
tgtgctatca gatactaggt gatcttttaa aaataatgtt ttctacttaa tctcattttt 14100
atgattccct cttttacgtc atttgtcatt tcaaatacag tcacttgtct gttgattcta 14160
ttatgtgaag tttttgagga taatcttttt gttactttga ttccaccttg gtatggtttg 14220
gctgtgcccc cactaaaatc tcatcttgaa ctctggttcc cataataccc acatgttgtg 14280
ggagggacct tgtgggaggt gattagatta tagggacgtt tccccccttt gctctgttct 14340
ttttcctgcc accatgtaag aaagatgtgt ttgcttcccc ttctgccatg attgtaaatt 14400
tcctgaggcc tccgcagcca tgcaggacct cttttctttg taaattaccc agtctccggc 14460
ggttctttat agctccgtga gaaaaaacta atacacacct catgatgtat tgtttaccac 14520
tgaaattgta tgcttaaatt taatctcact tgggaccctg tacaacctag acttaacata 14580
tctacctcca gagcagttac atctgtcaga cattctagag gaatcagcag cacatggact 14640
ttgttgttgt taatttgttg tcgggggagg ggggagggat agcattagga gatacaccta 14700
atgctaaatg acgagttaat gggtgcagca caccaacatg gcacatgtat acatatgtaa 14760
caaacctgca cgttgtgcac atatacccta aaacttaaag tataataata ataaaattaa 14820
aaaaaaaaag gttctgggag tattcaggta gtattaatga agattcagac atcgtgcagc 14880
caggcccatg cttatgaatt ttcaggtgat acttcttttt cttttttctt aatttaaagc 14940
tggatctcgg aaacagataa atttattttt ttatgacatg acgagcattt ttttcattct 15000
agttcatgct gttattgggt gtttagttct ttgagactcc tggccttttt ctaaaacctc 15060
aagttcaact tcctattttg cactggccca aggtcccatc tccagtctct atgtaaatgc 15120
taaacataag cctgtggaat attctagtct caccacatac tattcacatt cttctttgtt 15180
tttggtcttc caggattttc cttacttttc tatgaaccca gtcttgcatt tgaaatggaa 15240
tttattatat attatctatc ctttctattt gttttatgca gaaagtgttt tctaaaatta 15300
tttaggcttc catattgcta gacatggaag ttgtaattat ttgttcagtg cctgtttcta 15360
catctaaact gcaagaccca tatggcaact gtgaatctta gtcccagcta atttctgaag 15420
cttagaatag tgcctagcac aagaagttgt ttatctaaca tttttaaaaa taaatattaa 15480
attcatatct ggaatgaata ttaagttaga gctggtcatt gaggtgagag gaggaagcca 15540
agagagaata tgagagcctc aaagccaaat atctttaatg tactttttca gaaaagaaga 15600
cagccaatgt caggtggagg aactggttta tgaggtaact ttcctggaag aaaatagaaa 15660
ttactgaggt tttagataat ccaaatattt aatcaagtca ccaaggttta ttgtggggaa 15720
tctttattat taattaaaat gagtgatgaa atcttaatat acgacaaaag ttaaaatttg 15780
cttttgcagg cagatgaatg gtctaggtat caaaaaatta agttgagtct ctaactcaca 15840
caaatttaca accctatcac tttatgaatt tgtttaggag attattttta ataacactgg 15900
tgaagtctaa gaatagctaa aatttatagt acacttattg tgtgctattg actcttcttt 15960
gaagttttgc atatagtgat tcatctaatc ttcataaccc attttacatg tgaagaaact 16020
tagatataga aagattaaga aacttacata acttatccaa agttacacag taaaactctg 16080
gcattataac ttcaaaatca gctatcctac agtgagtaca gtgttctgtg cattgaaatc 16140
aaataagtga gatagcatcg tgatatagta ttacgtatgc aaacactgtt acagagatct 16200
gtctaaagtt aaattccaca aatgaattct ttaaaagggt ttaatcaaga agaatatata 16260
aacaggatgg tgaaaaattg tcatattatt tgttttttaa aatatcttta tgatttacag 16320
gcaagatggt agtggtgtga gagcggatgt tgtcatgaaa tttcaattca ctagaaataa 16380
caatggagca tcaatgaaaa gcagaattga gtctgtttta cgacaaatgc tgaataactc 16440
tggaaacctg gaaataaacc cttcaactga gataacatgt aagtataatt tttcataaac 16500
aattttattt caatatatcc ctcaagttta ccaattcaaa ttcatatttt aattgagagg 16560
ctgacttttc tttctttgaa actaaactgt gaaaacaatc cattaaaaag ctaaatatac 16620
catatagctc cctaacgtaa atcattctaa gacttaaaga atcatttggc atttatatag 16680
taaattttat ttgctaaaaa ttctcattaa ttatccctgc aacattcctt atgagtgatg 16740
ttactgtcag atgtcattag tggataggcc ataggagggg tacatagatg ctcaaggtca 16800
gagaactatt taattaatga tccacctcag aggcttcttc atttttcttt gtaacattta 16860
tcacaattga aattacaaag ttatctgtgt aaattttgta ttgtttggct tcatcctaca 16920
ctgtaatcat cctaaaagaa agaaccagtc aaccttcttc atcctactac cctcctacca 16980
cccagtctcc atcatataac acatattcaa taaataattc ttgcatgact gaaagaaaag 17040
aaataatata tgcatagaat ttaaggacat tcctccaagt tggttacatt ctgctagttt 17100
aataagccat tatttcttct cgatgagctc aagattaaaa ggattttgat gattcccata 17160
ctagactggt aggtaccagt tacagatgta ctaactgtta aatattgaaa tgctttccta 17220
tttgttggta aacaattact gcatcaggcc cacaaagttg tcttccgaga tgtttcaaat 17280
ccactgcccc tgctgctaaa gagttatgct tagcaaagca aagcactcta agacactgct 17340
ccaactccat ggcctgattg catcttttat gactggccaa tgctcacgca ctgcagtttg 17400
ttaggtagtt gaatattacc tctgcttcca cacattaagg aatgctcccg aacgcacttc 17460
ccaagtgttt atttatttat cattatacta gacaatatgg tgatacgatg gtcacagaat 17520
agcggtttcc acctccagag cccataatct agttgaaggg aaagatattc caacacaaga 17580
gtgttgacaa tcaagataga atatgatcaa gggcccagtg tgaggcccag gcaatgatca 17640
ctgcaggaat ctggggaaga aagagaccag cgtgcttggg atatctagca aaagtttcat 17700
gaaggagaat ggactttgac tttgaaatat gggtaggatt tacatatttt gagatgagaa 17760
aaagaaagtt cccagagaag gaaagcatga aaaggcaaac agtctgtact gaacgcgatg 17820
ctttgacaga ataatgaaga aagggacctg ctggaatgat tgatcagtgt tcatcattca 17880
caccatcatc atcaaaacac ttatttaatg agaacttact gttttttagg catggcttta 17940
atgccctata tgaatttttt tcttgattaa tccttacaac aaacatatcc catagatagt 18000
tttattgtcc cccttagaaa agataaattg cctaggctga cacagtcagt atatgaggca 18060
gtcaggattc aaactaagtc tgtttgttca aaaaattaag aatggccagc tttttaaaat 18120
tttctgtctc cagaagtatg atttggctcc actgaagttt gcaaaacaaa tgtgataccc 18180
aaaccttgtg aaacttttag tgggaaataa ctttgcataa gtcggtttga gagagcgtgg 18240
aaacctgtct tgaaaagttt taatttaact tgcaggaaat aaaaatgatg ggtttctcaa 18300
ttaaaaattt caatcaagga aggatatgag ctaacataac atttttttaa aaagatcagt 18360
ctggtaaggt agaggtgcat aaactgaaaa ggagcaaaag tggtggaatt cagttagaaa 18420
attattgtaa ctgtactgat gtcaaatgat gaaaccatga actaaagtag taccaaaagg 18480
agtgaggagg atggaataat tcaaaagata gaggacagat gtgcagaacc tggagattat 18540
aagatgtgaa aggaggagtt tgagaaaatt tcagattttg gaagtggtgt cattttacta 18600
aaaggatata ataagtagca aattttggat aaagttgggt cccactgagt ttgagatggc 18660
tgttggacat gcagagaaaa ctgtcttgta tgctgttctt aaattgaaat agacagacct 18720
ttaccctctg atactgacat attttccttt ccaggctcac cctccatttc cctaaacaca 18780
acacatgcac tagctctcct tactttattg ctccacaaac atcttacacc tccaagcatt 18840
tgtgcccact gtaccttcta tctggaatct cttttgtcct cttgtgtgcc tgaaaaattc 18900
ctttcagatc ttcaaaatac agtgcagatg ctatttcttc tagctcaaat attatctcct 18960
ccatataatt taattactct cttttttctt ttctctactt tgcacttaca tttatttgaa 19020
tgattgcttg attaatttct acctgtaaat tatgtgaggg caggtcctct atattttgct 19080
cgcagttaaa tctgcagcac ttattataga gtggtatcat tagagtaata tacatatatt 19140
tgaggacatg ataaattaac ttcccctata gtatttatca cattgcatct caatgacttg 19200
cttatgtttc tgttttccca tataaattga gtaacttgaa aaaagagata tctattaagt 19260
atttaatgag aaattaaagt acaaacttta gtatgcataa caacaaattg ggaaaaggtt 19320
gtaaacaaag agatttgtag ggcccatgag ttagagatcg tttcagcagg tctgaaagga 19380
agcctaggaa tctgcatttt agaggaccac ctcccaaccc caacaagtaa ttctgcttct 19440
tgttgtctgg gtactgtact ttaagaaatt atggtgaaat gatatcagcc tttattgtat 19500
ttatcttatt ctcatttttt aatactagca cttactgacc aggctgcagc aaattggctt 19560
attaatggta agttttaata ttattttgta actgtaattt gccaaatcat aaagagtaaa 19620
agtgcaagtc ttttgtgtac ttttggccaa ggcagtatct atcaagttga tgtctttgtt 19680
cttagttcgc tcaggtggtg ttgaaacaag acagtgctga tcccaagtgt cccatggagt 19740
ggactttagg tttccccttt ccttttagaa aaaggaagaa gttgtagtgg aggactaccc 19800
actctgcact caaaattgcc ctcatgaaaa tttctttggc agctttgaga accttttact 19860
gccctggttc taaggtggca tttctgtaga cttacaaatt atgtttgatg acaccgttta 19920
tgtagcttct cctaaccacc agagtagctt gctttgttgt gaattcaggt taatcacaaa 19980
gtataataaa aaagaattgt cagaagtctt cccagctttg ggtctataac ctgaaggaaa 20040
agtcactact cttcaacatc atcctatgta ctctcaggct aggatagcag aaatgcaatc 20100
cctagaaaac agcaacttac ttctctgacc aaaaaaatgc agttaaaaat tagttcaatg 20160
tacctggtag ctggcctatc ttaggtactt cagtgatttt acaaagtgat ggtagtccta 20220
tgggtgtttt tcagcttcac tacgtattta attcatgctt attgttaatg aaactgtgat 20280
aagcaattta ctagggtatt tgtttgggag atgccacaaa ggaacacatg tatctcttaa 20340
tggaagcctg gtcctccttt atccaggaaa tttgctagga aaaaaaagcc tttaggtggt 20400
tgtgctatta aaccagggca ctacttaaaa gccagcccag caatagttgt gtgatttacc 20460
attaatttct tagtaataga ccacacaaaa gaagaaaatt atgggaatgc gagttgagag 20520
gaattgggtg atcagcctac cccagcccgt ttcagctctg gccagtagac tattcacgag 20580
ctctttgaaa acatttaaat aaaccttatt tagatactag aaaccctctg tcaccctcaa 20640
gaatattctg tggtatagcg actcctttat gagggcatgt ttggtaatac agcatcagtc 20700
ttggaggtgg actggattct acaaggtgaa ctgcagtcac taaggagtct tttggatgag 20760
accagttttc ctccaacttc aatgtgtgca tgaacctcac atcaaaatgt agctttagat 20820
ttgtcccatg atgtggttcc aagaatcagc acttctaata agtttccagg ggatgcccat 20880
gctgcaggcc cacaaaccac actgagcata gcaagactat tgagaaaaag gaaatttccc 20940
aggagtctgt ggcctgagct ggcacatcca ataatgacct atcttaacct caactcatga 21000
ggaattccag ggaactctga agctgctcaa aatttgaagc ctatatgcca actaaattca 21060
gaaatgttct ccaaaatgct atctataagc aacagtagtc acaaatgcat tgtagaaata 21120
tatcgatcat gctttttgga aaatccagca tgtcctgagg aagaatgtat aagacataaa 21180
agtcataaat tatggaaaga ctcttcagct tcttccaaat gtaaaggaat catgatcttc 21240
ccagcacatt aatgcccttt ctcattagaa tgtggggccg gtccagacct aataacattg 21300
tctgagcaga gaatccttgg aggcactgag gctgaggagg gaagctggcc gtggcaagtc 21360
agtctgcggc tcaataatgc ccaccactgt ggaggcagcc tgatcaataa catgtggatc 21420
ctgacagcag ctcactgctt cagaaggtga ggccaccact acctacccat ctgggaacaa 21480
ttagaataga caggtcatga agactgcacc ctctacccta ggattgaatt gagccagaaa 21540
taattcaatg caaaaaaatc agtaagaatt ttcttcctat tcatgaaagg aaaaggattt 21600
ttccccttta gcatgctaat ttagtgctat ttctctgttt caggtaataa tatattagca 21660
cagtaaagaa caaagattta tatgtcagaa tgttttttaa atcctagcta taaaagctta 21720
agaaatttac taaatctcca taagctttat tttttttcca aattaaggga caacactgtt 21780
atctgtgact tagtgttact ggtagcattg agtacactaa tgtaaacata cgttaaatgt 21840
tagcgaaacg aattgctgtg gaagatttgc acattatatc atgggagctg atggctaacc 21900
tagagactgc cccatgccat taatttattc attcataaag attattgagt atctagtatg 21960
agcacagtgt tatatattgt agaagctact agtataaaca aagtattgcc tctgccttca 22020
aagagcttac actcgaatgt tggaatcaga atgcacaaaa ataatgatca attacaatga 22080
gtagcataaa taaaattaat gtaggcaact tacaagaatt cttaattgag gtgactaaac 22140
tattgccaac actagggtga tatgctacca gtggcgagta ggttgcataa acttacctta 22200
ttggtaaaaa gaaaagttca cattgctcat aaaagaagga ttttagattt cagcataact 22260
aaaatctgtt tcaaacctgc cttgttactg gggcatcgca gaccacaaca gttgttggga 22320
acttaactca aaaagttcac ccagaaaaat aatggagatt tgaactcgtg tgcccctgac 22380
catatcaatt ttcttctcag actcttactc taaactggac ctccttatca cacacacaaa 22440
gccttccata ggcagatcaa tccagtctta tttctcaaag catgtacctt gagcttcaga 22500
taaacagcat tgttctcttc ccctggactc ttcctacatt tccctaccta tgagtatctg 22560
atcaatctgc ttatccttga aatgttaata tatttaccac atctctattt gaattttatg 22620
aaatttttga taatttctaa gtagtttttt cagatttata ggcactactt catggtacag 22680
tgactgttac aaacgtattt gttaaattta gaaggaataa agatttaaaa gactagggta 22740
gttactgaac taaagtttta ggaaatccca aattatttca aatttttctt atggtaattt 22800
tatgacttaa tatttttata tgcagtgaac aaatttgaaa ctttaaaaga tactcccaga 22860
attatcagtt ttctgatgta gattggcaaa tttattacta tatcccaaat aacccaagag 22920
acaaaattca caaaaacatt tcaattttca ttgccacttg aaaggccaaa aagcagaaat 22980
ggcacgcatt gatttcaatc gtactcttga gtgtgggaac caggaattaa aatacctgga 23040
cttatcaggc acttagcata accaagaacg gaatagaaac ctccctggat tctaagccct 23100
attcagtccc aatcaccaaa aaccaagtaa acgatatcac tataatgaaa gccacagtta 23160
taaatatcga caacgattac caaaggaatc catggaactt tgaattttgc caccccacat 23220
ccttctattc attaccatga ttgatccact aaagctaaca gactctgtga accttgtatt 23280
ggacccctcc ctaaagacct gattgtcact gagaaccatc agtgaggatt tgtttggggc 23340
atgaccagcc ttacatcaaa gtacatagaa gtgatgaggt cttatcaaag aggattattg 23400
aattatcacc tcttctatgt agctttccct gatactctct ttcctctcca ttgagttcca 23460
cagaaatttt tttatctgcc tttaacagtt gtcctcatga tttgtgatat ttgacttacc 23520
tcttgtcagt ttccttcact agtgtagagt tcctcaaaga aagagaccat aattacttat 23580
atttttattc ctggagactc atactattcc ttatacaaag tagacactta acaatggctt 23640
gttgaactat aattaatgaa aataatagct accttcatga aagttcactt tgtgccaaac 23700
actatagttg acataataca tttgtctcat taatacttaa caattgtgtg agaaggtatc 23760
accaatcaca ttttatatgt aaataaaccc cagagctatt aattaacttg tcataaataa 23820
cacttttcat atgtggcata gccaagattt aaatataaat gttactggtt ccaaaatgat 23880
gctctaattc acttgctgga aagaaggaaa ggaagaaaat aaacgagtgg aaggaagaga 23940
gggagggaag agagaaaagg aaggaaagaa aaaagagtct cttcagaacc ttcactgtaa 24000
agactccgag caaaagaagt tgaatataaa aacaacatag gtttgtttgt tttctaatat 24060
tttttcttca aaatttttaa ctcaggttca ctcttacaca aactactgtg tcttataaaa 24120
gtatttccgg tcatagaatt tttattttct gtattaactc cactatctaa tctccataaa 24180
actcctaaat tggtattatc ggtaacattt tgtttttact caacccttag gaacaatgtt 24240
aagttaatca gccctccaca tcacagatcc ttattttcat cagtctgtac aaggcatttc 24300
tctcatttta attttttttc ctcctgtcat ccctggattt cactttcact gccctccttc 24360
cacccatatg cctcatacta atatattcga aatatacatg tcttaaaggt acatgcacgc 24420
acctacaaaa cctatagtgt ttttttgtat gtatatgtct ttaatttaaa taagtagcat 24480
tgtgtaaaag tctaatattg tttcttactg ttttcactca attcttggaa ttttcatctg 24540
atgcactgct gcatagcacc ccatggtatg cagccaccat atttccttca tccaattagg 24600
ttgcatgacc taccttccca ttgccacaaa gagtacacac aaaatatttg tacttatctt 24660
tctgtaaacc ttcaggaatt tcagaagcac acatgcaggc tgctaaatat accagaatac 24720
tttccagcca cttaaatctt taccagtatt gcaaaagagg ccccatttcc ctccacatca 24780
acatttagta ttattctttt gtttaagttt tatcaatctt ttaaatgtac acaagatgct 24840
catttttata attttaattt ctcagattac tagtttgagt atcttttcat atatctaaga 24900
gctgttttga tctcccctac catgaactgc cactaatatt ctttgcctat tttacaatgg 24960
tttttctgct tatttattac tggtttacag acttttaaaa tatattctac aaaaatttta 25020
gacattaaac attaccaata ttttcccatg gttcctcatc catctggtaa acttgtctat 25080
ggtatatcta attttgattt aatagaattc attctatttt taccttttag tttgtgtttt 25140
tgttgtttag ccaaaaagtc cccattccta ggtcataaag gtaatgtcct tttttttttt 25200
ttaacgctac tgttctctct ctgtctcccc ctatgtatat aggtgcacat atacttgtac 25260
acacatacat atacctatat atgaggggag ttcgataagt ttatggaaaa taaaattaaa 25320
agataaaata aaaaattata aactttattt ctcaacataa gctccttcaa gttcaagaca 25380
cttttgtaag caataatacc agccatatcg tccatcccta aagaactgag ggtcctgaga 25440
atttaactat gtcaatgcag tcttttttac attacttttt tacagtactt attgatgaaa 25500
aatgggtgcc ttttaaagat tgttttaaga ttagggaaca aaaataagtc agaggaagtc 25560
aaatcaggac tgaaaggtgg atgcctagtg atttattgct gaaactttca taaaactaac 25620
cttatttgat gagaggaatg agcatgagca tggttgtgat ggagaagaac tctggtggag 25680
ctttcctgga cactttttct actaaagctt tggctaactt tcttactctc ataagaagaa 25740
gatgttattt ttcactgacc ctttagaagg tcaacaagca aaatgccttc agcatcccaa 25800
atgtctgttg tcatgacttt tgttcttgac tagtctggtt ttgctttgac tggaccactt 25860
ctacctcttt atagccattg ctttgatggt gctttgtctt caagattgta ttagtaaagc 25920
catatttcat cttctgttac aattcttcaa agaaatactt cagaatcttg atctgacatg 25980
tttaaaattt ctattggaag ctctgacctt gggtgcagct gatctgggcg aaacagtttt 26040
ggcatccatc aagtagaaag tttgctcaac tttagttttt cagtcagaat tgtataagct 26100
gaaccagttg agatgtctat ggtgttgtct attgtttctc acagttaatt gttggtcctc 26160
tttgagacat gaacaagatg aaatttttcc tagcaaactg atgtggatga tctgttgctg 26220
cgggcttcac cctcaacaac atctctttct ttcttgaaac aaattatcca ttagtaaact 26280
gatgattggg ggagatgctg tccccataaa ctttttgtaa ggcataaata atttcaccat 26340
tcttccagtt tcaccataaa tttgacgttt ttttgcttca attttagcag cattcatgtt 26400
gctttgataa gagctctttt caaattcatg tcttattcct cttagtgcct caaactagat 26460
cttgttcagt atgacaagtt agtatgagtt tatctgcatg caaaaatctt tgaaatccat 26520
gcatagtttg tttataatat acattttcaa tgaacttttg aagaccccat acatacatat 26580
gtatatatat gcacacacac acacacacac acaccaaaat cttcaaccat tatcagactt 26640
agtgcagaaa aattattcat ccattaacaa gataagaatg ccccttatca tcactactat 26700
ttaaatggag ctcctggcta aaggaaaaga cagggattga aaaaaattag ttaaatctaa 26760
aatgtttatt atttcaggtt tcttagttgc ttaaatggga agggaggtat ggacaaaaga 26820
gaaatcaaag atatttgtgt tatgctactt atcattaaag tatcagaata acttcattgg 26880
aatagaaaaa caccaagatc accccacgat atgttttcta aaatcttctc catttcttta 26940
gacaagtgac catgtattcg gccagtgaag aattaaactc acttgccagc ttataatgca 27000
ggaaaatata gcaaagagat gtggatccaa tagtttctag atagtggtac aggatggcta 27060
agatgaattt atatatctga aatgttcaca aattccctac tcatatagca tgttttcata 27120
atgttttagc aactctaatc ctcgtgactg gattgccacg tctggtattt ccacaacatt 27180
tcctaaacta agaatgagag taagaaatat tttaattcat aacaattata aatctgcaac 27240
tcatgaaaat gacattgcac ttgtgagact tgagaacagt gtcaccttta ccaaagatat 27300
ccatagtgtg tgtctcccag ctgctaccca gaatattcca cctggctcta ctgcttatgt 27360
aacaggatgg ggcgctcaag aatatgctgg taagtgtctc ggaaaaaaaa attaacaata 27420
gaaatgtctt atatttgcta ttaggtaatt ttttaaatta ggaaacatct ggaataggtg 27480
tttctattct tctacagaca gaaccattct atattctgct cagcccaagc tctggctacc 27540
cctgagtctc cttagcaaag caaagcaatg ctccagaaac tatgggaatt ctcaaatata 27600
gtaataggaa aatgtaaaag aaagttatga agacacgagt tctttaataa tccagagatt 27660
ctataagatt caaatagctt ccctataaac aataaaaaag attttgtttg tttgtttgtt 27720
tgcttgtttt ttagagacaa agactttctc agactggagt gcagtggtgc aatcatggct 27780
tactgcagcc tcaaactctg gtcttaagaa atcctcttgc ttcagcctcc caagtagcta 27840
gaattataaa taagtgtgta ccaccatacc cagctttttt tttttttttc tacagacagg 27900
ttcttgctct gttgcccagg ctggtctgga attcctgccc tcaagccatc ctcctgcctt 27960
gttggcctcc caaagcaatg ggaggattta gattagacat tgtatgaggg cttaataatc 28020
cttaaggtat taactgccct ttaaagtatt ctgggatatg gcaaaaactc gatgtgtata 28080
taaacattgg tcatatttgt ttattgaatg aataaaatgg aaactaaaat gaggacaatg 28140
cacaagagct actagaacca gtaagagtat cagcgaagga gtggaagggt agcattgaca 28200
atttccctgg gcttttaccc atgttgtaga ttgtctctcc aaggaataat acaaagcctt 28260
aatagtccta gaacacattc tattgtgttc ttatggccca aagtaaattg gtgtagtaga 28320
taacatttgc accagtcatg aaaaactatt ggtgtcattc tgagagtaca tcaatataaa 28380
atagactagt tctttagcct tgaaactaga ctggtttctc ttttgctgct aggttaaagg 28440
ttattcaata tgtaatcttc caatccaaaa tctgtcagtg gataatttaa aagcttttag 28500
tcaattttaa gatatttgtt ttcttaaaat tttaaggggc actgtgtcac aaagctaaag 28560
aaaaaaaaga aaaaaaaact gatctgtgaa aggggttatc ctcatctact tggggaattt 28620
tggctgcgaa gaaactccaa agtaaatctt tagaagcctt cattgttaaa tatgaaataa 28680
tgtttggagt acatttattt cttctcaaat ttattatagg gtcaataatg tacacatctt 28740
gaagtccatt tttttcctgc ttttataaca aacaggccac acagttccag agctaaggca 28800
aggacaggtc agaataataa gtaatgatgt atgtaatgca ccacatagtt ataatggagc 28860
catcttgtct ggaatgctgt gtgctggagt acctcaaggt ggagtggacg catgtcaggt 28920
aagctcaaga caatctcatc catgtcatca tccaagaagt gtataagcac ttcctagtat 28980
gtgataatgt gatagacata agtgtaacag ttacaataca cagccctgtt cctctaaaat 29040
ttataatcta gattttagaa ataaattttt ttatgaatga agtttatcta tcatgaaagc 29100
attaactctg agaggccaaa ttacagagta gttaaccatc caaagctcaa gaatcagaaa 29160
gacctcgatt tgaattcctt aacctctatt accaagtctc taactaaaag ctggggataa 29220
tcataatagc acctaacttt ttgggtacta agaaaagtta aatgaagact aaatatatca 29280
ggcacatggt aaacaacaaa gaaatctcat ctatttcact attattaatg tagaccatgg 29340
tcactcgtgt taataacttt aacctcaacc ttttaactgc tgtgaaggat taaataaaaa 29400
attaatcact atattataaa aattaattga tatataataa atgaatttta agagatacgt 29460
aataattcat ggactccttg aagatagaaa atttatacaa aatcctagta atttgagtca 29520
caaaagctcc tacaataatg aaacagtatg aatgaaaaag aaaagaaata actattatat 29580
ttggatctag cccataattt ttaaccaaat gcacaaaaac aaacaacaaa tatgaaattc 29640
tcactgtaaa gtgattaaaa tcaaatttga attctaaaat tttaaattaa attatctaaa 29700
cataattgat gcagttatat gttttaatag gttttgttca catatctgaa atccaactcc 29760
acacagtagc aggaacagct ggtgtcagaa attaaatatt cttttagtct ggagttttaa 29820
aaaatcaatc tgtttacttg agtaatttgt tgctgttttc atgggtgaat tgtatacaga 29880
aggataagaa ttattcttcg catcaaaagg tcactgactt tcatatttag tgctcatggt 29940
ctttaaaaag tggataaaaa gtagttctca catttcatgg aaagccccca atccatgagc 30000
acatttccca aaatgaaaca tttttatcaa ctgcaagttg tgtgtaggtg gagatttgtt 30060
tttcaattgt caagatactg ttaattaccc agtcctttat ctccttttgg tggagatgtc 30120
tctgtgctag gaaacccttc ttgctctcct tcctgtttct cttttactac tggccctgaa 30180
acaacaaatt ctcaagtttc atgacagctt tccaaagaat ccatcaatca aataagcaac 30240
acaactcgac actgacaatt ccagacctac taagagcatt aattaagact taaaaataaa 30300
catgagtttt aaaagggtgt tattcattat tttcccattt ataacgtccc ttaccttctg 30360
tccttcagtg catacaaatt attatcttcc ttgaagccca gttcaagccg tacctcacca 30420
tgataccttc catgtatatt ccactctagg cctcactgat ttttaactga aatactataa 30480
tgcatagttc acacttaaaa aaaaaaaaaa aacacagcac tttacataag agcttacagg 30540
atcctatttg ttttatccat tcttttgttc atttttacaa tcattaattc aaaggaatta 30600
tattaattac tttctatgca cccgacgttg tgttaacaca acaatactat ccctgcattc 30660
agcaagtcta tggtctacaa gagaggacac aaattcaaat gtctgtagtc aagcagtgaa 30720
gctggctaga tatggaaaaa ttacaagtcc ctcttgcttt aacatttgct tgcccacatt 30780
tggtcagaca tcatgcaaaa taatttctca ctatagaaaa aaaaacacta caaaaacaat 30840
aatataaaga actgagaact ggttaactga agcatgcata tgtcatctaa aagaagcagg 30900
tgacgaccag cttcatgaag tacttgccat gcatattggc acttcacaca ctgacccttc 30960
tccccaccta gaccagtaat taaacaggta tggatgagct agctactaag agcagccaac 31020
tgaatagctg actaacttag aagcacactt ggtaataata gctgactttt attagtactg 31080
actatactat atgctaagct gtactcaaag tgctttgagt tttaaactga tacaaacatt 31140
atatgaggaa acagaggtac agagagctat tcaccagctt accaaaggtc acatagctgg 31200
taagtggagg acttaaaccc agactatcta gtttcagaac ccacagactt aatccatcgt 31260
gcagaacata agacatactc catctgtctc cccaactagg ttattatgtg cacaaatatt 31320
tattggttgg ttggttcatt attatgactg ggtggtaagt atgtcattag gagtgttttg 31380
cttatgacta tataaatttc ttcaccaaaa gaagactttc tgatgatata ctatgcatca 31440
gacaccacgc agggtgctaa ggttaggaag ataagtgaga cttctagaaa ctcattcatt 31500
caacaaatat ctcctaaggg ctagaagctt aggtttcagc agtgaacaga ataggtatgt 31560
tctctttcgt gttggacctt atagtatatc tgggaaaaca gacattgaat aaatatcaca 31620
aatgcaagtg agtgtttcag agacatgcag ctgctacatc aaaacaaaac agaacaaaac 31680
aaacaaacaa aaactgacca gtgggattaa gtgtaaatag gcacacaaat gcacaaatat 31740
gcttttataa aatagtgaag cagtgacaga gacacacaca agatataaag acacaatgaa 31800
gaacaattga gcccaaagct ggaaagggtg agagtgtgaa ggaaaaaggt tgatcagaga 31860
agttttcccg aaggagagaa agcctggatg attaggaggc aaccactcgg tgactgaggg 31920
aaatctgaaa aatgtatttg tcatcttctc agacttgctg aaggaatgac ttgggtactt 31980
tgaggatttc agtaattttt ccatgacttg gtataatatt tcaaaaggaa ataggctgac 32040
tttatttgta taatgaatgt gactccttcc tcgactgcca tagaaataaa ctccttaata 32100
ttttgggttt gtctttgcac ttaagtaatc agtcattctg tttttttaca gggtgactct 32160
ggtggcccac tagtacaaga agactcacgg cggctttggt ttattgtggg gatagtaagc 32220
tggggagatc agtgtggcct gccggataag ccaggagtgt atactcgagt gacagcctac 32280
cttgactgga ttaggcaaca aactgggatc tagtgcaaca agtgcatccc tgttgcaaag 32340
tctgtatgca ggtgtgcctg tcttaaattc caaagcttta catttcaact gaaaaagaaa 32400
ctagaaatgt cctaatttaa catcttgtta cataaatatg gtttaacaaa cactgtttaa 32460
cctttcttta ttattaaagg ttttctattt tctccagaga actatatgaa tgttgcatag 32520
tactgtggct gtgtaacaga agaaacacac taaactaatt acaaagttaa caatttcatt 32580
acagttgtgc taaatgcccg tagtgagaag aacaggaacc ttgagcatgt atagtagagg 32640
aacctgcaca ggtctgatgg gtcagagggg tcttctctgg gtttcactga ggatgagaag 32700
taagcaaact gtggaaacat gcaaaggaaa aagtgataga ataatattca agacaaaaag 32760
aacagtatga ggcaagagaa ataatatgta tttaaaattt ttggttactc aatatcttat 32820
acttagtatg agtcctaaaa ttaaaaatgt gaaactgttg tactatacgt ataacctaac 32880
cttaattatt ctgtaagaac atgcttccat aggaaatagt ggataatttt cagctattta 32940
aggcaaaagc taaaatagtt cactcctcaa ctgagaccca aagaattata gatatttttc 33000
atgatgaccc atgaaaaata tcactcatct acataaagga gagactatat ctattttata 33060
gagaagctaa gaaatatacc tacacaaact tgtcaggtgc tttacaacta catagtactt 33120
tttaacaaca aaataataat tttaagaatg aaaaatttaa tcatcgggaa gaacgtccca 33180
ctacagactt cctatcactg gcagttatat ttttgagcgt aaaagggtcg tcaaacgcta 33240
aatctaagta acgaattgaa agtttaaaga gggggaagag ttggtttgca aaggaaaagt 33300
ttaaatagct taatatcaat agaatgatcc tgaagacaga aaaaactttg tcactcttcc 33360
tctctcattt tctttctctc tctctcccct tctcatacac atgcctcccc caccaaagaa 33420
tataatgtaa attaaatcca ctaaaatgta atggcatgaa aatctctgta gtctgaatca 33480
ctaatattcc tgagttttta tgagctccta gtacagctaa agtttgccta tgcatgatca 33540
tctatgcgtc agagcttcct ccttctacaa gctaactccc tgcatctggg catcaggact 33600
gctccataca tttgctgaaa acttcttgta tttcctgatg taaaattgtg caaacaccta 33660
caataaagcc atctactttt agggaaaggg agttgaaaat gcaaccaact cttggcgaac 33720
tgtacaaaca aatctttgct atactttatt tcaaataaat tctttttaaa ataatttccc 33780
tgcctaatta tttatggaag ttatgacttt tgaaggacaa ttcaaaacca tttatttaat 33840
tggttctgca atgaaagaac tgccccatat actctactaa aggcttggca ctttctgctg 33900
ccttttaatc cagcgctata attgaggcaa gcgtccagct tgacacctcg agataacttc 33960
gtataatgta tgctatacga agttatgcta gtaactataa cggtcctaag gtagcgagct 34020
agctgcaacc gaggaaaaaa cgtgccatga ggtctctgta tccaagtgtg act 34073
<210> 21
<211> 418
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Рекомбинантный белок
<400> 21
Met Tyr Arg Pro Arg Pro Met Leu Ser Pro Ser Arg Phe Phe Thr Pro
1 5 10 15
Phe Ala Val Ala Phe Val Val Ile Ile Thr Val Gly Leu Leu Ala Met
20 25 30
Met Ala Gly Leu Leu Ile His Phe Leu Ala Phe Asp Gln Lys Ser Tyr
35 40 45
Phe Tyr Arg Ser Ser Phe Gln Leu Leu Asn Val Glu Tyr Asn Ser Gln
50 55 60
Leu Asn Ser Pro Ala Thr Gln Glu Tyr Arg Thr Leu Ser Gly Arg Ile
65 70 75 80
Glu Ser Leu Ile Thr Lys Thr Phe Lys Glu Ser Asn Leu Arg Asn Gln
85 90 95
Phe Ile Arg Ala His Val Ala Lys Leu Arg Gln Asp Gly Ser Gly Val
100 105 110
Arg Ala Asp Val Val Met Lys Phe Gln Phe Thr Arg Asn Asn Asn Gly
115 120 125
Ala Ser Met Lys Ser Arg Ile Glu Ser Val Leu Arg Gln Met Leu Asn
130 135 140
Asn Ser Gly Asn Leu Glu Ile Asn Pro Ser Thr Glu Ile Thr Ser Leu
145 150 155 160
Thr Asp Gln Ala Ala Ala Asn Trp Leu Ile Asn Glu Cys Gly Ala Gly
165 170 175
Pro Asp Leu Ile Thr Leu Ser Glu Gln Arg Ile Leu Gly Gly Thr Glu
180 185 190
Ala Glu Glu Gly Ser Trp Pro Trp Gln Val Ser Leu Arg Leu Asn Asn
195 200 205
Ala His His Cys Gly Gly Ser Leu Ile Asn Asn Met Trp Ile Leu Thr
210 215 220
Ala Ala His Cys Phe Arg Ser Asn Ser Asn Pro Arg Asp Trp Ile Ala
225 230 235 240
Thr Ser Gly Ile Ser Thr Thr Phe Pro Lys Leu Arg Met Arg Val Arg
245 250 255
Asn Ile Leu Ile His Asn Asn Tyr Lys Ser Ala Thr His Glu Asn Asp
260 265 270
Ile Ala Leu Val Arg Leu Glu Asn Ser Val Thr Phe Thr Lys Asp Ile
275 280 285
His Ser Val Cys Leu Pro Ala Ala Thr Gln Asn Ile Pro Pro Gly Ser
290 295 300
Thr Ala Tyr Val Thr Gly Trp Gly Ala Gln Glu Tyr Ala Gly His Thr
305 310 315 320
Val Pro Glu Leu Arg Gln Gly Gln Val Arg Ile Ile Ser Asn Asp Val
325 330 335
Cys Asn Ala Pro His Ser Tyr Asn Gly Ala Ile Leu Ser Gly Met Leu
340 345 350
Cys Ala Gly Val Pro Gln Gly Gly Val Asp Ala Cys Gln Gly Asp Ser
355 360 365
Gly Gly Pro Leu Val Gln Glu Asp Ser Arg Arg Leu Trp Phe Ile Val
370 375 380
Gly Ile Val Ser Trp Gly Asp Gln Cys Gly Leu Pro Asp Lys Pro Gly
385 390 395 400
Val Tyr Thr Arg Val Thr Ala Tyr Leu Asp Trp Ile Arg Gln Gln Thr
405 410 415
Gly Ile
<210> 22
<211> 257
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 22
agcacccctc tcttccgcag agtctaagaa atcgctgtgt ttagccctcg ccctgggcac 60
tgtcctcacg ggagctgctg tggctgctgt cttgctttgg aagttcagta agtgcaggga 120
gcctcgatcc caccatgtgc tcctgcagtc cccagtgctc tgagccagac cctgctctct 180
gggctattga gacctctgga ggccctccgt gaggttcctc tcttacataa cgaggctgtc 240
tctcttccct tctcttg 257
<210> 23
<211> 190
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 23
ggtcagagga ccaaaggtga ggcaaggcca gacttggtgc tcctgtggtt ctcgagataa 60
cttcgtataa tgtatgctat acgaagttat atgcatggcc tccgcgccgg gttttggcgc 120
ctcccgcggg cgcccccctc ctcacggcga gcgctgccac gtcagacgaa gggcgcagcg 180
agcgtcctga 190
<210> 24
<211> 171
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 24
attgttttgc caagttctaa ttccatcaga cctcgacctg cagcccctag ataacttcgt 60
ataatgtatg ctatacgaag ttatgctagt aactataacg gtcctaaggt agcgagctag 120
ctccacgtgg ctttgtccca gacttccttt gtcttcaaca accttctgca a 171
<210> 25
<211> 177
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 25
ggtcagagga ccaaaggtga ggcaaggcca gacttggtgc tcctgtggtt ctcgagataa 60
cttcgtataa tgtatgctat acgaagttat gctagtaact ataacggtcc taaggtagcg 120
agctagctcc acgtggcttt gtcccagact tcctttgtct tcaacaacct tctgcaa 177
<210> 26
<211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 26
gccgtgactg tgaccttctc 20
<210> 27
<211> 22
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 27
tggaggagcc acctgatgcc tc 22
<210> 28
<211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 28
gccttgccct caatggaaac 20
<210> 29
<211> 21
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 29
ggttgcacag caaggaagaa g 21
<210> 30
<211> 24
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 30
ccaggagttc ctgtgagcct accc 24
<210> 31
<211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 31
tggaatggaa ggagctggag 20
<210> 32
<211> 19
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 32
gtcccacctc ctgcaactg 19
<210> 33
<211> 22
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 33
tgagccttcc catcagcctg gg 22
<210> 34
<211> 21
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 34
ccacaatggc acatgggtct g 21
<210> 35
<211> 18
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 35
ggtgcttgct ccccaaga 18
<210> 36
<211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 36
cctaaaaggt gttgtaatgg 20
<210> 37
<211> 24
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 37
ggcaataaag aaggaagacg tttt 24
<210> 38
<211> 120
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 38
ccagtcaggg acacacatgc tcacacgccc gcccacccgc acacactaca gtcgagataa 60
cttcgtataa tgtatgctat acgaagttat atgcatggcc tccgcgccgg gttttggcgc 120
<210> 39
<211> 198
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 39
attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg aataacttcg 60
tataatgtat gctatacgaa gttatgctag taactataac ggtcctaagg tagcgagcta 120
gccaagtctg tgtgctacca agtagcaaaa ctgagcctgg aactcacaca tgcgtgtctg 180
agagcccagc actatcgc 198
<210> 40
<211> 100
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 40
taatctgact ttctcttcat cggtctctct tattctaggc tgagctgtaa cgctgccgtc 60
ccccacatcc agaagctgct tcccttcaga cctacctacg 100
<210> 41
<211> 177
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 41
ccagtcaggg acacacatgc tcacacgccc gcccacccgc acacactaca gtcgagataa 60
cttcgtataa tgtatgctat acgaagttat gctagtaact ataacggtcc taaggtagcg 120
agctagccaa gtctgtgtgc taccaagtag caaaactgag cctggaactc acacatg 177
<210> 42
<211> 19
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 42
gagcagggcc atgacacat 19
<210> 43
<211> 24
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 43
accattagat cccagcactg gaca 24
<210> 44
<211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 44
aaacccttcc cgagagagaa 20
<210> 45
<211> 23
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 45
gaggaacact gtgtcaagga ctt 23
<210> 46
<211> 22
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 46
cctgaaaagc ccggagtggc ag 22
<210> 47
<211> 19
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 47
gggcagagac cacatctga 19
<210> 48
<211> 22
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 48
ggaagccctc tctcgatact tg 22
<210> 49
<211> 22
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 49
ttctaccctg agggcatgca gc 22
<210> 50
<211> 22
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 50
tgggatgtag aaggttgtca ga 22
<210> 51
<211> 22
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 51
ctgagcctgg aactcacaca tg 22
<210> 52
<211> 23
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 52
tctgagagcc cagcactatc gcc 23
<210> 53
<211> 19
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 53
gctgagggtc aggcttgag 19
<210> 54
<211> 21
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 54
tctgcagggt agggagagaa g 21
<210> 55
<211> 29
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 55
tgtttcagaa aaggaagact cacgttaca 29
<210> 56
<211> 24
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 56
gagaccgatg aagagaaagt caga 24
<210> 57
<211> 100
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 57
gaccatttta aggttttgct tggttgtttt ggagggaggg tggtgctttg ctaatggtga 60
attactaact cctcaataaa gaatattatt tgaaataatt 100
<210> 58
<211> 190
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 58
gctgcctttt aatccagcgc tataattgag gcaagcgtcc agcttgacac ctcgagataa 60
cttcgtataa tgtatgctat acgaagttat atgcatggcc tccgcgccgg gttttggcgc 120
ctcccgcggg cgcccccctc ctcacggcga gcgctgccac gtcagacgaa gggcgcagcg 180
agcgtcctga 190
<210> 59
<211> 171
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 59
attgttttgc caagttctaa ttccatcaga cctcgacctg cagcccctag ataacttcgt 60
ataatgtatg ctatacgaag ttatgctagt aactataacg gtcctaaggt agcgagctag 120
ctgcaaccga ggaaaaaacg tgccatgagg tctctgtatc caagtgtgac t 171
<210> 60
<211> 177
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 60
ccagtcaggg acacacatgc tcacacgccc gcccacccgc acacactaca ctcgagataa 60
cttcgtataa tgtatgctat acgaagttat gctagtaact ataacggtcc taaggtagcg 120
agctagctgc aaccgaggaa aaaacgtgcc atgaggtctc tgtatccaag tgtgact 177
<210> 61
<211> 21
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 61
tcctctccag acaagaaagc t 21
<210> 62
<211> 30
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 62
tcatagcagc tttcaaatcc taaacgttga 30
<210> 63
<211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 63
tcgtgtgtag ctggtgagtt 20
<210> 64
<211> 22
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 64
catgcgatca caggaggaga tc 22
<210> 65
<211> 22
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 65
aattgggccc gaagccagat gc 22
<210> 66
<211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 66
cggaaggctt ctgtgacttc 20
<210> 67
<211> 25
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 67
gtctcccact tctgacataa tgaac 25
<210> 68
<211> 27
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 68
cccagtgtta accctacatc tggttcc 27
<210> 69
<211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 69
tgggaagaga ctcttggaca 20
<210> 70
<211> 25
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 70
atgagctcct agtacagcta aagtt 25
<210> 71
<211> 26
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 71
atgcatgatc atctatgcgt cagagc 26
<210> 72
<211> 21
<212> ДНК
<213> Искусственная последовательность
<220>
<223> синтетический олигонуклеотид
<400> 72
tgcccagatg cagggagtta g 21
<---

Claims (43)

1. Грызун, который экспрессирует гуманизированный белок Tmprss, причем геном грызуна содержит гуманизированный ген Tmprss, кодирующий гуманизированный белок Tmprss, где гуманизированный ген Tmprss содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека и расположен в эндогенном локусе Tmprss грызуна и под контролем промотора эндогенного гена Tmprss грызуна, причем гуманизированный белок Tmprss содержит эктодомен, практически идентичный эктодомену белка TMPRSS человека, кодируемого родственным геном TMPRSS человека, и содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна, и где грызун представляет собой мышь или крысу.
2. Грызун по п. 1, где гуманизированный ген Tmprss образован в результате замены геномной последовательности эндогенного гена Tmprss грызуна указанной нуклеотидной последовательностью родственного гена TMPRSS человека.
3. Грызун по п. 1 или 2, где гуманизированный ген Tmprss представляет собой гуманизированный ген Tmprss2, эндогенный ген Tmprss грызуна представляет собой эндогенный ген Tmprss2 грызуна, и родственный ген TMPRSS человека представляет собой ген TMPRSS2 человека.
4. Грызун по п. 3, где белок TMPRSS2 человека содержит аминокислотную последовательность, приведенную в SEQ ID NO: 4.
5. Грызун по п. 3, где нуклеотидная последовательность гена TMPRSS2 человека содержит область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS2 человека.
6. Грызун по п. 3, где гуманизированный ген Tmprss2 содержит
(i) кодирующие экзоны 1-2 эндогенного гена Tmprss2 грызуна,
(ii) экзон 3, который содержит 5'-часть кодирующего экзона 3 эндогенного гена Tmprss2 грызуна и 3'-часть кодирующего экзона 3 гена TMPRSS2 человека, и
(iii) область от кодирующего экзона 4 до кодирующего экзона 13 гена TMPRSS2 человека, и где гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам белка Tmprss2 грызуна, кодируемого указанным эндогенным геном Tmprss2 грызуна, и эктодомен, который практически идентичен эктодомену белка TMPRSS2 человека, кодируемого указанным геном TMPRSS2 человека.
7. Грызун по п. 1 или 2, где гуманизированный ген Tmprss представляет собой гуманизированный ген Tmprss4, эндогенный ген Tmprss грызуна представляет собой эндогенный ген Tmprss4 грызуна, и родственный ген TMPRSS человека представляет собой ген TMPRSS4 человека.
8. Грызун по п. 7, где белок TMPRSS4 человека содержит аминокислотную последовательность, приведенную в SEQ ID NO: 11.
9. Грызун по п. 7, где нуклеотидная последовательность гена TMPRSS4 человека содержит область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека.
10. Грызун по п. 7, где гуманизированный ген Tmprss4 содержит область от кодирующего экзона 1 до кодирующего экзона 3 эндогенного гена Tmprss4 грызуна и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека.
11. Грызун по п. 1 или 2, где гуманизированный ген Tmprss представляет собой гуманизированный ген Tmprss11d, эндогенный ген Tmprss грызуна представляет собой эндогенный ген Tmprss11d грызуна, и родственный ген TMPRSS человека представляет собой ген TMPRSS11D человека.
12. Грызун по п. 11, где белок TMPRSS11D человека содержит аминокислотную последовательность, приведенную в SEQ ID NO: 18.
13. Грызун по п. 11, где нуклеотидная последовательность гена TMPRSS11D человека содержит область от кодирующего экзона 3 до стоп-кодона в кодирующем экзоне 10 гена TMPRSS11D человека.
14. Грызун по п. 11, где гуманизированный ген Tmprss11d содержит кодирующие экзоны 1-2 эндогенного гена Tmprss11d грызуна и область от кодирующего экзона 3 до кодирующего экзона 10 гена TMPRSS11D человека.
15. Грызун по любому из пп. 1-14, где грызун представляет собой мышь.
16. Грызун по любому из пп. 1-14, где грызун представляет собой крысу.
17. Грызун по п. 15 или 16, где грызун является гетерозиготным по гуманизированному гену Tmprss.
18. Грызун по п. 15 или 16, где грызун является гомозиготным по гуманизированному гену Tmprss.
19. Выделенная клетка грызуна, которая экспрессирует гуманизированный белок Tmprss, в геноме которой содержится гуманизированный ген Tmprss, кодирующий гуманизированный белок Tmprss, причем гуманизированный ген Tmprss содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека и расположен в эндогенном локусе Tmprss грызуна и находится под контролем промотора эндогенного гена Tmprss грызуна, причем гуманизированный белок Tmprss содержит эктодомен, практически идентичный эктодомену белка TMPRSS человека, кодируемого родственным геном TMPRSS человека, и содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна, и где клетка грызуна представляет собой клетку мыши или клетку крысы.
20. Выделенная клетка грызуна по п. 19, где гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d.
21. Выделенная ткань грызуна, которая экспрессирует гуманизированный белок Tmprss, в геноме которой содержится гуманизированный ген Tmprss, кодирующий гуманизированный белок Tmprss, причем гуманизированный ген Tmprss содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека и расположен в эндогенном локусе Tmprss грызуна и находится под контролем промотора эндогенного гена Tmprss грызуна, причем гуманизированный белок Tmprss содержит эктодомен, практически идентичный эктодомену белка TMPRSS человека, кодируемого родственным геном TMPRSS человека, и содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна, и где ткань грызуна представляет собой ткань мыши или ткань крысы.
22. Выделенная ткань грызуна по п. 21, где гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d.
23. Эмбриональная стволовая (ЭС) клетка грызуна для получения грызуна, который экспрессирует гуманизированный белок Tmprss, содержащая гуманизированный ген Tmprss, кодирующий гуманизированный белок Tmprss, где гуманизированный ген Tmprss содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека и расположен в эндогенном локусе Tmprss грызуна и под контролем промотора эндогенного гена Tmprss грызуна, причем гуманизированный белок Tmprss содержит эктодомен, практически идентичный эктодомену белка TMPRSS человека, кодируемого родственным геном TMPRSS человека, и содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна, и где ЭС клетка грызуна представляет собой ЭС клетку мыши или ЭС клетку крысы.
24. ЭС клетка грызуна по п. 23, где гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d.
25. Эмбрион грызуна для получения грызуна, который экспрессирует гуманизированный белок Tmprss, содержащий ЭС клетку грызуна по п. 23 или 24, причем эмбрион грызуна представляет собой эмбрион мыши или эмбрион крысы.
26. Способ получения грызуна, имеющего гуманизированный ген Tmprss, включающий:
(a) вставку геномного фрагмента в эндогенный локус Tmprss грызуна в ЭС клетке грызуна, при этом указанный геномный фрагмент содержит нуклеотидную последовательность родственного гена TMPRSS человека, тем самым обеспечивая получение ЭС клетки грызуна, содержащей гуманизированный ген Tmprss, где гуманизированный ген Tmprss находится под контролем промотора гена Tmprss грызуна в эндогенном локусе Tmprss грызуна и кодирует гуманизированный белок Tmprss, где гуманизированный белок Tmprss содержит эктодомен, практически идентичный эктодомену белка TMPRSS человека, кодируемого родственным геном TMPRSS человека, и содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна, и где грызун представляет собой мышь или крысу; и
(b) получение грызуна с применением ЭС клетки грызуна полученной в (а).
27. Способ по п. 26, где гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d.
28. Способ по п. 27, где гуманизированный ген Tmprss2 содержит
(i) кодирующие экзоны 1-2 эндогенного гена Tmprss2 грызуна,
(ii) экзон 3, который содержит 5'-часть кодирующего экзона 3 эндогенного гена Tmprss2 грызуна и 3'-часть кодирующего экзона 3 гена TMPRSS2 человека, и
(iii) и область от кодирующего экзона 4 до кодирующего экзона 13 гена TMPRSS2 человека, и/или где гуманизированный ген Tmprss4 содержит область от кодирующего экзона 1 до кодирующего экзона 3 эндогенного гена Tmprss4 грызуна и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека, и/или где гуманизированный ген Tmprss11d содержит кодирующие экзоны 1-2 эндогенного гена Tmprss11d грызуна и область от кодирующего экзона 3 до кодирующего экзона 10 гена TMPRSS11D человека.
29. Способ по любому из пп. 26-28, где грызун представляет собой мышь.
30. Способ по любому из пп. 26-28, где грызун представляет собой крысу.
31. Способ оценки терапевтической эффективности соединения в лечении инфекции, вызванной вирусом гриппа, включающий:
получение грызуна по любому из пп. 1-18;
введение грызуну вируса гриппа и соединения кандидата; и
мониторинг наличия и тяжести инфекции, вызванной вирусом гриппа, у грызуна для определения терапевтической эффективности соединения кандидата.
32. Способ по п. 31, где соединение кандидат представляет собой антитело или его антигенсвязывающий фрагмент, специфичный в отношении белка TMPRSS человека.
RU2018131152A 2016-02-29 2017-02-27 Грызуны, характеризующиеся гуманизированным геном tmprss RU2749715C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662301023P 2016-02-29 2016-02-29
US62/301,023 2016-02-29
PCT/US2017/019574 WO2017151453A1 (en) 2016-02-29 2017-02-27 Rodents having a humanized tmprss gene

Publications (3)

Publication Number Publication Date
RU2018131152A RU2018131152A (ru) 2020-04-01
RU2018131152A3 RU2018131152A3 (ru) 2020-07-13
RU2749715C2 true RU2749715C2 (ru) 2021-06-16

Family

ID=58264641

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018131152A RU2749715C2 (ru) 2016-02-29 2017-02-27 Грызуны, характеризующиеся гуманизированным геном tmprss

Country Status (14)

Country Link
US (5) US10070632B2 (ru)
EP (2) EP3422845B1 (ru)
JP (1) JP6980674B2 (ru)
KR (2) KR102493894B1 (ru)
CN (1) CN109068621B (ru)
AU (1) AU2017228293B2 (ru)
CA (1) CA3014645C (ru)
DK (1) DK3422845T3 (ru)
ES (1) ES2886958T3 (ru)
IL (1) IL261139B (ru)
PT (1) PT3422845T (ru)
RU (1) RU2749715C2 (ru)
SG (2) SG11201807038UA (ru)
WO (1) WO2017151453A1 (ru)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102493894B1 (ko) * 2016-02-29 2023-01-31 리제너론 파마슈티칼스 인코포레이티드 인간화 tmprss 유전자를 갖는 설치류
EP4276185A3 (en) * 2017-09-29 2024-02-21 Regeneron Pharmaceuticals, Inc. Rodents comprising a humanized ttr locus and methods of use
MA46731B1 (fr) 2018-01-26 2021-06-30 Regeneron Pharma Anticorps anti-tmprss2 et fragments de liaison à l'antigène
CN116200426A (zh) 2018-07-16 2023-06-02 瑞泽恩制药公司 Ditra疾病的非人动物模型及其用途
MX2021008291A (es) 2019-01-17 2021-08-05 Regeneron Pharma Un modelo de roedor de trastornos del estado de animo.
AU2021219671A1 (en) 2020-02-10 2022-07-14 Regeneron Pharmaceuticals, Inc. Anti-Tmprss2 Antibodies and Antigen-Binding Fragments
CN115161326A (zh) * 2021-06-21 2022-10-11 百奥赛图(北京)医药科技股份有限公司 Sost基因人源化非人动物及其构建方法和应用
WO2023122506A1 (en) * 2021-12-20 2023-06-29 Regeneron Pharmaceuticals, Inc. Non-human animals comprising humanized ace2 and tmprss loci

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050026255A1 (en) * 2002-06-25 2005-02-03 Morser John Michael Corin, a serine protease
US20060101531A1 (en) * 2004-08-19 2006-05-11 Fred Hutchinson Cancer Research Center Animal models of cancer development and metastasis
RU2425880C2 (ru) * 2009-07-30 2011-08-10 Учреждение Российской академии наук Институт общей генетики им. Н.И. Вавилова РАН Способ получения трансгенных мышей

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002065266A (ja) * 2000-08-28 2002-03-05 Teijin Ltd 気道特異的トリプシン様酵素およびその利用法
US6586251B2 (en) 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US7479579B2 (en) * 2001-12-20 2009-01-20 The Regents Of The University Of California Triple transgenic mouse model of Alzheimer's disease
EP1558731A4 (en) * 2002-10-04 2007-01-10 Schering Ag MODIFIED HEPSINE MOLECULES COMPRISING A SUBSTITUTION ACTIVATION SEQUENCE AND USES THEREOF
RU2006100035A (ru) * 2003-06-11 2006-08-27 Шеринг Акциенгезельшафт (De) Новые модифицированные кориновые молекулы, имеющие замещенные активирующие последовательности, и их применение
ES2667169T3 (es) 2004-10-19 2018-05-09 Regeneron Pharmaceuticals, Inc. Método para generar un animal no humano homocigótico para una modificación genética
CA2651043A1 (en) * 2006-05-23 2007-12-06 David C. Tully Compounds and compositions as channel activating protease inhibitors
GB0821624D0 (en) * 2008-11-26 2008-12-31 Eisai London Res Lab Ltd Assay
JP5851842B2 (ja) * 2009-01-12 2016-02-03 サイトムエックス セラピューティクス, インク.CytomX Therapeutics, Inc. 改変した抗体組成物、それを作製および使用する方法
ES2908587T3 (es) 2009-10-06 2022-05-03 Regeneron Pharma Ratones modificados genéticamente e injerto
DK3375284T3 (da) * 2011-02-15 2023-06-12 Univ Yale Humaniserede M-CSF-mus og anvendelser deraf
SI2770821T1 (en) 2011-10-28 2018-01-31 Regeneron Pharmaceuticals, Inc. Genetically modified major histocompatibility complex of mice
HUE048511T2 (hu) 2011-10-28 2020-07-28 Regeneron Pharma Kiméra fõ hisztokompatibilitási komplex (MHC) II molekulákat expresszáló, genetikailag módosított egerek
SG10201600965YA (en) 2011-10-28 2016-03-30 Regeneron Pharma Humanized il-6 and il-6 receptor
BR112014025339A8 (pt) * 2012-04-16 2018-01-16 Regeneron Pharma método para tratamento ou prevenção ou redução de infecção do virus influenza e composição farmacêutica para o mesmo.
US8962913B2 (en) 2012-06-18 2015-02-24 Regeneron Pharmaceuticals, Inc. Humanized IL-7 rodents
PE20150643A1 (es) * 2012-06-22 2015-05-29 Cytomx Therapeutics Inc Anticuerpos de reaccion cruzada anti-jagged 1/jagged 2 anticuerpos anti-jagged activables y metodos de uso de los mismos
EP4193834A1 (en) 2012-09-07 2023-06-14 Yale University Genetically modified non-human animals and methods of use thereof
EP3556206B1 (en) 2012-11-05 2021-06-02 Regeneron Pharmaceuticals, Inc. Genetically modified non-human animals and methods of use thereof
HUE045478T2 (hu) 2013-02-20 2019-12-30 Regeneron Pharma Humanizált T-sejt koreceptorokat expresszáló egerek
EP2958990B1 (en) 2013-02-20 2019-10-16 Regeneron Pharmaceuticals, Inc. Genetic modification of rats
JP6444321B2 (ja) 2013-02-22 2018-12-26 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. ヒト化主要組織適合性遺伝子複合体を発現するマウス
US20150342163A1 (en) 2013-02-22 2015-12-03 Regeneron Pharmaceuticals, Inc. Genetically modified major histocompatibility complex mice
HUE040575T2 (hu) 2013-04-16 2019-03-28 Regeneron Pharma A patkány genom célzott módosítása
CA2913732A1 (en) 2013-06-04 2014-12-11 Cytomx Therapeutics, Inc. Compositions and methods for conjugating activatable antibodies
RS64573B1 (sr) 2013-09-23 2023-10-31 Regeneron Pharma Ne-humana životinja sa humanizovanim signalno-regulatornim proteinskim genom
SI3138397T1 (sl) 2013-10-15 2019-04-30 Regeneron Pharmaceuticals, Inc. Humanizirane živali IL-15
JP6484237B2 (ja) 2013-11-19 2019-03-13 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. ヒト化増殖誘導リガンド遺伝子を有する非ヒト動物
WO2015077071A1 (en) 2013-11-19 2015-05-28 Regeneron Pharmaceuticals, Inc. Non-human animals having a humanized b-cell activating factor gene
ES2794942T3 (es) 2014-04-08 2020-11-19 Regeneron Pharma Animales no humanos que tienen receptores Fc-gamma humanizados
NO2785538T3 (ru) 2014-05-07 2018-08-04
DK3841877T3 (da) 2014-05-19 2023-11-27 Regeneron Pharma Genetisk modificeret mus, der eksprimerer human EPO
RU2735958C2 (ru) 2014-06-19 2020-11-11 Регенерон Фармасьютикалз, Инк. Животные, отличные от человека, имеющие гуманизированный ген 1 запрограммированной гибели клеток
RU2020122439A (ru) 2014-11-24 2020-09-24 Регенерон Фармасьютикалз, Инк. Не относящиеся к человеку животные, экспрессирующие гуманизированный комплекс cd3
US20160345549A1 (en) 2014-12-05 2016-12-01 Regeneron Pharmaceuticals, Inc. Non-human animals having a humanized cluster of differentiation 47 gene
PT3230320T (pt) 2014-12-09 2021-01-08 Regeneron Pharma Animais não humanos tendo um gene do cluster humanizado de diferenciação 274
HRP20231039T1 (hr) 2015-04-06 2023-12-22 Regeneron Pharmaceuticals, Inc. Imunosni odgovori posredovani humaniziranim t stanicama kod ne-humanih životinja
KR102454546B1 (ko) 2015-11-20 2022-10-14 리제너론 파마슈티칼스 인코포레이티드 인간화 림프구 활성화 유전자 3을 갖는 비인간 동물
KR102493894B1 (ko) 2016-02-29 2023-01-31 리제너론 파마슈티칼스 인코포레이티드 인간화 tmprss 유전자를 갖는 설치류
KR101693243B1 (ko) * 2016-06-15 2017-01-05 재단법인 한국파스퇴르연구소 인플루엔자 바이러스의 복제에 관여하는 신규 인간 유전자 및 이의 용도

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050026255A1 (en) * 2002-06-25 2005-02-03 Morser John Michael Corin, a serine protease
US20060101531A1 (en) * 2004-08-19 2006-05-11 Fred Hutchinson Cancer Research Center Animal models of cancer development and metastasis
RU2425880C2 (ru) * 2009-07-30 2011-08-10 Учреждение Российской академии наук Институт общей генетики им. Н.И. Вавилова РАН Способ получения трансгенных мышей

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
NORA KUHN et al., The Proteolytic Activation of (H3N2) Influenza A Virus Hemagglutinin Is Facilitated by Different Type II Transmembrane Serine Proteases, J Virol. 2016, Vol.90, N.9, pp. 4298-4307. *
THOMAS H. BUGGE et al., Type II Transmembrane Serine Proteases, J Biol Chem., 2009, Vol. 284, N.35, pp. 23177-23181. *
THOMAS H. BUGGE et al., Type II Transmembrane Serine Proteases, J Biol Chem., 2009, Vol. 284, N.35, pp. 23177-23181. NORA KUHN et al., The Proteolytic Activation of (H3N2) Influenza A Virus Hemagglutinin Is Facilitated by Different Type II Transmembrane Serine Proteases, J Virol. 2016, Vol.90, N.9, pp. 4298-4307. *
YU SUN, Characterization of the TMPRSS2 Protease as a Modulator of Prostate Cancer Metastasis, 2009. *

Also Published As

Publication number Publication date
EP3895529A1 (en) 2021-10-20
US20240147971A1 (en) 2024-05-09
RU2018131152A3 (ru) 2020-07-13
ES2886958T3 (es) 2021-12-21
RU2018131152A (ru) 2020-04-01
AU2017228293A1 (en) 2018-08-23
US20170290308A1 (en) 2017-10-12
SG10202001578RA (en) 2020-04-29
IL261139A (en) 2018-10-31
DK3422845T3 (da) 2021-08-30
WO2017151453A1 (en) 2017-09-08
CN109068621B (zh) 2021-07-20
JP6980674B2 (ja) 2021-12-15
SG11201807038UA (en) 2018-09-27
IL261139B (en) 2022-04-01
US20180332831A1 (en) 2018-11-22
CA3014645C (en) 2022-10-25
PT3422845T (pt) 2021-08-26
US10863729B2 (en) 2020-12-15
KR20180117122A (ko) 2018-10-26
US20170245482A1 (en) 2017-08-31
KR102493894B1 (ko) 2023-01-31
US10070631B2 (en) 2018-09-11
EP3422845A1 (en) 2019-01-09
US11910787B2 (en) 2024-02-27
CA3014645A1 (en) 2017-09-08
US20210068377A1 (en) 2021-03-11
JP2019511918A (ja) 2019-05-09
US10070632B2 (en) 2018-09-11
EP3422845B1 (en) 2021-06-02
AU2017228293B2 (en) 2023-05-25
KR20230021759A (ko) 2023-02-14
CN109068621A (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
RU2749715C2 (ru) Грызуны, характеризующиеся гуманизированным геном tmprss
KR102650439B1 (ko) 제한된 면역글로불린 중쇄 유전자좌를 가지는 인간화된 비-인간 동물
US20230056182A1 (en) Use of adeno-associated viral vectors to correct gene defects/ express proteins in hair cells and supporting cells in the inner ear
AU2016364667A1 (en) Materials and methods for treatment of Alpha-1 antitrypsin deficiency
KR20120099363A (ko) 탯줄 혈액으로부터의 유도 만능 줄기 세포의 생성
AU2023202878A1 (en) Methods for targeted insertion of DNA in genes
KR20220012230A (ko) 스플라이싱 및 번역을 조절하기 위한 방법 및 조성물
RU2744831C2 (ru) Не относящееся к человеку животное, у которого проявляется снижение функции верхних и нижних моторных нейронов и чувственного восприятия
KR102661616B1 (ko) Gpr156 변이체 및 이들의 용도
KR20220025806A (ko) 핵산의 무작위 구성 표적화 통합
KR20210116480A (ko) 기분 장애의 설치류 모델
JP2003259875A (ja) ヒト遺伝子の一塩基多型(4)
JP2003116575A (ja) 新規遺伝子及びそれにコードされる蛋白質
JP2003180359A (ja) 新規遺伝子及びそれにコードされる蛋白質
JP2002345492A (ja) 新規遺伝子及びそれにコードされる蛋白質
CA2480771A1 (en) Isolated human transporter proteins, nucleic acid molecules encoding human transporter proteins, and used thereof
JP2003135081A (ja) 新規遺伝子及びそれにコードされる蛋白質
JP2003245081A (ja) 新規遺伝子及びそれにコードされる蛋白質
CA2439155A1 (en) Isolated human tumor supressor proteins, nucleic acid molecules encoding these human tumor supressor proteins, and uses thereof