KR20210013589A - 면역 체크포인트 억제제 공동-발현 벡터 - Google Patents

면역 체크포인트 억제제 공동-발현 벡터 Download PDF

Info

Publication number
KR20210013589A
KR20210013589A KR1020207036367A KR20207036367A KR20210013589A KR 20210013589 A KR20210013589 A KR 20210013589A KR 1020207036367 A KR1020207036367 A KR 1020207036367A KR 20207036367 A KR20207036367 A KR 20207036367A KR 20210013589 A KR20210013589 A KR 20210013589A
Authority
KR
South Korea
Prior art keywords
sequence
antigen
vector
nucleic acid
acid sequence
Prior art date
Application number
KR1020207036367A
Other languages
English (en)
Inventor
웨이드 블레어
카린 주스
레오니드 기틀린
시아란 다니엘 스캘란
에이미 레이첼 라파포트
기스베르트 마믹스 그로텐베르그
Original Assignee
그릿스톤 온콜로지, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 그릿스톤 온콜로지, 인코포레이티드 filed Critical 그릿스톤 온콜로지, 인코포레이티드
Publication of KR20210013589A publication Critical patent/KR20210013589A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/0005Vertebrate antigens
    • A61K39/0011Cancer antigens
    • A61K39/001184Cancer testis antigens, e.g. SSX, BAGE, GAGE or SAGE
    • A61K39/001188NY-ESO
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/0005Vertebrate antigens
    • A61K39/0011Cancer antigens
    • A61K39/00119Melanoma antigens
    • A61K39/001191Melan-A/MART
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/0005Vertebrate antigens
    • A61K39/0012Lipids; Lipoproteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/16Antivirals for RNA viruses for influenza or rhinoviruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • C07K16/2818Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily against CD28 or CD152
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/505Medicinal preparations containing antigens or antibodies comprising antibodies
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/572Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 cytotoxic response
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/575Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/60Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
    • A61K2039/6031Proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/60Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
    • A61K2039/6031Proteins
    • A61K2039/6037Bacterial toxins, e.g. diphteria toxoid [DT], tetanus toxoid [TT]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/60Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
    • A61K2039/6031Proteins
    • A61K2039/605MHC molecules or ligands thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/70Multivalent vaccine
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/70539MHC-molecules, e.g. HLA-molecules
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70596Molecules with a "CD"-designation not provided for elsewhere
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16111Cytomegalovirus, e.g. human herpesvirus 5
    • C12N2710/16134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16211Lymphocryptovirus, e.g. human herpesvirus 4, Epstein-Barr Virus
    • C12N2710/16234Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/20011Papillomaviridae
    • C12N2710/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2730/00Reverse transcribing DNA viruses
    • C12N2730/00011Details
    • C12N2730/10011Hepadnaviridae
    • C12N2730/10111Orthohepadnavirus, e.g. hepatitis B virus
    • C12N2730/10134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/14011Deltaretrovirus, e.g. bovine leukeamia virus
    • C12N2740/14034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16111Human Immunodeficiency Virus, HIV concerning HIV env
    • C12N2740/16134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16211Human Immunodeficiency Virus, HIV concerning HIV gagpol
    • C12N2740/16234Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16311Human Immunodeficiency Virus, HIV concerning HIV regulatory proteins
    • C12N2740/16334Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16111Influenzavirus A, i.e. influenza A virus
    • C12N2760/16134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24111Flavivirus, e.g. yellow fever virus, dengue, JEV
    • C12N2770/24141Use of virus, viral particle or viral elements as a vector
    • C12N2770/24143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24211Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
    • C12N2770/24234Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/36011Togaviridae
    • C12N2770/36111Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
    • C12N2770/36141Use of virus, viral particle or viral elements as a vector
    • C12N2770/36143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Virology (AREA)
  • Epidemiology (AREA)
  • Mycology (AREA)
  • Molecular Biology (AREA)
  • Oncology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Communicable Diseases (AREA)
  • Pulmonology (AREA)
  • Analytical Chemistry (AREA)
  • Cell Biology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

항원-인코딩 핵산 서열 및 공동-발현 면역 조절제를 포함하는 벡터가 본원에서 개시된다. 백신으로서의 용도를 포함하는 벡터와 관련된 뉴클레오티드, 세포, 및 방법이 또한 개시된다.

Description

면역 체크포인트 억제제 공동-발현 벡터
관련 출원에 대한 상호 참조
본 출원은 2018년 5월 23일에 출원된 62/675,624의 이익을 주장하며, 이들 각각은 모든 목적을 위해 전체가 참조로 여기에 통합된다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출된 서열 목록을 포함하며 그 전체가 참조로 통합된다. 2019년 5월 22일에 생성된 ASCII 사본의 이름은 GSO_018_WO_Sequence_Listing.txt이고 크기는 422,185 바이트이다.
종양-특이적 항원에 기초한 치료 백신은 차세대 개인화된 암 면역요법으로 큰 기대를 받고 있다. 1-3예를 들면, 비-소세포 폐암(NSCLC) 및 흑색종과 같은 높은 돌연변이 부하를 가진 암은 신생항원 생성의 가능성이 상대적으로 높을 경우 상기 치료법의 특히 매력적인 표적이다. 4,5조기에 발견된 증거에 따르면 신생항원-기반 백신접종으로 T-세포 반응이 유도될 수 있으며6, 신생항원 표적화된 세포-요법은 선택된 환자의 특정한 상황에서 종양 퇴화를 유도할 수 있음7을 보여준다.
현 신생항원 예측 방법의 문제점 이외에, 인간에서의 신생항원 전달에 사용될 수 있는 벡터 시스템에 대한 특정 도전도 존재하며, 이 중 많은 것들은 인간에서 유래된다. 예를 들어, 많은 인간들은 이전에 자연 노출의 결과로서 인간 바이러스에 대한 면연력이 이미 존재하고, 이 면역력은 암 치료를 위한 신생항원 전달을 위해 재조합 인간 바이러스의 주요 장애가 될 수 있다.
면역 체크포인트 억제제의 사용은 암 치료에서 큰 가능성을 보여 주었다. 그러나, 특히 DNA 또는 RNA 기반 암 백신의 경우 개선된 전달 방법이 여전히 필요하다.
요약
항원 카세트를 포함하는 벡터 시스템이 본원에 개시되며, 항원 카세트는: (1) 적어도 하나의 항원-인코딩 핵산 서열을 포함하는, 대상체 내에서 종양 존재와 연관된 적어도 하나의 항원-인코딩 핵산 서열로서, 선택적으로 적어도 하나의 항원-인코딩 핵산 서열은 MHC 부류 I 항원-인코딩 핵산 서열을 포함하고, 각각은: a. 에피토프 인코딩 핵산 서열로서, 선택적으로 인코딩된 펩티드 서열을 야생형 핵산 서열에 의해 인코딩된 상응하는 펩티드 서열과 구별되도록 하는 적어도 하나의 변경을 포함하는, 에피토프 인코딩 핵산 서열, b. 선택적으로 5' 링커 서열, 및 c. 선택적으로 3' 링커 서열을 포함하는, 대상체 내에서 종양 존재와 연관된 적어도 하나의 항원-인코딩 핵산 서열; (2) 적어도 하나의 항원-인코딩 핵산 서열에 작동 가능하게 연결된 적어도 하나의 프로모터 서열, (3) 선택적으로, 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열; (4) 선택적으로, 적어도 하나의 GPGPG 링커 서열(서열 번호: 56); (5) 선택적으로, 적어도 하나의 폴리아데닐화 서열을 포함하며; 및 벡터는, 선택적으로 카세트 내에, 적어도 하나의 면역 조절제를 인코딩하는 핵산 서열을 추가로 포함하고, 선택적으로 여기서 적어도 하나의 면역 조절제를 인코딩하는 핵산 서열은: (1) 적어도 하나의 면역 조절제를 인코딩하는 서열 및 적어도 하나의 항원-인코딩 핵산 서열을 분리하는 내부 리보솜 유입 서열(IRES) 서열이 있는 적어도 하나의 항원-인코딩 핵산 서열과 동일한 전사체(transcript), 또는 (2) 적어도 하나의 항원-인코딩 핵산 서열과 상이한 전사체 상에서 전사되며, 여기서 적어도 하나의 제2 프로모터 서열은 적어도 하나의 면역 조절제를 인코딩하는 서열에 작동 가능하게 연결된다.
또한, 다음을 포함하는 침팬지 아데노바이러스 벡터가 본원에 개시된다: a. E1(nt 577 내지 3403) 결손 및 E3(nt 27, 125-31, 825) 결손이 있는 서열 번호: 1의 서열을 포함하는 수정된 ChAdV68 서열; b. CMV 프로모터 서열; c. SV40 폴리아데닐화 신호 뉴클레오티드 서열; d. 면역 체크포인트 억제제를 인코딩하는 핵산 서열, 및 e. 항원 카세트로서, 다음을 포함하는 항원 카세트: (1) 대상체 내에서 종양 존재로부터 유래된 적어도 하나의 항원-인코딩 핵산 서열로서, 적어도 하나의 항원-인코딩 핵산 서열은: 서로 선형으로 연결된 적어도 10개의 종양-특이적 및 대상체-특이적 MHC 부류 I 항원-인코딩 핵산 서열을 포함하며 각각은: (A) 인코딩된 펩티드 서열을 야생형 핵산 서열에 의해 인코딩된 상응하는 펩티드 서열과 구별되도록 하는 적어도 하나의 변경이 있는 MHC 부류 I 에피토프 인코딩 핵산 서열, (B) 5' 링커, (C) 3' 링커를 포함하고, 여기서 MHC I 에피토프 인코딩 핵산 서열은 7개 내지 15개 아미노산 길이의 MHC 부류 I 에피토프를 인코딩하고, 여기서 5' 링커 서열은 MHC I 에피토프의 네이티브 N-말단 아미노산 서열을 인코딩하고, 여기서 5' 링커 서열은 적어도 3개 아미노산 길이인 펩티드를 인코딩하고, 여기서 3' 링커 서열은 MHC I 에피토프의 네이티브 C-말단 아미노산 서열을 인코딩하고, 여기서 3' 링커 서열은 적어도 3개 아미노산 길이인 펩티드를 인코딩하고, 여기서 각 MHC 부류 I 항원-인코딩 핵산 서열은 25개 아미노산 길이인 폴리펩티드를 인코딩하며, 여기서 각 MHC 부류 I 항원-인코딩 핵산 서열의 각 3' 말단은 최종 MHC 부류 I 항원-인코딩 핵산 서열을 제외하고 다음 MHC 부류 I 항원-인코딩 핵산 서열의 5' 말단에 연결되는, 대상체 내에서 종양 존재로부터 유래된 적어도 하나의 항원-인코딩 핵산 서열; 및 (2) 적어도 2개의 MHC 부류 II 항원-인코딩 핵산 서열로서, (A) PADRE MHC 부류 II 서열(서열 번호: 48), (B) 파상풍 변독소 MHC 부류 II 서열(서열 번호: 46), (C) PADRE MHC 부류 II 서열 및 파상풍 변독소 MHC 부류 II 서열을 연결하는 GPGPG 아미노산 링커 서열을 인코딩하는 제1 핵산 서열, (D) 적어도 10개의 종양-특이적 및 대상체-특이적 MHC 부류 I 신생항원-인코딩 핵산 서열에 적어도 2개의 MHC 부류 II 항원-인코딩 핵산 서열의 5' 말단을 연결하는 GPGPG 아미노산 링커 서열을 인코딩하는 제2 핵산 서열, (E) 선택적으로, 적어도 2개의 MHC 부류 II 항원-인코딩 핵산 서열의 3' 말단에서 GPGPG 아미노산 링커 서열을 인코딩하는 제3 핵산 서열을 포함하는, 적어도 2개의 MHC 부류 II 항원-인코딩 핵산 서열; 및 여기서 항원 카세트는 E1 결손 내에 삽입되며 CMV 프로모터 서열은 항원 카세트에 작동 가능하게 연결되고, 여기서 체크포인트 억제제를 인코딩하는 핵산 서열은: (1) 체크포인트 억제제를 인코딩하는 서열 및 적어도 하나의 항원-인코딩 핵산 서열을 분리하는 내부 리보솜 유입 서열(IRES) 서열이 있는 적어도 하나의 항원-인코딩 핵산 서열과 동일한 전사체 상에서, 또는 (2) 적어도 하나의 항원-인코딩 핵산 서열과 상이한 전사체 상에서 전사되며, 선택적으로 여기서 제2 CMV 프로모터 서열은 적어도 하나의 면역 조절제를 인코딩하는 서열과 작동 가능하게 연결되거나, 또는 선택적으로 여기서 적어도 하나의 면역 억제제는 E3 결손 내에 삽입된다.
일부 양태에서, 벡터의 각 요소의 순서화된 서열은 5' 내지 3'의 다음 식에 기재되며, 다음을 포함한다:
Figure pct00001
여기서 P는 적어도 하나의 항원-인코딩 핵산 서열의 적어도 하나에 작동 가능하게 연결된 적어도 하나의 프로모터 서열을 포함하되, a = 1이고, N은 인코딩된 펩티드 서열을 야생형 핵산 서열에 의해 인코딩된 상응하는 펩티드 서열과 구별되도록 하는 적어도 하나의 변경이 있는 에피토프 인코딩 핵산 서열 중 하나를 포함하되, c = 1이고, L5는 5' 링커 서열을 포함하되, b = 0 또는 1이고, L3은 3' 링커 서열을 포함하되, d = 0 또는 1이고, G5는 GPGPG 아미노산 링커를 인코딩하는 적어도 하나의 핵산 서열 중 하나를 포함하되, e = 0 또는 1이고, G3은 GPGPG 아미노산 링커를 인코딩하는 적어도 하나의 핵산 서열 중 하나를 포함하되, g = 0 또는 1이고, U는 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열 중 하나를 포함하되, f = 1이고, A는 적어도 하나의 폴리아데닐화 서열을 포함하되, h = 0 또는 1이고, X = 2 내지 400이되, 각 X에 대해 상응하는 Nc는 에피토프 인코딩 핵산 서열이고, 선택적으로 여기서 각 X에 대해 상응하는 Nc는 구별되는 MHC 부류 I 에피토프 인코딩 핵산 서열이며, Y = 0 내지 2이되, 각 Y에 대해 상응하는 Uf는 항원-인코딩 핵산 서열이고, 선택적으로 여기서 각 Y에 대해 상응하는 Uf는 구별되는 MHC 부류 II 항원-인코딩 핵산 서열이다. 특정한 양태에서, b = 1, d = 1, e = 1, g = 1, h = 1, X = 10, Y = 2이고, P는 CMV 프로모터 서열이고, 각 N은 7개 내지 15개 아미노산 길이의 MHC 부류 I 에피토프를 인코딩하고, L5는 MHC I 에피토프의 네이티브 N-말단 아미노산 서열을 인코딩하고, 여기서 5' 링커 서열은 적어도 3개 아미노산 길이인 펩티드를 인코딩하고, L3은 MHC I 에피토프의 네이티브 C-말단 아미노산 서열을 인코딩하고, 여기서 3' 링커 서열은 적어도 3개 아미노산 길이의 펩티드를 인코딩하고, U는 각 PADRE 부류 II 서열 및 파상풍 변독소 MHC 부류 II 서열이고, 벡터는 E1(nt 577 내지 3403) 결손 및 E3(nt 27, 125-31, 825) 결손이 있는 서열 번호: 1의 서열을 포함하는 수정된 ChAdV68 서열을 포함하고 신생항원 카세트는 E1 결손 내에 삽입되며, 각 MHC 부류 I 항원-인코딩 핵산 서열은 25개 아미노산 길이인 폴리펩티드를 인코딩한다.
일부 양태에서, 적어도 하나의 항원-인코딩 핵산 서열은 종양 세포 표면 상에서 MHC 부류 I에 의해 제시되는 폴리펩티드 서열 또는 이의 부분을 인코딩한다. 일부 양태에서, 적어도 1개, 2개, 또는 선택적으로 3개의 항원-인코딩 핵산 서열은 종양 세포 표면 상에서 MHC 부류 I에 의해 제시되는 폴리펩티드 서열 또는 이의 부분을 인코딩한다.
일부 측면에서 적어도 하나의 신생항원-인코딩 핵산 서열 중 적어도 하나는 종양 세포에서 MHC 부류 I에 의해 제시된 폴리펩티드 서열 또는 이의 부분을 인코딩한다. 일부 측면에서, 각각의 항원-인코딩 핵산 서열이 서로에게 직접적으로 연결된다. 일부 측면에서, 적어도 하나의 항원-인코딩 핵산 서열 중 적어도 하나는 링커를 인코딩하는 핵산 서열과 구별되는 항원-인코딩 핵산 서열에 연결된다. 일부 측면에서, 상기 링커는 2개의 MHC 부류 I 서열 또는 하나의 MHC 부류 I 서열을 하나의 MHC 부류 II 서열에 연결한다. 일부 측면에서, 상기 링커는 하기로 이루어진 군에서 선택된다: (1) 연속 글리신 잔기, 길이가 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 잔기; (2) 연속 알라닌 잔기, 길이가 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 잔기; (3) 두 개의 아르기닌 잔기(RR); (4) 알라닌, 알라닌, 타이로신(AAY); (5) 공통 서열, 포유류의 프로테아솜에 의해 효율적으로 가공되는 적어도 길이 2, 3, 4, 5, 6, 7, 8 , 9, 또는 10 아미노산 잔기; 및 (6) 동족 단백질에서 유래된 항원에 측접하고, 길이가 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 2~20 아미노산 잔기인 하나 이상의 본래의 서열. 일부 측면에서, 상기 링커는 두 개의 MHC 부류 II 서열 또는 하나의 MHC 부류 II 서열을 하나의 MHC 부류 I 서열에 연결한다. 일부 측면에서, 상기 링커는 서열 GPGPG를 포함한다.
일부 측면에서, 적어도 하나의 항원-인코딩 핵산 서열 중 적어도 하나는 상기 적어도 하나의 항원-인코딩 핵산 서열의 발현, 안전성, 세포 유통(trafficking), 가공 및 제시, 및/또는 면역원성을 향상시키는 별도의 또는 인접 서열에 실시가능하게 또는 직접적으로 연결된다. 일부 측면에서, 상기 별도 또는 인접 서열은 하기 중 적어도 하나를 포함한다: 유비퀴틴 서열, 프로테아솜 표적화를 증대시키기 위해 변형된 유비퀴틴 서열(예를 들어, 상기 유비퀴틴 서열은 위치 76에서 Gly 대 Ala 치환을 함유함), 면역글로불린 신호 서열(예를 들어, IgK), 주요 조직적합성 부류 I 서열, 리소좀-관련 막 단백질(LAMP)-1, 인간 수지상 세포 리소좀-관련 막 단백질, 및 주요 조직적합성 부류 II 서열; 선택적으로 프로테아솜 표적화를 증대시키기 위해 변형된 상기 유비퀴틴 서열은 A76이다.
일부 측면에서, 항원-인코딩 핵산 서열 중 적어도 하나는 상기 번역된 상응하는 야생형 핵산 서열 대비 상응하는 MHC 대립유전자에 대한 결합 친화성을 증가시킨 폴리펩티드 서열 또는 그것의 일부분을 인코딩한다. 일부 측면에서, 항원-인코딩 핵산 서열 중 적어도 하나는 상기 번역된 상응하는 야생형, 모(parental) 핵산 서열과 관련하여 상응하는 MHC 대립유전자에 결합 안정성을 증가시킨 폴리펩티드 서열 또는 그것의 일부분을 인코딩한다. 일부 측면에서, 항원-인코딩 핵산 서열 중 적어도 하나는 상기 번역된 번역된 상응하는 야생형, 핵산 서열과 관련하여 상응하는 MHC 대립유전자 상에 제시의 가능성이 증가된 폴리펩티드 서열 또는 그것의 일부분을 인코딩한다.
일부 측면에서, 적어도 하나의 변형은 점 돌연변이, 틀이동 돌연변이, 비-틀이동 돌연변이, 결손 돌연변이, 삽입 돌연변이, 접합 변이체, 게놈 재배치, 또는 프로테아솜-생성 이음(spliced) 항원을 포함한다.
일부 측면에서, 상기 종양은 하기로 이루어진 군에서 선택된다: 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 대장암, 고환암, 두경부암, 췌장암, 뇌암, B-세포 림프종, 급성 골수성 백혈병, 만성 골수성 백혈병, 만성 림프성 백혈병, T 세포 림프성 백혈병, 비-소세포 폐암, 및 소세포 폐암.
일부 측면에서, 각각의 적어도 하나의 항원-인코딩 핵산 서열의 발현은 적어도 하나의 프로모터에 의해 구동된다.
일부 측면에서, 적어도 하나의 항원-인코딩 핵산 서열은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 핵산 서열을 포함한다. 일부 측면에서, 적어도 하나의 항원-인코딩 핵산 서열은 적어도 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 최대 400개 핵산 서열을 포함한다. 일부 측면에서, 적어도 하나의 항원-인코딩 핵산 서열은 적어도 2~400개 핵산 서열을 포함하되, 적어도 하나의 항원-인코딩 핵산 서열은 종양 세포 표면에서 MHC I에 의해 제시되는 폴리펩티드 서열 또는 그의 일부분을 인코딩한다. 일부 측면에서, 적어도 하나의 항원-인코딩 핵산 서열은 적어도 2-400개의 핵산 서열을 포함하고, 여기서 대상체에게 투여되고 번역될 때, 항원 중 적어도 하나는 항원 제시 세포 상에 제시되어 종양 세포 표면에 있는 항원 중 하나 이상을 표적으로하는 면역 반응을 유발한다. 일부 측면에서, 적어도 하나의 항원-인코딩 핵산 서열은 적어도 2-400 MHC 부류 I 및/또는 부류 II 항원-인코딩 핵산 서열을 포함하고, 여기서 대상체에게 투여되고 번역될 때, 적어도 하나의 MHC 부류 I 또는 부류 II 항원은 종양 세포 표면상의 항원 중 하나 이상을 표적으로하는 면역 반응을 야기하는 항원 제시 세포 상에 제시되고, 선택적으로 여기서 각각의 적어도 2-400 MHC 부류 I 또는 부류 II 항원-인코딩 핵산 서열의 발현은 적어도 하나의 프로모터에 의해 구동된다.
일부 측면에서, 각각의 MHC 부류 I 항원-인코딩 핵산 서열은 길이 8 내지 35 아미노산 사이, 선택적으로 길이 9~17, 9~25, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35 아미노산의 폴리펩티드 서열을 인코딩한다.
일부 측면에서, 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열이 존재한다. 일부 측면에서, 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열이 존재하고, 인코딩된 펩티드 서열과 야생형 핵산 서열에 의해 인코딩되는 상응하는 펩티드 서열과 구별되게 하는 적어도 하나의 변형을 포함하는 적어도 하나의 MHC 부류 II 신생항원-인코딩 핵산 서열을 포함한다. 일부 측면에서, 상기 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열은 길이가 12~20, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 20~40 아미노산이다. 일부 측면에서, 상기 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열이 존재하고, 적어도 하나의 보편적 MHC 부류 II 항원-인코딩 핵산 서열을 포함하되, 선택적으로 상기 적어도 하나의 보편적 서열은 파상풍 변독소 및 PADRE 중 적어도 하나를 포함한다.
일부 측면에서, 적어도 하나의 프로모터 서열은 유도성이다. 일부 측면에서, 적어도 하나의 프로모터 서열은 비유도성이다. 일부 측면에서, 적어도 하나의 프로모터 서열은 CMV, SV40, EF-1, RSV, PGK, HSA, MCK 또는 EBV 프로모터 서열이다.
일부 측면에서, 항원 카세트는 적어도 하나의 항원-인코딩 핵산 서열 중 적어도 하나에 작동가능하게 연결된 적어도 하나의 폴리-아데닐화 (폴리A) 서열을 추가로 포함하고, 선택적으로 여기서 폴리A 서열은 적어도 하나의 항원-인코딩 핵산 서열의 3'에 위치된다. 일부 측면에서, 폴리A 서열은 SV40 또는 소 성장 호르몬 (BGH) 폴리A 서열을 포함한다. 일부 측면에서, 상기 항원 카세트는 하기 중 적어도 하나를 추가로 포함한다: 인트론 서열, 우드척 간염 바이러스(Woodchuck Hepatitis virus) 전사후 조절요소(WPRE) 서열, 내부 리보솜 유입 서열(IRES) 서열, 또는 적어도 하나의 항원-인코딩 뉴클레오티드 서열의 적어도 하나에 작동 가능하게 연결된 mRNA의 핵 유출, 안정성 또는 번역 효율성을 향상시키는 것으로 알려진 5' 또는 3' 비코딩(non-coding) 구역 중 서열. 일부 측면에서, 상기 항원 카세트는 리포터 유전자, 예컨대 비제한적으로, 초록 형광 단백질(GFP), GFP 변이체, 분비된 알칼린 포스파타제, 루시퍼라제, 또는 루시퍼라제 변이체로 이루어진 군으로부터 선택된다.
일부 측면에서, 적어도 하나의 면역 조절제는 면역 체크포인트 분자를 억제한다.
일부 측면에서, 상기 면역 조절제는 항-CTLA4 항체 또는 그것의 항원-결합 절편, 항-PD-1 항체 또는 그것의 항원-결합 절편, 항-PD-L1 항체 또는 그것의 항원-결합 절편, 항-4-1BB 항체 또는 그것의 항원-결합 절편, 또는 항-OX-40 항체 또는 그것의 항원-결합 절편이다. 일부 측면에서, 상기 항체 또는 그것의 항원-결합 절편은 Fab 절편, Fab' 절편, 단일사슬 Fv(scFv), 단일영역 항체(sdAb)(단일 특이적 또는, 서로 연결된 다중 특이성(예를 들어, 낙타과 항체 영역) 중 하나로서), 또는 전장 단일 사슬 항체(예를 들어, 유연한 링커에 의해 연결된 중쇄 및 경쇄 보유 전장 IgG)이다. 일부 측면에서, 항체의 중쇄 및 경쇄 서열은 2A와 같은 자가 절단 서열 중 하나에 의해 분리된 연속 서열이거나, 선택적으로 자가 절단 서열은 자가 절단 서열의 푸린 절단 부위 서열 5' 또는 IRES 서열을 가지거나; 또는 항체의 중쇄 및 경쇄 서열은 연속적인 글리신 잔기와 같은 유연한 링커에 의해 연결된다. 일부 측면에서, 항-CTLA4 항체는 각각 서열번호: 76-78을 포함하는 VL CDR1, CDR2, 및 CDR3 서열, 및 각각 서열번호: 79-81을 포함하는 VH CDR1, CDR2 및 CDR3 서열을 포함한다. 일부 측면에서, 항-CTLA4 항체는 각각 서열번호 21-23을 포함하는 VL CDR1, CDR2, 및 CDR3 서열, 및 각각 서열번호 18-20을 포함하는 VH CDR1, CDR2 및 CDR3 서열을 포함한다.
일부 측면에서, 상기 면역 조절제는 사이토킨이다. 일부 측면에서, 상기 사이토킨은 IL-2, IL-7, IL-12, IL-15, 또는 IL-21 또는 이들의 각각의 변이체 중 적어도 하나이다.
일부 양태에서, 벡터는 침팬지 아데노바이러스 벡터이다. 일부 양태에서, 벡터는 침팬지 아데노바이러스 벡터는 ChAdV68 벡터이다. 일부 양태에서, 벡터는 서열 번호: 1에 명시된 서열을 포함한다. 일부 양태에서, 벡터는 서열 번호: 1에 명시된 서열의 침팬지 아데노바이러스 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4, 및 L5로 이루어진 군으로부터 선택된 적어도 하나의 유전자에서 완전히 결손 또는 기능적으로 결손된 서열을 제외하고 서열 번호: 1에 명시된 서열을 포함하며, 선택적으로 여기서 서열은: 서열 번호: 1의 서열에 명시된 (1) E1A 및 E1B; (2) E1A, E1B, 및 E3; 또는 (3) E1A, E1B, E3, 및 E4에서 완전히 결손 또는 기능적으로 결손된다.
일부 양태에서, 벡터는 서열 번호: 1의 서열에서 수득된 유전자 또는 조절 서열을 포함하며, 선택적으로 여기서 유전자는 서열 번호: 1에 명시된 서열의 침팬지 아데노바이러스 반전(inverted) 말단 반복단위(ITR), E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4, 및 L5 유전자로 이루어진 군으로부터 선택된다.
일부 양태에서, 항원 카세트는 항원 카세트의 혼입을 가능하게 하는 E1 영역, E3 영역, 및/또는 임의의 결손된 AdV 영역에서 벡터에 삽입된다.
일부 양태에서, 벡터는 1세대, 2세대, 또는 헬퍼-의존성 아데노바이러스성 벡터 중 하나에서 생성된다.
일부 양태에서, 아데노바이러스 벡터 벡터는 염기쌍 번호 577 내지 3403 사이 또는 염기쌍 456 내지 3014 사이에 하나 이상의 결손을 포함하고, 선택적으로 여기서 벡터는 서열 번호: 1에 명시된 서열의 염기쌍 27,125 내지 31,825 사이 또는 염기쌍 27,816 내지 31,333 사이에 하나 이상의 결손을 추가로 포함한다. 일부 양태에서, 아데노바이러스 벡터는 서열 번호: 1에 명시된 서열의 염기쌍 번호 3957 내지 10346, 염기쌍 번호 21787 내지 23370, 및 염기쌍 번호 33486 내지 36193 사이에 하나 이상의 결손을 추가로 포함한다.
일부 양태에서, 벡터는 +-가닥 RNA 벡터를 포함한다. 일부 양태에서, +-가닥 RNA 벡터는 5' 7-메틸구아노신(m7g) 캡을 포함한다. 일부 양태에서, +-가닥 RNA 벡터는 시험관내 전사에 의해 생산된다. 일부 양태에서, 벡터는 포유류 세포 내에서 자가-복제된다.
일부 양태에서, 벡터는 벡터 백본을 포함하며, 여기서 백본은: (i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및 (ii) 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함한다. 일부 양태에서, 백본은 아우라(Aura) 바이러스, 포트 모건(Fort Morgan) 바이러스, 베네수엘라 마뇌염(Venezuelan equine encephalitis) 바이러스, 로스 리버(Ross River) 바이러스, 셈리키 삼림(Semliki Forest) 바이러스, 신드비스(Sindbis) 바이러스, 또는 마야로(Mayaro) 바이러스의 적어도 하나의 뉴클레오티드 서열을 포함한다. 일부 양태에서, 백본은 베네수엘라 마뇌염 바이러스의 적어도 하나의 뉴클레오티드 서열을 포함한다. 일부 양태에서, 백본은 적어도, 아우라 바이러스, 포트 모건 바이러스, 베네수엘라 마뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 인코딩되는 비구조적 단백질-매개 증폭을 위한 서열, 26S 프로모터 서열, 폴리(A) 서열, 비구조적 단백질 1(nsP1) 유전자, nsP2 유전자, nsP3 유전자, 및 nsP4 유전자를 포함한다. 일부 양태에서, 백본은 적어도, 아우라 바이러스, 포트 모건 바이러스, 베네수엘라 마뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 인코딩되는 비구조적 단백질-매개 증폭을 위한 서열, 26S 프로모터 서열, 및 폴리(A) 서열을 포함한다. 일부 양태에서, 비구조적 단백질-매개 증폭을 위한 서열은 다음으로 이루어진 군으로부터 선택된다: 알파바이러스 5' UTR, 51-nt CSE, 24-nt CSE, 26S 서브게놈 프로모터 서열, 19-nt CSE, 알파바이러스 3' UTR, 또는 이들의 조합.
일부 양태에서, 백본은 구조적 비리온 단백질 캡시드, E2 및 E1을 인코딩하지 않는다. 일부 양태에서, 신생항원 카세트는 아우라 바이러스, 포트 모건 바이러스, 베네수엘라 마뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 뉴클레오티드 서열 내에 구조적 비리온 단백질 대신에 삽입된다.
일부 양태에서, 베네수엘라 마뇌염 바이러스(VEE)는 균주 TC-83을 포함한다. 일부 양태에서, 베네수엘라 마뇌염 바이러스는 서열 번호: 3 또는 서열 번호: 5에 명시된 서열을 포함한다. 일부 양태에서, 베네수엘라 마뇌염 바이러스는 염기쌍 7544 내지 11175 사이의 결손을 추가로 포함하는 서열 번호: 3 또는 서열 번호: 5의 서열을 포함한다. 일부 양태에서, 백본은 서열 번호: 6 또는 서열 번호: 7에 명시된 서열이다. 일부 양태에서, 신생항원 카세트는 서열 번호: 3 또는 서열 번호: 5의 서열에 명시된 염기쌍 7544 내지 11175 사이의 결손을 대체하기 위해 삽입된다.
일부 양태에서, 신생항원 카세트의 삽입은 nsP1-4 유전자 및 적어도 하나의 항원-인코딩 핵산 서열을 포함하는 폴리시스트론성 RNA의 전사를 제공하고, 여기서 nsP1-4 유전자 및 적어도 하나의 항원-인코딩 핵산 서열은 별도의 개방 판독 프레임 내에 있다.
일부 양태에서, 적어도 하나의 프로모터 뉴클레오티드 서열은 백본에 의해 인코딩되는 네이티브 26S 프로모터 뉴클레오티드 서열이다. 일부 양태에서, 적어도 하나의 프로모터 뉴클레오티드 서열은 외인성 RNA 프로모터이다. 일부 양태에서, 제2 프로모터 뉴클레오티드 서열은 26S 프로모터 뉴클레오티드 서열이다. 일부 양태에서, 제2 프로모터 뉴클레오티드 서열은 다중 26S 프로모터 뉴클레오티드 서열을 포함하고, 여기서 각 26S 프로모터 뉴클레오티드 서열은 별도의 개방 판독 프레임 중 하나 이상의 전사를 제공한다.
일부 양태에서, 벡터는 srRNA 벡터이다. 일부 양태에서, srRNA 벡터는 베네수엘라 마뇌염 바이러스 srRNA 벡터이다.
일부 양태에서, 적어도 하나의 항원-인코딩 핵산 서열은 다음 단계들을 실행함으로써 선택된다: 종양에서 엑솜(exome), 전사체, 또는 전체 게놈 종양 뉴클레오티드 서열 분석 데이터 중 적어도 하나를 수득하고, 여기서 상기 종양 뉴클레오티드 서열 분석 데이터를 사용하여 일련의 항원 각각의 펩티드 서열을 나타내는 데이터를 수득하는 단계; 각 항원의 펩티드 서열을 제시 모델에 입력하여 항원 각각이 종양의 종양 세포 표면 상에서 MHC 대립유전자들 중 하나 이상에 의해 제시되는 일련의 수치적 가능성을 생성하는 단계로서, 일련의 수치적 가능성은 적어도 수신된 질량분광법 데이터를 기반으로 동정된 바 있는, 단계; 및 일련의 수치적 가능성을 기반으로 일련의 항원의 서브셋을 선택하여 적어도 하나의 항원-인코딩 핵산 서열을 생성하기 위해 사용되는 일련의 선택된 항원을 생성하는 단계.
일부 측면에서, 에피토프-코딩 핵산 서열 각각은 하기의 단계들을 실행함으로써 선택된다: 상기 종양에서 엑솜, 전사체, 또는 전체 게놈 종양 뉴클레오티드 서열 분석 데이터 중 적어도 하나를 수득하되, 상기 종양 뉴클레오티드 서열 분석 데이터가 사용되어 일련의 항원 각각의 펩티드 서열을 나타내는 데이터를 수득하는 단계; 각 항원의 펩티드 서열을 제시 모델에 입력하여 상기 항원 각각이 상기 종양의 종양 세포 표면 상의 MHC 대립유전자들 중 하나 이상에 의해 제시되는 일련의 수치적 가능성을 생성하는 단계(상기 일련의 수치적 가능성은 적어도 수신된 질량분광법 데이터를 기반으로 동정된 바 있음); 및 (c) 상기 일련의 수치적 가능성을 기반으로 항원의 일련의 수치적 가능성의 서브셋을 선택하여 상기 적어도 하나의 항원-인코딩 핵산 서열을 생성하기 위해 사용되는 일련의 선택된 신생항원을 생성하는 단계.
일부 측면에서, 일련의 선택된 항원의 개수는 2~20개이다.
일부 측면에서, 상기 제시 모델은 하기 사이의 의존도를 나타낸다: 상기 MHC 대립유전자와 펩티드 서열의 특정 위치에서의 특정 아미노산 중 특정한 하나의 쌍의 존재; 및 종양 세포 표면 상에서, 상기 쌍의 MHC 대립유전자들 중 특정한 하나에 의한, 상기 특정 위치에서의 상기 특정 아미노산을 포함하는 그와 같은 펩티드 서열의 제시 가능성.
일부 측면에서, 상기 일련의 선택된 항원을 선택하는 단계는 제시 모델을 기반으로 선택되지 않은 항원과 관련하여 상기 종양 세포 표면 상에서 제시될 가능성이 증가된 항원을 선택하는 것을 포함한다. 일부 측면에서, 일련의 선택된 항원을 선택하는 단계는 제시 모델을 기반으로 선택되지 않은 항원과 관련하여 상기 대상체에서 종양-특이적 면역 반응을 유도할 수 있는 가능성이 증가된 항원을 선택하는 것을 포함한다. 일부 측면에서, 상기 일련의 선택된 항원을 선택하는 단계는 제시 모델을 기반으로 선택되지 않은 항원과 관련하여 전문적인 항원 제시 세포(APC)에 의해 본래의 T 세포에 제시될 수 있는 가능성이 증가된 항원을 선택하는 것을 포함하되, 선택적으로 상기 APC는 수지상 세포(DC)이다. 일부 측면에서, 상기 일련의 선택된 항원을 선택하는 단계는 제시 모델을 기반으로 선택되지 않은 항원과 관련하여 중앙 또는 말초 관용(peripheral tolerance)을 통한 억제를 겪을 가능성이 감소된 항원을 선택하는 것을 포함한다. 일부 측면에서, 상기 일련의 선택된 항원을 선택하는 단계는 제시 모델을 기반으로 선택되지 않은 항원과 관련하여 대상체의 정상적 조직에 자가면역 반응을 유도할 수 있는 가능성이 감소된 항원을 선택하는 것을 포함한다. 일부 측면에서, 엑솜 또는 전사체 뉴클레오티드 서열 분석 데이터는 상기 종양 조직에서 서열 분석을 실행함으로써 수득된다. 일부 측면에서, 상기 서열 분석은 차세대 서열 분석(NGS) 또는 임의의 대규모 병렬 서열 분석 접근법이다.
일부 측면에서, 상기 항원 카세트는 상기 항원 카세트에서 이웃한 서열에 의해 형성된 접합 에피토프 서열을 포함한다. 일부 측면에서, 상기 적어도 하나의 또는 각각의 접합 에피토프 서열은 MHC에 대한 친화성이 500nM를 초과한다. 일부 측면에서, 각 접합 에피토프 서열은 비자기(non-self)이다. 일부 측면에서, 상기 항원 카세트는 번역된, 야생형 핵산 서열을 포함하는 비치료적 MHC 부류 I 또는 부류 II 에피토프 핵산 서열을 인코딩하지 않되, 상기 비치료적 에피토프는 대상체의 MHC 대립유전자 상에 표현될 것으로 예측된다. 일부 측면에서, 상기 비치료적 예상되는 MHC 부류 I 또는 부류 II 에피토프 서열은 상기 신생항원 카세트에서 이웃한 서열에 의해 형성되는 접합 에피토프 서열이다. 일부 측면에서, 상기 예측은 상기 비치료적 에피토프의 서열을 제시 모델에 입력함으로써 생성되는 제시 가능성을 기반으로 한다. 일부 측면에서, 상기 항원 카세트 중 상기 적어도 하나의 항원-인코딩 핵산 서열의 순서는 하기의 일련의 단계에 의해 결정된다: 1. 상기 적어도 하나의 항원-인코딩 핵산 서열의 상이한 순서에 상응하는 일련의 후보 항원 카세트 서열을 생성하는 단계; 2. 각각의 후보 항원 카세트 서열에 대해, 상기 후보 항원 카세트 서열에서 비치료적 에피토프를 기반으로 제시 스코어를 결정하는 단계; 및 3. 신생항원 백신을 위한 항원 카세트 서열로서 사전결정된 임계값 아래의 제시 스코어와 연관된 후보 카세트 서열을 선택하는 단계.
또한 본원에 개시된 벡터(예컨대, 본원에 개시된 ChAd-계 벡터) 및 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물이 본원에 개시된다. 일부 양태에서, 조성물은 아쥬반트를 추가로 포함한다. 일부 양태에서, 조성물은 면역 조절제를 추가로 포함한다. 일부 양태에서, 면역 조절제는 항-CTLA4 항체 또는 이의 항원-결합 절편, 항-PD-1 항체 또는 이의 항원-결합 절편, 항-PD-L1 항체 또는 이의 항원-결합 절편, 항-4-1BB 항체 또는 이의 항원-결합 절편, 또는 항-OX-40 항체 또는 이의 항원-결합 절편이다.
또한 본원에 개시된 항원 카세트 및 본원에 개시된 적어도 하나의 프로모터를 포함하는 단리된 뉴클레오티드 서열이 본원에 개시된다. 일부 양태에서, 단리된 뉴클레오티드 서열은 ChAd-계 유전자를 추가로 포함한다. 일부 양태에서, ChAd-계 유전자는 서열 번호: 1의 서열에서 수득되며, 선택적으로 여기서 유전자는 서열 번호: 1에 명시된 서열의 침팬지 아데노바이러스 ITR, E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4, 및 L5 유전자로 이루어진 군으로부터 선택되고, 선택적으로 여기서 뉴클레오티드 서열은 cDNA이다.
또한 본원에 개시된 단리된 뉴클레오티드 서열을 포함하는 단리된 세포가 본원에 개시되며, 선택적으로 여기서 세포는 CHO, HEK293 또는 이의 변이체, 911, HeLa, A549, LP-293, PER.C6, 또는 AE1-2a 세포이다.
또한 본원에 개시된 단리된 뉴클레오티드 서열을 포함하는 벡터가 본원에 개시된다.
또한 본원에 개시된 벡터 및 사용 설명서를 포함하는 키트가 본원에 개시된다.
또한 암을 앓는 대상체를 치료하는 방법이 본원에 개시되며, 상기 방법은 대상체에 본원에 개시된 벡터 또는 본원에 개시된 약제학적 조성물을 투여하는 단계를 포함한다. 일부 양태에서, 벡터 또는 조성물은 근육내(IM), 피부내(ID), 또는 피하(SC)로 투여된다. 일부 양태에서, 방법은 대상체에 면역 조절제를 포함하는 단계를 추가로 포함하며, 선택적으로 여기서 면역 조절제는 벡터 또는 약제학적 조성물의 투여 전, 투여와 동시에, 또는 투여 후에 투여된다. 일부 양태에서, 면역 조절제는 항-CTLA4 항체 또는 이의 항원-결합 절편, 항-PD-1 항체 또는 이의 항원-결합 절편, 항-PD-L1 항체 또는 이의 항원-결합 절편, 항-4-1BB 항체 또는 이의 항원-결합 절편, 또는 항-OX-40 항체 또는 이의 항원-결합 절편이다. 일부 양태에서, 면역 조절제는 정맥내(IV), 근육내(IM), 피부내(ID), 또는 피하(SC)로 투여된다. 일부 양태에서, 상기 피하 투여는 벡터 또는 조성물 투여 부위 근처에서 또는 하나 이상의 벡터 또는 조성물 배수(draining) 림프절에 이웃하여 이루어진다.
일부 양태에서, 방법은 대상체에 제2 백신 조성물을 투여하는 단계를 추가로 포함한다. 일부 양태에서, 제2 백신 조성물은 벡터 또는 임의의 상기한 벡터 또는 조성물의 약제학적 조성물의 투여 이전에 투여된다. 일부 양태에서, 제2 백신 조성물은 벡터 또는 임의의 상기한 벡터 또는 조성물의 약제학적 조성물의 투여 차후에 투여된다. 일부 양태에서, 제2 백신 조성물은 벡터 또는 임의의 상기한 벡터 또는 조성물의 약제학적 조성물과 동일하다. 일부 양태에서, 제2 백신 조성물은 벡터 또는 임의의 상기한 벡터 또는 조성물의 약제학적 조성물과 상이하다. 일부 양태에서, 제2 백신 조성물은 침팬지 아데노바이러스 벡터를 포함한다. 일부 양태에서, 침팬지 아데노바이러스 벡터는 ChAdV68 벡터이다. 일부 양태에서, 제2 백신 조성물은 srRNA 벡터를 포함한다. 일부 양태에서, srRNA 벡터는 베네수엘라 마뇌염 바이러스 벡터이다. 일부 양태에서, 침팬지 아데노바이러스 벡터 또는 srRNA 벡터는 적어도 하나의 면역 조절제를 인코딩하는 핵산 서열을 포함한다. 일부 양태에서, 침팬지 아데노바이러스 벡터 또는 srRNA 벡터에 의해 인코딩되는 적어도 하나의 항원-인코딩 핵산 서열은 임의의 상기한 벡터의 적어도 하나의 항원-인코딩 핵산 서열과 동일하다. 일부 양태에서, 침팬지 아데노바이러스 벡터 또는 srRNA 벡터에 의해 인코딩되는 적어도 하나의 면역 조절제를 인코딩하는 핵산 서열은 임의의 상기한 벡터의 적어도 하나의 면역 조절제와 동일하다.
일부 양태에서, 상기 조성물 중 임의의 것은 나노미립자 전달 비히클을 추가로 포함한다. 나노미립자 전달 비히클은, 일부 양태에서, 지질 나노입자 (LNP)일 수 있다. 일부 양태에서, LNP는 이온화가능 아미노 지질을 포함한다. 일부 양태에서, 이온화가능 아미노 지질은 MC3-유사 (디리놀레일메틸-4-디메틸아미노부티레이트) 분자를 포함한다. 일부 양태에서, 나노미립자 전달 비히클은 신생항원 발현 시스템을 캡슐화한다.
일부 양태에서, 상기 조성물 중 임의의 것은 복수의 LNP를 추가로 포함하며, 여기서 LNP는 신생항원 발현 시스템; 양이온성 지질; 비-양이온성 지질; 및 LNP의 응집을 억제하는 컨쥬게이트(conjugate)화된 지질을 포함하고, 여기서 복수의 LNP 중 적어도 약 95%의 LNP는 비-라멜라 모폴로지를 갖거나; 전자-치밀성이다.
일부 양태에서, 비-양이온성 지질은 (1) 인지질과 (2) 콜레스테롤 또는 콜레스테롤 유도체의 혼합물이다.
일부 양태에서, LNP의 응집을 억제하는 컨쥬게이트화된 지질은 폴리에틸렌글리콜 (PEG)-지질 컨쥬게이트이다. 일부 양태에서, PEG-지질 컨쥬게이트는 하기로 이루어진 군으로부터 선택된다: PEG-디아실글리세롤 (PEG-DAG) 컨쥬게이트, PEG 디알킬옥시프로필 (PEG-DAA) 컨쥬게이트, PEG-인지질 컨쥬게이트, PEG-세라미드 (PEG-Cer) 컨쥬게이트, 및 이들의 혼합물. 일부 양태에서 PEG-DAA 컨쥬게이트는 하기로 이루어진 군으로부터 선택된 구성원이다: PEG-디데실옥시프로필 (C10) 컨쥬게이트, PEG-디라우릴옥시프로필 (C12) 컨쥬게이트, PEG-디미리스틸옥시프로필 (C14) 컨쥬게이트, PEG-디팔미틸옥시프로필 (C16) 컨쥬게이트, PEG-디스테아릴옥시프로필 (C18) 컨쥬게이트, 및 이들의 혼합물.
일부 양태에서, 신생항원 발현 시스템은 LNP 내에 완전히 캡슐화된다.
일부 양태에서, LNP의 비-라멜라 모폴로지는 역 육각형 (H II ) 또는 입방 상 구조를 포함한다.
일부 양태에서, 양이온성 지질은 LNP 중에 존재하는 총 지질의 약 10 mol % 내지 약 50 mol %를 구성한다. 일부 양태에서, 양이온성 지질은 LNP 중에 존재하는 총 지질의 약 20 mol % 내지 약 50 mol %를 구성한다. 일부 양태에서, 양이온성 지질은 LNP 중에 존재하는 총 지질의 약 20 mol % 내지 약 40 mol %를 구성한다.
일부 양태에서, 비-양이온성 지질은 LNP 중에 존재하는 총 지질의 약 10 mol % 내지 약 60 mol %를 구성한다. 일부 양태에서, 비-양이온성 지질은 LNP 중에 존재하는 총 지질의 약 20 mol % 내지 약 55 mol %를 구성한다. 일부 양태에서, 비-양이온성 지질은 LNP 중에 존재하는 총 지질의 약 25 mol % 내지 약 50 mol %를 구성한다.
일부 양태에서, 컨쥬게이트화된 지질은 LNP 중에 존재하는 총 지질의 약 0.5 mol % 내지 약 20 mol %를 구성한다. 일부 양태에서, 컨쥬게이트화된 지질은 LNP 중에 존재하는 총 지질의 약 2 mol % 내지 약 20 mol %를 구성한다. 일부 양태에서, 컨쥬게이트화된 지질은 LNP 중에 존재하는 총 지질의 약 1.5 mol % 내지 약 18 mol %를 구성한다.
일부 양태에서, LNP의 95% 초과는 비-라멜라 모폴로지를 갖는다. 일부 양태에서, LNP의 95% 초과는 전자 치밀성이다.
일부 양태에서, 상기 조성물 중 임의의 것은 복수의 LNP를 추가로 포함하며, 여기서 LNP는 하기를 포함한다: LNP 중에 존재하는 총 지질의 50 mol % 내지 65 mol %를 구성하는 양이온성 지질; LNP 중에 존재하는 총 지질의 0.5 mol % 내지 2 mol %를 구성하는 LNP의 응집을 억제하는 컨쥬게이트화된 지질; 및 하기 중 하나를 포함하는 비-양이온성 지질: 인지질과 콜레스테롤 또는 그의 유도체의 혼합물이며, 여기서 인지질은 LNP 중에 존재하는 총 지질의 4 mol % 내지 10 mol %를 구성하고 콜레스테롤 또는 그의 유도체는 LNP 중에 존재하는 총 지질의 30 mol % 내지 40 mol %를 구성함; 인지질과 콜레스테롤 또는 그의 유도체의 혼합물이며, 여기서 인지질은 LNP 중에 존재하는 총 지질의 3 mol % 내지 15 mol %를 구성하고 콜레스테롤 또는 그의 유도체는 LNP 중에 존재하는 총 지질의 30 mol % 내지 40 mol %를 구성함; 또는 LNP 중에 존재하는 총 지질의 49.5 mol % 이하이며 인지질과 콜레스테롤 또는 그의 유도체의 혼합물을 포함하며, 여기서 콜레스테롤 또는 그의 유도체는 LNP 중에 존재하는 총 지질의 30 mol % 내지 40 mol %를 구성함.
일부 양태에서, 상기 조성물 중 임의의 것은 복수의 LNP를 추가로 포함하며, 여기서 LNP는 하기를 포함한다: LNP 중에 존재하는 총 지질의 50 mol % 내지 85 mol %를 구성하는 양이온성 지질; LNP 중에 존재하는 총 지질의 0.5 mol % 내지 2 mol %를 구성하는 LNP의 응집을 억제하는 컨쥬게이트화된 지질; 및 LNP 중에 존재하는 총 지질의 13 mol % 내지 49.5 mol %를 구성하는 비-양이온성 지질.
일부 양태에서, 인지질은 디팔미토일포스파티딜콜린 (DPPC), 디스테아로일포스파티딜콜린 (DSPC), 또는 이들의 혼합물을 포함한다.
일부 양태에서, 컨쥬게이트화된 지질은 폴리에틸렌글리콜 (PEG)-지질 컨쥬게이트를 포함한다. 일부 양태에서, PEG-지질 컨쥬게이트는 PEG-디아실글리세롤 (PEG-DAG) 컨쥬게이트, PEG-디알킬옥시프로필 (PEG-DAA) 컨쥬게이트, 또는 이들의 혼합물을 포함한다. 일부 양태에서, PEG-DAA 컨쥬게이트는 PEG-디미리스틸옥시프로필 (PEG-DMA) 컨쥬게이트, PEG-디스테아릴옥시프로필 (PEG-DSA) 컨쥬게이트, 또는 이들의 혼합물을 포함한다. 일부 양태에서, 컨쥬게이트의 PEG 부분은 약 2,000 돌턴의 평균 분자량을 갖는다.
일부 양태에서, 컨쥬게이트화된 지질은 LNP 중에 존재하는 총 지질의 1 mol % 내지 2 mol %를 구성한다.
일부 양태에서, LNP는 하기 화학식 I의 구조를 갖는 화합물:
Figure pct00002
또는 그의 약제학적으로 허용가능한 염, 호변이성질체, 전구약물 또는 입체이성질체를 포함하며, 여기서, L1 및 L2는 각각 독립적으로 -0(C=0)-, -(C=0)0-, -C(=0)-, -0-, -S(0)x-, -S-S-, -C(=0)S-, -SC(=0)-, - RaC(=0)-, -C(=0) Ra-, - RaC(=0) Ra-, -OC(=0) Ra-, - RaC(=0)0- 또는 직접 결합이고; G1은 Ci-C2 알킬렌, - (C=0)-, -0(C=0)-, -SC(=0)-, - RaC(=0)- 또는 직접 결합: -C(=0)-, -(C=0)0-, -C(=0)S-, -C(=0) Ra- 또는 직접 결합이고; G는 Ci-C6 알킬렌이고; Ra는 H 또는 C1-C12 알킬이고; Rla 및 Rlb는, 각 경우에, 독립적으로 하기 중 하나이고: (a) H 또는 C1-C12 알킬; 또는 (b) R1a는 H 또는 C1-C12 알킬이고, R1b는 이것이 결합된 탄소 원자와 함께, 인접한 R1b 및 이것이 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성함; R2a 및 R2b는, 각 경우에, 독립적으로 하기 중 하나이고: (a) H 또는 C1-C12 알킬; 또는 (b) R2a는 H 또는 C1-C12 알킬이고, R2b는 이것이 결합된 탄소 원자와 함께, 인접한 R2b 및 이것이 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성함; R3a 및 R3b는, 각 경우에, 독립적으로 하기 중 하나이고: (a) H 또는 C1-C12 알킬; 또는 (b) R3a는 H 또는 C1-C12 알킬이고, R3b는 이것이 결합된 탄소 원자와 함께, 인접한 R 및 이것이 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성함; R4a 및 R4b는, 각 경우에, 독립적으로 하기 중 하나이고: (a) H 또는 C1-C12 알킬; 또는 (b) R4a는 H 또는 C1-C12 알킬이고, R4b는 이것이 결합된 탄소 원자와 함께, 인접한 R4b 및 이것이 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성함; R5 및 R6은 각각 독립적으로 H 또는 메틸이고; R7은 C4-C20 알킬이고; R8 및 R9는 각각 독립적으로 C1-C12 알킬이거나; 또는 R8 및 R9는, 이들이 부착된 질소 원자와 함께 5, 6 또는 7원 헤테로시클릭 고리를 형성하고; a, b, c 및 d는 각각 독립적으로 1 내지 24의 정수이고; x는 0, 1 또는 2이다.
일부 양태에서, LNP는 하기 화학식 II의 구조를 갖는 화합물:
Figure pct00003
또는 그의 약제학적으로 허용가능한 염, 호변이성질체, 전구약물 또는 입체이성질체를 포함하며, 여기서, L1 및 L2는 각각 독립적으로 -0(C=0)-, -(C=0)0- 또는 탄소-탄소 이중 결합이고; R1a 및 R1b는, 각 경우에, 독립적으로 하기 중 하나이고: (a) H 또는 C1-C12 알킬, 또는 (b) R1a는 H 또는 C1-C12 알킬이고, R1b는 이것이 결합된 탄소 원자와 함께, 인접한 R1b 및 이것이 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성함; R2a 및 R2b는, 각 경우에, 독립적으로 하기 중 하나이고: (a) H 또는 C1-C12 알킬, 또는 (b) R2a는 H 또는 C1-C12 알킬이고, R2b는 이것이 결합된 탄소 원자와 함께, 인접한 R2b 및 이것이 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성함; R3a 및 R3b는, 각 경우에, 독립적으로 하기 중 하나이고: (a) H 또는 C1-C12 알킬; 또는 (b) R3a는 H 또는 C1-C12 알킬이고, R3b는 이것이 결합된 탄소 원자와 함께, 인접한 R3b 및 이것이 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성함; R4a 및 R4b는, 각 경우에, 독립적으로 하기 중 하나이고: (a) H 또는 C1-C12 알킬; 또는 (b) R4a는 H 또는 C1-C12 알킬이고, R4b는 이것이 결합된 탄소 원자와 함께, 인접한 R4b 및 이것이 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성함; R5 및 R6은 각각 독립적으로 메틸 또는 시클로알킬이고; R7은, 각 경우에, 독립적으로 H 또는 C1-C12 알킬이고; R8 및 R9는 각각 독립적으로 비치환된 C1-C12 알킬이거나; 또는 R8 및 R9는, 이들이 부착된 질소 원자와 함께 하나의 질소 원자를 포함하는 5, 6 또는 7원 헤테로시클릭 고리를 형성하고; a 및 d는 각각 독립적으로 0 내지 24의 정수이고; b 및 c는 각각 독립적으로 1 내지 24의 정수이고; e는 1 또는 2이되, 단 R1a, R2a, R3a 또는 R4a 중 적어도 하나는 C1-C12 알킬이거나, 또는 L1 또는 L2 중 적어도 하나는 -0(C=0)- 또는 -(C=0)0-이고; R1a 및 R1b는 a가 6인 경우 이소프로필 또는 a가 8인 경우 n-부틸이 아니다.
일부 양태에서, 상기 조성물 중 임의의 것은 중성 지질, 스테로이드, 및 중합체 컨쥬게이트화된 지질을 포함하는 하나 이상의 부형제를 추가로 포함한다. 일부 양태에서, 중성 지질은 1,2-디스테아로일-sn-글리세로-3-포스포콜린 (DSPC), 1,2-디팔미토일-sn-글리세로-3-포스포콜린 (DPPC), 1,2-디미리스토일-sn-글리세로-3-포스포콜린 (DMPC), 1-팔미토일-2-올레오일-sn-글리세로-3-포스포콜린 (POPC), 1,2-디올레오일-sn-글리세로-3-포스포콜린 (DOPC), 및 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민 (DOPE) 중 적어도 하나를 포함한다. 일부 양태에서, 중성 지질은 DSPC이다.
일부 양태에서, 화합물 대 중성 지질의 몰비는 약 2:1 내지 약 8:1의 범위이다.
일부 양태에서, 스테로이드는 콜레스테롤이다. 일부 양태에서, 화합물 대 콜레스테롤의 몰비는 약 2:1 내지 1:1의 범위이다.
일부 양태에서, 중합체 컨쥬게이트화된 지질은 페길화된(pegylated) 지질이다. 일부 양태에서, 화합물 대 페길화된 지질의 몰비는 약 100:1 내지 약 25:1의 범위이다. 일부 양태에서, 페길화된 지질은 PEG-DAG, PEG 폴리에틸렌 (PEG-PE), PEG-숙시노일-디아실글리세롤 (PEG-S-DAG), PEG-cer 또는 PEG 디알키옥시프로필카르바메이트이다. 일부 양태에서, 페길화된 지질은 하기 구조 III:
Figure pct00004
또는 그의 약제학적으로 허용가능한 염, 호변이성질체 또는 입체이성질체를 가지며, 여기서, R10 및 R11은 각각 독립적으로 10 내지 30개의 탄소 원자를 함유하는 직쇄 또는 분지쇄, 포화 또는 불포화 알킬 사슬이고, 여기서 알킬 사슬에는 선택적으로 하나 이상의 에스테르 결합이 개재되고; z는 30 내지 60 범위의 평균 값을 갖는다. 일부 양태에서, R10 및 R11은 각각 독립적으로 12 내지 16개의 탄소 원자를 갖는 직쇄, 포화 알킬 사슬이다. 일부 양태에서, 평균 z는 약 45이다.
여기서 시작
일부 양태에서, LNP는 다가음이온성 핵산과 혼합시 비-이중층 구조로 자가-조립된다. 일부 양태에서, 비-이중층 구조는 60nm 내지 120nm의 직경을 갖는다. 일부 양태에서, 비-이중층 구조는 약 70nm, 약 80nm, 약 90nm, 또는 약 100nm의 직경을 갖는다. 일부 양태에서, 나노미립자 전달 비히클은 약 100nm의 직경을 갖는다.
또한, 본원에 개시된 벡터를 제조하는 방법이 본원에 개시되어 있으며, 상기 방법은 적어도 하나의 프로모터 서열 및 항원 카세트를 포함하는 플라스미드 서열을 수득하는 단계; 플라스미드 서열을 하나 이상의 숙주 세포로 형질 감염시키는 단계; 및 하나 이상의 숙주 세포로부터 벡터를 단리하는 단계를 포함한다.
일부 측면에서, 단리 단계는 하기를 포함한다: 상기 숙주 세포를 용해하여 상기 벡터를 포함하는 세포 용해물을 수득하는 단계; 및 상기 세포 용해물 및 선택적으로 또한 상기 숙주 세포 배양에 사용된 배지에서 상기 벡터를 정제하는 단계.
일부 측면에서, 상기 플라스미드 서열은 하기 중 하나를 사용하여 생성된다: DNA 재조합 또는 세균 재조합 또는 전체 게놈 DNA 합성 또는 세균 세포 중 합성된 DNA의 증폭을 동반한 전체 게놈 DNA 합성 중 하나를 사용하여 생성된다. 일부 측면에서, 상기 하나 이상의 숙주 세포는 CHO, HEK293 또는 그것의 변이체, 911, HeLa, A549, LP-293, PER.C6, 및 AE1-2a 세포 중 적어도 하나이다. 일부 측면에서, 상기 세포 용해물에서 상기 벡터를 정제하는 단계는 크로마토그래피 분리, 원심분리, 바이러스 침전 및 여과 중 하나 이상을 수반한다.
본 발명의 이와 같은 및 기타 특징, 측면 및 이점은 다음의 설명 및 첨부된 도면과 관련하여 더 잘 이해될 것이다:
도면 (도) 1은 시험관내 T 세포 활성 검사의 전개를 도시한다. 항원 제시 세포에 백신 카세트의 전달이 구별되는 펩티드 항원의 발현, 가공 및 MHC-제한된 제시를 야기하는 검사의 도식. 상기 특이적 펩티드-MHC 조합에 어울리는 T 세포 수용체로 조작된 리포터 T 세포는 활성화됨으로써, 루시퍼라제 발현을 초래한다.
도 2a는 짧은 카세트 중 링커 서열의 평가를 묘사하고, 서로에 대해 동일한 위치에서 연결되는, 2개의 보편적 부류 II MHC 에피토프(MHC-II)가 뒤따르는, 5개 부류 I MHC-제한 에피토프(에피토프 1~5)를 도시한다. 상이한 링커들을 사용하여 다양한 반복(iteration)이 생성되었다. 일부 경우에, 상기 T 세포 에피토프는 서로 직접적으로 연결된다. 다른 경우에, 상기 T 세포 에피토프는 그것의 자연적인 서열이 일측 또는 양측에 있다. 기타 반복(iteration)의 경우, 상기 T 세포 에피토프는 비자연적인 서열 AAY, RR, 및 DPP에 의해 연결된다.
도 2b는 짧은 카세트 중 링커 서열의 평가를 묘사하고, 상기 짧은 카세트에 내재된 T 세포 에피토프에 대한 서열 정보를 도시한다.
도 3은 백신 카세트를 모형화하기 위해 첨가된 세포 표적화 서열의 평가를 도시한다. 상기 표적화 카세트는 유비퀴틴(Ub), 신호 펩티드(SP) 및/또는 막통과(TM) 영역으로 짧은 카세트 디자인을 연장시키고, 상기 5개 표지자 인간 T 세포 에피토프(에피토프 1~5) 또한 2개의 마우스 T 세포 에피토프 SIINFEKL 및 SPSYAYHQF (A5)의 측면을 특별히 포함하고, 양측 상(25mer)의 T 세포 에피토프에 측접하는 상기 비자연적 링커 AAY- 또는 자연적 링커를 사용한다.
도 4는 짧은 카세트 중 링커 서열의 생체내 평가를 도시한다. A) HLA-A2 형질전환 마우스를 사용한 백신 카세트의 생체내 평가의 실험 디자인.
도 5a는 긴 21-mer 카세트에서 에피토프 위치의 영향의 생체내 영향을 묘사하고, 긴 카세트의 디자인이 25-mer 자연적 서열에 함유된 추가의 공지된 T 세포 부류 I 에피토프(에피토프 6 내지 21)에 의해 간격이 벌어진, 그것의 25-mer 자연적 서열(링커 = 자연적 측접 서열)에 함유된 5개 표지자 부류 I 에피토프(에피토프 1 내지 5), 및 2개의 보편적 부류 II 에피토프(MHC-II0)(상기 부류 I 에피토프의 상대적 위치가 변형됨)를 수반함을 도시한다.
도 5b는 긴 21-mer 카세트에서 에피토프 위치의 영향의 생체내 평가를 묘사하고, 사용된 T 세포 에피토프에 대한 서열 정보를 도시한다.
도 6a는 임상전 IND-활성(enabling) 연구를 위한 최종 카세트 디자인을 묘사하고, 상기 최종 카세트의 디자인이 2개 보편적 MHC 부류 II 에피토프를 비롯하여, 25-mer 자연적 서열(링커 = 자연적 측접 서열)에 함유된 20개 MHC I 에피토프(6개 비-인간 유인원(NHP) 에피토프, 5개 인간 에피토프, 9 쥣과 에피토프로 구성됨)를 포함함을 도시한다.
도 6b는 임상전 IND-활성 연구를 위한 최종 카세트 디자인을 도시하고, 2개의 보편적 MHC 부류 II 에피토프 PADRE 및 파상풍 변독소의 서열 뿐만 아니라 비인간 유인원, 마우스 및 인간 기원의 부류 I MHC 상에 제시되는 사용 T 세포 에피토프에 대한 서열 정보를 도시한다.
도 7a는 형질주입 후 ChAdV68.4WTnt.GFP 바이러스 생산을 도시한다. HEK293A 세포는 인산칼슘 프로토콜을 사용하여 ChAdV68.4WTnt.GFP DNA로 형질주입되었다. 바이러스성 복제가 형질주입 후 10일차에 관찰되었고, ChAdV68.4WTnt.GFP 바이러스성 플라크가 광현미경(40x 배율)을 사용하여 시각화되었다.
도 7b는 형질주입 후 ChAdV68.4WTnt.GFP 바이러스 생산을 도시한다. HEK293A 세포가 인산칼슘 프로토콜을 사용하여 ChAdV68.4WTnt.GFP DNA로 형질주입되었다. 바이러스성 복제가 형질주입 후 10일차에 관찰되었고, ChAdV68.4WTnt.GFP 바이러스성 플라크가 형광현미경(40x 배율)을 사용하여 시각화되었다.
도 7c는 형질주입 후 ChAdV68.4WTnt.GFP 바이러스 생산을 도시한다. HEK293A 세포가 인산칼슘 프로토콜을 사용하여 ChAdV68.4WTnt.GFP DNA로 형질주입되었다. 바이러스성 복제가 형질주입 후 10일차 관찰되었고, ChAdV68.4WTnt.GFP 바이러스성 플라크가 형광현미경(100x 배율)을 사용하여 시각화되었다.
도 8a는 형질주입 후 ChAdV68.5WTnt.GFP 바이러스 생산을 도시한다. HEK293A 세포가 리포펙타민 프로토콜을 사용하여 ChAdV68.5WTnt.GFP DNA로 형질주입되었다. 바이러스성 복제(플라크)가 형질주입 후 10일차에 관찰되었다. 용해물이 만들어지고 T25 플라스크의 293A 세포를 재감염시키는데 사용되었다. 3일 후, 광현미경(40x 배율)을 사용하여 ChAdV68.5WTnt.GFP 바이러스성 플라크가 시각화 및 촬영되었다.
도 8b는 형질주입 후 ChAdV68.5WTnt.GFP 바이러스 생산을 도시한다. HEK293A 세포가 리포펙타민 프로토콜을 사용하여 ChAdV68.5WTnt.GFP DNA로 형질주입되었다. 바이러스성 복제(플라크)가 형질주입 후 10일차에 관찰되었다. 용해물이 만들어지고 T25 플라스크의 293A 세포를 재감염시키는데 사용되었다. 3일 후, 형광현미경(40x 배율)을 사용하여 ChAdV68.5WTnt.GFP 바이러스성 플라크가 시각화 및 촬영되었다.
도 8c는 형질주입 후 ChAdV68.5WTnt.GFP 바이러스 생산을 도시한다. HEK293A 세포가 리포펙타민 프로토콜을 사용하여 ChAdV68.5WTnt.GFP DNA로 형질주입되었다. 바이러스성 복제(플라크)가 형질주입 후 10일차에 관찰되었다. 용해물이 만들어지고 T25 플라스크의 293A 세포를 재감염시키는데 사용되었다. 3일 후, 형광현미경(100x 배율)을 사용하여 ChAdV68.5WTnt.GFP 바이러스성 플라크가 시각화 및 촬영되었다.
도 9는 바이러스성 입자 생산 도식을 도시한다.
도 10은 알파바이러스 유래 VEE 자기복제 RNA(srRNA) 벡터를 도시한다.
도 11은 VEE-루시퍼라제 srRNA로 C57BL/6J 마우스 접종 후 생체내 리포터 발현을 도시한다. 다양한 시점에 VEE-루시퍼라제 srRNA(마우스 한 마리당, 10ug 양측 근육내 주사, MC3으로 캡슐화됨)로 C57BL/6J 마우스의 면역화 이후 루시퍼라제 신호의 대표적 이미지가 도시된다.
도 12a는 B16-OVA 종양 보유 마우스에서 MC3 LNP로 제형화된 VEE srRNA로 면역화하고 14일 후 측정된 T-세포 반응를 도시한다. B16-OVA 종양 보유 C57BL/6J 마우스에 VEE-루시퍼라제 srRNA(대조군), VEE-UbAAY srRNA(Vax), VEE-루시퍼라제 srRNA 및 항-CTLA-4(aCTLA-4) 또는 VEE-UbAAY srRNA 및 항-CTLA-4(Vax+aCTLA-4) 10ug을 주사하였다. 이와 더불어, 모든 마우스에 7일차에 항-PD1 mAb 처리를 실시하였다. 각 그룹은 마우스 8마리로 이루어졌다. 면역화 후 14일차에 마우스를 희생시키고, 비장 및 림프절을 수거하였다. SIINFEKL-특이적 T-세포 반응을 IFN-감마 ELISPOT로 분석하였고, 비장세포 106개 당 점형 세포(SFC)로 보고된다. 선들은 중간값을 나타낸다.
도 12b는 B16-OVA 종양 보유 마우스에서 MC3 LNP로 제형화된 VEE srRNA로 면역화한 후 14일차에 측정된 T-세포 반응을 도시한다. B16-OVA 종양 보유 C57BL/6J 마우스에 VEE-루시퍼라제 srRNA(대조군), VEE-UbAAY srRNA(Vax), VEE-루시퍼라제 srRNA 및 항-CTLA-4(aCTLA-4) 또는 VEE-UbAAY srRNA 및 항-CTLA-4(Vax+aCTLA-4) 10ug을 주사하였다. 덧붙여, 모든 마우스를 7일차에 항-PD1 mAb로 처리하기 시작하였다. 각 그룹은 마우스 8마리로 이루어졌다. 면역화 후 14일차에 마우스를 희생시키고, 비장 및 림프절을 수거하였다. SIINFEKL-특이적 T-세포 반응을 MHCI-오량체 염색에 의해 분석하였고, CD8 양성 세포의 백분율로 오량체 양성 세포로 보고되었다. 선들은 중간값을 나타낸다.
도 13a는 B16-OVA 종양 보유 마우스에서 비상동 프라임/부스트 이후 항원-특이적 T-세포 반응을 도시한다. B16-OVA 종양 보유 C57BL/6J 마우스에 GFP(Ad5-GFP)를 발현하는 아데노바이러스를 주사하고, MC3 LNP(대조군) 또는 Ad5-UbAAY와 함께 제형화된 VEE-루시퍼라제 srRNA로 부스트시키고, VEE-UbAAY srRNA(Vax)로 부스트시켰다. 상기 대조군 및 Vax 그룹 양쪽 모두 IgG 대조군 mAb로 처리하였다. 제3 그룹을 항-CTLA-4(aCTLA-4)와 조합하여 Ad5-GFP 프라임/VEE-루시퍼라제 srRNA 부스트로 처리한 반면, 제4 그룹은 항-CTLA-4(Vax+aCTLA-4)와 조합하여 Ad5-UbAAY 프라임/VEE-UbAAY 부스트로 처리하였다. 덧붙여, 모든 마우스를 21일차에 항-PD-1 mAb로 처리하기 시작하였다. T-세포 반응을 IFN-감마 ELISPOT로 측정하였다. 아데노바이러스로의 면역화 이후 14일차에 마우스를 희생시키고, 비장 및 림프절을 수거하였다.
도 13b는 B16-OVA 종양 보유 마우스에서 비상동 프라임/부스트 이후 항원-특이적 T-세포 반응을 도시한다. B16-OVA 종양 보유 C57BL/6J 마우스에 GFP(Ad5-GFP)를 발현하는 아데노바이러스를 주사하고, MC3 LNP(대조군) 또는 Ad5-UbAAY와 함께 제형화된 VEE-루시퍼라제 srRNA로 부스트하고, VEE-UbAAY srRNA(Vax)로 부스트하였다. 상기 대조군 및 Vax 그룹 양쪽 모두 IgG 대조군 mAb로 처리하였다. 제3 그룹은 항-CTLA-4(aCTLA-4)과 조합하여 Ad5-GFP 프라임/VEE-루시퍼라제 srRNA 부스트로 처리한 반면, 제4 그룹은 항-CTLA-4(Vax+aCTLA-4)와 조합하여 Ad5-UbAAY 프라임/VEE-UbAAY 부스트로 처리하였다. 덧붙여, 모든 마우스를 21일차에 항-PD-1 mAb로 처리하기 시작하였다. T-세포 반응을 IFN-감마 ELISPOT으로 측정하였다. 아데노바이러스로 면역화 후 14일차에, 그리고 srRNA로 부스트 후 14일차에(프라임 후 28일차) 마우스를 희생시키고 비장 및 림프절을 수거하였다.
도 13c는 B16-OVA 종양 보유 마우스에서 비상동 프라임/부스트 이후 항원-특이적 T-세포 반응을 도시한다. B16-OVA 종양 보유 C57BL/6J 마우스에 GFP(Ad5-GFP)를 발현하는 아데노바이러스를 주사하고, MC3 LNP(대조군) 또는 Ad5-UbAAY와 함께 제형화된 VEE-루시퍼라제 srRNA로 부스트하고, VEE-UbAAY srRNA(Vax)로 부스트하였다. 상기 대조군 및 Vax 그룹 양쪽 모두 IgG 대조군 mAb로 처리하였다. 제3 그룹은 항-CTLA-4(aCTLA-4)과 조합하여 Ad5-GFP 프라임/VEE-루시퍼라제 srRNA 부스트로 처리한 반면, 제4 그룹은 항-CTLA-4(Vax+aCTLA-4)와 조합하여 Ad5-UbAAY 프라임/VEE-UbAAY 부스트로 처리하였다. 덧붙여, 모든 마우스를 21일차에 항-PD-1 mAb로 처리하기 시작하였다. T-세포 반응을 MHC 부류 I 오량체 염색으로 측정하였다. 아데노바이러스로 면역화 후 14일차에 마우스를 희생시키고 비장 및 림프절을 수거하였다.
도 13d는 B16-OVA 종양 보유 마우스에서 비상동 프라임/부스트 이후 항원-특이적 T-세포 반응을 도시한다. B16-OVA 종양 보유 C57BL/6J 마우스에 GFP(Ad5-GFP)를 발현하는 아데노바이러스를 주사하고, MC3 LNP(대조군) 또는 Ad5-UbAAY와 함께 제형화된 VEE-루시퍼라제 srRNA로 부스트하고, VEE-UbAAY srRNA(Vax)로 부스트하였다. 상기 대조군 및 Vax 그룹 양쪽 모두 IgG 대조군 mAb로 처리하였다. 제3 그룹은 항-CTLA-4(aCTLA-4)과 조합하여 Ad5-GFP 프라임/VEE-루시퍼라제 srRNA 부스트로 처리한 반면, 제4 그룹은 항-CTLA-4(Vax+aCTLA-4)와 조합하여 Ad5-UbAAY 프라임/VEE-UbAAY 부스트로 처리하였다. 덧붙여, 모든 마우스를 21일차에 항-PD-1 mAb로 처리하기 시작하였다. T-세포 반응을 MHC 부류 I 오량체 염색으로 측정하였다. 아데노바이러스로 면역화 후 14일차에, 그리고 srRNA로 부스트 후 14일차에(프라임 후 28일차) 마우스를 희생시키고 비장 및 림프절을 수거하였다.
도 14a는 CT26(Balb/c) 종양 보유 마우스에서 비상동 프라임/부스트 후 항원-특이적 T-세포 반응을 도시한다. 마우스를 MC3 LNP(대조군)와 함께 제형화되거나 또는 Ad5-UbAAY로 프라임된 VEE-루시퍼라제 srRNA로 아데노바이러스 프라임 후 15일차에 Ad5-GFP 로 면역화 및 부스트하였고, VEE-UbAAY srRNA(Vax)로 부스트하였다. 상기 대조군 및 Vax 그룹 양쪽 모두 IgG 대조군 mAb로 처리하였다. 별도의 그룹에 항-PD-1(aPD1)와 조합하여 Ad5-GFP/VEE-루시퍼라제 srRNA 프라임/부스트를 투여한 반면, 제4 그룹에는 항-PD-1 mAb(Vax+aPD1)과 조합하여 Ad5-UbAAY/VEE-UbAAY srRNA 프라임/부스트를 투여하였다. 상기 AH1 펩티드에 대한 T-세포 반응을 IFN-감마 ELISPOT를 사용하여 측정하였다. 아데노바이러스로 면역화 후 12일차에 마우스를 희생시키고, 비장 및 림프절을 수거하였다.
도 14b는 CT26(Balb/c) 종양 보유 마우스에서 비상동 프라임/부스트 후 항원-특이적 T-세포 반응을 도시한다. 마우스를 MC3 LNP(대조군)와 함께 제형화되거나 또는 Ad5-UbAAY로 프라임된 VEE-루시퍼라제 srRNA로 아데노바이러스 프라임 후 15일차에 Ad5-GFP 로 면역화 및 부스트하였고, VEE-UbAAY srRNA(Vax)로 부스트하였다. 상기 대조군 및 Vax 그룹 양쪽 모두 IgG 대조군 mAb로 처리하였다. 별도의 그룹에 항-PD-1(aPD1)와 조합하여 Ad5-GFP/VEE-루시퍼라제 srRNA 프라임/부스트를 투여한 반면, 제4 그룹에는 항-PD-1 mAb(Vax+aPD1)과 조합하여 Ad5-UbAAY/VEE-UbAAY srRNA 프라임/부스트를 투여하였다. 상기 AH1 펩티드에 대한 T-세포 반응을 IFN-감마 ELISPOT를 사용하여 측정하였다. 아데노바이러스로 면역화 후 12일차에 그리고 srRNA로 부스트 후 6일차(프라임 후 21일차)에 마우스를 희생시키고, 비장 및 림프절을 수거하였다.
도 15는 마우스에서 마우스 종양 항원에 대한 T-세포 반응을 유발시키는 ChAdV68을 도시한다. 마우스를 ChAdV68.5WTnt.MAG25mer로 면역화하고, MHC 부류 I 에피토프 SIINFEKL (OVA)에 대한 T-세포 반응을 C57BL/6J 암컷 마우스에서 측정하고, MHC 부류 I 에피토프 AH1-A5를 Balb/c 마우스에서 측정하였다. 106개 비장세포 당 평균 점 형성 세포(SFC) 개수를 ELISpot 검정에서 측정하여 제시하였다. 오차 막대는 표준 편차를 나타낸다.
도 16은 ChAdV6, ChAdV+항-PD-1, srRNA, srRNA+항-PD-1, 또는 단일 항-PD-1 중 하나로 단일 면역화 이후 CT26 종양 모형에서 세포 면역 반응을 도시한다. 각 대조군에서 항원-특이적 IFN-감마 생산을 6마리 마우스의 비장세포에 ELISpot을 사용하여 측정하였다. 결과는 106개 비장세포 당 점 형성 세포(SFC)로 제시하였다. 수평선은 각 군에 대한 중간값을 가리킨다. P값은 Dunnett's 다중 비교검사를 사용하여 결정하였다; *** P<0.0001, **P<0.001, *P<0.05. ChAdV= ChAdV68.5WTnt.MAG25mer; srRNA= VEE-MAG25mer srRNA.
도 17은 ChAdV6, ChAdV+항-PD-1, srRNA, srRNA+항-PD-1, 또는 단일 항-PD-1중 하나로 단일 면역화 후 CT26 종양 모형에서 CD8 T-세포 반응을 도시한다. ICS를 사용하여 CD8 T 세포에서 항원-특이적 IFN-감마 생산을 측정하고, 결과는 총 CD8 T 세포의 백분율로 표현된 항원-특이적 CD8 T 세포로 제시하였다. 수평선이 각 군의 중간값을 가리킨다. P값은 Dunnett's 다중 비교검사를 사용하여 결정하였다; *** P<0.0001, **P<0.001, *P<0.05. ChAdV= ChAdV68.5WTnt.MAG25mer; srRNA= VEE-MAG25mer srRNA.
도 18은 ChAdV/srRNA 비상동 프라임/부스트, srRNA/ChAdV 비상동 프라임/부스트, 또는 srRNA/srRNA 상동 프라이머/부스트로 면역화 후 CT26 종양 모형에서 종양 성장을 도시한다. 또한 프라임 및 부스트 중 항-PD1의 투여와 함께 또는 그것의 투여 없이 프라임/부스트 면역화에서 비교를 묘사하였다. 주 2회 종양체적을 측정하였고, 평균 종양 체적을 연구 시작 후 21일동안 제시하였다. 연구 개시에 그룹당 마우스 22~28마리로 시작하였다. 오차 막대는 평균값 표준 오차(SEM)를 나타낸다. P값은 Dunnett's 검사를 사용하여 결정하였다; *** P<0.0001, **P<0.001, *P<0.05. ChAdV= ChAdV68.5WTnt.MAG25mer; srRNA= VEE-MAG25mer srRNA.
도 19는 ChAdV/srRNA 비상동 프라임/부스트, srRNA/ChAdV 비상동 프라임/부스트, 또는 srRNA/srRNA 상동 프라이머/부스트로 면역화 이후 CT26 종양 모형에서 생존율을 도시한다. 프라임 및 부스트 중 항-PD1의 투여와 함께 또는 투여 없이 프라임/부스트 면역화의 비교를 묘사하였다. P값은 로그순위(log-rank) 검사를 사용하여 결정하였다; ***P<0.0001, **P<0.001, *P<0.01. ChAdV= ChAdV68.5WTnt.MAG25mer; srRNA= VEE-MAG25mer srRNA.
도 20은 ELISpot을 사용하여 측정된 항원-특이적 세포 면역 반응을 도시한다. VEE-MAG25mer srRNA-LNP1 (30μg) (도 20a), VEE-MAG25mer srRNA-LNP1 (100μg)(도 20b), 또는 첫 번째 부스트 면역화 후 ELISpot 1, 2, 3, 4, 5, 6, 8, 9 또는 10 주 (그룹당 붉은 털 원숭이 6 개)를 사용하는 VEE-MAG25mer srRNA-LNP2 (100μg) (도 20c) 상동성 프라임/부스트 또는 ChAdV68.5WTnt.MAG25mer/VEE-MAG25mer srRNA 이종성 프라임/부스트 그룹 (도 20d)에 대한 PBMC에서 6개의 상이한 mamu A01 제한 에피토프에 대한 항원-특이적 IFN-감마 생산을 측정하였다. 결과는 적층 된 막대 그래프 형식으로 각 에피토프에 대한 106 PBMC 당 평균 스팟 형성 세포 (SFC)로서 제시된다. 각 동물에 대한 값을 예비-블리드 수준으로 표준화 하였다(0 주).
도 21은 ELISpot을 사용하여 측정된 항원-특이적 세포 면역 반응을 보여준다. 면역화 전 및 초기 면역화 후 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 또는 24주에 ELISpot을 이용한 ChAdV68.5WTnt.MAG25mer/VEE-MAG25mer srRNA 이종 프라임/부스트 요법으로 면역화한 후 6개의 상이한 mamu A01 제한 에피토프에 대한 항원-특이적 IFN- 감마 생산을 PBMC에서 측정 하였다. 결과는 각각의 에피토프에 대한 106 PBMC 당 평균 스팟 형성 세포 (SFC) (그룹당 6마리의 붉은 털 원숭이)를 적층된 막대 그래프 형식으로 제시한다.
도 22는 ELISpot을 사용하여 측정된 항원-특이적 세포 면역 반응을 보여준다. 면역화 전 및 초기 면역화 후 4, 5, 6, 7, 8, 10, 11, 12, 13, 14 또는 15주에 ELISpot을 이용한 VEE-MAG25mer srRNA LNP2 상동성 프라임/부스트 요법으로 면역화한 후 6개의 상이한 mamu A01 제한 에피토프에 대한 항원-특이적 IFN-감마 생산을 PBMC에서 측정하였다. 결과는 각각의 에피토프에 대한 106 PBMC 당 평균 스팟 형성 세포 (SFC) (그룹당 6마리의 붉은 털 원숭이)를 적층된 막대 그래프 형식으로 제시한다.
도 23은 ELISpot을 사용하여 측정된 항원-특이적 세포 면역 반응을 보여준다. 면역화 전 및 초기 면역화 후 4, 5, 6, 7, 8, 10, 11, 12, 13, 14 또는 15주에 ELISpot을 이용한 VEE-MAG25mer srRNA LNP1 상동성 프라임/부스트 요법으로 면역화한 후 6개의 상이한 mamu A01 제한 에피토프에 대한 항원-특이적 IFN-감마 생산을 PBMC에서 측정하였다. 결과는 각각의 에피토프에 대한 106 PBMC 당 평균 스팟 형성 세포 (SFC) (그룹당 6마리의 붉은 털 원숭이)를 적층된 막대 그래프 형식으로 제시한다.
도 24a 및 도 24b는 Promega의 역동 범위 표준으로부터 생성된 예시적 펩티드 스펙트럼을 나타낸다.
도 25는 EDGE 스코어와 표적화된 MS에 의한 후보 공유 신생항원 펩티드의 검출의 확률 사이의 상관관계를 나타낸다.
도 26은 E1/E3 결실 ChAdV68 바이러스 벡터가 결실된 E1 영역에 도입된 체크포인트 억제제를 공동 발현하는 발현 카세트로 디자인된 것을 예시한다.
도 27은 293A 세포의 감염 후 시험관내 마우스 항-CTLA4 클론 9D9 항체 발현을 보여준다.
도 28a는 chAd68-MAG-IRES-IPI (IPI-MAG) 및 chAd68-GFP-IRES-IPI (IPI-GFP) 감염된 세포에서 인간 항-CTLA-4 IgG1 항체 (이필리무맙) 항체 발현을 보여주는 웨스턴 블롯을 보여준다. HEK293A. 세포는 1의 MOI에서 감염되었고 세포 펠릿 및 상청액은 감염 후 48 시간에 수확되었다. 항-CTLA4 항체는 단백질-G 비드 (ThermoFisher)를 사용한 면역 침강에 의해 상청액으로부터 정제되었다. 펠릿 및 면역 침전된 상청액은 HRP 당나귀 항-인간 IgG 항체를 사용하여 SDS-PAGE 전기 영동 및 웨스턴 블롯팅으로 분석하고 ECL 화학 발광 기질 (ThermoFisher)에 의해 검출되었다.
도 28b는 대조군 바이러스 감염 세포인 (1) chAd68-MAG-IRES-TREME 및 chAd68-M2.2에서 인간 항-CTLA-4 IgG2 항체 (트레멜리무맙) 항체 발현을 입증하는 웨스턴 블롯을 보여준다. HEK293A. 세포는 1의 MOI에서 감염되었고 세포 펠릿 및 상청액은 감염 후 48 시간에 수확되었다. 항-CTLA4 항체는 단백질-G 비드 (Thermofisher)를 사용한 면역 침강에 의해 상청액으로부터 정제되었다. 펠렛 및 면역 침전된 상청액은 HRP 당나귀 항-인간 IgG 항체를 사용하여 SDS-PAGE 전기 영동 및 웨스턴 블롯팅으로 분석하고 ECL 화학 발광 기질 (ThermoFisher)에 의해 검출되었다.
도 29는 30 (L), 40 (XL) 또는 50 (XXL)개의 에피토프를 갖는 대형 항원 카세트에 대한 다양한 종으로부터의 모델 에피토프의 일반적 조직화를 도시한다.
도 30은 ChAd 벡터가 모든 카세트에 대해 공통적인 서열을 인식하는 항-부류 II (PADRE) 항체를 사용한 상기 웨스턴 블롯에 의해 지시된 바와 같이 긴 카세트를 발현함을 보여준다. HEK293 세포를 가변적 크기의 대형 카세트를 발현하는 chAd68 벡터로 감염시켰다 (chAd68-50XXL, chAd68-40XL & chAd68-30L). 감염을 0.2의 MOI로 셋업하였다. 감염 24시간 후 MG132 프로테아솜 억제제를 감염된 웰의 세트에 첨가하였다 (플러스 부호로 나타냄). 바이러스 처리된 웰의 또 다른 세트는 MG132로 처리하지 않았다 (마이너스 부호로 나타냄). 감염되지 않은 HEK293 세포 (293F)를 음성 대조군으로서 사용하였다. 감염 48시간 후 세포 펠릿을 수확하고, SDS/PAGE 전기영동 및 토끼 항-부류 II PADRE 항체를 사용한 면역블롯팅에 의해 분석하였다. HRP 항-토끼 항체 및 ECL 화학발광 기질을 검출에 사용하였다.
도 31은, ICS에 의해 AH1 (상단) 및 SIINFEKL (하단)에 대하여 검출된, chAd68 대형 카세트 면역화된 마우스에서의 CD8+ 면역 반응을 나타낸다. 데이터는 총 CD8 세포에 대한 %로서 모델 에피토프에 대한 IFNg+ 세포로서 제시되어 있다.
도 32는, chAd68 대형 카세트 백신접종 후 LD-AH1+ (상단) 및 Kb-SIINFEKL + (하단) 사량체에 대한 CD8+ 반응을 나타낸다. 데이터는 모델 사량체 펩티드 복합체에 대하여 반응성인 총 CD8 세포에 대한 %로서 제시되어 있다. 터키(Tukey) 시험을 사용한 ANOVA에 의해 *p<0.05, **p<0.01. 모든 p-값이 MAG 20-항원 카세트와 비교되었다.
도 33은, ICS에 의해 AH1 (상단) 및 SIINFEKL (하단)에 대하여 검출된, 알파바이러스 대형 카세트 처리된 마우스에서의 CD8+ 면역 반응을 나타낸다. 데이터는 총 CD8 세포에 대한 %로서 모델 에피토프에 대한 IFNg+ 세포로서 제시되어 있다. 터키 시험을 사용한 ANOVA에 의해 *p<0.05, **p<0.01, ***p<0.001. 모든 p-값이 MAG 20-항원 카세트와 비교되었다.
도 34는 레서스 마카크(rhesus macaque)에서의 항원-카세트 함유 벡터의 면역원성을 평가하기 위해 사용되는 백신접종 전략을 도시한다. 삼각형은 제0 & 32주에서의 chAd68 백신접종 (1e12 vp/동물)을 나타낸다. 원은 제0, 4, 12, 20, 28 & 32주에서의 알파바이러스 백신접종을 나타낸다. 정사각형은 항-CTLA4 항체의 투여를 나타낸다.
도 35는 chAd-MAG 단독 투여된 레서스 마카크에서의 CD8+ 항-에피토프 반응의 시간 코스를 나타낸다 (그룹 4). 평균 SFC/1e6 비장세포가 나타나 있다.
도 36은 IV 전달된 chAd-MAG 플러스 항-CTLA4 항체 (이필리뮤맙) 투여된 레서스 마카크에서의 CD8+ 항-에피토프 반응의 시간 코스를 나타낸다 (그룹 5). 평균 SFC/1e6 비장세포가 나타나 있다.
도 37은 SC 전달된 chAd-MAG 플러스 항-CTLA4 항체 (이필리뮤맙) 투여된 레서스 마카크에서의 CD8+ 항-에피토프 반응의 시간 코스를 나타낸다 (그룹 6). 평균 SFC/1e6 비장세포가 나타나 있다.
도 38은 ELISpot에 의해 측정된 ChAdV68/samRNA 백신 프로토콜에 의해 생성된 항원-특이적 메모리 반응을 나타낸다. 결과는 개개의 점 플롯으로서 제시되어 있고, 여기서 각각의 점은 단일 동물을 나타낸다. 면역화 전 기준선 (좌측 패널) 및 프라이밍 후 18개월에서의 메모리 반응 (우측 패널)이 나타나 있다.
도 39는 조합 사량체 염색 및 CD45RA/CCR7 공동-염색을 사용한 유동 세포계측법에 의한 항원-특이적 CD8+ T-세포의 메모리 세포 표현형화(phenotyping)을 나타낸다.
도 40은 연구 18개월에서의 4개의 Mamu-A*01 사량체+ CD8+ T-세포 집단의 합계 내에서의 메모리 세포 유형의 분포를 나타낸다. 메모리 세포는 하기와 같이 특성화되었다: CD45RA+CCR7+=미접촉(
Figure pct00005
), CD45RA+CCR7-=이펙터 (Teff), CD45RA-CCR7+=중심 메모리 (Tcm), CD45RA-CCR7-=이펙터 메모리 (Tem).
도 41은 낮은 (1.5e6 IU, 왼쪽) 및 높은 (1.5e7 IU, 오른쪽) 벡터 용량에서 항-CTLA4 o9D9의 IP 전달로 chAd-MAG-CTLA4, chAd-MAG-단독 및 chAd-MAG를 사용한 면역화에 대한 항원-특이적 T-세포 반응을 보여준다. IFNγ ELISpot에 의해 측정되고 각 마우스(그룹당 n = 8)에 대한 1e6 비장세포 당 반점 형성 세포로 제시된 반응이다. 막대는 중앙값을 나타낸다.
도 42는 낮음 (1.5e6 IU, 왼쪽) 및 높은 (1.5e7 IU, 오른쪽) 벡터 용량에서 항-CTLA4 o9D9의 IP 전달로 chAd-MAG-CTLA4, chAd-MAG 단독 및 chAd-MAG를 사용한 면역화에 대한 항원 특이적 T-세포 반응을 보여준다. 세포 내 염색 (ICS)에 의해 측정된 반응은 각 마우스(그룹당 n = 8)에 대한 총 CD8+ 세포의 백분율로 IFNγ+ 세포로 제시된다. 막대는 중앙값을 나타낸다.
도 43은 chAd-MAG-CTLA4 또는 chAd-MAG + 항-CTLA4 o9D9의 IP 전달로 면역화 된 마우스의 혈청에서의 항-CTLA4 항체 수준을 보여준다. 전기 화학 발광 (ECL), 각 시점 및 그룹에 대한 평균 및 표준 편차 (그룹당 n = 8 마우스). 검은 색 화살표는 그룹 3 및 4에서 항-CTLA4 투여 시점을 나타낸다. 마우스를 0 일에 ChAd-MAG 및 ChAd-MAG-aCTLA4로 면역화했다. 점선은 검정의 최대 한계를 나타낸다. 항-CTLA4 mAb의 전신 (IP) 전달을 갖는 두 그룹은 모두 면역화 후 측정된 모든 시점에서 분석의 최대 한계에 있다.
도 44는 CT26 종양-보유 마우스에서 CT26 종양 항원 AH1을 인식하는 CD8+ T 세포의 빈도를 나타낸다. P 값은 터키의 다중 비교 시험과 함께 일원 ANOVA를 사용하여 결정되었다; **P<0.001, *P<0.05. ChAdV= ChAdV68.5WTnt.MAG25mer; aCTLA4=항-CTLA4 항체, 클론 9D9.
상세한 설명
I. 정의
일반적으로, 청구범위 및 명세서에서 사용된 용어는 당업자가 이해하는 명백한 의미를 갖는 것으로 해석되도록 의도된다. 추가의 명확성을 제공하기 위해 특정 용어가 아래에 정의된다. 명백한 의미와 제공된 정의가 상충하는 경우, 제공된 정의가 사용되어야 한다.
본 명세서에서 사용된 바와 같이 용어 "항원"은 면역 반응을 유도하는 물질이다. 항원은 신생항원일 수 있다. 항원은 특정 집단, 예를 들어 특정 암 환자 집단 사이에서 발견되는 항원인 "공유 항원"일 수 있다.
본 명세서에서 사용된 바와 같이 용어 "신생항원"은 종양 세포에서의 돌연변이 또는 종양 세포에 특이적 번역후 변형을 통해 상응하는 야생형 항원과 구별되도록 하는 적어도 하나의 변경을 갖는 항원이다. 신생항원은 폴리펩티드 서열 또는 뉴클레오티드 서열을 포함할 수 있다. 돌연변이는 틀이동 또는 비-틀이동 인델(indel), 미스센스(missense) 또는 논센스 치환, 슬라이스 부위 변경, 게놈 재배열 또는 유전자 융합, 또는 신생ORF를 일으키는 임의의 게놈 또는 발현 변경을 포함할 수 있다. 돌연변이는 또한 접합 변이체를 포함할 수 있다. 종양 세포에 특이적인 번역후 변형은 비정상적인 인산화를 포함할 수 있다. 종양 세포에 특이적인 번역후 변형은 또한 프로테아솜-생성된 스플라이싱된 항원을 포함할 수 있다. 문헌[Liepe et al., A large fraction of HLA class I ligands are proteasome-generated spliced peptides; Science. 2016 Oct 21;354(6310):354-358]를 참조한다. 이러한 공유된 신생항원은 투여를 통해 대상체에서 면역 반응을 유도하는데 유용하다. 대상체는 다양한 진단 방법, 예를 들어 아래에 추가로 설명되는 환자 선택 방법을 사용하여 투여를 위해 식별될 수 있다.
본 명세서에서 사용된 바와 같이 용어 "종양 항원"은 대상체의 종양 세포 또는 조직에는 존재하지만 대상체의 상응하는 정상 세포 또는 조직에는 존재하지 않는 항원이거나, 또는 정상 세포 또는 조직과 비교하여 종양 세포 또는 암성 조직에서 발현이 변경된 것으로 알려져 있거나 발견 된 폴리펩티드로부터 유래된다.
본 명세서에서 사용된 바와 같이 용어 "항원-기반 백신"은 하나 이상의 항원, 예컨대 복수의 항원에 기반을 둔 백신 조성물이다. 본 백신은 뉴클레오티드 기반 (예: 바이러스 기반, RNA 기반 또는 DNA 기반), 단백질 기반 (예: 펩티드 기반) 또는 이들의 조합일 수 있다.
본 명세서에서 사용된 바와 같이 용어 "후보 항원"은 항원을 나타낼 수 있는 서열을 생성하는 돌연변이 또는 다른 비정상이다.
본 명세서에서 사용된 바와 같이 용어 "코딩 영역"은 단백질을 인코딩하는 유전자의 부분(들)이다.
본 명세서에서 사용된 바와 같이 용어 "코딩 돌연변이"는 코딩 영역에서 발생하는 돌연변이이다.
본 명세서에서 사용된 바와 같이 용어 "ORF"는 열린 해독틀을 의미한다.
본 명세서에서 사용된 바와 같이 용어 "신생-ORF"는 돌연변이 또는 다른 비정상, 예컨대 스플라이싱으로부터 발생하는 종양-특이적 ORF이다.
본 명세서에서 사용된 바와 같이 용어 "미스센스 돌연변이"는 한 아미노산에서 또다른 아미노산으로의 치환을 일으키는 돌연변이이다.
본 명세서에서 사용된 바와 같이 용어 "논센스 돌연변이"는 아미노산에서 정지 코돈으로의 치환을 일으키거나 표준 시작 코돈의 제거를 일으키는 돌연변이이다.
본 명세서에서 사용된 바와 같이 용어 "틀이동 돌연변이"는 단백질의 프레임에서 변화를 일으키는 돌연변이이다.
본 명세서에서 사용된 바와 같이 용어 "인델"은 하나 이상의 핵산의 삽입 또는 결실이다.
본원에 사용된 바와 같이, 2개 이상의 핵산 또는 폴리펩티드 서열의 문맥에서의 용어 퍼센트 "동일성"은 하기 설명된 서열 비교 알고리즘 중 하나를 사용하여 (예를 들어, BLASTP 및 BLASTN 또는 숙련된 기술자가 이용할 수 있는 다른 알고리즘) 또는 육안 검사에 의해 측정된 바와 같이, 최대 대응을 위해 비교되고 정렬되는 경우 동일한 비율의 뉴클레오티드 또는 아미노산 잔기의 특정 비율을 갖는 2개 이상의 서열 또는 서브서열을 지칭한다. 적용에 따라, 퍼센트 "동일성"은 예를 들어, 기능성 도메인 상에 비교되는 서열의 영역에 걸쳐 존재할 수 있거나, 대안적으로 비교되는 두 서열의 전장에 걸쳐 존재할 수 있다.
서열 비교를 위해, 전형적으로 하나의 서열은 시험 서열이 비교되는 참조 서열로서 작용한다. 서열 비교 알고리즘을 사용할 때, 시험 및 참조 서열이 컴퓨터에 입력되고, 필요하다면 하위서열 좌표가 지정되며, 서열 알고리즘 프로그램 매개변수가 지정된다. 이어서, 서열 비교 알고리즘은 지정된 프로그램 매개변수에 기초하여 참조 서열에 대한 시험 서열(들)에 대한 퍼센트 서열 동일성을 계산한다. 대안적으로, 서열 유사성 또는 비유사성은 특정 뉴클레오티드의 결합된 존재 또는 부재에 의해, 또는 번역된 서열의 경우 선택된 서열 위치에서 아미노산에 의해 확립될 수 있다(예를 들어, 서열 모티프).
비교를 위한 서열의 최적 정렬은, 하기에 의해 진행될 수 있다: 예를 들어 Smith & Waterman (Adv.Appl.Math.2:482 (1981))의 국부 상동성 알고리즘, Needleman & Wunsch(J. Mol. Biol. 48:443 (1970))의 상동성 정렬 알고리즘, Pearson & Lipman (Proc. Nat'l.Acad. Sci. USA 85:2444 (1988))의 유사성 방법의 조사, 이러한 알고리즘의 컴퓨터화된 구현(GAP, BESTFIT, FASTA, 및 TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis.), 또는 육안 검사(참조 일반적으로 Ausubel et al., infra 참조)
퍼센트 서열 동일성 및 서열 유사성을 결정하기에 적합한 알고리즘의 한 예는 BLAST 알고리즘이며, 이는 Altschul et al., J. Mol. Biol. 215:403-410 (1990)에 기재되어있다. BLAST 분석을 수행하기 위한 소프트웨어는 National Center for Biotechnology 정보을 통해 공개적으로 이용할 수 있다.
본 명세서에서 사용된 바와 같이 용어 "비-정지 또는 연속-판독(read-through)"은 천연 정지 코돈의 제거를 일으키는 돌연변이이다.
본 명세서에서 사용된 바와 같이 용어 "에피토프"는 항체 또는 T-세포 수용체에 의해 전형적으로 결합된 항원의 특이적인 부분이다.
본 명세서에서 사용된 바와 같이 용어 "면역원성"은 예를 들어, T 세포, B 세포 또는 둘 모두를 통해 면역 반응을 유도할 수 있는 능력이다.
본 명세서에서 사용된 바와 같이 용어 "HLA 결합 친화성" "MHC 결합 친화성"은 특이적인 항원과 특이적인 MHC 대립유전자 사이의 결합 친화성을 의미한다.
본 명세서에서 사용된 바와 같이 용어 "유인물질(bait)"은 샘플로부터 DNA 또는 RNA의 특이적 서열을 풍부하게 하는데 사용되는 핵산 프로브이다.
본 명세서에서 사용된 바와 같이 용어 "변이체"는 대상체의 핵산과 대조군으로 사용되는 참조 인간 게놈 간의 차이다.
본 명세서에서 사용된 바와 같이 용어 "변이체 호출"은 전형적으로 서열분석으로부터 변이체의 존재를 알고리즘적으로 결정하는 것이다.
본 명세서에서 사용된 바와 같이 용어 "다형성"은 생식계열 변이체, 즉 개체의 모든 DNA-보유 세포에서 발견되는 변이체이다.
본 명세서에서 사용된 바와 같이 용어 "체세포 변이체"는 개체의 비-생식계열 세포에서 발생하는 변이체이다.
본 명세서에서 사용된 바와 같이 용어 "대립유전자"는 유전자의 버전 또는 유전자 서열의 버전 또는 단백질의 버전이다.
본 명세서에서 사용된 바와 같이 용어 "HLA 유형"은 HLA 유전자 대립유전자의 보체이다.
본 명세서에서 사용된 바와 같이 용어 "논센스-매개된 붕괴" 또는 "NMD"는 조기 중단 코돈으로 인한 세포에 의한 mRNA의 분해이다
본 명세서에서 사용된 바와 같이 용어 "몸통 돌연변이(truncal mutation)"는 종양의 발달 초기에 발생하고 종양의 세포의 상당 부분에 존재하는 돌연변이이다.
본 명세서에서 사용된 바와 같이 용어 "서브클로날 돌연변이(subclonal mutation)"는 종양의 발생에서 후기에 발생하고 종양 세포의 서브셋에만 존재하는 돌연변이이다.
본 명세서에서 사용된 바와 같이 용어 "엑솜(exome)"은 단백질을 인코딩하는 게놈의 서브셋이다. 엑솜은 게놈의 집단적인 엑솜일 수 있다.
본 명세서에서 사용된 바와 같이 용어 "로지스틱 회귀"는 통계로부터의 2원 데이터에 대한 회귀 모델이며, 종속 변수가 1과 같을 확률의 로짓(logit)은 종속 변수의 선형 함수로서 모델링된다.
본 명세서에서 사용된 바와 같이 용어 "신경망"은 확률적 구배 강하 및 역-전파를 통해 전형적으로 훈련된 요소별 비선형성이 뒤따르는 선형 변환의 다중 층으로 구성된 분류 또는 회귀에 대한 기작 학습 모델이다.
본 명세서에서 사용된 바와 같이 용어 "단백체"는 세포, 세포그룹 또는 개별에 의해 발현 및/또는 번역되는 모든 단백질의 세트이다.
본 명세서에서 사용된 바와 같이 용어 "펩타이돔"은 MHC-I 또는 MHC-II에 의해 세포 표면 상에 제시되는 모든 펩티드의 세트이다.
펩타이돔은 세포의 특성 또는 세포 집합체(예를 들어, 종양을 포함하는 모든 세포의 펩타이돔의 합체를 의미하는, 종양 펩타이돔)를 지칭할 수 있다.
본 명세서에서 사용된 바와 같이 용어 "ELISPOT"은 인간 및 동물에서 면역 반응을 모니터링하는 일반적인 방법인 효소-결합 면역흡착 스폿 분석을 의미한다.
본 명세서에서 사용된 바와 같이 용어 "덱스트라머"는 유동 세포계측법에서 항원-특이적 T-세포 염색에 사용되는 덱스트란-기반 펩티드-MHC 다합체이다.
본 명세서에서 사용된 바와 같이 용어 "내성 또는 면역 내성"은 하나 이상의 항원, 예를 들어 자기-항원에 대한 면역 비-반응성 상태이다.
본 명세서에서 사용된 바와 같이 용어 "중심 내성"은 자기-반응성 T-세포 클론을 결실시키거나 자기-반응성 T-세포 클론을 면역억제성 조절 T-세포(Tregs)로 분화하는 것을 촉진시킴으로써 흉선에서 영향을 받는 내성이다.
본 명세서에서 사용된 바와 같이 용어 "말초 내성"은 중심 내성을 견뎌내거나 T-세포가 Treg로 분화되도록 촉진하는 자기 반응성 T-세포를 하향 조절하거나 또는 애네르기화(anergizing)시킴으로써 말초에서 영향을 받는 내성이다.
용어 "샘플"은 정맥천자, 배설, 사정, 마사지, 생검, 침상흡인, 세척 샘플, 스크래핑(scraping), 외과적 절개 또는 개입 또는 당해 분야에 공지된 다른 수단을 포함하는 수단에 의해 대상체에서 채취한 단일 세포 또는 다중 세포 또는 세포 단편 또는 체액의 분취액을 포함할 수 있다.
용어 "대상체"는 생체내, 생체외 또는 시험관내, 남성 또는 여성에 관계없이, 세포, 조직 또는 유기체, 인간 또는 비-인간을 포함한다. 용어 대상체는 인간을 포함한 포괄적인 포유동물이다.
용어 "포유동물"은 인간과 비-인간을 포함하며, 인간, 비-인간 영장류, 개과, 고양이과, 쥐과, 소, 말 및 돼지를 포함하지만, 이에 한정되지는 않는다.
용어 "임상 인자"는 대상체의 상태, 예를 들어 질병 활성도 또는 중증도의 척도를 지칭한다. "임상 인자"는 비-샘플 마커, 및/또는 제한없이 연령 및 성별과 같은 대상체의 다른 특성을 포함하여 대상체의 건강 상태의 모든 마커를 포함한다. 임상 인자는 대상체 또는 결정된 조건 하에서의 대상체로부터의 샘플(또는 샘플 모집단)의 평가로부터 얻을 수 있는 스코어, 값 또는 일련의 값일 수 있다. 임상 인자는 또한 마커 및/또는 다른 매개변수, 예컨대 유전자 발현 대리체에 의해 예상될 수 있다. 임상 인자에는 종양 유형, 종양 하위유형 및 흡연 이력이 포함될 수 있다.
용어 "종양에서 유래된 항원-인코딩 핵산 서열"은 예를 들어 RT-PCR을 통해; 또는 종양을 서열화하고 나서 예를 들어, 공지된 다양한 합성 또는 PCR-기반 방법을 통해 서열 데이터를 사용하여 핵산 서열을 합성함으로써 얻어진 서열 데이터를 통해 종양에서 직접 추출된 핵산 서열을 지칭한다.
용어 "알파바이러스"는 토가바이러스과의 구성원을 지칭하고, 양성 감수성 단일 가닥 RNA 바이러스이다. 알파바이러스는 일반적으로 올드 월드, 예컨대 신드비스(Sindbis), 로스 리버(Ross River), 마야로(Mayaro), 치쿤군야(Chikungunya), 및 셈리키 삼림(Semliki Forest) 바이러스, 또는 신규한 월드, 예컨대 동부형마 뇌막염(eastern equine encephalitis), 아우라(Aura), 포트 모건(Fort Morgan), 또는 베네스 웰라형 마뇌염(Venezuelan equine encephalitis) 및 그것의 유도체 균주 TC-83로 분류된다. 알파바이러스는 일반적으로 자체-복제 RNA 바이러스이다.
용어 "알파바이러스 백본" 바이러스성 게놈의 자체-복제를 허용하는 알파바이러스의 최소 서열(들)을 지칭한다. 최소 서열은 비구조적 단백질-매개 증폭, 비구조적 단백질 1 (nsP1) 유전자, nsP2 유전자, nsP3 유전자, nsP4 유전자를 위한 보존 서열 및 폴리A 서열, 뿐만 아니라 26S 프로모터 요소를 포함하는 서브게놈 바이러스성 RNA의 발현을 위한 서열을 포함할 수 있다.
용어 "비구조적 단백질-매개 증폭을 위한 서열"은 당업계에 잘 알려진 알파바이러스 보존 서열 요소 (CSE)를 포함한다. CSE는 비제한적으로, 알파바이러스 5' UTR, 51-nt CSE, 24-nt CSE, 또는 다른 26S 서브게놈 프로모터 서열, 19-nt CSE, 및 알파바이러스 3' UTR를 포함한다.
용어 "RNA 폴리메라아제"는 DNA 주형으로부터 RNA 폴리뉴클레오티드의 생산을 촉매하는 폴리메라아제를 포함한다. RNA 폴리메라아제는 비제한적으로, T3, T7, 및 SP6을 포함하는 박테리오파지 유래 폴리메라아제를 포함한다.
용어 "지질"은 소수성 및/또는 양친매성 분자를 포함한다. 지질은 양이온성, 음이온성, 또는 중성일 수 있다. 지질은 합성 또는 천연 유래, 및 일부 경우에 생분해성일 수 있다. 지질은 비제한적으로, 폴리에틸렌글리콜 (PEG) 접합체 (PEG화 지질), 왁스, 오일, 글리세라이드, 지방, 및 지용성 비타민을 포함하여, 콜레스테롤, 인지질, 지질 접합체를 포함할 수 있다. 지질은 디리놀레일메틸- 4-디메틸아미노부티레이트 (MC3) 및 MC3-유사 분자를 포함할 수 있다.
용어 "지질 나노입자" 또는 "LNP"는 수성 내부를 둘러싸는 지질 함유 막을 사용하여 형성된 소포 유사 구조를 포함하며, 이는 또한 리포솜으로 지칭된다. 지질 나노입자는 계면활성제에 의해 안정화된 고체 지질 코어를 갖는 지질-기반 조성물을 포함한다. 코어 지질은 지방산, 아실글리세롤, 왁스, 및 이들 계면활성제의 혼합물일 수 있다. 생물학적 막 지질 예컨대 인지질, 스핑고미엘린, 담즙염 (타우로콜린산염 나트륨), 및 스테롤 (콜레스테롤)을 안정화제로서 사용할 수 있다. 지질 나노입자는 비제한적으로, 한정된 비율의 하나 이상의 양이온성, 음이온성, 또는 중성 지질을 포함하여, 한정된 비율의 상이한 지질 분자를 사용하여 형성될 수 있다. 지질 나노입자는 외부-막 셀 내의 분자를 캡슐화할 수 있고 이어서 표적 세포와 접촉시켜 캡슐화된 분자를 숙주 세포의 세포질에 전달할 수 있다. 지질 나노입자는 이들의 표면을 포함하여, 비-지질 분자로 변형되거나 작용화될 수 있다. 지질 나노입자는 단일-층(단일층) 또는 다중-층 (다층)일 수 있다. 지질 나노입자는 핵산과 복합화될 수 있다. 단일층 지질 나노입자는 핵산과 복합화될 수 있으며, 핵산은 수성 내부에 존재한다. 다중층 지질 나노입자는 핵산과 복합화될 수 있으며, 핵산은 수성 내부에 있거나 사이에 형성되거나 사이에 샌드위치된다.
약어: MHC: 주요 조직적합성 복합체; HLA: 인간 백혈구 항원, 또는 인간 MHC 유전자좌; NGS: 차세대 염기서열 분석; PPV: 양성 예측치; TSNA: 종양-특이적 신생항원; FFPE: 포르말린-고정, 파라핀-내장; NMD: 논센스-매개 감쇠; NSCLC: 비소-세포 폐암; DC: 수지상 세포.
명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수 형태는 문맥상 다르게 명확히 지시하지 않는 한 복수의 지시대상을 포함한다는 것을 알아야 한다.
문맥에서 구체적으로 언급되거나 달리 명시되지 않는 한, 본원에 사용된 용어 "약"은 당업계의 정규 공차 범위 내, 예를 들어 평균의 2 표준 편차 내로 이해된다. 약은 명시된 값의 10 %, 9 %, 8 %, 7 %, 6 %, 5 %, 4 %, 3 %, 2 %, 1 %, 0.5 %, 0.1 %, 0.05 % 또는 0.01 % 이내로 이해될 수 있다. 문맥상 달리 명확하지 않으면, 본원에 제공된 모든 수치는 용어에 의해 수정된다.
본 명세서에서 직접 정의되지 않은 임의의 용어는 본 발명의 당해 분야 내에서 이해되는 바와 같이 통상적으로 관련된 의미를 갖는 것으로 이해되어야 한다. 특정한 용어들은 본 발명의 양태의 조성물, 디바이스, 방법 등, 및 이들을 제조하거나 사용하는 방법을 기술할 때 종사자에게 추가적인 지침을 제공하기 위해 본원에 논의된다. 동일한 것을 여러 가지 방법으로 언급할 수 있음이 인정될 것이다. 결과적으로 본원에 언급된 하나 이상의 용어들에 대안적인 언어 및 동의어가 사용될 수 있다. 용어가 본원에서 정교화되거나 논의되는지의 여부는 중요하지 않다. 일부 동의어 또는 대체가능한 방법, 물질 등이 제공된다. 하나 또는 몇 개의 동의어 또는 동등한 표현의 설명은 명백하게 언급하지 않는 한 다른 동의어 또는 동등한 표현의 사용을 배제하지 않는다. 용어들의 예를 포함하는 예들의 사용은 단지 설명하기 위한 것이며, 본 발명의 양태의 범주 및 의미를 제한하지 않는다.
명세서 전체에 인용된 모든 참고문헌, 발행된 특허 및 특허 출원은 모든 목적을 위해 그 전문이 본 명세서에 참고로 포함된다.
II. 항원 동정 방법
공유 항원(예를 들어 신생항원)을 동정하는 방법은 수지상 세포와 같은 전문 항원 제시 세포를 포함하는 종양 또는 면역 세포의 세포 표면 상에 제시될 가능성이 있고, 및/또는 면역원성을 가질 가능성이 있는 대상체의 종양으로부터 항원을 동정하는 것을 포함한다. 예를 들어, 이러한 방법은 하기 단계 중 하나를 포함할 수 있다: 상기 대상체의 종양 세포로부터 엑솜, 전사체 또는 전체 게놈 종양 뉴클레오티드 염기서열 분석 및/또는 발현 데이터의 적어도 하나를 얻는 단계이되, 상기 종양 뉴클레오티드 염기서열 분석 및 발현 데이터는 항원 세트의 각각의 펩티드 서열을 나타내는 데이터를 얻는데 사용되는, 단계(예를 들어, 신생항원의 경우, 각 신생항원의 펩티드 서열은 대응하는 야생형 펩티드 서열과 구별되도록 하는 적어도 하나의 변경을 포함하거나 또는 돌연변이가 없는 공유 항원의 경우, 정상 세포 또는 조직과 비교하여 종양 세포 또는 암 조직에서 발현이 변경된 것으로 알려져 있거나 발견된 임의의 폴리펩티드에서 펩티드가 파생된다); 각 항원의 펩티드 서열을 하나 이상의 제시 모델을 입력하여 각각의 항원이 대상체의 종양 세포의 종양 세포 표면 상의 하나 이상의 MHC 대립유전자 또는 종양에 존재하는 세포에 의해 제시될 수치 가능성 세트를 생성하는 단계, 상기 수치적 가능성 세트는 적어도 수신된 질량 분석 데이터에 기초하여 동정되며; 및 선택된 항원 세트를 생성하기 위해 수치적 가능성 세트에 기초하여 항원 세트의 서브셋을 선택하는 단계.
제시 모델은 대응하는 라벨 세트를 포함하는 기준 데이터 세트(또한 훈련 데이터 세트로 지칭됨)에 대해 훈련된 통계적 회귀 또는 기작 학습 (예를 들어, 심층 학습) 모델을 포함할 수 있다, 상기 기준 데이터 세트는 선택적으로 일부 대상체가 종양을 가질 수 있는 복수의 별개 대상체 각각으로부터 얻어지고, 상기 기준 데이터 세트는 하기 중 적어도 하나를 포함한다: 종양 조직으로부터 엑솜 뉴클레오티드 서열을 나타내는 데이터, 정상 조직으로부터 엑솜 뉴클레오티드 서열을 나타내는 데이터, 종양 조직으로부터 전사체 뉴클레오티드 서열을 나타내는 데이터, 종양 조직으로부터 단백체 서열을 나타내는 데이터, 및 종양 조직으로부터 MHC 펩티돔 서열을 나타내는 데이터, 및 정상 조직으로부터 MHC 펩티돔 서열을 나타내는 데이터. 기준 데이터는 질량 분석 데이터, 염기서열 분석 데이터, RNA 염기서열 분석 데이터, 발현 프로파일링 데이터 및 합성 단백질에 연속적으로 노출된 미리 결정된 MHC 대립유전자를 발현하도록 조작된 단일-대립유전자 세포주에 대한 단백질 유전 정보학 데이터, 정상 및 종양 인간 세포주, 및 신선하고 동결된 1차 샘플, 및 T 세포 검정 (예를 들어, ELISPOT)를 추가로 포함할 수 있다. 특정한 양태에서, 참조 데이터 세트는 참조 데이터의 각각의 형태를 포함한다.
제시 모델은 참조 데이터 세트로부터 적어도 부분적으로 유래된 특징 세트를 포함할 수 있으며, 상기 특징 세트는 대립유전자 의존적-특징 및 대립유전자-독립적 특징 중 적어도 하나를 포함한다. 특정한 양태에서 각각의 특징이 포함된다.
또한 공유 항원을 동정하는 방법은 종양 세포의 표면 상에 제시될 수 있는 대상체의 하나 이상의 종양 세포로부터 하나 이상의 항원을 확인함으로써 맞춤형 암 백신을 구축하기 위한 출력물을 생성하는 것을 포함한다. 예로서, 하나의 이러한 방법은 대상체의 종양 세포 및 정상 세포로부터 엑솜, 전사체 또는 전체 게놈 뉴클레오티드 서열 분석 및/또는 발현 데이터 중 적어도 하나를 얻는 단계로서 여기서 상기 뉴클레오티드 서열 분석 및/또는 발현 데이터는 종양 세포로부터의 뉴클레오티드 서열 분석 및/또는 발현 데이터와 정상 세포로부터의 뉴클레오티드 서열 분석 및/또는 발현 데이터를 비교함으로써 동정된 각각의 항원 세트의 펩티드 서열 (예를 들어, 신생항원의 경우, 각 신생항원의 펩티드 서열은 대응하는 야생형 펩티드 서열과 구별되도록 하는 적어도 하나의 변경을 포함하거나 또는 돌연변이가 없는 공유 항원의 경우, 정상 세포 또는 조직과 비교하여 종양 세포 또는 암 조직에서 발현이 변경된 것으로 알려져 있거나 발견된 임의의 폴리펩티드에서 펩티드가 파생된다), 대상체의 정상 세포에서 동정된 펩티드 서열을 나타내는 데이터를 얻기 위해 사용되는, 단계; 각각의 항원의 펩티드 서열을 상응하는 수치 벡터로 인코딩하는 단계 (각각의 수치 벡터는 펩티드 서열을 포함하는 복수의 아미노산 및 펩티드 서열에서 아미노산의 위치 세트를 포함하는 정보를 포함함); 컴퓨터 프로세서를 사용하여 수치 벡터를 딥 러닝 제시 모델에 입력하여 항원 세트에 대한 제시 가능성 세트를 생성하는 단계 (세트에서의 각각의 제시 가능성은 상응하는 항원이 대상체의 종양 세포의 표면 상에 하나 이상의 부류 II MHC 대립유전자에 의해 제시된 가능성을 나타내고, 딥 러닝 제시 모델); 선택된 항원의 세트를 생성하기 위해 제시 가능성 세트에 기초하여 항원 세트의 서브셋을 선택하는 단계; 및 선택된 항원 세트에 기초하여 맞춤형 암 백신을 구성하기 위한 출력물을 생성하는 단계를 포함할 수 있다.
신생항원을 포함하여 항원을 확인하기 위한 특정 방법은 당업자에게 공지되어 있으며, 예를 들어 국제 특허 출원 공개 WO/2017/106638, WO/2018/195357 및 WO/2018/208856에 보다 상세하게 설명된 방법이 알려져 있으며, 각각은 모든 목적을 위해 그 전체가 본원에 참조로 포함된다.
본원에 기재된 항원 동정 방법 중 임의의 단계를 수행하는 단계를 포함하는 그리고 선택된 항원 세트를 포함하는 종양 백신을 얻는 단계, 및 상기 종양 백신을 대상체에게 투여하는 단계를 추가로 포함하는, 종양을 갖는 대상체를 치료하는 방법이 본원에 개시된다.
본원에서 개시된 방법은 또한 서브셋에서 하나 이상의 항원에 대해 항원-특이적인 하나 이상의 T 세포를 확인하는 단계를 포함할 수 있다. 일부 구현예에서, 확인하는 단계는 하나 이상의 항원-특이적 T 세포를 확장시키는 조건하에서 서브셋에서 하나 이상의 항원과 하나 이상의 T 세포를 공동 배양하는 것을 포함한다. 추가의 구체예에서, 확인하는 단계는 하나 이상의 T 세포를, T 세포와 사량 체 사이의 결합을 허용하는 조건하에서 서브셋에서 하나 이상의 항원을 포함하는 사량체와 접촉시키는 단계를 포함한다. 추가의 구체예에서, 본원에 개시된 방법은 또한 하나 이상의 동정된 T 세포의 하나 이상의 T 세포 수용체 (TCR)를 식별하는 단계를 포함할 수 있다. 특정 구체예에서, 하나 이상의 T 세포 수용체를 확인하는 것은 하나 이상의 동정된 T 세포의 T 세포 수용체 서열을 서열 분석하는 것을 포함한다. 본원에 개시된 방법은 하나 이상의 동정된 T 세포 수용체 중 적어도 하나를 발현하기 위해 복수의 T 세포를 유전자 조작하는 단계; 복수의 T 세포를 확장시키는 조건하에서 복수의 T 세포를 배양하는 단계; 및 확장된 T 세포를 대상체에게 주입하는 단계를 포함한다. 일부 구체예에서, 하나 이상의 동정된 T 세포 수용체 중 하나 이상을 발현시키기 위해 복수의 T 세포를 유전자 조작하는 것은 하나 이상의 동정된 T 세포의 T 세포 수용체 서열을 발현 벡터로 클로닝하는 단계; 및 복수의 T 세포 각각을 발현 벡터로 형질 감염시키는 단계를 포함한다. 일부 구체예에서, 본원에 개시된 방법은 하나 이상의 동정된 T 세포를 확장시키는 조건하에서 하나 이상의 동정된 T 세포를 배양하는 단계; 및 확장된 T 세포를 대상체에게 주입하는 단계를 추가로 포함한다.
또한, 서브셋에서 적어도 하나의 선택된 항원에 대해 항원-특이적인 단리된 T 세포가 본원에 개시된다.
또한, 대상체의 종양 세포로부터 엑솜, 전사체 또는 전체 게놈 종양 뉴클레오티드 서열분석 및/또는 발현 데이터 중 적어도 하나를 얻는 단계이며, 여기서 종양 뉴클레오티드 서열분석 및/또는 발현 데이터는 항원의 세트의 각각의 펩티드 서열을 나타내는 데이터를 얻기 위해 사용되는 것인 단계 (예를 들어, 신생항원의 경우, 여기서 각각의 신생항원의 펩티드 서열은 상응하는 야생형 펩티드 서열과 구별되도록 하는 적어도 하나의 변경을 포함하거나, 또는 돌연변이를 갖지 않는 공유 항원의 경우, 여기서 펩티드는 정상 세포 또는 조직과 비교하여 종양 세포 또는 암성 조직에서 변경된 발현을 갖는 것으로 공지되거나 나타난 임의의 폴리펩티드로부터 유래됨); 각각의 항원의 펩티드 서열을 하나 이상의 제시 모델로 입력하여 각각의 항원이 대상체의 종양 세포의 종양 세포 표면 상의 하나 이상의 MHC 대립유전자에 의해 제시되는 수치적 가능성의 세트를 생성하는 단계이며, 여기서 수치적 가능성의 세트는 적어도 수신된 질량 분광분석 데이터에 기초하여 동정되는 것인 단계; 및 수치적 가능성의 세트에 기초하여 항원의 세트의 서브셋을 선택하여 선택된 항원의 세트를 생성하는 단계; 및 선택된 항원의 세트를 포함하는 종양 백신을 생성하는 또는 생성한 단계를 포함하는, 종양 백신의 제조 방법이 본원에서 개시된다.
또한, 대상체의 종양 세포로부터 엑솜, 전사체 또는 전체 게놈 종양 뉴클레오티드 서열분석 및/또는 발현 데이터 중 적어도 하나를 얻는 단계이며, 여기서 종양 뉴클레오티드 서열분석 및/또는 발현 데이터는 항원의 세트의 각각의 펩티드 서열을 나타내는 데이터를 얻기 위해 사용되는 것인 단계 (여기서 각각의 항원의 펩티드 서열) (예를 들어, 신생항원의 경우, 여기서 각각의 신생항원의 펩티드 서열은 상응하는 야생형 펩티드 서열과 구별되도록 하는 적어도 하나의 변경을 포함하거나, 또는 돌연변이를 갖지 않는 공유 항원의 다른 경우, 여기서 펩티드는 정상 세포 또는 조직과 비교하여 종양 세포 또는 암성 조직에서 변경된 발현을 갖는 것으로 공지되거나 나타난 임의의 폴리펩티드로부터 유래됨); 각각의 항원의 펩티드 서열을 하나 이상의 제시 모델로 입력하여 각각의 항원이 대상체의 종양 세포의 종양 세포 표면 상의 하나 이상의 MHC 대립유전자에 의해 제시되는 수치적 가능성의 세트를 생성하는 단계이며, 여기서 수치적 가능성의 세트는 적어도 수신된 질량 분광분석 데이터에 기초하여 동정되는 것인 단계; 및 수치적 가능성의 세트에 기초하여 항원의 세트의 서브셋을 선택하여 선택된 항원의 세트를 생성하는 단계; 및 선택된 항원의 세트를 포함하는 종양 백신을 생성하는 또는 생성한 단계를 포함하는 방법을 수행함으로써 선택된, 선택된 항원의 세트를 포함하는 종양 백신이 본원에서 개시된다.
종양 백신은 뉴클레오티드 서열, 폴리펩티드 서열, RNA, DNA, 세포, 플라스미드 또는 벡터 중 하나 이상을 포함할 수 있다.
종양 백신은 종양 세포 표면 상에 존재하는 하나 이상의 항원을 포함할 수 있다.
종양 백신은 대상체에서 면역원성인 하나 이상의 항원을 포함할 수 있다.
종양 백신은 대상체의 정상 조직에 대한 자가면역 반응을 유도하는 하나 이상의 신생항원을 포함하지 않을 수 있다.
종양 백신은 아쥬반트를 포함할 수 있다.
종양 백신은 부형제를 포함할 수 있다.
본원에 개시된 방법은 또한 제시 모델에 기초하여 선택되지 않은 항원에 비해 종양 세포 표면 상에 제시될 가능성이 증가된 신생항원을 선택하는 단계를 포함할 수 있다.
본원에 개시된 방법은 또한 제시 모델에 기초하여 선택되지 않은 항원에 비해 상기 대상체에서 종양-특이적 면역 반응을 유도할 수 있는 가능성이 증가된 항원을 선택하는 단계를 포함할 수 있다.
본 명세서에 개시된 방법은 또한 제시 모델에 기반하여 비선택된 항원에 비해 훈련 항원 제시 세포(APC)에 의해 미접촉 T 세포에 지시될 수 있는 가능성이 증가한 항원을 선택하는 단계를 포함할 수 있으며, 선택적으로 상기 APC는 수지상 세포(DC)이다.
본원에 개시된 방법은 또한 제시 모델에 기초하여 선택되지 않은 항원에 비해 중추 또는 말초 내성을 통해 억제될 가능성이 감소된 항원을 선택하는 단계를 포함할 수 있다.
본원에 개시된 방법은 또한 제시 모델에 기초하여 선택되지 않은 항원에 비해 대상체의 정상 조직에 대한 자가면역 반응을 유도할 수 있는 가능성이 감소된 항원을 선택하는 단계를 포함할 수 있다.
엑솜 또는 전사체 뉴클레오티드 서열분석 및/또는 발현 데이터는 종양 조직에 대해 염기서열 분석을 수행하여 얻을 수 있다.
서열분석은 차세대 염기서열 분석(NGS) 또는 임의의 대규모 병렬 염기서열 분석 접근법일 수 있다.
상기 수치적 가능성 세트는 하기 중 적어도 하나를 포함하는 적어도 MHC-대립유전자 상호작용 특징에 의해 추가로 동정될 수 있다: MHC-대립유전자 및 항원 인코딩 펩티드가 결합하는 예측 친화성; 항원 인코딩된 펩티드-MHC 복합체의 예측된 안정성; 항원 인코딩된 펩티드의 서열 및 길이; 질량-분광분석법 프로테오믹스 또는 다른 수단에 의해 평가된 바와 같이 특정한 MHC 대립유전자를 발현하는 다른 개체로부터의 세포에서 유사한 서열을 갖는 신생항원 인코딩된 펩티드의 제시 확률; 문제의 대상체에서 특정한 MHC 대립유전자의 발현 수준 (예를 들어, RNA-seq 또는 질량 분광분석법으로 측정됨); 특정한 MHC 대립유전자를 발현하는 다른 구별되는 대상체에서 특정한 MHC 대립유전자에 의한 제시의 전반적인 신생항원 인코딩된 펩티드-서열-독립적인 확률; 다른 구별되는 대상체에서 동일한 분자 군 (예들 들어, HLA-A, HLA-B, HLA-C, HLA-DQ, HLA-DR, HLA-DP)에 속한 MHC 대립유전자에 의한 전반적인 신생항원 인코딩된 펩티드-서열-독립적인 제시 확률.
상기 수치적 가능성 세트는 하기 중 적어도 하나를 포함하는 적어도 MHC-대립유전자 비상호작용 특징에 의해 추가로 동정된다: 그의 공급원 단백질 서열 내 신생항원 인코딩된 펩티드에 측접한 C-말단 및 N-말단 서열; 종양 세포에서 상응하는 프로테아제의 발현에 따라 선택적으로 가중된 신생항원 인코딩된 펩티드 내의 프로테아제 절단 모티프의 존재 (RNA-seq 또는 질량 분석에 의해 측정된 바와 같음); 적절한 세포 유형에서 측정된 공급원 단백질의 전환율; RNA-seq 또는 단백체 질량 분광분석법으로 측정된 바와 같이, 또는 DNA 또는 RNA 서열 데이터에서 검출된 생식계열 또는 체세포 스플라이싱 돌연변이의 주석으로부터 예상된 바와 같이 종양 세포에서 가장 많이 발현되는 특정한 스플라이스 변이체("동형체")를 선택적으로 고려한 공급원 단백질의 길이; 프로테아솜, 면역프로테아솜, 열프로테아솜, 또는 종양 세포내 기타 프로테아제의 발현 수준 (RNA-seq, 단백체 질량 분광분석법, 또는 면역조직화학에 의해 측정될 수 있음); 신생항원 인코딩된 펩티드의 공급원 유전자의 발현 (예를 들어, RNA-seq 또는 질량 분석에 의해 측정됨); 세포주기의 다양한 단계 동안 신생항원 인코딩된 펩티드의 공급원 유전자의 전형적인 조직-특이적인 발현; 예를 들어 uniProt 또는 PDB http://www.rcsb.org/pdb/home/home.do에서 찾을 수 있을 것 같은 공급원 단백질 및/또는 이의 도메인의 특징의 포괄적 카탈로그; 펩티드를 함유하는 공급원 단백질의 도메인의 특성을 기술하는 특징, 예를 들어: 2차 또는 3차 구조 (예를 들어, 알파 나선 대 베타 시트); 대안적인 접합; 다른 구별되는 대상체에서 문제의 신생항원 인코딩된 펩티드의 공급원 단백질로부터의 펩티드 제시 확률; 기술 편향으로 인해 펩티드가 질량 분석으로 검출되거나 과잉 표현되지 않을 확률; 종양 세포, 기질, 또는 종양-침윤 림프구 (TIL)의 상태에 대해 정보를 제공하는 RNASeq(펩티드의 공급원 단백질을 함유할 필요가 없음)에 의해 측정된 다양한 유전자 모듈/경로의 발현; 종양 세포에서 신생항원 인코딩된 펩티드의 공급원 유전자의 카피 수; 펩티드가 TAP에 결합될 확률 또는 TAP에 대한 펩티드의 측정되거나 예측된 결합 친화성; 종양 세포에서의 TAP 발현 수준 (RNA-seq, 단백체 질량 분석, 면역조직화학법에 의해 측정될 수 있음); 비제한적으로 하기를 포함하는 종양 돌연변이의 존재 또는 부재: EGFR, KRAS, ALK, RET, ROS1, TP53, CDKN2A, CDKN2B, NTRK1, NTRK2, NTRK3와 같은 공지된 암 운전자 유전자 및 항원 제시 기작에 관련된 단백질을 인코딩하는 유전자 (예를 들어, B2M, HLA-A, HLA-B, HLA-C, TAP-1, TAP-2, TAPBP, CALR, CNX, ERP57, HLA-DM, HLA-DMA, HLA-DMB, HLA-DO, HLA-DOA, HLA-DOB, HLA-DP, HLA-DPA1, HLA-DPB1, HLA-DQ, HLA-DQA1, HLA-DQA2, HLA-DQB1, HLA-DQB2, HLA-DR, HLA-DRA, HLA-DRB1, HLA-DRB3, HLA-DRB4, HLA-DRB5 또는 프로테아솜 또는 면역프로테아솜의 성분에 대해 코딩된 임의의 유전자)에서 운전자 돌연변이. 대상체가 종양에서 기능상실 돌연변이를 일으키는 항원-제시 기작의 성분에 의존하는 펩티드는 제시 확률을 감소시킨다; 비제한적으로 하기를 포함하는 기능성 생식계 다형성의 존재 또는 부재: 항원 제시 기작과 관련된 단백질을 인코딩하는 유전자 (예를 들어, B2M, HLA-A, HLA-B, HLA-C, TAP-1, TAP-2, TAPBP, CALR, CNX, ERP57, HLA-DM, HLA-DMA, HLA-DMB, HLA-DO, HLA-DOA, HLA-DOB, HLA-DP, HLA-DPA1, HLA-DPB1, HLA-DQ, HLA-DQA1, HLA-DQA2, HLA-DQB1, HLA-DQB2, HLA-DR, HLA-DRA, HLA-DRB1, HLA-DRB3, HLA-DRB4, HLA-DRB5 또는 프로테아솜 또는 면역프로테아솜의 성분에 대해 코딩된 임의의 유전자); 종양 유형 (예를 들어, NSCLC, 흑색종); 임상 종양 아유형 (예를 들어, 편평 폐암 대 비-편평); 흡연 이력; 선택적으로 운전자 돌연변이에 의해 층화된 관련 종양 유형 또는 임상 아유형에서 펩티드의 공급원 유전자의 전형적인 발현.
적어도 하나의 변경은 틀이동 또는 비-틀이동 인델, 미스센스 또는 논센스 치환, 스플라이스 부위 변경, 게놈 재배열 또는 유전자 융합, 또는 신생ORF를 생성시키는 임의의 게놈 또는 발현 변경일 수 있다.
종양 세포는 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 대장암, 고환암, 두경부암, 췌장암, 뇌암, B-세포 림프종, 급성 골수성 백혈병, 만성 골수성 백혈병, 만성 림프성 백혈병, 및 T 세포 림프성 백혈병, 비-소세포 폐암, 및 소세포 폐암으로 이루어진 군으로부터 선택될 수 있다.
본원에 개시된 방법은 또한 선택된 신생항원 또는 이의 서브셋의 세트를 포함하는 종양 백신을 얻는 단계를 포함할 수 있으며, 선택적으로 종양 백신을 대상체에게 투여하는 단계를 추가로 포함한다
폴리펩티드 형태인 경우, 선택된 신생항원 세트에서 적어도 하나의 신생항원은 하기 중 적어도 하나를 포함할 수 있다: 1000nM 미만의 IC50 값을 갖는 MHC와의 결합 친화성, MHC 부류 I 폴리펩티드에 대해 길이 8-15, 8, 9, 10, 11, 12, 13, 14, 또는 15 아미노산, MHC 부류 II 폴리펩티드에 대해 길이 6-30, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30 아미노산, 프로테아솜 절단을 촉진하는 모체 단백질 서열 내의 폴리펩티드 내 또는 근방의 서열 모티프의 존재, 및 TAP 수송을 촉진하는 서열 모티프의 존재. MHC 부류 II의 경우, 세포 외 또는 리소좀 프로테아제 (예를 들어, 카텝신) 또는 HLA-DM 촉매화된 HLA 결합에 의한 절단을 촉진하는 펩티드 내부 또는 근처의 서열 모티프의 존재.
본원은 종양 세포의 종양 세포 표면 상에 제시될 수 있는 하나 이상의 신생항원을 동정하기 위한 방법을 개시하며, 하기 단계들을 수행하는 것을 포함한다: 복수의 신선하거나 동결된 종양 샘플로부터 유래된 주요 조직적합성 복합체(MHC)로부터 용출된 복수의 단리된 펩티드와 관련된 데이터를 포함하는 질량 분광분석 데이터를 수신하는 단계; 상기 종양 샘플에 존재하고 각각의 훈련 펩티드 서열과 관련된 하나 이상의 MHC 대립유전자 상에 제시되는 훈련 펩티드 서열 세트를 적어도 동정함으로써 훈련 데이터 세트를 얻는 단계; 훈련 펩티드 서열에 기초하여 훈련 단백질 서열의 세트를 얻는 단계; 및 상기 훈련 단백질 서열 및 상기 훈련 펩티드 서열을 사용하여 제시 모델의 수치 매개변수 세트를 훈련하는 단계로서, 상기 제시 모델은 종양 세포로부터 펩티드 서열이 종양 세포 표면 상의 하나 이상의 MHC 대립유전자에 의해 제시되는 복수의 수치 가능성을 제공하는, 단계.
제시 모델은 하기 사이의 의존성을 나타낼 수 있다.: MHC 대립유전자 중 특정 하나의 쌍 및 펩티드 서열의 특정 위치에서 특정 아미노산의 존재; 및 특정 위치에서 특정 아미노산을 포함하는 그러한 펩티드 서열의 쌍의 MHC 대립유전자 중 특정 하나에 의해 종양 세포 표면 상에서의 제시의 가능성.
본원에 개시된 방법은 또한 신생항원의 서브셋을 선택하는 단계로서, 상기 신생항원의 서브셋은 각각이 하나 이상의 구별되는 종양 신생항원와 관련하여 종양의 세포 표면 상에 제시되는 증가된 가능성을 갖기 때문에 선택되는 단계를 포함할 수 있다.
본원에 개시된 방법은 또한 신생항원의 서브셋을 선택하는 단계로서, 상기 신생항원의 서브셋은 각각이 하나 이상의 구별되는 종양 신생항원와 관련하여 상기 대상체내에서 종양-특이적 면역 반응을 유도할 수 있는 증가된 가능성을 갖기 때문에, 선택되는 단계를 포함할 수 있다.
본 명세서에 개시된 방법은 신생항원의 하위 세트를 선별하는 단계를 포함하는데, 신생항원의 서브셋은 그 각각이 하나 또는 그 이상의 개별적 종양 신생항원에 관련된 훈련 항원 제시 세포(APC)에 의해 미접촉 T 세포에 제시될 수 있는 방식으로 증가되므로 신생항원의 서브셋이 선별되며, 선택적으로 상기 APC는 수지상 세포(DC)이다.
본원에 개시된 방법은 또한 신생항원의 서브셋을 선택하는 단계로서, 상기 신생항원의 서브셋은 각각이 하나 이상의 구별되는 종양 신생항원에 대한 중추 또는 말초 내성을 통해 억제될 낮은 가능성을 갖기 때문에 선택되는 단계를 포함할 수 있다.
본원에 개시된 방법은 또한 신생항원의 서브셋을 선택하는 단계로서, 상기 신생항원의 서브셋은 각각이 하나 이상의 구별되는 종양 신생항원에 대한 대상체의 정상 조직에 대한 자가면역 반응을 유도할 수 있는 감소된 가능성을 갖기 때문에 선택되는 단계를 포함할 수 있다.
본원에 개시된 방법은 또한 신생항원의 서브셋을 선택하는 단계로서, 상기 신생항원의 서브셋은 각각이 종양 세포 대 APC에서 차별적으로 번역후 변형될 감소된 가능성을 갖기 때문에 선택되며, 선택적으로 상기 APC는 수지상 세포(DC)인, 단계를 포함할 수 있다.
본원의 방법의 실시는 달리 지시하지 않는 한, 당해 분야의 숙련가 내에서 단백질 화학, 생화학, 재조합 DNA 기술 및 약리학의 통상적인 방법을 사용할 것이다. 이러한 기술은 문헌에서 충분히 설명되어있다. 예를 들어, 문헌[T.E. Creighton, Proteins: Structures 및 Molecular Properties (W.H. Freeman 및 Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Methods In Enzymology (S. Colowick 및 N. Kaplan eds., Academic Press, Inc.); Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990); Carey 및 Sundberg Advanced Organic Chemistry 3 rd Ed. (Plenum Press) Vols A 및 B(1992)]을 참조한다.
III. 신생항원에서 종양 특이적 돌연변이의 동정
또한, 특정 돌연변이(예를 들어, 암세포에 존재하는 변이체 또는 대립유전자)를 동정하는 방법이 본 명세서에 개시되어 있다. 특히, 이러한 돌연변이는 대상체의 정상 조직이 아니라 암에 걸린 대상체의 암세포의 게놈, 전사체, 단백체, 또는 엑솜에 존재할 수 있다. 종양에 특이적인 공유 신생항원을 포함하여 신생항원을 동정하기 위한 특정 방법은 당업자에게 공지된 방법, 예를 들어 국제 특허 출원 공개 WO/2017/106638, WO/2018/195357, 및 WO/2018/208856에 좀더 상세하게 설명된 방법으로 알려져 있으며, 각각은 모든 목적을 위해 그 전체가 본원에 참조로 포함된다.
종양의 유전적 돌연변이는 종양에서만 배타적으로 단백질의 아미노산 서열의 변화를 유도하는 경우 종양의 면역학적 표적화에 유용하다고 간주될 수 있다. 유용한 돌연변이는 하기를 포함한다: (1) 단백질내 상이한 아미노산으로 이어지는 비-동의 돌연변이; (2) 정지 코돈이 변형 또는 결실되어 C-말단에서 새로운 종양-특이적 서열을 갖는 더 긴 단백질의 번역을 유도하는 연속판독 돌연변이; (3) 성숙한 mRNA에 인트론을 포함시켜 특유의 종양-특이적 단백질 서열을 포함시키는 스플라이스 부위 돌연변이; (4) 2개의 단백질의 접합부에서 종양-특이적 서열을 갖는 키메라 단백질을 생성시키는 염색체 재배열(즉, 유전자 융합); (5) 새로운 종양-특이적 단백질 서열을 갖는 신규한 열린 해독틀을 이끄는 틀이동 돌연변이 또는 결실. 돌연변이는 또한, 비-틀이동 인델, 미스센스 또는 논센스 치환, 스플라이스 부위 변경, 게놈 재배열 또는 유전자 융합, 또는 신생 ORF를 생성시키는 임의의 게놈 또는 발현 변경 중 하나 이상을 포함할 수 있다.
종양 세포에서 예를 들어 스플라이스-부위, 틀이동, 연속판독 또는 유전자 융합 돌연변이로 인해 발생하는 돌연변이가 있는 펩티드 또는 돌연변이된 폴리펩티드는 종양 대 정상 세포에서 DNA, RNA 또는 단백질을 염기서열 분석함으로써 동정할 수 있다.
또한 돌연변이에는 이전에 동정된 종양 특이적 돌연변이가 포함될 수 있다. 알려진 종양 돌연변이는 암의 체세포 돌연변이(COSMIC)의 데이터베이스에서 찾을 수 있다.
개개인의 DNA 또는 RNA에서 특정한 돌연변이 또는 대립유전자의 존재를 검출하기 위한 다양한 방법이 이용가능하다. 이 분야의 진전은 정확하고 쉽고 저렴한 대규모 SNP 유전자분석(genotyping)을 제공한다. 예를 들어, 동적 대립유전자-특이적 하이브리드화(DASH), 마이크로플레이트 어레이 대각선 겔 전기영동(MADGE), 파이로서열분석, 올리고뉴클레오티드-특이적 결찰, TaqMan 시스템 뿐만 아니라 Affymetrix SNP 칩과 같은 다양한 DNA "칩" 기술을 포함하는 여러 기술들이 기술되어 있다. 이들 방법은 전형적으로 PCR에 의해 표적 유전자 영역의 증폭을 이용한다. 또 다른 방법들은 침습성 절단에 의한 작은 신호 분자의 생성, 이어서 질량 분광분석법 또는 고정된 패드록 프로브 및 롤링-서클 증폭에 기초되어 있다. 특이적인 돌연변이를 검출하기 위한 당해 분야에 공지된 몇 가지 방법이 하기에 요약되어 있다.
PCR 기반 검출 수단은 복수의 마커의 멀티플렉스 증폭을 동시에 포함할 수 있다. 예를 들어, 크기가 중첩되지 않고 동시에 분석될 수 있는 PCR 생성물을 생성하기 위한 PCR 프라이머를 선택하는 것은 당해 분야에 잘 알려져 있다. 대안적으로, 차별적으로 표지되고 그에 따라서 차별적으로 검출될 수 있는 프라이머에 의해 상이한 마커를 증폭시키는 것이 가능하다. 물론, 하이브리드화 기반의 검출 수단은 샘플내 다중 PCR 생성물의 차별적인 검출을 허용한다. 복수의 마커의 다중 분석을 가능하게 하는 다른 기술에 당해 기술 분야에 알려져 있다.
게놈 DNA 또는 세포 RNA 내 단일 뉴클레오티드 다형성 분석을 용이하게 하기 위해 여러 가지 방법이 개발되었다. 예들 들어, 단일 염기 다형성은 예들 들어, [Mundy, C. R. (미국특허번호 4,656,127)]에 기재된 바와 같이 특이한 엑소뉴클레아제 내성 뉴클레오티드를 사용함으로써 검출할 수 있다. 상기 방법에 따라, 다형성 부위의 3' 바로 옆에 있는 대립유전자 서열에 상보적인 프라이머를 특정한 동물 또는 인간으로부터 수득된 표적 분자에 혼성화시킨다. 표적 분자 상의 다형성 부위가 존재하는 특정한 엑소뉴클레아제-저항성 뉴클레오티드 유도체에 상보적인 뉴클레오티드를 함유한다면, 그 유도체는 혼성화된 프라이머의 단부 상에 편입될 것이다. 상기 편입은 프라이머를 엑소뉴클레아제에 대하여 저항성이 되도록 하여, 검출을 가능하게 한다. 샘플의 엑소뉴클레아제-저항성 유도체의 신원이 알려져 있기 때문에, 프라이머가 엑소뉴클레아제에 대하여 저항성이 있다는 발견은 표적 분자의 다형성 부위에 존재하는 뉴클레오티드(들)이 반응에 사용된 뉴클레오티드 유도체의 뉴클레오티드와 상보적이라는 것을 나타낸다. 이 방법은 많은 양의 관계없는 서열 데이터를 결정할 필요가 없다는 이점이 있다.
용액-기반 방법은 다형성 부위의 뉴클레오티드의 신원을 결정하는데 사용될 수 있다. Cohen, D. et al. (French Patent 2,650,840; PCT Appln. No. WO91/02087). 하기의 미국특허번호 4,656,127의 Mundy 방법에서와 같이, 다형성 부위의 3' 바로 옆에 있는 대립유전자 서열에 상보적인 프라이머가 사용된다. 이 방법은 표지된 디데옥시뉴클레오티드 유도체를 사용하여 그 부위의 뉴클레오티드의 동정을 결정하는데, 다형성 부위의 뉴클레오티드에 상보적인 경우 프라이머의 말단에 편입될 것이다.
Genetic Bit Analysis 또는 GBA로 알려진 대안적인 방법은 Goelet, P. et al.에 의해 기술된다(PCT Appln.No. 92/15712). Goelet, P. 등의 방법은 표지된 종결자와 서열 3'에 상보적인 프라이머의 혼합물을 다형성 부위에 사용한다. 따라서, 편입된 표지된 종결자는 평가되는 표적 분자의 다형성 부위에 존재하는 뉴클레오티드에 의해 결정되고, 이에 대해 상보적이다. Cohen et al.의 방법과는 대조적으로, (프랑스 특허 제2,650,840호; PCT 출원 WO91/02087) Goelet, P.et al.의 방법은 프라이머 또는 표적 분자가 고상으로 고정되는 불균질 상 검정일 수 있다.
DNA에서 다형성 부위를 검정하기 위한 몇가지 프라이머-유도 뉴클레오티드 혼입 절차가 기재되어 있다: [Komher, J. S. et al., Nucl. Acids. Res. 17:7779-7784 (1989); Sokolov, B. P., Nucl. Acids Res. 18:3671 (1990); Syvanen, A.-C., et al., Genomics 8:684-692 (1990); Kuppuswamy, M. N. et al., Proc. Natl. Acad. Sci. (U.S.A.) 88:1143-1147 (1991); Prezant, T. R. et al., Hum. Mutat. 1:159-164 (1992); Ugozzoli, L. et al., GATA 9:107-112 (1992); Nyren, P. et al., Anal. Biochem. 208:171-175 (1993)]. 이들 방법은 다형성 부위의 염기를 구별하기 위해 표지된 데옥시뉴클레오티드의 편입을 이용하는 점에서 GBA와 상이하다. 그러한 형식에서, 신호는 혼입된 데옥시뉴클레오티드의 수에 비례하므로, 동일한뉴클레오티드의 런(run)에서 발생하는 다형성은 런의 길이에 비례하는 신호를 초래할 수 있다(Syvanen, A.-C., et al., Amer. J. Hum. Genet. 52:46-59 (1993)).
수많은 계획(initiatives)은 병렬적으로 DNA 또는 RNA의 수백만 개의 개별 분자에서 직접적으로 서열 정보를 얻는다. 실시간 단일 분자 합성을 통한 서열분석 기술은 형광성 뉴클레오티드가 서열분석되는 주형에 상보적인 DNA의 발생기 가닥에 편입될 때 형광성 뉴클레오티드의 검출에 의존한다. 하나의 방법으로, 길이 30-50 염기의 올리고뉴클레오티드가 유리 커버 슬립에 5' 단부에 공유적으로 고정된다. 이러한 고정된 가닥은 두 가지 기능을 수행한다. 첫째, 주형이 표면-결합된 올리고뉴클레오티드에 상보적인 포획 꼬리(capture tail)로 구성된 경우, 표적 템플레이트 가닥에 대한 포획 부위로서 작용한다. 그들은 또한 서열 판독의 기초를 이루는 주형 지향된 프라이머 연장을 위한 프라이머 역할을 한다. 포획 프라이머는 염료를 제거하기 위해 염료-링커의 합성, 검출 및 화학적 절단의 다중 주기를 사용하여 서열 결정을 위한 고정된 위치 부위로서 기능한다. 각각의 주기는 폴리머라제/표지된 뉴클레오티드 혼합물의 첨가, 세정, 이미지형성 및 염료의 절단으로 구성된다. 대안적인 방법에서, 폴리머라제는 형광 공여체 분자에 의해 변형되고, 유리 슬라이드 상에 고정된 반면, 각각의 뉴클레오티드는 감마-포스페이트에 부착된 수용체 형광 모이어티로 색상-코딩된다. 이 시스템은 뉴클레오티드가 드 노보(de novo) 사슬에 편입됨에 따라 형광-태깅된(fluorescently-태그ged) 폴리머라제와 형광-변형된 뉴클레오티드 사이의 상호작용을 검출한다. 다른 합성에 의한 서열분석(sequencing-by-synthesis) 기술도 존재한다.
임의의 적합한 합성을 통한 서열분석 플랫폼을 사용하여 돌연변이를 확인할 수 있다. 상기에 설명한 대로, 네 가지 주요 합성에 의한 서열분석 플랫폼이 현재 사용가능하다: Roche/454 Life Sciences의 Genome Sequencers, Illumina/Solexa의 1G Analyzer, Applied BioSystems의 SOLiD 시스템, 및 Helicos Biosciences의 Heliscope 시스템. 합성을 통한 서열분석 플랫폼은 Pacific BioSciences 및 VisiGen Biotechnologies에 의해 기술되었다. 일부 구현예에서, 서열분석된 복수의 핵산 분자는 지지체(예를 들어, 고형 지지체)에 결합된다. 지지체 상에 핵산을 고정화시키기 위해, 주형의 3' 및/또는 5' 단부에 포획 서열/보편적인 프라이밍 부위가 첨가될 수 있다. 핵산은 지지체에 공유결합된 상보적 서열에 포획 서열을 하이브리드화시킴으로써 지지체에 결합될 수 있다. 포획 서열(또한, 보편적인 포획 서열로도 지칭됨)은 보편적인 프라이머로서 이중으로 작용할 수 있는 지지체에 부착된 서열에 상보적인 핵산 서열이다.
포획 서열에 대한 대안으로서, 커플링 쌍의 멤버(예컨대, 예를 들어, 미국 특허 출원 제2006/0252077호에 기재된 바와 같은 항체/항원, 수용체/리간드, 또는 아비딘-바이오틴 쌍)는 커플링 쌍의 각 제2 멤버로 코팅된 표면에 캡쳐되도록 각 단편에 연결할 수 있다.
포획 후, 서열은 주형-의존성 합성에 의한 염기서열 분석을 포함하여 예를 들어, 실시예 및 미국 특허번호 7,283,337에 기재된 바와 같은 단일 분자 검출/서열분석에 의해 분석될 수 있다. 합성을 통한 서열분석에서, 표면-결합된 분자는 폴리머라제의 존재하에 복수의 표지된 뉴클레오티드 삼인산염에 노출된다. 주형의 서열은 성장하는 사슬의 3' 단부에 편입된 표지된 뉴클레오티드의 순서에 의해 결정된다. 이 작업은 실시간으로 수행되거나 단계별 반복 방식으로 수행될 수 있다. 실시간 분석을 위해, 각 뉴클레오티드에 대한 다양한 광학 라벨이 편입될 수 있으며, 편입된 뉴클레오티드의 자극을 위해 여러개의 레이저가 사용될 수 있다.
염기서열 분석은 또한 다른 대량 병렬 서열분석 또는 차세대 서열분석(NGS) 기술 및 플랫폼을 포함할 수 있다. 대규모 병렬 염기서열 분석 및 플랫폼의 추가 예제는 Illumina HiSeq 또는 MiSeq, Thermo PGM 또는 Proton, Pac Bio RS II 또는 Sequel, Qiagen's Gene Reader, 및 Oxford Nanopore MinION이다. 추가로 유사한 최신 대량 병렬 서열분석 기술뿐만 아니라 차세대 기술이 사용될 수 있다.
임의의 세포 유형 또는 조직을 이용하여 본 명세서에 기재된 방법에서 사용하기 위한 핵산 샘플을 수득할 수 있다. 예를 들어, DNA 또는 RNA 샘플은 공지된 기술(예를 들어, 정맥천자) 또는 타액에 의해 수득된 종양 또는 체액, 예를 들어 혈액으로부터 수득될 수 있다. 대안적으로, 핵산 테스트는 건조 샘플(예를 들어, 모발 또는 피부)에서 수행될 수 있다. 또한, 종양으로부터 서열분석을 위한 샘플이 수득될 수 있고, 정상 조직이 종양과 동일한 조직 유형인 경우 서열분석을 위해 다른 샘플이 정상 조직으로부터 수득될 수 있다. 종양으로부터 서열 분석을 위한 샘플이 수득될 수 있고, 정상 조직이 종양과 관련하여 구별되는 조직 유형인 경우 서열 분석을 위해 정상 조직으로부터 또 다른 샘플이 수득될 수 있다.
종양은 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 대장암, 고환암, 두경부암, 췌장암, 뇌암, B-세포 림프종, 급성 골수성 백혈병, 만성 골수성 백혈병, 만성 림프성 백혈병, 및 T 세포 림프성 백혈병, 비-소세포 폐암, 및 소세포 폐암 중 하나 이상을 포함할 수 있다.
대안적으로, 단백질 질량 분광분석법을 사용하여 종양 세포 상에서 MHC 단백질에 결합된 돌연변이된 펩티드의 존재를 확인하거나 입증할 수 있다. 펩티드는 종양 세포 또는 종양으로부터 면역 침전된 HLA 분자로부터 산-용출될 수 있고, 그 다음 질량 분석을 사용하여 동정될 수 있다.
IV. 항원
항원에는 뉴클레오티드 또는 폴리펩티드가 포함될 수 있다. 예를 들어, 항원은 폴리펩티드 서열을 인코딩하는 RNA 서열일 수 있다. 그러므로 백신에 유용한 항원은 뉴클레오티드 서열 또는 폴리펩티드 서열을 포함할 수 있다.
본원에 개시된 방법에 의해 동정된 종양 특이적 돌연변이, 공지된 종양 특이적 돌연변이를 포함하는 펩티드 및 본원에 개시된 방법에 의해 동정된 돌연변이체 폴리펩티드 또는 그의 단편을 포함하는 단리된 펩티드가 본원에 개시된다. 신생항원 펩티드는, 신생항원이 관련된 폴리펩티드 서열을 코딩하는 뉴클레오티드 서열(예를 들어, DNA 또는 RNA)을 포함하는 이들 코딩 서열의 문맥에서 기재될 수 있다.
또한, 정상 세포 또는 조직과 비교하여 종양 세포 또는 암 조직에서 발현이 변경된 것으로 알려져 있거나 발견된 임의의 폴리펩티드, 예를 들어 알려진 임의의 폴리펩티드로부터 유래된 펩티드가 본원에 개시된다. 정상 세포 또는 조직과 비교하여 종양 세포 또는 암 조직에서 비정상적으로 발현된다. 항원성 펩티드가 유래 될 수 있는 적합한 폴리펩티드는 예를 들어 COSMIC 데이터베이스에서 찾을 수 있다. COSMIC은 인간 암의 체세포 돌연변이에 대한 포괄적인 정보를 관리한다. 펩티드는 종양 특이적인 돌연변이를 함유한다.
항원 뉴클레오티드 서열에 의해 인코딩되는 하나 이상의 폴리펩티드는 하기 중 적어도 하나를 포함할 수 있다: 1000nM 미만의 IC50 값을 갖는 MHC와의 결합 친화성, MHC 부류 I 펩티드에 대한 길이 8-15, 8, 9, 10, 11, 12, 13, 14, 또는 15 아미노산, 프로테아솜 절단을 촉진하는 펩티드 내 또는 근방의 서열 모티프의 존재, 및 TAP 수송을 촉진하는 서열 모티프의 존재. MHC 부류 II 펩티드의 경우 길이 6-30, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30 아미노산, 세포 외 또는 리소좀 프로테아제 (예를 들어, 카텝신) 또는 HLA-DM 촉매화된 HLA 결합에 의한 절단을 촉진하는 펩티드 내 또는 근처의 서열 모티프의 존재.
하나 이상의 항원이 종양의 표면 상에 제시될 수 있다.
하나 이상의 항원은 종양이 있는 대상체에서 면역원성이며, 예를 들어 대상체에서 T 세포 반응 또는 B 세포 반응을 유도할 수 있다.
대상체에서 자가면역 반응을 유도하는 하나 이상의 항원은 종양이 있는 대상체에 대한 백신 생성의 맥락에서의 고려에서 제외될 수 있다
적어도 하나의 항원성 펩티드 분자의 크기는 비제한적으로 약 5, 약 6, 약 7, 약 8, 약 9, 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 약 30, 약 31, 약 32, 약 33, 약 34, 약 35, 약 36, 약 37, 약 38, 약 39, 약 40, 약 41, 약 42, 약 43, 약 44, 약 45, 약 46, 약 47, 약 48, 약 49, 약 50, 약 60, 약 70, 약 80, 약 90, 약 100, 약 110, 약 120 또는 그 이상의 아미노 분자 잔기 및 그로부터 유도가능한 임의의 범위이다. 특이적 구현예에서, 항원성 펩티드 분자는 50개 이하의 아미노산이다.
항원성 펩티드 및 폴리펩티드는 MHC 부류 I에 대해 15 잔기 이하의 길이일 수 있고 약 8 및 약 11 잔기, 특히 9 또는 10 잔기; MHC 부류 II에 대해 6 내지 30 잔기(경계값 포함)로 보통 구성된다.
바람직하다면, 더 긴 펩티드가 여러 가지 방법으로 디자인될 수 있다. 본원의 경우, HLA 대립유전자상의 펩티드의 제시 가능성이 예측되거나 공지될 때, 보다 긴 펩티드는 하기 중 하나로 구성될 수 있다: (1) 각각의 상응하는 유전자 생성물의 N-말단 및 C-말단을 향하여 2 내지 5개 아미노산의 연장을 갖는 개별 제시된 펩티드; (2) 제시된 펩티드의 일부 또는 전부와 각각에 대한 연장된 서열의 결합. 또 다른 경우에, 서열분석이 종양에 존재하는 긴(10개 잔기 초과) 신생에피토프 서열(예를 들어, 신규한 펩티드 서열로 이어지는 틀이동, 연속판독 또는 인트론 포함으로 인함)을 나타내는 경우, 보다 긴 펩티드는 하기로 구성된다: (3) 신규한 종양-특이적 아미노산의 전체 스트레치- 따라서 가장 강한 HLA가 제시된 더 짧은 펩티드의 선택에 기초한- 컴퓨터이용 또는 시험관내 시험의 필요성을 우회한다. 두가지 경우 모두에서, 다 길어진 펩티드를 사용하면 환자 세포에 의한 내인성처리가 가능해지고 보다 효과적인 항원 제시 및 T 세포 반응의 유도가 이끌어질 수 있다.
항원성 펩티드 및 폴리펩티드는 HLA 단백질 상에 제시될 수 있다. 일부 양태에서, 항원성 펩티드 및 폴리펩티드는 야생형 펩티드보다 큰 친화도를 갖는 HLA 단백질 상에 제시된다. 일부 양태에서, 항원성 펩티드 또는 폴리펩티드는 적어도 5000 nM 미만, 적어도 1000 nM 미만, 적어도 500 nM 미만, 적어도 250 nM 미만, 적어도 200 nM 미만, 적어도 150 nM 미만, 적어도 100 nM 미만, 적어도 50 nM 미만 또는 그 이하의 IC50을 가질 수 있다.
일부 양태에서, 항원성 펩티드 및 폴리펩티드는 대상체에게 투여되는 경우 면역 반응을 유도하고/하거나 면역학적 내성을 유발하지 않는다. 
또한, 적어도 2종 또는 그 이상의 항원성 펩티드를 포함하는 조성물이 제공된다. 일부 구현예에서, 조성물은 적어도 2종의 구별되는 펩티드를 함유한다. 동일한 폴리펩티드로부터 적어도 2종의 구별되는 펩티드가 유래될 수 있다. 구별되는 폴리펩티드는 펩티드가 길이, 아미노산 서열 또는 둘 모두에 의해 다양함을 의미한다. 펩티드는 종양 특이적 돌연변이를 포함하는 것으로 알려져 있거나 발견된 임의의 폴리펩티드로부터 유래되거나 또는 정상 세포 또는 조직과 비교하여 종양 세포 또는 암 조직에서 발현이 변경된 것으로 알려졌거나 발견된 임의의 폴리펩티드, 예를 들어 종양 세포 또는 정상 세포 또는 조직과 비교하여 암 조직에서 비정상적으로 발현되는 것으로 알려져 있거나 발견된 임의의 폴리펩티드로부터 유래된다. 항원성 펩티드가 유래될 수 있는 적합한 폴리펩티드는 예를 들어 COSMIC 데이터베이스 또는 AACR Genomics Evidence Neoplasia Information Exchange (GENIE) 데이터베이스에서 찾을 수 있다. COSMIC은 인간 암의 체세포 돌연변이에 대한 포괄적인 정보를 수집한다. AACR GENIE는 임상 등급 암 게놈 데이터를 수만 명의 암 환자의 임상 결과와 집계되고 연결한다. 펩티드는 종양 특이적 돌연변이를 포함한다. 일부 양태에서 종양 특이적인 돌연변이는 특정한 암 유형에 대한 유발 돌연변이이다.
원하는 활성 또는 특성을 갖는 항원성 펩티드 및 폴리펩티드는 원하는 MHC 분자를 결합시키고 적절한 T 세포를 활성화시키기 위해 비변형된 펩티드의 실질적으로 모든 생물학적 활성을 증가시키거나 또는 적어도 유지하면서도, 특정 원하는 속성, 예를 들어 개선된 약리적 특징을 제공하도록 변형될 수 있다. 예를 들어, 항원성 펩티드 및 폴리펩티드는 보존적 또는 비-보존적인 치환과 같은 다양한 변화를 겪을 수 있으며, 이러한 변화는 개선된 MHC 결합, 안정성 또는 제시와 같은 용도의 특정한 이점을 제공할 수 있다. 보존적 치환은 아미노산 잔기를 생물학적으로 및/또는 화학적으로 유사한 또 다른 아미노산 잔기, 예를 들어 다른 것에 대한 하나의 소수성 잔기, 또는 다른 것에 대한 하나의 극성 잔기로 대체하는 것을 의미한다. 치환은 Gly, Ala; Val, Ile, Leu, Met; Asp, Glu; Asn, Gln; Ser, Thr; Lys, Arg; 및 Phe, Tyr와 같은 조합을 포함한다. 단일 아미노산 치환의 효과는 D-아미노산을 사용하여 프로빙될 수도 있다. 이러한 변형은 예를 들어, 하기 문헌에 기재된 바와 같이 공지된 펩티드 합성 절차를 사용하여 수행될 수 있다: 문헌[Merrifield, Science 232:341-347 (1986), Barany & Merrifield, The Peptides, Gross & Meienhofer, eds. (N.Y., Academic Press), pp. 1-284 (1979); 및 Stewart & Young, Solid Phase Peptide Synthesis, (Rockford, Ill., Pierce), 2d Ed. (1984)].
다양한 아미노산 모방체 또는 비천연 아미노산을 갖는 펩티드 및 폴리펩티드의 변형은 생체내에서 펩티드 및 폴리펩티드의 안정성을 증가시키는데 특히 유용할 수 있다. 안정성은 수많은 방법으로 분석될 수 있다. 예를 들어, 펩티다아제 및 인간 혈장 및 혈청과 같은 다양한 생물학적 배지가 안정성 테스트에 사용되어왔다. 예를 들어, 문헌[Verhoef et al., Eur. J Drug Metab Pharmacokin. 11:291-302(1986)]을 참조한다. 펩티드의 반감기는 25% 인간 혈청(v/v) 분석법을 사용하여 편리하게 결정될 수 있다. 프로토콜은 일반적으로 다음과 같다. 풀링된 인간 혈청(유형 AB, 비-열 불활성화된)은 사용 전에 원심 분리에 의해 탈지된다. RPMI 조직 배양 배지에 의해 혈청이 25%로 희석되고, 펩티드 안정성을 시험하는데 사용하였다. 예정된 시간 간격으로 소량의 반응 용액이 제거되고, 6% 수성 트리클로로아세트산 또는 에탄올에 첨가된다. 흐린 반응 샘플이 15분 동안 냉각(4℃)된 다음, 침전된 혈청 단백질이 펠렛으로 스핀된다. 그 다음, 펩티드의 존재는 안정성-특이적 크로마토그래피 조건을 사용하여 역상 HPLC에 의해 결정된다.
펩티드 및 폴리펩티드는 개선된 혈청 반감기 이외의 원하는 속성을 제공하도록 변형될 수 있다. 예를 들어, CTL 활성을 유도하는 펩티드의 능력은 T 헬퍼 세포 반응을 유도할 수 있는 적어도 하나의 에피토프를 함유하는 서열로의 결합에 의해 강화될 수 있다. 면역원성 펩티드/T 헬퍼 접합체는 스페이서 분자에 의해 연결될 수 있다. 스페이서는 전형적으로 생리적 조건하에 실질적으로 충전되지 않은 비교적 작고 중성인 분자, 예컨대 아미노산 또는 아미노산 모방체로 구성된다. 스페이서는 일반적으로 예를 들어, Ala, Gly, 또는 비극성 아미노산 또는 중성 극성 아미노산의 다른 중성 스페이서로부터 선택된다. 선택적으로 존재하는 스페이서는 동일한 잔기로 구성될 필요는 없으며, 따라서 헤테로- 또는 호모-올리고머일 수 있는 것으로 이해될 것이다. 존재하는 경우, 스페이서는 일반적으로 적어도 1 또는 2개의 잔기, 보다 일반적으로 3 내지 6개의 잔기일 것이다. 대안적으로, 펩티드는 스페이서 없이 T 헬퍼 펩티드에 연결될 수 있다.
항원성 펩티드는 직접적으로 또는 펩티드의 아미노 또는 카르복시 말단에서 스페이서를 통해 T 헬퍼 펩티드에 연결될 수 있다. 항원성 펩티드 또는 T 헬퍼 펩티드의 아미노 말단은 아실화될 수 있다. 예시적인 T 헬퍼 펩티드는 파상풍 변독소 830-843, 인플루엔자 307-319, 말라리아 시르쿰스포로조이테 382-398 및 378-389를 포함한다.
단백질 또는 펩티드는 표준 분자 생물학적 기술을 통한 단백질, 폴리펩티드 또는 펩티드의 발현, 천연 공급원으로부터의 단백질 또는 펩티드의 단리, 또는 단백질 또는 펩티드의 화학적 합성을 포함하는 당해 분야의 숙련가에게 공지된 임의의 기술로 제조될 수 있다. 다양한 유전자에 상응하는 뉴클레오티드 및 단백질, 폴리펩티드 및 펩티드 서열은 이전에 개시되어 있고, 당업자에게 공지된 컴퓨터화된 데이터베이스에서 발견될 수 있다. 하나의 이러한 데이터베이스는 웹사이트에서 위치되는 National Center for Biotechnology information's Genbank 및 GenPept 데이터베이스이다. 공지된 유전자에 대한 코딩 영역은 본원에서 개시된 기술을 사용하여 증폭되거나/되고 발현될 수 있거나 또는 당업자에게 공지된 바와 같다. 대안적으로, 단백질, 폴리펩티드 및 펩티드의 다양한 상업적 제제는 당업자에게 공지되어 있다.
추가의 양태에서 항원은 항원성 펩티드 또는 그의 일부를 인코딩하는 핵산(예를 들어, 폴리뉴클레오티드)을 포함한다. 폴리뉴클레오티드는 예를 들어, DNA, cDNA, PNA, CNA, RNA (예를 들어, mRNA), 예를 들어, 포스포로티아제 백본, 또는 이들의 조합물을 갖는 폴리뉴클레오티드와 같은, 폴리뉴클레오티드의 단일-가닥 및/또는 이중-가닥, 또는 천연 또는 안정화된 형태일 수 있고 인트론을 함유할 수 있거나 함유하지 않을 수 있다. 또 추가의 양태는 폴리펩티드 또는 그의 일부를 발현할 수 있는 발현 벡터를 제공한다. 상이한 세포 유형에 대한 발현 벡터는 당해 분야에 잘 알려져 있으며, 과도한 실험과정 없이 선택될 수 있다. 일반적으로, DNA는 플라스미드와 같은 발현 벡터에 적절한 배향으로 및 발현을 위한 정확한 해독틀로 삽입된다. 필요하면, DNA는 원하는 숙주에 의해 인식되는 적절한 전사 및 번역 조절 제어 뉴클레오티드 서열에 연결될 수 있지만, 이러한 제어는 일반적으로 발현 벡터에서 이용 가능하다. 그런 다음 벡터는 표준 기술을 통해 숙주에 도입된다. 지침은 예를 들어 문헌[Sambrook et al. (1989) Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.]에서 찾을 수 있다.
V. 백신 조성물
또한, 특정한 면역 반응, 예를 들어, 종양-특이적 면역 반응을 일으킬 수 있는 면역원성 조성물, 예를 들어, 백신 조성물이 본원에 개시된다. 백신 조성물은 전형적으로, 예를 들어 본원에 기재된 방법을 사용하여 선택된 하나 또는 복수의 항원을 포함한다. 백신 조성물은 또한 백신이라고 지칭될 수 있다.
백신은 1 내지 30개의 펩티드, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 상이한 펩티드, 6, 7, 8, 9, 10 11, 12, 13, 또는 14개의 상이한 펩티드, 또는 12, 13 또는 14개의 상이한 펩티드를 함유할 수 있다. 펩티드는 번역후 변형을 포함할 수 있다. 백신은 1 내지 100개 또는 그 이상의 뉴클레오티드 서열, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100개, 또는 그 이상의 상이한 뉴클레오티드 서열, 6, 7, 8, 9, 10 11, 12, 13, 또는 14개의 상이한 뉴클레오티드 서열, 또는 12, 13, 또는 14개의 상이한 뉴클레오티드 서열을 함유할 수 있다. 백신은 1 내지 30개의 항원 서열, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100개, 또는 그 이상의 상이한 항원 서열, 6, 7, 8, 9, 10 11, 12, 13, 또는 14개의 상이한 항원 서열, 또는 12, 13, 또는 14개의 상이한 항원 서열을 함유할 수 있다.
일 구현예에서, 펩티드 및/또는 폴리펩티드가 상이한 MHC 분자, 예컨대 상이한 MHC 부류 I 분자 및/또는 상이한 MHC 부류 II 분자와 결합할 수 있도록, 상이한 펩티드 및/또는 폴리펩티드 또는 이들을 인코딩하는 뉴클레오티드 서열이 선택된다. 일부 양태에서, 하나의 백신 조성물은 가장 빈번하게 발생하는 MHC 부류 I 분자 및/또는 상이한 MHC 부류 II 분자와 결합할 수 있는 펩티드 및/또는 폴리펩티드에 대한 코딩 서열을 포함한다. 따라서, 백신 조성물은 적어도 2개의 바람직한, 적어도 3개의 바람직한, 또는 적어도 4개의 바람직한 MHC 부류 I 분자 및/또는 상이한 MHC 부류 II 분자와 결합될 수 있는 상이한 단편을 포함할 수 있다.
백신 조성물은 특이적 세포독성 T-세포 반응 및/또는 특이적 헬퍼 T-세포 반응을 일으킬 수 있다.
백신 조성물은 아쥬반트 및/또는 담체를 추가로 포함할 수 있다. 유용한 아쥬반트 및 담체의 예는 하기에 주어져 있다. 조성물은 담체 예컨대 예를 들어 단백질 또는 항원-제시 세포 예컨대 예를 들어 T-세포에 펩티드를 제시할 수 있는 수지상 세포(DC)와 결합될 수 있다.
아쥬반트는 백신 조성물과 혼합하여 항원에 대한 면역 반응을 증가시키거나 그렇지 않으면 변경시키는 임의의 물질이다. 담체는 스캐폴드 구조, 예를 들어 항원이 결합될 수 있는 폴리펩티드 또는 다당류일 수 있다. 선택적으로, 아쥬반트는 공유결합 또는 비공유결합된다.
항원에 대한 면역 반응을 증가시키는 아쥬반트의 능력은 전형적으로 면역-매개된 반응의 상당한 또는 실질적인 증가, 또는 질환 증상의 감소에 의해 나타난다. 예를 들어 체액성 면역의 증가는 전형적으로, 항원에 대해 상승된 항체의 역가가 유의미하게 증가함으로써 나타나며, T-세포 활성의 증가는 전형적으로, 증가된 세포증식 또는 세포성 세포독성 또는 사이토카인 분비에서 나타난다. 아쥬반트는 또한 예를 들어 주로 체액성 또는 Th 반응을 주로 세포성 또는 Th 반응으로 변화시킴으로써 면역 반응을 변화시킬 수 있다.
적합한 아쥬반트는 비제한적으로 1018 ISS, 명반, 알루미늄 염, Amplivax, AS15, BCG, CP-870,893, CpG7909, CyaA, dSLIM, GM-CSF, IC30, IC31, 이미퀴모드(Imiquimod), ImuFact IMP321, IS Patch, ISS, ISCOMATRIX, JuvImmune, LipoVac, MF59, 모노포스포릴 지질 A, 몬타나이드 IMS 1312, 몬타나이드 ISA 206, 몬타나이드 ISA 50V, 몬타나이드 ISA-51, OK-432, OM-174, OM-197-MP-EC, ONTAK, PepTel 벡터 시스템, PLG 미립자, 레시퀴모드, SRL172, 비로좀 및 기타 바이러스-유사 입자, YF-17D, VEGF 트랩, R848, 베타-글루칸, Pam3Cys, Aquila's QS21 자극제 (Aquila Biotech, Worcester, Mass., USA)를 포함하며, 이는 사포닌, 마이코박테리아 추출물 및 합성 박테리아 세포 벽 모방체, 및 Ribi's Detox. Quil 또는 Superfos와 같은 다른 독점적인 아쥬반트로부터 유래된다. 불완전 프로인트(Freund's) 또는 GM-CSF와 같은 아쥬반트가 유용하다. 수지상 세포 및 이의 제조에 특이적인 몇몇 면역학적 아쥬반트 (예를 들어, MF59)는 이전에 기재되어 있다(Dupuis M, et al., 세포 Immunol. 1998; 186(1):18-27; Allison A C; Dev Biol Stand. 1998; 92:3-11). 또한 사이토카인이 사용될 수 있다. 몇몇 사이토카인은 수지상 세포가 림프구 조직 (예를 들어, TNF-알파)으로 이동하여, T-림프구(예를 들어, GM-CSF, IL-1 및 IL-4) (미국 특허번호 5,849,589, 그 전체가 참고 문헌으로 본원에 구체적으로 포함된다)의 효율적인 항원-제시 세포로의 수지상 세포의 성숙을 가속화시키고 면역 아쥬반트로서 작용하는 것과 직접적으로 연관되어 있다(예를 들어, IL-12) (Gabrilovich D I, et al., J Immunother Emphasis 종양 Immunol. 1996 (6):414-418).
CpG 면역자극성 올리고뉴클레오티드는 또한 백신 설정에서 아쥬반트의 효과를 향상시키는 것으로 보고되었다. RNA 결합 TLR 7, TLR 8 및/또는 TLR 9와 같은 다른 TLR 결합 분자가 또한 사용될 수 있다.
유용한 아쥬반트의 다른 예는 비제한적으로, 화학적으로 변형된 CpG (예를 들어 CpR, Idera), 폴리(I:C)(예를 들어 폴리i:CI2U), 비-CpG 박테리아 DNA 또는 RNA뿐만 아니라 면역활성 소분자 및 항체 예컨대 시클로포스파미드, 수니티닙, 베바시주맙, 셀레브렉스, NCX-4016, 실데나필, 타다라필, 바르데나필, 소라피닙, XL-999, CP-547632, 파조파닙, ZD2171, AZD2171, 이필리뮤맙, 트레메리무맙, 및 SC58175를 포함하며, 이는 치료학적으로 및/또는 아쥬반트로서 작용할 수 있다. 아쥬반트 및 첨가제의 양 및 농도는 과도한 실험과정없이 숙련가에 의해 용이하게 결정될 수 있다. 추가의 아쥬반트는 집락-자극 인자, 예컨대 Granulocyte Macrophage Colony Stimulating Factor (GM-CSF, sargramostim)를 포함한다.
백신 조성물은 하나 이상의 상이한 아쥬반트를 포함할 수 있다. 또한, 치료 조성물은 상기의 임의의 것 또는 이들의 조합을 포함하는 임의의 아쥬반트 보조물질을 포함할 수 있다. 백신 및 아쥬반트는 함께 또는 임의의 적절한 순서로 개별적으로 투여될 수 있는 것으로 고려된다.
담체(또는 부형제)는 아쥬반트와 독립적으로 존재할 수 있다. 담체의 기능은 예를 들어, 활성 또는 면역원성을 증가시키고, 안정성을 부여하거나, 생물학적 활성을 증가시키거나, 또는 혈청 반감기를 증가시키기 위해 돌연변이체의 분자량을 증가시키는 것일 수 있다. 또한, 담체는 펩티드를 T-세포에 제시하는 것을 도울 수 있다. 담체는 당해 기술의 숙련가에게 공지된 임의의 적합한 담체, 예를 들어 단백질 또는 항원 제시 세포일 수 있다. 담체 단백질은 키홀 림펫 헤모시아닌, 혈청 단백질, 예컨대 트랜스페린, 소 혈청 알부민, 인간 혈청 알부민, 티로글로불린 또는 난백알부민, 면역글로불린, 또는 호르몬, 예컨대 인슐린 또는 팔미트산일 수 있다. 인간의 면역화를 위해, 담체는 일반적으로 인간에게 허용가능하고 안전한, 생리적으로 허용가능한 담체이다. 그러나, 파상풍 변독소 및/또는 디프테리아 독소가 적합한 담체이다. 대안적으로, 담체는 덱스트란, 예를 들어 세파로오스일 수 있다.
세포 독성 T-세포(CTL)는 온전한 외래 항원 자체보다는 MHC 분자에 결합된 펩티드의 형태로 항원을 인식한다. MHC 분자 자체는 항원 제시 세포의 세포 표면에 위치한다. 따라서, 펩티드 항원, MHC 분자 및 APC의 삼량체 복합체가 존재한다면 CTL의 활성화가 가능하다. 그에 상응하여, CTL의 활성화에 펩티드가 사용될뿐만 아니라, 추가로 각각의 MHC 분자를 갖는 APC가 첨가되는 경우 면역 반응을 향상시킬 수 있다. 따라서, 일부 구현예에서, 백신 조성물은 적어도 하나의 항원 제시 세포를 추가로 함유한다.
항원은 또한 바이러스 벡터-기재 백신 플랫폼, 예컨대, 백시니아, 계두, 자기-복제 알파바이러스, 마라바라이러스, 아데노바이러스 (예를 들어, Tatsis et al., Adenoviruses, Molecular Therapy (2004) 10, 616―629 참조), 또는 비제한적으로 제2, 제3 또는 하이브리드 제2/제3 세대 렌티바이러스 및 특정 세포 유형 또는 수용체를 표적으로하는 임의의 세대의 재조합 렌티바이러스를 포함하는 렌티바이러스 (예를 들어, Hu et al., Immunization Delivered by Lentiviral Vectors for Cancer 및 Infectious Diseases, Immunol Rev. (2011) 239(1): 45-61, Sakuma et al., Lentiviral vectors: basic to translational, Biochem J. (2012) 443(3):603-18, Cooper et al. Rescue of splicing-mediated intron loss maximizes expression in lentiviral vectors containing the human ubiquitin C promoter, Nucl. Acids Res. (2015) 43 (1): 682-690, Zufferey et al., Self-Inactivating Lentivirus Vector for Safe 및 Efficient In Vivo Gene Delivery, J. Virol. (1998) 72 (12): 9873-9880, 참조)를 포함할 수 있다. 상기 언급된 바이러스 벡터-기반 백신 플랫폼의 패키징 용량에 의존적으로, 이 접근법은 하나 이상의 신생항원 펩티드를 인코딩하는 하나 이상의 뉴클레오티드 서열을 전달할 수 있다. 상기 서열은 돌연변이가 없는 서열이 측면에 위치할 수 있고, 링커에 의해 분리될 수 있거나 또는 세포 내 부분을 표적으로 하는 하나 이상의 서열이 선행될 수 있다(예를 들어, Gros et al., Prospective identification of neoantigen-specific lymphocytes in the peripheral blood of melanoma patients, Nat Med. (2016) 22 (4):433-8, Stronen et al., Targeting of cancer neoantigens with donor-derived T cell receptor repertoires, Science. (2016) 352 (6291):1337-41, Lu et al., Efficient identification of mutated cancer antigens recognized by T cells associated with durable tumor regressions, Clin Cancer Res. (2014) 20( 13):3401-10). 숙주 내로 도입 시, 감염된 세포는 항원을 발현하고, 이에 의해 펩티드(들)에 대한 숙주 면역 (예를 들어, CTL) 반응을 유도한다. 면역화 프로토콜에 유용한 백시니아 벡터 및 방법은 하기에 기재되어 있다: 예를 들어, 미국 특허번호 4,722,848. 또 다른 벡터는 BCG(Bacille Calmette Guerin)이다. BCG 벡터는 Stover et al. (Nature 351:456-460 (1991))에 기재되어 있다. 예를 들어, 살모넬라 티피(Salmonella typhi) 벡터, 및 등의 항원의 치료학적 투여 또는 면역화에 유용한 다양한 다른 백신 벡터는 본원의 설명으로부터 당업자에게 명백할 것이다.
V.A. 항원 카세트
하나 이상의 항원의 선택, "카세트"의 클로닝 및 구축 및 바이러스성 벡터 내로의 그의 삽입을 위해 사용되는 방법은 본원에 제공된 교시가 주어진 당업계의 기술 범위 내에 있다. "항원 카세트"는 선택된 항원 또는 복수의 항원 및 항원(들)을 전사하고 전사된 생성물을 발현시키는데 필요한 다른 조절 요소의 조합을 의미한다. 항원 또는 복수의 항원은 전사를 허용하는 방식으로 조절 성분에 실시가능하게 연결될 수 있다. 이러한 성분은 바이러스성 벡터로 형질 감염된 세포 내에 항원(들)의 발현을 유도할 수 있는 통상적인 조절 요소를 포함한다. 따라서 항원 카세트는 또한 항원(들)에 결합되고 재조합 벡터의 선택된 바이러스성 서열 내에 다른 선택적인 조절 요소와 함께 위치되는 선택된 프로모터를 함유할 수 있다.
유용한 프로모터는 발현되는 항원(들)의 양을 제어할 수 있는 구성적인 프로모터 또는 조절(유도성) 프로모터일 수 있다. 예를 들어, 바람직한 프로모터는 사이토메갈로 즉각의 초기 프로모터/인핸서이다 [참조, 예를 들어, Boshart et al, Cell, 41:521-530 (1985)]. 다른 바람직한 프로모터는 라우스 유종 바이러스 LTR 프로모터/인핸서를 포함한다. 또 다른 프로모터/인핸서 서열은 닭 세포질의 베타-액틴 프로모터이다[T.A. Kost et al, Nucl. Acids Res., 11(23):8287 (1983)]. 다른 적합한 또는 바람직한 프로모터는 당업자에 의해 선택될 수 있다.
항원 카세트는 또한 전사체 (폴리(A), 폴리-A 또는 pA) 및 기능적 접합 공여 및 수용체 부위를 갖는 인트론의 효율적인 폴리아데닐레이션을 위핸 신호를 제공하는 서열을 포함하는 바이러스성 벡터 서열에 이종성인 핵산 서열을 포함할 수 있다. 본 발명의 예시적인 벡터에서 사용되는 일반적안 폴리-A 서열은 파포바 바이러스 SV-40로부터 유래된 것이다. 폴리-A 서열은 일반적으로 항원-기재 서열을 따르고 바이러스성 벡터 서열 전에 카세트 내에 삽입될 수 있다. 일반적인 인트론 서열은 또한 SV-40으로부터 유래될 수 있고, SV-40 T 인트론 서열로서 지칭된다. 항원 카세트는 또한 프로모터/인핸서 서열 및 항원(들) 사이에 위치하는 이러한 인트론을 함유할 수 있다. 이들 및 다른 벡터 요소의 선택은 통상적이고[참조, 예를 들어, Sambrook et al, "Molecular Cloning. A Laboratory Manual. 2d edit., Cold Spring Harbor Laboratory, New York (1989) 및 그 문헌에 인용된 참고문헌] 많은 이러한 서열은 상업적 또는 산업적 원천 뿐만 아니라 Genbank로부터 입수 가능하다.
항원 카세트는 하나 이상의 항원을 가질 수 있다. 예를 들어, 주어진 카세트는 1-10, 1-20, 1-30, 10-20, 15-25, 15-20, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 그 이상의 항원을 포함할 수 있다. 항원은 서로 직접적으로 연결될 수 있다. 항원은 또한 링커로 서로연결될 수 있다. 항원은 N 내지 C 또는 C 내지 N를 포함하여 서로에 대해 어떤 방향으로 있을 수 있다.
상기 기재한 바와 같이, 항원 카세트는 바이러스성 벡터의 임의의 선택된 결손의 부위, 예컨대 E1 유전자 영역 결손 또는 E3 유전자 영역 결손의 부위에 위치할 수 있으며, 특히 선택될 수 있다.
항원 카세트는, 5'에서 3'으로, 각 요소의 순차적 서열을 기재하기 위해 하기 식을 사용하여 기재될 수 있다:
(Pa-(L5b-Nc-L3d)X)Z-(P2h-(G5e-Uf)Y)W-G3g
여기서, P 및 P2는 프로모터 뉴클레오티드 서열을 포함하고, N은 MHC 부류 I 에피토프 인코딩 핵산 서열을 포함하고, L5는 5' 링커 서열을 포함하고, L3은 3' 링커 서열을 포함하고, G5는 핵산 서열 인코딩 아미노산 링커를 포함하고, G3은 아미노산 링커를 인코딩하는 적어도 하나의 핵산 서열 중 하나를 포함하고, U는 MHC 부류 II 항원-인코딩 핵산 서열을 포함하고, 여기서 각각의 X에 대하여 상응하는 Nc는 에피토프 인코딩 핵산 서열이고, 여기서 각각의 Y에 대하여 상응하는 Uf는 항원-인코딩 핵산 서열이다. 조성 및 순차적 서열은 존재하는 요소의 개수를 선택함으로써 추가로 정의될 수 있고, 예를 들어 a = 0 또는 1인 경우, b = 0 또는 1인 경우, c = 1인 경우, d = 0 또는 1인 경우, e = 0 또는 1인 경우, f = 1인 경우, g = 0 또는 1인 경우, h = 0 또는 1인 경우, X = 1 내지 400, Y = 0, 1, 2, 3, 4 또는 5, Z = 1 내지 400, 및 W = 0, 1, 2, 3, 4 또는 5이다.
하나의 예에서, 존재하는 요소는, a = 0, b = 1, d = 1, e = 1, g = 1, h = 0인 경우, X = 10, Y = 2, Z = 1, 및 W = 1을 포함하고, 이는 추가의 프로모터가 존재하지 않고(즉, 벡터 백본(예를 들어, 알파바이러스 백본과 같은 바이러스 백본)에 의해 제공된 프로모터 뉴클레오티드 서열만이 존재하고), 20 MHC 부류 I 에피토프가 존재하고, 5' 링커가 각각의 N에 대해 존재하고, 3' 링커가 각각의 N에 대해 존재하고, 2 MHC 부류 II 에피토프가 존재하고, 2개의 MHC 부류 II 에피토프를 연결하는 링커가 존재하고, 2개의 MHC 부류 II 에피토프의 5' 말단을 최종 MHC 부류 I 에피토프의 3' 링커에 연결하는 링커가 존재하고, 2개의 MHC 부류 II 에피토프의 3' 말단을 벡터 백본(예를 들어, 알파바이러스 백본과 같은 바이러스 백본)에 연결하는 링커가 존재함을 나타낸다. 벡터 백본(예를 들어, 알파바이러스 백본과 같은 바이러스 백본)에 대한 항원 카세트의 3' 말단 연결의 예는, 3' 19-nt CSE와 같은, 벡터 백본(예를 들어, 알파바이러스 백본과 같은 바이러스 백본)에 의해 제공된 3' UTR 요소에 대한 직접 연결을 포함한다. 벡터 백본(예를 들어, 알파바이러스 백본과 같은 바이러스 백본)에 대한 항원 카세트의 5' 말단 연결의 예는, 26S 프로모터 서열, 알파바이러스 5' UTR, 51-nt CSE, 또는 24-nt CSE에 대한 직접 연결을 포함한다.
다른 예는 하기를 포함한다: a = 1인 경우, 이는 벡터 백본(예를 들어, 알파바이러스 백본과 같은 바이러스 백본)에 의해 제공된 프로모터 뉴클레오티드 서열 이외의 프로모터가 존재함을 나타냄; a = 1이고, Z가 1 초과인 경우, 벡터 백본(예를 들어, 알파바이러스 백본과 같은 바이러스 백본)에 의해 제공된 프로모터 뉴클레오티드 서열 이외의 다중 프로모터가 존재하고, 이는 각각 1개 이상의 별개의 MHC 부류 I 에피토프 인코딩 핵산 서열의 발현을 유도함; h = 1인 경우, 이는 별도의 프로모터가 존재하여 MHC 부류 II 항원-인코딩 핵산 서열의 발현을 유도함을 나타냄; 및 g = 0인 경우, 이는 MHC 부류 II 항원-인코딩 핵산 서열이, 존재하는 경우, 벡터 백본(예를 들어, 알파바이러스 백본과 같은 바이러스 백본)에 직접 연결됨.
다른 예는, 존재하는 각각의 MHC 부류 I 에피토프가 5' 링커, 3' 링커를 어느 것도 갖지 않거나, 둘 다 가질 수 있는 경우를 포함한다. 동일한 항원 카세트에 하나 초과의 MHC 부류 I 에피토프가 존재하는 예에서, 일부 MHC 부류 I 에피토프는 5' 링커 및 3' 링커 둘 다를 가질 수 있으며, 다른 MHC 부류 I 에피토프는 5' 링커, 3' 링커 중 하나를 갖거나, 어느 것도 갖지 않을 수 있다. 동일한 항원 카세트에 하나 초과의 MHC 부류 I 에피토프가 존재하는 다른 예에서, 일부 MHC 부류 I 에피토프는 5' 링커 또는 3' 링커 중 하나를 가질 수 있으며, 다른 MHC 부류 I 에피토프는 5' 링커, 3' 링커 중 하나를 갖거나, 어느 것도 갖지 않을 수 있다.
동일한 항원 카세트에 하나 초과의 MHC 부류 II 에피토프가 존재하는 예에서, 일부 MHC 부류 II 에피토프는 5' 링커 및 3' 링커 둘 다를 가질 수 있으며, 다른 MHC 부류 II 에피토프는 5' 링커, 3' 링커 중 하나를 갖거나, 어느 것도 갖지 않을 수 있다. 동일한 항원 카세트에 하나 초과의 MHC 부류 II 에피토프가 존재하는 다른 예에서, 일부 MHC 부류 II 에피토프는 5' 링커 또는 3' 링커 중 하나를 가질 수 있으며, 다른 MHC 부류 II 에피토프는 5' 링커, 3' 링커 중 하나를 갖거나, 어느 것도 갖지 않을 수 있다.
프로모터 뉴클레오티드 서열 P 및/또는 P2는 벡터 백본(예를 들어, 알파바이러스 백본과 같은 바이러스 백본)에 의해 제공된 프로모터 뉴클레오티드 서열과 동일할 수 있다. 예를 들어, 벡터 백본(예를 들어, 알파바이러스 백본과 같은 바이러스 백본)에 의해 제공된 프로모터 서열, Pn 및 P2는 각각 26S 서브게놈 프로모터를 포함할 수 있다. 프로모터 뉴클레오티드 서열 P 및/또는 P2는 벡터 백본(예를 들어, 알파바이러스 백본과 같은 바이러스 백본)에 의해 제공된 프로모터 뉴클레오티드 서열과 상이할 수 있을 뿐만 아니라, 서로 상이할 수 있다.
5' 링커 L5는 네이티브 서열 또는 비자연적인 서열일 수 있다. 비자연적인 서열은, AAY, RR, 및 DPP를 포함하나, 이에 제한되지는 않는다. 3' 링커 L3은 또한 네이티브 서열 또는 비자연적인 서열일 수 있다. 추가로, L5 및 L3은 둘 다 네이티브 서열, 둘 다 비자연적인 서열일 수 있거나, 또는 하나는 네이티브이고 다른 하나는 비자연적일 수 있다. 각각의 X에 대하여, 아미노산 링커는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94,95, 96, 97, 98, 99, 100개 또는 그 이상의 아미노산 길이를 가질 수 있다. 각각의 X에 대하여, 아미노산 링커는 또한 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 또는 적어도 30개의 아미노산 길이를 가질 수 있다.
아미노산 링커 G5는, 각각의 Y에 대하여, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94,95, 96, 97, 98, 99, 100개 또는 그 이상의 아미노산 길이를 가질 수 있다. 각각의 Y에 대하여, 아미노산 링커는 또한 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 또는 적어도 30개의 아미노산 길이를 가질 수 있다.
아미노산 링커 G3은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94,95, 96, 97, 98, 99, 100개 또는 그 이상의 아미노산 길이를 가질 수 있다. G3은 또한 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 또는 적어도 30개의 아미노산 길이를 가질 수 있다.
각각의 X에 대하여, 각각의 N은 MHC 부류 I 에피토프 7-15개의 아미노산 길이를 인코딩할 수 있다. 각각의 X에 대하여, 각각의 N은 또한 MHC 부류 I 에피토프 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 아미노산 길이를 인코딩할 수 있다. 각각의 X에 대하여, 각각의 N은 또한 MHC 부류 I 에피토프 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 또는 적어도 30개의 아미노산 길이를 인코딩할 수 있다.
V.B. 면역 체크포인트
본원에 개시된 벡터, 예컨대 본원에 개시된 C68 벡터 또는 본원에 개시된 알파바이러스 벡터는 적어도 하나의 항원 인코딩하는 핵산을 포함할 수 있고 동일하거나 별개의 벡터는 면역 체크포인트 분자의 활성에 결합하고 그 활성을 차단하는 적어도 하나의 면역 조절제 (예를 들어, 항체 예컨대 scFv)를 인코딩하는 핵산을 포함할 수 있다. 벡터는 항원 카세트 및 하나 이상의 핵산 분자 인코딩하는 체크포인트 억제제를 인코딩하는 하나 이상의 핵산 분자를 포함할 수 있다.
차단 또는 억제를 목표로 하는 예시적인 면역 체크포인트 분자는 비제한적으로, CTLA-4, 4-1BB (CD137), 4-1BBL (CD137L), PDL1, PDL2, PD1, B7-H3, B7-H4, BTLA, HVEM, TIM3, GAL9, LAG3, TIM3, B7H3, B7H4, VISTA, KIR, 2B4 (분자의 CD2 계열에 속하고 모든 NK, γδ, 및 메모리 CD8+ (αβ) T 세포상에 발현됨), CD160 (BY55라고도 함), 및 CGEN-15049를 포함한다. 면역 체크포인트 억제제는 하나 이상의 CTLA-4, PDL1, PDL2, PD1, B7-H3, B7-H4, BTLA, HVEM, TIM3, GAL9, LAG3, TIM3, B7H3, B7H4, VISTA, KIR, 2B4, CD160, 및 CGEN-15049에 결합하고, 이들의 활성을 차단 또는 저해하는 항체 또는 이의 항원 결합 단편, 또는 다른 결합 단백질을 포함한다. 예시적인 면역 체크포인트 억제제는 트레메리뮤맙 (CTLA-4 차단 항체), 항-OX40, PD-L1 단일 클론 항체 (항-B7-H1; MEDI4736), 이필리뮤맙, MK-3475 (PD-1 차단제), 니볼루맙 (항-PD1 항체), CT-011 (항-PD1 항체), BY55 단일 클론 항체, AMP224 (항-PDL1 항체), BMS-936559 (항-PDL1 항체), MPLDL3280A (항-PDL1 항체), MSB0010718C (항-PDL1 항체) 및 Yervoy/이필리뮤맙 (항-CTLA-4 체크포인트 억제제)를 포함한다. 항체-코딩하는 서열은 당업계의 통상의 기술을 사용하여 C68과 같은 벡터로 조작할 수 있다. 예시적인 방법은 하기 문헌에 기재되어 있으며:[Fang et al., Stable antibody expression at therapeutic levels using the 2A peptide. Nat Biotechnol. 2005 May;23(5):584-90. Epub 2005 Apr 17]; 본원에 모든 목적을 위해 참고문헌으로 포함된다.
항원 인코딩 카세트와 동일한 벡터 시스템에서 인코딩된 면역 조절제 (예를 들어, 체크포인트 억제제 항체, 예컨대 항-CTLA4 항체 또는 항-PD1 항체)는 또한 면역 조절제를 인코딩하는 핵산 서열이 항원-인코딩 핵산 서열(들)과 동일한 전사체의 일부로 전사되도록 인코딩될 수 있다. 추가 요소는 항원과 면역 조절제 둘 다의 번역을 허용하는 핵산 서열 카세트에 통합될 수 있다. 예를 들어, 내부 리보솜 진입 서열 (IRES) 서열을 사용하여 항원 및 면역 조절제 (들)를 인코딩하는 서열을 분리하여 항원 및 면역 조절제 (들)의 개별 번역을 허용할 수 있다. 또 다른 예에서, 자가-절단 2A 펩티드를 인코딩하는 서열은 항원과 면역 조절제 (들) 사이에 통합되어 동일한 단백질의 일부로서 항원과 면역 조절제 (들) 둘다의 번역을 허용한 다음, 2A 펩티드의 절단에 의해; 항원과 면역 조절제를 위한 별도의 단백질이 생성된다. 이들 예는 제한하는 것을 의미하지 않으며, 또한 IRES 서열 및 2A 펩티드 인코딩 서열 모두의 사용과 같이 항원 및 면역 조절제 (들)의 공동 발현을 촉진하기 위해 다중 요소가 조합될 수 있음이 이해된다. 추가로, 푸린 절단 부위 인코딩 서열은 2A 펩티드 인코딩 서열의 5'에 포함될 수 있다. 푸린 절단 부위는 자가-절단 후 2A 펩티드 잔기의 제거를 허용한다.
항원 및 면역 조절제 (들)이 동일한 전사체에 인코딩되는 예에서, 항원 및 면역 조절제의 순서는 임의의 순서일 수 있다. 예를 들어, IRES 서열을 사용하여 항원과 면역 조절제를 분리하는 경우 5'에서 3'까지의 순서로; 항원-IRES-면역 조절제 배향 또는 면역 조절제-IRES-항원 배향일 수 있다.
또한, 항원 인코딩 카세트와 동일한 벡터 시스템에서 인코딩된 면역 조절제는 또한 면역 조절제를 인코딩하는 핵산 서열이 항원-인코딩 핵산 서열 (들)과 다른 전사체에 전사되도록 인코딩될 수 있다. 예를 들어, 면역 조절제 및 항원-인코딩 핵산 서열 (들)의 전사를 독립적으로 구동하기 위해 별도의 프로모터가 혼입될 수 있다. 개별 프로모터는 동일하거나 다른 프로모터일 수 있고, 각각은 유도성 또는 구성적 프로모터일 수 있다. 예시적인 프로모터 서열은 CMV, SV40, EF-1, RSV, PGK, MCK, HSA 및 EBV 프로모터 서열을 포함하지만 이에 제한되지 않는다. 다른 예에서, 항원 인코딩 카세트 및 면역 조절제를 인코딩하는 핵산 서열은 각각이 독립적으로 전사되도록 동일한 바이러스 벡터의 결실된 영역을 포함하여 상이한 영역에 삽입될 수 있다. 한 예에서, 벡터는 결실된 E1 영역에 도입된 발현 카세트로 설계되고 면역 체크포인트 억제제는 E1/E3 결실된 ChAdV68 바이러스 벡터의 결실된 E3 영역에 도입된다.
V.C. 백신 디자인 및 제조에 대한 추가 고려사항
V.C.1. 모든 종양 아클론을 커버하는 펩티드 세트 결정
모든 또는 대부분의 종양 아클론에 의해 제시되는 것을 의미하는 중심성 펩티드는, 백신에 포함시키기 위한 우선순위를 매길 수 있다.53 선택적으로, 높은 확률로 면역원성이 제시되도록 예상되는 중심성 펩티드가 없거나, 또는 높은 확률로 면역원성이 제시되도록 예상되는 중심성 펩티드의 수가 충분히 작아서, 추가의 비-중심성 펩티드는 종양 서브클론의 수와 동일성을 평가하고 백신에 의해 커버되는 서브클론의 수를 최대화하기 위해 펩티드를 선택함으로써 우선순위를 매길 수 있다.54
V.C.2. 항원 우선 순위
상기 위의 항원 필터를 모두 적용한 후에는 백신 기술이 지원할 수 있는 것보다 더 많은 후보 항원이 백신접종에 사용될 수 있다. 또한, 항원 분석의 다양한 측면에 대한 불확실성이 남아있을 수 있으며, 후보 백신 항원의 상이한 특성들 간에 상충 관계가 존재할 수 있다. 따라서, 선택 과정의 각 단계에서 소정의 필터 대신에, 적어도 하기 축을 갖는 공간에 후보 항원을 위치시키고, 통합 접근법을 사용하여 선택을 최적화하는 통합된 다중-차원 모델이 고려될 수 있다.
1. 자가면역 또는 내성의 위험(생식계열의 위험) (자가면역의 더 적은 위험이 전형적으로 바람직함)
2. 서열분석 인공물의 확률(인공물의 더 낮은 확률이 전형적으로 바람직함)
3. 면역원성 확률(면역원성의 높은 확률이 전형적으로 바람직함)
4. 제시 확률(제시의 더 높은 확률이 전형적으로 바람직함)
5. 유전자 발현(더 높은 발현이 전형적으로 바람직함)
6. HLA 유전자의 적용범위(항원 세트의 제시에 관여하는 HLA 분자의 더 많은 수는 종양이 HLA 분자의 하향 조절 또는 돌연변이를 통한 면역 공격을 피할 확률을 낮출 수 있음)
7. HLA 부류 적용 범위 (HLA-I 및 HLA-II를 모두 포함하면 치료 반응의 가능성이 증가하고 종양 탈출의 가능성이 감소할 수 있음)
추가로, 선택적으로, 항원은 환자의 종양의 전부 또는 일부에서 HLA 대립유전자가 소실되거나 불활성화될 것으로 예상되는 경우 백신 접종으로부터 우선 순위가 감소(예를 들어, 배제)할 수 있다. HLA 대립 유전자 손실은 체세포 돌연변이, 이종 접합성 손실 또는 유전자좌의 동형 접합 결실에 의해 발생할 수 있다. HLA 대립유전자 체세포 돌연변이의 검출 방법은 당업계에 널리 공지되어 있으며, 예를 들어 (Shukla 외, 2015). 체세포 LOH 및 동종 접합 결실 (HLA 유전자좌 포함)의 검출 방법도 마찬가지로 잘 설명되어있다. (Carter 외, 2012; McGranahan 외, 2017; Van Loo 외, 2010). 질량 분석 데이터가 예측된 항원이 예측된 HLA 대립 유전자에 의해 제시되지 않음을 나타내는 경우 항원을 우선 순위로 둘 수도 있다.
V.D. 알파바이러스
V.D.1. 알파바이러스 생물학
알파바이러스는 토가바이러스과의 멤버이고, 및 양성-센스 단일 가닥 RNA 바이러스이다. 멤버는 일반적으로 올드 월드, 예컨대 신드비스, 로스 리버, 마야로, 치쿤군야, 및 셈리키 삼림 바이러스, 또는 뉴 월드 바이러스, 예컨대 동부형마 뇌막염, 아우라, 포트 모건, 또는 베네스 웰라형 마뇌염 바이러스 및 그것의 파생 균주 TC-83 (Strauss Microbrial Review 1994)로 분류된다. 자연적인 알파바이러스 게놈은 일반적으로 약 12kb의 길이이고, 상기 첫번째 2/3는 바이러스성 게놈의 자기 복제를 위해 RNA 복제 복합체를 형성하는 비-구조 단백질(nsPs)을 인코딩하는 유전자를 함유하고, 상기 마지막 세번째는 비리온 생성을 위한 구조 단백질을 인코딩하는 서브게놈 발현 카세트를 함유한다(Frolov RNA 2001).
알파바이러스의 모델 라이프사이클은 여러가지 별개의 단계를 포함한다(Strauss Microbrial Review 1994, Jose Future Microbiol 2009). 숙주 세포에 바이러스가 부착된 후, 비리온은 세포내 구획내의 막과 융합되어 결국 게놈 RNA가 세포질로 방출되게 한다. 플러스-가닥 배향이고 5' 메틸구아닐레이트 캡 및 3' 폴리A 테일을 포함하는 게놈 RNA는 복제 복합체를 형성하는 비-구조 단백질 nsP1-4를 생성하도록 번역한다. 감염 초기에, 플러스-가닥은 복합체에 의해 음성-가닥 주형으로 이어서 복제된다. 현재 모델에서, 복제 복합체는 전장 양성-가닥 게놈 RNA, 뿐만 아니라 구조 유전자를 함유하는 26S 서브게놈 양성-가닥 RNA로 음성-가닥의 전사로 전환하는 결과 처리된 복합체와 감염이 진행됨에 따라 추가 처리된다. 알파바이러스의 몇몇 보존된 서열 요소 (CSE)는 잠재적으로 하기를 포함하는 다양한 RNA 복제 단계에서 역할을 하도록 동정된다: 음성-가닥 주형으로부터 플러스-가닥 RNA의 복제에 있어서 5' UTR의 보완물, 게놈 주형으로부터 음성-가닥 합성의 복제에서 51-nt CSE, 음성-가닥으로부터 서브게놈 RNA의 전사에서 nsPs와 26S RNA 사이의 연결 영역에서 24-nt CSE, 및 플러스-가닥 주형으로부터 음성-가닥 합성에서 3' 19-nt CSE.
다양한 RNA 종의 복제 후, 바이러스 입자는 일반적으로 바이러스의 자연라이프사이클에서 모아진다. 26S RNA는 번역되고 결과 단백질은 캡시드 단백질, 당단백질 E1 및 E2, 및 2개의 작은 폴리펩티드 E3 및 6K (Strauss 1994)를 포함하는 구조 단백질을 생성하도록 추가로 가공된다. 바이러스성 RNA의 단백질 막으로 둘러싸는 것은 캡시드 단백질이 일반적으로 게놈 RNA에만 특화되어 포장되며, 이어서 막 표면에서 비리온 조립체 및 발아(budding)가 생긴다.
V.D.2. 전달 벡터로서 알파바이러스
알파바이러스 (알파바이러스 서열, 특징 및 기타 요소 포함)를 사용하여 알파바이러스 기반 전달 벡터 (알파바이러스 벡터, 알파바이러스 바이러스성 벡터, 알파바이러스 백신 벡터, 자가 복제 RNA (srRNA)벡터 또는 자가 증폭 RNA (samRNA) 벡터라고도 함)를 생성될 수 있다. 알파바이러스는 발현 벡터 시스템로서 사용하기 위해 이전에 조작되었다 (Pushko 1997, Rheme 2004). 알파바이러스는 이종 항원 발현이 요구되는 백신 설정에서 특히 여러 이점을 제공한다. 숙주 세포질에서 자가-복제할 수 있는 능력으로 인해, 알파바이러스 벡터는 일반적으로 세포 내에서 높은 카피 수의 발현 카세트를 생산하여 높은 수준의 이종 항원 생산을 일으킬 수 있다. 또한, 벡터는 일반적으로 일시적이어서, 개선된 생물 안정성 뿐만 아니라 벡터에 대한 면역학적 내성의 감소된 유도가 초래된다. 일반인은 또한 일반적으로 다른 표준 바이러스성 벡터, 예컨대 인간 아데노바이러스와 비교하여 알파바이러스 벡터에 대한 기존의 면역력이 결여된다. 알파바이러스 기반 벡터는 또한 일반적으로 감염된 세포에 세포독성 반응을 일으킨다. 세포독성은 어느 정도까지 발현된 이종 항원에 대한 면역 반응을 적절하게 불법화하기 위한 백신 설정에서 중요할 수 있다. 그러나, 바람직한 세포독성의 정도는 균형 잡힌 행동(balancing act)일 수 있으므로, VEE의 TC-83 균주를 비롯하여 여러 감쇠 알파바이러스가 개발되었다. 따라서, 본원에 기재된 항원 발현 벡터의 예는 높은 수준의 항원 발현을 허용하고, 항원에 대한 강력한 면역 반응을 유도하고, 벡터 자체에 대한 면역 반응을 유도하지 않는 알파바이러스 백본을 이용할 수 있고, 안정한 방식에서 사용될 수 있다. 따라서, 항원 발현 카세트는 VEE 또는 그의 희석된 유도체 TC-83로부터 유래된 서열을 포함하는, 벡터가 사용되는 알파 벡터 서열의 최적화를 통해 상이한 수준의 면역 반응을 유도하도록 디자인될 수 있다.
여러 발현 벡터 디자인 전략은 알파바이러스 서열을 사용하여 조작되었다(Pushko 1997). 하나의 전략에서, 알파바이러스 벡터 디자인은 구조 단백질 유전자의 하류에 26S 프로모터 서열 요소의 제2 카피를 삽입하고, 이어서 이종 유전자를 삽입하는 것을 포함한다 (Frolov 1993). 따라서, 천연 비-구조 및 구조 단백질 이외에, 이종 단백질을 발현하는 추가의 서브게놈 RNA가 생성된다. 이 시스템에서, 감염성 비리온의 생성을 위한 모든 요소가 존재하므로, 비-감염된 세포에서 발현 벡터가 반복적으로 감염될 수 있다.
또 다른 발현 벡터 디자인은 헬퍼 바이러스 시스템을 이용한다 (Pushko 1997). 이 전략에서, 구조 단백질은 이종 유전자로 대체된다. 따라서, 아직 손상되지 않은 비-구조 유전자에 의해 매개되는 바이러스성 RNA의 자가-복제 이후, 26S 서브게놈 RNA는 이종 단백질의 발현을 제공한다. 전통적으로, 구조 단백질을 발현하는 추가의 벡터는 이어서 감염성 바이러스를 생산하기 위해, 세포주의 동시-형질 감염과 같은 트랜스 방식으로 공급된다. 시스템은 미국특허 8,093,021에 상세히 설명되며, 이는 모든 목적을 위해 그 전체가 참조로서 본원에 포함된다. 헬퍼 벡터 시스템은 감염성 입자를 형성할 가능성을 제한하고 따라서 생물안정성을 향상시키는 이점을 제공한다. 또한, 헬퍼 벡터 시스템은 전체 벡터 길이를 감소시켜, 잠재적으로 복제 및 발현 효율을 개선시킨다. 따라서, 본원에 기재된 항원 발현 벡터의 예는 알파바이러스 백본을 이용할 수 있으며, 상기 구조 단백질이 항원 카세트로 대체되고, 그 결과로 생성된 벡터는 생물안정성 우려를 줄이는 동시에, 전체적인 발현 벡터 크기의 감소로 인해 효율적인 발현을 촉진한다.
V.D.3. 시험관 내 알파바이러스 생산
알파바이러스 전달 벡터는 일반적으로 양성-센스 RNA 폴리뉴클레오티드이다.
RNA 생산에 대해 당 업계에서 잘 알려진 종래의 기술은 시험관 내 전사 IVT이다. 이 기술에서, 바람직한 벡터의 DNA 주형은 먼저 표준 분자 생물학 기술 예컨대 클로닝, 제한효소 분해, 결찰, 유전자 합성, 및 폴리메라아제 사슬 반응 (PCR)을 포함하여 당업계에 잘 알려진 기술에 의해 제조된다. DNA 주형은 RNA로 전사될 염기서열의 5' 단부에 RNA 폴리메라아제 프로모터를 함유한다. 프로모터는 비제한적으로, 박테리오파지 폴리메라아제 프로모터 예컨대 T3, T7, 또는 SP6을 포함한다. DNA 주형은 적절한 RNA 폴리메라아제 효소, 완충제, 및 뉴클레오티드 (NTP)와 함께 배양된다. 생성된 RNA 폴리뉴클레오티드는 선택적으로 폴리아데닐레이트 (폴리A) 테일을 포함하도록 3' 단부를 변형하고, 비제한적으로 5' 캡 구조 예컨대 7-메틸구아노신 또는 관련 구조의 첨가를 포함하여 추가로 변형될 수 있다. 이어서, RNA는 페놀-클로로폼 추출과 같은 분야에서 잘 알려진 기술을 사용하여 정제될 수 있다.
V.D.4. 지질 나노입자을 통한 전달
백신 벡터 디자인에서 고려해야 할 중요한 양상은 벡터 자체에 대한 면역력이다(Riley 2017). 이것은 특정 인간 아데노바이러스 시스템와 같은 벡터 자체에 대한 기존의 면역의 형태이거나, 또는 백신 투여 후 벡터에 대한 면역력을 나타내는 형태일 수 있다. 후자는 별도의 최초 접종(priming dose) 및 추가 접종과 같은 동일한 백신을 다중 투여하거나, 또는 동일한 백신 벡터 시스템을 사용하여 다른 항원 카세트를 전달하는 경우, 중요한 고려사항이다.
알파바이러스 벡터의 경우, 표준 전달 방법은 전염성 바이러스성 입자를 생성하기 위해 수송 중 캡시드, E1, 및 E2 단백질을 제공하는 전술한 헬퍼 바이러스 시스템이다. 그러나, E1 및 E2 단백질은 종종 중화 항체의 주요 표적이 된다는 점에 유의하는 것이 중요하다 (Strauss 1994). 따라서, 전염성 입자가 중화 항체에 의해 표적화된다면, 알파바이러스 벡터를 사용하여 표적 세포에 관심있는 항원을 전달하는 효능이 감소될 수 있다.
바이러스성 입자 매개 유전자 전달에 대한 대안은 발현 벡터를 전달하기 위한 나노물질의 사용이다(Riley 2017). 중요한 것은 나노물질 비히클이 비-면역 물질로 만들어질 수 있고, 일반적으로 전달 벡터 자체에 대한 면역을 유도하는 것을 피한다. 이러한 물질은 비제한적으로, 지질, 무기 나노물질, 및 다른 고분자 물질을 포함할 수 있다. 지질은 양이온성, 음이온성, 또는 중성일 수 있다. 물질은 합성 또는 천연 유래, 및 일부 경우에 생분해성일 수 있다. 지질은 비제한적으로, 폴리에틸렌글리콜 (PEG) 접합체 (PEG화 지질), 왁스, 오일, 글리세라이드, 및 지용성 비타민을 포함하여 지방, 콜레스테롤, 인지질, 지질 접합체를 포함할 수 있다.
지질 나노입자 (LNP)는 멤브레인 및 소포 유사 구조의 형성을 가능하게 하는 지질의 양친매성 성질로 인하여 매력적인 전달 시스템이다(Riley 2017). 일반적으로, 이러한 소포는 표적 세포막으로 흡수되고 핵산을 세포질로 방출시킴으로써 발현 벡터를 전달한다. 또한, 특이적 세포 유형의 표적을 용이하게 하기 위해 LNP를 추가로 변형하거나 작용화할 수 있다. LNP 디자인의 또다른 고려사항은 표적 효율과 세포독성 사이의 균형이다. 지질 조성물은 일반적으로 양이온성, 중성, 음이온성, 및 양친매성 지질의 한정된 혼합물을 포함한다. 일부 경우에, 특이적 지질은 LNP 응집을 방지하고, 지질 산화물을 방지하거나, 또는 추가의 모이어티의 부착을 용이하게 하는 작용성 화학기를 제공하기 위해 포함된다. 지질 조성물은 전체 LNP 크기 및 안정성에 영향을 줄 수 있다. 한 예에서, 지질 조성물은 디리놀레일메틸- 4-디메틸아미노부티레이트 (MC3) 또는 MC3-유사 분자를 포함한다. MC3 및 MC3-유사 지질 조성물은 하나 이상의 다른 지질, 예컨대 PEG 또는 PEG-결합 지질, 스테롤, 또는 중성 지질을 포함하도록 제형화될 수 있다.
혈청에 직접적으로 노출된 발현 벡터와 같은 핵산 벡터는 혈청 뉴클레아제에 의한 핵산의 분해 또는 유리 핵산에 의한 면역시스템의 표적외(off-target) 자극을 포함하는 여러 가지 바람직하지 못한 결과를 가질 수 있다. 따라서, 알파바이러스 벡터의 캡슐화는 또한 잠재적인 표적외 효과를 피하면서 저하를 피하기 위해 사용될 수 있다. 특정 예에서, 알파바이러스 벡터는 LNP의 수성 내부와 같은 전달 비히클 내에 완전히 캡슐화된다. LNP 내의 알파바이러스 벡터의 캡슐화는 미세유체 혼합 및 미세유체 액적 생성 장치와 같은 당업계에 잘 알려진 기술에 의해 수행될 수 있다. 이러한 장치는 비제한적으로, 표준 T-접합 장치 또는 흐름-집중 장치를 포함한다. 예들 들어, 바람직한 지질 제형, 예컨대 MC3 또는 MC3-유사 함유 조성물은 알파바이러스 전달 벡터 및 다른 바람직한 제제와 병행하여 액적 생성 장치에 제공하며, 이로써 전달 벡터 및 바람직한 제제는 MC3 또는 MC3-유사 기반된 LNP의 내부에 완전히 캡슐화된다. 예들 들어, 액적 생성 장치는 생성된 LNP의 크기 범위 및 크기 분포를 제어할 수 있다. 예를 들어, LNP는 직경이 1 내지 1000 나노미터, 예를 들어, 1, 10, 50, 100, 500, 또는 1000 나노미터의 크기 범위를 가질 수 있다. 액적 생성 후, 발현 벡터를 캡슐화하는 전달 비히클은 투여를 위해 그를 제조하기 위해 추가로 처리되거나 변형될 수 있다.
V.E. 침팬지 아데노바이러스(ChAd)
V.E.1. 침팬지 아데노바이러스로 바이러스 전달
하나 이상의 항원의 전달을 위한 백신 조성물(예를 들어, 항원 카세트를 통해 그리고 하나 이상의 신생항원을 포함)이 침팬지 기원의 아데노바이러스 뉴클레오티드 서열, 다양한 신규한 벡터, 및 침팬지 아데노바이러스 유전자를 발현하는 세포주를 제공함으로써 형성될 수 있다. 침팬지 C68 아데노바이러스(본원에서 또한 ChAdV68로 불림)의 뉴클레오티드 서열이 항원 전달을 위한 백신 조성물(서열 번호: 1)에 사용될 수 있다.  C68 아데노바이러스 유래 벡터의 사용이 USPN 6,083,716에 추가로 상세히 기술되었고, 이것이 모든 목적을 위해, 그 전체가 참조로 본원에 병합되었다.
추가적 일 측면에서, 침팬지 아데노바이러스, 예컨대 C68의 DNA 서열 및 그것의 발현을 지시하는 조절 서열에 실시가능하게 연결된 항원 카세트를 포함하는 재조합 아데노바이러스가 본원에 제공된다. 상기 재조합 바이러스는 포유류, 바람직하게는, 인간 세포를 감염시킬 수 있고, 상기 세포에서 항원 카세트 생성물을 발현할 수 있다. 이와 같은 벡터에서, 상기 본래의 침팬지 E1 유전자, 및/또는 E3 유전자, 및/또는 E4 유전자가 결손될 수 있다. 항원 카세트는 임의의 유전자 결손 부위에 삽입될 수 있다. 상기 항원 카세트는 프라임된 면역 반응이 표적으로 삼는 항원을 포함할 수 있다.
또 다른 측면에서, 침팬지 아데노바이러스, 예컨대 C68로 감염된 포유류 세포가 본원에 제공된다. 
좀 더 추가적인 측면에서, 침팬지 아데노바이러스 유전자(예를 들어, C68에서 유래됨) 또는 그것의 기능적 절편을 발현하는 신규한 포유류 세포주가 제공된다. 
좀 더 추가적인 측면에서, 항원 카세트를 포유류 세포에 전달하는 방법이 본원에 제공되되, 상기 방법은 상기 항원 카세트를 발현하도록 조작된 바 있는 침팬지 아데노바이러스, 예컨대 C68의 유효량을 상기 세포에 유입시키는 단계를 포함한다.
좀 더 다른 측면은 암을 치료하기 위해 포유류 숙주에서 면역 반응을 유발시키기 위한 방법을 제공한다. 상기 방법은 상기 상기 면역반응의 표적이 되는 종양에서 유래된 하나 이상의 항원을 인코딩하는 항원 카세트를 포함하는 재조합 침팬지 아데노바이러스, 예컨대 C68의 유효량을 상기 숙주에 투여하는 단계를 포함할 수 있다.
또한 서열 번호: 1의 서열에서 수득된 침팬지 아데노바이러스 유전자를 발현하는 비유인원 포유류 세포가 개시된다. 상기 유전자가 서열 번호: 1의 아데노바이러스 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5로 이루어진 군에서 선택될 수 있다. 
또한 서열 번호: 1의 서열에서 수득된 유전자를 포함하는 침팬지 아데노바이러스 DNA 서열을 포함하는 핵산 분자가 개시된다. 상기 유전자는 서열 번호: 1의 상기 침팬지 아데노바이러스 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자로 이루어진 군에서 선택될 수 있다. 일부 측면에서, 상기 핵산 분자는 서열 번호: 1을 포함한다. 일부 측면에서, 상기 핵산 분자는 서열 번호: 1의 서열을 포함하되, 서열 번호: 1의 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자로 이루어진 군에서 선택된 적어도 하나의 유전자가 부족하다. 
또한 서열 번호: 1에서 수득된 침팬지 아데노바이러스 DNA 서열 및, 비상동 숙주 세포에서 상기 카세트의 발현을 지시하는 하나 이상의 조절 서열에 실시가능하게 연결된 항원 카세트를 포함하는 벡터가 개시되되, 선택적으로 상기 침팬지 아데노바이러스 DNA 서열은 적어도 복제 및 비리온 이입(encapsidation)을 위해 필요한 cis-요소, 상기 항원 카세트 및 조절 서열에 측접하는 cis-요소를 포함한다. 일부 측면에서, 상기 침팬지 아데노바이러스 DNA 서열은 서열 번호: 1의 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자 서열로 이루어진 군에서 선택된 유전자를 포함한다. 일부 측면에서, 상기 벡터에는 상기 E1A 및/또는 E1B 유전자가 부족할 수 있다.
또한 항원 카세트를 발현하도록 조작된 본원에 개시된 벡터, 예컨대 C68 벡터로 형질주입된 숙주 세포가 본원에 개시된다. 또한  본원에 개시된 벡터를 상기 세포에 유입시킴으로써 거기에 유입된 선택된 유전자를 발현하는 인간 세포가 본원에 개시된다.
또한 포유류 세포에 항원 카세트를 전달하는 방법이 본원에 개시되되, 항원 카세트를 발현하도록 조작된 본원에 개시된 벡터, 예컨대 C68 벡터의 유효량을 상기 세포에 유입시키는 단계를 포함한다. 
또한 항원을 생산하는 방법이 본원에 개시되되, 본원에 개시된 벡터를 포유류 세포에 유입시키고, 상기 세포를 적절한 조건 하에서 배양하고, 상기 항원을 생산하는 것을 포함한다. 
V.E.2. E1-발현 상보성 세포주 
본원에 개시된 임의의 유전자에서 결손된 재조합 침팬지 아데노바이러스(Ad)를 생성하기 위해, 상기 바이러스의 복제 및 감염성에 필수 사항인 경우, 상기 결손된 유전자의 기능이 헬퍼 바이러스 또는 세포주, 즉 상보성 또는 패키지형 세포주에 의해 상기 재조합 바이러스에 공급될 수 있다. 예를 들어, 복제-결함 침팬지 아데노바이러스벡터를 생성하기 위해, 상기 인간 또는 침팬지 아데노바이러스의 E1 유전자 생성물을 발현하는 세포주가 사용될 수 있고; 그와 같은 세포주는 HEK293 또는 그것의 변이체를 포함할 수 있다. 상기 침팬지 E1 유전자 생성물을 발현하는 세포주의 생성을 위한 프로토콜(USPN 6,083,716의 실시예 3 및 4)이 임의의 선택된 침팬지 아데노바이러스유전자를 발현하는 세포주를 생성하기 위해 뒤따를 수 있다. 
침팬지 아데노바이러스 E1-발현 세포주를 동정하기 위해 AAV 증강 검정법이 사용될 수 있다. 이와 같은 검정법은 기타 특징이 규명되지 않은 아데노바이러스, 예컨대, 다른 종에서 유래된 것의 E1 유전자를 사용함으로써 제조된 세포주에서 E1 기능을 동정하는 데 유용하다. 상기 검정법은 USPN 6,083,716의 실시예 4B에 기술된다. 
선택된 침팬지 아데노바이러스유전자, 예컨대, E1은 선택된 모 세포주에서 발현을 위한 프로모터의 전사 조절하에 있을 수 있다. 유도가능한 또는 구성요소인 프로모터가 본 목적을 위해 활용될 수 있다. 유도가능한 프로모터에는 양 메탈로티오닌 프로모터(아연에 의해 유도가능함) 또는 마우스 유선종양 바이러스(MMTV) 프로모터(글루코코르티코이드, 특히 덱사메타손에 의해 유도가능함). 기타 유도가능한 프로모터, 예컨대 본원에 참조로 병합된 바 있는, 국제 특허출원 WO95/13392에서 동정된 것과 같은 것이 또한 패키지형 세포주의 생산에 사용될 수 있다. 침팬지 아데노바이러스 유전자의 발현의 통제 하에 있는 구성요소인 프로모터가 또한 활용될 수 있다.
모 세포가 임의의 바람직한 C68 유전자를 발현하는 신규한 세포주의 생성을 위해 선택될 수 있다. 비제한적으로, 그와 같은 모 세포주는 HeLa [ATCC 승인 번호. CCL 2], A549 [ATCC 승인 번호. CCL 185], KB [CCL 17], Detroit [예컨대, Detroit 510, CCL 72] 및 WI-38 [CCL 75] 세포일 수 있다. 기타 적합한 모 세포주는 기타 공급원에서 수득될 수 있다. 모 세포주에는 CHO, HEK293 또는 그것의 변이체, 911, HeLa, A549, LP-293, PER.C6 또는 AE1-2a가 포함된다.
E1-발현 세포주는 재조합 침팬지 아데노바이러스 E1-결손 벡터의 생성에 유용하게 사용될 수 있다. 하나 이상의 기타 침팬지 아데노바이러스 유전자 생성물을 발현하는 필수적으로 동일한 과정을 사용하여 구성된 세포주가 그와 같은 생성을 인코딩하는 유전자에서 결손된 재조합 침팬지 아데노바이러스벡터의 생성에 유용하게 사용된다. 더 나아가, 기타 인간 Ad E1 유전자 생성물을 발현하는 세포주는 또한 침팬지 재조합 Ads를 생성하는 데 유용하게 사용된다. 
V.E.3. 벡터로서 재조합 바이러스 입자
본원에 개시된 조성물은 적어도 하나의 항원을 세포에 전달하는 바이러스 벡터를 포함할 수 있다. 이와 같은 벡터는 침팬지 아데노바이러스 DNA 서열, 예컨대 C68 및 조절 서열에 실시가능하게 연결된 항원 카세트를 포함할 수 있다(상기 조절 서열은 상기 카세트의 발현을 지시함). 상기 C68 벡터는 감염된 포유류 세포에서 상기 카세트를 발현할 수 있다. 상기 C68 벡터는 기능적으로 하나 이상의 바이러스 유전자에서 결손될 수 있다. 항원 카세트는 하나 이상의 조절 서열, 예컨대 프로모터의 조절 하에 적어도 하나의 적어도 하나의 항원을 포함한다. 선택적 헬퍼 바이러스 및/또는 패키지형 세포주는 상기 침팬지 바이러스 벡터에 결손된 아데노바이러스 유전자의 임의의 필요한 생성물을 공급할 수 있다. 
용어 "기능적으로 결손된"이란 충분한 양의 유전자 부위가, 예컨대, 변이 또는 수정에 의해, 제거되거나 또는 그렇지 않으면 변경되어 상기 유전자 부위가 더 이상 유전자 발현의 기능적 생성물을 생산할 수 없음을 뜻한다. 기능적 결실을 초래할 수 있는 돌연변이 또는 변형은 조기 정지 코돈의 도입 및 표준 및 비표준 출발 코돈의 제거, mRNA 스플라이싱 또는 다른 전사 처리를 변경시키는 돌연변이, 또는 이들의 조합과 같은 넌센스 돌연변이를 포함하나 이에 제한되지는 않는다. 원하는 경우, 유전자 부위 전체가 제거될 수 있다.
상기 본원에 개시된 벡터를 형성하는 핵산 서열의 수정, 예를 들면 서열 결손, 삽입 및 기타 변이가 표준 분자생물학적 기법을 사용하여 생성될 수 있고, 이것은 본 발명의 범위에 속한다.
V.E.4. 바이러스 플라스미드 벡터의 구성 
본 발명에 유용한 침팬지 아데노바이러스 C68 벡터에는 재조합, 결함이 있는 아데노바이러스, 즉, E1a 또는 E1b 유전자에서 기능적으로 결손된, 및 선택적으로 기타 돌연변이, 예컨대, 온도 민감 돌연변이 또는 기타 유전자에서의 결손을 보유한 침팬지 아데노바이러스 서열이 포함된다. 이와 같은 침팬지 서열들은 또한 기타 아데노바이러스 및/또는 아데노-연관 바이러스 서열에서 하이브리드 벡터를 형성하는데 유용할 것으로 기대된다. 인간 아데노바이러스로 제조된 상동 아데노바이러스 벡터가 공개된 문헌에 기술되어 있다[예를 들어, 앞서 인용된 Kozarsky I 및 II, 및 그것에서 인용된 참조문헌 미국 특허 제5,240,846호]. 
인간(또는 기타 포유류) 세포로 항원 카세트의 전달을 위한 유용한 침팬지 아데노바이러스 C68 벡터의 구성에서, 다양한 아데노바이러스핵산 서열이 상기 벡터에 활용될 수 있다. 최소 침팬지 C68 아데노바이러스 서열을 포함하는 벡터가 감염성 재조합 바이러스 입자를 생산하기 위해 헬퍼 바이러스와 함께 사용될 수 있다. 상기 헬퍼 바이러스는 바이러스 감염성 및 최소 침팬지 아데노바이러스 벡터의 증식에 필요한 필수 유전자 생성물을 제공한다. 침팬지 아데노바이러스 유전자의 단지 하나 이상의 선택된 결손이 그 밖의 기능적 바이러스 벡터에서 이루어질 경우, 상기 결손된 유전자 기능을 도중에 제공하는 선택된 패키지형 세포주에서 상기 바이러스를 증식함으로써, 상기 결손된 유전자 생성물이 바이러스 벡터 생산 과정에 공급될 수 있다.
V.E.5. 재조합 최소 아데노바이러스
최소 침팬지 Ad C68 바이러스는 복제 및 비리온 이입(encapsidation)에 필요한 단지 아데노바이러스 cis-요소를 함유하는 바이러스 입자이다. 즉, 상기 벡터는 상기 아데노바이러스의 cis-작용 5' 및 3' 반전 단부 반복부(ITR) 서열(복제의 기원으로 작용함) 및 본래의 5' 패키지형/인핸서 구역(패키지형 선형 Ad 게놈 및 상기 E1 프로모터에 대한 인핸서 요소에 필요한 서열을 함유함)을 함유한다. 예를 들어, 국제 특허출원 WO96/13597에서 "최소" 인간 Ad 벡터의 제조에 대해 기술되고 참조로 본원에 병합된 기법을 참조한다.
V.E.6. 기타 결함이 있는 아데노바이러스 
재조합, 복제-결핍 아데노바이러스는 또한 최소 침팬지 아데노바이러스 서열보다 많은 것을 함유할 수 있다. 이와 같은 기타 Ad 벡터는 상기 바이러스의 유전자 부위의 다양한 부분들의 결손, 및 헬퍼 바이러스 및/또는 패키지형 세포주의 선택적 사용에 의해 형성된 감염성 바이러스 입자로 특징지을 수 있다. 
일 예로서, 적합한 벡터는 정상적인 생물학적 기능을 없애기 위해, C68 아데노바이러스 중간의(intermediate) 조기 유전자 E1a 및 지연된 조기 유전자 E1b의 전부를 또는 충분한 일부분을 결손함으로써 형성될 수 있다. 복제-결함 E1-결손 바이러스는 과정 중에 상응하는 유전자 생성물을 제공하는 기능적 아데노바이러스 E1a 및 E1b 유전자를 함유하는 침팬지 아데노바이러스-변형, 상보성 세포주 상에서 성장하는 경우, 감염 바이러스를 복제 및 생산할 수 있다. 아데노바이러스 서열에 알려진 상동성에 기반하여, 기존 기술의 인간 재조합 E1-결손 아데노바이러스에서 그랬듯이, 수득되는 재조합 침팬지 아데노바이러스는 여러 세포 유형들을 감염시킬 수 있고, 항원(들)을 발현할 수 있으나, 상기 세포가 매우 높은 감염 다중도(multiplicity)로 감염된 경우가 아닌 이상, 침팬지 E1 부위 DNA를 수반하지 않는 대부분의 세포에서 복제를 할 수 없다.
또 다른 일 예로, 상기 C68 아데노바이러스 지연된 조기 유전자 E3의 전부 또는 일부분이 상기 재조합 바이러스의 일부를 형성하는 침팬지 아데노바이러스 서열에서 제거될 수 있다.
침팬지 아데노바이러스 C68 벡터는 또한 상기 E4 유전자의 결손을 갖도록 구성될 수 있다. 그 밖의 또 다른 벡터는 상기 지연된조기 유전자 E2a에서 결손을 함유할 수 있다. 
결손은 또한 침팬지 C68 아데노바이러스 게놈의 후기(late) 유전자 L1 내지 L5 중 임의의 것에서 이루어질 수 있다. 이와 유사하게, 중간 유전자 IX 및 IVa2에서의 결손은 일부 목적에 있어서 유용할 수 있다. 기타 결손은 기타 구조적 또는 비구조적 아데노바이러스 유전자에서 이루어질 수도 있다. 
앞서 논의된 결손은 개별적으로 사용될 수 있는데, 이는 즉, 아데노바이러스 서열이 E1만의 결손을 함유할 수 있음을 의미한다. 대안적으로, 생물학적 활성을 파괴하거나 또는 감소시키는 데 효과적인 전체 유전자 또는 그것의 일부분의 결손이 임의의 조합으로 사용될 수 있다. 예를 들어, 하나의 예시적 벡터에서, 아데노바이러스 C68 서열은, E3의 결손이 있든지 또는 없든지, E1 유전자 및 E4 유전자의 결손, 또는 E1, E2a 및 E3 유전자의 결손, 또는 E1 및 E3 유전자의 결손, 또는 E1, E2a 및 E4 유전자의 결손을 가질 수 있다. 앞서 논의된 바와 같이, 그와 같은 결손은 원하는 결과를 달성하기 위해, 기타 돌연변이, 예컨대 온도 민감 돌연변이와 조합하여 사용될 수 있다.
항원(들)을 포함하는 카세트는 선택적으로 침팬지 C68 Ad 바이러스의 임의의 결손된 부위에 삽입될 수 있다. 대안적으로, 상기 카세트는 바람직한 경우, 상기 부위의 기능을 훼손하기 위해 기존의 유전자 부위에 삽입될 수 있다. 
V.E.7. 헬퍼 바이러스
항원 카세트를 운반하는 데 활용되는 바이러스 벡터의 침팬지 아데노바이러스 유전자 함량에 따라, 헬퍼 아데노바이러스 또는 비복제 바이러스 절편이 상기 카세트를 함유하는 간염성 재조합 바이러스 입자를 생산하기에 충분한 침팬지 아데노바이러스 유전자 서열을 제공하는 데 사용될 수 있다. 
유용한 헬퍼 바이러스는 아데노바이러스 벡터 구성체에 존재하지 않고, 및/또는 벡터가 형질주입된 패키지형 세포주에 의해 발현되지 않는 선택된 아데노바이러스 유전자 서열을 함유한다. 헬퍼 바이러스는 복제-결함이 있을 수 있고, 앞서 기술된 서열에 덧붙여 다양한 아데노바이러스 유전자를 함유할 수 있다. 헬퍼 바이러스는 본원에 기술된 E1-발현 세포주와 조합하여 사용될 수 있다.
C68의 경우, "헬퍼" 바이러스는 C68 게놈의 C 말단부를 SspI로 잘라냄으로써(이로써 상기 바이러스의 왼쪽 단부에서 약 1300 bp가 제거됨) 형성된 절편일 수 있다. 이와 같이 잘린 바이러스는 이어서 플라스미드 DNA와 함께 E1-발현 세포주로 공동 형질주입됨으로써, 상기 플라스미드에서 C68 서열과의 상동 조합에 의해 재조합 바이러스를 형성한다. 
헬퍼 바이러스는 Wu et al, J. Biol. Chem., 264:16985-16987(1989); K. J. Fisher and J. M. Wilson, Biochem. J., 299:49(Apr. 1, 1994)에서 기술된 바와 같이 다중-양이온 접합체로 형성될 수도 있다. 헬퍼 바이러스는 선택적으로 리포터 유전자를 함유할 수 있다. 수 많은 그와 같은 리포터 유전자가 당해기술에 알려져 있다. 아데노바이러스 벡터 상의 항원 카세트와 상이한 헬퍼 바이러스 상의 리포터 유전자의 존재는 Ad 벡터와 헬퍼 바이러스 모두가 독립적으로 모니터링되는 것을 가능하게 한다. 이와 같은 제2 리포터는 정제 시 수득된 재조합 바이러스와 헬퍼 바이러스의 분리를 가능하게 하기 위해 사용된다.
V.E.8. 바이러스 입자의 조립 및 세포주의 감염 
아데노바이러스, 항원 카세트, 및 기타 벡터 요소들의 선택된 DNA 서열을 다양한 중간 플라스미드 및 셔틀 벡터로 조립하기, 및 재조합 바이러스 입자를 생산하기 위해 플라스미드 및 벡터를 사용하기는 종래의 기법을 사용하여 모두 달성될 수 있다. 그와 같은 기법에는 종래의 cDNA 클로닝 기법, 시험관내 재조합 기법(예컨대, Gibson 조합), 아데노바이러스 게놈의 중첩된 올리고뉴클레오티드 서열의 사용, 폴리머라아제 연결반응 및 기타 원하는 뉴클레오티드 서열을 제공하는 임의의 적합한 방법이 포함된다. 표준 형질주입 및 공동-형질주입 기법들, 예컨대, CaPO4 침전 기법 또는 리포좀-중개 형질주입 방법, 예컨대 리포펙타민이 활용된다. 기타 활용되는 종래 방법에는 바이러스 게놈의 상동 재조합, 한천 오버레이에 바이러스의 플레이킹(plaquing), 신호 생성을 측정하는 방법들이 포함된다.
예를 들어, 원하는 항원 카세트-함유 바이러스 벡터의 구성 및 조립에 이어, 상기 벡터는 헬퍼 바이러스의 존재하에 시험관 내에서 패키지형 세포주로 형질주입될 수 있다. 상동 재조합은 헬퍼와 벡터 서열 사이에서 발생하고, 이것은 상기 벡터 중 아데노바이러스-항원 서열이 비리온 캡사이드로 복제 및 패키징될 있도록 허용함으로써, 재조합 바이러스 벡터 입자를 생성한다.
수득된 재조합 침팬지 C68 아데노바이러스는 항원 카세트를 선택된 세포로 운반하는 데 유용하다. 패키지형 세포주에서 성장된 재조합 바이러스의 체내 실험에서, E1-결손 재조합 침팬지 아데노바이러스는 카세트를 비-침팬지, 바람직하게는 인간, 세포로 운반하는 데 활용성을 입증한다. 
V.E.9. 재조합 바이러스 벡터의 용도 
항원 카세트(앞서 기술된 바와 같이, 아데노바이러스 벡터 및 헬퍼 바이러스 또는 아데노바이러스 벡터 및 패키지형 세포주의 협동에 의해 생산됨)를 함유하는 수득된 재조합 침팬지 C68 아데노바이러스는 따라서 항원(들)을 체내 또는 체외의 개체에 전달할 수 이는 효율적인 유전자 운반 비히클을 제공한다. 
앞서 기술된 재조합 벡터는 공개된 유전자 치료 방법에 따라 인간에게 투여된다. 항원 카세트를 보유하는 침팬지 바이러스 벡터는 바람직하게는, 생물학적으로 양립될 수 있는 용액 또는 약제학적으로 허용가능한 전달 비히클에 현탁화되어 환자에게 투여될 수 있다. 적합한 비히클에는 멸균 식염수가 포함된다. 약제학적으로 허용가능한 담체로 알려지고 당해기술의 숙련가에 잘 알려진 기타 수성 및 비수성 등장성 멸균 주사액 및 수성 및 비수성 멸균 현탁액이 위의 용도로 활용될 수 있다.
침팬지 아데노바이러스 벡터는 인간 세포에 형질도입하고 충분한 수준의 항원 운반 및 발현을 제공하여 부적절한 부작용 없이 또는 의학적으로 허용가능한 생리학적 효과의 존재하에, 치료 효과를 제공하기에 충분한 양으로 투여되되, 이것은 의학 기술의 숙련가에 의해 결정될 수 있다. 종래의 및 약제학적으로 허용가능한 투여경로에는, 비제한적으로, 간으로 직접 전달, 비강내, 정맥내, 근육내, 피하내, 경피, 경구 및 기타 비경구 투여경로가 포함된다. 원하는 경우, 투여 경로가 조합될 수 있다.
바이러스 벡터의 복용량은 주로 인자들, 예컨대 치료 대상 질환, 환자의 연령, 체중 및 건강상태에 따라 달라지기에, 환자들마다 다를 수 있다. 복용량은 치료 효과와 임의의 부작용의 균형을 맞추도록 조절되며, 그와 같은 복용량은 재조합 벡터가 활용되는 치료차원의 적용에 따라 달라질 수 있다. 항원(들)의 발현 수준은 복용량 투여의 회수를 결정하기 위해 모니터링 될 수 있다.
재조합, 복제 결함 아데노바이러스가 "약제학적 유효량"으로, 즉 원하는 세포에 형질주입되어 선택된 유전자의 충분한 발현수준을 제공하여 백신 혜택, 즉 측정가능한 수준의 보호 면역성을 제공하기에 투여 경로에서 효과적인 재조합 아데노바이러스의 양으로 투여될 수 있다. 항원 카세트를 포함하는 C68 벡터는 보조제와 공동투여될 수 있다. 보조제는 벡터와는 별개(예컨대, 명반)이거나 또는, 특히 상기 보조제가 단백질인 경우, 벡터 내에서 인코딩된다. 보조제는 당해기술에 잘 알려져 있다.
종래의 그리고 약제학적으로 허용가능한 투여 경로에는, 비제한적으로, 비강내, 근육내, 기관내, 피하, 경피, 직장, 경구 및 기타 비경구 투여경로가 포함된다. 투여경로는 원하는 경우 조합될 수 있고, 또는 면역원 또는 질병에 따라 조절될 수 있다. 예를 들어, 광견병의 예방의 경우, 기관내 및 비강내 경로가 선호된다. 투여경로는 주로 치료대상 질병의 성격에 좌우된다.
항원(들)에 대한 면역 수준은, 있다면, 부스터의 필요성을 판단하기 위해 모니터링될 수 있다. 혈청 중 항체 역가 평가 이후, 예를 들어, 선택적 부스터 면역화가 바람직할 수 있다.
VI. 치료 및 제조 방법
또한, 본원에 개시된 방법을 사용하여 동정된 복수의 항원과 같은 하나 이상의 항원을 대상체에 투여함으로써, 대상체에서 종양 특이적 면역 반응을 유도하고, 종양에 대한 예방 접종을 하고, 암 환자의 증상을 치료 및/또는 경감시키는 방법을 제공한다.
일부 양태에서, 대상체는 암으로 진단되었거나 암이 발병할 위험이 있다. 대상체는 인간, 개, 고양이, 말 또는 종양 특이적 면역 반응이 요구되는 임의의 동물일 수 있다. 대상체는 인간, 개, 고양이, 말 또는 종양 특이적 면역 반응이 요구되는 임의의 동물일 수 있다. 종양은 임의의 고형 종양, 예컨대 유방, 난소, 전립선, 폐, 신장, 위, 결장, 고환, 두경부, 췌장, 뇌, 흑색종 및 기타 조직기관 종양 및 혈액 종양, 예컨대 림프종 및, 급성 골수성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병 및 B 세포 림프종을 포함하는, 백혈병일 수 있다.
항원은 CTL 반응을 유도하기에 충분한 양으로 투여될 수 있다.
항원은 단독으로 또는 다른 치료제와 조합하여 투여될 수 있다. 치료제는 예를 들어 화학요법제, 방사선 또는 면역요법이다. 특정한 암에 대한 임의의 적합한 치료적 처치가 투여될 수 있다.
또한, 대상체는 체크포인트 억제제와 같은 항-면역억제성/면역자극성 제제를 추가로 투여받을 수 있다. 예를 들어, 대상체는 항-CTLA 항체 또는 항-PD-1 또는 항-PD-L1을 추가로 투여받을 수 있다. 항체에 의한 CTLA-4 또는 PD-L1의 봉쇄는 환자의 암성 세포에 대한 면역 반응을 향상시킬 수 있다. 특히 CTLA-4 봉쇄는 백신접종 프로토콜을 따르는 경우 효과적인 것으로 나타났다.
백신 조성물에 포함되는 각각의 항원의 최적량 및 최적의 투약 요법을 결정할 수 있다. 예를 들어, 항원 또는 그것의 변이체는 정맥내(i.v.) 주사, 피하(s.c.) 주사, 진피내(i.d.) 주사, 복강내(i.p.) 주사, 근육내(i.m.) 주사를 위해 제조될 수 있다. 주사 방법은 s.c., i.d., i.p., i.m., 및 i.v.를 포함한다. DNA 또는 RNA 주사의 방법은 i.d., i.m., s.c., i.p. 및 i.v.를 포함한다. 백신 조성물의 다른 투여 방법은 당업자에게 공지된다.
본 조성물에 존재하는 항원의 선택, 수 및/또는 양이 조직, 암 및/또는 환자-특이적이 되도록 백신이 컴파일링될 수 있다. 예를 들어, 펩티드의 정확한 선택은 주어진 조직에서 모 단백질의 발현 패턴에 의해 유도될 수 있거나 또는 환자의 돌연변이 상태에 의해 유도될 수 있다. 선택은 암의 특이적 유형, 질환의 상태, 초기 치료 요법, 환자의 면역 상태, 및 물론 환자의 HLA-일배체형(haplotype)에 의존될 수 있다. 더욱이, 백신은 특정한 환자의 개인적 필요에 따라, 개별화된 성분을 함유할 수 있다. 실시예는 특정 환자에서 항원의 발현에 따른 항원의 선택을 변화시키는 것 또는 1차 치료 또는 1차 치료 계획 후 2차 치료를 위한 조정을 포함한다. 
환자는 다양한 진단 방법, 예를 들어 아래에 추가로 설명되는 환자 선택 방법을 사용하여 항원 백신의 투여를 위해 식별될 수 있다. 환자 선택은 하나 이상의 유전자에서 돌연변이 또는 발현 패턴을 식별하는 것을 포함할 수 있다. 어떤 경우에는 환자 선택에 환자의 일배체형을 식별하는 것이 포함된다. 다양한 환자 선택 방법이 병렬로 수행 될 수 있으며, 예를 들어 서열분석 진단은 환자의 돌연변이와 일배체형을 모두 식별할 수 있다. 다양한 환자 선택 방법은 순차적으로 수행될 수 있으며, 예를 들어, 하나의 진단 테스트는 돌연변이를 식별하고 별도의 진단 테스트는 환자의 일배체형을 식별하며, 각 테스트는 동일하거나 (예: 고 처리량 서열분석) 또는 상이한 (예: 하나의 고 처리량 서열분석 및 다른 Sanger 서열분석) 진단 방법일 수 있다.
조성물을 암 백신으로 사용하기 위해, 정상 조직에서 다량으로 발현되는 유사한 정상적인 자가-펩티드를 갖는 항원은 본원에 기재된 조성물에서 회피되거나 또는 소량으로 존재할 수 있다. 반면에, 환자의 종양이 다량의 특정 항원을 발현한다는 것이 알려지면, 이 암의 치료를 위한 약제 조성물은 다량으로 존재할 수 있고/있거나 이 특이적인 항원에 대한 특이적 하나 이상의 항원 또는 이 항원의 경로가 포함될 수 있다.
항원을 포함하는 조성물은 이미 암을 앓고 있는 개체에게 투여될 수 있다. 치료적 적용에서, 조성물은 종양 항원에 대한 효과적인 CTL 반응을 유도하고, 증상 및/또는 합병증을 치료하거나 적어도 부분적으로 억제하기에 충분한 양으로 환자에게 투여된다. 이것을 달성하기에 충분한 양은 "치료적으로 효과적인 용량"으로 정의된다. 이러한 용도에 효과적인 양은 예를 들어 조성물, 투여 방식, 치료되는 질환의 단계 및 중증도, 환자의 체중 및 일반적인 건강 상태 및 처방 의사의 판단에 좌우될 것이다. 일반적으로 조성물은 생명을 위협하거나 잠재적으로 생명을 위협하는 상황에서, 특히 암이 전이된 경우, 사용될 수 있음을 명심해야 한다. 이러한 경우에, 외인성 서브스턴스의 최소화 및 항원의 상대적 무독성 성질의 관점에서, 치료의사가 이러한 조성물의 실질적인 초과량을 투여하는 것으로 치료하는 것이 가능하고 바람직한 것으로 느낄 수 있다.
치료 용도를 위해, 투여는 종양의 검출 또는 외과적 제거에서 시작될 수 있다. 그 다음 최소한 증상이 실질적으로 완화될 때까지 그리고 그 이후의 기간 동안 부스팅 투여를 한다.
치료적 처치를 위한 약제학적 조성물(예를 들어, 백신 조성물)은 비경구, 국소, 비강, 경구 또는 국소 투여를 위한 것이다. 약제학적 조성물은 비경구로, 예를 들어, 정맥내로, 피하로, 진피내로, 또는 근육내로 투여될 수 있다. 상기 조성물은 종양에 대한 국소 면역 반응을 유도하기 위해 외과적 절제 부위에 투여될 수 있다. 본원에 항원의 용액을 포함하는 비경구 투여용 조성물이 개시되어 있으며, 백신 조성물은 허용가능한 담체, 예를 들어 수성 담체에 용해시키거나 현탁된다. 다양한 수성 담체, 예를 들어 물, 완충된 물, 0.9% 염수, 0.3% 글리신, 히알루론산 등이 사용될 수 있다. 이들 조성물은 통상의 잘 알려진 멸균 기술에 의해 멸균될 수 있거나, 멸균 여과될 수 있다. 수득된 수용액은 그대로 사용하기 위해 포장되거나, 동결건조되며, 동결건조된 제제는 투여 전에 무균 용액과 조합된다. 상기 조성물은 생리적 조건을 근사화하는데 필요한 약제학적으로 허용가능한 보조 물질, 예컨대 pH 조절 및 완충제, 긴장성 조절제, 습윤제 등, 예를 들어 아세트산나트륨, 젖산나트륨, 염화나트륨, 염화칼륨, 염화칼슘, 소르비탄 모노라우레이트, 트리에탄올아민 올레이트 등을 함유할 수 있다.
항원은 또한 리포솜을 통해 투여될 수 있으며, 이는 림프양 조직과 같은 특정한 세포 조직을 표적으로 한다. 리포좀은 반감기를 증가시키는 데에도 유용하다. 리포좀은 유제, 발포체, 미셀, 불용성 단일층, 액정, 인지질 분산액, 라멜라층 등을 포함한다. 이들 제제에서, 전달되는 항원은 리포좀의 일부로서, 단독으로 또는, 예를 들어, CD45 항원에 결합하는 단일클론성 항체와 같은 림프양 세포 중 만연한 수용체, 또는 다른 치료용 또는 면역원성 조성물과 접합하여 편입된다. 따라서, 원하는 항원으로 충전된 리포솜은 림프양 세포의 부위로 유도될 수 있으며, 리포솜은 선택된 치료적/면역원성 조성물을 전달한다. 리포좀은 일반적으로 중성 및 음전하인 인지질 및 스테롤, 예컨대 콜레스테롤을 포함하는 표준 소포-형성 지질로부터 형성될 수 있다. 지질의 선택은 일반적으로 예를 들어, 리포좀 크기, 산 불안정성 및 혈류내 리포솜의 안정성을 고려하여 유도된다. 예를 들어, Szoka et al., Ann. Rev. Biophys. Bioeng. 9; 467 (1980), 미국 특허 번호 4,235,871, 4,501,728, 4,501,728, 4,837,028, 및 5,019,369에 기재된 바와 같이, 리포솜을 제조하기 위한 다양한 방법이 이용가능하다. 
면역 세포를 표적화하기 위해, 리포솜에 편입될 리간드는 예를 들어 원하는 면역계 세포의 세포 표면 결정 인자에 특이적인 항체 또는 그의 단편을 포함할 수 있다. 리포솜 현탁액은 특히 투여 방식, 전달되는 펩티드 및 치료되는 질환의 단계에 따라 달라지는 투여량으로 정맥내, 국소적으로, 국부적으로 등으로 투여될 수 있다. 
치료 또는 면역화 목적을 위해, 펩티드를 인코딩하는 핵산 및 선택적으로는 본원에 기재된 하나 이상의 펩티드가 환자에게 투여될 수 있다. 핵산을 환자에게 전달하기 위해 다수의 방법이 편리하게 사용된다. 예를 들어, 핵산은 "네이키드 DNA"로 직접 전달될 수 있다. 이 접근법은 예들 들어, 문헌[Wolff et al., Science 247: 1465-1468 (1990)]뿐만 아니라 미국특허 번호 5,580,859 및 5,589,466에 기재되어 있다. 핵산은 또한 예를 들어, 하기에 기술된 바와 같이, 탄도전달(ballistic 전달)을 사용하여 투여될 수 있다: 미국 특허번호 5,204,253. DNA만으로 구성된 입자가 투여될 수 있다. 대안적으로, DNA는 금 입자와 같은 입자에 부착될 수 있다. 핵산 서열을 전달하기 위한 접근법은 바이러스 벡터, mRNA 벡터, 및 전기천공이 있거나 없는 DNA 벡터를 포함할 수 있다.
핵산은 또한 양이온성 지질과 같은 양이온성 화합물과 복합체화되어 전달될 수 있다. 지질-매개된 유전자 전달 방법은 예를 들어, 하기에 기재되어 있다: 문헌[9618372WOAWO 96/18372; 9324640WOAWO 93/24640; Mannino & Gould-Fogerite, BioTechniques 6(7): 682-691 (1988); 미국 특허번호 5,279,833 Rose 미국 특허번호 5,279,833; 9106309WOAWO 91/06309; 및 Felgner et al., Proc. Natl. Acad. Sci. USA 84: 7413-7414 (1987)].
항원은 또한 바이러스 벡터-기재 백신 플랫폼, 예컨대, 백시니아, 계두, 자기-복제 알파바이러스, 마라바라이러스, 아데노바이러스 (예를 들어, Tatsis et al., Adenoviruses, Molecular Therapy (2004) 10, 616―629 참조), 또는 비제한적으로 제2, 제3 또는 하이브리드 제2/제3 세대 렌티바이러스 및 특정 세포 유형 또는 수용체를 표적으로하는 임의의 세대의 재조합 렌티바이러스를 포함하는 렌티바이러스 (예를 들어, Hu et al., Immunization Delivered by Lentiviral Vectors for Cancer and Infectious Diseases, Immunol Rev. (2011) 239(1): 45-61, Sakuma et al., Lentiviral vectors: basic to translational, Biochem J. (2012) 443(3):603-18, Cooper et al., Rescue of splicing-mediated intron loss maximizes expression in lentiviral vectors containing the human ubiquitin C promoter, Nucl. Acids Res. (2015) 43 (1): 682-690, Zufferey et al., Self-Inactivating Lentivirus Vector for Safe 및 Efficient In Vivo Gene Delivery, J. Virol. (1998) 72 (12): 9873-9880 참조)를 포함할 수 있다. 상기 언급된 바이러스 벡터-기반 백신 플랫폼의 패키징 용량에 의존적으로, 이 접근법은 하나 이상의 항원 펩티드를 인코딩하는 하나 이상의 뉴클레오티드 서열을 전달할 수 있다. 상기 서열은 돌연변이가 없는 서열이 측면에 위치할 수 있고, 링커에 의해 분리될 수 있거나 또는 세포 내 부분을 표적으로 하는 하나 이상의 서열이 선행될 수 있다(예를 들어, Gros et al., Prospective identification of neoantigen-specific lymphocytes in the peripheral blood of melanoma patients, Nat Med. (2016) 22 (4):433-8, Stronen et al., Targeting of cancer neoantigens with donor-derived T 세포 receptor repertoires, Science. (2016) 352 (6291):1337-41, Lu et al., Efficient identification of mutated cancer antigens recognized by T 세포s associated with durable 종양 regressions, Clin Cancer Res. (2014) 20( 13):3401-10). 숙주 내로 도입 시, 감염된 세포는 항원을 발현하고, 이에 의해 펩티드(들)에 대한 숙주 면역 (예를 들어, CTL) 반응을 유도한다. 면역화 프로토콜에 유용한 백시니아 벡터 및 방법은 하기에 기재되어 있다: 예를 들어, 미국 특허번호 4,722,848. 또 다른 벡터는 BCG(Bacille Calmette Guerin)이다. BCG 벡터는 Stover et al. (Nature 351:456-460 (1991))에 기재되어 있다. 예를 들어, 살모넬라 티피(Salmonella typhi) 벡터, 및 등의 항원의 치료학적 투여 또는 면역화에 유용한 다양한 다른 백신 벡터는 본원의 설명으로부터 당업자에게 명백할 것이다. 
핵산을 투여하는 수단은 하나 또는 다수의 에피토프를 인코딩하는 미니유전자 작제물을 사용한다. 인간 세포에서의 발현을 위해 선택된 CTL 에피토프(미니겐)를 인코딩하는 DNA 서열을 생성하기 위해, 에피토프의 아미노산 서열은 역번역된다. 인간 코돈 사용법 표는 각각의 아미노산에 대한 코돈 선택을 안내하는데 사용된다. 이들 에피토프-코딩 DNA 서열은 직접 인접하여, 연속 폴리펩티드 서열을 생성한다. 발현 및/또는 면역원성을 최적화하기 위해, 추가 요소가 미니유전자 디자인에 편입될 수 있다. 역전사될 수 있고 꼬마유전자 서열에 포함될 수 있는 아미노산 서열의 예는 헬퍼 T 림프구, 에피토프, 리더 (신호) 서열, 및 소포체 체류 신호를 포함한다. 또한, CTL 에피토프의 MHC 제시는 CTL 에피토프에 인접한 합성(예를 들어, 폴리-알라닌) 또는 자연 발생 측접 서열을 포함시킴으로써 개선될 수 있다. 꼬마유전자 서열은 꼬마유전자의 플러스 및 마이너스 가닥을 인코딩하는 올리고뉴클레오티드를 조합하여 DNA로 전환된다. 중첩된 올리고뉴클레오티드(30-100 염기 길이)가 합성되고, 인산화되고, 정제되고, 공지된 기술을 사용하여 적절한 조건하에 어닐링된다. 올리고뉴클레오티드의 단부는 T4 DNA 리가제를 사용하여 연결된다. 그 다음, CTL 에피토프 폴리펩티드를 인코딩하는 합성 꼬마유전자는 바람직한 발현 벡터로 클로닝할 수 있다.
정제된 플라스미드 DNA는 다양한 제형을 사용하여 주사를 위해 제조될 수 있다. 이들의 가장 간단한 방법은 멸균된 인산염-완충 식염수(PBS)에서 동결건조된 DNA를 재포함하는 것이다. 다양한 방법이 기재되었으며, 새로운 기술이 이용가능해질 수 있다. 전술한 바와 같이, 핵산은 양이온성 지질로 편리하게 제형화된다. 또한, 보호성, 상호작용, 비-응축 (PINC)으로 총칭되는 당지질, 융합생성 리포솜, 펩티드 및 화합물은 또한 정제된 플라스미드 DNA에 복합체화되어 안정성, 근육내 분산, 또는 특이적 장기 또는 세포 유형에 대한 밀매(trafficking)와 같은 변수에 영향을 미칠 수 있다.
또한, 본원에 개시된 방법의 단계를 수행하는 단계; 및 복수의 항원 또는 상기 복수의 항원의 서브셋을 포함하는 종양 백신을 생산하는 단계를 포함하는 종양 백신의 제조 방법이 개시된다.
본원에 개시된 항원은 당 업계에 공지된 방법을 사용하여 제조될 수 있다. 예를 들어, 본원에 개시된 항원 또는 벡터(예를 들어, 하나 이상의 항원을 인코딩하는 적어도 하나의 서열을 포함하는 벡터)를 생성하는 방법은 항원 또는 벡터를 발현하기에 적합한 조건하에 숙주 세포를 배양하는 단계를 포함할 수 있으며, 숙주 세포는 항원 또는 벡터를 인코딩하고 항원 또는 벡터를 정제하는 적어도 하나의 폴리뉴클레오티드를 포함한다. 표준 정제 방법은 크로마토그래피 기술, 전기 영동 기술, 면역학적 기술, 침전 기술, 투석 기술, 여과 기술, 농도 기술, 및 크로마토 초점맞춤 기술을 포함한다.
숙주 세포에는 중국 햄스터 난소(CHO) 세포, NS0 세포, 효모 또는 HEK293 세포가 포함될 수 있다. 숙주 세포는 본원에 개시된 항원 또는 벡터를 인코딩하는 하나 이상의 폴리뉴클레오티드로 형질 전환될 수 있으며, 선택적으로 상기 단리된 폴리뉴클레오티드는 항원 또는 벡터를 인코딩하는 적어도 하나의 핵산 서열에 실시가능하게 연결된 프로모터 서열을 추가로 포함한다. 특정 구현예에서, 단리된 폴리뉴클레오티드는 cDNA일 수 있다.
VII. 항원 용도 및 투여
백신 접종 프로토콜을 사용하여 하나 이상의 항원으로 대상체에 투여될 수 있다. 프라이밍 백신과 부스팅 백신을 사용하여 피험자에게 투여할 수 있다. 프라이밍 백신은 C68 (예를 들어, 서열 번호:1 또는 2에 나타낸 서열) 또는 srRNA (예를 들어, 서열 번호:3 또는 4에 나타낸 서열)를 기반으로 할 수 있고 부스팅 백신은 C68 (예를 들어, 서열 번호:1 또는 2에 나타낸 서열) 또는 srRNA (예를 들어, 서열 번호:3 또는 4에 나타낸 서열)을 기반으로 할 수 있다. 각 벡터는 일반적으로 항원을 포함하는 카세트를 포함한다. 카세트는 일반적으로 각 항원 또는 따른 비-자연적 스페이서 예컨대 AAY를 둘러싸는 자연 서열과 같은 스페이서에 의해 분리된 약 20개의 항원을 포함할 수 있다. 카세트는 또한 파상풍 변독소 항원 및 PADRE 항원과 같은 MHCII 항원을 포함할 수 있으며, 이는 유니버셜 부류 II 항원으로 간주될 수 있다. 카세트는 또한 유비퀴틴 표적화 서열과 같은 표적 서열을 포함할 수 있다. 또한, 각 백신 투여량은 체크포인트 억제제(CPI)와 함께 (예를 들어, 동시에, 전 또는 후에)대상체에 투여될 수 있다. CPI는 항체 또는 그의 항원-결합 부분과 같은 CTLA4, PD1, 및/또는 PDL1을 억제하는 것들을 포함할 수 있다. 이러한 항체는 트레멜리맙 또는 더발루맙을 포함할 수 있다.
프라이밍 백신은 대상에 주입(예를 들어, 근육내로)될 수 있다. 용량 당 양측 주사를 사용할 수 있다. 예를 들어, ChAdV68 (C68)의 하나 이상의 주사가 사용될 수 있으며(예를 들어, 총 투여량 1x1012 바이러스 입자); 0.001 내지 1 ug RNA, 특히 0.1 또는 1 ug 범위로 선택된 낮은 백신 용량에서의 자가-복제 RNA (srRNA)의 1회 이상의 주사가 사용될 수 있으며; 또는 1 내지 100 ug RNA, 특히 10 또는 100 ug의 범위로 선택된 높은 백신 용량에서의 srRNA의 1회 이상의 주사가 사용될 수 있다.
백신 부스트 (부스팅 백신)는 프라임 백신 후에 주입(예를 들어, 근육 내로)될 수 있다. 부스팅 백신은 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 주마다, 예를 들어, 프라임 후 4 주마다 및/또는 8 주마다 투여될 수 있다. 복용량 당 양측 주사를 사용할 수 있다. 예를 들어, ChAdV68 (C68)의 1회이 이상의 주사가 사용될 수 있으며(예를 들어, 총 투여량 1x1012 바이러스 입자); 0.001 to 1 ug RNA, 특히 0.1 또는 1 ug 범위로 선택된 낮은 백신 투여량에서의 자가-복제 RNA (srRNA)의 1회 이상 주사를 사용할 수 있으며; 또는 1 내지 100 ug RNA, 특히 10 또는 100 ug 범위로 선택된 높은 백신 투여량의 srRNA의 1회 이상의 주사를 사용할 수 있다.
항-CTLA-4 (예를 들어, 트레메리무맙) 또한 대상체에 투여될 수 있다. 예를 들어, 항-CTLA4는 동일한 림프절로 배액을 보장하기 위해 근육내 백신 주입 (ChAdV68 프라임 또는 srRNA 저용량) 부위 근처에서 피하 투여할 수 있다. 트레메리무맙은 CTLA-4의 선택적 인간 IgG2 mAb 억제제이다. 표적 항-CTLA-4 (트레메리무맙) 피하 투여량은 전형적으로 70-75 mg (특히 75 mg), 예를 들어, 1-100 mg 또는 5-420 mg의 용량 범위이다.
특정 경우에서, 더발루맙 (MEDI 4736)과 같은 항-PD-L1 항체가 사용될 수 있다. 더발루맙은 PD-1 및 CD80에 대한 PD-L1 결합을 차단하는, 선택적 고친화성 인간IgG1 mAb이다. 더발루맙은 일반적으로 4주마다 20mg/kg i.v.로 투여된다.
면역 모니터링은 백신 투여 전, 도중, 및/또는 후에 수행될 수 있다. 이러한 모니터링은 다른 매개변수 중에서도 안정성과 효능을 알려줄 수 있다.
면역 모니터링을 수행하기 위해서, PBMC가 일반적으로 사용된다. PBMC는 1차 백신 전에 그리고 1차 백신 접종 후에 분리될 수 있다(예를 들어 4 주 및 8 주). PBMC는 부스트 백신접종 전 및 각 부스팅 백신접종 후에 수확할 수 있다 (예를 들어 4 주 및 8 주).
T 세포 반응은 면역 모니터링 프로토콜의 일부로서 평가될 수 있다. T 세포 반응은 ELISpot, 세포내 사이토카인 염색, 사이토카인 분비 및 세포 표면 포획, T 세포 증식, MHC 다량체 염색, 또는 세포독성 분석과 같은 당업계 공지된 하나 이상의 방법을 사용하여 측정될 수 있다. 백신에서 인코딩된 에피토프에 대한 T 세포 반응은 ELISpot 검정을 사용하여 IFN-감마와 같은 사이토카인의 유도를 측정함으로써 PBMC로부터 모니터될 수 있다. 백신에서 인코딩된 에피토프에 대한 특이적 CD4 또는 CD8 T 세포 반응은 유동 세포계측법을 사용하여 IFN-감마와 같은 세포내 또는 세포외로 포획된 사이토카인의 유도를 측정함으로써 PBMC로부터 모니터될 수 있다. 백신에서 인코딩된 에피토프에 대한 특이적 CD4 또는 CD8 T 세포 반응은 MHC 다량체 염색법을 사용하여 에피토프/MHC 부류 I 복합체에 특이적인 T 세포 수용체를 발현하는 T 세포 집단을 측정함으로써 PBMC로부터 모니터될 수 있다. 백신에서 인코딩된 에피토프에 대한 특이적 CD4 또는 CD8 T 세포 반응은 3H-티미딘, 브로모데옥시우리딘 및 카르복시플루오레세인-이아세트산염-숙신이미딜에스테르(CFSE) 도입 후 T 세포 집단의 생체 외 확장을 측정함으로써 PBMC로부터 모니터될 수 있다. 백신에서 인코딩된 에피토프에 대한 특이적 PBMC-유래 T 세포의 항원 인식 능력 및 용균 활성은 크롬 방출 검정 또는 대안적인 비색계 세포독성 검정에 의해 기능적으로 평가될 수 있다.
VIII. 항원 동정
VIII.A. 항원 후보 동정
종양과 정상 엑솜 및 전사체들의 NGS 분석을 위한 연구 방법은 항원 동정 공간에서 기재되고 적용되었다.6,14,15 임상 환경에서 항원 동정에 대한 민감도와 특이도를 높이기 위한 특정한 최적화가 고려될 수 있다. 이러한 최적화는 실험실 프로세스와 관련된 영역 및 NGS 데이터 분석과 관련된 영역의 두 영역으로 그룹화될 수 있다. 최적화의 예는 당업자에게 공지되어 있으며, 예를 들어 국제 특허 출원 공개 WO/2017/106638, WO/2018/195357, 및 WO/2018/208856에 더 상세히 설명된 방법이 알려져 있으며, 각각의 본원은 모든 목적을 위해 전체적으로 참조로 포함된다.
VIII.B. HLA 펩티드의 분리 및 검출
HLA-펩티드 분자의 단리는 조직 샘플(55-58)의 용해 및 가용화 후에 전형적인 면역침강(IP) 방법을 사용하여 수행하였다. 정화된 용해물을 HLA 특이적 IP로 사용하였다.
면역침강은 항체가 HLA 분자에 특이적인 비드에 커플링된 항체를 사용하여 수행하였다. 팬(pan)-부류 I HLA 면역침강의 경우, 팬-부류 I CR 항체가 사용되며, 부류 II HLA-DR의 경우, HLA-DR 항체가 사용된다. 항체를 밤새 배양하면서 NHS-세파로스 비드에 공유결합시킨다. 공유결합 후, 비드를 세정하고 IP에 대해 분주하였다. (59, 60) 면역침강은 또한 비드에 공유적으로 부착되지 않은 항체로 수행될 수 있다. 일반적으로 이는 단백질 A 및/또는 단백질 G로 코팅된 세파로스 또는 자기 비드를 사용하여 수행되어 항체를 컬럼에 고정시킨다. MHC/펩티드 복합체를 선택적으로 풍부하게 하기 위해 사용될 수 있는 일부 항체가 아래에 나열되어있다.
Figure pct00006
면역침강을 위해 항체 비드에 상기 정화된 조직 용해물을 첨가한다. 면역침강 후, 용해물에서 비드를 제거하고, 용해물은 추가의 IP를 포함하여 추가 실험을 위해 저장된다. IP 비드를 세정하여 비특이적 결합을 제거하고, 표준 기술을 사용하여 HLA/펩티드 복합체를 비드에서 용출한다. 단백질 성분은 분자량 스핀 컬럼 또는 C18 분별화를 사용하여 펩티드로부터 제거된다. 수득된 펩티드를 SpeedVac 증발에 의해 건조시키고, 일부 경우에는 MS 분석 전에 -20℃에서 저장한다.
건조된 펩티드를 역상 크로마토그래피에 적합한 HPLC 완충액에서 재구성하고, 퓨전 루모스(융합 Lumos) 질량 분광분석기(Thermo)에서 구배 용출을 위한 C-18 미세모세관 HPLC 칼럼에 로딩하였다. 펩티드 질량/전하(m/z)의 MS1 스펙트럼을 Orbitrap 검출기에서 고해상도로 수집한 다음, 선택된 이온의 HCD 단편화 후에 이온 트랩 검출기에서 수집한 MS2 저해상도 스캔을 수행하였다. 추가로, MS2 스펙트럼은 CID 또는 ETD 단편화 방법 또는, 펩티드의 더 큰 아미노산 적용범위를 달성하기 위한 세 가지 기술의 임의의 조합을 사용하여 얻어질 수 있다. MS2 스펙트럼은 또한 Orbitrap 검출기에서 고해상도 질량 정확도로 측정될 수 있다.
각 분석으로부터 MS2 스펙트럼을 코멧(Comet)(61, 62)를 사용하여 단백질 데이터베이스에 대해 조사하고, 펩티드 동정을 퍼컬레이터(Percolator)(63-65)를 사용하여 기록한다. PEAKS 스튜디오 (Bioinformatics Solutions Inc.)를 사용하여 추가 서열 분석을 수행하고 스펙트럼 매칭 및 데노보 서열분석(97)을 포함한 다른 검색 엔진 또는 서열 분석 방법을 사용할 수 있다.
VIII.B.1. 포괄적인 HLA 펩티드 서열분석을 지원하는 검출 연구의 MS 한계.
펩티드 YVYVADVAAK를 사용하여 어떤 검출 한계가 LC 칼럼 상에 장입된 상이한 양의 펩티드를 사용하는지가 결정되었다. 시험된 펩티드의 양은 1 pmol, 100fmol, 10fmol, 1fmol 및 100amol이었다. (표 1) 결과를 도 24a 및 24b에 나타내었다. 이들 결과는 최저 검출 한계(LoD)가 아토몰 범위(10-18)에 있고, 동적 범위가 5배 이상이며 노이즈에 대한 신호가 낮은 펨토몰 범위(10-15)에서의 서열분석에 충분하다는 것을 나타낸다. 질량 분석법은 HLA 제시를 검증하기 위해 본원에 설명된 예측 알고리즘과 함께 사용될 수 있다. 예를 들어, 질량 분석법을 사용하여 EDGE 예측 모델 (국제 특허 출원 공개 WO/2017/106638, WO/2018/195357 및 WO/2018/208856에 설명 된대로 MS/MS에 의해 시퀀싱된 HLA 제시 펩티드에 대해 훈련된 딥 러닝 모델)에 의해 생성된 에피토프 후보를 검증할 수 있다. EDGE 스코어와 표적화된 MS에 의한 후보 공유 신생 항원 펩티드의 검출 확률 사이의 상관 관계의 예가 도 25에 나와 있다.
표 1
Figure pct00007
IX. 제시 모델
제시 모델을 사용하여 환자에서 펩티드 제시 가능성을 확인할 수 있다. 다양한 제시 모델이 당업자에게 공지되어 있으며, 예를 들어 본 제시 모델은 국제 특허 출원 공개 WO/2017/106638, WO/2018/195357, WO/2018/208856, WO2016187508 및 미국 특허 출원 US20110293637에 보다 상세히 설명되며, 각각은 모든 목적을 위해 그 전체가 본원에 참조로 포함된다.
X. 훈련 모듈
훈련 모듈은 펩티드 서열이 펩티드 서열과 관련된 MHC 대립유전자에 의해 제시될 가능성을 생성하는 훈련 데이터 세트에 기초하여 하나 이상의 제시 모델을 구축하는데 사용될 수 있다. 다양한 훈련 모듈이 당업자에게 알려져 있으며, 예를 들어, 본 제시 모델은 각각이 본원에 참조로 포함된 국제 특허 출원 공개 WO/2017/106638, WO/2018/195357 및 WO/2018/208856에 더 상세히 설명되며, 본원 각각은 전체적으로 모든 목적을 위해 참조로 포함된다. 훈련 모듈은 과-대립유전자별로 펩티드의 제시 가능성을 예측하는 제시 모델을 구성할 수 있다. 훈련 모듈은 또한 두 개 이상의 MHC 대립유전자가 존재하는 다중 대립유전자 설정에서 펩티드의 제시 가능성을 예측하는 제시 모델을 구성할 수 있다.
XI. 예측 모듈
예측 모듈은 서열 데이터를 수신하고, 제시 모델을 사용하여 서열 데이터 내의 후보 항원을 선택하는데 사용될 수 있다. 구체적으로, 서열 데이터는 환자의 종양 조직 세포로부터 추출된 DNA 서열, RNA 서열 및/또는 단백질 서열일 수 있다. 예측 모듈은 환자의 정상 조직 세포로부터 추출한 서열 데이터와 환자의 종양 조직 세포로부터 추출한 서열 데이터를 비교하여 하나 이상의 돌연변이를 함유하는 부분을 동정함으로써 돌연변이된 펩티드 서열인 후보 신생항원을 동정할 수 있다. 예측 모듈은 환자의 정상 조직 세포에서 추출된 서열 데이터와 환자의 종양 조직 세포에서 추출된 서열 데이터를 비교하여 부적절하게 발현된 후보 항원을 동정함으로써 정상 세포 또는 조직과 비교로 종양 세포 또는 암 조직에서 발현이 변경된 후보 항원을 동정할 수 있다.
제시 모듈은 처리된 펩티드 서열에 하나 이상의 제시 모델을 적용하여, 펩티드 서열의 제시 가능성을 추정할 수 있다. 구체적으로, 예측 모듈은 후보 항원에 제시 모델을 적용함으로써 종양 HLA 분자 상에 제시될 가능성이 있는 하나 이상의 후보 항원 서열을 선택할 수 있다. 일 구현예에서, 제시 모듈은 미리 결정된 임계치를 초과하는 추정된 제시 가능성을 갖는 후보 항원 서열을 선택한다. 다른 구현예에서, 제시 모델은 가장 높은 추정된 제시 가능성을 갖는 N개의 후보 항원 서열을 선택한다(여기서, N은 일반적으로 백신내에 전달될 수 있는 에피토프의 최대 개수임). 주어진 환자에 대해 선택된 후보 항원을 포함하는 백신은 환자에게 주사되어 면역 반응을 유도할 수 있다.
XI.B. 카세트 디자인 모듈
XI.B.1 개요
카세트 디자인 모듈은 환자에게 주사하기 위해 선택된 후보 펩티드에 기초하여 백신 카세트 서열을 생성하는데 사용될 수 있다. 다양한 카세트 디자인 모듈이 당업자에게 공지되어 있으며, 예를 들어 카세트 디자인 모듈은 국제 특허 출원 공개 WO/2017/106638, WO/2018/195357 및 WO/2018/208856에 더 상세히 설명되며, 각각 본원은 전체적으로 모든 목적을 위해 참조로 포함된다.
일 구현예에서, 일련의 치료 에피토프는 제시 가능성과 연관된 예측 모듈에 의해 결정된 선택된 펩티드를 기반으로 사전 설정된 임계값 이상으로 생성될 수 있되, 상기 제시 가능성은 제시 모델에 의해 결정된다. 그러나 기타 구현예에서, 일련의 치료 에피토프는 수많은 방법들 중 임의의 하나 이상(단독으로 또는 조합하여)를 기반으로, 예를 들어, 환자의 HLA 부류 I 또는 부류 II 대립유전자에 대한 결합 친화성 또는 예측성 결합 친화성, 환자의 HLA 부류 I 또는 부류 II 대립유전자에 대한 결합 안정성 또는 예측성 결합 안전성, 무작위표본 등을 기반으로, 생성될 수 있을 것으로 기대된다.
치료 에피토프는 선택된 펩티드 자체에 상응할 수 있다. 치료 에피토프는 또한 선택된 펩티드에 더하여 C-말단 및/또는 N-말단 측접 서열을 포함할 수 있다. N-말단 및 C-말단 측접 서열은 그 공급원 단백질의 환경에서 치료 백신 에피토프의 본래의 N-말단 및 C-말단 측접 서열일 수 있다. 치료 에피토프는 고정 길이 에피토프를 나타낼 수 있다. 치료 에피토프는 가변 길이 에피토프를 나타낼 수 있으며, 여기서 에피토프의 길이는 예를 들어 C-측접 서열 또는 N-측접 서열의 길이에 따라 달라질 수 있다. 예를 들어, C-말단 측접 서열 및 N-말단 측접 서열은 각각 2-5 개의 잔기의 다양한 길이를 가질 수 있으며, 결과적으로 에피토프에 대해 16 개의 가능한 선택이 가능하다.
일 구현예에서, 카세트 디자인 모듈은 또한 상기 카세트에서 한 쌍의 치료 에피토프 사이의 연결점을 가로지르는 연결점 에피토프의 제시를 고려하여 카세트 서열을 생성할 수 있다. 연결점 에피토프는 상기 카세트에서 치료 에피토프 및 링커 서열을 연결시키는 과정 때문에 상기 카세트에서 발생하는 신규한 비-자기, 그러나 무관한 에피토프 서열이다. 연결점 에피토프의 신규한 서열은 카세트 그 자체의 치료 에피토프와 상이하다.
카세트 디자인 모듈은 연결점 에피토프가 환자에게서 제시할 가능성을 감소시키는 카세트 서열을 생성할 수 있다. 구체적으로, 상기 카세트가 환자에게 주입된 경우, 연결점 에피토프는 환자의 HLA 부류 I 또는 HLA 부류 II 대립유전자에 의해 제시될 잠재성을 갖고, 및 각각 CD8 또는 CD4 T-세포 반응을 자극한다. 이와 같은 반응들은 종종 연결점 에피토프에 반응성인 T-세포에 치료 혜택이 없기 때문에 바람직하지 않고, 항원 경쟁에 의해 상기 카세트에서 선택된 치료 에피토프에 대한 면역 반응을 감소시킬 수 있다.76
카세트 디자인 모듈은 하나 이상의 후보 카세트들을 통해 반복할 수 있고, 그와 같은 카세트 서열과 연관된 연결점 에피토프의 제시 스코어가 수치적 임계값 이하인 카세트 서열을 결정할 수 있다. 상기 연결점 에피토프 제시 스코어는 카세트에서 연결점 에피토프의 제시 가능성과 연관된 양이고, 연결점 에피토프 제시 스코어가 더 높은 것은 상기 카세트의 연결점 에피토프가 HLA 부류 I 또는 HLA 부류 II 또는 둘 다에 의해 제시될 가능성이 더 높음을 시사한다.
일 구현예에서, 카세트 디자인 모듈은 후보 카세트 서열들 중에서 가장 낮은 연결점 에피토프 제시 스코어와 연관된 카세트 서열을 결정할 수 있다.
카세트 디자인 모듈은 하나 이상의 후보 카세트 서열을 통해 반복하고, 후보 카세트에 대한 연결점 에피토프 제시 스코어를 결정하고, 임계값 이하의 연결점 에피토프 제시 스코어와 연관된 최적의 카세트 서열을 동정할 수 있다.
카세트 디자인 모듈은 추가로 후보 카세트 서열 중 임의의 연결점 에피토프가 상기 백신의 디자인 표적인 소정의 환자에 대해 자기-에피토프인지를 확인하기 위해 하나 이상의 후보 카세트 서열을 추가로 검사할 수 있다. 이를 달성하기 위해, 카세트 디자인 모듈은 알려진 데이터베이스, 예컨대 BLAST와 비교하여 연결점 에피토프를 검사한다. 일 구현예에서, 카세트 디자인 모듈은 연결점 자체 에피토프를 방지하는 카세트를 디자인하도록 구성될 수 있다.
카세트 디자인 모듈은 가장 낮은 연결점 에피토프 제시 스코어를 갖는 서열을 선택하기 위해, 무차별대입(brute force) 접근방법을 실행하고 모든 또는 가장 가능한 후보 카세트 서열을 반복한다. 그러나, 이와 같은 후보 카세트의 개수는 백신의 수용력이 증가함에 따라 엄청나게 클 수 있다. 예를 들어, 20개의 에피토프의 백신 수용력의 경우, 카세트 디자인 모듈은 가장 낮은 연결점 에피토프 제시 스코어를 갖는 카세트를 결정하기 위해 ~1018 가능한 후보 카세트를 반복해야 한다. 이와 같은 결정은(필요한 컴퓨터 처리 자원의 관점에서) 컴퓨터상에 부담스러운 일일 수 있고, 때로 환자를 위한 백신을 생성하기 위한 합당한 시간의 양을 가지고 카세트 디자인 모듈이 완성하기에는 벅찰 수 있다. 게다가 각 후보 카세트에 대한 가능한 연결점 에피토프를 설명하는 것은 심지어 더욱 부담스러울 수 있다. 따라서, 카세트 디자인 모듈은 무차별대입(brute force) 접근방법을 위한 후보 카세트 서열의 개수보다 유의미하게 더 적은 수의 후보 카세트 서열을 반복하는 방식을 기반으로 카세트 서열을 선택될 수 있다.
카세트 디자인 모듈은 무작위로 또는 적어도 거짓 무작위로 생성된 후보 카세트들의 서브셋을 생성하고, 및 카세트 서열로서 사전설정된 임계값 아래의 연결점 에피토프 제시 스코어와 연관된 후보 카세트를 선택할 수 있다. 추가적으로, 카세트 디자인 모듈은 카세트 서열로서 가장 낮은 연결점 에피토프 제시 스코어를 갖는 하위 세트에서 후보 카세트를 선택할 수 있다. 예를 들어, 카세트 디자인 모듈은 일련의 20개의 선택된 에피토프에 대해 ~1백만 후보 카세트의 서브셋을 생성하고, 가장 낮은 연결점 에피토프 제시 스코어를 갖는 후보 카세트를 선택할 수 있다. 비록 무작위 카세트 서열의 서브셋을 생성하고 상기 서브셋에서 연결점 에피토프 제시 스코어가 낮은 카세트 서열을 선택하는 것이 접근방법 대비 최적에 못 미칠 수 있으나, 이것이 유의미하게 적은 컴퓨터 자원을 요구하기 때문에, 그것의 실현이 기술적으로 가능하게 할 수 있다. 추가적으로, 이와 같이 좀 더 효율적인 기법에 상반되는 무차별대입(brute force) 방법을 실행함으로써, 연결점 에피토프 제시 스코어에 적은 또는 심지어 무시할 만한 개선이 야기될 수 있고, 이에 따라서 자원 배분의 관점에서 이것이 가치가 없도록 만든다. 카세트 디자인 모듈은 카세트에 대한 에피토프 서열을 비대칭 주행 세일즈맨 문제(TSP)로 표현함으로써 개선된 카세트 구성을 결정할 수 있다. 노드 목록 및 각각의 쌍의 노드 사이의 거리를 감안하여, TSP가 각 노드를 정확히 1회 방문하고, 본래 노드로 돌아오는 가장 짧은 전체 거리와 연관된 서열을 결정한다. 예를 들어, 서로 알려진 거리를 갖는 장소 A, B, 및 C를 감안하여, TSP의 해결책은 장소의 폐쇄된 서열을 생성하되, 이것은 각 장소를 정확히 1회 방문하기 위한 총 주행 거리가 모든 가능한 경로 중 가장 짧다. TSP의 비대칭 버전은 한쌍의 노드 사이의 거리가 비대칭일 경우, 노드들의 최적의 서열을 결정한다. 예를 들어, 노드 A에서 노드 B로의 주행 "거리"는 노드 B에서 노드 A로의 주행 "거리"와 상이할 수 있다. 비대칭 TSP를 사용하여 개선된 최적 카세트에 대한 문제를 해결함으로써, 상기 카세트 디자인 모듈은 상기 카세트의 에피토프들 사이의 연결점들을 가로질러 축소된 제시 스코어를 야기하는 카세트 서열을 찾을 수 있다. 비대칭 TSP의 용액은 상기 카세트의 연결점들을 가로질러 연결점 에피토프 제시 스코어를 최소화하기 위해 카세트에서 연결되어야 하는 순서에 상응하는 치료 에피토프의 서열을 가리킨다. 이와 같은 접근법을 통해 결정된 카세트 서열은, 특히 생성된 후보 카세트 서열의 개수가 많을 경우, 무작위표본 접근법보다 컴퓨터 자원을 유의미하게 덜 요구할 가능성이 있는 반면, 연결점 에피토프의 제시가 유의미하게 줄어든 서열을 야기할 수 있다. 카세트 디자인을 최적화하기 위한 상이한 계산 접근법 및 비교의 예시적인 예는 국제 특허 출원 공보 WO/2017/106638, WO/2018/195357 및 WO/2018/208856에 더 자세히 설명되어 있으며, 각각은 모든 목적을 위해 그 전체가 본원에 참조로 포함된다.
XIII. 예시 컴퓨터
컴퓨터를 본원에 기재된 컴퓨터이용 방법 중 임의의 것에 사용할 수 있다. 당업자는 컴퓨터가 상이한 아키텍쳐를 가질 수 있음을 인식할 것이다. 컴퓨터의 예는 당업자에게 공지되어 있고, 예를 들어 국제 특허 출원 공개 WO/2017/106638, WO/2018/195357, 및 WO/2018/208856에 보다 상세히 기재된 컴퓨터이며, 이들 각각은 모든 목적을 위해 그 전체가 참조로서 본원에 포함된다.
XIV. 항원 전달 벡터 예
하기는 본 발명을 수행하기 위한 특정 구현예의 실시예이다. 실시예는 단지 예시적인 목적으로 제공되며, 본 발명의 범위를 어떤 식으로든 제한하려는 것은 아니다. 사용된 숫자(예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하도록 노력이 이루어지지만, 몇몇 실험 오차 및 편차가 물론 허용되어야 한다.
본 발명의 실시는 달리 지시되지 않는 한, 당해 분야의 숙련가 내에서 단백질 화학, 생화학, 재조합 DNA 기술 및 약리학의 통상적인 방법을 사용할 것이다. 이러한 기술은 문헌에서 충분히 설명되어 있다. 예를 들어, 문헌[T.E. Creighton, Proteins: Structures 및 Molecular Properties (W.H. Freeman 및 Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Methods In Enzymology (S. Colowick 및 N. Kaplan eds., Academic Press, Inc.); Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990); Carey 및 Sundberg Advanced Organic Chemistry 3 rd Ed. (Plenum Press) Vols A 및 B(1992)]을 참조한다.
XIV.A. 신생항원 카세트 디자인
백신 접종을 통해, 상응하는 세포 면역반응(들)을 자극하는 다중 부류 I MHC 제한된 종양-특이적 신생항원(TSNA)이 달성될 수 있다. 일 실시예에서, 단일 유전자 생성물로서 다중 에피토프를 인코딩하도록 백신 카세트를 조작하였는데, 상기 에피토프는 그것의 자연적인 주위 펩티드 서열 내에 내재되었거나, 또는 비자연적인 링커 서열에 의해 간격이 띄어 졌다. 항원 처리 및 제시에 잠재적으로 영향을 미치고, 그래서 TSNA 특이적 CD8 T 세포 반응의 크기 및 넓이에 영향을 미칠 수 있는 여러 디자인 매개변수를 동정하였다. 본 실시예에서, 하기를 평가하기 위해 여러 모형 카세트를 디자인 및 구성하였다: (1) 강력한 T 세포 반응이 단일 발현 카세트에 병합된 다중 에피토프에 생성될 수 있는지 여부; (2) 모든 에피토프의 최적의 처리 및 제시를 야기하는 발현 카세트 내에서 TSNA 사이에 놓인 최적의 링커를 만드는 것이 무엇인가; (3) 카세트 내 에피토프의 위치가 T 세포 반응에 영향을 미치는지 여부; (4) 카세트 내 에피토프의 개수가 개별 에피토프에 대한 T 세포 반응의 크기 또는 질에 영향을 미치는지 여부; (5) 세포 표적 서열의 첨가가 T 세포 반응을 향상시키는지 여부.
모형 카세트 내에서 표지자 에피토프에 대해 특이적인 항원 제시 및 T 세포 반응을 평가하기 위해 두 가지 판독정보를 개발하였다: (1) 시험관내 세포 기반 스크린(특별히 조작된 리포터 T 세포의 활성에 의해 측정되는 항원 평가를 허용함)(Aarnoudse et al., 2002; Nagai et al., 2012); 및(2) 상응하는에피토프에 특이적인 T 세포 반응에 의해(Cornet et al., 2006; Depla et al., 2008; Ishioka et al., 1999) 인간 기원의 카세트-유래 에피토프의 백신접종 후 면역원성을 평가하기 위한 체내 검정법(HLA-A2 형질전환 마우스 사용함(Vitiello et al., 1991).
XIV.B. 항원 카세트 디자인 평가
XIV.B.1. 방법 및 재료
TCR 및 카세트 디자인, 그리고 클로닝
선택된 TCR는 A*0201에 의해 제시된 경우 펩티드 NLVPMVATV (PDB# 5D2N), CLGGLLTMV (PDB#3REV), GILGFVFTL (PDB#1OGA) LLFGYPVYV (PDB#1AO7)를 인식한다. 2A 펩티드-연결 TCR 하부유닛(베타에 이어서 알파), EMCV IRES 및 2A-연결 CD8 하부유닛(베타에 이어 알파 및 퓨로마이신 내성 유전자)을 함유하는 이송 벡터를 구성하였다. 개방된 판독 프레임 서열을 코돈-적합화하고 GeneArt가 합성하였다 .
시험관내 에피토프 처리 및 제시 연구를 위한 세포주 생성
물/DMSO(2:8, v/v) 중 10mM 트리스(2-카복시에틸)포스핀(TCEP)으로 10mg/mL으로 희석된 펩티드를 ProImmune 또는 Genscript에서 구매하였다. 세포 배양 배지 및 보충액은, 달리 언급되지 않는 한, Gibco에서 구입하였다. 열 불활성화된 소 태아 혈청(FBShi)을 Seradigm에서 구입하였다. QUANTI-Luc 기질, 제오신 및 퓨로마이신을 InvivoGen에서 구입하였다. Jurkat-Lucia NFAT 세포(InvivoGen)를 10% FBShi, 소듐 피루베이트 및 100μg/mL 제오신으로 보충된 RPMI 1640에 유지하였다. 일단 형질도입되면, 이들 세포에 추가적으로 0.3 μg/mL 퓨로마이신을 첨가하였다. T2 세포(ATCC CRL-1992)를 Iscove's 배지(IMDM)와 20% FBShi에서 배양하였다. U-87 MG(ATCC HTB-14) 세포를 10% FBShi로 보충한 MEM Eagles 배지에 유지하였다.
Jurkat-Lucia NFAT 세포는 NFAT-유도가능한 Lucia 리포터 작제물을 함유한다. Lucia 유전자는 T 세포 수용체(TCR)의 교합에 의해 활성화되는 경우, 코엘렌테라진-활용 루시퍼라제의 배양 배지로의 분비를 유발한다. 이와 같은 루시퍼라제는 QUANTI-Luc 루시퍼라제 검출 시약을 사용하여 측정될 수 있다. Jurkat-Lucia 세포에 렌티바이러스를 형질도입하여 항원-특이적 TCR을 발현하였다. HIV-유래 렌티바이러스 이송 벡터를 GeneCopoeia에서 수득하고, VSV-G(pCMV-VsvG), Rev(pRSV-Rev) 및 Gag-pol(pCgpV)을 발현하는 렌티바이러스 지지체 플라스미드를 Cell Design Labs에서 수득하였다.
렌티바이러스를 50~80% 충만도 T75 플라스크의 HEK293 세포를 리포펙타민 2000(Thermo Fisher)으로 형질주입함으로써 제조하되, 리포펙타민 40μl과 DNA 혼합물(이송 플라스미드:pCgpV:pRSV-Rev:pCMV-VsvG의 중량비가 4:2:1:1) 20μg을 사용하였다. 바이러스-함유 배지 8~10mL를 Lenti-X 시스템(Clontech)을 사용하여 농축시켰고, 상기 바이러스를 신선한 배지 100~200μl에 재현탁하였다. 이와 같은 부피를 사용하여 동일한 부피의 Jurkat-Lucia 세포(다른 실험에서는 5x10E4-1x10E6 세포를 사용함)를 덮어씌웠다. 0.3μg/ml 퓨로마이신-함유 배지에서 배양 후, 세포를 분류하여 클론형성능를 수득하였다. 이들 Jurkat-Lucia TCR 클론에 대해 펩티드-로딩된 T2 세포를 사용하여 활성 및 선택성 검사를 실시하였다.
시험관내 에피토프 처리 및 제시 검정법
T2 세포는 TCR에 의한 항원 인식을 검토하기 위해 일상적으로 사용된다. T2 세포는 항원 처리를 위한 펩티드 운송체가 부족하고(TAP 결핍), MHC 상의 제시를 위해 소포체 내에 내인성 펩티드를 로딩할 수 없다. 그러나, T2 세포는 외인성 펩티드로 쉽게 로딩될 수 있다. 상기 5가지 표지자 펩티드(NLVPMVATV, CLGGLLTMV, GLCTLVAML, LLFGYPVYV), GILGFVFTL)와 두 가지 무관한 펩티드(WLSLLVPFV, FLLTRICT)를 T2 세포 상에 로딩하였다. 간략하게, T2 세포의 개수를 세고 IMDM와 1% FBShi로 1x106 세포/mL로 희석하였다. 펩티드를 첨가하여 10μg 펩티드/1x106 세포를 수득하였다. 이어서 세포를 90분 동안 37℃에서 배양하였다. 세포를 IMDM과 20% FBShi로 2회 세척하고, 5x10E5 세포/mL로 희석한 뒤, 100μL를 96-웰 Costar 조직 배양 플레이트에 플레이팅하였다. Jurkat-Lucia TCR 클론의 개수를 세고, RPMI 1640과 10% FBShi 중에 5x10E5 세포/mL로 희석하고, 100μL를 T2 세포에 첨가하였다. 플레이트를 37℃, 5% CO2의 조건에서 밤새 배양하였다. 이어서 플레이트를 3분 동안 400g에서 원심분리하고, 상청액 20μL를 백색 평평 바닥 Greiner 플레이트로 수거하였다. 설명서에 따라 QUANTI-Luc 기질을 준비하고, 웰당 50μL를 첨가하였다. Molecular Devices SpectraMax iE3x 상에서 루시퍼라제 발현을 판독하였다.
아데노바이러스 카세트에 의한 표지자 에피토프 제시를 시험하기 위해, 대리 항원 제시 세포(APCs)로 U-87 MG 세포를 사용하여, 아데노바이러스 벡터를 형질도입하였다. U-87 MG 세포를 수확하여 96-웰 Costar 조직 배양 플레이트에 5x10E5 세포/100μl로서 배양 배지에 플레이팅하였다. 플레이를 약 2시간 동안 37℃에서 배양하였다. 아데노바이러스 카세트를 MEM과 10% FBShi로 100, 50, 10, 5, 1 및 0의 MOI로 희석한 후, U-87 MG 세포에 웰당 5μl로 첨가하였다. 플레이트를 다시 2시간 동안 37에서 배양하였다. Jurkat-Lucia TCR 클론의 개수를 세고, RPMI와 10% FBShi 중의 5x10E5 세포/mL로 희석하고, U-87 MG 세포에 웰당 100μL으로서 첨가하였다. 이어서 플레이트를 약 24시간 동안 37℃, 5% CO2의 조건 하에서 배양하였다. 플레이트를 3분 동안 400g으로 원심분리하고, 상청액 20μL를 백색 평평바닥 Greiner 플레이트에 수거하였다. QUANTI-Luc 기질을 설명서에 따라 제조하여 웰당 50μL를 첨가하였다. Molecular Devices SpectraMax iE3x 상에서 루시퍼라제 발현을 판독하였다.
면역원성 연구를 위한 마우스 균주
형질전환 HLA-A2.1(HLA-A2 Tg) 마우스를 Taconic Labs, Inc에서 수득하였다. 이들 마우스는 인간 HLA-A2.1 리더, α1 및 α2 영역 및 쥣과 H2-Kb α3으로 구성된 키메라 부류 I 분자, 막관통성, 및 세포질 영역으로 이루어진 형질전환유전자를 운반한다(Vitiello et al., 1991). 이와 같은 연구에 사용한 마우스는 C57Bl/6 배경의 야생형 BALB/cAnNTac 암컷 및 동형 접합성 HLA-A2.1 Tg 수컷의 제1 생성 자손(F1)이었다.
아데노바이러스벡터(Ad5v) 면역화
HLA-A2 Tg 마우스를 양측 근육내 주사를 통해 전경골(tibialis anterior)로 아데노바이러스 벡터 1x1010 내지 1x106 바이러스 입자로 면역화하였다. 면역 반응을 면역화 후 12일차에 측정하였다.
임파구 단리
면역화된 마우스의 갓 수확한 비장과 림프절에서 임파구를 단리하였다. 페니실린과 스트렙토마이신을 가진 10% 소 태아 혈청을 함유하는 RPMI(완전한 RPMI)에서, 제조업체의 설명서에 따라 GentleMACS 조직 분해기를 사용하여 조직들을 분해하였다.
생체외 효소-연결 면역점(ELISPOT) 분석
마우스 IFNg ELISpotPLUS 키트(MABTECH)를 가지고 ELISPOT 조화 지침(Janetzki et al., 2015)에 따라 ELISPOT 분석을 실행하였다. 1x105 비장세포를 명시된 펩티드 10uM 와 함께 16시간 동안 96-웰 IFNg 항체 도포 플레이트에서 배양하였다. 알칼린 포스파타아제를 사용하여 점(spot)을 발생시켰다. 반응 시간을 10분으로 설정하고, 수돗물 아래에 플레이트를 두어서 급냉시켰다. AID vSpot 판독 스펙트럼을 사용하여 점들의 개수를 세었다. ELISPOT 분석의 경우, 포화도 >50%의 웰들은 “너무 많아서 셀 수 없음”으로 기록하였다. > 10%의 복제 웰의 편차를 갖는 샘플은 분석에서 제외하였다. 하기 식을 사용하여 웰 충만도에 대해 점들의 개수를 보정하였다: 점 개수+2 x(점 개수 x %충만도 /[100% - %충만도]). 음성 배경을 상기 항원 자극된 웰에서 음성 펩티드 자극 중 점 개수를 빼서 보정하였다. 마지막으로, 너무 많아서 셀 수 없음으로 표지된 웰을 가장 높게 관찰된 보정된 값으로 설정하고, 가장 가까운 백 단위로 반올림하였다.
체외 세포내 사이토킨 염색(ICS) 및 유세포분석기 분석
2~5x106 세포/mL의 밀도로 새롭게 단리된 임파구를 10uM의 지시된 펩티드와 함께 2시간 동안 배양하였다. 2시간 후, 브레펠딘 A를 첨가하여 농도를 5ug/ml로 만들고, 세포를 추가적으로 4시간 동안 자극제와 함께 배양하였다. 자극 후, 제조업체의 프로토콜에 따라, 고정가능한 생존능 연료 eFluor780으로 생존능 세포를 표지하고, 1:400 희석으로 항-CD8 APC(클론 53-6.7, BioLegend)로 염색하였다. 세포내 염색을 위해 항-IFNg PE(클론 XMG1.2, BioLegend) 을 1:100으로 사용하였다. 샘플을 Attune NxT 유세포분석기(Thermo Scientific)에서 수거하였다. 유세포분석기 데이터를 플롯팅하고, FlowJo를 사용하여 분석하였다. 항원-특이적 반응의 정도를 평가하기 위해, CD8+ 세포의 백분율 IFNg+ 및 총 IFNg+ 세포 개수/1x106 생 세포 둘 다를 각 펩티드 자극제에 반응하여 계산하였다.
XIV.B.2. 항원 카세트 디자인의 시험관내 평가
항원 카세트 디자인 평가의 예로서, 모형 백신 카세트 내에서 선택된 인간 에피토프가 항원-제시 세포(도 1)에 의해 발현, 처리 및 제시되는지 여부를 평가하기 위해 시험관내 세포-기반 검정법을 개발하였다. 인식 시, 특징이 잘 규명된 펩티드-HLA 조합들에 대해 특이적인 5가지 TCRs 중 하나를 발현하도록 조작된 Jurkat-Lucia 리포터 T 세포가 활성화되고, 활성화된 T 세포의 핵 인자(NFAT)를 루시퍼라제 리포터 유전자의 전사적 활성을 이끄는 핵으로 이동킨다. 개별적 리포터 CD8 T 세포주의 항원 자극을 생물발광으로 정량화하였다.
개별적 Jurkat-Lucia 리포터 세포주를 같은 몰(mole)의 양만큼 번역된 생성물을 보장하기 위해 P2A 리보솜 스킵 서열에 의해 분리된 항원-특이적 TCR 베타 및 TCR 알파 사슬을 포함하는 발현 구성체로 렌티바이러스를 형질도입함으로써 수정하였다(Banu et al., 2014). 렌티바이러스 구성체에 제2 CD8 베타-P2A-CD8 알파 요소의 추가는 CD8 공동-수용체의 발현을 제공하는데, 이것은 세포 표면상에서 CD8이 표적 pMHC 분자에 대한 결합 친화도와 관련하여 중요하고, 이것의 세포질 꼬리의 교합을 통해 신호전달을 향상시킬 때 모 리포터 세포주에 부족한 것이다(Lyons et al., 2006; Yachi et al., 2006).
렌티바이러스 형질도입 이후, Jurkat-Lucia 리포터를 퓨로마이신 선택 하에서 팽창시키고, 그에 대해 단일 세포 형광 보조 세포 분류(FACS)를 실행하였고, 루시퍼라제 발현에 대해 상기 단클론 군집을 시험하였다. 이로써 기능적 세포 반응을 갖는 특이적 펩티드 항원 1, 2, 4 및 5에 대해 안정적으로 형질주입된 리포터 세포주가 수득되었다.(표 2).
표 2: 시험관내 T 세포 활성화 분석의 전개. 루시퍼라제의 유도에 의해 측정되는 펩티드-특이적 T 세포 인식은 백신 카세트 항원의 효과적인 처리 및 제시를 나타낸다.
Figure pct00008
*: 에피토프 3의 리포터 T 세포는 아직 생성되지 않음
또 다른 실시예에서, 일련의 짧은 카세트, 모든 표지자 에피토프를 동일한 위치에 병합하고(도 2a), HLA-A*0201 제한 에피토프를 분리하는 링커(도 2b)만 변경하였다. 리포터 T 세포를 이와 같은 짧은 카세트를 발현하는 아데노바이러스 구성체로 감염된 U-87 항원-제시 세포(APC)와 개별적으로 혼합하고, 미감염된 대조군과 대비하여 루시퍼라제 발현을 측정하였다. 리포터 T 세포를 매칭함으로써 모형 카세트 중 네 가지 항원 모두를 인식하였고, 이것이 다중 항원의 효율적인 처리 및 제시를 입증하였다. T 세포 반응의 크기는 자연적 및 AAY-링커의 대체로 유사한 추세를 따른다. RR-링커 기반 카세트에서 방출된 항원은 더 낮은 루시퍼라제 유도를 나타낸다(표 3). 항원 처리를 방해하도록 디자인된 DPP-링커는 낮은 에피토프 제시를 야기하는 백신 카세트를 생산하였다(표 3).
표 3: 짧은 카세트 중 링커 서열의 평가. 시험관내 T 세포 활성화 검정법에서 루시퍼라제 유도는, DPP-기반 카세트는 별개로, 모든 링커가 카세트 항원의 효율적인 방출을 용이하게 하였음을 시사하였다. 오직 T 세포 에피토프(링커 없음) = 9AA, 자연적 링커 일측 = 17AA, 자연적 링커 양측 = 25AA, 비자연적인 링커 = AAY, RR, DPP
Figure pct00009
*: 에피토프 3의 리포터 T 세포는 아직 생성되지 않음
또 다른 실시예에서, 인간 및 마우스 에피토프 이외, 표적 서열, 예컨대 유비퀴틴(Ub), MHC 및 Ig-카파 신호 펩티드(SP), 및/또는 카세트의 N-말단 또는 C-말단 중 하나에 위치한 MHC 막관통성(TM) 모티프를 함유하는, 추가적인 일련의 짧은 카세트를 구성하였다.(도 3). 아데노바이러스 벡터에 의해 U-87 APCs로 전달되는 경우, 리포터 T 세포는 다시 다중 카세트-유래 항원의 효율적인 처리 및 제시를 입증하였다. 그러나, T 세포 반응의 크기는 다양한 표적 특징에 의해 대체로 영향을 받지 않았다(표 4).
표 4: 모형 백신 카세트에 추가된 세포 표적 서열의 평가. Employing the 시험관내 T 세포 활성화 검정법을 활용하는 것은 4가지 HLA-A*0201 제한 표지자 에피토프는 모형 카세트에서 효율적으로 해방되고, 표적화 서열은 T 세포 인식 및 활성화를 대체로 향상시키지 못했음을 입증하였다.
Figure pct00010
*: 에피토프 3의 리포터 T 세포는 아직 생성되지 않음
XIV.B.3. 항원 카세트 디자인의 체내 평가
항원 카세트 디자인 평가의 또 다른 실시예로서, 백신 카세트는 HLA-A*02:01 제한된 방식으로 CD8 T 세포를 자극하는 것으로 알려진 5가지 특징이 잘 규명된 인간 부류 I MHC 에피토프를 함유하도록 디자인하였다(도 2a, 3, 5a). 이와 같은 표지자 에피토프를 함유한 백신 카세트는, 이것의 체내 면역원성의 평가를 위해, 아데노바이러스 벡터에 병합하였고, HLA-A2 형질전환 마우스를 감염시키기 위해 사용하였다(도 4). 이와 같은 마우스 모형은 인간 HLA-A*0201과 마우스 H2-Kb의 일부분으로 이루어진 형질전환유전자를 운반함으로써, 쥣과 α3에 결찰된 인간 HLA-A2.1 리더, α1 및 α2 영역, 막관통성 및 세포질 H2-Kb 영역으로 이루어진 키메라 부류 I MHC 분자를 인코딩한다(Vitiello et al., 1991). 상기 키메라 분자는 HLA-A*02:01-제한 항원 제시를 허용하는 한편, MHC 상에서 α3 구역과 CD8 공동-수용체의 종-일치된 상호작용을 유지한다.
짧은 카세트의 경우, 모든 표지자 에피토프는 일반적으로 보고된 바보다 대략 10~50배 더 강한, IFN-감마 ELISPOT에 의해 결정된 T 세포 반응을 생성하였다(Cornet et al., 2006; Depla et al., 2008; Ishioka et al., 1999). 평가된 모든 링커 중에서, 25mer 서열의 연결체(각각은 그들의 자연적 아미노산 서열에 측접하는 최소 에피토프를 함유함)는 가장 크고 가장 넓은 T 세포 반응을 생성하였다(표 5). 세포내 사이토킨 염색(ICS) 및 유세포분석기 분석은 항원-특이적 T 세포 반응이 CD8 T 세포에서 유래됨을 보여주었다.
표 5: 짧은 카세트 중 링커 서열의 체내 평가. ELISPOT 데이터는 HLA-A2 형질전환 마우스는, 1e11 아데노바이러스바이러스 입자로 감염 후 17일 차에, 상기 카세트의 모든 부류 I MHC 제한 에피토프에 대한 T 세포 반응을 생성하였음을 시사하였다.
Figure pct00011
또 다른 실시예에서, 일련의 긴 백신 카세트를 구성하고, 본래의 5가지 표지자 에피토프 옆에, 알려진 CD8 T 세포 반응성을 갖는 추가적인 16 HLA-A*02:01, A*03:01 및 B*44:05 에피토프를 함유하는 아데노바이러스 벡터에 병합하였다(도 5a, b). 이들 긴 카세트의 크기는 최종 임상적 카세트 디자인와 면밀히 닮았고, 서로에 대해 에피토프의 위치만을 변경하였다. 긴 백신 카세트 및 짧은 백신 카세트 모두에서, 크기 및 너비의 측면에서 CD8T 세포 반응들은 비교할 만하였고, 이는(a) 더 많은 에피토프의 추가가 원래의 일련의 에피토프에 대한 면역반응의 크기에 대체로 영향을 미치지 않음, 및(b) 카세트에서 에피토프의 위치가 그것에 대한 결과적인 T 세포 반응에 대체로 영향을 미치지 않음(표 6)을 입증하였다.
표 6: 긴 카세트에서 에피토프 위치의 영향에 대한 체내 평가. ELISPOT 데이터는 HLA-A2 형질전환 마우스가, 아데노바이러스 바이러스 입자로 감염시킨 후 17일차에, 긴 백신 카세트와 짧은 백신 카세트 모두에 대해 크기를 비교할 만한 T 세포 반응을 생성하였음을 시사하였다.
Figure pct00012
*: 의심되는 기술적 오차가 T 세포 반응의 부재를 유발하였다.
XIV.B.4. 면역원성 및 독물학 연구를 위한 항원 카세트 디자인
요약하면, 모형 카세트 평가의 결과(도 2~5, 표 2~6)는 모형 백신 카세트의 경우, 아데노바이러스-기반 벡터의 환경에서 약 20개 에피토프를 인코딩하는 “일련의 비드(string of beads)” 접근법을 활용할 때 경우, 강력한 면역원성을 달성하였음을 입증하였다. 에피토프는 25mer 서열을 연결함으로써 조립되었는데, 각각은 자연적, 주위 펩티드 서열(예컨대 각 측면 상에 8개 아미노산 잔기)에 의해 양측이 측접되는 최소 CD8 T 세포 에피토프(예컨대 9개 아미노산 잔기)를 내포시킨다. 본원에 사용된 “자연적” 또는 “본래의(native)” 측접 서열은 그것의 원천 단백질 내에서 에피토프의 자연발생적 환경에 주어진 에피토프의 N- 및/또는 C- 말단 측접 서열을 가리킨다. 예를 들어, HCMV pp65 MHC I 에피토프 NLVPMVATV는 그것의 5' 단부가 본래의 5' 서열 WQAGILAR에 측접하고, 그것의 3' 단부가 본래의 3' 서열 QGQNLKYQ에 측접하기 때문에, HCMV pp65 원천 단백질 내에서 발견된 WQAGILARNLVPMVATVQGQNLKYQ 25mer 펩티드가 생성되었다. 자연적 또는 본래의 서열은 또한 본래의 측접 서열(들)이 측접된 에피토프를 인코딩하는 뉴클레오티드 서열을 가리킬 수 있다. 각 25mer 서열은 직접적으로 이어지는 25mer 서열에 연결된다. 최소 CD8 T 세포 에피토프가 9개 아미노산보다 크거나 또는 작은 경우에, 측접 펩티드 길이는 총 길이가 여전히 25mer 펩티드 서열이 되도록 조절될 수 있다. 예를 들어, 10 아미노산 CD8 T 세포 에피토프는 8 아미노산 서열 및 7 아미노산이 측접할 수 있다. 연결체 뒤에 CD4 T 헬퍼 세포를 자극하고 백신 카세트 항원의 전반적인 체내 면역원성을 향상시키기 위해 포함된 2가지 보편적 부류 II MHC 에피토프가 따른다(Alexander et al., 1994; Panina-Bordignon et al., 1989). 상기 부류 II 에피토프는 GPGPG 아미노산 링커 (서열 번호:56)에 의해 최종 부류 I 에피토프에 연결된다. 상기 2가지 부류 II 에피토프는 또한 GPGPG 아미노산 링커에 의해 서로 연결될 뿐만 아니라, C-말단에서 GPGPG 아미노산 링커에 측접된다. 에피토프의 위치 또는 개수 중 어느 것도 T 세포 인식 또는 반응에 실질적으로 영향을 미친다는 것이 나타나지 않았다. 서열 표적화 역시 카세트-유래 항원의 면역원성에 실질적으로 영향을 미치는 것으로 보이지 않았다.
추가적 실시예로서, 모형 카세트로 수득된 시험관내 및 체내 데이터(도 2~5, 표 2~6)를 토대로, 비-인간 유인원(NHP), 마우스 및 인간에서 면역원성으로 알려진 특징 규명이 잘 된 T 세포 에피토프들을 교대로 갖는 카세트 디자인을 생성하였다. 모두 자연적 25mer 서열에 내재된, 상기 20개 에피토프들은 그 뒤에 평가된 모든 모형 카세트에 존재했던 2가지 보편적 부류 II MHC 에피토프들이 따라온다(도 6). 본 카세트 디자인을 사용하여 다양한 종에서 약물학 및 독물학 연구 뿐만 아니라 면역원성을 연구하였다.
XIV.B.5. 30, 40, 및 50개 항원에 대한 항원 카세트 디자인 및 평가
각각 25개 아미노산 길이의 30 (L), 40 (XL) 또는 50 (XXL)개의 에피토프를 갖는 대형 항원 카세트를 디자인하였다. 에피토프는 종양 항원을 포함하는 질환 항원을 모델링하기 위한 인간, NHP 및 마우스 에피토프의 혼합물이었다. 도 29는 다양한 종으로부터의 에피토프의 일반적 조직화를 도시한다. 사용된 모델 항원은, 각각 인간, 영장류, 및 마우스 모델 에피토프에 대하여 표 37, 38 및 39에 기재되어 있다. 표 37, 38 및 39는 각각 에피토프 위치, 명칭, 최소 에피토프 기재, 및 MHC 부류를 기재하였다.
이들 카세트를 기재된 바와 같이 chAd68 및 srRNA 백신 벡터로 클로닝하여 보다 긴 다중-에피토프 카세트의 효능을 평가하였다. 도 30은 각각의 대형 항원 카세트가 웨스턴 블롯에 의해 예상 크기의 적어도 하나의 주요 밴드에 의해 지시된 바와 같이 ChAdV 벡터로부터 발현되었음을 보여준다.
마우스를 기재된 바와 같이 면역화하여 대형 카세트의 효능을 평가하였다. T 세포 반응을, 에피토프 AH1 (상단 패널) 및 SINNFEKL (하단 패널)에 대하여, chAd68 벡터로의 면역화 후 ICS 및 사량체 염색에 의해 (각각 도 31/표 40 및 도 32/표 41), 또한 srRNA 벡터로의 면역화 후 ICS에 의해 (도 33/표 42) 분석하였다. 30 (L), 40 (XL) 또는 50 (XXL)개의 에피토프를 발현하는 chAd68 및 srRNA 백신 벡터를 사용한 면역화는 CD8+ 면역 반응을 유도하여 질환 에피토프를 모델링하였다.
표 37 - 대형 카세트에서의 인간 에피토프
Figure pct00013
표 38 - 대형 카세트에서의 NHP 에피토프
Figure pct00014
표 39 - 대형 카세트에서의 마우스 에피토프
Figure pct00015
표 40: ChAd 대형 카세트 처리된 마우스에서 AH1 및 SIINFEKL 펩티드에 반응하는 평균 IFNg+ 세포. 데이터는 총 CD8 세포에 대한 %로서 제시되어 있다. 그룹 당 평균 및 표준 편자 및 터키 시험을 사용한 ANOVA에 의한 p-값이 나타나 있다. 모든 p-값이 MAG 20-항원 카세트와 비교되었다.
Figure pct00016
표 41: ChAd 대형 카세트 처리된 마우스에서 AH1 및 SIINFEKL 항원에 대한 평균 사량체+ 세포. 데이터는 총 CD8 세포에 대한 %로서 제시되어 있다. 그룹 당 평균 및 표준 편자 및 터키 시험을 사용한 ANOVA에 의한 p-값이 나타나 있다. 모든 p-값이 MAG 20-항원 카세트와 비교되었다.
Figure pct00017
표 42: SAM 대형 카세트 처리된 마우스에서 AH1 및 SIINFEKL (서열번호: 83)펩티드에 반응하는 평균 IFNg+ 세포. 데이터는 총 CD8 세포에 대한 %로서 제시되어 있다. 그룹 당 평균 및 표준 편차 및 터키 시험을 사용한 ANOVA에 의한 p-값이 나타나 있다. 모든 p-값이 MAG 20-항원 카세트와 비교되었다.
Figure pct00018
XV. ChAd 항원 카세트 전달 벡터
XV.A. ChAd 항원 카세트 전달 벡터 구축
일 실시예에서, 침팬지 아데노바이러스(ChAd)를 항원 카세트용 전달 벡터가 되도록 조작하였다. 추가적인 실시예에서, 전장 ChAdV68 벡터를 E1(nt 457 내지 3014) 및 E3(nt 27,816 내지 31,332) 서열이 결손된 AC_000011.1(특허 US 6083716의 서열 2)을 기반으로 합성하였다. CMV 프로모터/인핸서의 통제 하의 리포터 유전자를 결손된 E1 서열 자리에 삽입하였다. 이와 같은 클론의 HEK293 세포로의 형질주입은 전염성 바이러스를 생산하지 않았다. 야생형 C68 바이러스 서열을 확인하기 위해, ATCC에서 단리된 VR-594를 수득하고, 계대배양한 후, 독립적으로 서열화하였다(서열 번호:10). AC_000011.1 서열을 야생형 ChAdV68 바이러스의 ATCC VR-594 서열(서열 번호:10)과 비교할 때, 6가지 뉴클레오티드 차이를 동정하였다. 일 실시예에서, 5곳에서 상응하는 ATCC VR-594 뉴클레오티드가 치환된 AC_000011.1을 토대로 변형된 ChAdV68 벡터를 생성하였다(ChAdV68.5WTnt 서열 번호:1).
또 다른 실시예에서, E1(nt 577 내지 3403) 및 E3(nt 27,816 내지 31,332) 서열이 결손되고, 4곳에서 상응하는 ATCC VR-594 뉴클레오티드가 치환된 AC_000011.1을 토대로 수정된 ChAdV68 벡터를 생성하였다. CMV 프로모터/인핸서의 통제 하의 GFP 리포터(ChAdV68.4WTnt.GFP; 서열 번호:11) 또는 모델 신생항원 카세트(ChAdV68.4WTnt.MAG25mer; 서열 번호:12)를 결손된 E1 서열 자리에 삽입하였다.
또 다른 실시예에서, E1(nt 577 내지 3403) 및 E3(nt 27,125 내지 31,825) 서열이 결손되고 5곳에서 상응하는 ATCC VR-594 뉴클레오티드가 치환된 AC_000011.1을 토대로 수정된 ChAdV68 벡터를 생성하였다. CMV 프로모터/인핸서의 통제 하의 GFP 리포터(ChAdV68.5WTnt.GFP; 서열 번호:13) 또는 모형 신생항원 카세트(ChAdV68.5WTnt.MAG25mer; 서열 번호:2)를 결손된 E1 서열 자리에 삽입하였다.
관련 벡터가 아래에 설명되어 있다.
- 전장 ChAdVC68 서열 "ChAdV68.5WTnt"(서열번호: 1); 5 위치에서 상응하는 ATCC VR-594 뉴클레오티드가 치환된 AC_000011.1 서열.
- ATCC VR-594 C68 (서열번호: 10); 독립적으로 서열됨; 전장 C68
- ChAdV68.4WTnt.GFP (서열번호: 11); E1 (nt 577 내지 3403) 및 E3 (nt 27,816 ~ 31,332) 서열이 결손된 AC_000011.1; 4 위치에서 치환된 상응하는 ATCC VR-594 뉴클레오티드; 결손된 E1 자리에 삽입된 CMV 프로모터/인핸서가 통제하의 GFP 리포터
- ChAdV68.4WTnt.MAG25mer (서열번호: 12); E1 (nt 577 내지 3403) 및 E3 (nt 27,816 ~ 31,332) 서열이 AC_000011.1; 4 위치에서 치환된 상응하는 ATCC VR-594 뉴클레오티드; 결손된 E1 자리에 삽입된 CMV 프로모터/인핸서의 통제하의 모형 신생항원 카세트
- ChAdV68.5WTnt.GFP (서열 번호: 13); E1 (nt 577 내지 3403) 및 E3 (nt 27,125 ~ 31,825) 서열이 결손된 AC_000011.1; 5 위치에서 치환된 상응하는 ATCC VR-594 뉴클레오티드; 결손된 E1 자리에 삽입된 CMV 프로모터/인핸서의 통제 하의 GFP 리포터
XV.B. ChAd 항원 카세트 전달 벡터 검사
XV.B.1. ChAd 벡터 평가 방법 및 재료
리포펙타민을 사용한 HEK293A 세포의 형질주입
ChAdV68 작제물 (ChAdV68.4WTnt.GFP, ChAdV68.5WTnt.GFP, ChAdV68.4WTnt.MAG25mer 및 ChAdV68.5WTnt.MAG25mer)용 DNA를 제조하여, 하기 프로토콜을 사용하여 HEK293A 세포에 형질주입하였다.
플라스미드 DNA 10ug를 PacI로 소화시켜 바이러스성 게놈을 해방시켰다. 이어서 제조업체의 설명에 따라 GeneJet DNA 정화 Micro columns(Thermo Fisher)를 사용하여 긴 DNA 절편에 대해 DNA를 정제하고, 예열된 물 20uL에 용출시키고; 용출 단계 전에 0.5 내지 1시간 동안 37도에서 컬럼을 방치하였다.
형질주입 14 내지 18시간 전에 106 세포/웰의 세포 밀도로 6-웰 플레이트에 HEK293A 세포를 유입시켰다. 웰당 1ml의 신선한 배지(페니실린/스트렙마이신 및 글루탐산 함유 DMEM-10% hiFBS)로 세포를 덧씌웠다. 제조업체의 프로토콜에 따라, 리포펙타민 2000의 ul 부피(2~4ul)의 두 배로 형질주입 시, 웰당 정제된 DNA 1~2ug을 사용하였다. 형질주입 혼합물을 함유한 OPTI-MEM 배지 0.5ml를 각 웰의 정상적인 성장 배지 1ml에 첨가하여, 밤새 세포 상에 두었다.
형질주입된 세포 배양액을 적어도 5~7일 동안 37℃에서 배양하였다. 만약 형질주입 후 7일차에 바이러스성 플라크가 관찰되지 않으면, 세포를 1:4 또는 1:6으로 쪼개어, 37℃에서 배양하여 플라크 발달을 모니터링하였다. 대안적으로, 형질주입된 세포를 수확하여 동결 및 해동을 3주기로 실행하고, 세포 용해물을 사용하여 HEK293A 세포를 감염시키고, 상기 세포를 바이러스 플라크가 관찰될 때까지 배양하였다.
인산칼슘을 사용한 ChAdV68 벡터의 HEK293A 세포로의 형질주입 및 3차 바이러스성 저장품의 생성
ChAdV68 작제물 (ChAdV68.4WTnt.GFP, ChAdV68.5WTnt.GFP, ChAdV68.4WTnt.MAG25mer, ChAdV68.5WTnt.MAG25mer)용 DNA를 제조하고, 하기 프로토콜에 따라 HEK293A 세포에 형질주입하였다.
HEK293A 세포를 형질주입 하루 전에 5% BS/DMEM/ 1XP/S, 1XGlutamax의 6웰 플레이트에 106 세포/웰의 밀도로 시딩하였다. 형질주입 당 2개 웰이 필요하다. 형질주입 2~4시간 전에, 상기 배지를 신선한 배지로 교체하였다. ChAdV68.4WTnt.GFP 플라스미드를 PacI로 선형화하였다. 상기 선형화된 DNA를 이어서 페놀 클로로포름 추출하고, pH 5.3의 아세트산나트륨 3M의 1/10과 100% 에탄올 2가지 체적을 사용하여 침전시켰다. 침전된 DNA를 12,000xg에서 5분 동안 원심분리하여 펠릿화하였고, 이어서 70% 에탄올로 1회 세척하였다. 상기 펠릿을 공기건조하고 살균수 50μL에 재현탁하였다. NanoDropTM(ThermoFisher)를 사용하여 DNA 농도를 계산하고, 체적을 50μL 당 DNA 5μg으로 조절하였다.
살균수 169μL를 마이크로원심분리 관에 첨가하였다. 이어서 2M CaCl2 5μL를 물에 첨가하고, 피펫팅으로 부드럽게 혼합하였다. DNA 50μL를 CaCl2 수용액에 적가하였다. 이어서 2M CaCl2 26μL를 첨가하고, 마이크로피펫터로 2회 피펫팅하여 부드럽게 혼합하였다. 이와 같은 최종 용액은 0.25M CaCl2 250μL 중 DNA 5μg으로 이루어져야 한다. 이어서 2XHBS(Hepes 완충용액) 250μL를 함유한 제2 시험관을 준비하였다. Pipet-Aid에 부착된 2ml 살균 피펫을 사용하여, 2XHBS 용액에 천천히 공기방울을 주입하였다. 이와 동시에 0.25M CaCl2 용액 중 DNA 용액을 적가하였다. 최종 DNA 적가 후 약 5초 동안 공기방울 주입을 지속하였다. 이어서 상기 용액을 293A 세포에 첨가하기 전 최대 20분 동안 상온에서 배양하였다. 하루 전 6웰 플레이트에 웰당 106 세포 밀도로 시딩된 바 있는 293A 세포의 단일층에 DNA/인산칼슘 용액 250μL를 첨가하였다. 세포를 배양기에 수거하여 밤새 배양하였다. 24시간 후 배지를 교체하였다. 72시간 후, 세포를 6웰 플레이트에 1:6으로 나누었다. 세포병변(CPE)의 증거를 찾기 위해 단일층을 광현미경으로 매일 모니터링하였다. 형질주입 후 7~10일차에, 바이러스성 플라크를 관찰하였고, 웰에서 배지를 피펫팅하여 단일층을 수확함으로써 세포를 떠냈다. 수확된 세포 및 배지를 50ml 원심분리기 관에 이송하고, 이어서 동결-해동(-80℃ 및 37℃) 3주기를 실행하였다. 1차 바이러스 저장품이라고 불리는 차후 용해물을 벤치톱 원심분리기에서 최대속도(4300Xg)로 원심분리하여 청징하고, 용해물의 일부분(10~50%)을 사용하여 T25 플라스크에서 293A 세포를 감염시켰다. 완전한 CPE에서 세포 및 배지를 수확하기 전 48시간 동안 감염된 세포를 배양하였다. 세포를 다시 한 번 수확하고, 동결해동하고 청징한 후, 수득된 2차 바이러스성 저장품을 사용하여 플라스크 당 1.5x 107 세포로 시딩된 T150 플라스크를 감염시켰다. 72시간에 완전한 CPE를 달성하면, 배지 및 세포를 수확하고 이전 바이러스성 저장품에 그리하였듯이 처리하여 3차 저장품을 생성하였다.
293F 세포에서 생산
8% C02의 배양기 중 293 FreeStyleTM(ThermoFisher) 배지에서 성장한 293F 세포에서 ChAdV68 바이러스 생산을 실행하였다. 감염 당일에, 세포를 98% 생존능으로 ml 당 106 세포로 희석하고, 1L 진탕 플라스크(Corning)에서 생산량당 400ml를 사용하였다. 1회 감염당 표적 MOI가 >3.3인 3차 바이러스성 저장품 4ml를 사용하였다. 트리판 블루로 측정된 생존능이 <70%이 될 때까지 48~72시간 동안 세포를 배양하였다. 이어서 원심분리(벤치톱 원심분리, 전속력)로 감염된 세포를 수확하고, 1XPBS에서 세척하고, 다시 원심분리하고, 이어서 10mM Tris(pH7.4) 20ml에서 재현탁하였다. 동결해동 3X하여 세포 펠릿을 용해하고, 5분간 4,300Xg로 원심분리하여 청징하였다.
CsCl 원심분리에 의한 정제
바이러스성 DNA를 CsCl 원심분리에 의해 정제하였다. 2회 불연속 구배 운행을 실행하였다. 첫번째는 세포 구성요소에서 바이러스를 정제하기 위해, 두번째는 세포 구성요소에서 분리를 추가적으로 개선하여 감염성 입자에서 불량을 분리하기 위해 실행하였다.
1.2(10 mM Tris(pH 8.0) 92ml 중에 용해된 26.8g CsCl) CsCl 10ml를 폴리알로머 관에 첨가하였다 이어서 1.4 CsCl(10 mM Tris(pH 8.0) 87ml 중에 용해된 53g CsCl) 8ml를 피펫 전달을 사용하여 상기 관의 바닥에 조심스럼게 첨가하였다. 청징된 바이러스를 1.2 층의 상부에 조심스럽게 적층하였다. 필요한 경우, 시험관의 균형을 맞추기 위해 10 mM Tris를 좀 더 첨가하였다. 이어서 상기 시험관을 SW-32Ti 회전자에 넣고, 10℃에서 2시간 30분 동안 원심분리하였다. 그러고 나서, 시험관을 제거하여 층류(laminar flow) 캐비닛으로 옮기고, 18게이지 바늘과 10ml 주사기를 사용하여 바이러스 밴드를 뽑아냈다. 오염성 숙주 세포 DNA 및 단백질을 제거하지 않도록 주의를 기울였다. 이어서 상기 밴드를 10 mM Tris(pH 8.0)로 적어도 2X 희석하고, 앞서 기술한 바와 같이 불연속 구배 상에서 앞서와 같이 적층하였다. 앞서 기술된 바와 같이 운행하였는데, 단 이번에는 밤새 운행하였다. 다음날, 결함이 있는 입자 밴드 중 어떤 것이라고 뽑아내는 것을 피하기 위해 조심스럽게 밴드를 뽑아내었다. 이어서 Slide-a-LyzerTM 카세트(Pierce)를 사용하여 ARM 완충용액 (20 mM Tris pH 8.0, 25 mM NaCl, 2.5% 글리세롤)에 대해 바이러스를 여막분석하였다. 이것은 완충액 교환 시마다 1시간 동안 3회 실행하였다. 이어서 -80℃에서의 보관을 위해 바이러스를 분주하였다.
바이러스성 검사
OD260 nm에서 흡광도 값 1에 해당하는 1.1x 1012 바이러스성 입자(VP)의 흡광계수를 토대로 OD 260 검정법을 사용하여 VP 농축을 실행하였다. 바이러스성 용해 완충액(0.1% SDS, 10 mM Tris pH 7.4, 1mM EDTA) 중 아데노바이러스 희석액 2개(1:5 및 1:10)를 제조하였다. 양쪽 희석액에서 이중으로 OD를 측정하였고, ml당 VP 농도는 OD260 값 X 희석 인자 X 1.1x 1012VP의 곱셈으로 측정하였다.
바이러스성 저장품의 희석액 검정법을 제한함으로써 감염 단위(IU) 역가를 계산하였다. 상기 바이러스를 처음에 DMEM/5% NS/ 1X PS에서 100X로 희석하고, 이어서 차후에 10배 희석액을 사용하여 1x 10-7로 희석하였다. 이와 같은 희석액 100μL를 이어서 24웰 플레이트에 웰당 3e5 세포의 밀도로 적어도 한 시간 전에 시딩된 293A 세포에 첨가하였다. 이것은 이중으로 실행하였다. 플레이트를 37℃의 CO2(5%) 배양기에서 48시간 동안 배양하였다. 이어서 세포를 1XPBS로 세척하고, 이후 100% 냉 메탄올(-20℃)로 고정하였다. 그러고 나서, 플레이트를 최소한 20분 동안 -20℃에서 배양하였다. 웰들을 1XPBS로 세척한 후, 실온에서 1시간 동안 1XPBS/0.1% BSA에 가둬 두었다. 토끼 항-Ad 항체(Abcam, Cambridge, MA)를 차단 완충액(웰당 0.25ml)에서 1:8,000의 희석으로 첨가하고, 1시간동안 실온에서 배양하였다. 웰들을 웰당 0.5ml PBS로 4회 세척하였다. 1000배 희석된 HRP 접합된 염소 항-토끼 항체(Bethyl Labs, Montgomery Texas)를 웰당 첨가하고, 최종 세척 이전에 1시간 동안 배양하였다. PBS 세척 5회 실행하였고, 플레이트를 0.01% H2O2을 함유한 Tris 완충 식염수(50 mM Tris(pH 7.5) 중 DAB 0.67mg/mL, 150 mM NaCl) 중 DAB(디아미노벤지딘 테트라히드로클로라이드) 기질을 사용하여 전개시켰다. 개체수를 계산하기 전 5분 동안 웰을 전개시켰다. 시야각 당 4~40개 염색된 세포를 제공하는 희석액을 사용하여 10배 대물렌즈 하에서 세포의 개수를 세었다. 사용한 시야각은 24웰 플레이트 상의 시야각 당 625와 동일한 0.32 mm2의 격자였다. Ml당 감염성 바이러스의 개수는 희석 인자 10을 곱하고, 시야각당 격자의 개수를 격자당 염색된 세포의 수에 곱함으로써 결정될 수 있다. 이와 유사하게, GFP 발현 세포를 가지고 작업할 때, 로 작용할 때, ml 당 GFP 발현 비리온의 개수를 계산하기 위해 캡시드 염색보다 형광이 사용될 수 있다.
면역화
C57BL/6J 암컷 마우스 및 Balb/c 암컷 마우스에 100uL 체적당 ChAdV68.5WTnt.MAG25mer 1x108 바이러스성 입자(VP)를 쌍방의 근육내 주사(다리 당50uL)로 주입하였다.
비장세포 분리
각 마우스의 비장 및 림프절을 완전한 RPMI(RPMI, 10% FBS, 페니실린/스트렙토마이신) 3mL에 모았다. 제조업체의 프로토콜에 따라, gentleMACS 분리기(Miltenyi Biotec)를 사용하여 기계적 분리를 실행하였다. 분리된 세포를 40 마이크론 여과막을 통해 여과하고, 적혈구 세포를 ACK 용해 완충액(150mM NH4Cl, 10mM KHCO3, 0.1mM Na2EDTA)으로 용해하였다. 세포를 다시 한 번 30 마이크론 여과막을 통해 여과하고, 완전한 RPMI에 재현탁하였다. 프로피디움 아이오다이드 염색을 사용하여 죽은 세포 및 세포사멸적 세포를 제외시켜서 Attune NxT 유세포분석기(Thermo Fisher) 상에서 세포의 개수를 세었다. 이어서 추후 분석을 위해 생 세포의 적합한 농도로 조절하였다.
체외 효소-연결 면역점(ELISPOT) 분석
마우스 IFNg ELISpotPLUS 키트(MABTECH)로 ELISPOT 조화 지침{DOI: 10.1038/nprot.2015.068}에 따라 ELISPOT 분석을 실행하였다. 5x104 비장세포를 96-웰 IFNg 항체 도포 플레이트에서 16시간 동안 지시된 펩티드 10uM와 함께 배양하였다. 알칼린 포스파타아제를 사용하여 점(spot)들을 전개하였다. 10분 동안 반응을 일으키고, 흐르는 수돗물로 플레이트를 씻어 반응을 종료하였다. AID vSpot 판독 스펙트럼을 사용하여 점들의 개수를 세었다. ELISPOT 분석의 경우, 포화도가 >50%인 웰들은 “너무 많아서 셀 수 없음”으로 기록하였다. 복제 웰의 편차가 >10%인 샘플들은 분석에서 제외시켰다. 이어서 하기 식을 사용하여 웰 충만도에 대해 점 개수를 보정하였다: 점 개수+2 x(점 개체수 x %충만도 /[100% ~ %충만도]). 항원 자극된 웰에서 음성 펩티드 자극 웰의 점 개수를 차감하여 음성 배경을 보정하였다. 마지막으로, 너무 많아서 셀 수 없음이라고 표지된 웰은 가장 가까운 100단위로 반올림된 최고 관찰 보정값으로 설졍하였다.
XV.B.2. DNA 형질주입 후 ChAdV68 바이러스성 전달 입자의 생산
일 실시예에서, ChAdV68.4WTnt.GFP(도 7) 및 ChAdV68.5WTnt.GFP(도 8) DNA를 HEK293A 세포에 형질주입하고, 형질주입 후 7~10일차에 바이러스 복제(바이러스성 플라크)를 관찰하였다. 광현미경 (도 7a 및 8a) 및 형광현미경(도 7b~c 및 도 8b~c)를 사용하여 ChAdV68 바이러스성 플라크를 시각화하였다. GFP는 생산적인 ChAdV68 바이러스성 전달 입자 생산을 의미한다.
XV.B.3. ChAdV68 바이러스성 전달 입자 팽창
일 실시예에서, ChAdV68.4WTnt.GFP, ChAdV68.5WTnt.GFP, 및 ChAdV68.5WTnt.MAG25mer 바이러스를 HEK293F 세포에서 팽창시키고, 형질주입 후 18일차에 정제된 바이러스 저장품을 생산하였다(도 9). 정제된 ChAdV68 바이러스 저장품에서 바이러스성 입자를 정량화하고, 동일한 프로토콜을 사용하여 생산된 아데노바이러스 유형 5(Ad5) 및 ChAdVY25(밀접하게 관련된 ChAdV; Dicks, 2012, PloS ONE 7, e40385) 바이러스성 저장품과 비교하였다. ChAdV68 바이러스성 역가는 Ad5 및 ChAdVY25와 견줄 만 했다 (표 7).
표 7: 293F 현탁 세포에서 아데노바이러스 벡터 생산
Figure pct00019
*SD는 다중 생산 운행이 이루어지는 곳으로 단지 보고됨
XV.B.4. 종양 모형에서 면역원성의 평가
마우스 면역원성 연구에서 마우스 종양 항원을 발현하는 C68 벡터를 평가하여, C68 벡터가 T-세포 반응을 유발함을 입증하였다. MHC 부류 I 에피토프 SIINFEKL에 대한 T-세포 반응을 C57BL/6J 암컷 마우스에서 측정하였고, MHC 부류 I 에피토프 AH1-A5(Slansky et al., 2000, Immunity13:529-538)에 대해서 Balb/c 마우스에서 측정하였다. 도 15에 도시된 바와 같이, ChAdV68.5WTnt.MAG25mer 보유 마우스의 면역화 이후, 대조군에 비해 강한 T-세포 반응을 측정하였다. C57BL/6J 또는 Balb/c 마우스를 were immunized with ChAdV68.5WTnt.MAG25mer로 각각 면역화하였을 때, 면역화 후 10일차에 106 비장세포당 8957 또는 4019 점 형성 세포(SFC)의 평균 세포 면역 반응을 ELISpot 검정에서 관찰하였다.
CT26 종양 모델에서 종양 침윤 림프구를 또한 평가하여, ChAdV 및 항-CTLA4 항체의 공동-투여를 평가하였다. 마우스에 CT26 종양 세포를 이식하고, 이식 7일 후 ChAdV 백신으로 면역화하고, 항-CTLA4 항체 (클론 9D9) 또는 IgG (대조군)로 처리하였다. 종양 침윤 림프구를 면역화 12일 후 분석하였다. 각각의 마우스로부터의 종양을 gentleMACS 해리기 (Miltenyi Biotec) 및 마우스 종양 해리 키트 (Miltenyi Biotec)를 사용하여 해리시켰다. 해리된 세포를 30 마이크론 필터를 통해 여과하고, 완전 RPMI 중에 재현탁시켰다. 프로피디움 아이오다이드 염색을 사용하여 죽은 세포 및 세포사멸적 세포를 제외시켜서 Attune NxT 유동 세포계측기 (Thermo Fisher) 상에서 세포를 카운팅하였다. 이어서, 세포를 후속 분석을 위해 생 세포의 적절한 농도로 조정하였다. 항원 특이적 세포를 MHC-사량체 복합체에 의해 동정하고, 항-CD8 및 생존능 마커로 공동-염색하였다. 종양을 면역화 12일 후 수확하였다.
종양 내의 항원-특이적 CD8+ T 세포 세포는, 각각 ChAdV, 항-CTLA4, 및 ChAdV+항-CTLA4 처리 그룹에서 총 생 세포 집단의 3.3%, 2.2%, 또는 8.1%의 중간값을 구성하였다 (도 44 및 표 36). 활성 ChAdV 면역화와 조합된 항-CTLA로의 처리는 ChAdV 단독 및 항-CTLA4 단독 둘 다에 비해 항원-특이적 CD8+ T 세포 빈도에서 통계적으로 유의한 증가를 제공하였고, 이는 항-CTLA4가, chAd68 백신과 공동-투여시, 종양 내의 침윤 T 세포의 수를 증가시켰음을 입증한다.
표 36 - CT26 종양에서 사량체+ 침윤 CD8 T 세포 빈도
Figure pct00020
XVI. 알파바이러스 항원 카세트 전달 벡터
XVI.A. 알파바이러스 전달 벡터 평가 물질 및 방법
RNA를 생성하기 위한 시험관내 전사
시험관내 시험의 경우: PmeI로의 제한 소화에 의해 플라스미드 DNA를 선형화하고, 제조업체의 프로토콜(GeneJet DNA 정화 키트, Thermo)에 따라 컬럼을 정제하고 템플레이트로 사용하였다. 제조업체의 프로토콜에 따라 m7G 캡 유사체(Promega)를 소유한 RiboMAX 대규모 RNA 생산 시스템(Promega)을 사용하여 시험관내 전사를 실행하였다. 제조업체의 프로토콜에 따라 RNeasy 키트(Qiagen)를 사용하여 mRNA를 정제하였다.
생체내 연구의 경우: TriLInk Biotechnologies에 의해 RNA를 생성 및 정제하였고, 효소 Cap1로 끝을 덮었다.
RNA의 형질주입
형질주입 약 16시간 전에 96웰에는 6e4 세포/웰로, 24웰에는 2e5 세포/웰로 HEK293A 세포를 시딩하였다. MessengerMAX 리포펙타민(Invitrogen)을 사용하여, 제조업체의 프로토콜에 따라, mRNA를 세포에 형질주입하였다. 96웰의 경우, 웰당 리포펙타민 0.15uL 및 mRNA 10ng을 사용하였고, 24웰의 경우 리포펙타민 0.75uL 및 mRNA 150ng을 사용하였다. GFP 발현 mRNA(TriLink Biotechnologies)을 형질주입 대조군으로 사용하였다.
루시퍼라제 검정법
제조업체의 프로토콜에 따라 ONE-Glo 루시퍼라제 검정법(Promega)을 사용하여 각 조건을 삼중으로 백색벽 96-웰 플레이트에서 루시퍼라제 리포터 검정법을 실행하였다. SpectraMax를 사용하여 발광을 측정하였다.
qRT-PCR
형질주입된 세포를 세정하고, 형질주입 2시간 후 신선한 배지를 교체하여 임의의 형질주입이 되지 않은 mRNA를 제거하였다. 이어서 모든 경우에 제조업체의 프로토콜에 따라, RLT+용해 완충액(Qiagen)에서 다양한 시점에 세포를 수확하고, QiaShredder(Qiagen)를 사용하여 균질화하고, RNeasy 키트(Qiagen)를 사용하여 RNA를 추출하였다. Nanodrop(Thermo Scientific)을 사용하여 총 RNA를 정량화하였다. 제조업체의 프로토콜에 따라 qTower3(Analytik Jena) 상에서 Quantitect 프로브 원스텝 RT-PCR 키트(Qiagen)를 사용하여, 1회 반응당 총 RNA 20ng을 사용하여 qRT-PCR를 실행하였다. 각 샘플을 각 프로브에 대해 3중으로 운행하였다. 액틴 또는 GusB를 참조 유전자로 사용하였다. 맞춤형 프라이머/프로브를 IDT로 생성하였다(표 8).
표 8. qPCR 프라이머/프로브
Figure pct00021
B16-OVA 종양 모형
C57BL/6J 마우스의 좌측 하부 옆구리에 동물개체당 105 B16-OVA 세포를 주입하였다. 종양은 면역화 전 3일 동안 성장하도록 허용하였다.
CT26 종양 모델
Balb/c 마우스의 좌측 하부 옆구리에 동물개체당 106 CT26 세포를 주입하였다. 종양은 면역화 전 7일 동안 성장하도록 허용하였다.
면역화
srRNA 백신의 경우, 마우스에 양측 근육내 주사로 100uL 체적 중 RNA 10ug을 주입하였다(다리 당 50uL). Ad5 백신의 경우, 마우스에 양측 근육내 주사로 100uL 체적 중 5x1010 바이러스성 입자(VP)를 주입하였다(다리 당 50uL). 동물에 250ug의 용량으로 1주에 2회씩, 복강내 주사를 통해 항-CTLA-4(클론 9D9, BioXcell), 항-PD-1(클론 RMP1-14, BioXcell) 또는 항-IgG(클론 MPC-11, BioXcell)을 주입하였다.
생체내 생물발광 영상화
각 시점에, 마우스에 복강내 주사를 통해 루시페린 기질 150mg/kg을 주입하고, 주입 후 10~15분 지나서 IVIS 생체내 영상화 시스템(PerkinElmer)을 사용하여 생물발광을 측정하였다.
비장세포 분리
각 마우스의 비장 및 림프절을 완전한 RPMI(RPMI, 10% FBS, 페니실린/스트렙토마이신) 3ml에 모았다. 제조업체의 프로토콜에 따라 gentleMACS 분리기(Miltenyi Biotec)를 사용하여 기계적 분리를 실행하였다. 분리된 세포를 40 마이크론 여과막을 통해 여과하고, 적혈구 세포를 ACK 용해 완충액(150mM NH4Cl, 10mM KHCO3, 0.1mM Na2EDTA)으로 용해하였다. 세포를 다시 한 번 30 마이크론 여과막을 통해 여과하고, 이어서 완전한 RPMI에 재현탁하였다. 프로피디움 아이오다이드 염색을 사용하여 죽은 세포 및 세포사멸적 세포를 제외하고, Attune NxT 유세포분석기(Thermo Fisher) 상에서 세포의 수를 세었다. 이어서 세포를 추후 분석을 위한 생 세포의 적절한 농도로 조절하였다.
생체외 효소-연결 면역점(ELISPOT) 분석
마우스 IFNg ELISpotPLUS 키트(MABTECH)로 ELISPOT 조화 지침 {DOI: 10.1038/nprot.2015.068}에 따라 ELISPOT 분석을 실행하였다. 5x104 비장세포를 96-웰 IFNg 항체 도포 플레이트에서 16시간 동안 명시된 펩티드 10uM와 함께 배양하였다. 알칼린 포스파타아제를 사용하여 점들을 전개시켰다. 반응시간은 10분으로 설정하였고, 플레이트를 수돗물로 씻어 내리면서 반응을 종료하였다. AID vSpot 판독 스펙트럼을 사용하여 점들의 개수를 세었다. ELISPOT 분석의 경우, 포화도가 >50%인 웰은 “너무 많아서 셀 수 없음”으로 기록하였다. 복제 웰의 편차가 > 10%인 샘플은 분석에서 제외시켰다. 이어서 하기 식을 사용하여 점 개수를 웰 충만도에 대해 보정하였다: 점 개수+2 x(점 개수 x %충만도 /[100% - %충만도]). 항원 자극된 웰에서 음성 펩티드 자극 웰 중 점 개수를 차감함으로써, 음성 배경을 보정하였다. 마지막으로, 너무 많아서 셀 수 없음으로 표지된 웰은 최고 관찰된 보정값으로 설정하여 가장 가까운 백단위로 반올림하였다.
XVI.B. 알파바이러스 벡터
XVI.B.1. 알파바이러스 벡터 시험관내 평가
본 발명의 일 실현예에서, 항원 발현 시스템용 RNA 알파바이러스 백본을 Venezuelan Equine Encephalitis(VEE)(Kinney, 1986, Virology 152:400-413)-기반 자기복제 RNA(srRNA) 벡터에서 생산하였다. 일 실시예에서, 26S 하위게놈 프로모터의 VEE 위치 3'의 구조적 단백질을 인코딩하는 서열이 결손되었고(VEE 서열 7544 내지 11,175이 결손됨; Kinney 등 1986 토대로 번호 매기기; 서열 번호: 6), 항원 서열(서열 번호: 14 및 서열 번호: 4) 또는 루시퍼라제 리포터(예를 들어, VEE-루시퍼라제, 서열 번호: 15)(도 10)로 대체되었다. 시험관내에서 RNA를 srRNA DNA 벡터에서 전사하고, HEK293A 세포로 형질주입하고, 루시퍼라제 리포터 발현을 측정하였다. 이와 더불어, 루시퍼라제를 인코딩하는 (비복제형) mRNA를 비교를 위해 형질주입하였다. 23시간 측정 대 2시간 측정을 비교하였을 때, VEE-루시퍼라제 srRNA의 경우, srRNA 리포터 신호의 약 30,000배 증가를 관찰하였다(표 9). 반면에, mRNA 리포터는 동일한 시간에 걸쳐 10배 미만의 신호 증가를 나타내었다(표 9).
표 9. VEE 자기복제 벡터에서 루시퍼라제의 발현이 시간 경과에 따라 증가한다. 96웰에서 웰당 VEE-루시퍼라제 srRNA 10ng 또는 비복제 루시퍼라제 mRNA(TriLink L-6307) 10ng이 형질주입된 HEK293A 세포. 형질주입 후 여러 시간에 발광을 측정하였다. 루시퍼라제 발현이 상대적 발광 유닛(RLU)으로 보고된다. 각 데이터 포인트는 3개의 형질주입된 웰의 평균 +/- SD이다.
Figure pct00022
또 다른 실시예에서, 정량적 역전사 폴리머라아제 연결반응 (qRT-PCR)을 사용하여, 루시퍼라제-인코딩 srRNA(VEE-루시퍼라제) 또는 다중-에피토프 카세트(VEE-MAG25mer)를 인코딩하는 srRNA 중 하나의 형질주입 후 RNA 수준을 측정함으로써, srRNA의 복제를 직접적으로 확인하였다. VEE-루시퍼라제 srRNA의 경우 RNA의 약 150배 증가를 관찰한 반면(표 10), VEE-MAG25mer srRNA의 경우 RNA의 30~50배 증가를 관찰하였다(표 11). 이와 같은 데이터는 세포에 형질주입된 경우 VEE srRNA 벡터가 복제됨을 확인하여 준다.
표 10. VEE-루시퍼라제 srRNA 형질주입된 세포에서 RNA 복제의 직접적 측정. VEE-루시퍼라제 srRNA(24웰, 웰당 150ng)가 형질주입된 HEK293A 세포 및 형질주입 후 여러 시점에 qRT-PCR에 의해 정량화된 RNA 수준. 각 측정값은 액틴 참조 유전자를 토대로 정규화하였고, 2시간 시점 대비 배수변화가 나타난다.
Figure pct00023
표 11. VEE-MAG25mer srRNA 형질주입된 세포에서 RNA 복제의 직접적인 측정. VEE-MAG25mer srRNA(24-웰, 웰당 150ng)로 형질주입된 HEK293 세포 및 형질주입 후 여러 시점에 qRT-PCR로 정량화된 RNA 수준. 각 측정값은 GusB 참조 유전자를 토대로 정규화하였고, 2시간 시점 대비 배수 변화가 나타났다. 그래프 상의 상이한 선들은 2개의 상이한 qPCR 프라이머/프로브 세트들을 나타내고, 이들은 모두 srRNA의 에피토프 카세트 구역을 검출한다.
Figure pct00024
XVI.B.2. 알파바이러스 벡터 생체내 평가
또 다른 실시예에서, VEE-루시퍼라제 리포터 발현을 생체내에서 평가하였다. 지질 나노입자(MC3)에 캡슐화된 VEE-루시퍼라제 srRNA 10ug를 마우스에 주입하고, 주사 후 그리고 24 시간 및 48시간, 7일 및 14일에 영상촬영을 하여, 생물발광 신호를 결정하였다. 주사 후 24시간에 루시퍼라제 신호를 검출하였고, 신호는 시간 경과에 따라 증가하였으며, srRNA 주사 후 7일차에 최고치에 도달하는 것으로 나타났다 (도 11).
XVI.B.3. 알파바이러스 벡터 종양 모형 평가
일 실현예에서, VEE srRNA 벡터가 생체내에서 항원-특이적 면역 반응을 지시하는 지 여부를 판단하기 위해, 2가지 상이한 MHC 부류 I 마우스 종양 에피토프, SIINFEKL 및 AH1-A5(Slansky et al., 2000, Immunity 13:529-538)를 발현하는 VEE srRNA 벡터(VEE-UbAAY, 서열 번호: 14)를 생성하였다. B16-OVA 흑색종 세포주로 SFL(SIINFEKL) 에피토프를 발현하고, AH1-A5(SPSYAYHQF; Slansky et al., 2000, Immunity) 에피토프는 CT26 결장암 세포주에 의해 발현되는 T 세포 표적화 관련 에피토프(AH1/ SPSYVYHQF; Huang et al., 1996, Proc Natl Acad Sci USA 93:9730-9735)를 유도한다. 일 실시예에서, 생체내 연구의 경우, T7 폴리머라아제(TriLink Biotechnologies)를 사용하여 시험관내 전사에 의해 VEE-UbAAY srRNA를 생성하였고, 지질 나노입자(MC3)에 캡슐화하였다.
MC3 제형화된 VEE-UbAAY srRNA로 B16-OVA 종양 보유 마우스의 면역화 후 2주차에 대조군에 비해 SFL를 표적화하는 강력한 항원-특이적 T-세포 반응을 관찰하였다. 일 실시예에서, 106 비장세포당 3835 점 형성 세포(SFC)의 중간값을 ELISpot 검정법에서 SFL 펩티드로 자극 후 측정하였고(도 12a, 표 12), CD8 T-세포의 1.8%(중간값)은 오량체 염색에 의해 측정된 바와 같이 SFL 항원-특이적이었다(도 12b, 표 12). 또 다른 실시예에서, 항-CTLA-4 단클론 항체(mAb)와 VEE srRNA 백신의 공동투여가 전반적인 T-세포 반응에서 완만한 증가를 초래하였다(106 비장세포 당 4794.5 SFCs의 중간값을 ELISpot 검정법에 측정하였다)(도 12a, 표 12).
표 12: B16-OVA 종양 보유 C57BL/6J 마우스에서 VEE srRNA 면역화 후 14일 차에 ELISPOT 및 MHCI-오량체 염색 검정법의 결과.
Figure pct00025
* 주의: Vax 그룹에서 그룹 마우스 #6 의 결과는 3중 웰들 사이에서 높은 가변성으로 인해 분석에서 제외시켰다.
또 다른 실현예에서, 임상적 접근방법을 반영하기 위해, B16-OVA 및 CT26 마우스 종양 모형에서 비상동 프라임/부스트를 실행하였는데, 종양 보유 마우스를 우선 동일한 항원 카세트(Ad5-UbAAY)를 발현하는 아데노바이러스성 벡터로 면역화하고, 뒤이어서 Ad5-UbAAY 프라임 후 14일차에 VEE-UbAAY srRNA 백신으로 부스트 면역화를 실행하였다. 일 실시예에서, Ad5-UbAAY 백신으로 항원-특이적 면역 반응을 유도하였고, 그 결과 ELISpot 검정법에 측정된 106 비장세포 당 7330(중간값) SFC (도 13a, 표 13) 및 오량체 염색(도 13c, 표 13)에 의해 측정된 바와 같이 SFL 항원을 표적화하는 CD8 T-세포의 2.9%(중간값)을 수득하였다. 또 다른 실시예에서, ELISpot 검정법에서 측정한 106 비장세포당 3960(중간값) SFL-특이적 SFC(도 13b, 표 13) 및 오량체 염색에 의해 측정된 바와 같이 SFL 항원을 표적화하는 CD8 T-세포의 3.1%(중간값)(도 13d, 표 13)을 갖는 B16-OVA 모형에서 VEE-UbAAY srRNA 부스트 후 2주차에도 T-세포 반응을 유지하였다.
표 13: Ad5 백신 프라임 및 srRNA 부스트로 비상동 프라임/부스트에 따른 B16-OVA 마우스의 면역 모니터링.
Figure pct00026
Figure pct00027
또 다른 실현예에서, CT26 마우스 모형에서 Ad5-UbAAY 프라임 및 VEE-UbAAY srRNA 부스트 이후 유사한 결과를 관찰하였다. 일 실시예에서, Ad5-UbAAY 프라임(14일차) 후 ELISpot 검정법에서 측정된 106 비장세포당 평균 5187 SFC(도 14a, 표 14)를 갖고, VEE-UbAAY srRNA 부스트(28일차) 후 ELISpot 검정법에서 측정한 106 비장세포당 3799 SFC (도 14b, 표 14)를 갖는 AH1 항원-특이적 반응을 관찰하였다. 표 14: CT26 종양 마우스 모형에서 비상동 프라임/부스트 후 면역 모니터링
Figure pct00028
XVII. ChAdV/srRNA 조합 종양 모형 평가
ChAdV68 및 자기복제 RNA(srRNA)를 사용한 다양한 복용 프로토콜을 쥣과 CT26 종양 모형에서 평가하였다.
XVII.A ChAdV/srRNA 조합 종양 모형 평가 방법 및 재료
종양 주입
Balb/c 마우스에 CT26 종양 세포주를 주입하였다. 종양 세포 주입 후 7일차에, 마우스를 상이한 연구 부문으로 무작위로 뽑았고(그룹 당 28~40마리 마우스), 치료를 개시하였다. Balb/c 마우스의 좌측 하부 옆구리에 동물개체당 106 CT26 세포를 주입하였다. 면역화 전 7일 동안 종양이 성장하도록 허용하였다. 연구 부분은 표 15에 상세히 기술되어 있다.
표 15: ChAdV/srRNA 조합 종양 모형 평가 연구 부문
Figure pct00029
면역화
srRNA 백신의 경우, 마우스에 100uL 체적, 양측 근육내 주사(다리 당 50uL)로 VEE-MAG25mer srRNA 10ug을 주입하였다. C68 백신의 경우, 마우스에 100uL 체적, 양측 근육내 주사(다리 당 50uL)로 ChAdV68.5WTnt.MAG25mer의 1x1011 바이러스성 입자(VP)를 주입하였다. 동물개체에 복강내 주사를 통해 1주에 1회, 250ug 용량으로 항-PD-1(클론 RMP1-14, BioXcell) 또는 항-IgG(클론 MPC-11, BioXcell)를 주입하였다.
비장세포 분리
각 마우스의 비장 및 림프절을 완전한 RPMI(RPMI, 10% FBS, 페니실린/스트렙토마이신) 3ml에 모았다. 제조업체의 프로토콜에 따라 gentleMACS 분리기(Miltenyi Biotec)를 사용하여 기계적 분리를 실행하였다. 분리된 세포를 40 마이크론 여과막을 통해 여과하고, 적혈구를 ACK 용해 완충액(150mM NH4Cl, 10mM KHCO3, 0.1mM Na2EDTA)으로 용해하였다. 세포를 다시 30 마이크론 여과막을 통해 여과하고, 이어서 완전한 RPMI에 재현탁하였다. 프로피디움 아이오다이드 염색을 사용하여 죽은 세포 및 세포사멸적 세포를 제외시키고, Attune NxT 유세포분석기(Thermo Fisher) 상에서 세포의 개수를 세었다. 이어서, 추후 분석을 위해 생 세포의 적합한 농도로 세포를 조절하였다.
생체외 효소-연결 면역점(ELISPOT) 분석
마우스 IFNg ELISpotPLUS 키트(MABTECH)로 ELISPOT 조화 지침 {DOI: 10.1038/nprot.2015.068}에 따라 ELISPOT 분석을 실행하였다. 5x104 비장세포를 96-웰 IFNg 항체 도포 플레이트에서 16시간 동안 명시된 펩티드 10uM과 함께 배양하였다. 알칼린 포스파타아제를 사용하여 점들을 전개시켰다. 반응 시간을 10분으로 정하고, 수돗물로 씻어내어 반응을 종료하였다. AID vSpot 판독 스펙트럼을 사용하여 점 개수를 세었다. ELISPOT 분석의 경우, 포화도가 >50%인 웰은 "너무 많아서 셀 수 없음"으로 기록하였다. 복제 웰의 편차가 >10%인 샘플들은 분석에서 제외시켰다. 이어서 하기 식을 사용하여 점 개수를 웰 충만도에 대해 보정하였다: 점 개수+2 x(점 개수 x %충만도 /[100% - %충만도]). 항원 자극된 웰에서 음성 펩티드 자극 웰 중 점 개수를 차감하여 음성 배경을 보정하였다. 마지막으로, 너무 많아서 셀 수 없음으로 표지된 웰은 최고 관찰 보정값으로 설정하고, 가장 가까운 백단위로 반올림된다.
XVII.B CT26 종양 모형에서 ChAdV/srRNA 조합 평가
ChAdV68.5WTnt.MAG25mer/ VEE-MAG25mer srRNA 비상동 프라임/부스트 또는 VEE-MAG25mer srRNA 상동 프라임/부스트 백신의 면역원성 및 효능을 CT26 마우스 종양 모형에서 평가하였다. Balb/c 마우스에 CT26 종양 세포주를 주입하였다. 종양 세포 주입 7일 후, 상이한 연구 부문으로 마우스를 무작위 추출하였고 및 치료를 개시하였다. 연구 부문은 표 15에 상세히 기술되고, 표 16에 좀 더 일반적으로 기술된다.
표 16: 프라임/부스트 연구 부문
Figure pct00030
면역 모니터링을 위해 프라임 백신접종 14일 후 비장을 수확하였다. 종양 및 체중 측정을 1주에 두 번씩 실행하고, 생존율을 모니터링하였다. 모든 활성 백신 그룹에서 대조군에 비해 강력한 면역 반응을 관찰하였다.
첫번째 면역화 후 14일차에, 각각 ChAdV68.5WTnt.MAG25mer(ChAdV/그룹 3), ChAdV68.5WTnt.MAG25mer+항-PD-1(ChAdV+PD-1/그룹 4), VEE-MAG25mer srRNA(srRNA/ 그룹 5 & 7 조합에 대한 중간값), 또는 VEE-MAG25mer srRNA+항-PD-1(srRNA+PD-1/그룹 6 & 8 조합에 대한 중간값)으로 면역화한 마우스에서, ELISpot 검정법 결과, 106 비장세포당 10,630, 12,976, 3319, 또는 3745 점 형성 세포s(SFCs)의 중간값 세포 면역 반응을 관찰하였다(도 16 및 표 17). 대조적으로, 백신 대조군(그룹 1) 또는 항-PD-1의 백신 대조군(그룹 2)은 106 비장세포당 각각 296 또는 285 SFC의 중간값 세포 면역 반응을 나타내었다.
표 17: CT26 종양 모형에서 세포 면역 반응
Figure pct00031
ELISpot 데이터와 일관되게, 첫 번째 면역화 후 14일 차에 ChAdV68.5WTnt.MAG25mer(ChAdV/그룹 3), ChAdV68.5WTnt.MAG25mer+항-PD-1(ChAdV+PD-1/그룹 4), VEE-MAG25mer srRNA(srRNA/ 그룹 5 & 7 조합에 대한 중간값), 또는 VEE-MAG25mer srRNA+항-PD-1(srRNA+PD-1/ 그룹 6 & 8 조합에 대한 중간값)으로 각각 면역화한 마우스에 대한 세포내 사이토킨 염색(ICS) 분석에서, CD8 T 세포의 5.6, 7.8, 1.8 또는 1.9%(중간값)은 항원-특이적 반응을 나타내었다(도 17 및 표 18). 상기 백신 대조군 또는 항-PD-1과 조합된 백신 대조군으로 면역화된 마우스는 각각 0.2 및 0.1%의 항원-특이적 CD8 반응을 나타내었다.
표 18: CT26 종양 모형에서 CD8 T-세포 반응
Figure pct00032
모든 그룹의 CT26 결장 종양 모형에서 종양 성장을 측정하였고, 치료 개시 후 21일까지(CT-26 종양 세포의 주입 후 28일까지) 종양 성장이 제시한다. 큰 종양 크기(>2500 mm3)를 토대로 치료 개시 후 21일차에 마우스를 희생하였고; 따라서, 분석적 편견을 피하기 위해, 처음 21일만 제시하였다. 21일차의 평균 종양 체적은 ChAdV68.5WTnt.MAG25mer 프라임/ VEE-MAG25mer srRNA 부스트(그룹 3), ChAdV68.5WTnt.MAG25mer 프라임/ VEE-MAG25mer srRNA 부스트+항-PD-1(그룹 4), VEE-MAG25mer srRNA 프라임/ ChAdV68.5WTnt.MAG25mer 부스트(그룹 5), VEE-MAG25mer srRNA 프라임 / ChAdV68.5WTnt.MAG25mer 부스트+항-PD-1(그룹 6), VEE-MAG25mer srRNA 프라임/ VEE-MAG25mer srRNA 부스트(그룹 7) 및 VEE-MAG25mer srRNA 프라임/ VEE-MAG25mer srRNA 부스트+항-PD-1(그룹 8)의 경우, 각각 1129, 848, 2142, 1418, 2198 및 1606 mm3이었다(도 18 및 표 19). 백신 대조군 또는 항-PD-1와 조합된 백신 대조군에서 평균 종양 체적은 각각 2361 또는 2067 mm3이었다. 이와 같은 데이터를 토대로, ChAdV68.5WTnt.MAG25mer / VEE-MAG25mer srRNA(그룹 3), ChAdV68.5WTnt.MAG25mer / VEE-MAG25mer srRNA+항-PD-1(그룹 4), VEE-MAG25mer srRNA/ ChAdV68.5WTnt.MAG25mer+항-PD-1(그룹 6) 및 VEE-MAG25mer srRNA/ VEE-MAG25mer srRNA+항-PD-1(그룹 8)로의 백신 치료는 21일차에 종양 성장의 축소를 야기하였는데, 이것은 대조군(그룹 1)과 유의미하게 상이하였다.
표 19: CT26 모형에서 측정한 21일차 종양 크기
Figure pct00033
CT-26 종양 모형에서 치료 개시 후 35일 동안 생존율을 모니터링하였다(CT-26 종양 세포의 주입 후 42일 동안). 실험대상 4가지 조합으로 마우스에 백신 접종을 한 후, 생존율 향상을 관찰하였다. 백신접종 후, 항-PD-1와 조합한 ChAdV68.5WTnt.MAG25mer 프라임/ VEE-MAG25mer srRNA 부스트(그룹 4; 대조군 그룹 1 대비 P<0.0001), 항-PD-1과 조합한 VEE-MAG25mer srRNA 프라임/ VEE-MAG25mer srRNA 부스트(그룹 8; 대조군 그룹 1 대비 P=0.0006), ChAdV68.5WTnt.MAG25mer 프라임/ VEE-MAG25mer srRNA 부스트(그룹 3; 대조군 그룹 1 대비 P=0.0003) 및 항-PD-1과 조합한 VEE-MAG25mer srRNA 프라임/ ChAdV68.5WTnt.MAG25mer 부스트(그룹 6; 대조군 그룹 1 대비 P=0.0016 ) 각각의 경우에, 마우스의 64%, 46%, 41% 및 36%가 생존하였다(도 19 및 표 20). 생존율은 나머지 치료 그룹들, 예컨대 VEE-MAG25mer srRNA프라임/ ChAdV68.5WTnt.MAG25mer 부스트(그룹 5), VEE-MAG25mer srRNA 프라임/ VEE-MAG25mer srRNA 부스트(그룹 7) 및 항-PD-1 단독(그룹 2)의 경우 대조군 그룹 1(≤14%)과 유의미하게 다르지 않았다.
표 20: CT26 모형에서 생존율
Figure pct00034
결론적으로, ChAdV68.5WTnt.MAG25mer 및 VEE-MAG25mer srRNA는 대조군에 비해 상기 백신에 의해 인코딩된 마우스 종양 항원에 대한 강력한 T-세포 반응을 유발하였다. 종양 보유 마우스에 항-PD-1의 공동 투여가 있든 없든 ChAdV68.5WTnt.MAG25mer 프라임 및 VEE-MAG25mer srRNA 부스트의 투여, 항-PD-1와 조합한 VEE-MAG25mer srRNA 프라임 및 ChAdV68.5WTnt.MAG25mer 부스트의 투여, 또는 상동 프라임 부스트 면역화로서 항-PD-1과 조합한 VEE-MAG25mer srRNA의 투여가 생존율을 향상시켰다.
XVIII. 비인간 유인원 연구
ChAdV68 및 자기복제 RNA(srRNA)를 사용한 다양한 복용 프로토콜을 비인간 유인원(NHP)에서 평가하였다.
재료 및 방법
프라이밍 백신을 각 NHP에 근육 내 (IM) 주사하여 연구를 시작 하였다 (백신 프라임). 하나 이상의 부스팅 백신 (백신 부스트)도 각 NHP에 근육 내 주사되었다. 용량 당 양측 주사는 표에 요약되고 하기 요약된 그룹에 따라 투여되었다.
면역화
Mamu-A*01 인디언 붉은털 원숭이를 ChAdV68.5WTnt.MAG25mer의 1x1012 바이러스성 입자(주입 1회당 5x1011 바이러스성 입자), VEE-MAG25MER srRNA 30ug, LNP-1 또는 LNP-2로 제형화된 VEE-MAG25mer srRNA 100ug 또는 VEE-MAG25mer srRNA 300ug으로 양측으로 면역화하였다. 30 ug, 100 ug 또는 300 ug VEE-MAG25mer srRNA의 백신 부스트는 프라임 백신 접종 후 지시된 시간에 근육 내 투여되었다.
면역 모니터링
프라임 백신접종 후 지시된 시간에 림프구 분리 배지(LSM, MP Biomedicals) 및 LeucoSep 분리 시험관(Greiner Bio-One)을 사용하여 PBMC를 단리하고, 10% FBS 및 페니실린/스트렙토마이신를 함유한 RPMI에 재현탁하였다. 프로피디움 아이오다이드 염색을 사용하여 죽은 세포 및 세포사멸적 세포를 제외시키고 Attune NxT 유세포분석기(Thermo Fisher) 상에서 세포의 개수를 세었다. 그러고 나서, 추후 분석을 위해 생 세포의 적합한 농도로 세포를 조절하였다. 본 연구 중 각 원숭이에 대해, ELISpot 또는 유세포분석기 방법을 사용하여 T 세포 반응을 측정하였다. 생체외 효소-연결 면역점(ELISpot) 분석을 사용하여 사이토킨, 예컨대 IFN-감마의 유도를 측정함으로써, PBMCs에서 상기 백신에서 인코딩된 6가지 상이한 붉은털 원숭이 Mamu-A*01 부류 I 에피토프에 대한 T 세포 반응을 모니터링하였다. 원숭이 IFNg ELISpotPLUS 키트(MABTECH)로 ELISPOT 조화 지침 {DOI:10.1038/nprot.2015.068}에 따라 ELISpot 분석을 실행하였다. 200,000 PBMCs를 96-웰 IFNg 항체 도포 플레이트에서 16시간 동안 명시된 펩티드 10uM 와 함께 배양하였다. 알칼린 포스파타아제를 사용하여 점들을 전개시켰다. 상기 반응 시간을 10분으로 설정하고, 수돗물로 플레이트를 씻어서 반응을 종료시켰다. AID vSpot 판독기 스펙트럼을 사용하여 점의 개수를 세었다. ELISPOT 분석을 위해, 포화도가 >50%인 웰은 “너무 많아서 셀 수 없음”으로 기록하였다. 복제 웰의 편차가 > 10%인 샘플은 분석에서 제외시켰다. 그러고 나서, 하기 식을 사용하여 웰 충만도에 대해 점 개수를 보정하였다: 점 개수+2x(점 개수 x %충만도 /[100%~%충만도]). 항원 자극된 웰에서 음성 펩티드 자극 웰 중의 점 개수를 차감함으로써 음성 배경을 보정하였다. 마지막으로, 너무 많아서 셀 수 없음으로 표지가 된 웰을 최고 관찰 보정값으로 정하고, 가장 가까운 백단위로 반올림하였다.
유세포분석기를 사용하여 세포내 사이토킨, 예컨대 IFN-감마의 유도를 측정함으로써, PBMC에서, 백신에서 인코딩된 6가지 상이한 붉은털 원숭이 Mamu-A*01 부류 I 에피토프에 대한 특이적 CD4 및 CD8 T 세포 반응을 모니터링하였다. 양쪽 방법 모두의 결과는 사이토킨이 에피토프에 대해 항원-특이적 방식으로 유도됨을 시사하였다.
붉은털 원숭이에서 면역원성
본 연구는 (a) ChAdV68.5WTnt.MAG25mer와 조합하여 상동성 프라임/부스트 또는 비상동 프라임/부스트로서 VEE-MAG25mer srRNA 30 μg 및 100 μg 용량의 면역 원성 및 예비 안전성을 평가하고; (b) LNP1 대 LNP2를 사용하여 지질 나노입자에서 VEE-MAG25mer srRNA의 면역 반응을 비교하고; (c) VEE-MAG25mer srRNA 및 ChAdV68.5WTnt.MAG25mer 면역에 대한 T-세포 반응의 동역학을 평가하도록 고안되었다.
본 연구에서 사용된 선택 항원은 붉은털 원숭이에서만, 구체적으로 Mamu-A*01 MHC 부류 I 단상형(haplotype)을 갖는 것에서만 인식된다. Mamu-A*01 인디언 붉은털 원숭이를 상이한 연구 부문(그룹당 6마리 붉은 털 원숭이)에 무작위로 뽑아서, 다중 Mamu-A*01 제한 에피토프를 포함하는 ChAdV68.5WTnt.MAG25mer 또는 VEE-MAG25mer srRNA 벡터 인코딩 모형 항원 중 하나를 양측으로 IM 주사로 투여하였다. 상기 연구 부문은 아래에 기술된 바와 같다.
표 21: 인디언 붉은털 원숭이에서의 비-GLP 면역원성 연구
Figure pct00035
면역 모니터링을 위해 면역화 이전 및 초기 면역화 이후 1, 2, 3, 4, 5, 6, 8, 9, 및 10주에 PBMC를 수집하였다.
결과
말초 혈액 단핵 세포 (PBMC)에서의 항원-특이적 세포 면역 반응은 면역화 이전 및 초기 면역화 이후 1, 2, 3, 4, 5, 6, 8, 9 및 10주에 6개의 상이한 Mamu-A*01 제한 에피토프에 대해 측정되었다. 동물은 4주 및 8주에 30 ㎍ 또는 100 ㎍ 용량으로 VEE-MAG25mer srRNA를 사용하여 부스트 면역화를 받고, 표 21에 기재된 바와 같이 LNP1 또는 LNP2로 제제화하였다. 6개의 모든 에피토프에 대한 조합된 면역 반응을 각각의 면역 모니터링 시점에 대해 플롯팅 하였다 (도 20a-d 및 표 22-25).
각각 초기 VEE-MAG25mer srRNA-LNP1 (30 ㎍) 프라임 면역화 후, 1, 2, 3, 4, 5, 6, 8, 9 또는 10 주에 106 PBMC(6 개의 에피토프 조합) 당 170, 14, 15, 11, 7, 8, 14, 17, 12 SFC로 모든 측정에서 조합 된 항원-특이적 면역 반응이 관찰되었다(도 20a). 각각 초기 VEE-MAG25mer srRNA-LNP1 (100 ㎍) 프라임 면역화 후, 1, 2, 3, 4, 5, 6 8, 9, 또는 10 주에 106 PBMC(6 개의 에피토프 조합) 당 108, -3, 14, 1, 37, 4, 105, 17, 25 SFC로 모든 측정에서 결합된 항원-특이적 면역 반응이 관찰되었다 (도 20b). 초기 VEE-MAG25mer srRNA-LNP2 (100 ㎍) 프라임 면역화 후 1, 2, 3, 4, 5, 6, 8, 9, 또는 10 주에 106 PBMC(6 개의 에피토프 조합) 당 -17, 38, 14, -2, 87, 21, 104, 129, 89 SFC로 모든 측정에서 결합된 항원-특이적 면역 반응이 관찰되었다 (도 20c). 음수 값은 각 에피토프/동물에 대한 사전-블리드 값으로 정규화한 결과입니다.
각각 초기 ChAdV68.5WTnt.MAG25mer 프라임 면역화 후 1, 2, 3, 4, 5, 6, 8, 9 또는 10 주에 106 PBMC(6 개의 에피토프 조합) 당 1218, 1784, 1866, 973, 1813, 747, 797, 1249 및 547 SFC로 모든 측정에서 조합된 항원-특이적 면역 반응이 관찰되었다 (도 20d). 면역 반응은 프라임 면역 후 약 2-3 주 후에 측정된 피크 면역 반응 및 4주 후 면역 반응의 수축으로 예상되는 프로파일을 보여주었다. 106 PBMC(6 개의 에피토프 조합) 당 1813 SFC의 조합된 항원-특이적 세포 면역 반응을 ChAdV68.5WTnt.MAG25mer (즉, VEE-MAG25mer srRNA로 첫 번째 부스팅 1주 후)로 면역화한 후 5주 후에 측정하였다. VEE-MAG25mer srRNA (5주차)를 사용한 첫 번째 부스트 1주 후 측정된 면역 반응은 ChAdV68.5WTnt.MAG25mer 프라임 면역화 (3주차)에 대해 측정된 피크 면역 반응과 유사하였다 (도 20d). 106 PBMC(6 개의 에피토프 조합) 당 1249 개 SFC의 조합된 항원-특이적 세포 면역 반응을 각각 ChAdV68.5WTnt.MAG25mer로 초기 면역화한 지 9주 후(즉, VEE-MAG25mer srRNA로 2차 부스트한지 1주 후)에 측정하였다. VEE-MAG25mer srRNA (9주차)로 2차 부스트한지 1주 후 측정된 면역 반응은 부스트 면역화 직전에 측정된 것보다 약 2 배 높았다 (도 20d).
표 22: VEE-MAG25mer srRNA-LNP1 (30 μg)에 대해 각 에피토프 ± SEM에 대해 106 PBMC 당 평균 스팟 형성 셀 (SFC) (그룹 1)
Figure pct00036
표 23 : VEE-MAG25mer srRNA-LNP1 (100 ㎍)에 대한 각 에피토프 ± SEM에 대한 106 PBMC 당 평균 스팟 형성 세포 (SFC) (그룹 2)
Figure pct00037
표 24 : VEE-MAG25mer srRNA-LNP2 (100 ㎍)에 대한 각 에피토프 ± SEM에 대한 106 PBMC 당 평균 스팟 형성 세포 (SFC) (그룹 3)
Figure pct00038
표 25: ChAdV68.5WTnt.MAG25mer 프라임에 대한 각 에피토프 ± SEM에 대한 106 PBMC 당 평균 스폿 형성 세포 (SFC)
Figure pct00039
인디언 붉은털 원숭이의 비-GLP RNA 용량 범위 연구(고용량)
본 연구는 (a) ChAdV68.5WTnt.MAG25mer와 조합하여 상동 프라임/부스트 또는 비상동 프라임/부스트로서 300 ㎍의 용량으로 VEE-MAG25mer srRNA의 면역원성을 평가하고; (b) 300㎍ 용량에서 LNP1 대 LNP2를 사용하여 지질 나노입자에서 VEE-MAG25mer srRNA의 면역 반응을 비교하고; 그리고 (c) VEE-MAG25mer srRNA 및 ChAdV68.5WTnt.MAG25mer 면역에 대한 T- 세포 반응의 동역학을 평가하도록 고안하였다.
연구 부문을 면역원성을 입증하기 위해 Mamu-A*01 인디언 붉은털 원숭이에서 수행하였다. 붉은털 원숭이와 같은 비인간 영장류 종의 백신 면역원성은 인간의 백신 효능을 예측하기에 가장 좋은 방법입니다. 또한, 이 연구에 사용된 선별된 항원은 붉은털 원숭이, 특히 Mamu-A*01 MHC 부류 I 일배체형을 갖는 항원에서만 인식된다. Mamu-A*01 인디언 붉은털 원숭이는 다른 연구 부문 (그룹당 6 마리의 원숭이)에 무작위 배정되었고 다중 Mamu-A*01 제한된 항원을 포함하는 ChAdV68.5-WTnt.MAG25mer 또는 VEE-MAG25mer srRNA 인코딩 모델 항원으로 양측에 IM 주사를 투여했다. 연구 부문은 다음과 같다.
그룹 1에 대한 면역 모니터링을 위해 면역화 이전 및 초기 면역화 후 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 또는 24주에 PBMC를 수집하였다(비상동성 프라임/부스트). 그룹 2 및 3에 대한 면역 모니터링을 위해 면역화 이전 및 초기 면역화 후 4, 5, 7, 8, 10, 11, 12, 13, 14 또는 15주에 PBMC를 수집하였다(상동성 프라임/부스트).
표 26 : 인디언 붉은털 원숭이에서의 비-GLP 면역원성 연구
Figure pct00040
결과
Mamu-A*01 인디언 레서스 붉은 털 원숭이를 ChAdV68.5-WTnt.MAG25mer로 면역화하였다. 면역화 전에, 초기 면역화 후 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 또는 24주차에, 6가지 상이한 Mamu-A*01 제한 에피토프에 대한 말초 혈액 단핵 세포(PBMC)에서의 항원-특이적 세포 면역 반응을 측정하였다(도 21 및 표 27). 동물은 4, 12, 및 20주차에 LNP2 제형을 사용한 VEE-MAG25mer srRNA로의 부스트 면역화를 수용하였다. 106 PBMC당 1750, 4225, 1100, 2529, 3218, 1915, 1708, 1561, 5077, 4543, 4920, 5820, 3395, 2728, 1996, 1465, 4730, 2984, 2828, 또는 3043 SFC의 조합된 항원-특이적 면역 반응(6가지 에피토프 조합)을 ChAdV68.5WTnt.MAG25mer로의 초기 면역화 후 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 또는 24주차에 측정하였다(도 21). VEE-MAG25mer srRNA로의 제2 부스트 면역화 후 1주차(13주)에 측정된 면역 반응은, 부스트 면역화 직전(12주)에 측정된 것보다 ~3배 높았다. VEE-MAG25mer srRNA로의 제3 부스트 면역화 후 1주차(21주)에 측정된 면역 반응은, 부스트 면역화 직전(20주)에 측정된 것보다 ~3배 높았고, 이는 제2 부스트에서 관찰된 반응과 유사하다.
Mamu-A*01 인디언 레서스 붉은 털 원숭이를 또한 2가지 상이한 LNP 제형(LNP1 및 LNP2)을 사용하여 VEE-MAG25mer srRNA로 면역화하였다. 면역화 전에, 초기 면역화 후 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 또는 15주차에, 6가지 상이한 Mamu-A*01 제한 에피토프에 대한 말초 혈액 단핵 세포(PBMC)에서의 항원-특이적 세포 면역 반응을 측정하였다(도 22 및 23, 표 28 및 29). 동물은 4 및 12주차에 각각 LNP1 또는 LNP2 제형을 사용한 VEE-MAG25mer srRNA로의 부스트 면역화를 수용하였다. 106 PBMC당 168, 204, 103, 126, 140, 145, 330, 203, 및 162 SFC의 조합된 항원-특이적 면역 반응(6가지 에피토프 조합)을 VEE-MAG25mer srRNA-LNP2로의 면역화 후 4, 5, 7, 8, 10, 11, 13, 14, 15주차에 측정하였다(도 22). 106 PBMC당 189, 185, 349, 437, 492, 570, 233, 886, 369, 및 381 SFC의 조합된 항원-특이적 면역 반응(6가지 에피토프 조합)을 VEE-MAG25mer srRNA-LNP1로의 면역화 후 4, 5, 7, 8, 10, 11, 12, 13, 14, 15주차에 측정하였다(도 23).
표 27 : ChAdV68.5WTnt.MAG25mer로 프라이밍 백신 접종하기 위해 각 에피토프 ± SEM에 대한 106 PBMC 당 평균 스팟 형성 세포(SFC)(그룹 1)
Figure pct00041
표 28 : VEE-MAG25mer srRNA-LNP2 (300 ㎍)를 이용한 프라이밍 백신 접종을 위해 각 에피토프 ± SEM 당 106 PBMC 당 평균 스팟 형성 세포 (SFC) (그룹 2)
Figure pct00042
표 29 : VEE-MAG25mer srRNA-LNP1 (300 ㎍)으로 프라이밍 백신 접종을 위한 각 에피토프 ± SEM에 대한 106 PBMC 당 평균 스팟 형성 세포 (SFC) (그룹 3)
Figure pct00043
srRNA 용량 범위 연구
본 발명의 하나의 실행에서는, mamu A01 인디언 레서스 붉은 털 원숭이에서 srRNA 투여량 범위 연구를 수행하여 어떠한 srRNA 투여량이 NHP 면역원성 연구로 진행될지를 동정할 수 있다. 일례에서는, Mamu A01 인디언 레서스 붉은 털 원숭이에게 다중 mamu A01 제한 에피토프를 포함하는 모델 항원을 인코딩하는 srRNA 벡터를 IM 주사로 투여할 수 있다. 또 다른 예에서는, 하나의 그룹의 동물에서 백신 배수 림프절을 표적화하도록 IM 백신 주사 부위 근위에 항-CTLA-4 단클론 항체를 SC 투여할 수 있다. 면역 모니터링을 위해 초기 백신접종 후 2주마다 PBMC를 수집할 수 있다. 연구 아암(arm)을 하기에 기재한다(표 30).
표 30: 인디언 레서스 붉은 털 원숭이에서의 비-GLP RNA 투여량 범위 연구
Figure pct00044
* srRNA의 투여량 범위는 높은 투여량 ≤300 ㎍으로 결정됨.
인디언 레서스 마카크에서의 면역원성 연구
항원 벡터를 사용하여 면역원성을 입증하기 위해 mamu A01 인디언 레서스 마카크 (NHP)에서 백신 연구를 수행하였다. 도 34는 백신접종 전략을 도시한다. NHP의 3개 그룹을 ChAdV68.5-WTnt.MAG25mer로 면역화하였고, 여기서는 체크포인트 억제제 항-CTLA-4 항체 이필리뮤맙을 사용하거나 (그룹 5 & 6) 체크포인트 억제제를 사용하지 않았다 (그룹 4). 항체를 정맥내 (그룹 5) 또는 피하 (그룹 6) 투여하였다. 삼각형은 제0 & 32주에서의 chAd68 백신접종 (1e12 vp/동물)을 나타낸다. 원은 제0, 4, 12, 20, 28 및 32주에서의 알파바이러스 백신접종을 나타낸다.
chAd-MAG 면역화 단독 (도 35 및 표 31A), IV 전달된 체크포인트 억제제와 chAd-MAG 면역화 (도 36 및 표 31B), 및 SC 전달된 체크포인트 억제제와 chAd-MAG 면역 (도 37 및 표 31C)에 대해, 면역화된 NHP에서의 CD8+ 항-에피토프 반응의 시간 코스가 제시되어 있다. 결과는, 영장류에서 chAd68 벡터가 CD8+ 반응을 효율적으로 프라이밍하고, 알파바이러스 벡터가 chAD68 백신 프라이밍 반응을 효율적으로 부스팅하고, IV 전달되든 SC 전달되든 체크포인트 억제제가 프라이밍 및 부스팅 반응 둘 다를 증폭시키고, 백신접종 후 재투여된 chAd 벡터가 면역 반응을 효과적으로 부스팅함을 입증한다.
표 31A: chAd-MAG가 투여된 레서스 마카크에서의 CD8+ 항-에피토프 반응 (그룹 4). 평균 SFC/1e6 비장세포 +/- 표준 오차가 나타나 있음
Figure pct00045
표 31B: IV 전달된 chAd-MAG 플러스 항-CTLA4 항체 (이필리뮤맙)가 투여된 레서스 마카크에서의 CD8+ 항-에피토프 반응 (그룹 5). 평균 SFC/1e6 비장세포 +/- 표준 오차가 나타나 있음
Figure pct00046
표 31C: SC 전달된 chAd-MAG 플러스 항-CTLA4 항체 (이필리뮤맙)가 투여된 레서스 마카크에서의 CD8+ 항-에피토프 반응 (그룹 6). 평균 SFC/1e6 비장세포 +/- 표준 오차가 나타나 있음
Figure pct00047
인디언 레서스 마카크에서의 메모리 표현형화
레서스 마카크를 ChAdV68.5WTnt.MAG25mer /VEE-MAG25mer srRNA 이종 프라임/부스트 요법으로 항-CTLA4와 함께 또는 이것 없이 면역화하고, 다시 ChAdV68.5WTnt.MAG25mer로 부스팅하였다. 그룹을 최종 ChAdV68 투여 11개월 후 평가하였다 (연구 18개월). ELISpot를 기재된 바와 같이 수행하였다. 도 38 및 표 43은 면역화 전 (좌측 패널) 및 18개월 후 (우측 패널) 둘 다에 ELISpot에 의해 측정된 6개의 상이한 Mamu-A*01 제한 에피토프에 대한 세포 반응을 나타낸다. 제한 에피토프에 대한 반응의 검출은, 항원-특이적 메모리 반응이 ChAdV68/samRNA 백신 프로토콜에 의해 생성되었음을 입증한다.
메모리를 평가하기 위해, 백신에서 인코딩된 4개의 상이한 레서스 마카크 Mamu-A*01 부류 I 에피토프를 인식하는 CD8+ T-세포를 이중-색 Mamu-A*01 사량체 라벨링을 사용하여 모니터링하였고, 여기서 각각의 항원은 특유의 이중 양성 조합으로 나타나며, 단일 샘플 내의 모든 4개의 항원-특이적 집단의 동정을 가능하게 하였다. 메모리 세포 표현형화를 세포 표면 마커 CD45RA 및 CCR7로의 공동-염색에 의해 수행하였다. 도 39 및 표 44는, 4개의 상이한 Mamu-A*01 제한 에피토프를 인식하는 메모리 T-세포에 대한 조합 사량체 염색 및 CD45RA/CCR7 공동-염색의 결과를 나타낸다. T 세포 표현형을 또한 유동 세포계측법에 의해 평가하였다. 도 40은 연구 18개월에서의 4개의 Mamu-A*01 사량체+ CD8+ T-세포 집단의 합계 내에서의 메모리 세포 유형의 분포를 나타낸다. 메모리 세포는 하기와 같이 특성화되었다: CD45RA+CCR7+=미접촉, CD45RA+CCR7-=이펙터 (Teff), CD45RA-CCR7+=중심 메모리 (Tcm), CD45RA-CCR7-=이펙터 메모리 (Tem). 총체적으로, 결과는, 메모리 반응이, 이펙터, 중심 메모리, 및 이펙터 메모리 집단을 포함하여, 길게 지속되는 면역성을 나타내는 최종 부스트 후 적어도 1년에 검출되었음을 입증한다.
표 43 프라이밍 전 및 메모리 평가 시점 (18개월) 둘 다에서의 각각의 동물에 대한 106 PBMC 당 평균 스팟 형성 세포 (SFC)
Figure pct00048
ND=기술적 배제로 인해 결정되지 않음
표 44 CD8+ 생 세포 중 퍼센트 Mamu-A*01 사량체 양성
Figure pct00049
XIX. 항-CTLA4 면역 체크포인트 억제제의 공동-발현
항원 및 면역 체크포인트 억제제를 공동-발현하는 벡터(들)을 조작하였다.
재료 및 방법
일 실시예에서, 침팬지 아데노바이러스성 바이러스성 벡터를 모델 항원 및 면역 체크포인트 억제제, 항-CTLA4 둘 다를 발현하도록 디자인하였다.
벡터 디자인
다음의 구성방식으로 결손된 E1 영역 내로 도입된 다음의 5' 내지 3'으로의 방향인 발현 카세트로 E1/E3 결손된 ChAdV68 바이러스성 벡터를 디자인하였다(도 26 참조): [CMV - 모델 - 항원/GFP - IRES - 항-CTLA4 - SV40]. 모델 항원 카세트(또는 GFP 리포터)의 시토메갈로바이러스(CMV) 프로모터 위치된 5' 및 항-CTLA4 항체의 SV40 폴리아데닐화 신호 3'에 의해 카세트 발현을 일으켰다. 모델 항원 카세트는 상기의 섹션 XIV.B.4(서열 번호: 34)에 기재된 MAG25mer 카세트였다. 항원 카세트(또는 GFP 리포터) 및 항-CTLA4 항체를 IRES 서열에 의해 분리하였는데, 이는 동일한 전사체로부터의 모델 항원 및 항-CTLA4 항체의 별도의 번역을 가능하게 한다. 항-CTLA4 항체 뉴클레오티드 서열은 진뱅크(Genbank)에서 이용가능한 항-CTLA4 클론 9D9 서열(NCBI ID LQ222660.1 및 LQ222658.1)에 기반하였고 PCT 공개 WO 2016025642에 추가로 기재되었으며, 이 문헌은 이것이 교시하는 모든 것에 대하여 본원에 참조로 포함된다. 기재된 바(Fang J, Qian JJ, Yi S, Harding TC, Tu GH, Van Roey M, Jooss K. (2005). Stable antibody expression at therapeutic levels using the 2A peptide. Nat Biotechnol. 23(5):584-90)와 같이, 다음의 구성방식으로 항-CTLA4 항체 발현 카세트를 디자인하였으되: [전장 중쇄 - 푸린 절단 부위 - T2A 부위 - 전장 경쇄], T2A 부위는 토세아 아시그나(thosea asigna) 바이러스 2A 펩티드이다. 가변 영역을, 9D9의 본래의 아이소타입(isotype)에 상응하는, 마우스 IgG2b의 불변 영역에 덧붙였다. 또한 뉴클레오티드 서열을 진뱅크 서열과 비교하여 발현을 위해 코돈 최적화하였다.
2개 버전의 GFP 리포터 발현 작제물을 제작하였다: NCBI 서열(g9D9, 서열 번호: 60)을 사용하여 항체 리더(leader) 서열이 있는 하나 및 IgBLAST 도구(o9D9, 서열 번호: 61)에 의해 본래의 마우스 9D9 하이브리도마 내에 존재한다고 예측되는 서열에 기반한 리더 서열이 있는 다른 하나.
모델 항원 발현 작제물은 상기에 기재된 "o9D9" 항체 리더 서열로 제작하였다. 모델 항원 및 항-CTLA4("chAd-MAG-CTLA4")를 발현하는 침팬지 C68 아데노바이러스성 작제물에 대한 전장 서열은 하기에 기재된다(서열 번호: 57).
추가적인 체크포인트 면역 체크포인트 억제제 공동-발현 벡터를 생성하였다: GFP 리포터 또는 모델 항원 카세트, 뿐만 아니라 항-CTLA4 항체 이필리뮤맙을 인코딩하는 서열을 발현하는 침팬지 C68 아데노바이러스성 작제물(chAd68-GFP-IRES-IPI "IPI-GFP" 및 chAd68-MAG-IRES-IPI "IPI-MAG"; 각각 서열 번호: 70 및 71); 모델 항원 카세트 및 항-CTLA4 항체 트레메리무맙을 인코딩하는 서열을 발현하는 침팬지 C68 아데노바이러스성 작제물(chAd68-MAG-IRES-TREME; 서열 번호: 72).
벡터 생산
293A 세포 내로 Fugene 6(Promega)를 사용하여 PacI 소화된 pA68-MAG-o9D9(모델 항원 카세트 및 항-CTLA4의 o9D9 버전을 발현하는 ChAdV68 벡터를 함유하는 플라스미드), pA68-GFP-IRES-o9D9(GFP 리포터 및 항-CTLA4의 o9D9 버전을 발현하는 ChAdV68 벡터를 함유하는 플라스미드), 및 pA68-GFP-IRES-g9D9(GFP 리포터 및 항-CTLA4의 g9D9 버전을 발현하는 ChAdV68 벡터를 함유하는 플라스미드)를 형질감염시킴으로써 항-CTLA4 발현 바이러스성 벡터를 생성하였다. 바이러스성 벡터는 293F 현탁 세포에서의 대규모 생산(400 mL 규모) 전 293 세포에서 팽창을 겪었다. 감염 48h 이후 세포를 수확하고, 용해시키고, 바이러스를 2회 CsCl 구배에 의해 정제하였다. 바이러스를 20 mM Tris pH 8.0, 25 mM NaCl 및 2.5% 글리세롤 내로 여막분석하였다. 정제된 바이러스성 벡터를 분취하고 -80C에서 저장하였다. 정제된 바이러스성 벡터의 감염 단위 역가를 항-캡시드 검정법을 사용하여 결정하였다. 시험관내 및 생체내 실험에 대해, 복용량은 IU 역가에 기반하였다.
시험관내 발현
293F 세포를 1의 MOI에서 하기에 기재된 바이러스성 벡터로 감염시켰다. 감염 이후, 상층액을 수확하였고, 항체를 단백질(Protein) A 비드를 사용하여 회수하였다. 항체를 비드로부터 용출시켰고 4 내지 20% SDS-PAGE 겔 상에서 분리하였다. TBST-5% 분유 중 1:2,500 희석으로 염소 항-마우스, HRP-접합된 항체(Millipore, AP124P)를, 이어서 화학발광 검출 시약(Thermofisher, ECL Plus)을 사용하여 겔이 웨스턴 블롯 분석을 받도록 하였다.
생체내 평가
C56F1 마우스에 1.5e7 또는 1.5e6 IU 중 어느 하나로 하기에 기재된 바이러스성 벡터를 투여하였는데, 벡터는 양측 근육내(IM) 주사를 통해 전경골(tibialis anterior) 근육으로 전달되었다. 항-CTLA4가 동시투여된 마우스는 항체가 2x/주, 250 ug에서의 복강내(IP) 투여를 통해 전달되었다. 그룹, 용량, 경로 및 주사의 시기가 하기에 기재된다. 항원-특이적 T-세포를 ELISpot 및 세포내 사이토킨 염색에 의해 측정하였다. 혈청은 다양한 시점에서 수득하였고 항-CTLA4 농도를 ELISA에 의해 측정하였다.
결과
바이러스를 상기에 기재된 바와 같이 생산하고 정량화하였다. 생체내 연구에서 사용된 chAd68-o9D9 롯트(lot)# CS110617E에 대한 역가 데이터는 하기에 나타낸다:
표 32: 항-CTLA4 임상적 카세트 바이러스(chAd68-MAG-o9D9)의 역가 데이터
Figure pct00050
항-CTLA4 시험관내 발현
293F 세포를 다음의 바이러스성 벡터로 감염시켰다: ChAdVC68-MAG25mer-IRES-o9D9("5WT-MAG-o9D9"), ChAdVC68-GFP-IRES-o9D9, 및 ChAdVC68-GFP-IRES-g9D9. 상층액을 감염 이후 7, 20, 30 및 48h 시간에 수집하였고, 이어서 Protein A 비드를 사용하여 회수된 항체를 웨스턴에 의해 분석하였다. 상업적인 9D9 항체를 양성 대조군("(+) ctrl")으로 사용하였다. GFP만을 인코딩하고 항-CTLA 9D9 항체는 인코딩하지 않는 바이러스성 벡터로부터의 상층액을 음성 대조군("(-) ctrl")으로 사용하였다. 도 27에 나타난 바와 같이, 9D9 항-CTLA4 양성 대조군의 중쇄 및 경쇄와 관련이 있는 밴드는 감염 이후 20h에 시작하여 시험된 3개의 벡터의 상층액에 존재한 반면, 음성 대조군 레인에서는 어떤 단백질 밴드도 검출되지 않았는데, 이는 각 벡터가 바람직한 항-CTLA4 항체를 발현하였음을 나타낸다. 또한 단백질은 세포 용해물 단독 레인, , 단백질 A 비드를 사용한 항체 회수가 없는 샘플(레인 2)에서도 관찰되지 않았는데, 이는 발현된 항체의 검출은 항체 회수를 필요로 함을 입증한다.
다음으로, chAd68-GFP-IRES-IPI 및 chAd68-MAG-IRES-IPI에 대하여 시험관내 발현을 평가하였다. 도 28a는 이필리뮤맙의 중쇄 및 경쇄의 발현을 입증한다. 다음으로, chAd68-MAG-IRES-TREME에 대하여 시험관내 발현을 평가하였다. 도 28b는 트레메리무맙의 중쇄 및 경쇄의 발현을 입증한다.
항-CTLA4를 공동-발현하는 벡터의 생체내 평가
혈청 중 세포 항원-특이적 면역 반응 및 항-CTLA4 발현에 대하여 모델 항원 카세트(MAG) 및 항-CTLA4 항체(o9D9)를 공동-발현하는 ChAdVC68-MAG25mer-IRES-o9D9("chAd-MAG-CTLA4")를 마우스에서 평가하였다. 공동-발현 벡터 처리를 동일한 모델 항원 카세트는 발현하지만 항-CTLA4 항체("chAd-MAG")은 발현하지 않는 벡터, 또는 동일한 모델 항원 카세트는 발현하지만 항-CTLA4 항체는 발현하지 않음과 동시에 동시에 9D9 항-CTLA4 항체(BioXcell에서 구매함)이 동시-투여되는 벡터 중 어느 하나를 받는 마우스와 비교하였다. ChAd 바이러스는 IM 경로에 의해 1.5e7 또는 1.5e6 IU중 어느 하나로 복용되었다. 동시-투여된 항-CTLA4 항체는 250 ug의 용량으로 IP 주사하였다. 다양한 그룹이 하기의 표에 상세히 기재된다:
표 33. chAd-MAG-CTLA4 면역원성 및 발현의 생체 내 평가의 디자인
Figure pct00051
MHC 부류 I 에피토프 AH1-A5에 대한 항원-특이적 T-세포를 백신 투여 후 12일에 ELISpot 및 세포내 사이토킨 염색에 의해 측정하였다. 도 41에 나타난 바와 같이, 면역화 이후 12일에서 ELISpot에 의해 측정된 항원-특이적 면역 반응은 chAd-MAG-CTLA4, chAd-MAG 단독, 및 IP로 전달된 항-CTLA4 항체와 동시-투여된 chAd-MAG와 동등하였다. 항원-특이적 T-세포의 수는 IFNγ-Elispot에 의해 측정된 바와 같이 chAd-MAG-CTLA4, chAd-MAG + 항-CTLA4, 및 chAd-MAG의 경우와 유사하였는데, 이때 중간값은, 1.5e6 IU(도 41 좌측 패널)의 저용량의 경우, 각각 11578, 12194, 및 12945 SFC/1e6 비장세포, 및 1.5e7 IU(도 41 우측 패널)의 고용량의 경우 18933, 17992, 및 18766 SFC/1e6 비장세포였다.
도 42에 나타난 바와 같이, 3회 처리는 또한, 1.5e6 IU(도 42 좌측 패널)에서 3.7, 3.5 및 3.9 IFNγ+(CD8+의 %), 및 1.5e7 IU(도 42 우측 패널)에서 8.4, 7.3 및 8.2의 중간값으로 ICS에 의해 측정된 바와 같이, MHC 부류 I 에피토프 AH1-A5에 대해 동등한 수의 CD8+IFNγ+ 항원-특이적 T-세포를 생성하였다.
ANOVA에 의해 결정된 바와 같이, ELISpot 또는 ICS 분석에 대하여, 그룹 사이에서 어떤 통계학적으로 유의한 차이도 발견되지 않았다. 결과는 chAd-MAG-aCTLA4 백신이 기능적이며, 적어도 이들 검정법에 의해, 마우스에서 항원-특이적 T-세포 반응을 일으키는 데 있어 동등함을 입증한다.
마우스의 혈청 중 항-CTLA4 항체의 양은 chAd-MAG-CTLA4(그룹 1 및 2), 또는 IP로 전달된 항-CTLA4 항체와 함께 동시-투여된 chAd-MAG를 이용한 면역화-이후 1, 2, 3, 6, 및 12일에 중규모 디스커버리(mesoscale discovery; MSD) ELISA에 의해 평가하였다. 그룹 3 및 4에 대해, 항-CTLA4 mAb(250 ㎍, IP)를 0, 3, 6, 및 9일에 투여하였다.
도 43 및 표 34에 나타난 바와 같이, 낮은(1.5e6 IU) 및 높은(1.5e7 IU) 용량 둘 다에서의 chAd-MAG-CTLA4로 면역화된 마우스의 혈청 중 항-CTLA4 발현이 검출되었다. 발현은 추가적인 면역화 없이, 면역화 이후 2일에 정점에 도달하였고 12일에서의 최종 측정까지 기준치 값(0일) 위로 유지되었다. 발현에서의 용량-반응은, 더 높은 용량의 chAd-MAG-CTLA4와 함께 모든 시점에서 더 높은 수준이 검출되는 것으로 관찰되었다. 항-CTLA4의 혈청 수준은 항-CTLA4 mAb의 IP 전달을 이용한 것보다 유의하게 낮았는데, 이는 투여 이후 모든 시점에서 검정법의 최대 범위보다 더 높은 수준을 갖는다. 이들 결과는 ChAd-MAG-aCTLA4 백신이, 반복된 IP 투여에 비교하여, 낮지만 용량-의존적 방식으로 오래가는 수준으로 항-CTLA4 항체를 발현함을 입증한다.
표 34. 마우스 혈청에서의 항-CTLA4 항체 수준
Figure pct00052
각 그룹 및 시점에 대한 평균 ECL 값.
서열
Figure pct00053
Figure pct00054
Figure pct00055
Figure pct00056
Figure pct00057
Figure pct00058
Figure pct00059
Figure pct00060
Figure pct00061
Figure pct00062
Figure pct00063
Figure pct00064
Figure pct00065
Figure pct00066
Figure pct00067
Figure pct00068
Figure pct00069
Figure pct00070
Figure pct00071
Figure pct00072
Figure pct00073
Figure pct00074
Figure pct00075
Figure pct00076
Figure pct00077
Figure pct00078
Figure pct00079
Figure pct00080
Figure pct00081
Figure pct00082
Figure pct00083
Figure pct00084
Figure pct00085
Figure pct00086
Figure pct00087
Figure pct00088
XX. 항-CTLA4 면역 체크포인트 억제제 종양 모델 평가의 공동-발현
항-CTLA4의 공동-발현과 함께 또는 없이 및 선택적으로 자가-복제 RNA(srRNA)와 조합하여, ChAdV68을 사용하여 다양한 복용량 프로토콜을 뮤린 CT26 또는 B16-OVA 종양 모델에서 평가한다.
방법 및 재료
종양 주사
B16-OVA 종양 모델의 경우, Balb/c 마우스의 하부 좌측 복부 옆구리에 105 B16-OVA 세포/동물을 주사한다. 종양은 면역화 이전 3일 동안 성장하도록 허용한다.
CT26 종양 모델의 경우, Balb/c 마우스의 하부 좌측 복부 옆구리에 106 CT26 세포/동물을 주사한다. 종양은 면역화 이전 7일 동안 성장하도록 허용한다.
면역화
모델 항원 카세트(MAG) 및 항-CTLA4 항체(o9D9)를 공동-발현하는 ChAdVC68-MAG25mer-IRES-o9D9, 동일한 모델 항원 카세트를 발현하지만 항-CTLA4 항체는 발현하지 않는 벡터, 및/또는 동일한 모델 항원 카세트를 발현하지만 항-CTLA4 항체를 발현하지 않음과 동시에 9D9 항-CTLA4 항체(BioXcell에서 구입함)와 동시-투여되는 벡터로 마우스를 면역화한다. 다양한 연구 부문에서, 마우스는 동일한 모델 항원을 발현하는 알파바이러스 백신 벡터로 부스팅(boosting) 면역화를 받는다.
비장세포 분리
각 마우스에 대해 비장 및 림프절을 완전한 RPMI(RPMI, 10% FBS, 페니실린/스트렙토마이신) 3 mL에 모은다. 제조업체의 프로토콜에 따라, gentleMACS 분리기(Miltenyi Biotec)를 사용하여 기계적 분리를 실행한다. 분리된 세포를 40 마이크론 필터를 통해 여과하고, 적혈구 세포를 ACK 용해 완충액(150 mM NH4Cl, 10 mM KHCO3, 0.1 mM Na2EDTA)으로 용해한다. 세포를 다시 한 번 30 마이크론 필터를 통해 여과하고, 이어서 완전한 RPMI 중 재현탁한다. 프로피디움 아이오다이드 염색을 사용하여 Attune NxT 유세포분석기(Thermo Fisher) 상에서 세포의 개수를 세어 죽은 세포 및 세포사멸적 세포를 제외시킨다. 이어서 추후 분석을 위해 세포를 생 세포의 적절한 농도로 조정한다.
체외 효소-연결 면역점(ELISPOT) 분석
ELISPOT 조화 지침{DOI: 10.1038/nprot.2015.068}에 따라 마우스 IFNg ELISpotPLUS 키트(MABTECH)로 ELISPOT 분석을 실행한다. 5 x 104 비장세포를 96-웰 IFNg 항체 코팅된 플레이트에서 16시간 동안 지시된 펩티드 10 uM와 함께 배양한다. 알칼린 포스파타아제를 사용하여 점(spot)들을 전개한다. 반응은 10분 동안으로 되어있고 수돗물 하에서 플레이트를 움직임으로써 종료된다. AID vSpot 판독 스펙트럼을 사용하여 점들의 개수를 센다. ELISPOT 분석의 경우, 포화도가 > 50%인 웰들은 "너무 많아서 셀 수 없음"으로 기록하였다. 복제 웰의 편차가 > 10%인 샘플들은 분석에서 제외된다. 이어서 다음 식을 사용하여 웰 충만도에 대해 점 개수를 보정한다: 점 개수 + 2x(점 개수 x %충만도 / [100% - %충만도]). 항원 자극된 웰에서 음성 펩티드 자극 웰의 점 개수를 차감함으로써 음성 배경을 보정한다. 마지막으로, 너무 많아서 셀 수 없음이라고 표지된 웰은 가장 가까운 100단위로 반올림된, 최고 관찰 보정값으로 설정한다.
결과
다양한 연구 부문에서 ELISpot 및 ICS에 의한 세포 항원-특이적 면역 반응, 혈청 중 항-CTLA4 항체 수준, 종양 성장, 및 생존에 대해 마우스를 평가한다. ChAdVC68-MAG25mer-IRES-o9D9을 이용한 면역화는 개선된 면역 반응을 입증한다.
XXI. 면역 체크포인트 억제제의 공동-발현
일 실시예에서, 모델 항원 및 면역 체크포인트 억제제 둘 다를 발현하도록 바이러스성 벡터를 디자인한다. 면역 체크포인트 억제제를 공동-발현하는 바이러스성 벡터는 동일한 모델 항원 카세트를 발현하지만 면역 체크포인트 억제제는 발현하지 않는 벡터, 및/또는 동일한 모델 항원 카세트를 발현하지만 면역 체크포인트 억제제는 발현하지 않음과 동시에 면역 체크포인트 억제제와 동시-투여되는 벡터와 비교한다. 다른 면역 조절제를 또한 동일한 방식으로 시험한다.
벡터 디자인
일 실시예에서, 다음의 구성방식으로 결손된 E1 영역 내로 도입된 다음의 5' 내지 3'으로의 방향인 발현 카세트로 E1/E3 결손된 ChAdV68 바이러스성 벡터를 디자인한다: [CMV - 모델 - 항원/GFP - IRES - 면역 체크포인트 억제제 - SV40]. 모델 항원 카세트(또는 GFP 리포터)의 시토메갈로바이러스(CMV) 프로모터 위치된 5' 및 면역 체크포인트 억제제의 SV-40 폴리아데닐화 신호 3'에 의해 카세트 발현을 일으킨다. 모델 항원 카세트는 상기의 섹션 XIV.B.4(서열 번호: 34)에 기재된 MAG25mer 카세트이다. 항원 카세트(또는 GFP 리포터) 및 면역 체크포인트 억제제를 IRES 서열에 의해 분리하는데, 이는 동일한 전사체로부터 모델 항원의 별도의 번역을 가능하게 하며 IRES 서열에 의해 분리된다. 면역 체크포인트 억제제 또는 면역 조절제는, 항-CTLA4 항체 또는 이의 항원-결합 절편, 항-PD-1 항체 또는 이의 항원-결합 절편, 항-PD-L1 항체 또는 이의 항원-결합 절편, 항-4-1BB 항체 또는 이의 항원-결합 절편, 또는 항-OX-40 항체 또는 이의 항원-결합 절편에 대해, 이용가능한 서열, 이용가능한 항체의 펩티드 서열분석 및 발현을 위한 뉴클레오티드 서열의 추후 디자인에 의해 수득된 서열, 또는 하이브리도마의 BCR 서열분석에 의해 수득된 서열에 기반한다. 이용가능한 면역 체크포인트 억제제 및 면역 조절제는 하기의 표 35에 기재된다. 또한 서열은 발현을 위해 수정되어, 예를 들어, 코돈 최적화되거나 클로닝 벡터 내로의 도입을 위해 조작된다. 기재된 바(Fang J, Qian JJ, Yi S, Harding TC, Tu GH, Van Roey M, Jooss K. (2005). Stable antibody expression at therapeutic levels using the 2A peptide. Nat Biotechnol. 23(5):584-90)와 같이, 뉴클레오티드 서열을 인코딩하는 항체를 다음의 구성방식으로 디자인하되: [중쇄 - 푸린 절단 부위 - T2A 부위 - 경쇄], T2A 부위는 토세아 아시그나 바이러스 2A 펩티드이다. 가변 영역을, 마우스 Ig 아이소타입의 불변 영역에 덧붙인다.
표 35: 이용가능한 면역 체크포인트 억제제
Figure pct00089
또 다른 실시예에서, 상기에 기재된 바와 같이, 결손된 E1 영역 내로 도입된 발현 카세트로 E1/E3 결손된 ChAdV68 바이러스성 벡터를 디자인하고, 면역 체크포인트 억제제를 결손된 E3 영역 내로 도입한다.
또 다른 실시예에서, 다음의 구성방식으로 결손된 영역 내로 도입된 다음의 5' 내지 3'으로의 방향인 발현 카세트로 결손된 바이러스성 구조적 단백질이 있는 알파바이러스 바이러스성 벡터를 디자인한다: [모델 - 항원/GFP - IRES - 면역 체크포인트 억제제]. 알파바이러스 벡터에서 시험된 다양한 면역 체크포인트 억제제는 상기에 기재된 아데노바이러스성 벡터에서 시험된 것과 동일하다.
벡터 생산
293A 세포 내로 Fugene 6(Promega)를 사용하여 선형화된 벡터를 형질감염시킴으로써 면역 체크포인트 억제제 발현 바이러스성 벡터를 생성한다. 바이러스성 벡터는 293F 현탁 세포에서의 대규모 생산(400 mL 규모) 전 293 세포에서 팽창을 겪는다. 감염 48h 이후 세포를 수확하고, 용해시키고, 바이러스를 2회 CsCl 구배에 의해 정제한다. 바이러스를 20 mM Tris pH 8.0, 25 mM NaCl 및 2.5% 글리세롤 내로 여막분석한다. 정제된 바이러스성 벡터를 분취하고 -80C에서 저장한다. 정제된 바이러스성 벡터의 감염 단위 역가를 항-캡시드 검정법을 사용하여 결정한다. 시험관내 및 생체내 실험에 대해, 복용량은 IU 역가에 기반하였다.
시험관내 발현
293F 세포를 1의 MOI에서 다양한 바이러스성 벡터로 감염시킨다. 감염 이후, 상층액을 수확하고, 항체를 Protein A 비드를 사용하여 회수한다. 항체를 비드로부터 용출시키고 4 내지 20% SDS-PAGE 겔 상에서 분리한다. TBST-5% 분유 중 1:2,500 희석으로 염소 항-마우스, HRP-접합된 항체(Millipore, AP124P)를, 이어서 화학발광 검출 시약(Thermofisher, ECL Plus)을 사용하여 겔이 웨스턴 블롯 분석을 받도록 한다.
생체내 평가
마우스를 다양한 바이러스성 벡터로 면역화하는데, 벡터는 양측 근육내(IM) 주사를 통해 전경골 근육으로 전달된다. 면역 체크포인트 억제제를 발현하지 않는 바이러스성 벡터를 받는 선택 그룹에서의 마우스에 면역 체크포인트 억제제를 동시-투여한다. 항원-특이적 T-세포를 ELISpot 및 세포내 사이토킨 염색에 의해 측정한다. 혈청을 다양한 시점에서 수득하고 면역 체크포인트 억제제 농도를 ELISA에 의해 측정한다.
결과
면역 체크포인트 억제제를 공동-발현하는 것들을 포함하는 다양한 바이러스성 벡터가 생산되고 정량화된다. 면역 체크포인트 억제제를 인코딩하는 바이러스성 벡터는 시험관내 및 혈청 중 검출가능한 수준으로 면역 체크포인트 억제제를 발현한다.
면역 체크포인트 억제제를 공동-발현하는 다양한 바이러스성 벡터는 체크포인트 억제제 없이 벡터에 의해 달성되는 것과 동등하거나 또는 이보다 더 큰 면역 활성을 야기한다.
특정 서열
본원에서 언급된 벡터, 카세트, 및 항체가 하기에 기재되며, 서열 번호에 의해 언급된다.
Figure pct00090
Figure pct00091
참고문헌
Figure pct00092
Figure pct00093
Figure pct00094
Figure pct00095
Figure pct00096
Figure pct00097
SEQUENCE LISTING <110> GRITSTONE ONCOLOGY, INC. <120> IMMUNE CHECKPOINT INHIBITOR CO-EXPRESSION VECTORS <130> GSO-018(generic) <140> <141> <150> PCT/US2019/033828 <151> 2019-05-23 <150> 62/675,624 <151> 2018-05-23 <160> 225 <170> PatentIn version 3.5 <210> 1 <211> 36519 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1 ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60 aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120 gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180 tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240 aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300 gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360 gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420 tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480 atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540 tcctccgcgc cgcgagtcag atctacactt tgaaagatga ggcacctgag agacctgccc 600 gatgagaaaa tcatcatcgc ttccgggaac gagattctgg aactggtggt aaatgccatg 660 atgggcgacg accctccgga gccccccacc ccatttgaga caccttcgct gcacgatttg 720 tatgatctgg aggtggatgt gcccgaggac gatcccaatg aggaggcggt aaatgatttt 780 tttagcgatg ccgcgctgct agctgccgag gaggcttcga gctctagctc agacagcgac 840 tcttcactgc atacccctag acccggcaga ggtgagaaaa agatccccga gcttaaaggg 900 gaagagatgg acttgcgctg ctatgaggaa tgcttgcccc cgagcgatga tgaggacgag 960 caggcgatcc agaacgcagc gagccaggga gtgcaagccg ccagcgagag ctttgcgctg 1020 gactgcccgc ctctgcccgg acacggctgt aagtcttgtg aatttcatcg catgaatact 1080 ggagataaag ctgtgttgtg tgcactttgc tatatgagag cttacaacca ttgtgtttac 1140 agtaagtgtg attaagttga actttagagg gaggcagaga gcagggtgac tgggcgatga 1200 ctggtttatt tatgtatata tgttctttat ataggtcccg tctctgacgc agatgatgag 1260 acccccacta caaagtccac ttcgtcaccc ccagaaattg gcacatctcc acctgagaat 1320 attgttagac cagttcctgt tagagccact gggaggagag cagctgtgga atgtttggat 1380 gacttgctac agggtggggt tgaacctttg gacttgtgta cccggaaacg ccccaggcac 1440 taagtgccac acatgtgtgt ttacttgagg tgatgtcagt atttataggg tgtggagtgc 1500 aataaaaaat gtgttgactt taagtgcgtg gtttatgact caggggtggg gactgtgagt 1560 atataagcag gtgcagacct gtgtggttag ctcagagcgg catggagatt tggacggtct 1620 tggaagactt tcacaagact agacagctgc tagagaacgc ctcgaacgga gtctcttacc 1680 tgtggagatt ctgcttcggt ggcgacctag ctaggctagt ctacagggcc aaacaggatt 1740 atagtgaaca atttgaggtt attttgagag agtgttctgg tctttttgac gctcttaact 1800 tgggccatca gtctcacttt aaccagagga tttcgagagc ccttgatttt actactcctg 1860 gcagaaccac tgcagcagta gccttttttg cttttattct tgacaaatgg agtcaagaaa 1920 cccatttcag cagggattac cagctggatt tcttagcagt agctttgtgg agaacatgga 1980 agtgccagcg cctgaatgca atctccggct acttgccggt acagccgcta gacactctga 2040 ggatcctgaa tctccaggag agtcccaggg cacgccaacg tcgccagcag cagcagcagg 2100 aggaggatca agaagagaac ccgagagccg gcctggaccc tccggcggag gaggaggagt 2160 agctgacctg tttcctgaac tgcgccgggt gctgactagg tcttcgagtg gtcgggagag 2220 ggggattaag cgggagaggc atgatgagac taatcacaga actgaactga ctgtgggtct 2280 gatgagtcgc aagcgcccag aaacagtgtg gtggcatgag gtgcagtcga ctggcacaga 2340 tgaggtgtcg gtgatgcatg agaggttttc tctagaacaa gtcaagactt gttggttaga 2400 gcctgaggat gattgggagg tagccatcag gaattatgcc aagctggctc tgaggccaga 2460 caagaagtac aagattacta agctgataaa tatcagaaat gcctgctaca tctcagggaa 2520 tggggctgaa gtggagatct gtctccagga aagggtggct ttcagatgct gcatgatgaa 2580 tatgtacccg ggagtggtgg gcatggatgg ggttaccttt atgaacatga ggttcagggg 2640 agatgggtat aatggcacgg tctttatggc caataccaag ctgacagtcc atggctgctc 2700 cttctttggg tttaataaca cctgcatcga ggcctggggt caggtcggtg tgaggggctg 2760 cagtttttca gccaactgga tgggggtcgt gggcaggacc aagagtatgc tgtccgtgaa 2820 gaaatgcttg tttgagaggt gccacctggg ggtgatgagc gagggcgaag ccagaatccg 2880 ccactgcgcc tctaccgaga cgggctgctt tgtgctgtgc aagggcaatg ctaagatcaa 2940 gcataatatg atctgtggag cctcggacga gcgcggctac cagatgctga cctgcgccgg 3000 cgggaacagc catatgctgg ccaccgtaca tgtggcttcc catgctcgca agccctggcc 3060 cgagttcgag cacaatgtca tgaccaggtg caatatgcat ctggggtccc gccgaggcat 3120 gttcatgccc taccagtgca acctgaatta tgtgaaggtg ctgctggagc ccgatgccat 3180 gtccagagtg agcctgacgg gggtgtttga catgaatgtg gaggtgtgga agattctgag 3240 atatgatgaa tccaagacca ggtgccgagc ctgcgagtgc ggagggaagc atgccaggtt 3300 ccagcccgtg tgtgtggatg tgacggagga cctgcgaccc gatcatttgg tgttgccctg 3360 caccgggacg gagttcggtt ccagcgggga agaatctgac tagagtgagt agtgttctgg 3420 ggcgggggag gacctgcatg agggccagaa taactgaaat ctgtgctttt ctgtgtgttg 3480 cagcagcatg agcggaagcg gctcctttga gggaggggta ttcagccctt atctgacggg 3540 gcgtctcccc tcctgggcgg gagtgcgtca gaatgtgatg ggatccacgg tggacggccg 3600 gcccgtgcag cccgcgaact cttcaaccct gacctatgca accctgagct cttcgtcgtt 3660 ggacgcagct gccgccgcag ctgctgcatc tgccgccagc gccgtgcgcg gaatggccat 3720 gggcgccggc tactacggca ctctggtggc caactcgagt tccaccaata atcccgccag 3780 cctgaacgag gagaagctgt tgctgctgat ggcccagctc gaggccttga cccagcgcct 3840 gggcgagctg acccagcagg tggctcagct gcaggagcag acgcgggccg cggttgccac 3900 ggtgaaatcc aaataaaaaa tgaatcaata aataaacgga gacggttgtt gattttaaca 3960 cagagtctga atctttattt gatttttcgc gcgcggtagg ccctggacca ccggtctcga 4020 tcattgagca cccggtggat cttttccagg acccggtaga ggtgggcttg gatgttgagg 4080 tacatgggca tgagcccgtc ccgggggtgg aggtagctcc attgcagggc ctcgtgctcg 4140 ggggtggtgt tgtaaatcac ccagtcatag caggggcgca gggcatggtg ttgcacaata 4200 tctttgagga ggagactgat ggccacgggc agccctttgg tgtaggtgtt tacaaatctg 4260 ttgagctggg agggatgcat gcggggggag atgaggtgca tcttggcctg gatcttgaga 4320 ttggcgatgt taccgcccag atcccgcctg gggttcatgt tgtgcaggac caccagcacg 4380 gtgtatccgg tgcacttggg gaatttatca tgcaacttgg aagggaaggc gtgaaagaat 4440 ttggcgacgc ctttgtgccc gcccaggttt tccatgcact catccatgat gatggcgatg 4500 ggcccgtggg cggcggcctg ggcaaagacg tttcgggggt cggacacatc atagttgtgg 4560 tcctgggtga ggtcatcata ggccatttta atgaatttgg ggcggagggt gccggactgg 4620 gggacaaagg taccctcgat cccgggggcg tagttcccct cacagatctg catctcccag 4680 gctttgagct cggagggggg gatcatgtcc acctgcgggg cgataaagaa cacggtttcc 4740 ggggcggggg agatgagctg ggccgaaagc aagttccgga gcagctggga cttgccgcag 4800 ccggtggggc cgtagatgac cccgatgacc ggctgcaggt ggtagttgag ggagagacag 4860 ctgccgtcct cccggaggag gggggccacc tcgttcatca tctcgcgcac gtgcatgttc 4920 tcgcgcacca gttccgccag gaggcgctct ccccccaggg ataggagctc ctggagcgag 4980 gcgaagtttt tcagcggctt gagtccgtcg gccatgggca ttttggagag ggtttgttgc 5040 aagagttcca ggcggtccca gagctcggtg atgtgctcta cggcatctcg atccagcaga 5100 cctcctcgtt tcgcgggttg ggacggctgc gggagtaggg caccagacga tgggcgtcca 5160 gcgcagccag ggtccggtcc ttccagggtc gcagcgtccg cgtcagggtg gtctccgtca 5220 cggtgaaggg gtgcgcgccg ggctgggcgc ttgcgagggt gcgcttcagg ctcatccggc 5280 tggtcgaaaa ccgctcccga tcggcgccct gcgcgtcggc caggtagcaa ttgaccatga 5340 gttcgtagtt gagcgcctcg gccgcgtggc ctttggcgcg gagcttacct ttggaagtct 5400 gcccgcaggc gggacagagg agggacttga gggcgtagag cttgggggcg aggaagacgg 5460 actcgggggc gtaggcgtcc gcgccgcagt gggcgcagac ggtctcgcac tccacgagcc 5520 aggtgaggtc gggctggtcg gggtcaaaaa ccagtttccc gccgttcttt ttgatgcgtt 5580 tcttaccttt ggtctccatg agctcgtgtc cccgctgggt gacaaagagg ctgtccgtgt 5640 ccccgtagac cgactttatg ggccggtcct cgagcggtgt gccgcggtcc tcctcgtaga 5700 ggaaccccgc ccactccgag acgaaagccc gggtccaggc cagcacgaag gaggccacgt 5760 gggacgggta gcggtcgttg tccaccagcg ggtccacctt ttccagggta tgcaaacaca 5820 tgtccccctc gtccacatcc aggaaggtga ttggcttgta agtgtaggcc acgtgaccgg 5880 gggtcccggc cgggggggta taaaagggtg cgggtccctg ctcgtcctca ctgtcttccg 5940 gatcgctgtc caggagcgcc agctgttggg gtaggtattc cctctcgaag gcgggcatga 6000 cctcggcact caggttgtca gtttctagaa acgaggagga tttgatattg acggtgccgg 6060 cggagatgcc tttcaagagc ccctcgtcca tctggtcaga aaagacgatc tttttgttgt 6120 cgagcttggt ggcgaaggag ccgtagaggg cgttggagag gagcttggcg atggagcgca 6180 tggtctggtt tttttccttg tcggcgcgct ccttggcggc gatgttgagc tgcacgtact 6240 cgcgcgccac gcacttccat tcggggaaga cggtggtcag ctcgtcgggc acgattctga 6300 cctgccagcc ccgattatgc agggtgatga ggtccacact ggtggccacc tcgccgcgca 6360 ggggctcatt agtccagcag aggcgtccgc ccttgcgcga gcagaagggg ggcagggggt 6420 ccagcatgac ctcgtcgggg gggtcggcat cgatggtgaa gatgccgggc aggaggtcgg 6480 ggtcaaagta gctgatggaa gtggccagat cgtccagggc agcttgccat tcgcgcacgg 6540 ccagcgcgcg ctcgtaggga ctgaggggcg tgccccaggg catgggatgg gtaagcgcgg 6600 aggcgtacat gccgcagatg tcgtagacgt agaggggctc ctcgaggatg ccgatgtagg 6660 tggggtagca gcgccccccg cggatgctgg cgcgcacgta gtcatacagc tcgtgcgagg 6720 gggcgaggag ccccgggccc aggttggtgc gactgggctt ttcggcgcgg tagacgatct 6780 ggcggaaaat ggcatgcgag ttggaggaga tggtgggcct ttggaagatg ttgaagtggg 6840 cgtggggcag tccgaccgag tcgcggatga agtgggcgta ggagtcttgc agcttggcga 6900 cgagctcggc ggtgactagg acgtccagag cgcagtagtc gagggtctcc tggatgatgt 6960 catacttgag ctgtcccttt tgtttccaca gctcgcggtt gagaaggaac tcttcgcggt 7020 ccttccagta ctcttcgagg gggaacccgt cctgatctgc acggtaagag cctagcatgt 7080 agaactggtt gacggccttg taggcgcagc agcccttctc cacggggagg gcgtaggcct 7140 gggcggcctt gcgcagggag gtgtgcgtga gggcgaaagt gtccctgacc atgaccttga 7200 ggaactggtg cttgaagtcg atatcgtcgc agcccccctg ctcccagagc tggaagtccg 7260 tgcgcttctt gtaggcgggg ttgggcaaag cgaaagtaac atcgttgaag aggatcttgc 7320 ccgcgcgggg cataaagttg cgagtgatgc ggaaaggttg gggcacctcg gcccggttgt 7380 tgatgacctg ggcggcgagc acgatctcgt cgaagccgtt gatgttgtgg cccacgatgt 7440 agagttccac gaatcgcgga cggcccttga cgtggggcag tttcttgagc tcctcgtagg 7500 tgagctcgtc ggggtcgctg agcccgtgct gctcgagcgc ccagtcggcg agatgggggt 7560 tggcgcggag gaaggaagtc cagagatcca cggccagggc ggtttgcaga cggtcccggt 7620 actgacggaa ctgctgcccg acggccattt tttcgggggt gacgcagtag aaggtgcggg 7680 ggtccccgtg ccagcgatcc catttgagct ggagggcgag atcgagggcg agctcgacga 7740 gccggtcgtc cccggagagt ttcatgacca gcatgaaggg gacgagctgc ttgccgaagg 7800 accccatcca ggtgtaggtt tccacatcgt aggtgaggaa gagcctttcg gtgcgaggat 7860 gcgagccgat ggggaagaac tggatctcct gccaccaatt ggaggaatgg ctgttgatgt 7920 gatggaagta gaaatgccga cggcgcgccg aacactcgtg cttgtgttta tacaagcggc 7980 cacagtgctc gcaacgctgc acgggatgca cgtgctgcac gagctgtacc tgagttcctt 8040 tgacgaggaa tttcagtggg aagtggagtc gtggcgcctg catctcgtgc tgtactacgt 8100 cgtggtggtc ggcctggccc tcttctgcct cgatggtggt catgctgacg agcccgcgcg 8160 ggaggcaggt ccagacctcg gcgcgagcgg gtcggagagc gaggacgagg gcgcgcaggc 8220 cggagctgtc cagggtcctg agacgctgcg gagtcaggtc agtgggcagc ggcggcgcgc 8280 ggttgacttg caggagtttt tccagggcgc gcgggaggtc cagatggtac ttgatctcca 8340 ccgcgccatt ggtggcgacg tcgatggctt gcagggtccc gtgcccctgg ggtgtgacca 8400 ccgtcccccg tttcttcttg ggcggctggg gcgacggggg cggtgcctct tccatggtta 8460 gaagcggcgg cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg 8520 cggcaggggc acgtcggcgc cgcgcgcggg taggttctgg tactgcgccc ggagaagact 8580 ggcgtgagcg acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac 8640 gggacccgtg agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac 8700 ggcggcctgc cgcaggatct cttgcacgtc gcccgagttg tcctggtagg cgatctcggt 8760 catgaactgc tcgatctcct cctcttgaag gtctccgcgg ccggcgcgct ccacggtggc 8820 cgcgaggtcg ttggagatgc ggcccatgag ctgcgagaag gcgttcatgc ccgcctcgtt 8880 ccagacgcgg ctgtagacca cgacgccctc gggatcgcgg gcgcgcatga ccacctgggc 8940 gaggttgagc tccacgtggc gcgtgaagac cgcgtagttg cagaggcgct ggtagaggta 9000 gttgagcgtg gtggcgatgt gctcggtgac gaagaaatac atgatccagc ggcggagcgg 9060 catctcgctg acgtcgccca gcgcctccaa acgttccatg gcctcgtaaa agtccacggc 9120 gaagttgaaa aactgggagt tgcgcgccga gacggtcaac tcctcctcca gaagacggat 9180 gagctcggcg atggtggcgc gcacctcgcg ctcgaaggcc cccgggagtt cctccacttc 9240 ctcttcttcc tcctccacta acatctcttc tacttcctcc tcaggcggca gtggtggcgg 9300 gggagggggc ctgcgtcgcc ggcggcgcac gggcagacgg tcgatgaagc gctcgatggt 9360 ctcgccgcgc cggcgtcgca tggtctcggt gacggcgcgc ccgtcctcgc ggggccgcag 9420 cgtgaagacg ccgccgcgca tctccaggtg gccggggggg tccccgttgg gcagggagag 9480 ggcgctgacg atgcatctta tcaattgccc cgtagggact ccgcgcaagg acctgagcgt 9540 ctcgagatcc acgggatctg aaaaccgctg aacgaaggct tcgagccagt cgcagtcgca 9600 aggtaggctg agcacggttt cttctggcgg gtcatgttgg ttgggagcgg ggcgggcgat 9660 gctgctggtg atgaagttga aataggcggt tctgagacgg cggatggtgg cgaggagcac 9720 caggtctttg ggcccggctt gctggatgcg cagacggtcg gccatgcccc aggcgtggtc 9780 ctgacacctg gccaggtcct tgtagtagtc ctgcatgagc cgctccacgg gcacctcctc 9840 ctcgcccgcg cggccgtgca tgcgcgtgag cccgaagccg cgctggggct ggacgagcgc 9900 caggtcggcg acgacgcgct cggcgaggat ggcttgctgg atctgggtga gggtggtctg 9960 gaagtcatca aagtcgacga agcggtggta ggctccggtg ttgatggtgt aggagcagtt 10020 ggccatgacg gaccagttga cggtctggtg gcccggacgc acgagctcgt ggtacttgag 10080 gcgcgagtag gcgcgcgtgt cgaagatgta gtcgttgcag gtgcgcacca ggtactggta 10140 gccgatgagg aagtgcggcg gcggctggcg gtagagcggc catcgctcgg tggcgggggc 10200 gccgggcgcg aggtcctcga gcatggtgcg gtggtagccg tagatgtacc tggacatcca 10260 ggtgatgccg gcggcggtgg tggaggcgcg cgggaactcg cggacgcggt tccagatgtt 10320 gcgcagcggc aggaagtagt tcatggtggg cacggtctgg cccgtgaggc gcgcgcagtc 10380 gtggatgctc tatacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag 10440 gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag 10500 ccgcagctaa cgtggtattg gcactcccgt ctcgacccaa gcctgcacca accctccagg 10560 atacggaggc gggtcgtttt gcaacttttt tttggaggcc ggatgagact agtaagcgcg 10620 gaaagcggcc gaccgcgatg gctcgctgcc gtagtctgga gaagaatcgc cagggttgcg 10680 ttgcggtgtg ccccggttcg aggccggccg gattccgcgg ctaacgaggg cgtggctgcc 10740 ccgtcgtttc caagacccca tagccagccg acttctccag ttacggagcg agcccctctt 10800 ttgttttgtt tgtttttgcc agatgcatcc cgtactgcgg cagatgcgcc cccaccaccc 10860 tccaccgcaa caacagcccc ctccacagcc ggcgcttctg cccccgcccc agcagcaact 10920 tccagccacg accgccgcgg ccgccgtgag cggggctgga cagagttatg atcaccagct 10980 ggccttggaa gagggcgagg ggctggcgcg cctgggggcg tcgtcgccgg agcggcaccc 11040 gcgcgtgcag atgaaaaggg acgctcgcga ggcctacgtg cccaagcaga acctgttcag 11100 agacaggagc ggcgaggagc ccgaggagat gcgcgcggcc cggttccacg cggggcggga 11160 gctgcggcgc ggcctggacc gaaagagggt gctgagggac gaggatttcg aggcggacga 11220 gctgacgggg atcagccccg cgcgcgcgca cgtggccgcg gccaacctgg tcacggcgta 11280 cgagcagacc gtgaaggagg agagcaactt ccaaaaatcc ttcaacaacc acgtgcgcac 11340 cctgatcgcg cgcgaggagg tgaccctggg cctgatgcac ctgtgggacc tgctggaggc 11400 catcgtgcag aaccccacca gcaagccgct gacggcgcag ctgttcctgg tggtgcagca 11460 tagtcgggac aacgaagcgt tcagggaggc gctgctgaat atcaccgagc ccgagggccg 11520 ctggctcctg gacctggtga acattctgca gagcatcgtg gtgcaggagc gcgggctgcc 11580 gctgtccgag aagctggcgg ccatcaactt ctcggtgctg agtttgggca agtactacgc 11640 taggaagatc tacaagaccc cgtacgtgcc catagacaag gaggtgaaga tcgacgggtt 11700 ttacatgcgc atgaccctga aagtgctgac cctgagcgac gatctggggg tgtaccgcaa 11760 cgacaggatg caccgtgcgg tgagcgccag caggcggcgc gagctgagcg accaggagct 11820 gatgcatagt ctgcagcggg ccctgaccgg ggccgggacc gagggggaga gctactttga 11880 catgggcgcg gacctgcact ggcagcccag ccgccgggcc ttggaggcgg cggcaggacc 11940 ctacgtagaa gaggtggacg atgaggtgga cgaggagggc gagtacctgg aagactgatg 12000 gcgcgaccgt atttttgcta gatgcaacaa caacagccac ctcctgatcc cgcgatgcgg 12060 gcggcgctgc agagccagcc gtccggcatt aactcctcgg acgattggac ccaggccatg 12120 caacgcatca tggcgctgac gacccgcaac cccgaagcct ttagacagca gccccaggcc 12180 aaccggctct cggccatcct ggaggccgtg gtgccctcgc gctccaaccc cacgcacgag 12240 aaggtcctgg ccatcgtgaa cgcgctggtg gagaacaagg ccatccgcgg cgacgaggcc 12300 ggcctggtgt acaacgcgct gctggagcgc gtggcccgct acaacagcac caacgtgcag 12360 accaacctgg accgcatggt gaccgacgtg cgcgaggccg tggcccagcg cgagcggttc 12420 caccgcgagt ccaacctggg atccatggtg gcgctgaacg ccttcctcag cacccagccc 12480 gccaacgtgc cccggggcca ggaggactac accaacttca tcagcgccct gcgcctgatg 12540 gtgaccgagg tgccccagag cgaggtgtac cagtccgggc cggactactt cttccagacc 12600 agtcgccagg gcttgcagac cgtgaacctg agccaggctt tcaagaactt gcagggcctg 12660 tggggcgtgc aggccccggt cggggaccgc gcgacggtgt cgagcctgct gacgccgaac 12720 tcgcgcctgc tgctgctgct ggtggccccc ttcacggaca gcggcagcat caaccgcaac 12780 tcgtacctgg gctacctgat taacctgtac cgcgaggcca tcggccaggc gcacgtggac 12840 gagcagacct accaggagat cacccacgtg agccgcgccc tgggccagga cgacccgggc 12900 aacctggaag ccaccctgaa ctttttgctg accaaccggt cgcagaagat cccgccccag 12960 tacgcgctca gcaccgagga ggagcgcatc ctgcgttacg tgcagcagag cgtgggcctg 13020 ttcctgatgc aggagggggc cacccccagc gccgcgctcg acatgaccgc gcgcaacatg 13080 gagcccagca tgtacgccag caaccgcccg ttcatcaata aactgatgga ctacttgcat 13140 cgggcggccg ccatgaactc tgactatttc accaacgcca tcctgaatcc ccactggctc 13200 ccgccgccgg ggttctacac gggcgagtac gacatgcccg accccaatga cgggttcctg 13260 tgggacgatg tggacagcag cgtgttctcc ccccgaccgg gtgctaacga gcgccccttg 13320 tggaagaagg aaggcagcga ccgacgcccg tcctcggcgc tgtccggccg cgagggtgct 13380 gccgcggcgg tgcccgaggc cgccagtcct ttcccgagct tgcccttctc gctgaacagt 13440 atccgcagca gcgagctggg caggatcacg cgcccgcgct tgctgggcga agaggagtac 13500 ttgaatgact cgctgttgag acccgagcgg gagaagaact tccccaataa cgggatagaa 13560 agcctggtgg acaagatgag ccgctggaag acgtatgcgc aggagcacag ggacgatccc 13620 cgggcgtcgc agggggccac gagccggggc agcgccgccc gtaaacgccg gtggcacgac 13680 aggcagcggg gacagatgtg ggacgatgag gactccgccg acgacagcag cgtgttggac 13740 ttgggtggga gtggtaaccc gttcgctcac ctgcgccccc gtatcgggcg catgatgtaa 13800 gagaaaccga aaataaatga tactcaccaa ggccatggcg accagcgtgc gttcgtttct 13860 tctctgttgt tgttgtatct agtatgatga ggcgtgcgta cccggagggt cctcctccct 13920 cgtacgagag cgtgatgcag caggcgatgg cggcggcggc gatgcagccc ccgctggagg 13980 ctccttacgt gcccccgcgg tacctggcgc ctacggaggg gcggaacagc attcgttact 14040 cggagctggc acccttgtac gataccaccc ggttgtacct ggtggacaac aagtcggcgg 14100 acatcgcctc gctgaactac cagaacgacc acagcaactt cctgaccacc gtggtgcaga 14160 acaatgactt cacccccacg gaggccagca cccagaccat caactttgac gagcgctcgc 14220 ggtggggcgg ccagctgaaa accatcatgc acaccaacat gcccaacgtg aacgagttca 14280 tgtacagcaa caagttcaag gcgcgggtga tggtctcccg caagaccccc aatggggtga 14340 cagtgacaga ggattatgat ggtagtcagg atgagctgaa gtatgaatgg gtggaatttg 14400 agctgcccga aggcaacttc tcggtgacca tgaccatcga cctgatgaac aacgccatca 14460 tcgacaatta cttggcggtg gggcggcaga acggggtgct ggagagcgac atcggcgtga 14520 agttcgacac taggaacttc aggctgggct gggaccccgt gaccgagctg gtcatgcccg 14580 gggtgtacac caacgaggct ttccatcccg atattgtctt gctgcccggc tgcggggtgg 14640 acttcaccga gagccgcctc agcaacctgc tgggcattcg caagaggcag cccttccagg 14700 aaggcttcca gatcatgtac gaggatctgg aggggggcaa catccccgcg ctcctggatg 14760 tcgacgccta tgagaaaagc aaggaggatg cagcagctga agcaactgca gccgtagcta 14820 ccgcctctac cgaggtcagg ggcgataatt ttgcaagcgc cgcagcagtg gcagcggccg 14880 aggcggctga aaccgaaagt aagatagtca ttcagccggt ggagaaggat agcaagaaca 14940 ggagctacaa cgtactaccg gacaagataa acaccgccta ccgcagctgg tacctagcct 15000 acaactatgg cgaccccgag aagggcgtgc gctcctggac gctgctcacc acctcggacg 15060 tcacctgcgg cgtggagcaa gtctactggt cgctgcccga catgatgcaa gacccggtca 15120 ccttccgctc cacgcgtcaa gttagcaact acccggtggt gggcgccgag ctcctgcccg 15180 tctactccaa gagcttcttc aacgagcagg ccgtctactc gcagcagctg cgcgccttca 15240 cctcgcttac gcacgtcttc aaccgcttcc ccgagaacca gatcctcgtc cgcccgcccg 15300 cgcccaccat taccaccgtc agtgaaaacg ttcctgctct cacagatcac gggaccctgc 15360 cgctgcgcag cagtatccgg ggagtccagc gcgtgaccgt tactgacgcc agacgccgca 15420 cctgccccta cgtctacaag gccctgggca tagtcgcgcc gcgcgtcctc tcgagccgca 15480 ccttctaaat gtccattctc atctcgccca gtaataacac cggttggggc ctgcgcgcgc 15540 ccagcaagat gtacggaggc gctcgccaac gctccacgca acaccccgtg cgcgtgcgcg 15600 ggcacttccg cgctccctgg ggcgccctca agggccgcgt gcggtcgcgc accaccgtcg 15660 acgacgtgat cgaccaggtg gtggccgacg cgcgcaacta cacccccgcc gccgcgcccg 15720 tctccaccgt ggacgccgtc atcgacagcg tggtggccga cgcgcgccgg tacgcccgcg 15780 ccaagagccg gcggcggcgc atcgcccggc ggcaccggag cacccccgcc atgcgcgcgg 15840 cgcgagcctt gctgcgcagg gccaggcgca cgggacgcag ggccatgctc agggcggcca 15900 gacgcgcggc ttcaggcgcc agcgccggca ggacccggag acgcgcggcc acggcggcgg 15960 cagcggccat cgccagcatg tcccgcccgc ggcgagggaa cgtgtactgg gtgcgcgacg 16020 ccgccaccgg tgtgcgcgtg cccgtgcgca cccgcccccc tcgcacttga agatgttcac 16080 ttcgcgatgt tgatgtgtcc cagcggcgag gaggatgtcc aagcgcaaat tcaaggaaga 16140 gatgctccag gtcatcgcgc ctgagatcta cggccctgcg gtggtgaagg aggaaagaaa 16200 gccccgcaaa atcaagcggg tcaaaaagga caaaaaggaa gaagaaagtg atgtggacgg 16260 attggtggag tttgtgcgcg agttcgcccc ccggcggcgc gtgcagtggc gcgggcggaa 16320 ggtgcaaccg gtgctgagac ccggcaccac cgtggtcttc acgcccggcg agcgctccgg 16380 caccgcttcc aagcgctcct acgacgaggt gtacggggat gatgatattc tggagcaggc 16440 ggccgagcgc ctgggcgagt ttgcttacgg caagcgcagc cgttccgcac cgaaggaaga 16500 ggcggtgtcc atcccgctgg accacggcaa ccccacgccg agcctcaagc ccgtgacctt 16560 gcagcaggtg ctgccgaccg cggcgccgcg ccgggggttc aagcgcgagg gcgaggatct 16620 gtaccccacc atgcagctga tggtgcccaa gcgccagaag ctggaagacg tgctggagac 16680 catgaaggtg gacccggacg tgcagcccga ggtcaaggtg cggcccatca agcaggtggc 16740 cccgggcctg ggcgtgcaga ccgtggacat caagattccc acggagccca tggaaacgca 16800 gaccgagccc atgatcaagc ccagcaccag caccatggag gtgcagacgg atccctggat 16860 gccatcggct cctagtcgaa gaccccggcg caagtacggc gcggccagcc tgctgatgcc 16920 caactacgcg ctgcatcctt ccatcatccc cacgccgggc taccgcggca cgcgcttcta 16980 ccgcggtcat accagcagcc gccgccgcaa gaccaccact cgccgccgcc gtcgccgcac 17040 cgccgctgca accacccctg ccgccctggt gcggagagtg taccgccgcg gccgcgcacc 17100 tctgaccctg ccgcgcgcgc gctaccaccc gagcatcgcc atttaaactt tcgcctgctt 17160 tgcagatcaa tggccctcac atgccgcctt cgcgttccca ttacgggcta ccgaggaaga 17220 aaaccgcgcc gtagaaggct ggcggggaac gggatgcgtc gccaccacca ccggcggcgg 17280 cgcgccatca gcaagcggtt ggggggaggc ttcctgcccg cgctgatccc catcatcgcc 17340 gcggcgatcg gggcgatccc cggcattgct tccgtggcgg tgcaggcctc tcagcgccac 17400 tgagacacac ttggaaacat cttgtaataa accaatggac tctgacgctc ctggtcctgt 17460 gatgtgtttt cgtagacaga tggaagacat caatttttcg tccctggctc cgcgacacgg 17520 cacgcggccg ttcatgggca cctggagcga catcggcacc agccaactga acgggggcgc 17580 cttcaattgg agcagtctct ggagcgggct taagaatttc gggtccacgc ttaaaaccta 17640 tggcagcaag gcgtggaaca gcaccacagg gcaggcgctg agggataagc tgaaagagca 17700 gaacttccag cagaaggtgg tcgatgggct cgcctcgggc atcaacgggg tggtggacct 17760 ggccaaccag gccgtgcagc ggcagatcaa cagccgcctg gacccggtgc cgcccgccgg 17820 ctccgtggag atgccgcagg tggaggagga gctgcctccc ctggacaagc ggggcgagaa 17880 gcgaccccgc cccgatgcgg aggagacgct gctgacgcac acggacgagc cgcccccgta 17940 cgaggaggcg gtgaaactgg gtctgcccac cacgcggccc atcgcgcccc tggccaccgg 18000 ggtgctgaaa cccgaaaagc ccgcgaccct ggacttgcct cctccccagc cttcccgccc 18060 ctctacagtg gctaagcccc tgccgccggt ggccgtggcc cgcgcgcgac ccgggggcac 18120 cgcccgccct catgcgaact ggcagagcac tctgaacagc atcgtgggtc tgggagtgca 18180 gagtgtgaag cgccgccgct gctattaaac ctaccgtagc gcttaacttg cttgtctgtg 18240 tgtgtatgta ttatgtcgcc gccgccgctg tccaccagaa ggaggagtga agaggcgcgt 18300 cgccgagttg caagatggcc accccatcga tgctgcccca gtgggcgtac atgcacatcg 18360 ccggacagga cgcttcggag tacctgagtc cgggtctggt gcagtttgcc cgcgccacag 18420 acacctactt cagtctgggg aacaagttta ggaaccccac ggtggcgccc acgcacgatg 18480 tgaccaccga ccgcagccag cggctgacgc tgcgcttcgt gcccgtggac cgcgaggaca 18540 acacctactc gtacaaagtg cgctacacgc tggccgtggg cgacaaccgc gtgctggaca 18600 tggccagcac ctactttgac atccgcggcg tgctggatcg gggccctagc ttcaaaccct 18660 actccggcac cgcctacaac agtctggccc ccaagggagc acccaacact tgtcagtgga 18720 catataaagc cgatggtgaa actgccacag aaaaaaccta tacatatgga aatgcacccg 18780 tgcagggcat taacatcaca aaagatggta ttcaacttgg aactgacacc gatgatcagc 18840 caatctacgc agataaaacc tatcagcctg aacctcaagt gggtgatgct gaatggcatg 18900 acatcactgg tactgatgaa aagtatggag gcagagctct taagcctgat accaaaatga 18960 agccttgtta tggttctttt gccaagccta ctaataaaga aggaggtcag gcaaatgtga 19020 aaacaggaac aggcactact aaagaatatg acatagacat ggctttcttt gacaacagaa 19080 gtgcggctgc tgctggccta gctccagaaa ttgttttgta tactgaaaat gtggatttgg 19140 aaactccaga tacccatatt gtatacaaag caggcacaga tgacagcagc tcttctatta 19200 atttgggtca gcaagccatg cccaacagac ctaactacat tggtttcaga gacaacttta 19260 tcgggctcat gtactacaac agcactggca atatgggggt gctggccggt caggcttctc 19320 agctgaatgc tgtggttgac ttgcaagaca gaaacaccga gctgtcctac cagctcttgc 19380 ttgactctct gggtgacaga acccggtatt tcagtatgtg gaatcaggcg gtggacagct 19440 atgatcctga tgtgcgcatt attgaaaatc atggtgtgga ggatgaactt cccaactatt 19500 gtttccctct ggatgctgtt ggcagaacag atacttatca gggaattaag gctaatggaa 19560 ctgatcaaac cacatggacc aaagatgaca gtgtcaatga tgctaatgag ataggcaagg 19620 gtaatccatt cgccatggaa atcaacatcc aagccaacct gtggaggaac ttcctctacg 19680 ccaacgtggc cctgtacctg cccgactctt acaagtacac gccggccaat gttaccctgc 19740 ccaccaacac caacacctac gattacatga acggccgggt ggtggcgccc tcgctggtgg 19800 actcctacat caacatcggg gcgcgctggt cgctggatcc catggacaac gtgaacccct 19860 tcaaccacca ccgcaatgcg gggctgcgct accgctccat gctcctgggc aacgggcgct 19920 acgtgccctt ccacatccag gtgccccaga aatttttcgc catcaagagc ctcctgctcc 19980 tgcccgggtc ctacacctac gagtggaact tccgcaagga cgtcaacatg atcctgcaga 20040 gctccctcgg caacgacctg cgcacggacg gggcctccat ctccttcacc agcatcaacc 20100 tctacgccac cttcttcccc atggcgcaca acacggcctc cacgctcgag gccatgctgc 20160 gcaacgacac caacgaccag tccttcaacg actacctctc ggcggccaac atgctctacc 20220 ccatcccggc caacgccacc aacgtgccca tctccatccc ctcgcgcaac tgggccgcct 20280 tccgcggctg gtccttcacg cgtctcaaga ccaaggagac gccctcgctg ggctccgggt 20340 tcgaccccta cttcgtctac tcgggctcca tcccctacct cgacggcacc ttctacctca 20400 accacacctt caagaaggtc tccatcacct tcgactcctc cgtcagctgg cccggcaacg 20460 accggctcct gacgcccaac gagttcgaaa tcaagcgcac cgtcgacggc gagggctaca 20520 acgtggccca gtgcaacatg accaaggact ggttcctggt ccagatgctg gcccactaca 20580 acatcggcta ccagggcttc tacgtgcccg agggctacaa ggaccgcatg tactccttct 20640 tccgcaactt ccagcccatg agccgccagg tggtggacga ggtcaactac aaggactacc 20700 aggccgtcac cctggcctac cagcacaaca actcgggctt cgtcggctac ctcgcgccca 20760 ccatgcgcca gggccagccc taccccgcca actaccccta cccgctcatc ggcaagagcg 20820 ccgtcaccag cgtcacccag aaaaagttcc tctgcgacag ggtcatgtgg cgcatcccct 20880 tctccagcaa cttcatgtcc atgggcgcgc tcaccgacct cggccagaac atgctctatg 20940 ccaactccgc ccacgcgcta gacatgaatt tcgaagtcga ccccatggat gagtccaccc 21000 ttctctatgt tgtcttcgaa gtcttcgacg tcgtccgagt gcaccagccc caccgcggcg 21060 tcatcgaggc cgtctacctg cgcaccccct tctcggccgg taacgccacc acctaagctc 21120 ttgcttcttg caagccatgg ccgcgggctc cggcgagcag gagctcaggg ccatcatccg 21180 cgacctgggc tgcgggccct acttcctggg caccttcgat aagcgcttcc cgggattcat 21240 ggccccgcac aagctggcct gcgccatcgt caacacggcc ggccgcgaga ccgggggcga 21300 gcactggctg gccttcgcct ggaacccgcg ctcgaacacc tgctacctct tcgacccctt 21360 cgggttctcg gacgagcgcc tcaagcagat ctaccagttc gagtacgagg gcctgctgcg 21420 ccgcagcgcc ctggccaccg aggaccgctg cgtcaccctg gaaaagtcca cccagaccgt 21480 gcagggtccg cgctcggccg cctgcgggct cttctgctgc atgttcctgc acgccttcgt 21540 gcactggccc gaccgcccca tggacaagaa ccccaccatg aacttgctga cgggggtgcc 21600 caacggcatg ctccagtcgc cccaggtgga acccaccctg cgccgcaacc aggaggcgct 21660 ctaccgcttc ctcaactccc actccgccta ctttcgctcc caccgcgcgc gcatcgagaa 21720 ggccaccgcc ttcgaccgca tgaatcaaga catgtaaacc gtgtgtgtat gttaaatgtc 21780 tttaataaac agcactttca tgttacacat gcatctgaga tgatttattt agaaatcgaa 21840 agggttctgc cgggtctcgg catggcccgc gggcagggac acgttgcgga actggtactt 21900 ggccagccac ttgaactcgg ggatcagcag tttgggcagc ggggtgtcgg ggaaggagtc 21960 ggtccacagc ttccgcgtca gttgcagggc gcccagcagg tcgggcgcgg agatcttgaa 22020 atcgcagttg ggacccgcgt tctgcgcgcg ggagttgcgg tacacggggt tgcagcactg 22080 gaacaccatc agggccgggt gcttcacgct cgccagcacc gtcgcgtcgg tgatgctctc 22140 cacgtcgagg tcctcggcgt tggccatccc gaagggggtc atcttgcagg tctgccttcc 22200 catggtgggc acgcacccgg gcttgtggtt gcaatcgcag tgcaggggga tcagcatcat 22260 ctgggcctgg tcggcgttca tccccgggta catggccttc atgaaagcct ccaattgcct 22320 gaacgcctgc tgggccttgg ctccctcggt gaagaagacc ccgcaggact tgctagagaa 22380 ctggttggtg gcgcacccgg cgtcgtgcac gcagcagcgc gcgtcgttgt tggccagctg 22440 caccacgctg cgcccccagc ggttctgggt gatcttggcc cggtcggggt tctccttcag 22500 cgcgcgctgc ccgttctcgc tcgccacatc catctcgatc atgtgctcct tctggatcat 22560 ggtggtcccg tgcaggcacc gcagcttgcc ctcggcctcg gtgcacccgt gcagccacag 22620 cgcgcacccg gtgcactccc agttcttgtg ggcgatctgg gaatgcgcgt gcacgaagcc 22680 ctgcaggaag cggcccatca tggtggtcag ggtcttgttg ctagtgaagg tcagcggaat 22740 gccgcggtgc tcctcgttga tgtacaggtg gcagatgcgg cggtacacct cgccctgctc 22800 gggcatcagc tggaagttgg ctttcaggtc ggtctccacg cggtagcggt ccatcagcat 22860 agtcatgatt tccataccct tctcccaggc cgagacgatg ggcaggctca tagggttctt 22920 caccatcatc ttagcgctag cagccgcggc cagggggtcg ctctcgtcca gggtctcaaa 22980 gctccgcttg ccgtccttct cggtgatccg caccgggggg tagctgaagc ccacggccgc 23040 cagctcctcc tcggcctgtc tttcgtcctc gctgtcctgg ctgacgtcct gcaggaccac 23100 atgcttggtc ttgcggggtt tcttcttggg cggcagcggc ggcggagatg ttggagatgg 23160 cgagggggag cgcgagttct cgctcaccac tactatctct tcctcttctt ggtccgaggc 23220 cacgcggcgg taggtatgtc tcttcggggg cagaggcgga ggcgacgggc tctcgccgcc 23280 gcgacttggc ggatggctgg cagagcccct tccgcgttcg ggggtgcgct cccggcggcg 23340 ctctgactga cttcctccgc ggccggccat tgtgttctcc tagggaggaa caacaagcat 23400 ggagactcag ccatcgccaa cctcgccatc tgcccccacc gccgacgaga agcagcagca 23460 gcagaatgaa agcttaaccg ccccgccgcc cagccccgcc acctccgacg cggccgtccc 23520 agacatgcaa gagatggagg aatccatcga gattgacctg ggctatgtga cgcccgcgga 23580 gcacgaggag gagctggcag tgcgcttttc acaagaagag atacaccaag aacagccaga 23640 gcaggaagca gagaatgagc agagtcaggc tgggctcgag catgacggcg actacctcca 23700 cctgagcggg ggggaggacg cgctcatcaa gcatctggcc cggcaggcca ccatcgtcaa 23760 ggatgcgctg ctcgaccgca ccgaggtgcc cctcagcgtg gaggagctca gccgcgccta 23820 cgagttgaac ctcttctcgc cgcgcgtgcc ccccaagcgc cagcccaatg gcacctgcga 23880 gcccaacccg cgcctcaact tctacccggt cttcgcggtg cccgaggccc tggccaccta 23940 ccacatcttt ttcaagaacc aaaagatccc cgtctcctgc cgcgccaacc gcacccgcgc 24000 cgacgccctt ttcaacctgg gtcccggcgc ccgcctacct gatatcgcct ccttggaaga 24060 ggttcccaag atcttcgagg gtctgggcag cgacgagact cgggccgcga acgctctgca 24120 aggagaagga ggagagcatg agcaccacag cgccctggtc gagttggaag gcgacaacgc 24180 gcggctggcg gtgctcaaac gcacggtcga gctgacccat ttcgcctacc cggctctgaa 24240 cctgcccccc aaagtcatga gcgcggtcat ggaccaggtg ctcatcaagc gcgcgtcgcc 24300 catctccgag gacgagggca tgcaagactc cgaggagggc aagcccgtgg tcagcgacga 24360 gcagctggcc cggtggctgg gtcctaatgc tagtccccag agtttggaag agcggcgcaa 24420 actcatgatg gccgtggtcc tggtgaccgt ggagctggag tgcctgcgcc gcttcttcgc 24480 cgacgcggag accctgcgca aggtcgagga gaacctgcac tacctcttca ggcacgggtt 24540 cgtgcgccag gcctgcaaga tctccaacgt ggagctgacc aacctggtct cctacatggg 24600 catcttgcac gagaaccgcc tggggcagaa cgtgctgcac accaccctgc gcggggaggc 24660 ccggcgcgac tacatccgcg actgcgtcta cctctacctc tgccacacct ggcagacggg 24720 catgggcgtg tggcagcagt gtctggagga gcagaacctg aaagagctct gcaagctcct 24780 gcagaagaac ctcaagggtc tgtggaccgg gttcgacgag cgcaccaccg cctcggacct 24840 ggccgacctc attttccccg agcgcctcag gctgacgctg cgcaacggcc tgcccgactt 24900 tatgagccaa agcatgttgc aaaactttcg ctctttcatc ctcgaacgct ccggaatcct 24960 gcccgccacc tgctccgcgc tgccctcgga cttcgtgccg ctgaccttcc gcgagtgccc 25020 cccgccgctg tggagccact gctacctgct gcgcctggcc aactacctgg cctaccactc 25080 ggacgtgatc gaggacgtca gcggcgaggg cctgctcgag tgccactgcc gctgcaacct 25140 ctgcacgccg caccgctccc tggcctgcaa cccccagctg ctgagcgaga cccagatcat 25200 cggcaccttc gagttgcaag ggcccagcga aggcgagggt tcagccgcca aggggggtct 25260 gaaactcacc ccggggctgt ggacctcggc ctacttgcgc aagttcgtgc ccgaggacta 25320 ccatcccttc gagatcaggt tctacgagga ccaatcccat ccgcccaagg ccgagctgtc 25380 ggcctgcgtc atcacccagg gggcgatcct ggcccaattg caagccatcc agaaatcccg 25440 ccaagaattc ttgctgaaaa agggccgcgg ggtctacctc gacccccaga ccggtgagga 25500 gctcaacccc ggcttccccc aggatgcccc gaggaaacaa gaagctgaaa gtggagctgc 25560 cgcccgtgga ggatttggag gaagactggg agaacagcag tcaggcagag gaggaggaga 25620 tggaggaaga ctgggacagc actcaggcag aggaggacag cctgcaagac agtctggagg 25680 aagacgagga ggaggcagag gaggaggtgg aagaagcagc cgccgccaga ccgtcgtcct 25740 cggcggggga gaaagcaagc agcacggata ccatctccgc tccgggtcgg ggtcccgctc 25800 gaccacacag tagatgggac gagaccggac gattcccgaa ccccaccacc cagaccggta 25860 agaaggagcg gcagggatac aagtcctggc gggggcacaa aaacgccatc gtctcctgct 25920 tgcaggcctg cgggggcaac atctccttca cccggcgcta cctgctcttc caccgcgggg 25980 tgaactttcc ccgcaacatc ttgcattact accgtcacct ccacagcccc tactacttcc 26040 aagaagaggc agcagcagca gaaaaagacc agcagaaaac cagcagctag aaaatccaca 26100 gcggcggcag caggtggact gaggatcgcg gcgaacgagc cggcgcaaac ccgggagctg 26160 aggaaccgga tctttcccac cctctatgcc atcttccagc agagtcgggg gcaggagcag 26220 gaactgaaag tcaagaaccg ttctctgcgc tcgctcaccc gcagttgtct gtatcacaag 26280 agcgaagacc aacttcagcg cactctcgag gacgccgagg ctctcttcaa caagtactgc 26340 gcgctcactc ttaaagagta gcccgcgccc gcccagtcgc agaaaaaggc gggaattacg 26400 tcacctgtgc ccttcgccct agccgcctcc acccatcatc atgagcaaag agattcccac 26460 gccttacatg tggagctacc agccccagat gggcctggcc gccggtgccg cccaggacta 26520 ctccacccgc atgaattggc tcagcgccgg gcccgcgatg atctcacggg tgaatgacat 26580 ccgcgcccac cgaaaccaga tactcctaga acagtcagcg ctcaccgcca cgccccgcaa 26640 tcacctcaat ccgcgtaatt ggcccgccgc cctggtgtac caggaaattc cccagcccac 26700 gaccgtacta cttccgcgag acgcccaggc cgaagtccag ctgactaact caggtgtcca 26760 gctggcgggc ggcgccaccc tgtgtcgtca ccgccccgct cagggtataa agcggctggt 26820 gatccggggc agaggcacac agctcaacga cgaggtggtg agctcttcgc tgggtctgcg 26880 acctgacgga gtcttccaac tcgccggatc ggggagatct tccttcacgc ctcgtcaggc 26940 cgtcctgact ttggagagtt cgtcctcgca gccccgctcg ggtggcatcg gcactctcca 27000 gttcgtggag gagttcactc cctcggtcta cttcaacccc ttctccggct cccccggcca 27060 ctacccggac gagttcatcc cgaacttcga cgccatcagc gagtcggtgg acggctacga 27120 ttgaatgtcc catggtggcg cagctgacct agctcggctt cgacacctgg accactgccg 27180 ccgcttccgc tgcttcgctc gggatctcgc cgagtttgcc tactttgagc tgcccgagga 27240 gcaccctcag ggcccggccc acggagtgcg gatcgtcgtc gaagggggcc tcgactccca 27300 cctgcttcgg atcttcagcc agcgtccgat cctggtcgag cgcgagcaag gacagaccct 27360 tctgactctg tactgcatct gcaaccaccc cggcctgcat gaaagtcttt gttgtctgct 27420 gtgtactgag tataataaaa gctgagatca gcgactactc cggacttccg tgtgttcctg 27480 aatccatcaa ccagtctttg ttcttcaccg ggaacgagac cgagctccag ctccagtgta 27540 agccccacaa gaagtacctc acctggctgt tccagggctc cccgatcgcc gttgtcaacc 27600 actgcgacaa cgacggagtc ctgctgagcg gccctgccaa ccttactttt tccacccgca 27660 gaagcaagct ccagctcttc caacccttcc tccccgggac ctatcagtgc gtctcgggac 27720 cctgccatca caccttccac ctgatcccga ataccacagc gtcgctcccc gctactaaca 27780 accaaactaa cctccaccaa cgccaccgtc gcgacctttc tgaatctaat actaccaccc 27840 acaccggagg tgagctccga ggtcaaccaa cctctgggat ttactacggc ccctgggagg 27900 tggttgggtt aatagcgcta ggcctagttg cgggtgggct tttggttctc tgctacctat 27960 acctcccttg ctgttcgtac ttagtggtgc tgtgttgctg gtttaagaaa tggggaagat 28020 caccctagtg agctgcggtg cgctggtggc ggtgttgctt tcgattgtgg gactgggcgg 28080 tgcggctgta gtgaaggaga aggccgatcc ctgcttgcat ttcaatccca acaaatgcca 28140 gctgagtttt cagcccgatg gcaatcggtg cgcggtactg atcaagtgcg gatgggaatg 28200 cgagaacgtg agaatcgagt acaataacaa gactcggaac aatactctcg cgtccgtgtg 28260 gcagcccggg gaccccgagt ggtacaccgt ctctgtcccc ggtgctgacg gctccccgcg 28320 caccgtgaat aatactttca tttttgcgca catgtgcgac acggtcatgt ggatgagcaa 28380 gcagtacgat atgtggcccc ccacgaagga gaacatcgtg gtcttctcca tcgcttacag 28440 cctgtgcacg gcgctaatca ccgctatcgt gtgcctgagc attcacatgc tcatcgctat 28500 tcgccccaga aataatgccg aaaaagaaaa acagccataa cgtttttttt cacacctttt 28560 tcagaccatg gcctctgtta aatttttgct tttatttgcc agtctcattg ccgtcattca 28620 tggaatgagt aatgagaaaa ttactattta cactggcact aatcacacat tgaaaggtcc 28680 agaaaaagcc acagaagttt catggtattg ttattttaat gaatcagatg tatctactga 28740 actctgtgga aacaataaca aaaaaaatga gagcattact ctcatcaagt ttcaatgtgg 28800 atctgactta accctaatta acatcactag agactatgta ggtatgtatt atggaactac 28860 agcaggcatt tcggacatgg aattttatca agtttctgtg tctgaaccca ccacgcctag 28920 aatgaccaca accacaaaaa ctacacctgt taccactatg cagctcacta ccaataacat 28980 ttttgccatg cgtcaaatgg tcaacaatag cactcaaccc accccaccca gtgaggaaat 29040 tcccaaatcc atgattggca ttattgttgc tgtagtggtg tgcatgttga tcatcgcctt 29100 gtgcatggtg tactatgcct tctgctacag aaagcacaga ctgaacgaca agctggaaca 29160 cttactaagt gttgaatttt aattttttag aaccatgaag atcctaggcc ttttaatttt 29220 ttctatcatt acctctgctc tatgcaattc tgacaatgag gacgttactg tcgttgtcgg 29280 atcaaattat acactgaaag gtccagcgaa gggtatgctt tcgtggtatt gctattttgg 29340 atctgacact acagaaactg aattatgcaa tcttaagaat ggcaaaattc aaaattctaa 29400 aattaacaat tatatatgca atggtactga tctgatactc ctcaatatca cgaaatcata 29460 tgctggcagt tacacctgcc ctggagatga tgctgacagt atgatttttt acaaagtaac 29520 tgttgttgat cccactactc cacctccacc caccacaact actcacacca cacacacaga 29580 tcaaaccgca gcagaggagg cagcaaagtt agccttgcag gtccaagaca gttcatttgt 29640 tggcattacc cctacacctg atcagcggtg tccggggctg ctagtcagcg gcattgtcgg 29700 tgtgctttcg ggattagcag tcataatcat ctgcatgttc atttttgctt gctgctatag 29760 aaggctttac cgacaaaaat cagacccact gctgaacctc tatgtttaat tttttccaga 29820 gtcatgaagg cagttagcgc tctagttttt tgttctttga ttggcattgt tttttgcaat 29880 cctattccta aagttagctt tattaaagat gtgaatgtta ctgagggggg caatgtgaca 29940 ctggtaggtg tagagggtgc tgaaaacacc acctggacaa aataccacct caatgggtgg 30000 aaagatattt gcaattggag tgtattagtt tatacatgtg agggagttaa tcttaccatt 30060 gtcaatgcca cctcagctca aaatggtaga attcaaggac aaagtgtcag tgtatctaat 30120 gggtatttta cccaacatac ttttatctat gacgttaaag tcataccact gcctacgcct 30180 agcccaccta gcactaccac acagacaacc cacactacac agacaaccac atacagtaca 30240 ttaaatcagc ctaccaccac tacagcagca gaggttgcca gctcgtctgg ggtccgagtg 30300 gcatttttga tgtgggcccc atctagcagt cccactgcta gtaccaatga gcagactact 30360 gaatttttgt ccactgtcga gagccacacc acagctacct ccagtgcctt ctctagcacc 30420 gccaatctct cctcgctttc ctctacacca atcagtcccg ctactactcc tagccccgct 30480 cctcttccca ctcccctgaa gcaaacagac ggcggcatgc aatggcagat caccctgctc 30540 attgtgatcg ggttggtcat cctggccgtg ttgctctact acatcttctg ccgccgcatt 30600 cccaacgcgc accgcaagcc ggtctacaag cccatcattg tcgggcagcc ggagccgctt 30660 caggtggaag ggggtctaag gaatcttctc ttctctttta cagtatggtg attgaactat 30720 gattcctaga caattcttga tcactattct tatctgcctc ctccaagtct gtgccaccct 30780 cgctctggtg gccaacgcca gtccagactg tattgggccc ttcgcctcct acgtgctctt 30840 tgccttcacc acctgcatct gctgctgtag catagtctgc ctgcttatca ccttcttcca 30900 gttcattgac tggatctttg tgcgcatcgc ctacctgcgc caccaccccc agtaccgcga 30960 ccagcgagtg gcgcggctgc tcaggctcct ctgataagca tgcgggctct gctacttctc 31020 gcgcttctgc tgttagtgct cccccgtccc gtcgaccccc ggtcccccac ccagtccccc 31080 gaggaggtcc gcaaatgcaa attccaagaa ccctggaaat tcctcaaatg ctaccgccaa 31140 aaatcagaca tgcatcccag ctggatcatg atcattggga tcgtgaacat tctggcctgc 31200 accctcatct cctttgtgat ttacccctgc tttgactttg gttggaactc gccagaggcg 31260 ctctatctcc cgcctgaacc tgacacacca ccacagcaac ctcaggcaca cgcactacca 31320 ccactacagc ctaggccaca atacatgccc atattagact atgaggccga gccacagcga 31380 cccatgctcc ccgctattag ttacttcaat ctaaccggcg gagatgactg acccactggc 31440 caacaacaac gtcaacgacc ttctcctgga catggacggc cgcgcctcgg agcagcgact 31500 cgcccaactt cgcattcgcc agcagcagga gagagccgtc aaggagctgc aggatgcggt 31560 ggccatccac cagtgcaaga gaggcatctt ctgcctggtg aaacaggcca agatctccta 31620 cgaggtcact ccaaacgacc atcgcctctc ctacgagctc ctgcagcagc gccagaagtt 31680 cacctgcctg gtcggagtca accccatcgt catcacccag cagtctggcg ataccaaggg 31740 gtgcatccac tgctcctgcg actcccccga ctgcgtccac actctgatca agaccctctg 31800 cggcctccgc gacctcctcc ccatgaacta atcaccccct tatccagtga aataaagatc 31860 atattgatga tgattttaca gaaataaaaa ataatcattt gatttgaaat aaagatacaa 31920 tcatattgat gatttgagtt taacaaaaaa ataaagaatc acttacttga aatctgatac 31980 caggtctctg tccatgtttt ctgccaacac cacttcactc ccctcttccc agctctggta 32040 ctgcaggccc cggcgggctg caaacttcct ccacacgctg aaggggatgt caaattcctc 32100 ctgtccctca atcttcattt tatcttctat cagatgtcca aaaagcgcgt ccgggtggat 32160 gatgacttcg accccgtcta cccctacgat gcagacaacg caccgaccgt gcccttcatc 32220 aaccccccct tcgtctcttc agatggattc caagagaagc ccctgggggt gttgtccctg 32280 cgactggccg accccgtcac caccaagaac ggggaaatca ccctcaagct gggagagggg 32340 gtggacctcg attcctcggg aaaactcatc tccaacacgg ccaccaaggc cgccgcccct 32400 ctcagttttt ccaacaacac catttccctt aacatggatc acccctttta cactaaagat 32460 ggaaaattat ccttacaagt ttctccacca ttaaatatac tgagaacaag cattctaaac 32520 acactagctt taggttttgg atcaggttta ggactccgtg gctctgcctt ggcagtacag 32580 ttagtctctc cacttacatt tgatactgat ggaaacataa agcttacctt agacagaggt 32640 ttgcatgtta caacaggaga tgcaattgaa agcaacataa gctgggctaa aggtttaaaa 32700 tttgaagatg gagccatagc aaccaacatt ggaaatgggt tagagtttgg aagcagtagt 32760 acagaaacag gtgttgatga tgcttaccca atccaagtta aacttggatc tggccttagc 32820 tttgacagta caggagccat aatggctggt aacaaagaag acgataaact cactttgtgg 32880 acaacacctg atccatcacc aaactgtcaa atactcgcag aaaatgatgc aaaactaaca 32940 ctttgcttga ctaaatgtgg tagtcaaata ctggccactg tgtcagtctt agttgtagga 33000 agtggaaacc taaaccccat tactggcacc gtaagcagtg ctcaggtgtt tctacgtttt 33060 gatgcaaacg gtgttctttt aacagaacat tctacactaa aaaaatactg ggggtatagg 33120 cagggagata gcatagatgg cactccatat accaatgctg taggattcat gcccaattta 33180 aaagcttatc caaagtcaca aagttctact actaaaaata atatagtagg gcaagtatac 33240 atgaatggag atgtttcaaa acctatgctt ctcactataa ccctcaatgg tactgatgac 33300 agcaacagta catattcaat gtcattttca tacacctgga ctaatggaag ctatgttgga 33360 gcaacatttg gggctaactc ttataccttc tcatacatcg cccaagaatg aacactgtat 33420 cccaccctgc atgccaaccc ttcccacccc actctgtgga acaaactctg aaacacaaaa 33480 taaaataaag ttcaagtgtt ttattgattc aacagtttta caggattcga gcagttattt 33540 ttcctccacc ctcccaggac atggaataca ccaccctctc cccccgcaca gccttgaaca 33600 tctgaatgcc attggtgatg gacatgcttt tggtctccac gttccacaca gtttcagagc 33660 gagccagtct cgggtcggtc agggagatga aaccctccgg gcactcccgc atctgcacct 33720 cacagctcaa cagctgagga ttgtcctcgg tggtcgggat cacggttatc tggaagaagc 33780 agaagagcgg cggtgggaat catagtccgc gaacgggatc ggccggtggt gtcgcatcag 33840 gccccgcagc agtcgctgcc gccgccgctc cgtcaagctg ctgctcaggg ggtccgggtc 33900 cagggactcc ctcagcatga tgcccacggc cctcagcatc agtcgtctgg tgcggcgggc 33960 gcagcagcgc atgcggatct cgctcaggtc gctgcagtac gtgcaacaca gaaccaccag 34020 gttgttcaac agtccatagt tcaacacgct ccagccgaaa ctcatcgcgg gaaggatgct 34080 acccacgtgg ccgtcgtacc agatcctcag gtaaatcaag tggtgccccc tccagaacac 34140 gctgcccacg tacatgatct ccttgggcat gtggcggttc accacctccc ggtaccacat 34200 caccctctgg ttgaacatgc agccccggat gatcctgcgg aaccacaggg ccagcaccgc 34260 cccgcccgcc atgcagcgaa gagaccccgg gtcccggcaa tggcaatgga ggacccaccg 34320 ctcgtacccg tggatcatct gggagctgaa caagtctatg ttggcacagc acaggcatat 34380 gctcatgcat ctcttcagca ctctcaactc ctcgggggtc aaaaccatat cccagggcac 34440 ggggaactct tgcaggacag cgaaccccgc agaacagggc aatcctcgca cagaacttac 34500 attgtgcatg gacagggtat cgcaatcagg cagcaccggg tgatcctcca ccagagaagc 34560 gcgggtctcg gtctcctcac agcgtggtaa gggggccggc cgatacgggt gatggcggga 34620 cgcggctgat cgtgttcgcg accgtgtcat gatgcagttg ctttcggaca ttttcgtact 34680 tgctgtagca gaacctggtc cgggcgctgc acaccgatcg ccggcggcgg tctcggcgct 34740 tggaacgctc ggtgttgaaa ttgtaaaaca gccactctct cagaccgtgc agcagatcta 34800 gggcctcagg agtgatgaag atcccatcat gcctgatggc tctgatcaca tcgaccaccg 34860 tggaatgggc cagacccagc cagatgatgc aattttgttg ggtttcggtg acggcggggg 34920 agggaagaac aggaagaacc atgattaact tttaatccaa acggtctcgg agtacttcaa 34980 aatgaagatc gcggagatgg cacctctcgc ccccgctgtg ttggtggaaa ataacagcca 35040 ggtcaaaggt gatacggttc tcgagatgtt ccacggtggc ttccagcaaa gcctccacgc 35100 gcacatccag aaacaagaca atagcgaaag cgggagggtt ctctaattcc tcaatcatca 35160 tgttacactc ctgcaccatc cccagataat tttcattttt ccagccttga atgattcgaa 35220 ctagttcctg aggtaaatcc aagccagcca tgataaagag ctcgcgcaga gcgccctcca 35280 ccggcattct taagcacacc ctcataattc caagatattc tgctcctggt tcacctgcag 35340 cagattgaca agcggaatat caaaatctct gccgcgatcc ctgagctcct ccctcagcaa 35400 taactgtaag tactctttca tatcctctcc gaaattttta gccataggac caccaggaat 35460 aagattaggg caagccacag tacagataaa ccgaagtcct ccccagtgag cattgccaaa 35520 tgcaagactg ctataagcat gctggctaga cccggtgata tcttccagat aactggacag 35580 aaaatcgccc aggcaatttt taagaaaatc aacaaaagaa aaatcctcca ggtggacgtt 35640 tagagcctcg ggaacaacga tgaagtaaat gcaagcggtg cgttccagca tggttagtta 35700 gctgatctgt agaaaaaaca aaaatgaaca ttaaaccatg ctagcctggc gaacaggtgg 35760 gtaaatcgtt ctctccagca ccaggcaggc cacggggtct ccggcgcgac cctcgtaaaa 35820 attgtcgcta tgattgaaaa ccatcacaga gagacgttcc cggtggccgg cgtgaatgat 35880 tcgacaagat gaatacaccc ccggaacatt ggcgtccgcg agtgaaaaaa agcgcccgag 35940 gaagcaataa ggcactacaa tgctcagtct caagtccagc aaagcgatgc catgcggatg 36000 aagcacaaaa ttctcaggtg cgtacaaaat gtaattactc ccctcctgca caggcagcaa 36060 agcccccgat ccctccaggt acacatacaa agcctcagcg tccatagctt accgagcagc 36120 agcacacaac aggcgcaaga gtcagagaaa ggctgagctc taacctgtcc acccgctctc 36180 tgctcaatat atagcccaga tctacactga cgtaaaggcc aaagtctaaa aatacccgcc 36240 aaataatcac acacgcccag cacacgccca gaaaccggtg acacactcaa aaaaatacgc 36300 gcacttcctc aaacgcccaa aactgccgtc atttccgggt tcccacgcta cgtcatcaaa 36360 acacgacttt caaattccgt cgaccgttaa aaacgtcacc cgccccgccc ctaacggtcg 36420 cccgtctctc agccaatcag cgccccgcat ccccaaattc aaacacctca tttgcatatt 36480 aacgcgcaca aaaagtttga ggtatattat tgatgatgg 36519 <210> 2 <211> 31588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 2 ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60 aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120 gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180 tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240 aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300 gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360 gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420 tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480 atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540 tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600 gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840 atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900 atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960 tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200 cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260 ccgggatgtt ccaggcactg tccgaaggct gcacacccta tgatattaac cagatgctga 1320 atgtcctggg agaccaccag gtctctggcc tggagcagct ggagagcatc atcaacttcg 1380 agaagctgac cgagtggaca agctccaatg tgatgcctat cctgtcccca ctgaccaagg 1440 gcatcctggg cttcgtgttt accctgacag tgccttctga gcggggcctg tcttgcatca 1500 gcgaggcaga cgcaaccaca ccagagtccg ccaatctggg cgaggagatc ctgtctcagc 1560 tgtacctgtg gccccgggtg acatatcact ccccttctta cgcctatcac cagttcgagc 1620 ggagagccaa gtacaagaga cacttcccag gctttggcca gtctctgctg ttcggctacc 1680 ccgtgtacgt gttcggcgat tgcgtgcagg gcgactggga tgccatccgg tttagatact 1740 gcgcaccacc tggatatgca ctgctgaggt gtaacgacac caattattcc gccctgctgg 1800 cagtgggcgc cctggagggc cctcgcaatc aggattggct gggcgtgcca aggcagctgg 1860 tgacacgcat gcaggccatc cagaacgcag gcctgtgcac cctggtggca atgctggagg 1920 agacaatctt ctggctgcag gcctttctga tggccctgac cgacagcggc cccaagacaa 1980 acatcatcgt ggattcccag tacgtgatgg gcatctccaa gccttctttc caggagtttg 2040 tggactggga gaacgtgagc ccagagctga attccaccga tcagccattc tggcaggcag 2100 gaatcctggc aaggaacctg gtgcctatgg tggccacagt gcagggccag aatctgaagt 2160 accagggcca gagcctggtc atcagcgcct ccatcatcgt gtttaacctg ctggagctgg 2220 agggcgacta tcgggacgat ggcaacgtgt gggtgcacac cccactgagc cccagaacac 2280 tgaacgcctg ggtgaaggcc gtggaggaga agaagggcat cccagtgcac ctggagctgg 2340 cctccatgac caatatggag ctgatgtcta gcatcgtgca ccagcaggtg aggacatacg 2400 gacccgtgtt catgtgcctg ggaggcctgc tgaccatggt ggcaggagcc gtgtggctga 2460 cagtgcgggt gctggagctg ttcagagccg cccagctggc caacgatgtg gtgctgcaga 2520 tcatggagct gtgcggagca gcctttcgcc aggtgtgcca caccacagtg ccatggccca 2580 atgcctccct gacccccaag tggaacaatg agacaacaca gcctcagatc gccaactgta 2640 gcgtgtacga cttcttcgtg tggctgcact actatagcgt gagggatacc ctgtggcccc 2700 gcgtgacata ccacatgaat aagtacgcct atcacatgct ggagaggcgc gccaagtata 2760 agagaggccc tggcccaggc gcaaagtttg tggcagcatg gaccctgaag gccgccgccg 2820 gccccggccc cggccagtat atcaaggcta acagtaagtt cattggaatc acagagctgg 2880 gacccggacc tggataatga gtttaaactc ccatttaaat gtgagggtta atgcttcgag 2940 cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 3000 aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 3060 ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt 3120 gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaataact ataacggtcc 3180 taaggtagcg agtgagtagt gttctggggc gggggaggac ctgcatgagg gccagaataa 3240 ctgaaatctg tgcttttctg tgtgttgcag cagcatgagc ggaagcggct cctttgaggg 3300 aggggtattc agcccttatc tgacggggcg tctcccctcc tgggcgggag tgcgtcagaa 3360 tgtgatggga tccacggtgg acggccggcc cgtgcagccc gcgaactctt caaccctgac 3420 ctatgcaacc ctgagctctt cgtcgttgga cgcagctgcc gccgcagctg ctgcatctgc 3480 cgccagcgcc gtgcgcggaa tggccatggg cgccggctac tacggcactc tggtggccaa 3540 ctcgagttcc accaataatc ccgccagcct gaacgaggag aagctgttgc tgctgatggc 3600 ccagctcgag gccttgaccc agcgcctggg cgagctgacc cagcaggtgg ctcagctgca 3660 ggagcagacg cgggccgcgg ttgccacggt gaaatccaaa taaaaaatga atcaataaat 3720 aaacggagac ggttgttgat tttaacacag agtctgaatc tttatttgat ttttcgcgcg 3780 cggtaggccc tggaccaccg gtctcgatca ttgagcaccc ggtggatctt ttccaggacc 3840 cggtagaggt gggcttggat gttgaggtac atgggcatga gcccgtcccg ggggtggagg 3900 tagctccatt gcagggcctc gtgctcgggg gtggtgttgt aaatcaccca gtcatagcag 3960 gggcgcaggg catggtgttg cacaatatct ttgaggagga gactgatggc cacgggcagc 4020 cctttggtgt aggtgtttac aaatctgttg agctgggagg gatgcatgcg gggggagatg 4080 aggtgcatct tggcctggat cttgagattg gcgatgttac cgcccagatc ccgcctgggg 4140 ttcatgttgt gcaggaccac cagcacggtg tatccggtgc acttggggaa tttatcatgc 4200 aacttggaag ggaaggcgtg aaagaatttg gcgacgcctt tgtgcccgcc caggttttcc 4260 atgcactcat ccatgatgat ggcgatgggc ccgtgggcgg cggcctgggc aaagacgttt 4320 cgggggtcgg acacatcata gttgtggtcc tgggtgaggt catcataggc cattttaatg 4380 aatttggggc ggagggtgcc ggactggggg acaaaggtac cctcgatccc gggggcgtag 4440 ttcccctcac agatctgcat ctcccaggct ttgagctcgg agggggggat catgtccacc 4500 tgcggggcga taaagaacac ggtttccggg gcgggggaga tgagctgggc cgaaagcaag 4560 ttccggagca gctgggactt gccgcagccg gtggggccgt agatgacccc gatgaccggc 4620 tgcaggtggt agttgaggga gagacagctg ccgtcctccc ggaggagggg ggccacctcg 4680 ttcatcatct cgcgcacgtg catgttctcg cgcaccagtt ccgccaggag gcgctctccc 4740 cccagggata ggagctcctg gagcgaggcg aagtttttca gcggcttgag tccgtcggcc 4800 atgggcattt tggagagggt ttgttgcaag agttccaggc ggtcccagag ctcggtgatg 4860 tgctctacgg catctcgatc cagcagacct cctcgtttcg cgggttggga cggctgcggg 4920 agtagggcac cagacgatgg gcgtccagcg cagccagggt ccggtccttc cagggtcgca 4980 gcgtccgcgt cagggtggtc tccgtcacgg tgaaggggtg cgcgccgggc tgggcgcttg 5040 cgagggtgcg cttcaggctc atccggctgg tcgaaaaccg ctcccgatcg gcgccctgcg 5100 cgtcggccag gtagcaattg accatgagtt cgtagttgag cgcctcggcc gcgtggcctt 5160 tggcgcggag cttacctttg gaagtctgcc cgcaggcggg acagaggagg gacttgaggg 5220 cgtagagctt gggggcgagg aagacggact cgggggcgta ggcgtccgcg ccgcagtggg 5280 cgcagacggt ctcgcactcc acgagccagg tgaggtcggg ctggtcgggg tcaaaaacca 5340 gtttcccgcc gttctttttg atgcgtttct tacctttggt ctccatgagc tcgtgtcccc 5400 gctgggtgac aaagaggctg tccgtgtccc cgtagaccga ctttatgggc cggtcctcga 5460 gcggtgtgcc gcggtcctcc tcgtagagga accccgccca ctccgagacg aaagcccggg 5520 tccaggccag cacgaaggag gccacgtggg acgggtagcg gtcgttgtcc accagcgggt 5580 ccaccttttc cagggtatgc aaacacatgt ccccctcgtc cacatccagg aaggtgattg 5640 gcttgtaagt gtaggccacg tgaccggggg tcccggccgg gggggtataa aagggtgcgg 5700 gtccctgctc gtcctcactg tcttccggat cgctgtccag gagcgccagc tgttggggta 5760 ggtattccct ctcgaaggcg ggcatgacct cggcactcag gttgtcagtt tctagaaacg 5820 aggaggattt gatattgacg gtgccggcgg agatgccttt caagagcccc tcgtccatct 5880 ggtcagaaaa gacgatcttt ttgttgtcga gcttggtggc gaaggagccg tagagggcgt 5940 tggagaggag cttggcgatg gagcgcatgg tctggttttt ttccttgtcg gcgcgctcct 6000 tggcggcgat gttgagctgc acgtactcgc gcgccacgca cttccattcg gggaagacgg 6060 tggtcagctc gtcgggcacg attctgacct gccagccccg attatgcagg gtgatgaggt 6120 ccacactggt ggccacctcg ccgcgcaggg gctcattagt ccagcagagg cgtccgccct 6180 tgcgcgagca gaaggggggc agggggtcca gcatgacctc gtcggggggg tcggcatcga 6240 tggtgaagat gccgggcagg aggtcggggt caaagtagct gatggaagtg gccagatcgt 6300 ccagggcagc ttgccattcg cgcacggcca gcgcgcgctc gtagggactg aggggcgtgc 6360 cccagggcat gggatgggta agcgcggagg cgtacatgcc gcagatgtcg tagacgtaga 6420 ggggctcctc gaggatgccg atgtaggtgg ggtagcagcg ccccccgcgg atgctggcgc 6480 gcacgtagtc atacagctcg tgcgaggggg cgaggagccc cgggcccagg ttggtgcgac 6540 tgggcttttc ggcgcggtag acgatctggc ggaaaatggc atgcgagttg gaggagatgg 6600 tgggcctttg gaagatgttg aagtgggcgt ggggcagtcc gaccgagtcg cggatgaagt 6660 gggcgtagga gtcttgcagc ttggcgacga gctcggcggt gactaggacg tccagagcgc 6720 agtagtcgag ggtctcctgg atgatgtcat acttgagctg tcccttttgt ttccacagct 6780 cgcggttgag aaggaactct tcgcggtcct tccagtactc ttcgaggggg aacccgtcct 6840 gatctgcacg gtaagagcct agcatgtaga actggttgac ggccttgtag gcgcagcagc 6900 ccttctccac ggggagggcg taggcctggg cggccttgcg cagggaggtg tgcgtgaggg 6960 cgaaagtgtc cctgaccatg accttgagga actggtgctt gaagtcgata tcgtcgcagc 7020 ccccctgctc ccagagctgg aagtccgtgc gcttcttgta ggcggggttg ggcaaagcga 7080 aagtaacatc gttgaagagg atcttgcccg cgcggggcat aaagttgcga gtgatgcgga 7140 aaggttgggg cacctcggcc cggttgttga tgacctgggc ggcgagcacg atctcgtcga 7200 agccgttgat gttgtggccc acgatgtaga gttccacgaa tcgcggacgg cccttgacgt 7260 ggggcagttt cttgagctcc tcgtaggtga gctcgtcggg gtcgctgagc ccgtgctgct 7320 cgagcgccca gtcggcgaga tgggggttgg cgcggaggaa ggaagtccag agatccacgg 7380 ccagggcggt ttgcagacgg tcccggtact gacggaactg ctgcccgacg gccatttttt 7440 cgggggtgac gcagtagaag gtgcgggggt ccccgtgcca gcgatcccat ttgagctgga 7500 gggcgagatc gagggcgagc tcgacgagcc ggtcgtcccc ggagagtttc atgaccagca 7560 tgaaggggac gagctgcttg ccgaaggacc ccatccaggt gtaggtttcc acatcgtagg 7620 tgaggaagag cctttcggtg cgaggatgcg agccgatggg gaagaactgg atctcctgcc 7680 accaattgga ggaatggctg ttgatgtgat ggaagtagaa atgccgacgg cgcgccgaac 7740 actcgtgctt gtgtttatac aagcggccac agtgctcgca acgctgcacg ggatgcacgt 7800 gctgcacgag ctgtacctga gttcctttga cgaggaattt cagtgggaag tggagtcgtg 7860 gcgcctgcat ctcgtgctgt actacgtcgt ggtggtcggc ctggccctct tctgcctcga 7920 tggtggtcat gctgacgagc ccgcgcggga ggcaggtcca gacctcggcg cgagcgggtc 7980 ggagagcgag gacgagggcg cgcaggccgg agctgtccag ggtcctgaga cgctgcggag 8040 tcaggtcagt gggcagcggc ggcgcgcggt tgacttgcag gagtttttcc agggcgcgcg 8100 ggaggtccag atggtacttg atctccaccg cgccattggt ggcgacgtcg atggcttgca 8160 gggtcccgtg cccctggggt gtgaccaccg tcccccgttt cttcttgggc ggctggggcg 8220 acgggggcgg tgcctcttcc atggttagaa gcggcggcga ggacgcgcgc cgggcggcag 8280 gggcggctcg gggcccggag gcaggggcgg caggggcacg tcggcgccgc gcgcgggtag 8340 gttctggtac tgcgcccgga gaagactggc gtgagcgacg acgcgacggt tgacgtcctg 8400 gatctgacgc ctctgggtga aggccacggg acccgtgagt ttgaacctga aagagagttc 8460 gacagaatca atctcggtat cgttgacggc ggcctgccgc aggatctctt gcacgtcgcc 8520 cgagttgtcc tggtaggcga tctcggtcat gaactgctcg atctcctcct cttgaaggtc 8580 tccgcggccg gcgcgctcca cggtggccgc gaggtcgttg gagatgcggc ccatgagctg 8640 cgagaaggcg ttcatgcccg cctcgttcca gacgcggctg tagaccacga cgccctcggg 8700 atcgcgggcg cgcatgacca cctgggcgag gttgagctcc acgtggcgcg tgaagaccgc 8760 gtagttgcag aggcgctggt agaggtagtt gagcgtggtg gcgatgtgct cggtgacgaa 8820 gaaatacatg atccagcggc ggagcggcat ctcgctgacg tcgcccagcg cctccaaacg 8880 ttccatggcc tcgtaaaagt ccacggcgaa gttgaaaaac tgggagttgc gcgccgagac 8940 ggtcaactcc tcctccagaa gacggatgag ctcggcgatg gtggcgcgca cctcgcgctc 9000 gaaggccccc gggagttcct ccacttcctc ttcttcctcc tccactaaca tctcttctac 9060 ttcctcctca ggcggcagtg gtggcggggg agggggcctg cgtcgccggc ggcgcacggg 9120 cagacggtcg atgaagcgct cgatggtctc gccgcgccgg cgtcgcatgg tctcggtgac 9180 ggcgcgcccg tcctcgcggg gccgcagcgt gaagacgccg ccgcgcatct ccaggtggcc 9240 gggggggtcc ccgttgggca gggagagggc gctgacgatg catcttatca attgccccgt 9300 agggactccg cgcaaggacc tgagcgtctc gagatccacg ggatctgaaa accgctgaac 9360 gaaggcttcg agccagtcgc agtcgcaagg taggctgagc acggtttctt ctggcgggtc 9420 atgttggttg ggagcggggc gggcgatgct gctggtgatg aagttgaaat aggcggttct 9480 gagacggcgg atggtggcga ggagcaccag gtctttgggc ccggcttgct ggatgcgcag 9540 acggtcggcc atgccccagg cgtggtcctg acacctggcc aggtccttgt agtagtcctg 9600 catgagccgc tccacgggca cctcctcctc gcccgcgcgg ccgtgcatgc gcgtgagccc 9660 gaagccgcgc tggggctgga cgagcgccag gtcggcgacg acgcgctcgg cgaggatggc 9720 ttgctggatc tgggtgaggg tggtctggaa gtcatcaaag tcgacgaagc ggtggtaggc 9780 tccggtgttg atggtgtagg agcagttggc catgacggac cagttgacgg tctggtggcc 9840 cggacgcacg agctcgtggt acttgaggcg cgagtaggcg cgcgtgtcga agatgtagtc 9900 gttgcaggtg cgcaccaggt actggtagcc gatgaggaag tgcggcggcg gctggcggta 9960 gagcggccat cgctcggtgg cgggggcgcc gggcgcgagg tcctcgagca tggtgcggtg 10020 gtagccgtag atgtacctgg acatccaggt gatgccggcg gcggtggtgg aggcgcgcgg 10080 gaactcgcgg acgcggttcc agatgttgcg cagcggcagg aagtagttca tggtgggcac 10140 ggtctggccc gtgaggcgcg cgcagtcgtg gatgctctat acgggcaaaa acgaaagcgg 10200 tcagcggctc gactccgtgg cctggaggct aagcgaacgg gttgggctgc gcgtgtaccc 10260 cggttcgaat ctcgaatcag gctggagccg cagctaacgt ggtattggca ctcccgtctc 10320 gacccaagcc tgcaccaacc ctccaggata cggaggcggg tcgttttgca actttttttt 10380 ggaggccgga tgagactagt aagcgcggaa agcggccgac cgcgatggct cgctgccgta 10440 gtctggagaa gaatcgccag ggttgcgttg cggtgtgccc cggttcgagg ccggccggat 10500 tccgcggcta acgagggcgt ggctgccccg tcgtttccaa gaccccatag ccagccgact 10560 tctccagtta cggagcgagc ccctcttttg ttttgtttgt ttttgccaga tgcatcccgt 10620 actgcggcag atgcgccccc accaccctcc accgcaacaa cagccccctc cacagccggc 10680 gcttctgccc ccgccccagc agcaacttcc agccacgacc gccgcggccg ccgtgagcgg 10740 ggctggacag agttatgatc accagctggc cttggaagag ggcgaggggc tggcgcgcct 10800 gggggcgtcg tcgccggagc ggcacccgcg cgtgcagatg aaaagggacg ctcgcgaggc 10860 ctacgtgccc aagcagaacc tgttcagaga caggagcggc gaggagcccg aggagatgcg 10920 cgcggcccgg ttccacgcgg ggcgggagct gcggcgcggc ctggaccgaa agagggtgct 10980 gagggacgag gatttcgagg cggacgagct gacggggatc agccccgcgc gcgcgcacgt 11040 ggccgcggcc aacctggtca cggcgtacga gcagaccgtg aaggaggaga gcaacttcca 11100 aaaatccttc aacaaccacg tgcgcaccct gatcgcgcgc gaggaggtga ccctgggcct 11160 gatgcacctg tgggacctgc tggaggccat cgtgcagaac cccaccagca agccgctgac 11220 ggcgcagctg ttcctggtgg tgcagcatag tcgggacaac gaagcgttca gggaggcgct 11280 gctgaatatc accgagcccg agggccgctg gctcctggac ctggtgaaca ttctgcagag 11340 catcgtggtg caggagcgcg ggctgccgct gtccgagaag ctggcggcca tcaacttctc 11400 ggtgctgagt ttgggcaagt actacgctag gaagatctac aagaccccgt acgtgcccat 11460 agacaaggag gtgaagatcg acgggtttta catgcgcatg accctgaaag tgctgaccct 11520 gagcgacgat ctgggggtgt accgcaacga caggatgcac cgtgcggtga gcgccagcag 11580 gcggcgcgag ctgagcgacc aggagctgat gcatagtctg cagcgggccc tgaccggggc 11640 cgggaccgag ggggagagct actttgacat gggcgcggac ctgcactggc agcccagccg 11700 ccgggccttg gaggcggcgg caggacccta cgtagaagag gtggacgatg aggtggacga 11760 ggagggcgag tacctggaag actgatggcg cgaccgtatt tttgctagat gcaacaacaa 11820 cagccacctc ctgatcccgc gatgcgggcg gcgctgcaga gccagccgtc cggcattaac 11880 tcctcggacg attggaccca ggccatgcaa cgcatcatgg cgctgacgac ccgcaacccc 11940 gaagccttta gacagcagcc ccaggccaac cggctctcgg ccatcctgga ggccgtggtg 12000 ccctcgcgct ccaaccccac gcacgagaag gtcctggcca tcgtgaacgc gctggtggag 12060 aacaaggcca tccgcggcga cgaggccggc ctggtgtaca acgcgctgct ggagcgcgtg 12120 gcccgctaca acagcaccaa cgtgcagacc aacctggacc gcatggtgac cgacgtgcgc 12180 gaggccgtgg cccagcgcga gcggttccac cgcgagtcca acctgggatc catggtggcg 12240 ctgaacgcct tcctcagcac ccagcccgcc aacgtgcccc ggggccagga ggactacacc 12300 aacttcatca gcgccctgcg cctgatggtg accgaggtgc cccagagcga ggtgtaccag 12360 tccgggccgg actacttctt ccagaccagt cgccagggct tgcagaccgt gaacctgagc 12420 caggctttca agaacttgca gggcctgtgg ggcgtgcagg ccccggtcgg ggaccgcgcg 12480 acggtgtcga gcctgctgac gccgaactcg cgcctgctgc tgctgctggt ggcccccttc 12540 acggacagcg gcagcatcaa ccgcaactcg tacctgggct acctgattaa cctgtaccgc 12600 gaggccatcg gccaggcgca cgtggacgag cagacctacc aggagatcac ccacgtgagc 12660 cgcgccctgg gccaggacga cccgggcaac ctggaagcca ccctgaactt tttgctgacc 12720 aaccggtcgc agaagatccc gccccagtac gcgctcagca ccgaggagga gcgcatcctg 12780 cgttacgtgc agcagagcgt gggcctgttc ctgatgcagg agggggccac ccccagcgcc 12840 gcgctcgaca tgaccgcgcg caacatggag cccagcatgt acgccagcaa ccgcccgttc 12900 atcaataaac tgatggacta cttgcatcgg gcggccgcca tgaactctga ctatttcacc 12960 aacgccatcc tgaatcccca ctggctcccg ccgccggggt tctacacggg cgagtacgac 13020 atgcccgacc ccaatgacgg gttcctgtgg gacgatgtgg acagcagcgt gttctccccc 13080 cgaccgggtg ctaacgagcg ccccttgtgg aagaaggaag gcagcgaccg acgcccgtcc 13140 tcggcgctgt ccggccgcga gggtgctgcc gcggcggtgc ccgaggccgc cagtcctttc 13200 ccgagcttgc ccttctcgct gaacagtatc cgcagcagcg agctgggcag gatcacgcgc 13260 ccgcgcttgc tgggcgaaga ggagtacttg aatgactcgc tgttgagacc cgagcgggag 13320 aagaacttcc ccaataacgg gatagaaagc ctggtggaca agatgagccg ctggaagacg 13380 tatgcgcagg agcacaggga cgatccccgg gcgtcgcagg gggccacgag ccggggcagc 13440 gccgcccgta aacgccggtg gcacgacagg cagcggggac agatgtggga cgatgaggac 13500 tccgccgacg acagcagcgt gttggacttg ggtgggagtg gtaacccgtt cgctcacctg 13560 cgcccccgta tcgggcgcat gatgtaagag aaaccgaaaa taaatgatac tcaccaaggc 13620 catggcgacc agcgtgcgtt cgtttcttct ctgttgttgt tgtatctagt atgatgaggc 13680 gtgcgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag gcgatggcgg 13740 cggcggcgat gcagcccccg ctggaggctc cttacgtgcc cccgcggtac ctggcgccta 13800 cggaggggcg gaacagcatt cgttactcgg agctggcacc cttgtacgat accacccggt 13860 tgtacctggt ggacaacaag tcggcggaca tcgcctcgct gaactaccag aacgaccaca 13920 gcaacttcct gaccaccgtg gtgcagaaca atgacttcac ccccacggag gccagcaccc 13980 agaccatcaa ctttgacgag cgctcgcggt ggggcggcca gctgaaaacc atcatgcaca 14040 ccaacatgcc caacgtgaac gagttcatgt acagcaacaa gttcaaggcg cgggtgatgg 14100 tctcccgcaa gacccccaat ggggtgacag tgacagagga ttatgatggt agtcaggatg 14160 agctgaagta tgaatgggtg gaatttgagc tgcccgaagg caacttctcg gtgaccatga 14220 ccatcgacct gatgaacaac gccatcatcg acaattactt ggcggtgggg cggcagaacg 14280 gggtgctgga gagcgacatc ggcgtgaagt tcgacactag gaacttcagg ctgggctggg 14340 accccgtgac cgagctggtc atgcccgggg tgtacaccaa cgaggctttc catcccgata 14400 ttgtcttgct gcccggctgc ggggtggact tcaccgagag ccgcctcagc aacctgctgg 14460 gcattcgcaa gaggcagccc ttccaggaag gcttccagat catgtacgag gatctggagg 14520 ggggcaacat ccccgcgctc ctggatgtcg acgcctatga gaaaagcaag gaggatgcag 14580 cagctgaagc aactgcagcc gtagctaccg cctctaccga ggtcaggggc gataattttg 14640 caagcgccgc agcagtggca gcggccgagg cggctgaaac cgaaagtaag atagtcattc 14700 agccggtgga gaaggatagc aagaacagga gctacaacgt actaccggac aagataaaca 14760 ccgcctaccg cagctggtac ctagcctaca actatggcga ccccgagaag ggcgtgcgct 14820 cctggacgct gctcaccacc tcggacgtca cctgcggcgt ggagcaagtc tactggtcgc 14880 tgcccgacat gatgcaagac ccggtcacct tccgctccac gcgtcaagtt agcaactacc 14940 cggtggtggg cgccgagctc ctgcccgtct actccaagag cttcttcaac gagcaggccg 15000 tctactcgca gcagctgcgc gccttcacct cgcttacgca cgtcttcaac cgcttccccg 15060 agaaccagat cctcgtccgc ccgcccgcgc ccaccattac caccgtcagt gaaaacgttc 15120 ctgctctcac agatcacggg accctgccgc tgcgcagcag tatccgggga gtccagcgcg 15180 tgaccgttac tgacgccaga cgccgcacct gcccctacgt ctacaaggcc ctgggcatag 15240 tcgcgccgcg cgtcctctcg agccgcacct tctaaatgtc cattctcatc tcgcccagta 15300 ataacaccgg ttggggcctg cgcgcgccca gcaagatgta cggaggcgct cgccaacgct 15360 ccacgcaaca ccccgtgcgc gtgcgcgggc acttccgcgc tccctggggc gccctcaagg 15420 gccgcgtgcg gtcgcgcacc accgtcgacg acgtgatcga ccaggtggtg gccgacgcgc 15480 gcaactacac ccccgccgcc gcgcccgtct ccaccgtgga cgccgtcatc gacagcgtgg 15540 tggccgacgc gcgccggtac gcccgcgcca agagccggcg gcggcgcatc gcccggcggc 15600 accggagcac ccccgccatg cgcgcggcgc gagccttgct gcgcagggcc aggcgcacgg 15660 gacgcagggc catgctcagg gcggccagac gcgcggcttc aggcgccagc gccggcagga 15720 cccggagacg cgcggccacg gcggcggcag cggccatcgc cagcatgtcc cgcccgcggc 15780 gagggaacgt gtactgggtg cgcgacgccg ccaccggtgt gcgcgtgccc gtgcgcaccc 15840 gcccccctcg cacttgaaga tgttcacttc gcgatgttga tgtgtcccag cggcgaggag 15900 gatgtccaag cgcaaattca aggaagagat gctccaggtc atcgcgcctg agatctacgg 15960 ccctgcggtg gtgaaggagg aaagaaagcc ccgcaaaatc aagcgggtca aaaaggacaa 16020 aaaggaagaa gaaagtgatg tggacggatt ggtggagttt gtgcgcgagt tcgccccccg 16080 gcggcgcgtg cagtggcgcg ggcggaaggt gcaaccggtg ctgagacccg gcaccaccgt 16140 ggtcttcacg cccggcgagc gctccggcac cgcttccaag cgctcctacg acgaggtgta 16200 cggggatgat gatattctgg agcaggcggc cgagcgcctg ggcgagtttg cttacggcaa 16260 gcgcagccgt tccgcaccga aggaagaggc ggtgtccatc ccgctggacc acggcaaccc 16320 cacgccgagc ctcaagcccg tgaccttgca gcaggtgctg ccgaccgcgg cgccgcgccg 16380 ggggttcaag cgcgagggcg aggatctgta ccccaccatg cagctgatgg tgcccaagcg 16440 ccagaagctg gaagacgtgc tggagaccat gaaggtggac ccggacgtgc agcccgaggt 16500 caaggtgcgg cccatcaagc aggtggcccc gggcctgggc gtgcagaccg tggacatcaa 16560 gattcccacg gagcccatgg aaacgcagac cgagcccatg atcaagccca gcaccagcac 16620 catggaggtg cagacggatc cctggatgcc atcggctcct agtcgaagac cccggcgcaa 16680 gtacggcgcg gccagcctgc tgatgcccaa ctacgcgctg catccttcca tcatccccac 16740 gccgggctac cgcggcacgc gcttctaccg cggtcatacc agcagccgcc gccgcaagac 16800 caccactcgc cgccgccgtc gccgcaccgc cgctgcaacc acccctgccg ccctggtgcg 16860 gagagtgtac cgccgcggcc gcgcacctct gaccctgccg cgcgcgcgct accacccgag 16920 catcgccatt taaactttcg cctgctttgc agatcaatgg ccctcacatg ccgccttcgc 16980 gttcccatta cgggctaccg aggaagaaaa ccgcgccgta gaaggctggc ggggaacggg 17040 atgcgtcgcc accaccaccg gcggcggcgc gccatcagca agcggttggg gggaggcttc 17100 ctgcccgcgc tgatccccat catcgccgcg gcgatcgggg cgatccccgg cattgcttcc 17160 gtggcggtgc aggcctctca gcgccactga gacacacttg gaaacatctt gtaataaacc 17220 aatggactct gacgctcctg gtcctgtgat gtgttttcgt agacagatgg aagacatcaa 17280 tttttcgtcc ctggctccgc gacacggcac gcggccgttc atgggcacct ggagcgacat 17340 cggcaccagc caactgaacg ggggcgcctt caattggagc agtctctgga gcgggcttaa 17400 gaatttcggg tccacgctta aaacctatgg cagcaaggcg tggaacagca ccacagggca 17460 ggcgctgagg gataagctga aagagcagaa cttccagcag aaggtggtcg atgggctcgc 17520 ctcgggcatc aacggggtgg tggacctggc caaccaggcc gtgcagcggc agatcaacag 17580 ccgcctggac ccggtgccgc ccgccggctc cgtggagatg ccgcaggtgg aggaggagct 17640 gcctcccctg gacaagcggg gcgagaagcg accccgcccc gatgcggagg agacgctgct 17700 gacgcacacg gacgagccgc ccccgtacga ggaggcggtg aaactgggtc tgcccaccac 17760 gcggcccatc gcgcccctgg ccaccggggt gctgaaaccc gaaaagcccg cgaccctgga 17820 cttgcctcct ccccagcctt cccgcccctc tacagtggct aagcccctgc cgccggtggc 17880 cgtggcccgc gcgcgacccg ggggcaccgc ccgccctcat gcgaactggc agagcactct 17940 gaacagcatc gtgggtctgg gagtgcagag tgtgaagcgc cgccgctgct attaaaccta 18000 ccgtagcgct taacttgctt gtctgtgtgt gtatgtatta tgtcgccgcc gccgctgtcc 18060 accagaagga ggagtgaaga ggcgcgtcgc cgagttgcaa gatggccacc ccatcgatgc 18120 tgccccagtg ggcgtacatg cacatcgccg gacaggacgc ttcggagtac ctgagtccgg 18180 gtctggtgca gtttgcccgc gccacagaca cctacttcag tctggggaac aagtttagga 18240 accccacggt ggcgcccacg cacgatgtga ccaccgaccg cagccagcgg ctgacgctgc 18300 gcttcgtgcc cgtggaccgc gaggacaaca cctactcgta caaagtgcgc tacacgctgg 18360 ccgtgggcga caaccgcgtg ctggacatgg ccagcaccta ctttgacatc cgcggcgtgc 18420 tggatcgggg ccctagcttc aaaccctact ccggcaccgc ctacaacagt ctggccccca 18480 agggagcacc caacacttgt cagtggacat ataaagccga tggtgaaact gccacagaaa 18540 aaacctatac atatggaaat gcacccgtgc agggcattaa catcacaaaa gatggtattc 18600 aacttggaac tgacaccgat gatcagccaa tctacgcaga taaaacctat cagcctgaac 18660 ctcaagtggg tgatgctgaa tggcatgaca tcactggtac tgatgaaaag tatggaggca 18720 gagctcttaa gcctgatacc aaaatgaagc cttgttatgg ttcttttgcc aagcctacta 18780 ataaagaagg aggtcaggca aatgtgaaaa caggaacagg cactactaaa gaatatgaca 18840 tagacatggc tttctttgac aacagaagtg cggctgctgc tggcctagct ccagaaattg 18900 ttttgtatac tgaaaatgtg gatttggaaa ctccagatac ccatattgta tacaaagcag 18960 gcacagatga cagcagctct tctattaatt tgggtcagca agccatgccc aacagaccta 19020 actacattgg tttcagagac aactttatcg ggctcatgta ctacaacagc actggcaata 19080 tgggggtgct ggccggtcag gcttctcagc tgaatgctgt ggttgacttg caagacagaa 19140 acaccgagct gtcctaccag ctcttgcttg actctctggg tgacagaacc cggtatttca 19200 gtatgtggaa tcaggcggtg gacagctatg atcctgatgt gcgcattatt gaaaatcatg 19260 gtgtggagga tgaacttccc aactattgtt tccctctgga tgctgttggc agaacagata 19320 cttatcaggg aattaaggct aatggaactg atcaaaccac atggaccaaa gatgacagtg 19380 tcaatgatgc taatgagata ggcaagggta atccattcgc catggaaatc aacatccaag 19440 ccaacctgtg gaggaacttc ctctacgcca acgtggccct gtacctgccc gactcttaca 19500 agtacacgcc ggccaatgtt accctgccca ccaacaccaa cacctacgat tacatgaacg 19560 gccgggtggt ggcgccctcg ctggtggact cctacatcaa catcggggcg cgctggtcgc 19620 tggatcccat ggacaacgtg aaccccttca accaccaccg caatgcgggg ctgcgctacc 19680 gctccatgct cctgggcaac gggcgctacg tgcccttcca catccaggtg ccccagaaat 19740 ttttcgccat caagagcctc ctgctcctgc ccgggtccta cacctacgag tggaacttcc 19800 gcaaggacgt caacatgatc ctgcagagct ccctcggcaa cgacctgcgc acggacgggg 19860 cctccatctc cttcaccagc atcaacctct acgccacctt cttccccatg gcgcacaaca 19920 cggcctccac gctcgaggcc atgctgcgca acgacaccaa cgaccagtcc ttcaacgact 19980 acctctcggc ggccaacatg ctctacccca tcccggccaa cgccaccaac gtgcccatct 20040 ccatcccctc gcgcaactgg gccgccttcc gcggctggtc cttcacgcgt ctcaagacca 20100 aggagacgcc ctcgctgggc tccgggttcg acccctactt cgtctactcg ggctccatcc 20160 cctacctcga cggcaccttc tacctcaacc acaccttcaa gaaggtctcc atcaccttcg 20220 actcctccgt cagctggccc ggcaacgacc ggctcctgac gcccaacgag ttcgaaatca 20280 agcgcaccgt cgacggcgag ggctacaacg tggcccagtg caacatgacc aaggactggt 20340 tcctggtcca gatgctggcc cactacaaca tcggctacca gggcttctac gtgcccgagg 20400 gctacaagga ccgcatgtac tccttcttcc gcaacttcca gcccatgagc cgccaggtgg 20460 tggacgaggt caactacaag gactaccagg ccgtcaccct ggcctaccag cacaacaact 20520 cgggcttcgt cggctacctc gcgcccacca tgcgccaggg ccagccctac cccgccaact 20580 acccctaccc gctcatcggc aagagcgccg tcaccagcgt cacccagaaa aagttcctct 20640 gcgacagggt catgtggcgc atccccttct ccagcaactt catgtccatg ggcgcgctca 20700 ccgacctcgg ccagaacatg ctctatgcca actccgccca cgcgctagac atgaatttcg 20760 aagtcgaccc catggatgag tccacccttc tctatgttgt cttcgaagtc ttcgacgtcg 20820 tccgagtgca ccagccccac cgcggcgtca tcgaggccgt ctacctgcgc acccccttct 20880 cggccggtaa cgccaccacc taagctcttg cttcttgcaa gccatggccg cgggctccgg 20940 cgagcaggag ctcagggcca tcatccgcga cctgggctgc gggccctact tcctgggcac 21000 cttcgataag cgcttcccgg gattcatggc cccgcacaag ctggcctgcg ccatcgtcaa 21060 cacggccggc cgcgagaccg ggggcgagca ctggctggcc ttcgcctgga acccgcgctc 21120 gaacacctgc tacctcttcg accccttcgg gttctcggac gagcgcctca agcagatcta 21180 ccagttcgag tacgagggcc tgctgcgccg cagcgccctg gccaccgagg accgctgcgt 21240 caccctggaa aagtccaccc agaccgtgca gggtccgcgc tcggccgcct gcgggctctt 21300 ctgctgcatg ttcctgcacg ccttcgtgca ctggcccgac cgccccatgg acaagaaccc 21360 caccatgaac ttgctgacgg gggtgcccaa cggcatgctc cagtcgcccc aggtggaacc 21420 caccctgcgc cgcaaccagg aggcgctcta ccgcttcctc aactcccact ccgcctactt 21480 tcgctcccac cgcgcgcgca tcgagaaggc caccgccttc gaccgcatga atcaagacat 21540 gtaaaccgtg tgtgtatgtt aaatgtcttt aataaacagc actttcatgt tacacatgca 21600 tctgagatga tttatttaga aatcgaaagg gttctgccgg gtctcggcat ggcccgcggg 21660 cagggacacg ttgcggaact ggtacttggc cagccacttg aactcgggga tcagcagttt 21720 gggcagcggg gtgtcgggga aggagtcggt ccacagcttc cgcgtcagtt gcagggcgcc 21780 cagcaggtcg ggcgcggaga tcttgaaatc gcagttggga cccgcgttct gcgcgcggga 21840 gttgcggtac acggggttgc agcactggaa caccatcagg gccgggtgct tcacgctcgc 21900 cagcaccgtc gcgtcggtga tgctctccac gtcgaggtcc tcggcgttgg ccatcccgaa 21960 gggggtcatc ttgcaggtct gccttcccat ggtgggcacg cacccgggct tgtggttgca 22020 atcgcagtgc agggggatca gcatcatctg ggcctggtcg gcgttcatcc ccgggtacat 22080 ggccttcatg aaagcctcca attgcctgaa cgcctgctgg gccttggctc cctcggtgaa 22140 gaagaccccg caggacttgc tagagaactg gttggtggcg cacccggcgt cgtgcacgca 22200 gcagcgcgcg tcgttgttgg ccagctgcac cacgctgcgc ccccagcggt tctgggtgat 22260 cttggcccgg tcggggttct ccttcagcgc gcgctgcccg ttctcgctcg ccacatccat 22320 ctcgatcatg tgctccttct ggatcatggt ggtcccgtgc aggcaccgca gcttgccctc 22380 ggcctcggtg cacccgtgca gccacagcgc gcacccggtg cactcccagt tcttgtgggc 22440 gatctgggaa tgcgcgtgca cgaagccctg caggaagcgg cccatcatgg tggtcagggt 22500 cttgttgcta gtgaaggtca gcggaatgcc gcggtgctcc tcgttgatgt acaggtggca 22560 gatgcggcgg tacacctcgc cctgctcggg catcagctgg aagttggctt tcaggtcggt 22620 ctccacgcgg tagcggtcca tcagcatagt catgatttcc atacccttct cccaggccga 22680 gacgatgggc aggctcatag ggttcttcac catcatctta gcgctagcag ccgcggccag 22740 ggggtcgctc tcgtccaggg tctcaaagct ccgcttgccg tccttctcgg tgatccgcac 22800 cggggggtag ctgaagccca cggccgccag ctcctcctcg gcctgtcttt cgtcctcgct 22860 gtcctggctg acgtcctgca ggaccacatg cttggtcttg cggggtttct tcttgggcgg 22920 cagcggcggc ggagatgttg gagatggcga gggggagcgc gagttctcgc tcaccactac 22980 tatctcttcc tcttcttggt ccgaggccac gcggcggtag gtatgtctct tcgggggcag 23040 aggcggaggc gacgggctct cgccgccgcg acttggcgga tggctggcag agccccttcc 23100 gcgttcgggg gtgcgctccc ggcggcgctc tgactgactt cctccgcggc cggccattgt 23160 gttctcctag ggaggaacaa caagcatgga gactcagcca tcgccaacct cgccatctgc 23220 ccccaccgcc gacgagaagc agcagcagca gaatgaaagc ttaaccgccc cgccgcccag 23280 ccccgccacc tccgacgcgg ccgtcccaga catgcaagag atggaggaat ccatcgagat 23340 tgacctgggc tatgtgacgc ccgcggagca cgaggaggag ctggcagtgc gcttttcaca 23400 agaagagata caccaagaac agccagagca ggaagcagag aatgagcaga gtcaggctgg 23460 gctcgagcat gacggcgact acctccacct gagcgggggg gaggacgcgc tcatcaagca 23520 tctggcccgg caggccacca tcgtcaagga tgcgctgctc gaccgcaccg aggtgcccct 23580 cagcgtggag gagctcagcc gcgcctacga gttgaacctc ttctcgccgc gcgtgccccc 23640 caagcgccag cccaatggca cctgcgagcc caacccgcgc ctcaacttct acccggtctt 23700 cgcggtgccc gaggccctgg ccacctacca catctttttc aagaaccaaa agatccccgt 23760 ctcctgccgc gccaaccgca cccgcgccga cgcccttttc aacctgggtc ccggcgcccg 23820 cctacctgat atcgcctcct tggaagaggt tcccaagatc ttcgagggtc tgggcagcga 23880 cgagactcgg gccgcgaacg ctctgcaagg agaaggagga gagcatgagc accacagcgc 23940 cctggtcgag ttggaaggcg acaacgcgcg gctggcggtg ctcaaacgca cggtcgagct 24000 gacccatttc gcctacccgg ctctgaacct gccccccaaa gtcatgagcg cggtcatgga 24060 ccaggtgctc atcaagcgcg cgtcgcccat ctccgaggac gagggcatgc aagactccga 24120 ggagggcaag cccgtggtca gcgacgagca gctggcccgg tggctgggtc ctaatgctag 24180 tccccagagt ttggaagagc ggcgcaaact catgatggcc gtggtcctgg tgaccgtgga 24240 gctggagtgc ctgcgccgct tcttcgccga cgcggagacc ctgcgcaagg tcgaggagaa 24300 cctgcactac ctcttcaggc acgggttcgt gcgccaggcc tgcaagatct ccaacgtgga 24360 gctgaccaac ctggtctcct acatgggcat cttgcacgag aaccgcctgg ggcagaacgt 24420 gctgcacacc accctgcgcg gggaggcccg gcgcgactac atccgcgact gcgtctacct 24480 ctacctctgc cacacctggc agacgggcat gggcgtgtgg cagcagtgtc tggaggagca 24540 gaacctgaaa gagctctgca agctcctgca gaagaacctc aagggtctgt ggaccgggtt 24600 cgacgagcgc accaccgcct cggacctggc cgacctcatt ttccccgagc gcctcaggct 24660 gacgctgcgc aacggcctgc ccgactttat gagccaaagc atgttgcaaa actttcgctc 24720 tttcatcctc gaacgctccg gaatcctgcc cgccacctgc tccgcgctgc cctcggactt 24780 cgtgccgctg accttccgcg agtgcccccc gccgctgtgg agccactgct acctgctgcg 24840 cctggccaac tacctggcct accactcgga cgtgatcgag gacgtcagcg gcgagggcct 24900 gctcgagtgc cactgccgct gcaacctctg cacgccgcac cgctccctgg cctgcaaccc 24960 ccagctgctg agcgagaccc agatcatcgg caccttcgag ttgcaagggc ccagcgaagg 25020 cgagggttca gccgccaagg ggggtctgaa actcaccccg gggctgtgga cctcggccta 25080 cttgcgcaag ttcgtgcccg aggactacca tcccttcgag atcaggttct acgaggacca 25140 atcccatccg cccaaggccg agctgtcggc ctgcgtcatc acccaggggg cgatcctggc 25200 ccaattgcaa gccatccaga aatcccgcca agaattcttg ctgaaaaagg gccgcggggt 25260 ctacctcgac ccccagaccg gtgaggagct caaccccggc ttcccccagg atgccccgag 25320 gaaacaagaa gctgaaagtg gagctgccgc ccgtggagga tttggaggaa gactgggaga 25380 acagcagtca ggcagaggag gaggagatgg aggaagactg ggacagcact caggcagagg 25440 aggacagcct gcaagacagt ctggaggaag acgaggagga ggcagaggag gaggtggaag 25500 aagcagccgc cgccagaccg tcgtcctcgg cgggggagaa agcaagcagc acggatacca 25560 tctccgctcc gggtcggggt cccgctcgac cacacagtag atgggacgag accggacgat 25620 tcccgaaccc caccacccag accggtaaga aggagcggca gggatacaag tcctggcggg 25680 ggcacaaaaa cgccatcgtc tcctgcttgc aggcctgcgg gggcaacatc tccttcaccc 25740 ggcgctacct gctcttccac cgcggggtga actttccccg caacatcttg cattactacc 25800 gtcacctcca cagcccctac tacttccaag aagaggcagc agcagcagaa aaagaccagc 25860 agaaaaccag cagctagaaa atccacagcg gcggcagcag gtggactgag gatcgcggcg 25920 aacgagccgg cgcaaacccg ggagctgagg aaccggatct ttcccaccct ctatgccatc 25980 ttccagcaga gtcgggggca ggagcaggaa ctgaaagtca agaaccgttc tctgcgctcg 26040 ctcacccgca gttgtctgta tcacaagagc gaagaccaac ttcagcgcac tctcgaggac 26100 gccgaggctc tcttcaacaa gtactgcgcg ctcactctta aagagtagcc cgcgcccgcc 26160 cagtcgcaga aaaaggcggg aattacgtca cctgtgccct tcgccctagc cgcctccacc 26220 catcatcatg agcaaagaga ttcccacgcc ttacatgtgg agctaccagc cccagatggg 26280 cctggccgcc ggtgccgccc aggactactc cacccgcatg aattggctca gcgccgggcc 26340 cgcgatgatc tcacgggtga atgacatccg cgcccaccga aaccagatac tcctagaaca 26400 gtcagcgctc accgccacgc cccgcaatca cctcaatccg cgtaattggc ccgccgccct 26460 ggtgtaccag gaaattcccc agcccacgac cgtactactt ccgcgagacg cccaggccga 26520 agtccagctg actaactcag gtgtccagct ggcgggcggc gccaccctgt gtcgtcaccg 26580 ccccgctcag ggtataaagc ggctggtgat ccggggcaga ggcacacagc tcaacgacga 26640 ggtggtgagc tcttcgctgg gtctgcgacc tgacggagtc ttccaactcg ccggatcggg 26700 gagatcttcc ttcacgcctc gtcaggccgt cctgactttg gagagttcgt cctcgcagcc 26760 ccgctcgggt ggcatcggca ctctccagtt cgtggaggag ttcactccct cggtctactt 26820 caaccccttc tccggctccc ccggccacta cccggacgag ttcatcccga acttcgacgc 26880 catcagcgag tcggtggacg gctacgattg aaactaatca cccccttatc cagtgaaata 26940 aagatcatat tgatgatgat tttacagaaa taaaaaataa tcatttgatt tgaaataaag 27000 atacaatcat attgatgatt tgagtttaac aaaaaaataa agaatcactt acttgaaatc 27060 tgataccagg tctctgtcca tgttttctgc caacaccact tcactcccct cttcccagct 27120 ctggtactgc aggccccggc gggctgcaaa cttcctccac acgctgaagg ggatgtcaaa 27180 ttcctcctgt ccctcaatct tcattttatc ttctatcaga tgtccaaaaa gcgcgtccgg 27240 gtggatgatg acttcgaccc cgtctacccc tacgatgcag acaacgcacc gaccgtgccc 27300 ttcatcaacc cccccttcgt ctcttcagat ggattccaag agaagcccct gggggtgttg 27360 tccctgcgac tggccgaccc cgtcaccacc aagaacgggg aaatcaccct caagctggga 27420 gagggggtgg acctcgattc ctcgggaaaa ctcatctcca acacggccac caaggccgcc 27480 gcccctctca gtttttccaa caacaccatt tcccttaaca tggatcaccc cttttacact 27540 aaagatggaa aattatcctt acaagtttct ccaccattaa atatactgag aacaagcatt 27600 ctaaacacac tagctttagg ttttggatca ggtttaggac tccgtggctc tgccttggca 27660 gtacagttag tctctccact tacatttgat actgatggaa acataaagct taccttagac 27720 agaggtttgc atgttacaac aggagatgca attgaaagca acataagctg ggctaaaggt 27780 ttaaaatttg aagatggagc catagcaacc aacattggaa atgggttaga gtttggaagc 27840 agtagtacag aaacaggtgt tgatgatgct tacccaatcc aagttaaact tggatctggc 27900 cttagctttg acagtacagg agccataatg gctggtaaca aagaagacga taaactcact 27960 ttgtggacaa cacctgatcc atcaccaaac tgtcaaatac tcgcagaaaa tgatgcaaaa 28020 ctaacacttt gcttgactaa atgtggtagt caaatactgg ccactgtgtc agtcttagtt 28080 gtaggaagtg gaaacctaaa ccccattact ggcaccgtaa gcagtgctca ggtgtttcta 28140 cgttttgatg caaacggtgt tcttttaaca gaacattcta cactaaaaaa atactggggg 28200 tataggcagg gagatagcat agatggcact ccatatacca atgctgtagg attcatgccc 28260 aatttaaaag cttatccaaa gtcacaaagt tctactacta aaaataatat agtagggcaa 28320 gtatacatga atggagatgt ttcaaaacct atgcttctca ctataaccct caatggtact 28380 gatgacagca acagtacata ttcaatgtca ttttcataca cctggactaa tggaagctat 28440 gttggagcaa catttggggc taactcttat accttctcat acatcgccca agaatgaaca 28500 ctgtatccca ccctgcatgc caacccttcc caccccactc tgtggaacaa actctgaaac 28560 acaaaataaa ataaagttca agtgttttat tgattcaaca gttttacagg attcgagcag 28620 ttatttttcc tccaccctcc caggacatgg aatacaccac cctctccccc cgcacagcct 28680 tgaacatctg aatgccattg gtgatggaca tgcttttggt ctccacgttc cacacagttt 28740 cagagcgagc cagtctcggg tcggtcaggg agatgaaacc ctccgggcac tcccgcatct 28800 gcacctcaca gctcaacagc tgaggattgt cctcggtggt cgggatcacg gttatctgga 28860 agaagcagaa gagcggcggt gggaatcata gtccgcgaac gggatcggcc ggtggtgtcg 28920 catcaggccc cgcagcagtc gctgccgccg ccgctccgtc aagctgctgc tcagggggtc 28980 cgggtccagg gactccctca gcatgatgcc cacggccctc agcatcagtc gtctggtgcg 29040 gcgggcgcag cagcgcatgc ggatctcgct caggtcgctg cagtacgtgc aacacagaac 29100 caccaggttg ttcaacagtc catagttcaa cacgctccag ccgaaactca tcgcgggaag 29160 gatgctaccc acgtggccgt cgtaccagat cctcaggtaa atcaagtggt gccccctcca 29220 gaacacgctg cccacgtaca tgatctcctt gggcatgtgg cggttcacca cctcccggta 29280 ccacatcacc ctctggttga acatgcagcc ccggatgatc ctgcggaacc acagggccag 29340 caccgccccg cccgccatgc agcgaagaga ccccgggtcc cggcaatggc aatggaggac 29400 ccaccgctcg tacccgtgga tcatctggga gctgaacaag tctatgttgg cacagcacag 29460 gcatatgctc atgcatctct tcagcactct caactcctcg ggggtcaaaa ccatatccca 29520 gggcacgggg aactcttgca ggacagcgaa ccccgcagaa cagggcaatc ctcgcacaga 29580 acttacattg tgcatggaca gggtatcgca atcaggcagc accgggtgat cctccaccag 29640 agaagcgcgg gtctcggtct cctcacagcg tggtaagggg gccggccgat acgggtgatg 29700 gcgggacgcg gctgatcgtg ttcgcgaccg tgtcatgatg cagttgcttt cggacatttt 29760 cgtacttgct gtagcagaac ctggtccggg cgctgcacac cgatcgccgg cggcggtctc 29820 ggcgcttgga acgctcggtg ttgaaattgt aaaacagcca ctctctcaga ccgtgcagca 29880 gatctagggc ctcaggagtg atgaagatcc catcatgcct gatggctctg atcacatcga 29940 ccaccgtgga atgggccaga cccagccaga tgatgcaatt ttgttgggtt tcggtgacgg 30000 cgggggaggg aagaacagga agaaccatga ttaactttta atccaaacgg tctcggagta 30060 cttcaaaatg aagatcgcgg agatggcacc tctcgccccc gctgtgttgg tggaaaataa 30120 cagccaggtc aaaggtgata cggttctcga gatgttccac ggtggcttcc agcaaagcct 30180 ccacgcgcac atccagaaac aagacaatag cgaaagcggg agggttctct aattcctcaa 30240 tcatcatgtt acactcctgc accatcccca gataattttc atttttccag ccttgaatga 30300 ttcgaactag ttcctgaggt aaatccaagc cagccatgat aaagagctcg cgcagagcgc 30360 cctccaccgg cattcttaag cacaccctca taattccaag atattctgct cctggttcac 30420 ctgcagcaga ttgacaagcg gaatatcaaa atctctgccg cgatccctga gctcctccct 30480 cagcaataac tgtaagtact ctttcatatc ctctccgaaa tttttagcca taggaccacc 30540 aggaataaga ttagggcaag ccacagtaca gataaaccga agtcctcccc agtgagcatt 30600 gccaaatgca agactgctat aagcatgctg gctagacccg gtgatatctt ccagataact 30660 ggacagaaaa tcgcccaggc aatttttaag aaaatcaaca aaagaaaaat cctccaggtg 30720 gacgtttaga gcctcgggaa caacgatgaa gtaaatgcaa gcggtgcgtt ccagcatggt 30780 tagttagctg atctgtagaa aaaacaaaaa tgaacattaa accatgctag cctggcgaac 30840 aggtgggtaa atcgttctct ccagcaccag gcaggccacg gggtctccgg cgcgaccctc 30900 gtaaaaattg tcgctatgat tgaaaaccat cacagagaga cgttcccggt ggccggcgtg 30960 aatgattcga caagatgaat acacccccgg aacattggcg tccgcgagtg aaaaaaagcg 31020 cccgaggaag caataaggca ctacaatgct cagtctcaag tccagcaaag cgatgccatg 31080 cggatgaagc acaaaattct caggtgcgta caaaatgtaa ttactcccct cctgcacagg 31140 cagcaaagcc cccgatccct ccaggtacac atacaaagcc tcagcgtcca tagcttaccg 31200 agcagcagca cacaacaggc gcaagagtca gagaaaggct gagctctaac ctgtccaccc 31260 gctctctgct caatatatag cccagatcta cactgacgta aaggccaaag tctaaaaata 31320 cccgccaaat aatcacacac gcccagcaca cgcccagaaa ccggtgacac actcaaaaaa 31380 atacgcgcac ttcctcaaac gcccaaaact gccgtcattt ccgggttccc acgctacgtc 31440 atcaaaacac gactttcaaa ttccgtcgac cgttaaaaac gtcacccgcc ccgcccctaa 31500 cggtcgcccg tctctcagcc aatcagcgcc ccgcatcccc aaattcaaac acctcatttg 31560 catattaacg cgcacaaaaa gtttgagg 31588 <210> 3 <211> 11447 <212> DNA <213> Venezuelan equine encephalitis virus <400> 3 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560 gatgttcccg ttccagccaa tgtatccgat gcagccaatg ccctatcgca acccgttcgc 7620 ggccccgcgc aggccctggt tccccagaac cgaccctttt ctggcgatgc aggtgcagga 7680 attaacccgc tcgatggcta acctgacgtt caagcaacgc cgggacgcgc cacctgaggg 7740 gccatccgct aagaaaccga agaaggaggc ctcgcaaaaa cagaaagggg gaggccaagg 7800 gaagaagaag aagaaccaag ggaagaagaa ggctaagaca gggccgccta atccgaaggc 7860 acagaatgga aacaagaaga agaccaacaa gaaaccaggc aagagacagc gcatggtcat 7920 gaaattggaa tctgacaaga cgttcccaat catgttggaa gggaagataa acggctacgc 7980 ttgtgtggtc ggagggaagt tattcaggcc gatgcatgtg gaaggcaaga tcgacaacga 8040 cgttctggcc gcgcttaaga cgaagaaagc atccaaatac gatcttgagt atgcagatgt 8100 gccacagaac atgcgggccg atacattcaa atacacccat gagaaacccc aaggctatta 8160 cagctggcat catggagcag tccaatatga aaatgggcgt ttcacggtgc cgaaaggagt 8220 tggggccaag ggagacagcg gacgacccat tctggataac cagggacggg tggtcgctat 8280 tgtgctggga ggtgtgaatg aaggatctag gacagccctt tcagtcgtca tgtggaacga 8340 gaagggagtt accgtgaagt atactccgga gaactgcgag caatggtcac tagtgaccac 8400 catgtgtctg ctcgccaatg tgacgttccc atgtgctcaa ccaccaattt gctacgacag 8460 aaaaccagca gagactttgg ccatgctcag cgttaacgtt gacaacccgg gctacgatga 8520 gctgctggaa gcagctgtta agtgccccgg aaggaaaagg agatccaccg aggagctgtt 8580 taaggagtat aagctaacgc gcccttacat ggccagatgc atcagatgtg cagttgggag 8640 ctgccatagt ccaatagcaa tcgaggcagt aaagagcgac gggcacgacg gttatgttag 8700 acttcagact tcctcgcagt atggcctgga ttcctccggc aacttaaagg gcaggaccat 8760 gcggtatgac atgcacggga ccattaaaga gataccacta catcaagtgt cactccatac 8820 atctcgcccg tgtcacattg tggatgggca cggttatttc ctgcttgcca ggtgcccggc 8880 aggggactcc atcaccatgg aatttaagaa agattccgtc acacactcct gctcggtgcc 8940 gtatgaagtg aaatttaatc ctgtaggcag agaactctat actcatcccc cagaacacgg 9000 agtagagcaa gcgtgccaag tctacgcaca tgatgcacag aacagaggag cttatgtcga 9060 gatgcacctc ccgggctcag aagtggacag cagtttggtt tccttgagcg gcagttcagt 9120 caccgtgaca cctcctgttg ggactagcgc cctggtggaa tgcgagtgtg gcggcacaaa 9180 gatctccgag accatcaaca agacaaaaca gttcagccag tgcacaaaga aggagcagtg 9240 cagagcatat cggctgcaga acgataagtg ggtgtataat tctgacaaac tgcccaaagc 9300 agcgggagcc accttaaaag gaaaactgca tgtcccattc ttgctggcag acggcaaatg 9360 caccgtgcct ctagcaccag aacctatgat aacctttggt ttcagatcag tgtcactgaa 9420 actgcaccct aagaatccca catatctaac cacccgccaa cttgctgatg agcctcacta 9480 cacgcacgag ctcatatctg aaccagctgt taggaatttt accgtcaccg aaaaagggtg 9540 ggagtttgta tggggaaacc acccgccgaa aaggttttgg gcacaggaaa cagcacccgg 9600 aaatccacat gggctaccgc acgaggtgat aactcattat taccacagat accctatgtc 9660 caccatcctg ggtttgtcaa tttgtgccgc cattgcaacc gtttccgttg cagcgtctac 9720 ctggctgttt tgcagatcta gagttgcgtg cctaactcct taccggctaa cacctaacgc 9780 taggatacca ttttgtctgg ctgtgctttg ctgcgcccgc actgcccggg ccgagaccac 9840 ctgggagtcc ttggatcacc tatggaacaa taaccaacag atgttctgga ttcaattgct 9900 gatccctctg gccgccttga tcgtagtgac tcgcctgctc aggtgcgtgt gctgtgtcgt 9960 gcctttttta gtcatggccg gcgccgcagg cgccggcgcc tacgagcacg cgaccacgat 10020 gccgagccaa gcgggaatct cgtataacac tatagtcaac agagcaggct acgcaccact 10080 ccctatcagc ataacaccaa caaagatcaa gctgatacct acagtgaact tggagtacgt 10140 cacctgccac tacaaaacag gaatggattc accagccatc aaatgctgcg gatctcagga 10200 atgcactcca acttacaggc ctgatgaaca gtgcaaagtc ttcacagggg tttacccgtt 10260 catgtggggt ggtgcatatt gcttttgcga cactgagaac acccaagtca gcaaggccta 10320 cgtaatgaaa tctgacgact gccttgcgga tcatgctgaa gcatataaag cgcacacagc 10380 ctcagtgcag gcgttcctca acatcacagt gggagaacac tctattgtga ctaccgtgta 10440 tgtgaatgga gaaactcctg tgaatttcaa tggggtcaaa ttaactgcag gtccgctttc 10500 cacagcttgg acaccctttg atcgcaaaat cgtgcagtat gccggggaga tctataatta 10560 tgattttcct gagtatgggg caggacaacc aggagcattt ggagatatac aatccagaac 10620 agtctcaagc tcagatctgt atgccaatac caacctagtg ctgcagagac ccaaagcagg 10680 agcgatccac gtgccataca ctcaggcacc ttcgggtttt gagcaatgga agaaagataa 10740 agctccatca ttgaaattta ccgccccttt cggatgcgaa atatatacaa accccattcg 10800 cgccgaaaac tgtgctgtag ggtcaattcc attagccttt gacattcccg acgccttgtt 10860 caccagggtg tcagaaacac cgacactttc agcggccgaa tgcactctta acgagtgcgt 10920 gtattcttcc gactttggtg ggatcgccac ggtcaagtac tcggccagca agtcaggcaa 10980 gtgcgcagtc catgtgccat cagggactgc taccctaaaa gaagcagcag tcgagctaac 11040 cgagcaaggg tcggcgacta tccatttctc gaccgcaaat atccacccgg agttcaggct 11100 ccaaatatgc acatcatatg ttacgtgcaa aggtgattgt caccccccga aagaccatat 11160 tgtgacacac cctcagtatc acgcccaaac atttacagcc gcggtgtcaa aaaccgcgtg 11220 gacgtggtta acatccctgc tgggaggatc agccgtaatt attataattg gcttggtgct 11280 ggctactatt gtggccatgt acgtgctgac caaccagaaa cataattgaa tacagcagca 11340 attggcaagc tgcttacata gaactcgcgg cgattggcat gccgccttaa aatttttatt 11400 ttattttttc ttttcttttc cgaatcggat tttgttttta atatttc 11447 <210> 4 <211> 9577 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 4 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gactctagaa tagtctttaa 7560 ttaagccacc atggcaggca tgtttcaggc gctgagcgaa ggctgcaccc cgtatgatat 7620 taaccagatg ctgaacgtgc tgggcgatca tcaggtctca ggccttgagc agcttgagag 7680 tataatcaac tttgaaaaac tgactgaatg gaccagttct aatgttatgc ctatcctgtc 7740 tcctctgaca aagggcatcc tgggcttcgt gtttaccctg accgtgcctt ctgagagagg 7800 acttagctgc attagcgaag cggatgcgac caccccggaa agcgcgaacc tgggcgaaga 7860 aattctgagc cagctgtatc tttggccaag ggtgacctac cattccccta gttatgctta 7920 ccaccaattt gaaagacgag ccaaatataa aagacacttc cccggctttg gccagagcct 7980 gctgtttggc taccctgtgt acgtgttcgg cgattgcgtg cagggcgatt gggatgcgat 8040 tcgctttcgc tattgcgcgc cgccgggcta tgcgctgctg cgctgcaacg ataccaacta 8100 tagcgctctg ctggctgtgg gggccctaga aggacccagg aatcaggact ggcttggtgt 8160 cccaagacaa cttgtaactc ggatgcaggc tattcagaat gccggcctgt gtaccctggt 8220 ggccatgctg gaagagacaa tcttctggct gcaagcgttt ctgatggcgc tgaccgatag 8280 cggcccgaaa accaacatta ttgtggatag ccagtatgtg atgggcatta gcaaaccgag 8340 ctttcaggaa tttgtggatt gggaaaacgt gagcccggaa ctgaacagca ccgatcagcc 8400 gttttggcaa gccggaatcc tggccagaaa tctggtgcct atggtggcca cagtgcaggg 8460 ccagaacctg aagtaccagg gtcagtcact agtcatctct gcttctatca ttgtcttcaa 8520 cctgctggaa ctggaaggtg attatcgaga tgatggcaac gtgtgggtgc ataccccgct 8580 gagcccgcgc accctgaacg cgtgggtgaa agcggtggaa gaaaaaaaag gtattccagt 8640 tcacctagag ctggccagta tgaccaacat ggagctcatg agcagtattg tgcatcagca 8700 ggtcagaaca tacggccccg tgttcatgtg tctcggcgga ctgcttacaa tggtggctgg 8760 tgctgtgtgg ctgacagtgc gagtgctcga gctgttccgg gccgcgcagc tggccaacga 8820 cgtggtcctc cagatcatgg agctttgtgg tgcagcgttt cgccaggtgt gccataccac 8880 cgtgccgtgg ccgaacgcga gcctgacccc gaaatggaac aacgaaacca cccagcccca 8940 gatcgccaac tgcagcgtgt atgacttttt tgtgtggctc cattattatt ctgttcgaga 9000 cacactttgg ccaagggtga cctaccatat gaacaaatat gcgtatcata tgctggaaag 9060 acgagccaaa tataaaagag gaccaggacc tggcgctaaa tttgtggccg cctggacact 9120 gaaagccgct gctggtcctg gacctggcca gtacatcaag gccaacagca agttcatcgg 9180 catcaccgaa ctcggacccg gaccaggctg atgattcgaa cggccgtatc acgcccaaac 9240 atttacagcc gcggtgtcaa aaaccgcgtg gacgtggtta acatccctgc tgggaggatc 9300 agccgtaatt attataattg gcttggtgct ggctactatt gtggccatgt acgtgctgac 9360 caaccagaaa cataattgaa tacagcagca attggcaagc tgcttacata gaactcgcgg 9420 cgattggcat gccgccttaa aatttttatt ttattttttc ttttcttttc cgaatcggat 9480 tttgttttta atatttcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 9540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 9577 <210> 5 <211> 11447 <212> DNA <213> Venezuelan equine encephalitis virus <400> 5 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560 gatgttcccg ttccagccaa tgtatccgat gcagccaatg ccctatcgca acccgttcgc 7620 ggccccgcgc aggccctggt tccccagaac cgaccctttt ctggcgatgc aggtgcagga 7680 attaacccgc tcgatggcta acctgacgtt caagcaacgc cgggacgcgc cacctgaggg 7740 gccatccgct aagaaaccga agaaggaggc ctcgcaaaaa cagaaagggg gaggccaagg 7800 gaagaagaag aagaaccaag ggaagaagaa ggctaagaca gggccgccta atccgaaggc 7860 acagaatgga aacaagaaga agaccaacaa gaaaccaggc aagagacagc gcatggtcat 7920 gaaattggaa tctgacaaga cgttcccaat catgttggaa gggaagataa acggctacgc 7980 ttgtgtggtc ggagggaagt tattcaggcc gatgcatgtg gaaggcaaga tcgacaacga 8040 cgttctggcc gcgcttaaga cgaagaaagc atccaaatac gatcttgagt atgcagatgt 8100 gccacagaac atgcgggccg atacattcaa atacacccat gagaaacccc aaggctatta 8160 cagctggcat catggagcag tccaatatga aaatgggcgt ttcacggtgc cgaaaggagt 8220 tggggccaag ggagacagcg gacgacccat tctggataac cagggacggg tggtcgctat 8280 tgtgctggga ggtgtgaatg aaggatctag gacagccctt tcagtcgtca tgtggaacga 8340 gaagggagtt accgtgaagt atactccgga gaactgcgag caatggtcac tagtgaccac 8400 catgtgtctg ctcgccaatg tgacgttccc atgtgctcaa ccaccaattt gctacgacag 8460 aaaaccagca gagactttgg ccatgctcag cgttaacgtt gacaacccgg gctacgatga 8520 gctgctggaa gcagctgtta agtgccccgg aaggaaaagg agatccaccg aggagctgtt 8580 taaggagtat aagctaacgc gcccttacat ggccagatgc atcagatgtg cagttgggag 8640 ctgccatagt ccaatagcaa tcgaggcagt aaagagcgac gggcacgacg gttatgttag 8700 acttcagact tcctcgcagt atggcctgga ttcctccggc aacttaaagg gcaggaccat 8760 gcggtatgac atgcacggga ccattaaaga gataccacta catcaagtgt cactccatac 8820 atctcgcccg tgtcacattg tggatgggca cggttatttc ctgcttgcca ggtgcccggc 8880 aggggactcc atcaccatgg aatttaagaa agattccgtc acacactcct gctcggtgcc 8940 gtatgaagtg aaatttaatc ctgtaggcag agaactctat actcatcccc cagaacacgg 9000 agtagagcaa gcgtgccaag tctacgcaca tgatgcacag aacagaggag cttatgtcga 9060 gatgcacctc ccgggctcag aagtggacag cagtttggtt tccttgagcg gcagttcagt 9120 caccgtgaca cctcctgttg ggactagcgc cctggtggaa tgcgagtgtg gcggcacaaa 9180 gatctccgag accatcaaca agacaaaaca gttcagccag tgcacaaaga aggagcagtg 9240 cagagcatat cggctgcaga acgataagtg ggtgtataat tctgacaaac tgcccaaagc 9300 agcgggagcc accttaaaag gaaaactgca tgtcccattc ttgctggcag acggcaaatg 9360 caccgtgcct ctagcaccag aacctatgat aacctttggt ttcagatcag tgtcactgaa 9420 actgcaccct aagaatccca catatctaac cacccgccaa cttgctgatg agcctcacta 9480 cacgcacgag ctcatatctg aaccagctgt taggaatttt accgtcaccg aaaaagggtg 9540 ggagtttgta tggggaaacc acccgccgaa aaggttttgg gcacaggaaa cagcacccgg 9600 aaatccacat gggctaccgc acgaggtgat aactcattat taccacagat accctatgtc 9660 caccatcctg ggtttgtcaa tttgtgccgc cattgcaacc gtttccgttg cagcgtctac 9720 ctggctgttt tgcagatcta gagttgcgtg cctaactcct taccggctaa cacctaacgc 9780 taggatacca ttttgtctgg ctgtgctttg ctgcgcccgc actgcccggg ccgagaccac 9840 ctgggagtcc ttggatcacc tatggaacaa taaccaacag atgttctgga ttcaattgct 9900 gatccctctg gccgccttga tcgtagtgac tcgcctgctc aggtgcgtgt gctgtgtcgt 9960 gcctttttta gtcatggccg gcgccgcagg cgccggcgcc tacgagcacg cgaccacgat 10020 gccgagccaa gcgggaatct cgtataacac tatagtcaac agagcaggct acgcaccact 10080 ccctatcagc ataacaccaa caaagatcaa gctgatacct acagtgaact tggagtacgt 10140 cacctgccac tacaaaacag gaatggattc accagccatc aaatgctgcg gatctcagga 10200 atgcactcca acttacaggc ctgatgaaca gtgcaaagtc ttcacagggg tttacccgtt 10260 catgtggggt ggtgcatatt gcttttgcga cactgagaac acccaagtca gcaaggccta 10320 cgtaatgaaa tctgacgact gccttgcgga tcatgctgaa gcatataaag cgcacacagc 10380 ctcagtgcag gcgttcctca acatcacagt gggagaacac tctattgtga ctaccgtgta 10440 tgtgaatgga gaaactcctg tgaatttcaa tggggtcaaa ttaactgcag gtccgctttc 10500 cacagcttgg acaccctttg atcgcaaaat cgtgcagtat gccggggaga tctataatta 10560 tgattttcct gagtatgggg caggacaacc aggagcattt ggagatatac aatccagaac 10620 agtctcaagc tcagatctgt atgccaatac caacctagtg ctgcagagac ccaaagcagg 10680 agcgatccac gtgccataca ctcaggcacc ttcgggtttt gagcaatgga agaaagataa 10740 agctccatca ttgaaattta ccgccccttt cggatgcgaa atatatacaa accccattcg 10800 cgccgaaaac tgtgctgtag ggtcaattcc attagccttt gacattcccg acgccttgtt 10860 caccagggtg tcagaaacac cgacactttc agcggccgaa tgcactctta acgagtgcgt 10920 gtattcttcc gactttggtg ggatcgccac ggtcaagtac tcggccagca agtcaggcaa 10980 gtgcgcagtc catgtgccat cagggactgc taccctaaaa gaagcagcag tcgagctaac 11040 cgagcaaggg tcggcgacta tccatttctc gaccgcaaat atccacccgg agttcaggct 11100 ccaaatatgc acatcatatg ttacgtgcaa aggtgattgt caccccccga aagaccatat 11160 tgtgacacac cctcagtatc acgcccaaac atttacagcc gcggtgtcaa aaaccgcgtg 11220 gacgtggtta acatccctgc tgggaggatc agccgtaatt attataattg gcttggtgct 11280 ggctactatt gtggccatgt acgtgctgac caaccagaaa cataattgaa tacagcagca 11340 attggcaagc tgcttacata gaactcgcgg cgattggcat gccgccttaa aatttttatt 11400 ttattttttc ttttcttttc cgaatcggat tttgttttta atatttc 11447 <210> 6 <211> 7894 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 6 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gactatcacg cccaaacatt 7560 tacagccgcg gtgtcaaaaa ccgcgtggac gtggttaaca tccctgctgg gaggatcagc 7620 cgtaattatt ataattggct tggtgctggc tactattgtg gccatgtacg tgctgaccaa 7680 ccagaaacat aattgaatac agcagcaatt ggcaagctgc ttacatagaa ctcgcggcga 7740 ttggcatgcc gccttaaaat ttttatttta ttttttcttt tcttttccga atcggatttt 7800 gtttttaata tttcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 7894 <210> 7 <211> 7893 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 7 ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gactatcacg cccaaacatt 7560 tacagccgcg gtgtcaaaaa ccgcgtggac gtggttaaca tccctgctgg gaggatcagc 7620 cgtaattatt ataattggct tggtgctggc tactattgtg gccatgtacg tgctgaccaa 7680 ccagaaacat aattgaatac agcagcaatt ggcaagctgc ttacatagaa ctcgcggcga 7740 ttggcatgcc gccttaaaat ttttatttta tttttctttt cttttccgaa tcggattttg 7800 tttttaatat ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 7893 <210> 8 <211> 7927 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 8 taatacgact cactatagga tgggcggcgc atgagagaag cccagaccaa ttacctaccc 60 aaaatggaga aagttcacgt tgacatcgag gaagacagcc cattcctcag agctttgcag 120 cggagcttcc cgcagtttga ggtagaagcc aagcaggtca ctgataatga ccatgctaat 180 gccagagcgt tttcgcatct ggcttcaaaa ctgatcgaaa cggaggtgga cccatccgac 240 acgatccttg acattggaag tgcgcccgcc cgcagaatgt attctaagca caagtatcat 300 tgtatctgtc cgatgagatg tgcggaagat ccggacagat tgtataagta tgcaactaag 360 ctgaagaaaa actgtaagga aataactgat aaggaattgg acaagaaaat gaaggagctc 420 gccgccgtca tgagcgaccc tgacctggaa actgagacta tgtgcctcca cgacgacgag 480 tcgtgtcgct acgaagggca agtcgctgtt taccaggatg tatacgcggt tgacggaccg 540 acaagtctct atcaccaagc caataaggga gttagagtcg cctactggat aggctttgac 600 accacccctt ttatgtttaa gaacttggct ggagcatatc catcatactc taccaactgg 660 gccgacgaaa ccgtgttaac ggctcgtaac ataggcctat gcagctctga cgttatggag 720 cggtcacgta gagggatgtc cattcttaga aagaagtatt tgaaaccatc caacaatgtt 780 ctattctctg ttggctcgac catctaccac gagaagaggg acttactgag gagctggcac 840 ctgccgtctg tatttcactt acgtggcaag caaaattaca catgtcggtg tgagactata 900 gttagttgcg acgggtacgt cgttaaaaga atagctatca gtccaggcct gtatgggaag 960 ccttcaggct atgctgctac gatgcaccgc gagggattct tgtgctgcaa agtgacagac 1020 acattgaacg gggagagggt ctcttttccc gtgtgcacgt atgtgccagc tacattgtgt 1080 gaccaaatga ctggcatact ggcaacagat gtcagtgcgg acgacgcgca aaaactgctg 1140 gttgggctca accagcgtat agtcgtcaac ggtcgcaccc agagaaacac caataccatg 1200 aaaaattacc ttttgcccgt agtggcccag gcatttgcta ggtgggcaaa ggaatataag 1260 gaagatcaag aagatgaaag gccactagga ctacgagata gacagttagt catggggtgt 1320 tgttgggctt ttagaaggca caagataaca tctatttata agcgcccgga tacccaaacc 1380 atcatcaaag tgaacagcga tttccactca ttcgtgctgc ccaggatagg cagtaacaca 1440 ttggagatcg ggctgagaac aagaatcagg aaaatgttag aggagcacaa ggagccgtca 1500 cctctcatta ccgccgagga cgtacaagaa gctaagtgcg cagccgatga ggctaaggag 1560 gtgcgtgaag ccgaggagtt gcgcgcagct ctaccacctt tggcagctga tgttgaggag 1620 cccactctgg aagccgatgt cgacttgatg ttacaagagg ctggggccgg ctcagtggag 1680 acacctcgtg gcttgataaa ggttaccagc tacgctggcg aggacaagat cggctcttac 1740 gctgtgcttt ctccgcaggc tgtactcaag agtgaaaaat tatcttgcat ccaccctctc 1800 gctgaacaag tcatagtgat aacacactct ggccgaaaag ggcgttatgc cgtggaacca 1860 taccatggta aagtagtggt gccagaggga catgcaatac ccgtccagga ctttcaagct 1920 ctgagtgaaa gtgccaccat tgtgtacaac gaacgtgagt tcgtaaacag gtacctgcac 1980 catattgcca cacatggagg agcgctgaac actgatgaag aatattacaa aactgtcaag 2040 cccagcgagc acgacggcga atacctgtac gacatcgaca ggaaacagtg cgtcaagaaa 2100 gaactagtca ctgggctagg gctcacaggc gagctggtgg atcctccctt ccatgaattc 2160 gcctacgaga gtctgagaac acgaccagcc gctccttacc aagtaccaac cataggggtg 2220 tatggcgtgc caggatcagg caagtctggc atcattaaaa gcgcagtcac caaaaaagat 2280 ctagtggtga gcgccaagaa agaaaactgt gcagaaatta taagggacgt caagaaaatg 2340 aaagggctgg acgtcaatgc cagaactgtg gactcagtgc tcttgaatgg atgcaaacac 2400 cccgtagaga ccctgtatat tgacgaagct tttgcttgtc atgcaggtac tctcagagcg 2460 ctcatagcca ttataagacc taaaaaggca gtgctctgcg gggatcccaa acagtgcggt 2520 ttttttaaca tgatgtgcct gaaagtgcat tttaaccacg agatttgcac acaagtcttc 2580 cacaaaagca tctctcgccg ttgcactaaa tctgtgactt cggtcgtctc aaccttgttt 2640 tacgacaaaa aaatgagaac gacgaatccg aaagagacta agattgtgat tgacactacc 2700 ggcagtacca aacctaagca ggacgatctc attctcactt gtttcagagg gtgggtgaag 2760 cagttgcaaa tagattacaa aggcaacgaa ataatgacgg cagctgcctc tcaagggctg 2820 acccgtaaag gtgtgtatgc cgttcggtac aaggtgaatg aaaatcctct gtacgcaccc 2880 acctcagaac atgtgaacgt cctactgacc cgcacggagg accgcatcgt gtggaaaaca 2940 ctagccggcg acccatggat aaaaacactg actgccaagt accctgggaa tttcactgcc 3000 acgatagagg agtggcaagc agagcatgat gccatcatga ggcacatctt ggagagaccg 3060 gaccctaccg acgtcttcca gaataaggca aacgtgtgtt gggccaaggc tttagtgccg 3120 gtgctgaaga ccgctggcat agacatgacc actgaacaat ggaacactgt ggattatttt 3180 gaaacggaca aagctcactc agcagagata gtattgaacc aactatgcgt gaggttcttt 3240 ggactcgatc tggactccgg tctattttct gcacccactg ttccgttatc cattaggaat 3300 aatcactggg ataactcccc gtcgcctaac atgtacgggc tgaataaaga agtggtccgt 3360 cagctctctc gcaggtaccc acaactgcct cgggcagttg ccactggaag agtctatgac 3420 atgaacactg gtacactgcg caattatgat ccgcgcataa acctagtacc tgtaaacaga 3480 agactgcctc atgctttagt cctccaccat aatgaacacc cacagagtga cttttcttca 3540 ttcgtcagca aattgaaggg cagaactgtc ctggtggtcg gggaaaagtt gtccgtccca 3600 ggcaaaatgg ttgactggtt gtcagaccgg cctgaggcta ccttcagagc tcggctggat 3660 ttaggcatcc caggtgatgt gcccaaatat gacataatat ttgttaatgt gaggacccca 3720 tataaatacc atcactatca gcagtgtgaa gaccatgcca ttaagcttag catgttgacc 3780 aagaaagctt gtctgcatct gaatcccggc ggaacctgtg tcagcatagg ttatggttac 3840 gctgacaggg ccagcgaaag catcattggt gctatagcgc ggcagttcaa gttttcccgg 3900 gtatgcaaac cgaaatcctc acttgaagag acggaagttc tgtttgtatt cattgggtac 3960 gatcgcaagg cccgtacgca caatccttac aagctttcat caaccttgac caacatttat 4020 acaggttcca gactccacga agccggatgt gcaccctcat atcatgtggt gcgaggggat 4080 attgccacgg ccaccgaagg agtgattata aatgctgcta acagcaaagg acaacctggc 4140 ggaggggtgt gcggagcgct gtataagaaa ttcccggaaa gcttcgattt acagccgatc 4200 gaagtaggaa aagcgcgact ggtcaaaggt gcagctaaac atatcattca tgccgtagga 4260 ccaaacttca acaaagtttc ggaggttgaa ggtgacaaac agttggcaga ggcttatgag 4320 tccatcgcta agattgtcaa cgataacaat tacaagtcag tagcgattcc actgttgtcc 4380 accggcatct tttccgggaa caaagatcga ctaacccaat cattgaacca tttgctgaca 4440 gctttagaca ccactgatgc agatgtagcc atatactgca gggacaagaa atgggaaatg 4500 actctcaagg aagcagtggc taggagagaa gcagtggagg agatatgcat atccgacgac 4560 tcttcagtga cagaacctga tgcagagctg gtgagggtgc atccgaagag ttctttggct 4620 ggaaggaagg gctacagcac aagcgatggc aaaactttct catatttgga agggaccaag 4680 tttcaccagg cggccaagga tatagcagaa attaatgcca tgtggcccgt tgcaacggag 4740 gccaatgagc aggtatgcat gtatatcctc ggagaaagca tgagcagtat taggtcgaaa 4800 tgccccgtcg aagagtcgga agcctccaca ccacctagca cgctgccttg cttgtgcatc 4860 catgccatga ctccagaaag agtacagcgc ctaaaagcct cacgtccaga acaaattact 4920 gtgtgctcat cctttccatt gccgaagtat agaatcactg gtgtgcagaa gatccaatgc 4980 tcccagccta tattgttctc accgaaagtg cctgcgtata ttcatccaag gaagtatctc 5040 gtggaaacac caccggtaga cgagactccg gagccatcgg cagagaacca atccacagag 5100 gggacacctg aacaaccacc acttataacc gaggatgaga ccaggactag aacgcctgag 5160 ccgatcatca tcgaagagga agaagaggat agcataagtt tgctgtcaga tggcccgacc 5220 caccaggtgc tgcaagtcga ggcagacatt cacgggccgc cctctgtatc tagctcatcc 5280 tggtccattc ctcatgcatc cgactttgat gtggacagtt tatccatact tgacaccctg 5340 gagggagcta gcgtgaccag cggggcaacg tcagccgaga ctaactctta cttcgcaaag 5400 agtatggagt ttctggcgcg accggtgcct gcgcctcgaa cagtattcag gaaccctcca 5460 catcccgctc cgcgcacaag aacaccgtca cttgcaccca gcagggcctg ctcgagaacc 5520 agcctagttt ccaccccgcc aggcgtgaat agggtgatca ctagagagga gctcgaggcg 5580 cttaccccgt cacgcactcc tagcaggtcg gtctcgagaa ccagcctggt ctccaacccg 5640 ccaggcgtaa atagggtgat tacaagagag gagtttgagg cgttcgtagc acaacaacaa 5700 tgacggtttg atgcgggtgc atacatcttt tcctccgaca ccggtcaagg gcatttacaa 5760 caaaaatcag taaggcaaac ggtgctatcc gaagtggtgt tggagaggac cgaattggag 5820 atttcgtatg ccccgcgcct cgaccaagaa aaagaagaat tactacgcaa gaaattacag 5880 ttaaatccca cacctgctaa cagaagcaga taccagtcca ggaaggtgga gaacatgaaa 5940 gccataacag ctagacgtat tctgcaaggc ctagggcatt atttgaaggc agaaggaaaa 6000 gtggagtgct accgaaccct gcatcctgtt cctttgtatt catctagtgt gaaccgtgcc 6060 ttttcaagcc ccaaggtcgc agtggaagcc tgtaacgcca tgttgaaaga gaactttccg 6120 actgtggctt cttactgtat tattccagag tacgatgcct atttggacat ggttgacgga 6180 gcttcatgct gcttagacac tgccagtttt tgccctgcaa agctgcgcag ctttccaaag 6240 aaacactcct atttggaacc cacaatacga tcggcagtgc cttcagcgat ccagaacacg 6300 ctccagaacg tcctggcagc tgccacaaaa agaaattgca atgtcacgca aatgagagaa 6360 ttgcccgtat tggattcggc ggcctttaat gtggaatgct tcaagaaata tgcgtgtaat 6420 aatgaatatt gggaaacgtt taaagaaaac cccatcaggc ttactgaaga aaacgtggta 6480 aattacatta ccaaattaaa aggaccaaaa gctgctgctc tttttgcgaa gacacataat 6540 ttgaatatgt tgcaggacat accaatggac aggtttgtaa tggacttaaa gagagacgtg 6600 aaagtgactc caggaacaaa acatactgaa gaacggccca aggtacaggt gatccaggct 6660 gccgatccgc tagcaacagc gtatctgtgc ggaatccacc gagagctggt taggagatta 6720 aatgcggtcc tgcttccgaa cattcataca ctgtttgata tgtcggctga agactttgac 6780 gctattatag ccgagcactt ccagcctggg gattgtgttc tggaaactga catcgcgtcg 6840 tttgataaaa gtgaggacga cgccatggct ctgaccgcgt taatgattct ggaagactta 6900 ggtgtggacg cagagctgtt gacgctgatt gaggcggctt tcggcgaaat ttcatcaata 6960 catttgccca ctaaaactaa atttaaattc ggagccatga tgaaatctgg aatgttcctc 7020 acactgtttg tgaacacagt cattaacatt gtaatcgcaa gcagagtgtt gagagaacgg 7080 ctaaccggat caccatgtgc agcattcatt ggagatgaca atatcgtgaa aggagtcaaa 7140 tcggacaaat taatggcaga caggtgcgcc acctggttga atatggaagt caagattata 7200 gatgctgtgg tgggcgagaa agcgccttat ttctgtggag ggtttatttt gtgtgactcc 7260 gtgaccggca cagcgtgccg tgtggcagac cccctaaaaa ggctgtttaa gcttggcaaa 7320 cctctggcag cagacgatga acatgatgat gacaggagaa gggcattgca tgaagagtca 7380 acacgctgga accgagtggg tattctttca gagctgtgca aggcagtaga atcaaggtat 7440 gaaaccgtag gaacttccat catagttatg gccatgacta ctctagctag cagtgttaaa 7500 tcattcagct acctgagagg ggcccctata actctctacg gctaacctga atggactacg 7560 actatcacgc ccaaacattt acagccgcgg tgtcaaaaac cgcgtggacg tggttaacat 7620 ccctgctggg aggatcagcc gtaattatta taattggctt ggtgctggct actattgtgg 7680 ccatgtacgt gctgaccaac cagaaacata attgaataca gcagcaattg gcaagctgct 7740 tacatagaac tcgcggcgat tggcatgccg ccttaaaatt tttattttat tttttctttt 7800 cttttccgaa tcggattttg tttttaatat ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaatacgtag 7920 tttaaac 7927 <210> 9 <211> 7926 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 9 taatacgact cactatagga taggcggcgc atgagagaag cccagaccaa ttacctaccc 60 aaaatggaga aagttcacgt tgacatcgag gaagacagcc cattcctcag agctttgcag 120 cggagcttcc cgcagtttga ggtagaagcc aagcaggtca ctgataatga ccatgctaat 180 gccagagcgt tttcgcatct ggcttcaaaa ctgatcgaaa cggaggtgga cccatccgac 240 acgatccttg acattggaag tgcgcccgcc cgcagaatgt attctaagca caagtatcat 300 tgtatctgtc cgatgagatg tgcggaagat ccggacagat tgtataagta tgcaactaag 360 ctgaagaaaa actgtaagga aataactgat aaggaattgg acaagaaaat gaaggagctc 420 gccgccgtca tgagcgaccc tgacctggaa actgagacta tgtgcctcca cgacgacgag 480 tcgtgtcgct acgaagggca agtcgctgtt taccaggatg tatacgcggt tgacggaccg 540 acaagtctct atcaccaagc caataaggga gttagagtcg cctactggat aggctttgac 600 accacccctt ttatgtttaa gaacttggct ggagcatatc catcatactc taccaactgg 660 gccgacgaaa ccgtgttaac ggctcgtaac ataggcctat gcagctctga cgttatggag 720 cggtcacgta gagggatgtc cattcttaga aagaagtatt tgaaaccatc caacaatgtt 780 ctattctctg ttggctcgac catctaccac gagaagaggg acttactgag gagctggcac 840 ctgccgtctg tatttcactt acgtggcaag caaaattaca catgtcggtg tgagactata 900 gttagttgcg acgggtacgt cgttaaaaga atagctatca gtccaggcct gtatgggaag 960 ccttcaggct atgctgctac gatgcaccgc gagggattct tgtgctgcaa agtgacagac 1020 acattgaacg gggagagggt ctcttttccc gtgtgcacgt atgtgccagc tacattgtgt 1080 gaccaaatga ctggcatact ggcaacagat gtcagtgcgg acgacgcgca aaaactgctg 1140 gttgggctca accagcgtat agtcgtcaac ggtcgcaccc agagaaacac caataccatg 1200 aaaaattacc ttttgcccgt agtggcccag gcatttgcta ggtgggcaaa ggaatataag 1260 gaagatcaag aagatgaaag gccactagga ctacgagata gacagttagt catggggtgt 1320 tgttgggctt ttagaaggca caagataaca tctatttata agcgcccgga tacccaaacc 1380 atcatcaaag tgaacagcga tttccactca ttcgtgctgc ccaggatagg cagtaacaca 1440 ttggagatcg ggctgagaac aagaatcagg aaaatgttag aggagcacaa ggagccgtca 1500 cctctcatta ccgccgagga cgtacaagaa gctaagtgcg cagccgatga ggctaaggag 1560 gtgcgtgaag ccgaggagtt gcgcgcagct ctaccacctt tggcagctga tgttgaggag 1620 cccactctgg aagccgatgt cgacttgatg ttacaagagg ctggggccgg ctcagtggag 1680 acacctcgtg gcttgataaa ggttaccagc tacgatggcg aggacaagat cggctcttac 1740 gctgtgcttt ctccgcaggc tgtactcaag agtgaaaaat tatcttgcat ccaccctctc 1800 gctgaacaag tcatagtgat aacacactct ggccgaaaag ggcgttatgc cgtggaacca 1860 taccatggta aagtagtggt gccagaggga catgcaatac ccgtccagga ctttcaagct 1920 ctgagtgaaa gtgccaccat tgtgtacaac gaacgtgagt tcgtaaacag gtacctgcac 1980 catattgcca cacatggagg agcgctgaac actgatgaag aatattacaa aactgtcaag 2040 cccagcgagc acgacggcga atacctgtac gacatcgaca ggaaacagtg cgtcaagaaa 2100 gaactagtca ctgggctagg gctcacaggc gagctggtgg atcctccctt ccatgaattc 2160 gcctacgaga gtctgagaac acgaccagcc gctccttacc aagtaccaac cataggggtg 2220 tatggcgtgc caggatcagg caagtctggc atcattaaaa gcgcagtcac caaaaaagat 2280 ctagtggtga gcgccaagaa agaaaactgt gcagaaatta taagggacgt caagaaaatg 2340 aaagggctgg acgtcaatgc cagaactgtg gactcagtgc tcttgaatgg atgcaaacac 2400 cccgtagaga ccctgtatat tgacgaagct tttgcttgtc atgcaggtac tctcagagcg 2460 ctcatagcca ttataagacc taaaaaggca gtgctctgcg gggatcccaa acagtgcggt 2520 ttttttaaca tgatgtgcct gaaagtgcat tttaaccacg agatttgcac acaagtcttc 2580 cacaaaagca tctctcgccg ttgcactaaa tctgtgactt cggtcgtctc aaccttgttt 2640 tacgacaaaa aaatgagaac gacgaatccg aaagagacta agattgtgat tgacactacc 2700 ggcagtacca aacctaagca ggacgatctc attctcactt gtttcagagg gtgggtgaag 2760 cagttgcaaa tagattacaa aggcaacgaa ataatgacgg cagctgcctc tcaagggctg 2820 acccgtaaag gtgtgtatgc cgttcggtac aaggtgaatg aaaatcctct gtacgcaccc 2880 acctcagaac atgtgaacgt cctactgacc cgcacggagg accgcatcgt gtggaaaaca 2940 ctagccggcg acccatggat aaaaacactg actgccaagt accctgggaa tttcactgcc 3000 acgatagagg agtggcaagc agagcatgat gccatcatga ggcacatctt ggagagaccg 3060 gaccctaccg acgtcttcca gaataaggca aacgtgtgtt gggccaaggc tttagtgccg 3120 gtgctgaaga ccgctggcat agacatgacc actgaacaat ggaacactgt ggattatttt 3180 gaaacggaca aagctcactc agcagagata gtattgaacc aactatgcgt gaggttcttt 3240 ggactcgatc tggactccgg tctattttct gcacccactg ttccgttatc cattaggaat 3300 aatcactggg ataactcccc gtcgcctaac atgtacgggc tgaataaaga agtggtccgt 3360 cagctctctc gcaggtaccc acaactgcct cgggcagttg ccactggaag agtctatgac 3420 atgaacactg gtacactgcg caattatgat ccgcgcataa acctagtacc tgtaaacaga 3480 agactgcctc atgctttagt cctccaccat aatgaacacc cacagagtga cttttcttca 3540 ttcgtcagca aattgaaggg cagaactgtc ctggtggtcg gggaaaagtt gtccgtccca 3600 ggcaaaatgg ttgactggtt gtcagaccgg cctgaggcta ccttcagagc tcggctggat 3660 ttaggcatcc caggtgatgt gcccaaatat gacataatat ttgttaatgt gaggacccca 3720 tataaatacc atcactatca gcagtgtgaa gaccatgcca ttaagcttag catgttgacc 3780 aagaaagctt gtctgcatct gaatcccggc ggaacctgtg tcagcatagg ttatggttac 3840 gctgacaggg ccagcgaaag catcattggt gctatagcgc ggcagttcaa gttttcccgg 3900 gtatgcaaac cgaaatcctc acttgaagag acggaagttc tgtttgtatt cattgggtac 3960 gatcgcaagg cccgtacgca caatccttac aagctttcat caaccttgac caacatttat 4020 acaggttcca gactccacga agccggatgt gcaccctcat atcatgtggt gcgaggggat 4080 attgccacgg ccaccgaagg agtgattata aatgctgcta acagcaaagg acaacctggc 4140 ggaggggtgt gcggagcgct gtataagaaa ttcccggaaa gcttcgattt acagccgatc 4200 gaagtaggaa aagcgcgact ggtcaaaggt gcagctaaac atatcattca tgccgtagga 4260 ccaaacttca acaaagtttc ggaggttgaa ggtgacaaac agttggcaga ggcttatgag 4320 tccatcgcta agattgtcaa cgataacaat tacaagtcag tagcgattcc actgttgtcc 4380 accggcatct tttccgggaa caaagatcga ctaacccaat cattgaacca tttgctgaca 4440 gctttagaca ccactgatgc agatgtagcc atatactgca gggacaagaa atgggaaatg 4500 actctcaagg aagcagtggc taggagagaa gcagtggagg agatatgcat atccgacgac 4560 tcttcagtga cagaacctga tgcagagctg gtgagggtgc atccgaagag ttctttggct 4620 ggaaggaagg gctacagcac aagcgatggc aaaactttct catatttgga agggaccaag 4680 tttcaccagg cggccaagga tatagcagaa attaatgcca tgtggcccgt tgcaacggag 4740 gccaatgagc aggtatgcat gtatatcctc ggagaaagca tgagcagtat taggtcgaaa 4800 tgccccgtcg aagagtcgga agcctccaca ccacctagca cgctgccttg cttgtgcatc 4860 catgccatga ctccagaaag agtacagcgc ctaaaagcct cacgtccaga acaaattact 4920 gtgtgctcat cctttccatt gccgaagtat agaatcactg gtgtgcagaa gatccaatgc 4980 tcccagccta tattgttctc accgaaagtg cctgcgtata ttcatccaag gaagtatctc 5040 gtggaaacac caccggtaga cgagactccg gagccatcgg cagagaacca atccacagag 5100 gggacacctg aacaaccacc acttataacc gaggatgaga ccaggactag aacgcctgag 5160 ccgatcatca tcgaagagga agaagaggat agcataagtt tgctgtcaga tggcccgacc 5220 caccaggtgc tgcaagtcga ggcagacatt cacgggccgc cctctgtatc tagctcatcc 5280 tggtccattc ctcatgcatc cgactttgat gtggacagtt tatccatact tgacaccctg 5340 gagggagcta gcgtgaccag cggggcaacg tcagccgaga ctaactctta cttcgcaaag 5400 agtatggagt ttctggcgcg accggtgcct gcgcctcgaa cagtattcag gaaccctcca 5460 catcccgctc cgcgcacaag aacaccgtca cttgcaccca gcagggcctg ctcgagaacc 5520 agcctagttt ccaccccgcc aggcgtgaat agggtgatca ctagagagga gctcgaggcg 5580 cttaccccgt cacgcactcc tagcaggtcg gtctcgagaa ccagcctggt ctccaacccg 5640 ccaggcgtaa atagggtgat tacaagagag gagtttgagg cgttcgtagc acaacaacaa 5700 tgacggtttg atgcgggtgc atacatcttt tcctccgaca ccggtcaagg gcatttacaa 5760 caaaaatcag taaggcaaac ggtgctatcc gaagtggtgt tggagaggac cgaattggag 5820 atttcgtatg ccccgcgcct cgaccaagaa aaagaagaat tactacgcaa gaaattacag 5880 ttaaatccca cacctgctaa cagaagcaga taccagtcca ggaaggtgga gaacatgaaa 5940 gccataacag ctagacgtat tctgcaaggc ctagggcatt atttgaaggc agaaggaaaa 6000 gtggagtgct accgaaccct gcatcctgtt cctttgtatt catctagtgt gaaccgtgcc 6060 ttttcaagcc ccaaggtcgc agtggaagcc tgtaacgcca tgttgaaaga gaactttccg 6120 actgtggctt cttactgtat tattccagag tacgatgcct atttggacat ggttgacgga 6180 gcttcatgct gcttagacac tgccagtttt tgccctgcaa agctgcgcag ctttccaaag 6240 aaacactcct atttggaacc cacaatacga tcggcagtgc cttcagcgat ccagaacacg 6300 ctccagaacg tcctggcagc tgccacaaaa agaaattgca atgtcacgca aatgagagaa 6360 ttgcccgtat tggattcggc ggcctttaat gtggaatgct tcaagaaata tgcgtgtaat 6420 aatgaatatt gggaaacgtt taaagaaaac cccatcaggc ttactgaaga aaacgtggta 6480 aattacatta ccaaattaaa aggaccaaaa gctgctgctc tttttgcgaa gacacataat 6540 ttgaatatgt tgcaggacat accaatggac aggtttgtaa tggacttaaa gagagacgtg 6600 aaagtgactc caggaacaaa acatactgaa gaacggccca aggtacaggt gatccaggct 6660 gccgatccgc tagcaacagc gtatctgtgc ggaatccacc gagagctggt taggagatta 6720 aatgcggtcc tgcttccgaa cattcataca ctgtttgata tgtcggctga agactttgac 6780 gctattatag ccgagcactt ccagcctggg gattgtgttc tggaaactga catcgcgtcg 6840 tttgataaaa gtgaggacga cgccatggct ctgaccgcgt taatgattct ggaagactta 6900 ggtgtggacg cagagctgtt gacgctgatt gaggcggctt tcggcgaaat ttcatcaata 6960 catttgccca ctaaaactaa atttaaattc ggagccatga tgaaatctgg aatgttcctc 7020 acactgtttg tgaacacagt cattaacatt gtaatcgcaa gcagagtgtt gagagaacgg 7080 ctaaccggat caccatgtgc agcattcatt ggagatgaca atatcgtgaa aggagtcaaa 7140 tcggacaaat taatggcaga caggtgcgcc acctggttga atatggaagt caagattata 7200 gatgctgtgg tgggcgagaa agcgccttat ttctgtggag ggtttatttt gtgtgactcc 7260 gtgaccggca cagcgtgccg tgtggcagac cccctaaaaa ggctgtttaa gcttggcaaa 7320 cctctggcag cagacgatga acatgatgat gacaggagaa gggcattgca tgaagagtca 7380 acacgctgga accgagtggg tattctttca gagctgtgca aggcagtaga atcaaggtat 7440 gaaaccgtag gaacttccat catagttatg gccatgacta ctctagctag cagtgttaaa 7500 tcattcagct acctgagagg ggcccctata actctctacg gctaacctga atggactacg 7560 actatcacgc ccaaacattt acagccgcgg tgtcaaaaac cgcgtggacg tggttaacat 7620 ccctgctggg aggatcagcc gtaattatta taattggctt ggtgctggct actattgtgg 7680 ccatgtacgt gctgaccaac cagaaacata attgaataca gcagcaattg gcaagctgct 7740 tacatagaac tcgcggcgat tggcatgccg ccttaaaatt tttattttat ttttcttttc 7800 ttttccgaat cggattttgt ttttaatatt tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aatacgtagt 7920 ttaaac 7926 <210> 10 <211> 36519 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 10 ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60 aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120 gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180 tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240 aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300 gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360 gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420 tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480 atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540 tcctccgcgc cgcgagtcag atctacactt tgaaagatga ggcacctgag agacctgccc 600 gatgagaaaa tcatcatcgc ttccgggaac gagattctgg aactggtggt aaatgccatg 660 atgggcgacg accctccgga gccccccacc ccatttgaga caccttcgct gcacgatttg 720 tatgatctgg aggtggatgt gcccgaggac gatcccaatg aggaggcggt aaatgatttt 780 tttagcgatg ccgcgctgct agctgccgag gaggcttcga gctctagctc agacagcgac 840 tcttcactgc atacccctag acccggcaga ggtgagaaaa agatccccga gcttaaaggg 900 gaagagatgg acttgcgctg ctatgaggaa tgcttgcccc cgagcgatga tgaggacgag 960 caggcgatcc agaacgcagc gagccaggga gtgcaagccg ccagcgagag ctttgcgctg 1020 gactgcccgc ctctgcccgg acacggctgt aagtcttgtg aatttcatcg catgaatact 1080 ggagataaag ctgtgttgtg tgcactttgc tatatgagag cttacaacca ttgtgtttac 1140 agtaagtgtg attaagttga actttagagg gaggcagaga gcagggtgac tgggcgatga 1200 ctggtttatt tatgtatata tgttctttat ataggtcccg tctctgacgc agatgatgag 1260 acccccacta caaagtccac ttcgtcaccc ccagaaattg gcacatctcc acctgagaat 1320 attgttagac cagttcctgt tagagccact gggaggagag cagctgtgga atgtttggat 1380 gacttgctac agggtggggt tgaacctttg gacttgtgta cccggaaacg ccccaggcac 1440 taagtgccac acatgtgtgt ttacttgagg tgatgtcagt atttataggg tgtggagtgc 1500 aataaaaaat gtgttgactt taagtgcgtg gtttatgact caggggtggg gactgtgagt 1560 atataagcag gtgcagacct gtgtggttag ctcagagcgg catggagatt tggacggtct 1620 tggaagactt tcacaagact agacagctgc tagagaacgc ctcgaacgga gtctcttacc 1680 tgtggagatt ctgcttcggt ggcgacctag ctaggctagt ctacagggcc aaacaggatt 1740 atagtgaaca atttgaggtt attttgagag agtgttctgg tctttttgac gctcttaact 1800 tgggccatca gtctcacttt aaccagagga tttcgagagc ccttgatttt actactcctg 1860 gcagaaccac tgcagcagta gccttttttg cttttattct tgacaaatgg agtcaagaaa 1920 cccatttcag cagggattac cagctggatt tcttagcagt agctttgtgg agaacatgga 1980 agtgccagcg cctgaatgca atctccggct acttgccggt acagccgcta gacactctga 2040 ggatcctgaa tctccaggag agtcccaggg cacgccaacg tcgccagcag cagcagcagg 2100 aggaggatca agaagagaac ccgagagccg gcctggaccc tccggcggag gaggaggagt 2160 agctgacctg tttcctgaac tgcgccgggt gctgactagg tcttcgagtg gtcgggagag 2220 ggggattaag cgggagaggc atgatgagac taatcacaga actgaactga ctgtgggtct 2280 gatgagtcgc aagcgcccag aaacagtgtg gtggcatgag gtgcagtcga ctggcacaga 2340 tgaggtgtcg gtgatgcatg agaggttttc tctagaacaa gtcaagactt gttggttaga 2400 gcctgaggat gattgggagg tagccatcag gaattatgcc aagctggctc tgaggccaga 2460 caagaagtac aagattacta agctgataaa tatcagaaat gcctgctaca tctcagggaa 2520 tggggctgaa gtggagatct gtctccagga aagggtggct ttcagatgct gcatgatgaa 2580 tatgtacccg ggagtggtgg gcatggatgg ggttaccttt atgaacatga ggttcagggg 2640 agatgggtat aatggcacgg tctttatggc caataccaag ctgacagtcc atggctgctc 2700 cttctttggg tttaataaca cctgcatcga ggcctggggt caggtcggtg tgaggggctg 2760 cagtttttca gccaactgga tgggggtcgt gggcaggacc aagagtatgc tgtccgtgaa 2820 gaaatgcttg tttgagaggt gccacctggg ggtgatgagc gagggcgaag ccagaatccg 2880 ccactgcgcc tctaccgaga cgggctgctt tgtgctgtgc aagggcaatg ctaagatcaa 2940 gcataatatg atctgtggag cctcggacga gcgcggctac cagatgctga cctgcgccgg 3000 cgggaacagc catatgctgg ccaccgtaca tgtggcttcc catgctcgca agccctggcc 3060 cgagttcgag cacaatgtca tgaccaggtg caatatgcat ctggggtccc gccgaggcat 3120 gttcatgccc taccagtgca acctgaatta tgtgaaggtg ctgctggagc ccgatgccat 3180 gtccagagtg agcctgacgg gggtgtttga catgaatgtg gaggtgtgga agattctgag 3240 atatgatgaa tccaagacca ggtgccgagc ctgcgagtgc ggagggaagc atgccaggtt 3300 ccagcccgtg tgtgtggatg tgacggagga cctgcgaccc gatcatttgg tgttgccctg 3360 caccgggacg gagttcggtt ccagcgggga agaatctgac tagagtgagt agtgttctgg 3420 ggcgggggag gacctgcatg agggccagaa taactgaaat ctgtgctttt ctgtgtgttg 3480 cagcagcatg agcggaagcg gctcctttga gggaggggta ttcagccctt atctgacggg 3540 gcgtctcccc tcctgggcgg gagtgcgtca gaatgtgatg ggatccacgg tggacggccg 3600 gcccgtgcag cccgcgaact cttcaaccct gacctatgca accctgagct cttcgtcgtt 3660 ggacgcagct gccgccgcag ctgctgcatc tgccgccagc gccgtgcgcg gaatggccat 3720 gggcgccggc tactacggca ctctggtggc caactcgagt tccaccaata atcccgccag 3780 cctgaacgag gagaagctgt tgctgctgat ggcccagctc gaggccttga cccagcgcct 3840 gggcgagctg acccagcagg tggctcagct gcaggagcag acgcgggccg cggttgccac 3900 ggtgaaatcc aaataaaaaa tgaatcaata aataaacgga gacggttgtt gattttaaca 3960 cagagtctga atctttattt gatttttcgc gcgcggtagg ccctggacca ccggtctcga 4020 tcattgagca cccggtggat cttttccagg acccggtaga ggtgggcttg gatgttgagg 4080 tacatgggca tgagcccgtc ccgggggtgg aggtagctcc attgcagggc ctcgtgctcg 4140 ggggtggtgt tgtaaatcac ccagtcatag caggggcgca gggcatggtg ttgcacaata 4200 tctttgagga ggagactgat ggccacgggc agccctttgg tgtaggtgtt tacaaatctg 4260 ttgagctggg agggatgcat gcggggggag atgaggtgca tcttggcctg gatcttgaga 4320 ttggcgatgt taccgcccag atcccgcctg gggttcatgt tgtgcaggac caccagcacg 4380 gtgtatccgg tgcacttggg gaatttatca tgcaacttgg aagggaaggc gtgaaagaat 4440 ttggcgacgc ctttgtgccc gcccaggttt tccatgcact catccatgat gatggcgatg 4500 ggcccgtggg cggcggcctg ggcaaagacg tttcgggggt cggacacatc atagttgtgg 4560 tcctgggtga ggtcatcata ggccatttta atgaatttgg ggcggagggt gccggactgg 4620 gggacaaagg taccctcgat cccgggggcg tagttcccct cacagatctg catctcccag 4680 gctttgagct cggagggggg gatcatgtcc acctgcgggg cgataaagaa cacggtttcc 4740 ggggcggggg agatgagctg ggccgaaagc aagttccgga gcagctggga cttgccgcag 4800 ccggtggggc cgtagatgac cccgatgacc ggctgcaggt ggtagttgag ggagagacag 4860 ctgccgtcct cccggaggag gggggccacc tcgttcatca tctcgcgcac gtgcatgttc 4920 tcgcgcacca gttccgccag gaggcgctct ccccccaggg ataggagctc ctggagcgag 4980 gcgaagtttt tcagcggctt gagtccgtcg gccatgggca ttttggagag ggtttgttgc 5040 aagagttcca ggcggtccca gagctcggtg atgtgctcta cggcatctcg atccagcaga 5100 cctcctcgtt tcgcgggttg ggacggctgc gggagtaggg caccagacga tgggcgtcca 5160 gcgcagccag ggtccggtcc ttccagggtc gcagcgtccg cgtcagggtg gtctccgtca 5220 cggtgaaggg gtgcgcgccg ggctgggcgc ttgcgagggt gcgcttcagg ctcatccggc 5280 tggtcgaaaa ccgctcccga tcggcgccct gcgcgtcggc caggtagcaa ttgaccatga 5340 gttcgtagtt gagcgcctcg gccgcgtggc ctttggcgcg gagcttacct ttggaagtct 5400 gcccgcaggc gggacagagg agggacttga gggcgtagag cttgggggcg aggaagacgg 5460 actcgggggc gtaggcgtcc gcgccgcagt gggcgcagac ggtctcgcac tccacgagcc 5520 aggtgaggtc gggctggtcg gggtcaaaaa ccagtttccc gccgttcttt ttgatgcgtt 5580 tcttaccttt ggtctccatg agctcgtgtc cccgctgggt gacaaagagg ctgtccgtgt 5640 ccccgtagac cgactttatg ggccggtcct cgagcggtgt gccgcggtcc tcctcgtaga 5700 ggaaccccgc ccactccgag acgaaagccc gggtccaggc cagcacgaag gaggccacgt 5760 gggacgggta gcggtcgttg tccaccagcg ggtccacctt ttccagggta tgcaaacaca 5820 tgtccccctc gtccacatcc aggaaggtga ttggcttgta agtgtaggcc acgtgaccgg 5880 gggtcccggc cgggggggta taaaagggtg cgggtccctg ctcgtcctca ctgtcttccg 5940 gatcgctgtc caggagcgcc agctgttggg gtaggtattc cctctcgaag gcgggcatga 6000 cctcggcact caggttgtca gtttctagaa acgaggagga tttgatattg acggtgccgg 6060 cggagatgcc tttcaagagc ccctcgtcca tctggtcaga aaagacgatc tttttgttgt 6120 cgagcttggt ggcgaaggag ccgtagaggg cgttggagag gagcttggcg atggagcgca 6180 tggtctggtt tttttccttg tcggcgcgct ccttggcggc gatgttgagc tgcacgtact 6240 cgcgcgccac gcacttccat tcggggaaga cggtggtcag ctcgtcgggc acgattctga 6300 cctgccagcc ccgattatgc agggtgatga ggtccacact ggtggccacc tcgccgcgca 6360 ggggctcatt agtccagcag aggcgtccgc ccttgcgcga gcagaagggg ggcagggggt 6420 ccagcatgac ctcgtcgggg gggtcggcat cgatggtgaa gatgccgggc aggaggtcgg 6480 ggtcaaagta gctgatggaa gtggccagat cgtccagggc agcttgccat tcgcgcacgg 6540 ccagcgcgcg ctcgtaggga ctgaggggcg tgccccaggg catgggatgg gtaagcgcgg 6600 aggcgtacat gccgcagatg tcgtagacgt agaggggctc ctcgaggatg ccgatgtagg 6660 tggggtagca gcgccccccg cggatgctgg cgcgcacgta gtcatacagc tcgtgcgagg 6720 gggcgaggag ccccgggccc aggttggtgc gactgggctt ttcggcgcgg tagacgatct 6780 ggcggaaaat ggcatgcgag ttggaggaga tggtgggcct ttggaagatg ttgaagtggg 6840 cgtggggcag tccgaccgag tcgcggatga agtgggcgta ggagtcttgc agcttggcga 6900 cgagctcggc ggtgactagg acgtccagag cgcagtagtc gagggtctcc tggatgatgt 6960 catacttgag ctgtcccttt tgtttccaca gctcgcggtt gagaaggaac tcttcgcggt 7020 ccttccagta ctcttcgagg gggaacccgt cctgatctgc acggtaagag cctagcatgt 7080 agaactggtt gacggccttg taggcgcagc agcccttctc cacggggagg gcgtaggcct 7140 gggcggcctt gcgcagggag gtgtgcgtga gggcgaaagt gtccctgacc atgaccttga 7200 ggaactggtg cttgaagtcg atatcgtcgc agcccccctg ctcccagagc tggaagtccg 7260 tgcgcttctt gtaggcgggg ttgggcaaag cgaaagtaac atcgttgaag aggatcttgc 7320 ccgcgcgggg cataaagttg cgagtgatgc ggaaaggttg gggcacctcg gcccggttgt 7380 tgatgacctg ggcggcgagc acgatctcgt cgaagccgtt gatgttgtgg cccacgatgt 7440 agagttccac gaatcgcgga cggcccttga cgtggggcag tttcttgagc tcctcgtagg 7500 tgagctcgtc ggggtcgctg agcccgtgct gctcgagcgc ccagtcggcg agatgggggt 7560 tggcgcggag gaaggaagtc cagagatcca cggccagggc ggtttgcaga cggtcccggt 7620 actgacggaa ctgctgcccg acggccattt tttcgggggt gacgcagtag aaggtgcggg 7680 ggtccccgtg ccagcgatcc catttgagct ggagggcgag atcgagggcg agctcgacga 7740 gccggtcgtc cccggagagt ttcatgacca gcatgaaggg gacgagctgc ttgccgaagg 7800 accccatcca ggtgtaggtt tccacatcgt aggtgaggaa gagcctttcg gtgcgaggat 7860 gcgagccgat ggggaagaac tggatctcct gccaccaatt ggaggaatgg ctgttgatgt 7920 gatggaagta gaaatgccga cggcgcgccg aacactcgtg cttgtgttta tacaagcggc 7980 cacagtgctc gcaacgctgc acgggatgca cgtgctgcac gagctgtacc tgagttcctt 8040 tgacgaggaa tttcagtggg aagtggagtc gtggcgcctg catctcgtgc tgtactacgt 8100 cgtggtggtc ggcctggccc tcttctgcct cgatggtggt catgctgacg agcccgcgcg 8160 ggaggcaggt ccagacctcg gcgcgagcgg gtcggagagc gaggacgagg gcgcgcaggc 8220 cggagctgtc cagggtcctg agacgctgcg gagtcaggtc agtgggcagc ggcggcgcgc 8280 ggttgacttg caggagtttt tccagggcgc gcgggaggtc cagatggtac ttgatctcca 8340 ccgcgccatt ggtggcgacg tcgatggctt gcagggtccc gtgcccctgg ggtgtgacca 8400 ccgtcccccg tttcttcttg ggcggctggg gcgacggggg cggtgcctct tccatggtta 8460 gaagcggcgg cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg 8520 cggcaggggc acgtcggcgc cgcgcgcggg taggttctgg tactgcgccc ggagaagact 8580 ggcgtgagcg acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac 8640 gggacccgtg agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac 8700 ggcggcctgc cgcaggatct cttgcacgtc gcccgagttg tcctggtagg cgatctcggt 8760 catgaactgc tcgatctcct cctcttgaag gtctccgcgg ccggcgcgct ccacggtggc 8820 cgcgaggtcg ttggagatgc ggcccatgag ctgcgagaag gcgttcatgc ccgcctcgtt 8880 ccagacgcgg ctgtagacca cgacgccctc gggatcgcgg gcgcgcatga ccacctgggc 8940 gaggttgagc tccacgtggc gcgtgaagac cgcgtagttg cagaggcgct ggtagaggta 9000 gttgagcgtg gtggcgatgt gctcggtgac gaagaaatac atgatccagc ggcggagcgg 9060 catctcgctg acgtcgccca gcgcctccaa acgttccatg gcctcgtaaa agtccacggc 9120 gaagttgaaa aactgggagt tgcgcgccga gacggtcaac tcctcctcca gaagacggat 9180 gagctcggcg atggtggcgc gcacctcgcg ctcgaaggcc cccgggagtt cctccacttc 9240 ctcttcttcc tcctccacta acatctcttc tacttcctcc tcaggcggca gtggtggcgg 9300 gggagggggc ctgcgtcgcc ggcggcgcac gggcagacgg tcgatgaagc gctcgatggt 9360 ctcgccgcgc cggcgtcgca tggtctcggt gacggcgcgc ccgtcctcgc ggggccgcag 9420 cgtgaagacg ccgccgcgca tctccaggtg gccggggggg tccccgttgg gcagggagag 9480 ggcgctgacg atgcatctta tcaattgccc cgtagggact ccgcgcaagg acctgagcgt 9540 ctcgagatcc acgggatctg aaaaccgctg aacgaaggct tcgagccagt cgcagtcgca 9600 aggtaggctg agcacggttt cttctggcgg gtcatgttgg ttgggagcgg ggcgggcgat 9660 gctgctggtg atgaagttga aataggcggt tctgagacgg cggatggtgg cgaggagcac 9720 caggtctttg ggcccggctt gctggatgcg cagacggtcg gccatgcccc aggcgtggtc 9780 ctgacacctg gccaggtcct tgtagtagtc ctgcatgagc cgctccacgg gcacctcctc 9840 ctcgcccgcg cggccgtgca tgcgcgtgag cccgaagccg cgctggggct ggacgagcgc 9900 caggtcggcg acgacgcgct cggcgaggat ggcttgctgg atctgggtga gggtggtctg 9960 gaagtcatca aagtcgacga agcggtggta ggctccggtg ttgatggtgt aggagcagtt 10020 ggccatgacg gaccagttga cggtctggtg gcccggacgc acgagctcgt ggtacttgag 10080 gcgcgagtag gcgcgcgtgt cgaagatgta gtcgttgcag gtgcgcacca ggtactggta 10140 gccgatgagg aagtgcggcg gcggctggcg gtagagcggc catcgctcgg tggcgggggc 10200 gccgggcgcg aggtcctcga gcatggtgcg gtggtagccg tagatgtacc tggacatcca 10260 ggtgatgccg gcggcggtgg tggaggcgcg cgggaactcg cggacgcggt tccagatgtt 10320 gcgcagcggc aggaagtagt tcatggtggg cacggtctgg cccgtgaggc gcgcgcagtc 10380 gtggatgctc tatacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag 10440 gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag 10500 ccgcagctaa cgtggtattg gcactcccgt ctcgacccaa gcctgcacca accctccagg 10560 atacggaggc gggtcgtttt gcaacttttt tttggaggcc ggatgagact agtaagcgcg 10620 gaaagcggcc gaccgcgatg gctcgctgcc gtagtctgga gaagaatcgc cagggttgcg 10680 ttgcggtgtg ccccggttcg aggccggccg gattccgcgg ctaacgaggg cgtggctgcc 10740 ccgtcgtttc caagacccca tagccagccg acttctccag ttacggagcg agcccctctt 10800 ttgttttgtt tgtttttgcc agatgcatcc cgtactgcgg cagatgcgcc cccaccaccc 10860 tccaccgcaa caacagcccc ctccacagcc ggcgcttctg cccccgcccc agcagcaact 10920 tccagccacg accgccgcgg ccgccgtgag cggggctgga cagagttatg atcaccagct 10980 ggccttggaa gagggcgagg ggctggcgcg cctgggggcg tcgtcgccgg agcggcaccc 11040 gcgcgtgcag atgaaaaggg acgctcgcga ggcctacgtg cccaagcaga acctgttcag 11100 agacaggagc ggcgaggagc ccgaggagat gcgcgcggcc cggttccacg cggggcggga 11160 gctgcggcgc ggcctggacc gaaagagggt gctgagggac gaggatttcg aggcggacga 11220 gctgacgggg atcagccccg cgcgcgcgca cgtggccgcg gccaacctgg tcacggcgta 11280 cgagcagacc gtgaaggagg agagcaactt ccaaaaatcc ttcaacaacc acgtgcgcac 11340 cctgatcgcg cgcgaggagg tgaccctggg cctgatgcac ctgtgggacc tgctggaggc 11400 catcgtgcag aaccccacca gcaagccgct gacggcgcag ctgttcctgg tggtgcagca 11460 tagtcgggac aacgaagcgt tcagggaggc gctgctgaat atcaccgagc ccgagggccg 11520 ctggctcctg gacctggtga acattctgca gagcatcgtg gtgcaggagc gcgggctgcc 11580 gctgtccgag aagctggcgg ccatcaactt ctcggtgctg agtttgggca agtactacgc 11640 taggaagatc tacaagaccc cgtacgtgcc catagacaag gaggtgaaga tcgacgggtt 11700 ttacatgcgc atgaccctga aagtgctgac cctgagcgac gatctggggg tgtaccgcaa 11760 cgacaggatg caccgtgcgg tgagcgccag caggcggcgc gagctgagcg accaggagct 11820 gatgcatagt ctgcagcggg ccctgaccgg ggccgggacc gagggggaga gctactttga 11880 catgggcgcg gacctgcact ggcagcccag ccgccgggcc ttggaggcgg cggcaggacc 11940 ctacgtagaa gaggtggacg atgaggtgga cgaggagggc gagtacctgg aagactgatg 12000 gcgcgaccgt atttttgcta gatgcaacaa caacagccac ctcctgatcc cgcgatgcgg 12060 gcggcgctgc agagccagcc gtccggcatt aactcctcgg acgattggac ccaggccatg 12120 caacgcatca tggcgctgac gacccgcaac cccgaagcct ttagacagca gccccaggcc 12180 aaccggctct cggccatcct ggaggccgtg gtgccctcgc gctccaaccc cacgcacgag 12240 aaggtcctgg ccatcgtgaa cgcgctggtg gagaacaagg ccatccgcgg cgacgaggcc 12300 ggcctggtgt acaacgcgct gctggagcgc gtggcccgct acaacagcac caacgtgcag 12360 accaacctgg accgcatggt gaccgacgtg cgcgaggccg tggcccagcg cgagcggttc 12420 caccgcgagt ccaacctggg atccatggtg gcgctgaacg ccttcctcag cacccagccc 12480 gccaacgtgc cccggggcca ggaggactac accaacttca tcagcgccct gcgcctgatg 12540 gtgaccgagg tgccccagag cgaggtgtac cagtccgggc cggactactt cttccagacc 12600 agtcgccagg gcttgcagac cgtgaacctg agccaggctt tcaagaactt gcagggcctg 12660 tggggcgtgc aggccccggt cggggaccgc gcgacggtgt cgagcctgct gacgccgaac 12720 tcgcgcctgc tgctgctgct ggtggccccc ttcacggaca gcggcagcat caaccgcaac 12780 tcgtacctgg gctacctgat taacctgtac cgcgaggcca tcggccaggc gcacgtggac 12840 gagcagacct accaggagat cacccacgtg agccgcgccc tgggccagga cgacccgggc 12900 aacctggaag ccaccctgaa ctttttgctg accaaccggt cgcagaagat cccgccccag 12960 tacgcgctca gcaccgagga ggagcgcatc ctgcgttacg tgcagcagag cgtgggcctg 13020 ttcctgatgc aggagggggc cacccccagc gccgcgctcg acatgaccgc gcgcaacatg 13080 gagcccagca tgtacgccag caaccgcccg ttcatcaata aactgatgga ctacttgcat 13140 cgggcggccg ccatgaactc tgactatttc accaacgcca tcctgaatcc ccactggctc 13200 ccgccgccgg ggttctacac gggcgagtac gacatgcccg accccaatga cgggttcctg 13260 tgggacgatg tggacagcag cgtgttctcc ccccgaccgg gtgctaacga gcgccccttg 13320 tggaagaagg aaggcagcga ccgacgcccg tcctcggcgc tgtccggccg cgagggtgct 13380 gccgcggcgg tgcccgaggc cgccagtcct ttcccgagct tgcccttctc gctgaacagt 13440 atccgcagca gcgagctggg caggatcacg cgcccgcgct tgctgggcga agaggagtac 13500 ttgaatgact cgctgttgag acccgagcgg gagaagaact tccccaataa cgggatagaa 13560 agcctggtgg acaagatgag ccgctggaag acgtatgcgc aggagcacag ggacgatccc 13620 cgggcgtcgc agggggccac gagccggggc agcgccgccc gtaaacgccg gtggcacgac 13680 aggcagcggg gacagatgtg ggacgatgag gactccgccg acgacagcag cgtgttggac 13740 ttgggtggga gtggtaaccc gttcgctcac ctgcgccccc gtatcgggcg catgatgtaa 13800 gagaaaccga aaataaatga tactcaccaa ggccatggcg accagcgtgc gttcgtttct 13860 tctctgttgt tgttgtatct agtatgatga ggcgtgcgta cccggagggt cctcctccct 13920 cgtacgagag cgtgatgcag caggcgatgg cggcggcggc gatgcagccc ccgctggagg 13980 ctccttacgt gcccccgcgg tacctggcgc ctacggaggg gcggaacagc attcgttact 14040 cggagctggc acccttgtac gataccaccc ggttgtacct ggtggacaac aagtcggcgg 14100 acatcgcctc gctgaactac cagaacgacc acagcaactt cctgaccacc gtggtgcaga 14160 acaatgactt cacccccacg gaggccagca cccagaccat caactttgac gagcgctcgc 14220 ggtggggcgg ccagctgaaa accatcatgc acaccaacat gcccaacgtg aacgagttca 14280 tgtacagcaa caagttcaag gcgcgggtga tggtctcccg caagaccccc aatggggtga 14340 cagtgacaga ggattatgat ggtagtcagg atgagctgaa gtatgaatgg gtggaatttg 14400 agctgcccga aggcaacttc tcggtgacca tgaccatcga cctgatgaac aacgccatca 14460 tcgacaatta cttggcggtg gggcggcaga acggggtgct ggagagcgac atcggcgtga 14520 agttcgacac taggaacttc aggctgggct gggaccccgt gaccgagctg gtcatgcccg 14580 gggtgtacac caacgaggct ttccatcccg atattgtctt gctgcccggc tgcggggtgg 14640 acttcaccga gagccgcctc agcaacctgc tgggcattcg caagaggcag cccttccagg 14700 aaggcttcca gatcatgtac gaggatctgg aggggggcaa catccccgcg ctcctggatg 14760 tcgacgccta tgagaaaagc aaggaggatg cagcagctga agcaactgca gccgtagcta 14820 ccgcctctac cgaggtcagg ggcgataatt ttgcaagcgc cgcagcagtg gcagcggccg 14880 aggcggctga aaccgaaagt aagatagtca ttcagccggt ggagaaggat agcaagaaca 14940 ggagctacaa cgtactaccg gacaagataa acaccgccta ccgcagctgg tacctagcct 15000 acaactatgg cgaccccgag aagggcgtgc gctcctggac gctgctcacc acctcggacg 15060 tcacctgcgg cgtggagcaa gtctactggt cgctgcccga catgatgcaa gacccggtca 15120 ccttccgctc cacgcgtcaa gttagcaact acccggtggt gggcgccgag ctcctgcccg 15180 tctactccaa gagcttcttc aacgagcagg ccgtctactc gcagcagctg cgcgccttca 15240 cctcgcttac gcacgtcttc aaccgcttcc ccgagaacca gatcctcgtc cgcccgcccg 15300 cgcccaccat taccaccgtc agtgaaaacg ttcctgctct cacagatcac gggaccctgc 15360 cgctgcgcag cagtatccgg ggagtccagc gcgtgaccgt tactgacgcc agacgccgca 15420 cctgccccta cgtctacaag gccctgggca tagtcgcgcc gcgcgtcctc tcgagccgca 15480 ccttctaaat gtccattctc atctcgccca gtaataacac cggttggggc ctgcgcgcgc 15540 ccagcaagat gtacggaggc gctcgccaac gctccacgca acaccccgtg cgcgtgcgcg 15600 ggcacttccg cgctccctgg ggcgccctca agggccgcgt gcggtcgcgc accaccgtcg 15660 acgacgtgat cgaccaggtg gtggccgacg cgcgcaacta cacccccgcc gccgcgcccg 15720 tctccaccgt ggacgccgtc atcgacagcg tggtggccga cgcgcgccgg tacgcccgcg 15780 ccaagagccg gcggcggcgc atcgcccggc ggcaccggag cacccccgcc atgcgcgcgg 15840 cgcgagcctt gctgcgcagg gccaggcgca cgggacgcag ggccatgctc agggcggcca 15900 gacgcgcggc ttcaggcgcc agcgccggca ggacccggag acgcgcggcc acggcggcgg 15960 cagcggccat cgccagcatg tcccgcccgc ggcgagggaa cgtgtactgg gtgcgcgacg 16020 ccgccaccgg tgtgcgcgtg cccgtgcgca cccgcccccc tcgcacttga agatgttcac 16080 ttcgcgatgt tgatgtgtcc cagcggcgag gaggatgtcc aagcgcaaat tcaaggaaga 16140 gatgctccag gtcatcgcgc ctgagatcta cggccctgcg gtggtgaagg aggaaagaaa 16200 gccccgcaaa atcaagcggg tcaaaaagga caaaaaggaa gaagaaagtg atgtggacgg 16260 attggtggag tttgtgcgcg agttcgcccc ccggcggcgc gtgcagtggc gcgggcggaa 16320 ggtgcaaccg gtgctgagac ccggcaccac cgtggtcttc acgcccggcg agcgctccgg 16380 caccgcttcc aagcgctcct acgacgaggt gtacggggat gatgatattc tggagcaggc 16440 ggccgagcgc ctgggcgagt ttgcttacgg caagcgcagc cgttccgcac cgaaggaaga 16500 ggcggtgtcc atcccgctgg accacggcaa ccccacgccg agcctcaagc ccgtgacctt 16560 gcagcaggtg ctgccgaccg cggcgccgcg ccgggggttc aagcgcgagg gcgaggatct 16620 gtaccccacc atgcagctga tggtgcccaa gcgccagaag ctggaagacg tgctggagac 16680 catgaaggtg gacccggacg tgcagcccga ggtcaaggtg cggcccatca agcaggtggc 16740 cccgggcctg ggcgtgcaga ccgtggacat caagattccc acggagccca tggaaacgca 16800 gaccgagccc atgatcaagc ccagcaccag caccatggag gtgcagacgg atccctggat 16860 gccatcggct cctagtcgaa gaccccggcg caagtacggc gcggccagcc tgctgatgcc 16920 caactacgcg ctgcatcctt ccatcatccc cacgccgggc taccgcggca cgcgcttcta 16980 ccgcggtcat accagcagcc gccgccgcaa gaccaccact cgccgccgcc gtcgccgcac 17040 cgccgctgca accacccctg ccgccctggt gcggagagtg taccgccgcg gccgcgcacc 17100 tctgaccctg ccgcgcgcgc gctaccaccc gagcatcgcc atttaaactt tcgcctgctt 17160 tgcagatcaa tggccctcac atgccgcctt cgcgttccca ttacgggcta ccgaggaaga 17220 aaaccgcgcc gtagaaggct ggcggggaac gggatgcgtc gccaccacca ccggcggcgg 17280 cgcgccatca gcaagcggtt ggggggaggc ttcctgcccg cgctgatccc catcatcgcc 17340 gcggcgatcg gggcgatccc cggcattgct tccgtggcgg tgcaggcctc tcagcgccac 17400 tgagacacac ttggaaacat cttgtaataa accaatggac tctgacgctc ctggtcctgt 17460 gatgtgtttt cgtagacaga tggaagacat caatttttcg tccctggctc cgcgacacgg 17520 cacgcggccg ttcatgggca cctggagcga catcggcacc agccaactga acgggggcgc 17580 cttcaattgg agcagtctct ggagcgggct taagaatttc gggtccacgc ttaaaaccta 17640 tggcagcaag gcgtggaaca gcaccacagg gcaggcgctg agggataagc tgaaagagca 17700 gaacttccag cagaaggtgg tcgatgggct cgcctcgggc atcaacgggg tggtggacct 17760 ggccaaccag gccgtgcagc ggcagatcaa cagccgcctg gacccggtgc cgcccgccgg 17820 ctccgtggag atgccgcagg tggaggagga gctgcctccc ctggacaagc ggggcgagaa 17880 gcgaccccgc cccgatgcgg aggagacgct gctgacgcac acggacgagc cgcccccgta 17940 cgaggaggcg gtgaaactgg gtctgcccac cacgcggccc atcgcgcccc tggccaccgg 18000 ggtgctgaaa cccgaaaagc ccgcgaccct ggacttgcct cctccccagc cttcccgccc 18060 ctctacagtg gctaagcccc tgccgccggt ggccgtggcc cgcgcgcgac ccgggggcac 18120 cgcccgccct catgcgaact ggcagagcac tctgaacagc atcgtgggtc tgggagtgca 18180 gagtgtgaag cgccgccgct gctattaaac ctaccgtagc gcttaacttg cttgtctgtg 18240 tgtgtatgta ttatgtcgcc gccgccgctg tccaccagaa ggaggagtga agaggcgcgt 18300 cgccgagttg caagatggcc accccatcga tgctgcccca gtgggcgtac atgcacatcg 18360 ccggacagga cgcttcggag tacctgagtc cgggtctggt gcagtttgcc cgcgccacag 18420 acacctactt cagtctgggg aacaagttta ggaaccccac ggtggcgccc acgcacgatg 18480 tgaccaccga ccgcagccag cggctgacgc tgcgcttcgt gcccgtggac cgcgaggaca 18540 acacctactc gtacaaagtg cgctacacgc tggccgtggg cgacaaccgc gtgctggaca 18600 tggccagcac ctactttgac atccgcggcg tgctggatcg gggccctagc ttcaaaccct 18660 actccggcac cgcctacaac agtctggccc ccaagggagc acccaacact tgtcagtgga 18720 catataaagc cgatggtgaa actgccacag aaaaaaccta tacatatgga aatgcacccg 18780 tgcagggcat taacatcaca aaagatggta ttcaacttgg aactgacacc gatgatcagc 18840 caatctacgc agataaaacc tatcagcctg aacctcaagt gggtgatgct gaatggcatg 18900 acatcactgg tactgatgaa aagtatggag gcagagctct taagcctgat accaaaatga 18960 agccttgtta tggttctttt gccaagccta ctaataaaga aggaggtcag gcaaatgtga 19020 aaacaggaac aggcactact aaagaatatg acatagacat ggctttcttt gacaacagaa 19080 gtgcggctgc tgctggccta gctccagaaa ttgttttgta tactgaaaat gtggatttgg 19140 aaactccaga tacccatatt gtatacaaag caggcacaga tgacagcagc tcttctatta 19200 atttgggtca gcaagccatg cccaacagac ctaactacat tggtttcaga gacaacttta 19260 tcgggctcat gtactacaac agcactggca atatgggggt gctggccggt caggcttctc 19320 agctgaatgc tgtggttgac ttgcaagaca gaaacaccga gctgtcctac cagctcttgc 19380 ttgactctct gggtgacaga acccggtatt tcagtatgtg gaatcaggcg gtggacagct 19440 atgatcctga tgtgcgcatt attgaaaatc atggtgtgga ggatgaactt cccaactatt 19500 gtttccctct ggatgctgtt ggcagaacag atacttatca gggaattaag gctaatggaa 19560 ctgatcaaac cacatggacc aaagatgaca gtgtcaatga tgctaatgag ataggcaagg 19620 gtaatccatt cgccatggaa atcaacatcc aagccaacct gtggaggaac ttcctctacg 19680 ccaacgtggc cctgtacctg cccgactctt acaagtacac gccggccaat gttaccctgc 19740 ccaccaacac caacacctac gattacatga acggccgggt ggtggcgccc tcgctggtgg 19800 actcctacat caacatcggg gcgcgctggt cgctggatcc catggacaac gtgaacccct 19860 tcaaccacca ccgcaatgcg gggctgcgct accgctccat gctcctgggc aacgggcgct 19920 acgtgccctt ccacatccag gtgccccaga aatttttcgc catcaagagc ctcctgctcc 19980 tgcccgggtc ctacacctac gagtggaact tccgcaagga cgtcaacatg atcctgcaga 20040 gctccctcgg caacgacctg cgcacggacg gggcctccat ctccttcacc agcatcaacc 20100 tctacgccac cttcttcccc atggcgcaca acacggcctc cacgctcgag gccatgctgc 20160 gcaacgacac caacgaccag tccttcaacg actacctctc ggcggccaac atgctctacc 20220 ccatcccggc caacgccacc aacgtgccca tctccatccc ctcgcgcaac tgggccgcct 20280 tccgcggctg gtccttcacg cgtctcaaga ccaaggagac gccctcgctg ggctccgggt 20340 tcgaccccta cttcgtctac tcgggctcca tcccctacct cgacggcacc ttctacctca 20400 accacacctt caagaaggtc tccatcacct tcgactcctc cgtcagctgg cccggcaacg 20460 accggctcct gacgcccaac gagttcgaaa tcaagcgcac cgtcgacggc gagggctaca 20520 acgtggccca gtgcaacatg accaaggact ggttcctggt ccagatgctg gcccactaca 20580 acatcggcta ccagggcttc tacgtgcccg agggctacaa ggaccgcatg tactccttct 20640 tccgcaactt ccagcccatg agccgccagg tggtggacga ggtcaactac aaggactacc 20700 aggccgtcac cctggcctac cagcacaaca actcgggctt cgtcggctac ctcgcgccca 20760 ccatgcgcca gggccagccc taccccgcca actaccccta cccgctcatc ggcaagagcg 20820 ccgtcaccag cgtcacccag aaaaagttcc tctgcgacag ggtcatgtgg cgcatcccct 20880 tctccagcaa cttcatgtcc atgggcgcgc tcaccgacct cggccagaac atgctctatg 20940 ccaactccgc ccacgcgcta gacatgaatt tcgaagtcga ccccatggat gagtccaccc 21000 ttctctatgt tgtcttcgaa gtcttcgacg tcgtccgagt gcaccagccc caccgcggcg 21060 tcatcgaggc cgtctacctg cgcaccccct tctcggccgg taacgccacc acctaagctc 21120 ttgcttcttg caagccatgg ccgcgggctc cggcgagcag gagctcaggg ccatcatccg 21180 cgacctgggc tgcgggccct acttcctggg caccttcgat aagcgcttcc cgggattcat 21240 ggccccgcac aagctggcct gcgccatcgt caacacggcc ggccgcgaga ccgggggcga 21300 gcactggctg gccttcgcct ggaacccgcg ctcgaacacc tgctacctct tcgacccctt 21360 cgggttctcg gacgagcgcc tcaagcagat ctaccagttc gagtacgagg gcctgctgcg 21420 ccgcagcgcc ctggccaccg aggaccgctg cgtcaccctg gaaaagtcca cccagaccgt 21480 gcagggtccg cgctcggccg cctgcgggct cttctgctgc atgttcctgc acgccttcgt 21540 gcactggccc gaccgcccca tggacaagaa ccccaccatg aacttgctga cgggggtgcc 21600 caacggcatg ctccagtcgc cccaggtgga acccaccctg cgccgcaacc aggaggcgct 21660 ctaccgcttc ctcaactccc actccgccta ctttcgctcc caccgcgcgc gcatcgagaa 21720 ggccaccgcc ttcgaccgca tgaatcaaga catgtaaacc gtgtgtgtat gttaaatgtc 21780 tttaataaac agcactttca tgttacacat gcatctgaga tgatttattt agaaatcgaa 21840 agggttctgc cgggtctcgg catggcccgc gggcagggac acgttgcgga actggtactt 21900 ggccagccac ttgaactcgg ggatcagcag tttgggcagc ggggtgtcgg ggaaggagtc 21960 ggtccacagc ttccgcgtca gttgcagggc gcccagcagg tcgggcgcgg agatcttgaa 22020 atcgcagttg ggacccgcgt tctgcgcgcg ggagttgcgg tacacggggt tgcagcactg 22080 gaacaccatc agggccgggt gcttcacgct cgccagcacc gtcgcgtcgg tgatgctctc 22140 cacgtcgagg tcctcggcgt tggccatccc gaagggggtc atcttgcagg tctgccttcc 22200 catggtgggc acgcacccgg gcttgtggtt gcaatcgcag tgcaggggga tcagcatcat 22260 ctgggcctgg tcggcgttca tccccgggta catggccttc atgaaagcct ccaattgcct 22320 gaacgcctgc tgggccttgg ctccctcggt gaagaagacc ccgcaggact tgctagagaa 22380 ctggttggtg gcgcacccgg cgtcgtgcac gcagcagcgc gcgtcgttgt tggccagctg 22440 caccacgctg cgcccccagc ggttctgggt gatcttggcc cggtcggggt tctccttcag 22500 cgcgcgctgc ccgttctcgc tcgccacatc catctcgatc atgtgctcct tctggatcat 22560 ggtggtcccg tgcaggcacc gcagcttgcc ctcggcctcg gtgcacccgt gcagccacag 22620 cgcgcacccg gtgcactccc agttcttgtg ggcgatctgg gaatgcgcgt gcacgaagcc 22680 ctgcaggaag cggcccatca tggtggtcag ggtcttgttg ctagtgaagg tcagcggaat 22740 gccgcggtgc tcctcgttga tgtacaggtg gcagatgcgg cggtacacct cgccctgctc 22800 gggcatcagc tggaagttgg ctttcaggtc ggtctccacg cggtagcggt ccatcagcat 22860 agtcatgatt tccataccct tctcccaggc cgagacgatg ggcaggctca tagggttctt 22920 caccatcatc ttagcgctag cagccgcggc cagggggtcg ctctcgtcca gggtctcaaa 22980 gctccgcttg ccgtccttct cggtgatccg caccgggggg tagctgaagc ccacggccgc 23040 cagctcctcc tcggcctgtc tttcgtcctc gctgtcctgg ctgacgtcct gcaggaccac 23100 atgcttggtc ttgcggggtt tcttcttggg cggcagcggc ggcggagatg ttggagatgg 23160 cgagggggag cgcgagttct cgctcaccac tactatctct tcctcttctt ggtccgaggc 23220 cacgcggcgg taggtatgtc tcttcggggg cagaggcgga ggcgacgggc tctcgccgcc 23280 gcgacttggc ggatggctgg cagagcccct tccgcgttcg ggggtgcgct cccggcggcg 23340 ctctgactga cttcctccgc ggccggccat tgtgttctcc tagggaggaa caacaagcat 23400 ggagactcag ccatcgccaa cctcgccatc tgcccccacc gccgacgaga agcagcagca 23460 gcagaatgaa agcttaaccg ccccgccgcc cagccccgcc acctccgacg cggccgtccc 23520 agacatgcaa gagatggagg aatccatcga gattgacctg ggctatgtga cgcccgcgga 23580 gcacgaggag gagctggcag tgcgcttttc acaagaagag atacaccaag aacagccaga 23640 gcaggaagca gagaatgagc agagtcaggc tgggctcgag catgacggcg actacctcca 23700 cctgagcggg ggggaggacg cgctcatcaa gcatctggcc cggcaggcca ccatcgtcaa 23760 ggatgcgctg ctcgaccgca ccgaggtgcc cctcagcgtg gaggagctca gccgcgccta 23820 cgagttgaac ctcttctcgc cgcgcgtgcc ccccaagcgc cagcccaatg gcacctgcga 23880 gcccaacccg cgcctcaact tctacccggt cttcgcggtg cccgaggccc tggccaccta 23940 ccacatcttt ttcaagaacc aaaagatccc cgtctcctgc cgcgccaacc gcacccgcgc 24000 cgacgccctt ttcaacctgg gtcccggcgc ccgcctacct gatatcgcct ccttggaaga 24060 ggttcccaag atcttcgagg gtctgggcag cgacgagact cgggccgcga acgctctgca 24120 aggagaagga ggagagcatg agcaccacag cgccctggtc gagttggaag gcgacaacgc 24180 gcggctggcg gtgctcaaac gcacggtcga gctgacccat ttcgcctacc cggctctgaa 24240 cctgcccccc aaagtcatga gcgcggtcat ggaccaggtg ctcatcaagc gcgcgtcgcc 24300 catctccgag gacgagggca tgcaagactc cgaggagggc aagcccgtgg tcagcgacga 24360 gcagctggcc cggtggctgg gtcctaatgc tagtccccag agtttggaag agcggcgcaa 24420 actcatgatg gccgtggtcc tggtgaccgt ggagctggag tgcctgcgcc gcttcttcgc 24480 cgacgcggag accctgcgca aggtcgagga gaacctgcac tacctcttca ggcacgggtt 24540 cgtgcgccag gcctgcaaga tctccaacgt ggagctgacc aacctggtct cctacatggg 24600 catcttgcac gagaaccgcc tggggcagaa cgtgctgcac accaccctgc gcggggaggc 24660 ccggcgcgac tacatccgcg actgcgtcta cctctacctc tgccacacct ggcagacggg 24720 catgggcgtg tggcagcagt gtctggagga gcagaacctg aaagagctct gcaagctcct 24780 gcagaagaac ctcaagggtc tgtggaccgg gttcgacgag cgcaccaccg cctcggacct 24840 ggccgacctc attttccccg agcgcctcag gctgacgctg cgcaacggcc tgcccgactt 24900 tatgagccaa agcatgttgc aaaactttcg ctctttcatc ctcgaacgct ccggaatcct 24960 gcccgccacc tgctccgcgc tgccctcgga cttcgtgccg ctgaccttcc gcgagtgccc 25020 cccgccgctg tggagccact gctacctgct gcgcctggcc aactacctgg cctaccactc 25080 ggacgtgatc gaggacgtca gcggcgaggg cctgctcgag tgccactgcc gctgcaacct 25140 ctgcacgccg caccgctccc tggcctgcaa cccccagctg ctgagcgaga cccagatcat 25200 cggcaccttc gagttgcaag ggcccagcga aggcgagggt tcagccgcca aggggggtct 25260 gaaactcacc ccggggctgt ggacctcggc ctacttgcgc aagttcgtgc ccgaggacta 25320 ccatcccttc gagatcaggt tctacgagga ccaatcccat ccgcccaagg ccgagctgtc 25380 ggcctgcgtc atcacccagg gggcgatcct ggcccaattg caagccatcc agaaatcccg 25440 ccaagaattc ttgctgaaaa agggccgcgg ggtctacctc gacccccaga ccggtgagga 25500 gctcaacccc ggcttccccc aggatgcccc gaggaaacaa gaagctgaaa gtggagctgc 25560 cgcccgtgga ggatttggag gaagactggg agaacagcag tcaggcagag gaggaggaga 25620 tggaggaaga ctgggacagc actcaggcag aggaggacag cctgcaagac agtctggagg 25680 aagacgagga ggaggcagag gaggaggtgg aagaagcagc cgccgccaga ccgtcgtcct 25740 cggcggggga gaaagcaagc agcacggata ccatctccgc tccgggtcgg ggtcccgctc 25800 gaccacacag tagatgggac gagaccggac gattcccgaa ccccaccacc cagaccggta 25860 agaaggagcg gcagggatac aagtcctggc gggggcacaa aaacgccatc gtctcctgct 25920 tgcaggcctg cgggggcaac atctccttca cccggcgcta cctgctcttc caccgcgggg 25980 tgaactttcc ccgcaacatc ttgcattact accgtcacct ccacagcccc tactacttcc 26040 aagaagaggc agcagcagca gaaaaagacc agcagaaaac cagcagctag aaaatccaca 26100 gcggcggcag caggtggact gaggatcgcg gcgaacgagc cggcgcaaac ccgggagctg 26160 aggaaccgga tctttcccac cctctatgcc atcttccagc agagtcgggg gcaggagcag 26220 gaactgaaag tcaagaaccg ttctctgcgc tcgctcaccc gcagttgtct gtatcacaag 26280 agcgaagacc aacttcagcg cactctcgag gacgccgagg ctctcttcaa caagtactgc 26340 gcgctcactc ttaaagagta gcccgcgccc gcccagtcgc agaaaaaggc gggaattacg 26400 tcacctgtgc ccttcgccct agccgcctcc acccatcatc atgagcaaag agattcccac 26460 gccttacatg tggagctacc agccccagat gggcctggcc gccggtgccg cccaggacta 26520 ctccacccgc atgaattggc tcagcgccgg gcccgcgatg atctcacggg tgaatgacat 26580 ccgcgcccac cgaaaccaga tactcctaga acagtcagcg ctcaccgcca cgccccgcaa 26640 tcacctcaat ccgcgtaatt ggcccgccgc cctggtgtac caggaaattc cccagcccac 26700 gaccgtacta cttccgcgag acgcccaggc cgaagtccag ctgactaact caggtgtcca 26760 gctggcgggc ggcgccaccc tgtgtcgtca ccgccccgct cagggtataa agcggctggt 26820 gatccggggc agaggcacac agctcaacga cgaggtggtg agctcttcgc tgggtctgcg 26880 acctgacgga gtcttccaac tcgccggatc ggggagatct tccttcacgc ctcgtcaggc 26940 cgtcctgact ttggagagtt cgtcctcgca gccccgctcg ggtggcatcg gcactctcca 27000 gttcgtggag gagttcactc cctcggtcta cttcaacccc ttctccggct cccccggcca 27060 ctacccggac gagttcatcc cgaacttcga cgccatcagc gagtcggtgg acggctacga 27120 ttgaatgtcc catggtggcg cagctgacct agctcggctt cgacacctgg accactgccg 27180 ccgcttccgc tgcttcgctc gggatctcgc cgagtttgcc tactttgagc tgcccgagga 27240 gcaccctcag ggcccggccc acggagtgcg gatcgtcgtc gaagggggcc tcgactccca 27300 cctgcttcgg atcttcagcc agcgtccgat cctggtcgag cgcgagcaag gacagaccct 27360 tctgactctg tactgcatct gcaaccaccc cggcctgcat gaaagtcttt gttgtctgct 27420 gtgtactgag tataataaaa gctgagatca gcgactactc cggacttccg tgtgttcctg 27480 aatccatcaa ccagtctttg ttcttcaccg ggaacgagac cgagctccag ctccagtgta 27540 agccccacaa gaagtacctc acctggctgt tccagggctc cccgatcgcc gttgtcaacc 27600 actgcgacaa cgacggagtc ctgctgagcg gccctgccaa ccttactttt tccacccgca 27660 gaagcaagct ccagctcttc caacccttcc tccccgggac ctatcagtgc gtctcgggac 27720 cctgccatca caccttccac ctgatcccga ataccacagc gtcgctcccc gctactaaca 27780 accaaactaa cctccaccaa cgccaccgtc gcgacctttc tgaatctaat actaccaccc 27840 acaccggagg tgagctccga ggtcaaccaa cctctgggat ttactacggc ccctgggagg 27900 tggttgggtt aatagcgcta ggcctagttg cgggtgggct tttggttctc tgctacctat 27960 acctcccttg ctgttcgtac ttagtggtgc tgtgttgctg gtttaagaaa tggggaagat 28020 caccctagtg agctgcggtg cgctggtggc ggtgttgctt tcgattgtgg gactgggcgg 28080 tgcggctgta gtgaaggaga aggccgatcc ctgcttgcat ttcaatccca acaaatgcca 28140 gctgagtttt cagcccgatg gcaatcggtg cgcggtactg atcaagtgcg gatgggaatg 28200 cgagaacgtg agaatcgagt acaataacaa gactcggaac aatactctcg cgtccgtgtg 28260 gcagcccggg gaccccgagt ggtacaccgt ctctgtcccc ggtgctgacg gctccccgcg 28320 caccgtgaat aatactttca tttttgcgca catgtgcgac acggtcatgt ggatgagcaa 28380 gcagtacgat atgtggcccc ccacgaagga gaacatcgtg gtcttctcca tcgcttacag 28440 cctgtgcacg gcgctaatca ccgctatcgt gtgcctgagc attcacatgc tcatcgctat 28500 tcgccccaga aataatgccg aaaaagaaaa acagccataa cgtttttttt cacacctttt 28560 tcagaccatg gcctctgtta aatttttgct tttatttgcc agtctcattg ccgtcattca 28620 tggaatgagt aatgagaaaa ttactattta cactggcact aatcacacat tgaaaggtcc 28680 agaaaaagcc acagaagttt catggtattg ttattttaat gaatcagatg tatctactga 28740 actctgtgga aacaataaca aaaaaaatga gagcattact ctcatcaagt ttcaatgtgg 28800 atctgactta accctaatta acatcactag agactatgta ggtatgtatt atggaactac 28860 agcaggcatt tcggacatgg aattttatca agtttctgtg tctgaaccca ccacgcctag 28920 aatgaccaca accacaaaaa ctacacctgt taccactatg cagctcacta ccaataacat 28980 ttttgccatg cgtcaaatgg tcaacaatag cactcaaccc accccaccca gtgaggaaat 29040 tcccaaatcc atgattggca ttattgttgc tgtagtggtg tgcatgttga tcatcgcctt 29100 gtgcatggtg tactatgcct tctgctacag aaagcacaga ctgaacgaca agctggaaca 29160 cttactaagt gttgaatttt aattttttag aaccatgaag atcctaggcc ttttaatttt 29220 ttctatcatt acctctgctc tatgcaattc tgacaatgag gacgttactg tcgttgtcgg 29280 atcaaattat acactgaaag gtccagcgaa gggtatgctt tcgtggtatt gctattttgg 29340 atctgacact acagaaactg aattatgcaa tcttaagaat ggcaaaattc aaaattctaa 29400 aattaacaat tatatatgca atggtactga tctgatactc ctcaatatca cgaaatcata 29460 tgctggcagt tacacctgcc ctggagatga tgctgacagt atgatttttt acaaagtaac 29520 tgttgttgat cccactactc cacctccacc caccacaact actcacacca cacacacaga 29580 tcaaaccgca gcagaggagg cagcaaagtt agccttgcag gtccaagaca gttcatttgt 29640 tggcattacc cctacacctg atcagcggtg tccggggctg ctagtcagcg gcattgtcgg 29700 tgtgctttcg ggattagcag tcataatcat ctgcatgttc atttttgctt gctgctatag 29760 aaggctttac cgacaaaaat cagacccact gctgaacctc tatgtttaat tttttccaga 29820 gtcatgaagg cagttagcgc tctagttttt tgttctttga ttggcattgt tttttgcaat 29880 cctattccta aagttagctt tattaaagat gtgaatgtta ctgagggggg caatgtgaca 29940 ctggtaggtg tagagggtgc tgaaaacacc acctggacaa aataccacct caatgggtgg 30000 aaagatattt gcaattggag tgtattagtt tatacatgtg agggagttaa tcttaccatt 30060 gtcaatgcca cctcagctca aaatggtaga attcaaggac aaagtgtcag tgtatctaat 30120 gggtatttta cccaacatac ttttatctat gacgttaaag tcataccact gcctacgcct 30180 agcccaccta gcactaccac acagacaacc cacactacac agacaaccac atacagtaca 30240 ttaaatcagc ctaccaccac tacagcagca gaggttgcca gctcgtctgg ggtccgagtg 30300 gcatttttga tgttggcccc atctagcagt cccactgcta gtaccaatga gcagactact 30360 gaatttttgt ccactgtcga gagccacacc acagctacct ccagtgcctt ctctagcacc 30420 gccaatctct cctcgctttc ctctacacca atcagtcccg ctactactcc tagccccgct 30480 cctcttccca ctcccctgaa gcaaacagac ggcggcatgc aatggcagat caccctgctc 30540 attgtgatcg ggttggtcat cctggccgtg ttgctctact acatcttctg ccgccgcatt 30600 cccaacgcgc accgcaagcc ggtctacaag cccatcattg tcgggcagcc ggagccgctt 30660 caggtggaag ggggtctaag gaatcttctc ttctctttta cagtatggtg attgaactat 30720 gattcctaga caattcttga tcactattct tatctgcctc ctccaagtct gtgccaccct 30780 cgctctggtg gccaacgcca gtccagactg tattgggccc ttcgcctcct acgtgctctt 30840 tgccttcacc acctgcatct gctgctgtag catagtctgc ctgcttatca ccttcttcca 30900 gttcattgac tggatctttg tgcgcatcgc ctacctgcgc caccaccccc agtaccgcga 30960 ccagcgagtg gcgcggctgc tcaggctcct ctgataagca tgcgggctct gctacttctc 31020 gcgcttctgc tgttagtgct cccccgtccc gtcgaccccc ggtcccccac ccagtccccc 31080 gaggaggtcc gcaaatgcaa attccaagaa ccctggaaat tcctcaaatg ctaccgccaa 31140 aaatcagaca tgcatcccag ctggatcatg atcattggga tcgtgaacat tctggcctgc 31200 accctcatct cctttgtgat ttacccctgc tttgactttg gttggaactc gccagaggcg 31260 ctctatctcc cgcctgaacc tgacacacca ccacagcaac ctcaggcaca cgcactacca 31320 ccactacagc ctaggccaca atacatgccc atattagact atgaggccga gccacagcga 31380 cccatgctcc ccgctattag ttacttcaat ctaaccggcg gagatgactg acccactggc 31440 caacaacaac gtcaacgacc ttctcctgga catggacggc cgcgcctcgg agcagcgact 31500 cgcccaactt cgcattcgcc agcagcagga gagagccgtc aaggagctgc aggatgcggt 31560 ggccatccac cagtgcaaga gaggcatctt ctgcctggtg aaacaggcca agatctccta 31620 cgaggtcact ccaaacgacc atcgcctctc ctacgagctc ctgcagcagc gccagaagtt 31680 cacctgcctg gtcggagtca accccatcgt catcacccag cagtctggcg ataccaaggg 31740 gtgcatccac tgctcctgcg actcccccga ctgcgtccac actctgatca agaccctctg 31800 cggcctccgc gacctcctcc ccatgaacta atcaccccct tatccagtga aataaagatc 31860 atattgatga tgattttaca gaaataaaaa ataatcattt gatttgaaat aaagatacaa 31920 tcatattgat gatttgagtt taacaaaaaa ataaagaatc acttacttga aatctgatac 31980 caggtctctg tccatgtttt ctgccaacac cacttcactc ccctcttccc agctctggta 32040 ctgcaggccc cggcgggctg caaacttcct ccacacgctg aaggggatgt caaattcctc 32100 ctgtccctca atcttcattt tatcttctat cagatgtcca aaaagcgcgt ccgggtggat 32160 gatgacttcg accccgtcta cccctacgat gcagacaacg caccgaccgt gcccttcatc 32220 aaccccccct tcgtctcttc agatggattc caagagaagc ccctgggggt gttgtccctg 32280 cgactggccg accccgtcac caccaagaac ggggaaatca ccctcaagct gggagagggg 32340 gtggacctcg attcctcggg aaaactcatc tccaacacgg ccaccaaggc cgccgcccct 32400 ctcagttttt ccaacaacac catttccctt aacatggatc acccctttta cactaaagat 32460 ggaaaattat ccttacaagt ttctccacca ttaaatatac tgagaacaag cattctaaac 32520 acactagctt taggttttgg atcaggttta ggactccgtg gctctgcctt ggcagtacag 32580 ttagtctctc cacttacatt tgatactgat ggaaacataa agcttacctt agacagaggt 32640 ttgcatgtta caacaggaga tgcaattgaa agcaacataa gctgggctaa aggtttaaaa 32700 tttgaagatg gagccatagc aaccaacatt ggaaatgggt tagagtttgg aagcagtagt 32760 acagaaacag gtgttgatga tgcttaccca atccaagtta aacttggatc tggccttagc 32820 tttgacagta caggagccat aatggctggt aacaaagaag acgataaact cactttgtgg 32880 acaacacctg atccatcacc aaactgtcaa atactcgcag aaaatgatgc aaaactaaca 32940 ctttgcttga ctaaatgtgg tagtcaaata ctggccactg tgtcagtctt agttgtagga 33000 agtggaaacc taaaccccat tactggcacc gtaagcagtg ctcaggtgtt tctacgtttt 33060 gatgcaaacg gtgttctttt aacagaacat tctacactaa aaaaatactg ggggtatagg 33120 cagggagata gcatagatgg cactccatat accaatgctg taggattcat gcccaattta 33180 aaagcttatc caaagtcaca aagttctact actaaaaata atatagtagg gcaagtatac 33240 atgaatggag atgtttcaaa acctatgctt ctcactataa ccctcaatgg tactgatgac 33300 agcaacagta catattcaat gtcattttca tacacctgga ctaatggaag ctatgttgga 33360 gcaacatttg gggctaactc ttataccttc tcatacatcg cccaagaatg aacactgtat 33420 cccaccctgc atgccaaccc ttcccacccc actctgtgga acaaactctg aaacacaaaa 33480 taaaataaag ttcaagtgtt ttattgattc aacagtttta caggattcga gcagttattt 33540 ttcctccacc ctcccaggac atggaataca ccaccctctc cccccgcaca gccttgaaca 33600 tctgaatgcc attggtgatg gacatgcttt tggtctccac gttccacaca gtttcagagc 33660 gagccagtct cgggtcggtc agggagatga aaccctccgg gcactcccgc atctgcacct 33720 cacagctcaa cagctgagga ttgtcctcgg tggtcgggat cacggttatc tggaagaagc 33780 agaagagcgg cggtgggaat catagtccgc gaacgggatc ggccggtggt gtcgcatcag 33840 gccccgcagc agtcgctgcc gccgccgctc cgtcaagctg ctgctcaggg ggtccgggtc 33900 cagggactcc ctcagcatga tgcccacggc cctcagcatc agtcgtctgg tgcggcgggc 33960 gcagcagcgc atgcggatct cgctcaggtc gctgcagtac gtgcaacaca gaaccaccag 34020 gttgttcaac agtccatagt tcaacacgct ccagccgaaa ctcatcgcgg gaaggatgct 34080 acccacgtgg ccgtcgtacc agatcctcag gtaaatcaag tggtgccccc tccagaacac 34140 gctgcccacg tacatgatct ccttgggcat gtggcggttc accacctccc ggtaccacat 34200 caccctctgg ttgaacatgc agccccggat gatcctgcgg aaccacaggg ccagcaccgc 34260 cccgcccgcc atgcagcgaa gagaccccgg gtcccggcaa tggcaatgga ggacccaccg 34320 ctcgtacccg tggatcatct gggagctgaa caagtctatg ttggcacagc acaggcatat 34380 gctcatgcat ctcttcagca ctctcaactc ctcgggggtc aaaaccatat cccagggcac 34440 ggggaactct tgcaggacag cgaaccccgc agaacagggc aatcctcgca cagaacttac 34500 attgtgcatg gacagggtat cgcaatcagg cagcaccggg tgatcctcca ccagagaagc 34560 gcgggtctcg gtctcctcac agcgtggtaa gggggccggc cgatacgggt gatggcggga 34620 cgcggctgat cgtgttcgcg accgtgtcat gatgcagttg ctttcggaca ttttcgtact 34680 tgctgtagca gaacctggtc cgggcgctgc acaccgatcg ccggcggcgg tctcggcgct 34740 tggaacgctc ggtgttgaaa ttgtaaaaca gccactctct cagaccgtgc agcagatcta 34800 gggcctcagg agtgatgaag atcccatcat gcctgatggc tctgatcaca tcgaccaccg 34860 tggaatgggc cagacccagc cagatgatgc aattttgttg ggtttcggtg acggcggggg 34920 agggaagaac aggaagaacc atgattaact tttaatccaa acggtctcgg agtacttcaa 34980 aatgaagatc gcggagatgg cacctctcgc ccccgctgtg ttggtggaaa ataacagcca 35040 ggtcaaaggt gatacggttc tcgagatgtt ccacggtggc ttccagcaaa gcctccacgc 35100 gcacatccag aaacaagaca atagcgaaag cgggagggtt ctctaattcc tcaatcatca 35160 tgttacactc ctgcaccatc cccagataat tttcattttt ccagccttga atgattcgaa 35220 ctagttcctg aggtaaatcc aagccagcca tgataaagag ctcgcgcaga gcgccctcca 35280 ccggcattct taagcacacc ctcataattc caagatattc tgctcctggt tcacctgcag 35340 cagattgaca agcggaatat caaaatctct gccgcgatcc ctgagctcct ccctcagcaa 35400 taactgtaag tactctttca tatcctctcc gaaattttta gccataggac caccaggaat 35460 aagattaggg caagccacag tacagataaa ccgaagtcct ccccagtgag cattgccaaa 35520 tgcaagactg ctataagcat gctggctaga cccggtgata tcttccagat aactggacag 35580 aaaatcgccc aggcaatttt taagaaaatc aacaaaagaa aaatcctcca ggtggacgtt 35640 tagagcctcg ggaacaacga tgaagtaaat gcaagcggtg cgttccagca tggttagtta 35700 gctgatctgt agaaaaaaca aaaatgaaca ttaaaccatg ctagcctggc gaacaggtgg 35760 gtaaatcgtt ctctccagca ccaggcaggc cacggggtct ccggcgcgac cctcgtaaaa 35820 attgtcgcta tgattgaaaa ccatcacaga gagacgttcc cggtggccgg cgtgaatgat 35880 tcgacaagat gaatacaccc ccggaacatt ggcgtccgcg agtgaaaaaa agcgcccgag 35940 gaagcaataa ggcactacaa tgctcagtct caagtccagc aaagcgatgc catgcggatg 36000 aagcacaaaa ttctcaggtg cgtacaaaat gtaattactc ccctcctgca caggcagcaa 36060 agcccccgat ccctccaggt acacatacaa agcctcagcg tccatagctt accgagcagc 36120 agcacacaac aggcgcaaga gtcagagaaa ggctgagctc taacctgtcc acccgctctc 36180 tgctcaatat atagcccaga tctacactga cgtaaaggcc aaagtctaaa aatacccgcc 36240 aaataatcac acacgcccag cacacgccca gaaaccggtg acacactcaa aaaaatacgc 36300 gcacttcctc aaacgcccaa aactgccgtc atttccgggt tcccacgcta cgtcatcaaa 36360 acacgacttt caaattccgt cgaccgttaa aaacgtcacc cgccccgccc ctaacggtcg 36420 cccgtctctc agccaatcag cgccccgcat ccccaaattc aaacacctca tttgcatatt 36480 aacgcgcaca aaaagtttga ggtatattat tgatgatgg 36519 <210> 11 <211> 31867 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 11 ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60 aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120 gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180 tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240 aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300 gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360 gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420 tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480 atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540 tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600 gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840 atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900 atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960 tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200 cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260 tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg 1320 acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca 1380 agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg 1440 tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 1500 acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 1560 aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga 1620 accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc 1680 tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca 1740 tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc 1800 actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc 1860 tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc 1920 tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctttac aagtagtgag 1980 tttaaactcc catttaaatg tgagggttaa tgcttcgagc agacatgata agatacattg 2040 atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 2100 gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 2160 attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 2220 aaaacctcta caaatgtggt aaaataacta taacggtcct aaggtagcga gtgagtagtg 2280 ttctggggcg ggggaggacc tgcatgaggg ccagaataac tgaaatctgt gcttttctgt 2340 gtgttgcagc agcatgagcg gaagcggctc ctttgaggga ggggtattca gcccttatct 2400 gacggggcgt ctcccctcct gggcgggagt gcgtcagaat gtgatgggat ccacggtgga 2460 cggccggccc gtgcagcccg cgaactcttc aaccctgacc tatgcaaccc tgagctcttc 2520 gtcgttggac gcagctgccg ccgcagctgc tgcatctgcc gccagcgccg tgcgcggaat 2580 ggccatgggc gccggctact acggcactct ggtggccaac tcgagttcca ccaataatcc 2640 cgccagcctg aacgaggaga agctgttgct gctgatggcc cagctcgagg ccttgaccca 2700 gcgcctgggc gagctgaccc agcaggtggc tcagctgcag gagcagacgc gggccgcggt 2760 tgccacggtg aaatccaaat aaaaaatgaa tcaataaata aacggagacg gttgttgatt 2820 ttaacacaga gtctgaatct ttatttgatt tttcgcgcgc ggtaggccct ggaccaccgg 2880 tctcgatcat tgagcacccg gtggatcttt tccaggaccc ggtagaggtg ggcttggatg 2940 ttgaggtaca tgggcatgag cccgtcccgg gggtggaggt agctccattg cagggcctcg 3000 tgctcggggg tggtgttgta aatcacccag tcatagcagg ggcgcagggc atggtgttgc 3060 acaatatctt tgaggaggag actgatggcc acgggcagcc ctttggtgta ggtgtttaca 3120 aatctgttga gctgggaggg atgcatgcgg ggggagatga ggtgcatctt ggcctggatc 3180 ttgagattgg cgatgttacc gcccagatcc cgcctggggt tcatgttgtg caggaccacc 3240 agcacggtgt atccggtgca cttggggaat ttatcatgca acttggaagg gaaggcgtga 3300 aagaatttgg cgacgccttt gtgcccgccc aggttttcca tgcactcatc catgatgatg 3360 gcgatgggcc cgtgggcggc ggcctgggca aagacgtttc gggggtcgga cacatcatag 3420 ttgtggtcct gggtgaggtc atcataggcc attttaatga atttggggcg gagggtgccg 3480 gactggggga caaaggtacc ctcgatcccg ggggcgtagt tcccctcaca gatctgcatc 3540 tcccaggctt tgagctcgga gggggggatc atgtccacct gcggggcgat aaagaacacg 3600 gtttccgggg cgggggagat gagctgggcc gaaagcaagt tccggagcag ctgggacttg 3660 ccgcagccgg tggggccgta gatgaccccg atgaccggct gcaggtggta gttgagggag 3720 agacagctgc cgtcctcccg gaggaggggg gccacctcgt tcatcatctc gcgcacgtgc 3780 atgttctcgc gcaccagttc cgccaggagg cgctctcccc ccagggatag gagctcctgg 3840 agcgaggcga agtttttcag cggcttgagt ccgtcggcca tgggcatttt ggagagggtt 3900 tgttgcaaga gttccaggcg gtcccagagc tcggtgatgt gctctacggc atctcgatcc 3960 agcagacctc ctcgtttcgc gggttgggac ggctgcggga gtagggcacc agacgatggg 4020 cgtccagcgc agccagggtc cggtccttcc agggtcgcag cgtccgcgtc agggtggtct 4080 ccgtcacggt gaaggggtgc gcgccgggct gggcgcttgc gagggtgcgc ttcaggctca 4140 tccggctggt cgaaaaccgc tcccgatcgg cgccctgcgc gtcggccagg tagcaattga 4200 ccatgagttc gtagttgagc gcctcggccg cgtggccttt ggcgcggagc ttacctttgg 4260 aagtctgccc gcaggcggga cagaggaggg acttgagggc gtagagcttg ggggcgagga 4320 agacggactc gggggcgtag gcgtccgcgc cgcagtgggc gcagacggtc tcgcactcca 4380 cgagccaggt gaggtcgggc tggtcggggt caaaaaccag tttcccgccg ttctttttga 4440 tgcgtttctt acctttggtc tccatgagct cgtgtccccg ctgggtgaca aagaggctgt 4500 ccgtgtcccc gtagaccgac tttatgggcc ggtcctcgag cggtgtgccg cggtcctcct 4560 cgtagaggaa ccccgcccac tccgagacga aagcccgggt ccaggccagc acgaaggagg 4620 ccacgtggga cgggtagcgg tcgttgtcca ccagcgggtc caccttttcc agggtatgca 4680 aacacatgtc cccctcgtcc acatccagga aggtgattgg cttgtaagtg taggccacgt 4740 gaccgggggt cccggccggg ggggtataaa agggtgcggg tccctgctcg tcctcactgt 4800 cttccggatc gctgtccagg agcgccagct gttggggtag gtattccctc tcgaaggcgg 4860 gcatgacctc ggcactcagg ttgtcagttt ctagaaacga ggaggatttg atattgacgg 4920 tgccggcgga gatgcctttc aagagcccct cgtccatctg gtcagaaaag acgatctttt 4980 tgttgtcgag cttggtggcg aaggagccgt agagggcgtt ggagaggagc ttggcgatgg 5040 agcgcatggt ctggtttttt tccttgtcgg cgcgctcctt ggcggcgatg ttgagctgca 5100 cgtactcgcg cgccacgcac ttccattcgg ggaagacggt ggtcagctcg tcgggcacga 5160 ttctgacctg ccagccccga ttatgcaggg tgatgaggtc cacactggtg gccacctcgc 5220 cgcgcagggg ctcattagtc cagcagaggc gtccgccctt gcgcgagcag aaggggggca 5280 gggggtccag catgacctcg tcgggggggt cggcatcgat ggtgaagatg ccgggcagga 5340 ggtcggggtc aaagtagctg atggaagtgg ccagatcgtc cagggcagct tgccattcgc 5400 gcacggccag cgcgctctcg tagggactga ggggcgtgcc ccagggcatg ggatgggtaa 5460 gcgcggaggc gtacatgccg cagatgtcgt agacgtagag gggctcctcg aggatgccga 5520 tgtaggtggg gtagcagcgc cccccgcgga tgctggcgcg cacgtagtca tacagctcgt 5580 gcgagggggc gaggagcccc gggcccaggt tggtgcgact gggcttttcg gcgcggtaga 5640 cgatctggcg gaaaatggca tgcgagttgg aggagatggt gggcctttgg aagatgttga 5700 agtgggcgtg gggcagtccg accgagtcgc ggatgaagtg ggcgtaggag tcttgcagct 5760 tggcgacgag ctcggcggtg actaggacgt ccagagcgca gtagtcgagg gtctcctgga 5820 tgatgtcata cttgagctgt cccttttgtt tccacagctc gcggttgaga aggaactctt 5880 cgcggtcctt ccagtactct tcgaggggga acccgtcctg atctgcacgg taagagccta 5940 gcatgtagaa ctggttgacg gccttgtagg cgcagcagcc cttctccacg gggagggcgt 6000 aggcctgggc ggccttgcgc agggaggtgt gcgtgagggc gaaagtgtcc ctgaccatga 6060 ccttgaggaa ctggtgcttg aagtcgatat cgtcgcagcc cccctgctcc cagagctgga 6120 agtccgtgcg cttcttgtag gcggggttgg gcaaagcgaa agtaacatcg ttgaagagga 6180 tcttgcccgc gcggggcata aagttgcgag tgatgcggaa aggttggggc acctcggccc 6240 ggttgttgat gacctgggcg gcgagcacga tctcgtcgaa gccgttgatg ttgtggccca 6300 cgatgtagag ttccacgaat cgcggacggc ccttgacgtg gggcagtttc ttgagctcct 6360 cgtaggtgag ctcgtcgggg tcgctgagcc cgtgctgctc gagcgcccag tcggcgagat 6420 gggggttggc gcggaggaag gaagtccaga gatccacggc cagggcggtt tgcagacggt 6480 cccggtactg acggaactgc tgcccgacgg ccattttttc gggggtgacg cagtagaagg 6540 tgcgggggtc cccgtgccag cgatcccatt tgagctggag ggcgagatcg agggcgagct 6600 cgacgagccg gtcgtccccg gagagtttca tgaccagcat gaaggggacg agctgcttgc 6660 cgaaggaccc catccaggtg taggtttcca catcgtaggt gaggaagagc ctttcggtgc 6720 gaggatgcga gccgatgggg aagaactgga tctcctgcca ccaattggag gaatggctgt 6780 tgatgtgatg gaagtagaaa tgccgacggc gcgccgaaca ctcgtgcttg tgtttataca 6840 agcggccaca gtgctcgcaa cgctgcacgg gatgcacgtg ctgcacgagc tgtacctgag 6900 ttcctttgac gaggaatttc agtgggaagt ggagtcgtgg cgcctgcatc tcgtgctgta 6960 ctacgtcgtg gtggtcggcc tggccctctt ctgcctcgat ggtggtcatg ctgacgagcc 7020 cgcgcgggag gcaggtccag acctcggcgc gagcgggtcg gagagcgagg acgagggcgc 7080 gcaggccgga gctgtccagg gtcctgagac gctgcggagt caggtcagtg ggcagcggcg 7140 gcgcgcggtt gacttgcagg agtttttcca gggcgcgcgg gaggtccaga tggtacttga 7200 tctccaccgc gccattggtg gcgacgtcga tggcttgcag ggtcccgtgc ccctggggtg 7260 tgaccaccgt cccccgtttc ttcttgggcg gctggggcga cgggggcggt gcctcttcca 7320 tggttagaag cggcggcgag gacgcgcgcc gggcggcagg ggcggctcgg ggcccggagg 7380 caggggcggc aggggcacgt cggcgccgcg cgcgggtagg ttctggtact gcgcccggag 7440 aagactggcg tgagcgacga cgcgacggtt gacgtcctgg atctgacgcc tctgggtgaa 7500 ggccacggga cccgtgagtt tgaacctgaa agagagttcg acagaatcaa tctcggtatc 7560 gttgacggcg gcctgccgca ggatctcttg cacgtcgccc gagttgtcct ggtaggcgat 7620 ctcggtcatg aactgctcga tctcctcctc ttgaaggtct ccgcggccgg cgcgctccac 7680 ggtggccgcg aggtcgttgg agatgcggcc catgagctgc gagaaggcgt tcatgcccgc 7740 ctcgttccag acgcggctgt agaccacgac gccctcggga tcgcgggcgc gcatgaccac 7800 ctgggcgagg ttgagctcca cgtggcgcgt gaagaccgcg tagttgcaga ggcgctggta 7860 gaggtagttg agcgtggtgg cgatgtgctc ggtgacgaag aaatacatga tccagcggcg 7920 gagcggcatc tcgctgacgt cgcccagcgc ctccaaacgt tccatggcct cgtaaaagtc 7980 cacggcgaag ttgaaaaact gggagttgcg cgccgagacg gtcaactcct cctccagaag 8040 acggatgagc tcggcgatgg tggcgcgcac ctcgcgctcg aaggcccccg ggagttcctc 8100 cacttcctct tcttcctcct ccactaacat ctcttctact tcctcctcag gcggcagtgg 8160 tggcggggga gggggcctgc gtcgccggcg gcgcacgggc agacggtcga tgaagcgctc 8220 gatggtctcg ccgcgccggc gtcgcatggt ctcggtgacg gcgcgcccgt cctcgcgggg 8280 ccgcagcgtg aagacgccgc cgcgcatctc caggtggccg ggggggtccc cgttgggcag 8340 ggagagggcg ctgacgatgc atcttatcaa ttgccccgta gggactccgc gcaaggacct 8400 gagcgtctcg agatccacgg gatctgaaaa ccgctgaacg aaggcttcga gccagtcgca 8460 gtcgcaaggt aggctgagca cggtttcttc tggcgggtca tgttggttgg gagcggggcg 8520 ggcgatgctg ctggtgatga agttgaaata ggcggttctg agacggcgga tggtggcgag 8580 gagcaccagg tctttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc 8640 gtggtcctga cacctggcca ggtccttgta gtagtcctgc atgagccgct ccacgggcac 8700 ctcctcctcg cccgcgcggc cgtgcatgcg cgtgagcccg aagccgcgct ggggctggac 8760 gagcgccagg tcggcgacga cgcgctcggc gaggatggct tgctggatct gggtgagggt 8820 ggtctggaag tcatcaaagt cgacgaagcg gtggtaggct ccggtgttga tggtgtagga 8880 gcagttggcc atgacggacc agttgacggt ctggtggccc ggacgcacga gctcgtggta 8940 cttgaggcgc gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggtgc gcaccaggta 9000 ctggtagccg atgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc 9060 gggggcgccg ggcgcgaggt cctcgagcat ggtgcggtgg tagccgtaga tgtacctgga 9120 catccaggtg atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca 9180 gatgttgcgc agcggcagga agtagttcat ggtgggcacg gtctggcccg tgaggcgcgc 9240 gcagtcgtgg atgctctata cgggcaaaaa cgaaagcggt cagcggctcg actccgtggc 9300 ctggaggcta agcgaacggg ttgggctgcg cgtgtacccc ggttcgaatc tcgaatcagg 9360 ctggagccgc agctaacgtg gtattggcac tcccgtctcg acccaagcct gcaccaaccc 9420 tccaggatac ggaggcgggt cgttttgcaa cttttttttg gaggccggat gagactagta 9480 agcgcggaaa gcggccgacc gcgatggctc gctgccgtag tctggagaag aatcgccagg 9540 gttgcgttgc ggtgtgcccc ggttcgaggc cggccggatt ccgcggctaa cgagggcgtg 9600 gctgccccgt cgtttccaag accccatagc cagccgactt ctccagttac ggagcgagcc 9660 cctcttttgt tttgtttgtt tttgccagat gcatcccgta ctgcggcaga tgcgccccca 9720 ccaccctcca ccgcaacaac agccccctcc acagccggcg cttctgcccc cgccccagca 9780 gcaacttcca gccacgaccg ccgcggccgc cgtgagcggg gctggacaga gttatgatca 9840 ccagctggcc ttggaagagg gcgaggggct ggcgcgcctg ggggcgtcgt cgccggagcg 9900 gcacccgcgc gtgcagatga aaagggacgc tcgcgaggcc tacgtgccca agcagaacct 9960 gttcagagac aggagcggcg aggagcccga ggagatgcgc gcggcccggt tccacgcggg 10020 gcgggagctg cggcgcggcc tggaccgaaa gagggtgctg agggacgagg atttcgaggc 10080 ggacgagctg acggggatca gccccgcgcg cgcgcacgtg gccgcggcca acctggtcac 10140 ggcgtacgag cagaccgtga aggaggagag caacttccaa aaatccttca acaaccacgt 10200 gcgcaccctg atcgcgcgcg aggaggtgac cctgggcctg atgcacctgt gggacctgct 10260 ggaggccatc gtgcagaacc ccaccagcaa gccgctgacg gcgcagctgt tcctggtggt 10320 gcagcatagt cgggacaacg aagcgttcag ggaggcgctg ctgaatatca ccgagcccga 10380 gggccgctgg ctcctggacc tggtgaacat tctgcagagc atcgtggtgc aggagcgcgg 10440 gctgccgctg tccgagaagc tggcggccat caacttctcg gtgctgagtt tgggcaagta 10500 ctacgctagg aagatctaca agaccccgta cgtgcccata gacaaggagg tgaagatcga 10560 cgggttttac atgcgcatga ccctgaaagt gctgaccctg agcgacgatc tgggggtgta 10620 ccgcaacgac aggatgcacc gtgcggtgag cgccagcagg cggcgcgagc tgagcgacca 10680 ggagctgatg catagtctgc agcgggccct gaccggggcc gggaccgagg gggagagcta 10740 ctttgacatg ggcgcggacc tgcactggca gcccagccgc cgggccttgg aggcggcggc 10800 aggaccctac gtagaagagg tggacgatga ggtggacgag gagggcgagt acctggaaga 10860 ctgatggcgc gaccgtattt ttgctagatg caacaacaac agccacctcc tgatcccgcg 10920 atgcgggcgg cgctgcagag ccagccgtcc ggcattaact cctcggacga ttggacccag 10980 gccatgcaac gcatcatggc gctgacgacc cgcaaccccg aagcctttag acagcagccc 11040 caggccaacc ggctctcggc catcctggag gccgtggtgc cctcgcgctc caaccccacg 11100 cacgagaagg tcctggccat cgtgaacgcg ctggtggaga acaaggccat ccgcggcgac 11160 gaggccggcc tggtgtacaa cgcgctgctg gagcgcgtgg cccgctacaa cagcaccaac 11220 gtgcagacca acctggaccg catggtgacc gacgtgcgcg aggccgtggc ccagcgcgag 11280 cggttccacc gcgagtccaa cctgggatcc atggtggcgc tgaacgcctt cctcagcacc 11340 cagcccgcca acgtgccccg gggccaggag gactacacca acttcatcag cgccctgcgc 11400 ctgatggtga ccgaggtgcc ccagagcgag gtgtaccagt ccgggccgga ctacttcttc 11460 cagaccagtc gccagggctt gcagaccgtg aacctgagcc aggctttcaa gaacttgcag 11520 ggcctgtggg gcgtgcaggc cccggtcggg gaccgcgcga cggtgtcgag cctgctgacg 11580 ccgaactcgc gcctgctgct gctgctggtg gcccccttca cggacagcgg cagcatcaac 11640 cgcaactcgt acctgggcta cctgattaac ctgtaccgcg aggccatcgg ccaggcgcac 11700 gtggacgagc agacctacca ggagatcacc cacgtgagcc gcgccctggg ccaggacgac 11760 ccgggcaacc tggaagccac cctgaacttt ttgctgacca accggtcgca gaagatcccg 11820 ccccagtacg cgctcagcac cgaggaggag cgcatcctgc gttacgtgca gcagagcgtg 11880 ggcctgttcc tgatgcagga gggggccacc cccagcgccg cgctcgacat gaccgcgcgc 11940 aacatggagc ccagcatgta cgccagcaac cgcccgttca tcaataaact gatggactac 12000 ttgcatcggg cggccgccat gaactctgac tatttcacca acgccatcct gaatccccac 12060 tggctcccgc cgccggggtt ctacacgggc gagtacgaca tgcccgaccc caatgacggg 12120 ttcctgtggg acgatgtgga cagcagcgtg ttctcccccc gaccgggtgc taacgagcgc 12180 cccttgtgga agaaggaagg cagcgaccga cgcccgtcct cggcgctgtc cggccgcgag 12240 ggtgctgccg cggcggtgcc cgaggccgcc agtcctttcc cgagcttgcc cttctcgctg 12300 aacagtatcc gcagcagcga gctgggcagg atcacgcgcc cgcgcttgct gggcgaagag 12360 gagtacttga atgactcgct gttgagaccc gagcgggaga agaacttccc caataacggg 12420 atagaaagcc tggtggacaa gatgagccgc tggaagacgt atgcgcagga gcacagggac 12480 gatccccggg cgtcgcaggg ggccacgagc cggggcagcg ccgcccgtaa acgccggtgg 12540 cacgacaggc agcggggaca gatgtgggac gatgaggact ccgccgacga cagcagcgtg 12600 ttggacttgg gtgggagtgg taacccgttc gctcacctgc gcccccgtat cgggcgcatg 12660 atgtaagaga aaccgaaaat aaatgatact caccaaggcc atggcgacca gcgtgcgttc 12720 gtttcttctc tgttgttgtt gtatctagta tgatgaggcg tgcgtacccg gagggtcctc 12780 ctccctcgta cgagagcgtg atgcagcagg cgatggcggc ggcggcgatg cagcccccgc 12840 tggaggctcc ttacgtgccc ccgcggtacc tggcgcctac ggaggggcgg aacagcattc 12900 gttactcgga gctggcaccc ttgtacgata ccacccggtt gtacctggtg gacaacaagt 12960 cggcggacat cgcctcgctg aactaccaga acgaccacag caacttcctg accaccgtgg 13020 tgcagaacaa tgacttcacc cccacggagg ccagcaccca gaccatcaac tttgacgagc 13080 gctcgcggtg gggcggccag ctgaaaacca tcatgcacac caacatgccc aacgtgaacg 13140 agttcatgta cagcaacaag ttcaaggcgc gggtgatggt ctcccgcaag acccccaatg 13200 gggtgacagt gacagaggat tatgatggta gtcaggatga gctgaagtat gaatgggtgg 13260 aatttgagct gcccgaaggc aacttctcgg tgaccatgac catcgacctg atgaacaacg 13320 ccatcatcga caattacttg gcggtggggc ggcagaacgg ggtgctggag agcgacatcg 13380 gcgtgaagtt cgacactagg aacttcaggc tgggctggga ccccgtgacc gagctggtca 13440 tgcccggggt gtacaccaac gaggctttcc atcccgatat tgtcttgctg cccggctgcg 13500 gggtggactt caccgagagc cgcctcagca acctgctggg cattcgcaag aggcagccct 13560 tccaggaagg cttccagatc atgtacgagg atctggaggg gggcaacatc cccgcgctcc 13620 tggatgtcga cgcctatgag aaaagcaagg aggatgcagc agctgaagca actgcagccg 13680 tagctaccgc ctctaccgag gtcaggggcg ataattttgc aagcgccgca gcagtggcag 13740 cggccgaggc ggctgaaacc gaaagtaaga tagtcattca gccggtggag aaggatagca 13800 agaacaggag ctacaacgta ctaccggaca agataaacac cgcctaccgc agctggtacc 13860 tagcctacaa ctatggcgac cccgagaagg gcgtgcgctc ctggacgctg ctcaccacct 13920 cggacgtcac ctgcggcgtg gagcaagtct actggtcgct gcccgacatg atgcaagacc 13980 cggtcacctt ccgctccacg cgtcaagtta gcaactaccc ggtggtgggc gccgagctcc 14040 tgcccgtcta ctccaagagc ttcttcaacg agcaggccgt ctactcgcag cagctgcgcg 14100 ccttcacctc gcttacgcac gtcttcaacc gcttccccga gaaccagatc ctcgtccgcc 14160 cgcccgcgcc caccattacc accgtcagtg aaaacgttcc tgctctcaca gatcacggga 14220 ccctgccgct gcgcagcagt atccggggag tccagcgcgt gaccgttact gacgccagac 14280 gccgcacctg cccctacgtc tacaaggccc tgggcatagt cgcgccgcgc gtcctctcga 14340 gccgcacctt ctaaatgtcc attctcatct cgcccagtaa taacaccggt tggggcctgc 14400 gcgcgcccag caagatgtac ggaggcgctc gccaacgctc cacgcaacac cccgtgcgcg 14460 tgcgcgggca cttccgcgct ccctggggcg ccctcaaggg ccgcgtgcgg tcgcgcacca 14520 ccgtcgacga cgtgatcgac caggtggtgg ccgacgcgcg caactacacc cccgccgccg 14580 cgcccgtctc caccgtggac gccgtcatcg acagcgtggt ggccgacgcg cgccggtacg 14640 cccgcgccaa gagccggcgg cggcgcatcg cccggcggca ccggagcacc cccgccatgc 14700 gcgcggcgcg agccttgctg cgcagggcca ggcgcacggg acgcagggcc atgctcaggg 14760 cggccagacg cgcggcttca ggcgccagcg ccggcaggac ccggagacgc gcggccacgg 14820 cggcggcagc ggccatcgcc agcatgtccc gcccgcggcg agggaacgtg tactgggtgc 14880 gcgacgccgc caccggtgtg cgcgtgcccg tgcgcacccg cccccctcgc acttgaagat 14940 gttcacttcg cgatgttgat gtgtcccagc ggcgaggagg atgtccaagc gcaaattcaa 15000 ggaagagatg ctccaggtca tcgcgcctga gatctacggc cctgcggtgg tgaaggagga 15060 aagaaagccc cgcaaaatca agcgggtcaa aaaggacaaa aaggaagaag aaagtgatgt 15120 ggacggattg gtggagtttg tgcgcgagtt cgccccccgg cggcgcgtgc agtggcgcgg 15180 gcggaaggtg caaccggtgc tgagacccgg caccaccgtg gtcttcacgc ccggcgagcg 15240 ctccggcacc gcttccaagc gctcctacga cgaggtgtac ggggatgatg atattctgga 15300 gcaggcggcc gagcgcctgg gcgagtttgc ttacggcaag cgcagccgtt ccgcaccgaa 15360 ggaagaggcg gtgtccatcc cgctggacca cggcaacccc acgccgagcc tcaagcccgt 15420 gaccttgcag caggtgctgc cgaccgcggc gccgcgccgg gggttcaagc gcgagggcga 15480 ggatctgtac cccaccatgc agctgatggt gcccaagcgc cagaagctgg aagacgtgct 15540 ggagaccatg aaggtggacc cggacgtgca gcccgaggtc aaggtgcggc ccatcaagca 15600 ggtggccccg ggcctgggcg tgcagaccgt ggacatcaag attcccacgg agcccatgga 15660 aacgcagacc gagcccatga tcaagcccag caccagcacc atggaggtgc agacggatcc 15720 ctggatgcca tcggctccta gtcgaagacc ccggcgcaag tacggcgcgg ccagcctgct 15780 gatgcccaac tacgcgctgc atccttccat catccccacg ccgggctacc gcggcacgcg 15840 cttctaccgc ggtcatacca gcagccgccg ccgcaagacc accactcgcc gccgccgtcg 15900 ccgcaccgcc gctgcaacca cccctgccgc cctggtgcgg agagtgtacc gccgcggccg 15960 cgcacctctg accctgccgc gcgcgcgcta ccacccgagc atcgccattt aaactttcgc 16020 ctgctttgca gatcaatggc cctcacatgc cgccttcgcg ttcccattac gggctaccga 16080 ggaagaaaac cgcgccgtag aaggctggcg gggaacggga tgcgtcgcca ccaccaccgg 16140 cggcggcgcg ccatcagcaa gcggttgggg ggaggcttcc tgcccgcgct gatccccatc 16200 atcgccgcgg cgatcggggc gatccccggc attgcttccg tggcggtgca ggcctctcag 16260 cgccactgag acacacttgg aaacatcttg taataaacca atggactctg acgctcctgg 16320 tcctgtgatg tgttttcgta gacagatgga agacatcaat ttttcgtccc tggctccgcg 16380 acacggcacg cggccgttca tgggcacctg gagcgacatc ggcaccagcc aactgaacgg 16440 gggcgccttc aattggagca gtctctggag cgggcttaag aatttcgggt ccacgcttaa 16500 aacctatggc agcaaggcgt ggaacagcac cacagggcag gcgctgaggg ataagctgaa 16560 agagcagaac ttccagcaga aggtggtcga tgggctcgcc tcgggcatca acggggtggt 16620 ggacctggcc aaccaggccg tgcagcggca gatcaacagc cgcctggacc cggtgccgcc 16680 cgccggctcc gtggagatgc cgcaggtgga ggaggagctg cctcccctgg acaagcgggg 16740 cgagaagcga ccccgccccg atgcggagga gacgctgctg acgcacacgg acgagccgcc 16800 cccgtacgag gaggcggtga aactgggtct gcccaccacg cggcccatcg cgcccctggc 16860 caccggggtg ctgaaacccg aaaagcccgc gaccctggac ttgcctcctc cccagccttc 16920 ccgcccctct acagtggcta agcccctgcc gccggtggcc gtggcccgcg cgcgacccgg 16980 gggcaccgcc cgccctcatg cgaactggca gagcactctg aacagcatcg tgggtctggg 17040 agtgcagagt gtgaagcgcc gccgctgcta ttaaacctac cgtagcgctt aacttgcttg 17100 tctgtgtgtg tatgtattat gtcgccgccg ccgctgtcca ccagaaggag gagtgaagag 17160 gcgcgtcgcc gagttgcaag atggccaccc catcgatgct gccccagtgg gcgtacatgc 17220 acatcgccgg acaggacgct tcggagtacc tgagtccggg tctggtgcag tttgcccgcg 17280 ccacagacac ctacttcagt ctggggaaca agtttaggaa ccccacggtg gcgcccacgc 17340 acgatgtgac caccgaccgc agccagcggc tgacgctgcg cttcgtgccc gtggaccgcg 17400 aggacaacac ctactcgtac aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc 17460 tggacatggc cagcacctac tttgacatcc gcggcgtgct ggatcggggc cctagcttca 17520 aaccctactc cggcaccgcc tacaacagtc tggcccccaa gggagcaccc aacacttgtc 17580 agtggacata taaagccgat ggtgaaactg ccacagaaaa aacctataca tatggaaatg 17640 cacccgtgca gggcattaac atcacaaaag atggtattca acttggaact gacaccgatg 17700 atcagccaat ctacgcagat aaaacctatc agcctgaacc tcaagtgggt gatgctgaat 17760 ggcatgacat cactggtact gatgaaaagt atggaggcag agctcttaag cctgatacca 17820 aaatgaagcc ttgttatggt tcttttgcca agcctactaa taaagaagga ggtcaggcaa 17880 atgtgaaaac aggaacaggc actactaaag aatatgacat agacatggct ttctttgaca 17940 acagaagtgc ggctgctgct ggcctagctc cagaaattgt tttgtatact gaaaatgtgg 18000 atttggaaac tccagatacc catattgtat acaaagcagg cacagatgac agcagctctt 18060 ctattaattt gggtcagcaa gccatgccca acagacctaa ctacattggt ttcagagaca 18120 actttatcgg gctcatgtac tacaacagca ctggcaatat gggggtgctg gccggtcagg 18180 cttctcagct gaatgctgtg gttgacttgc aagacagaaa caccgagctg tcctaccagc 18240 tcttgcttga ctctctgggt gacagaaccc ggtatttcag tatgtggaat caggcggtgg 18300 acagctatga tcctgatgtg cgcattattg aaaatcatgg tgtggaggat gaacttccca 18360 actattgttt ccctctggat gctgttggca gaacagatac ttatcaggga attaaggcta 18420 atggaactga tcaaaccaca tggaccaaag atgacagtgt caatgatgct aatgagatag 18480 gcaagggtaa tccattcgcc atggaaatca acatccaagc caacctgtgg aggaacttcc 18540 tctacgccaa cgtggccctg tacctgcccg actcttacaa gtacacgccg gccaatgtta 18600 ccctgcccac caacaccaac acctacgatt acatgaacgg ccgggtggtg gcgccctcgc 18660 tggtggactc ctacatcaac atcggggcgc gctggtcgct ggatcccatg gacaacgtga 18720 accccttcaa ccaccaccgc aatgcggggc tgcgctaccg ctccatgctc ctgggcaacg 18780 ggcgctacgt gcccttccac atccaggtgc cccagaaatt tttcgccatc aagagcctcc 18840 tgctcctgcc cgggtcctac acctacgagt ggaacttccg caaggacgtc aacatgatcc 18900 tgcagagctc cctcggcaac gacctgcgca cggacggggc ctccatctcc ttcaccagca 18960 tcaacctcta cgccaccttc ttccccatgg cgcacaacac ggcctccacg ctcgaggcca 19020 tgctgcgcaa cgacaccaac gaccagtcct tcaacgacta cctctcggcg gccaacatgc 19080 tctaccccat cccggccaac gccaccaacg tgcccatctc catcccctcg cgcaactggg 19140 ccgccttccg cggctggtcc ttcacgcgtc tcaagaccaa ggagacgccc tcgctgggct 19200 ccgggttcga cccctacttc gtctactcgg gctccatccc ctacctcgac ggcaccttct 19260 acctcaacca caccttcaag aaggtctcca tcaccttcga ctcctccgtc agctggcccg 19320 gcaacgaccg gctcctgacg cccaacgagt tcgaaatcaa gcgcaccgtc gacggcgagg 19380 gctacaacgt ggcccagtgc aacatgacca aggactggtt cctggtccag atgctggccc 19440 actacaacat cggctaccag ggcttctacg tgcccgaggg ctacaaggac cgcatgtact 19500 ccttcttccg caacttccag cccatgagcc gccaggtggt ggacgaggtc aactacaagg 19560 actaccaggc cgtcaccctg gcctaccagc acaacaactc gggcttcgtc ggctacctcg 19620 cgcccaccat gcgccagggc cagccctacc ccgccaacta cccctacccg ctcatcggca 19680 agagcgccgt caccagcgtc acccagaaaa agttcctctg cgacagggtc atgtggcgca 19740 tccccttctc cagcaacttc atgtccatgg gcgcgctcac cgacctcggc cagaacatgc 19800 tctatgccaa ctccgcccac gcgctagaca tgaatttcga agtcgacccc atggatgagt 19860 ccacccttct ctatgttgtc ttcgaagtct tcgacgtcgt ccgagtgcac cagccccacc 19920 gcggcgtcat cgaggccgtc tacctgcgca cccccttctc ggccggtaac gccaccacct 19980 aagctcttgc ttcttgcaag ccatggccgc gggctccggc gagcaggagc tcagggccat 20040 catccgcgac ctgggctgcg ggccctactt cctgggcacc ttcgataagc gcttcccggg 20100 attcatggcc ccgcacaagc tggcctgcgc catcgtcaac acggccggcc gcgagaccgg 20160 gggcgagcac tggctggcct tcgcctggaa cccgcgctcg aacacctgct acctcttcga 20220 ccccttcggg ttctcggacg agcgcctcaa gcagatctac cagttcgagt acgagggcct 20280 gctgcgccgc agcgccctgg ccaccgagga ccgctgcgtc accctggaaa agtccaccca 20340 gaccgtgcag ggtccgcgct cggccgcctg cgggctcttc tgctgcatgt tcctgcacgc 20400 cttcgtgcac tggcccgacc gccccatgga caagaacccc accatgaact tgctgacggg 20460 ggtgcccaac ggcatgctcc agtcgcccca ggtggaaccc accctgcgcc gcaaccagga 20520 ggcgctctac cgcttcctca actcccactc cgcctacttt cgctcccacc gcgcgcgcat 20580 cgagaaggcc accgccttcg accgcatgaa tcaagacatg taaaccgtgt gtgtatgtta 20640 aatgtcttta ataaacagca ctttcatgtt acacatgcat ctgagatgat ttatttagaa 20700 atcgaaaggg ttctgccggg tctcggcatg gcccgcgggc agggacacgt tgcggaactg 20760 gtacttggcc agccacttga actcggggat cagcagtttg ggcagcgggg tgtcggggaa 20820 ggagtcggtc cacagcttcc gcgtcagttg cagggcgccc agcaggtcgg gcgcggagat 20880 cttgaaatcg cagttgggac ccgcgttctg cgcgcgggag ttgcggtaca cggggttgca 20940 gcactggaac accatcaggg ccgggtgctt cacgctcgcc agcaccgtcg cgtcggtgat 21000 gctctccacg tcgaggtcct cggcgttggc catcccgaag ggggtcatct tgcaggtctg 21060 ccttcccatg gtgggcacgc acccgggctt gtggttgcaa tcgcagtgca gggggatcag 21120 catcatctgg gcctggtcgg cgttcatccc cgggtacatg gccttcatga aagcctccaa 21180 ttgcctgaac gcctgctggg ccttggctcc ctcggtgaag aagaccccgc aggacttgct 21240 agagaactgg ttggtggcgc acccggcgtc gtgcacgcag cagcgcgcgt cgttgttggc 21300 cagctgcacc acgctgcgcc cccagcggtt ctgggtgatc ttggcccggt cggggttctc 21360 cttcagcgcg cgctgcccgt tctcgctcgc cacatccatc tcgatcatgt gctccttctg 21420 gatcatggtg gtcccgtgca ggcaccgcag cttgccctcg gcctcggtgc acccgtgcag 21480 ccacagcgcg cacccggtgc actcccagtt cttgtgggcg atctgggaat gcgcgtgcac 21540 gaagccctgc aggaagcggc ccatcatggt ggtcagggtc ttgttgctag tgaaggtcag 21600 cggaatgccg cggtgctcct cgttgatgta caggtggcag atgcggcggt acacctcgcc 21660 ctgctcgggc atcagctgga agttggcttt caggtcggtc tccacgcggt agcggtccat 21720 cagcatagtc atgatttcca tacccttctc ccaggccgag acgatgggca ggctcatagg 21780 gttcttcacc atcatcttag cgctagcagc cgcggccagg gggtcgctct cgtccagggt 21840 ctcaaagctc cgcttgccgt ccttctcggt gatccgcacc ggggggtagc tgaagcccac 21900 ggccgccagc tcctcctcgg cctgtctttc gtcctcgctg tcctggctga cgtcctgcag 21960 gaccacatgc ttggtcttgc ggggtttctt cttgggcggc agcggcggcg gagatgttgg 22020 agatggcgag ggggagcgcg agttctcgct caccactact atctcttcct cttcttggtc 22080 cgaggccacg cggcggtagg tatgtctctt cgggggcaga ggcggaggcg acgggctctc 22140 gccgccgcga cttggcggat ggctggcaga gccccttccg cgttcggggg tgcgctcccg 22200 gcggcgctct gactgacttc ctccgcggcc ggccattgtg ttctcctagg gaggaacaac 22260 aagcatggag actcagccat cgccaacctc gccatctgcc cccaccgccg acgagaagca 22320 gcagcagcag aatgaaagct taaccgcccc gccgcccagc cccgccacct ccgacgcggc 22380 cgtcccagac atgcaagaga tggaggaatc catcgagatt gacctgggct atgtgacgcc 22440 cgcggagcac gaggaggagc tggcagtgcg cttttcacaa gaagagatac accaagaaca 22500 gccagagcag gaagcagaga atgagcagag tcaggctggg ctcgagcatg acggcgacta 22560 cctccacctg agcggggggg aggacgcgct catcaagcat ctggcccggc aggccaccat 22620 cgtcaaggat gcgctgctcg accgcaccga ggtgcccctc agcgtggagg agctcagccg 22680 cgcctacgag ttgaacctct tctcgccgcg cgtgcccccc aagcgccagc ccaatggcac 22740 ctgcgagccc aacccgcgcc tcaacttcta cccggtcttc gcggtgcccg aggccctggc 22800 cacctaccac atctttttca agaaccaaaa gatccccgtc tcctgccgcg ccaaccgcac 22860 ccgcgccgac gcccttttca acctgggtcc cggcgcccgc ctacctgata tcgcctcctt 22920 ggaagaggtt cccaagatct tcgagggtct gggcagcgac gagactcggg ccgcgaacgc 22980 tctgcaagga gaaggaggag agcatgagca ccacagcgcc ctggtcgagt tggaaggcga 23040 caacgcgcgg ctggcggtgc tcaaacgcac ggtcgagctg acccatttcg cctacccggc 23100 tctgaacctg ccccccaaag tcatgagcgc ggtcatggac caggtgctca tcaagcgcgc 23160 gtcgcccatc tccgaggacg agggcatgca agactccgag gagggcaagc ccgtggtcag 23220 cgacgagcag ctggcccggt ggctgggtcc taatgctagt ccccagagtt tggaagagcg 23280 gcgcaaactc atgatggccg tggtcctggt gaccgtggag ctggagtgcc tgcgccgctt 23340 cttcgccgac gcggagaccc tgcgcaaggt cgaggagaac ctgcactacc tcttcaggca 23400 cgggttcgtg cgccaggcct gcaagatctc caacgtggag ctgaccaacc tggtctccta 23460 catgggcatc ttgcacgaga accgcctggg gcagaacgtg ctgcacacca ccctgcgcgg 23520 ggaggcccgg cgcgactaca tccgcgactg cgtctacctc tacctctgcc acacctggca 23580 gacgggcatg ggcgtgtggc agcagtgtct ggaggagcag aacctgaaag agctctgcaa 23640 gctcctgcag aagaacctca agggtctgtg gaccgggttc gacgagcgca ccaccgcctc 23700 ggacctggcc gacctcattt tccccgagcg cctcaggctg acgctgcgca acggcctgcc 23760 cgactttatg agccaaagca tgttgcaaaa ctttcgctct ttcatcctcg aacgctccgg 23820 aatcctgccc gccacctgct ccgcgctgcc ctcggacttc gtgccgctga ccttccgcga 23880 gtgccccccg ccgctgtgga gccactgcta cctgctgcgc ctggccaact acctggccta 23940 ccactcggac gtgatcgagg acgtcagcgg cgagggcctg ctcgagtgcc actgccgctg 24000 caacctctgc acgccgcacc gctccctggc ctgcaacccc cagctgctga gcgagaccca 24060 gatcatcggc accttcgagt tgcaagggcc cagcgaaggc gagggttcag ccgccaaggg 24120 gggtctgaaa ctcaccccgg ggctgtggac ctcggcctac ttgcgcaagt tcgtgcccga 24180 ggactaccat cccttcgaga tcaggttcta cgaggaccaa tcccatccgc ccaaggccga 24240 gctgtcggcc tgcgtcatca cccagggggc gatcctggcc caattgcaag ccatccagaa 24300 atcccgccaa gaattcttgc tgaaaaaggg ccgcggggtc tacctcgacc cccagaccgg 24360 tgaggagctc aaccccggct tcccccagga tgccccgagg aaacaagaag ctgaaagtgg 24420 agctgccgcc cgtggaggat ttggaggaag actgggagaa cagcagtcag gcagaggagg 24480 aggagatgga ggaagactgg gacagcactc aggcagagga ggacagcctg caagacagtc 24540 tggaggaaga cgaggaggag gcagaggagg aggtggaaga agcagccgcc gccagaccgt 24600 cgtcctcggc gggggagaaa gcaagcagca cggataccat ctccgctccg ggtcggggtc 24660 ccgctcgacc acacagtaga tgggacgaga ccggacgatt cccgaacccc accacccaga 24720 ccggtaagaa ggagcggcag ggatacaagt cctggcgggg gcacaaaaac gccatcgtct 24780 cctgcttgca ggcctgcggg ggcaacatct ccttcacccg gcgctacctg ctcttccacc 24840 gcggggtgaa ctttccccgc aacatcttgc attactaccg tcacctccac agcccctact 24900 acttccaaga agaggcagca gcagcagaaa aagaccagca gaaaaccagc agctagaaaa 24960 tccacagcgg cggcagcagg tggactgagg atcgcggcga acgagccggc gcaaacccgg 25020 gagctgagga accggatctt tcccaccctc tatgccatct tccagcagag tcgggggcag 25080 gagcaggaac tgaaagtcaa gaaccgttct ctgcgctcgc tcacccgcag ttgtctgtat 25140 cacaagagcg aagaccaact tcagcgcact ctcgaggacg ccgaggctct cttcaacaag 25200 tactgcgcgc tcactcttaa agagtagccc gcgcccgccc agtcgcagaa aaaggcggga 25260 attacgtcac ctgtgccctt cgccctagcc gcctccaccc atcatcatga gcaaagagat 25320 tcccacgcct tacatgtgga gctaccagcc ccagatgggc ctggccgccg gtgccgccca 25380 ggactactcc acccgcatga attggctcag cgccgggccc gcgatgatct cacgggtgaa 25440 tgacatccgc gcccaccgaa accagatact cctagaacag tcagcgctca ccgccacgcc 25500 ccgcaatcac ctcaatccgc gtaattggcc cgccgccctg gtgtaccagg aaattcccca 25560 gcccacgacc gtactacttc cgcgagacgc ccaggccgaa gtccagctga ctaactcagg 25620 tgtccagctg gcgggcggcg ccaccctgtg tcgtcaccgc cccgctcagg gtataaagcg 25680 gctggtgatc cggggcagag gcacacagct caacgacgag gtggtgagct cttcgctggg 25740 tctgcgacct gacggagtct tccaactcgc cggatcgggg agatcttcct tcacgcctcg 25800 tcaggccgtc ctgactttgg agagttcgtc ctcgcagccc cgctcgggtg gcatcggcac 25860 tctccagttc gtggaggagt tcactccctc ggtctacttc aaccccttct ccggctcccc 25920 cggccactac ccggacgagt tcatcccgaa cttcgacgcc atcagcgagt cggtggacgg 25980 ctacgattga atgtcccatg gtggcgcagc tgacctagct cggcttcgac acctggacca 26040 ctgccgccgc ttccgctgct tcgctcggga tctcgccgag tttgcctact ttgagctgcc 26100 cgaggagcac cctcagggcc cggcccacgg agtgcggatc gtcgtcgaag ggggcctcga 26160 ctcccacctg cttcggatct tcagccagcg tccgatcctg gtcgagcgcg agcaaggaca 26220 gacccttctg actctgtact gcatctgcaa ccaccccggc ctgcatgaaa gtctttgttg 26280 tctgctgtgt actgagtata ataaaagctg agatcagcga ctactccgga cttccgtgtg 26340 ttcctgaatc catcaaccag tctttgttct tcaccgggaa cgagaccgag ctccagctcc 26400 agtgtaagcc ccacaagaag tacctcacct ggctgttcca gggctccccg atcgccgttg 26460 tcaaccactg cgacaacgac ggagtcctgc tgagcggccc tgccaacctt actttttcca 26520 cccgcagaag caagctccag ctcttccaac ccttcctccc cgggacctat cagtgcgtct 26580 cgggaccctg ccatcacacc ttccacctga tcccgaatac cacagcgtcg ctccccgcta 26640 ctaacaacca aactaacctc caccaacgcc accgtcgcga cggccacaat acatgcccat 26700 attagactat gaggccgagc cacagcgacc catgctcccc gctattagtt acttcaatct 26760 aaccggcgga gatgactgac ccactggcca acaacaacgt caacgacctt ctcctggaca 26820 tggacggccg cgcctcggag cagcgactcg cccaacttcg cattcgccag cagcaggaga 26880 gagccgtcaa ggagctgcag gatgcggtgg ccatccacca gtgcaagaga ggcatcttct 26940 gcctggtgaa acaggccaag atctcctacg aggtcactcc aaacgaccat cgcctctcct 27000 acgagctcct gcagcagcgc cagaagttca cctgcctggt cggagtcaac cccatcgtca 27060 tcacccagca gtctggcgat accaaggggt gcatccactg ctcctgcgac tcccccgact 27120 gcgtccacac tctgatcaag accctctgcg gcctccgcga cctcctcccc atgaactaat 27180 caccccctta tccagtgaaa taaagatcat attgatgatg attttacaga aataaaaaat 27240 aatcatttga tttgaaataa agatacaatc atattgatga tttgagttta acaaaaaaat 27300 aaagaatcac ttacttgaaa tctgatacca ggtctctgtc catgttttct gccaacacca 27360 cttcactccc ctcttcccag ctctggtact gcaggccccg gcgggctgca aacttcctcc 27420 acacgctgaa ggggatgtca aattcctcct gtccctcaat cttcatttta tcttctatca 27480 gatgtccaaa aagcgcgtcc gggtggatga tgacttcgac cccgtctacc cctacgatgc 27540 agacaacgca ccgaccgtgc ccttcatcaa cccccccttc gtctcttcag atggattcca 27600 agagaagccc ctgggggtgt tgtccctgcg actggccgac cccgtcacca ccaagaacgg 27660 ggaaatcacc ctcaagctgg gagagggggt ggacctcgat tcctcgggaa aactcatctc 27720 caacacggcc accaaggccg ccgcccctct cagtttttcc aacaacacca tttcccttaa 27780 catggatcac cccttttaca ctaaagatgg aaaattatcc ttacaagttt ctccaccatt 27840 aaatatactg agaacaagca ttctaaacac actagcttta ggttttggat caggtttagg 27900 actccgtggc tctgccttgg cagtacagtt agtctctcca cttacatttg atactgatgg 27960 aaacataaag cttaccttag acagaggttt gcatgttaca acaggagatg caattgaaag 28020 caacataagc tgggctaaag gtttaaaatt tgaagatgga gccatagcaa ccaacattgg 28080 aaatgggtta gagtttggaa gcagtagtac agaaacaggt gttgatgatg cttacccaat 28140 ccaagttaaa cttggatctg gccttagctt tgacagtaca ggagccataa tggctggtaa 28200 caaagaagac gataaactca ctttgtggac aacacctgat ccatcaccaa actgtcaaat 28260 actcgcagaa aatgatgcaa aactaacact ttgcttgact aaatgtggta gtcaaatact 28320 ggccactgtg tcagtcttag ttgtaggaag tggaaaccta aaccccatta ctggcaccgt 28380 aagcagtgct caggtgtttc tacgttttga tgcaaacggt gttcttttaa cagaacattc 28440 tacactaaaa aaatactggg ggtataggca gggagatagc atagatggca ctccatatac 28500 caatgctgta ggattcatgc ccaatttaaa agcttatcca aagtcacaaa gttctactac 28560 taaaaataat atagtagggc aagtatacat gaatggagat gtttcaaaac ctatgcttct 28620 cactataacc ctcaatggta ctgatgacag caacagtaca tattcaatgt cattttcata 28680 cacctggact aatggaagct atgttggagc aacatttggg gctaactctt ataccttctc 28740 atacatcgcc caagaatgaa cactgtatcc caccctgcat gccaaccctt cccaccccac 28800 tctgtggaac aaactctgaa acacaaaata aaataaagtt caagtgtttt attgattcaa 28860 cagttttaca ggattcgagc agttattttt cctccaccct cccaggacat ggaatacacc 28920 accctctccc cccgcacagc cttgaacatc tgaatgccat tggtgatgga catgcttttg 28980 gtctccacgt tccacacagt ttcagagcga gccagtctcg ggtcggtcag ggagatgaaa 29040 ccctccgggc actcccgcat ctgcacctca cagctcaaca gctgaggatt gtcctcggtg 29100 gtcgggatca cggttatctg gaagaagcag aagagcggcg gtgggaatca tagtccgcga 29160 acgggatcgg ccggtggtgt cgcatcaggc cccgcagcag tcgctgccgc cgccgctccg 29220 tcaagctgct gctcaggggg tccgggtcca gggactccct cagcatgatg cccacggccc 29280 tcagcatcag tcgtctggtg cggcgggcgc agcagcgcat gcggatctcg ctcaggtcgc 29340 tgcagtacgt gcaacacaga accaccaggt tgttcaacag tccatagttc aacacgctcc 29400 agccgaaact catcgcggga aggatgctac ccacgtggcc gtcgtaccag atcctcaggt 29460 aaatcaagtg gtgccccctc cagaacacgc tgcccacgta catgatctcc ttgggcatgt 29520 ggcggttcac cacctcccgg taccacatca ccctctggtt gaacatgcag ccccggatga 29580 tcctgcggaa ccacagggcc agcaccgccc cgcccgccat gcagcgaaga gaccccgggt 29640 cccggcaatg gcaatggagg acccaccgct cgtacccgtg gatcatctgg gagctgaaca 29700 agtctatgtt ggcacagcac aggcatatgc tcatgcatct cttcagcact ctcaactcct 29760 cgggggtcaa aaccatatcc cagggcacgg ggaactcttg caggacagcg aaccccgcag 29820 aacagggcaa tcctcgcaca gaacttacat tgtgcatgga cagggtatcg caatcaggca 29880 gcaccgggtg atcctccacc agagaagcgc gggtctcggt ctcctcacag cgtggtaagg 29940 gggccggccg atacgggtga tggcgggacg cggctgatcg tgttcgcgac cgtgtcatga 30000 tgcagttgct ttcggacatt ttcgtacttg ctgtagcaga acctggtccg ggcgctgcac 30060 accgatcgcc ggcggcggtc tcggcgcttg gaacgctcgg tgttgaaatt gtaaaacagc 30120 cactctctca gaccgtgcag cagatctagg gcctcaggag tgatgaagat cccatcatgc 30180 ctgatggctc tgatcacatc gaccaccgtg gaatgggcca gacccagcca gatgatgcaa 30240 ttttgttggg tttcggtgac ggcgggggag ggaagaacag gaagaaccat gattaacttt 30300 taatccaaac ggtctcggag tacttcaaaa tgaagatcgc ggagatggca cctctcgccc 30360 ccgctgtgtt ggtggaaaat aacagccagg tcaaaggtga tacggttctc gagatgttcc 30420 acggtggctt ccagcaaagc ctccacgcgc acatccagaa acaagacaat agcgaaagcg 30480 ggagggttct ctaattcctc aatcatcatg ttacactcct gcaccatccc cagataattt 30540 tcatttttcc agccttgaat gattcgaact agttcgtgag gtaaatccaa gccagccatg 30600 ataaagagct cgcgcagagc gccctccacc ggcattctta agcacaccct cataattcca 30660 agatattctg ctcctggttc acctgcagca gattgacaag cggaatatca aaatctctgc 30720 cgcgatccct gagctcctcc ctcagcaata actgtaagta ctctttcata tcctctccga 30780 aatttttagc cataggacca ccaggaataa gattagggca agccacagta cagataaacc 30840 gaagtcctcc ccagtgagca ttgccaaatg caagactgct ataagcatgc tggctagacc 30900 cggtgatatc ttccagataa ctggacagaa aatcgcccag gcaattttta agaaaatcaa 30960 caaaagaaaa atcctccagg tggacgttta gagcctcggg aacaacgatg aagtaaatgc 31020 aagcggtgcg ttccagcatg gttagttagc tgatctgtag aaaaaacaaa aatgaacatt 31080 aaaccatgct agcctggcga acaggtgggt aaatcgttct ctccagcacc aggcaggcca 31140 cggggtctcc ggcgcgaccc tcgtaaaaat tgtcgctatg attgaaaacc atcacagaga 31200 gacgttcccg gtggccggcg tgaatgattc gacaagatga atacaccccc ggaacattgg 31260 cgtccgcgag tgaaaaaaag cgcccgagga agcaataagg cactacaatg ctcagtctca 31320 agtccagcaa agcgatgcca tgcggatgaa gcacaaaatt ctcaggtgcg tacaaaatgt 31380 aattactccc ctcctgcaca ggcagcaaag cccccgatcc ctccaggtac acatacaaag 31440 cctcagcgtc catagcttac cgagcagcag cacacaacag gcgcaagagt cagagaaagg 31500 ctgagctcta acctgtccac ccgctctctg ctcaatatat agcccagatc tacactgacg 31560 taaaggccaa agtctaaaaa tacccgccaa ataatcacac acgcccagca cacgcccaga 31620 aaccggtgac acactcaaaa aaatacgcgc acttcctcaa acgcccaaaa ctgccgtcat 31680 ttccgggttc ccacgctacg tcatcaaaac acgactttca aattccgtcg accgttaaaa 31740 acgtcacccg ccccgcccct aacggtcgcc cgtctctcag ccaatcagcg ccccgcatcc 31800 ccaaattcaa acacctcatt tgcatattaa cgcgcacaaa aagtttgagg tatattattg 31860 atgatgg 31867 <210> 12 <211> 32788 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 12 ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60 aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120 gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180 tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240 aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300 gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360 gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420 tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480 atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540 tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600 gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840 atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900 atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960 tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200 cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260 ccgggatgtt ccaggcactg tccgaaggct gcacacccta tgatattaac cagatgctga 1320 atgtcctggg agaccaccag gtctctggcc tggagcagct ggagagcatc atcaacttcg 1380 agaagctgac cgagtggaca agctccaatg tgatgcctat cctgtcccca ctgaccaagg 1440 gcatcctggg cttcgtgttt accctgacag tgccttctga gcggggcctg tcttgcatca 1500 gcgaggcaga cgcaaccaca ccagagtccg ccaatctggg cgaggagatc ctgtctcagc 1560 tgtacctgtg gccccgggtg acatatcact ccccttctta cgcctatcac cagttcgagc 1620 ggagagccaa gtacaagaga cacttcccag gctttggcca gtctctgctg ttcggctacc 1680 ccgtgtacgt gttcggcgat tgcgtgcagg gcgactggga tgccatccgg tttagatact 1740 gcgcaccacc tggatatgca ctgctgaggt gtaacgacac caattattcc gccctgctgg 1800 cagtgggcgc cctggagggc cctcgcaatc aggattggct gggcgtgcca aggcagctgg 1860 tgacacgcat gcaggccatc cagaacgcag gcctgtgcac cctggtggca atgctggagg 1920 agacaatctt ctggctgcag gcctttctga tggccctgac cgacagcggc cccaagacaa 1980 acatcatcgt ggattcccag tacgtgatgg gcatctccaa gccttctttc caggagtttg 2040 tggactggga gaacgtgagc ccagagctga attccaccga tcagccattc tggcaggcag 2100 gaatcctggc aaggaacctg gtgcctatgg tggccacagt gcagggccag aatctgaagt 2160 accagggcca gagcctggtc atcagcgcct ccatcatcgt gtttaacctg ctggagctgg 2220 agggcgacta tcgggacgat ggcaacgtgt gggtgcacac cccactgagc cccagaacac 2280 tgaacgcctg ggtgaaggcc gtggaggaga agaagggcat cccagtgcac ctggagctgg 2340 cctccatgac caatatggag ctgatgtcta gcatcgtgca ccagcaggtg aggacatacg 2400 gacccgtgtt catgtgcctg ggaggcctgc tgaccatggt ggcaggagcc gtgtggctga 2460 cagtgcgggt gctggagctg ttcagagccg cccagctggc caacgatgtg gtgctgcaga 2520 tcatggagct gtgcggagca gcctttcgcc aggtgtgcca caccacagtg ccatggccca 2580 atgcctccct gacccccaag tggaacaatg agacaacaca gcctcagatc gccaactgta 2640 gcgtgtacga cttcttcgtg tggctgcact actatagcgt gagggatacc ctgtggcccc 2700 gcgtgacata ccacatgaat aagtacgcct atcacatgct ggagaggcgc gccaagtata 2760 agagaggccc tggcccaggc gcaaagtttg tggcagcatg gaccctgaag gccgccgccg 2820 gccccggccc cggccagtat atcaaggcta acagtaagtt cattggaatc acagagctgg 2880 gacccggacc tggataatga gtttaaactc ccatttaaat gtgagggtta atgcttcgag 2940 cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 3000 aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 3060 ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt 3120 gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaataact ataacggtcc 3180 taaggtagcg agtgagtagt gttctggggc gggggaggac ctgcatgagg gccagaataa 3240 ctgaaatctg tgcttttctg tgtgttgcag cagcatgagc ggaagcggct cctttgaggg 3300 aggggtattc agcccttatc tgacggggcg tctcccctcc tgggcgggag tgcgtcagaa 3360 tgtgatggga tccacggtgg acggccggcc cgtgcagccc gcgaactctt caaccctgac 3420 ctatgcaacc ctgagctctt cgtcgttgga cgcagctgcc gccgcagctg ctgcatctgc 3480 cgccagcgcc gtgcgcggaa tggccatggg cgccggctac tacggcactc tggtggccaa 3540 ctcgagttcc accaataatc ccgccagcct gaacgaggag aagctgttgc tgctgatggc 3600 ccagctcgag gccttgaccc agcgcctggg cgagctgacc cagcaggtgg ctcagctgca 3660 ggagcagacg cgggccgcgg ttgccacggt gaaatccaaa taaaaaatga atcaataaat 3720 aaacggagac ggttgttgat tttaacacag agtctgaatc tttatttgat ttttcgcgcg 3780 cggtaggccc tggaccaccg gtctcgatca ttgagcaccc ggtggatctt ttccaggacc 3840 cggtagaggt gggcttggat gttgaggtac atgggcatga gcccgtcccg ggggtggagg 3900 tagctccatt gcagggcctc gtgctcgggg gtggtgttgt aaatcaccca gtcatagcag 3960 gggcgcaggg catggtgttg cacaatatct ttgaggagga gactgatggc cacgggcagc 4020 cctttggtgt aggtgtttac aaatctgttg agctgggagg gatgcatgcg gggggagatg 4080 aggtgcatct tggcctggat cttgagattg gcgatgttac cgcccagatc ccgcctgggg 4140 ttcatgttgt gcaggaccac cagcacggtg tatccggtgc acttggggaa tttatcatgc 4200 aacttggaag ggaaggcgtg aaagaatttg gcgacgcctt tgtgcccgcc caggttttcc 4260 atgcactcat ccatgatgat ggcgatgggc ccgtgggcgg cggcctgggc aaagacgttt 4320 cgggggtcgg acacatcata gttgtggtcc tgggtgaggt catcataggc cattttaatg 4380 aatttggggc ggagggtgcc ggactggggg acaaaggtac cctcgatccc gggggcgtag 4440 ttcccctcac agatctgcat ctcccaggct ttgagctcgg agggggggat catgtccacc 4500 tgcggggcga taaagaacac ggtttccggg gcgggggaga tgagctgggc cgaaagcaag 4560 ttccggagca gctgggactt gccgcagccg gtggggccgt agatgacccc gatgaccggc 4620 tgcaggtggt agttgaggga gagacagctg ccgtcctccc ggaggagggg ggccacctcg 4680 ttcatcatct cgcgcacgtg catgttctcg cgcaccagtt ccgccaggag gcgctctccc 4740 cccagggata ggagctcctg gagcgaggcg aagtttttca gcggcttgag tccgtcggcc 4800 atgggcattt tggagagggt ttgttgcaag agttccaggc ggtcccagag ctcggtgatg 4860 tgctctacgg catctcgatc cagcagacct cctcgtttcg cgggttggga cggctgcggg 4920 agtagggcac cagacgatgg gcgtccagcg cagccagggt ccggtccttc cagggtcgca 4980 gcgtccgcgt cagggtggtc tccgtcacgg tgaaggggtg cgcgccgggc tgggcgcttg 5040 cgagggtgcg cttcaggctc atccggctgg tcgaaaaccg ctcccgatcg gcgccctgcg 5100 cgtcggccag gtagcaattg accatgagtt cgtagttgag cgcctcggcc gcgtggcctt 5160 tggcgcggag cttacctttg gaagtctgcc cgcaggcggg acagaggagg gacttgaggg 5220 cgtagagctt gggggcgagg aagacggact cgggggcgta ggcgtccgcg ccgcagtggg 5280 cgcagacggt ctcgcactcc acgagccagg tgaggtcggg ctggtcgggg tcaaaaacca 5340 gtttcccgcc gttctttttg atgcgtttct tacctttggt ctccatgagc tcgtgtcccc 5400 gctgggtgac aaagaggctg tccgtgtccc cgtagaccga ctttatgggc cggtcctcga 5460 gcggtgtgcc gcggtcctcc tcgtagagga accccgccca ctccgagacg aaagcccggg 5520 tccaggccag cacgaaggag gccacgtggg acgggtagcg gtcgttgtcc accagcgggt 5580 ccaccttttc cagggtatgc aaacacatgt ccccctcgtc cacatccagg aaggtgattg 5640 gcttgtaagt gtaggccacg tgaccggggg tcccggccgg gggggtataa aagggtgcgg 5700 gtccctgctc gtcctcactg tcttccggat cgctgtccag gagcgccagc tgttggggta 5760 ggtattccct ctcgaaggcg ggcatgacct cggcactcag gttgtcagtt tctagaaacg 5820 aggaggattt gatattgacg gtgccggcgg agatgccttt caagagcccc tcgtccatct 5880 ggtcagaaaa gacgatcttt ttgttgtcga gcttggtggc gaaggagccg tagagggcgt 5940 tggagaggag cttggcgatg gagcgcatgg tctggttttt ttccttgtcg gcgcgctcct 6000 tggcggcgat gttgagctgc acgtactcgc gcgccacgca cttccattcg gggaagacgg 6060 tggtcagctc gtcgggcacg attctgacct gccagccccg attatgcagg gtgatgaggt 6120 ccacactggt ggccacctcg ccgcgcaggg gctcattagt ccagcagagg cgtccgccct 6180 tgcgcgagca gaaggggggc agggggtcca gcatgacctc gtcggggggg tcggcatcga 6240 tggtgaagat gccgggcagg aggtcggggt caaagtagct gatggaagtg gccagatcgt 6300 ccagggcagc ttgccattcg cgcacggcca gcgcgctctc gtagggactg aggggcgtgc 6360 cccagggcat gggatgggta agcgcggagg cgtacatgcc gcagatgtcg tagacgtaga 6420 ggggctcctc gaggatgccg atgtaggtgg ggtagcagcg ccccccgcgg atgctggcgc 6480 gcacgtagtc atacagctcg tgcgaggggg cgaggagccc cgggcccagg ttggtgcgac 6540 tgggcttttc ggcgcggtag acgatctggc ggaaaatggc atgcgagttg gaggagatgg 6600 tgggcctttg gaagatgttg aagtgggcgt ggggcagtcc gaccgagtcg cggatgaagt 6660 gggcgtagga gtcttgcagc ttggcgacga gctcggcggt gactaggacg tccagagcgc 6720 agtagtcgag ggtctcctgg atgatgtcat acttgagctg tcccttttgt ttccacagct 6780 cgcggttgag aaggaactct tcgcggtcct tccagtactc ttcgaggggg aacccgtcct 6840 gatctgcacg gtaagagcct agcatgtaga actggttgac ggccttgtag gcgcagcagc 6900 ccttctccac ggggagggcg taggcctggg cggccttgcg cagggaggtg tgcgtgaggg 6960 cgaaagtgtc cctgaccatg accttgagga actggtgctt gaagtcgata tcgtcgcagc 7020 ccccctgctc ccagagctgg aagtccgtgc gcttcttgta ggcggggttg ggcaaagcga 7080 aagtaacatc gttgaagagg atcttgcccg cgcggggcat aaagttgcga gtgatgcgga 7140 aaggttgggg cacctcggcc cggttgttga tgacctgggc ggcgagcacg atctcgtcga 7200 agccgttgat gttgtggccc acgatgtaga gttccacgaa tcgcggacgg cccttgacgt 7260 ggggcagttt cttgagctcc tcgtaggtga gctcgtcggg gtcgctgagc ccgtgctgct 7320 cgagcgccca gtcggcgaga tgggggttgg cgcggaggaa ggaagtccag agatccacgg 7380 ccagggcggt ttgcagacgg tcccggtact gacggaactg ctgcccgacg gccatttttt 7440 cgggggtgac gcagtagaag gtgcgggggt ccccgtgcca gcgatcccat ttgagctgga 7500 gggcgagatc gagggcgagc tcgacgagcc ggtcgtcccc ggagagtttc atgaccagca 7560 tgaaggggac gagctgcttg ccgaaggacc ccatccaggt gtaggtttcc acatcgtagg 7620 tgaggaagag cctttcggtg cgaggatgcg agccgatggg gaagaactgg atctcctgcc 7680 accaattgga ggaatggctg ttgatgtgat ggaagtagaa atgccgacgg cgcgccgaac 7740 actcgtgctt gtgtttatac aagcggccac agtgctcgca acgctgcacg ggatgcacgt 7800 gctgcacgag ctgtacctga gttcctttga cgaggaattt cagtgggaag tggagtcgtg 7860 gcgcctgcat ctcgtgctgt actacgtcgt ggtggtcggc ctggccctct tctgcctcga 7920 tggtggtcat gctgacgagc ccgcgcggga ggcaggtcca gacctcggcg cgagcgggtc 7980 ggagagcgag gacgagggcg cgcaggccgg agctgtccag ggtcctgaga cgctgcggag 8040 tcaggtcagt gggcagcggc ggcgcgcggt tgacttgcag gagtttttcc agggcgcgcg 8100 ggaggtccag atggtacttg atctccaccg cgccattggt ggcgacgtcg atggcttgca 8160 gggtcccgtg cccctggggt gtgaccaccg tcccccgttt cttcttgggc ggctggggcg 8220 acgggggcgg tgcctcttcc atggttagaa gcggcggcga ggacgcgcgc cgggcggcag 8280 gggcggctcg gggcccggag gcaggggcgg caggggcacg tcggcgccgc gcgcgggtag 8340 gttctggtac tgcgcccgga gaagactggc gtgagcgacg acgcgacggt tgacgtcctg 8400 gatctgacgc ctctgggtga aggccacggg acccgtgagt ttgaacctga aagagagttc 8460 gacagaatca atctcggtat cgttgacggc ggcctgccgc aggatctctt gcacgtcgcc 8520 cgagttgtcc tggtaggcga tctcggtcat gaactgctcg atctcctcct cttgaaggtc 8580 tccgcggccg gcgcgctcca cggtggccgc gaggtcgttg gagatgcggc ccatgagctg 8640 cgagaaggcg ttcatgcccg cctcgttcca gacgcggctg tagaccacga cgccctcggg 8700 atcgcgggcg cgcatgacca cctgggcgag gttgagctcc acgtggcgcg tgaagaccgc 8760 gtagttgcag aggcgctggt agaggtagtt gagcgtggtg gcgatgtgct cggtgacgaa 8820 gaaatacatg atccagcggc ggagcggcat ctcgctgacg tcgcccagcg cctccaaacg 8880 ttccatggcc tcgtaaaagt ccacggcgaa gttgaaaaac tgggagttgc gcgccgagac 8940 ggtcaactcc tcctccagaa gacggatgag ctcggcgatg gtggcgcgca cctcgcgctc 9000 gaaggccccc gggagttcct ccacttcctc ttcttcctcc tccactaaca tctcttctac 9060 ttcctcctca ggcggcagtg gtggcggggg agggggcctg cgtcgccggc ggcgcacggg 9120 cagacggtcg atgaagcgct cgatggtctc gccgcgccgg cgtcgcatgg tctcggtgac 9180 ggcgcgcccg tcctcgcggg gccgcagcgt gaagacgccg ccgcgcatct ccaggtggcc 9240 gggggggtcc ccgttgggca gggagagggc gctgacgatg catcttatca attgccccgt 9300 agggactccg cgcaaggacc tgagcgtctc gagatccacg ggatctgaaa accgctgaac 9360 gaaggcttcg agccagtcgc agtcgcaagg taggctgagc acggtttctt ctggcgggtc 9420 atgttggttg ggagcggggc gggcgatgct gctggtgatg aagttgaaat aggcggttct 9480 gagacggcgg atggtggcga ggagcaccag gtctttgggc ccggcttgct ggatgcgcag 9540 acggtcggcc atgccccagg cgtggtcctg acacctggcc aggtccttgt agtagtcctg 9600 catgagccgc tccacgggca cctcctcctc gcccgcgcgg ccgtgcatgc gcgtgagccc 9660 gaagccgcgc tggggctgga cgagcgccag gtcggcgacg acgcgctcgg cgaggatggc 9720 ttgctggatc tgggtgaggg tggtctggaa gtcatcaaag tcgacgaagc ggtggtaggc 9780 tccggtgttg atggtgtagg agcagttggc catgacggac cagttgacgg tctggtggcc 9840 cggacgcacg agctcgtggt acttgaggcg cgagtaggcg cgcgtgtcga agatgtagtc 9900 gttgcaggtg cgcaccaggt actggtagcc gatgaggaag tgcggcggcg gctggcggta 9960 gagcggccat cgctcggtgg cgggggcgcc gggcgcgagg tcctcgagca tggtgcggtg 10020 gtagccgtag atgtacctgg acatccaggt gatgccggcg gcggtggtgg aggcgcgcgg 10080 gaactcgcgg acgcggttcc agatgttgcg cagcggcagg aagtagttca tggtgggcac 10140 ggtctggccc gtgaggcgcg cgcagtcgtg gatgctctat acgggcaaaa acgaaagcgg 10200 tcagcggctc gactccgtgg cctggaggct aagcgaacgg gttgggctgc gcgtgtaccc 10260 cggttcgaat ctcgaatcag gctggagccg cagctaacgt ggtattggca ctcccgtctc 10320 gacccaagcc tgcaccaacc ctccaggata cggaggcggg tcgttttgca actttttttt 10380 ggaggccgga tgagactagt aagcgcggaa agcggccgac cgcgatggct cgctgccgta 10440 gtctggagaa gaatcgccag ggttgcgttg cggtgtgccc cggttcgagg ccggccggat 10500 tccgcggcta acgagggcgt ggctgccccg tcgtttccaa gaccccatag ccagccgact 10560 tctccagtta cggagcgagc ccctcttttg ttttgtttgt ttttgccaga tgcatcccgt 10620 actgcggcag atgcgccccc accaccctcc accgcaacaa cagccccctc cacagccggc 10680 gcttctgccc ccgccccagc agcaacttcc agccacgacc gccgcggccg ccgtgagcgg 10740 ggctggacag agttatgatc accagctggc cttggaagag ggcgaggggc tggcgcgcct 10800 gggggcgtcg tcgccggagc ggcacccgcg cgtgcagatg aaaagggacg ctcgcgaggc 10860 ctacgtgccc aagcagaacc tgttcagaga caggagcggc gaggagcccg aggagatgcg 10920 cgcggcccgg ttccacgcgg ggcgggagct gcggcgcggc ctggaccgaa agagggtgct 10980 gagggacgag gatttcgagg cggacgagct gacggggatc agccccgcgc gcgcgcacgt 11040 ggccgcggcc aacctggtca cggcgtacga gcagaccgtg aaggaggaga gcaacttcca 11100 aaaatccttc aacaaccacg tgcgcaccct gatcgcgcgc gaggaggtga ccctgggcct 11160 gatgcacctg tgggacctgc tggaggccat cgtgcagaac cccaccagca agccgctgac 11220 ggcgcagctg ttcctggtgg tgcagcatag tcgggacaac gaagcgttca gggaggcgct 11280 gctgaatatc accgagcccg agggccgctg gctcctggac ctggtgaaca ttctgcagag 11340 catcgtggtg caggagcgcg ggctgccgct gtccgagaag ctggcggcca tcaacttctc 11400 ggtgctgagt ttgggcaagt actacgctag gaagatctac aagaccccgt acgtgcccat 11460 agacaaggag gtgaagatcg acgggtttta catgcgcatg accctgaaag tgctgaccct 11520 gagcgacgat ctgggggtgt accgcaacga caggatgcac cgtgcggtga gcgccagcag 11580 gcggcgcgag ctgagcgacc aggagctgat gcatagtctg cagcgggccc tgaccggggc 11640 cgggaccgag ggggagagct actttgacat gggcgcggac ctgcactggc agcccagccg 11700 ccgggccttg gaggcggcgg caggacccta cgtagaagag gtggacgatg aggtggacga 11760 ggagggcgag tacctggaag actgatggcg cgaccgtatt tttgctagat gcaacaacaa 11820 cagccacctc ctgatcccgc gatgcgggcg gcgctgcaga gccagccgtc cggcattaac 11880 tcctcggacg attggaccca ggccatgcaa cgcatcatgg cgctgacgac ccgcaacccc 11940 gaagccttta gacagcagcc ccaggccaac cggctctcgg ccatcctgga ggccgtggtg 12000 ccctcgcgct ccaaccccac gcacgagaag gtcctggcca tcgtgaacgc gctggtggag 12060 aacaaggcca tccgcggcga cgaggccggc ctggtgtaca acgcgctgct ggagcgcgtg 12120 gcccgctaca acagcaccaa cgtgcagacc aacctggacc gcatggtgac cgacgtgcgc 12180 gaggccgtgg cccagcgcga gcggttccac cgcgagtcca acctgggatc catggtggcg 12240 ctgaacgcct tcctcagcac ccagcccgcc aacgtgcccc ggggccagga ggactacacc 12300 aacttcatca gcgccctgcg cctgatggtg accgaggtgc cccagagcga ggtgtaccag 12360 tccgggccgg actacttctt ccagaccagt cgccagggct tgcagaccgt gaacctgagc 12420 caggctttca agaacttgca gggcctgtgg ggcgtgcagg ccccggtcgg ggaccgcgcg 12480 acggtgtcga gcctgctgac gccgaactcg cgcctgctgc tgctgctggt ggcccccttc 12540 acggacagcg gcagcatcaa ccgcaactcg tacctgggct acctgattaa cctgtaccgc 12600 gaggccatcg gccaggcgca cgtggacgag cagacctacc aggagatcac ccacgtgagc 12660 cgcgccctgg gccaggacga cccgggcaac ctggaagcca ccctgaactt tttgctgacc 12720 aaccggtcgc agaagatccc gccccagtac gcgctcagca ccgaggagga gcgcatcctg 12780 cgttacgtgc agcagagcgt gggcctgttc ctgatgcagg agggggccac ccccagcgcc 12840 gcgctcgaca tgaccgcgcg caacatggag cccagcatgt acgccagcaa ccgcccgttc 12900 atcaataaac tgatggacta cttgcatcgg gcggccgcca tgaactctga ctatttcacc 12960 aacgccatcc tgaatcccca ctggctcccg ccgccggggt tctacacggg cgagtacgac 13020 atgcccgacc ccaatgacgg gttcctgtgg gacgatgtgg acagcagcgt gttctccccc 13080 cgaccgggtg ctaacgagcg ccccttgtgg aagaaggaag gcagcgaccg acgcccgtcc 13140 tcggcgctgt ccggccgcga gggtgctgcc gcggcggtgc ccgaggccgc cagtcctttc 13200 ccgagcttgc ccttctcgct gaacagtatc cgcagcagcg agctgggcag gatcacgcgc 13260 ccgcgcttgc tgggcgaaga ggagtacttg aatgactcgc tgttgagacc cgagcgggag 13320 aagaacttcc ccaataacgg gatagaaagc ctggtggaca agatgagccg ctggaagacg 13380 tatgcgcagg agcacaggga cgatccccgg gcgtcgcagg gggccacgag ccggggcagc 13440 gccgcccgta aacgccggtg gcacgacagg cagcggggac agatgtggga cgatgaggac 13500 tccgccgacg acagcagcgt gttggacttg ggtgggagtg gtaacccgtt cgctcacctg 13560 cgcccccgta tcgggcgcat gatgtaagag aaaccgaaaa taaatgatac tcaccaaggc 13620 catggcgacc agcgtgcgtt cgtttcttct ctgttgttgt tgtatctagt atgatgaggc 13680 gtgcgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag gcgatggcgg 13740 cggcggcgat gcagcccccg ctggaggctc cttacgtgcc cccgcggtac ctggcgccta 13800 cggaggggcg gaacagcatt cgttactcgg agctggcacc cttgtacgat accacccggt 13860 tgtacctggt ggacaacaag tcggcggaca tcgcctcgct gaactaccag aacgaccaca 13920 gcaacttcct gaccaccgtg gtgcagaaca atgacttcac ccccacggag gccagcaccc 13980 agaccatcaa ctttgacgag cgctcgcggt ggggcggcca gctgaaaacc atcatgcaca 14040 ccaacatgcc caacgtgaac gagttcatgt acagcaacaa gttcaaggcg cgggtgatgg 14100 tctcccgcaa gacccccaat ggggtgacag tgacagagga ttatgatggt agtcaggatg 14160 agctgaagta tgaatgggtg gaatttgagc tgcccgaagg caacttctcg gtgaccatga 14220 ccatcgacct gatgaacaac gccatcatcg acaattactt ggcggtgggg cggcagaacg 14280 gggtgctgga gagcgacatc ggcgtgaagt tcgacactag gaacttcagg ctgggctggg 14340 accccgtgac cgagctggtc atgcccgggg tgtacaccaa cgaggctttc catcccgata 14400 ttgtcttgct gcccggctgc ggggtggact tcaccgagag ccgcctcagc aacctgctgg 14460 gcattcgcaa gaggcagccc ttccaggaag gcttccagat catgtacgag gatctggagg 14520 ggggcaacat ccccgcgctc ctggatgtcg acgcctatga gaaaagcaag gaggatgcag 14580 cagctgaagc aactgcagcc gtagctaccg cctctaccga ggtcaggggc gataattttg 14640 caagcgccgc agcagtggca gcggccgagg cggctgaaac cgaaagtaag atagtcattc 14700 agccggtgga gaaggatagc aagaacagga gctacaacgt actaccggac aagataaaca 14760 ccgcctaccg cagctggtac ctagcctaca actatggcga ccccgagaag ggcgtgcgct 14820 cctggacgct gctcaccacc tcggacgtca cctgcggcgt ggagcaagtc tactggtcgc 14880 tgcccgacat gatgcaagac ccggtcacct tccgctccac gcgtcaagtt agcaactacc 14940 cggtggtggg cgccgagctc ctgcccgtct actccaagag cttcttcaac gagcaggccg 15000 tctactcgca gcagctgcgc gccttcacct cgcttacgca cgtcttcaac cgcttccccg 15060 agaaccagat cctcgtccgc ccgcccgcgc ccaccattac caccgtcagt gaaaacgttc 15120 ctgctctcac agatcacggg accctgccgc tgcgcagcag tatccgggga gtccagcgcg 15180 tgaccgttac tgacgccaga cgccgcacct gcccctacgt ctacaaggcc ctgggcatag 15240 tcgcgccgcg cgtcctctcg agccgcacct tctaaatgtc cattctcatc tcgcccagta 15300 ataacaccgg ttggggcctg cgcgcgccca gcaagatgta cggaggcgct cgccaacgct 15360 ccacgcaaca ccccgtgcgc gtgcgcgggc acttccgcgc tccctggggc gccctcaagg 15420 gccgcgtgcg gtcgcgcacc accgtcgacg acgtgatcga ccaggtggtg gccgacgcgc 15480 gcaactacac ccccgccgcc gcgcccgtct ccaccgtgga cgccgtcatc gacagcgtgg 15540 tggccgacgc gcgccggtac gcccgcgcca agagccggcg gcggcgcatc gcccggcggc 15600 accggagcac ccccgccatg cgcgcggcgc gagccttgct gcgcagggcc aggcgcacgg 15660 gacgcagggc catgctcagg gcggccagac gcgcggcttc aggcgccagc gccggcagga 15720 cccggagacg cgcggccacg gcggcggcag cggccatcgc cagcatgtcc cgcccgcggc 15780 gagggaacgt gtactgggtg cgcgacgccg ccaccggtgt gcgcgtgccc gtgcgcaccc 15840 gcccccctcg cacttgaaga tgttcacttc gcgatgttga tgtgtcccag cggcgaggag 15900 gatgtccaag cgcaaattca aggaagagat gctccaggtc atcgcgcctg agatctacgg 15960 ccctgcggtg gtgaaggagg aaagaaagcc ccgcaaaatc aagcgggtca aaaaggacaa 16020 aaaggaagaa gaaagtgatg tggacggatt ggtggagttt gtgcgcgagt tcgccccccg 16080 gcggcgcgtg cagtggcgcg ggcggaaggt gcaaccggtg ctgagacccg gcaccaccgt 16140 ggtcttcacg cccggcgagc gctccggcac cgcttccaag cgctcctacg acgaggtgta 16200 cggggatgat gatattctgg agcaggcggc cgagcgcctg ggcgagtttg cttacggcaa 16260 gcgcagccgt tccgcaccga aggaagaggc ggtgtccatc ccgctggacc acggcaaccc 16320 cacgccgagc ctcaagcccg tgaccttgca gcaggtgctg ccgaccgcgg cgccgcgccg 16380 ggggttcaag cgcgagggcg aggatctgta ccccaccatg cagctgatgg tgcccaagcg 16440 ccagaagctg gaagacgtgc tggagaccat gaaggtggac ccggacgtgc agcccgaggt 16500 caaggtgcgg cccatcaagc aggtggcccc gggcctgggc gtgcagaccg tggacatcaa 16560 gattcccacg gagcccatgg aaacgcagac cgagcccatg atcaagccca gcaccagcac 16620 catggaggtg cagacggatc cctggatgcc atcggctcct agtcgaagac cccggcgcaa 16680 gtacggcgcg gccagcctgc tgatgcccaa ctacgcgctg catccttcca tcatccccac 16740 gccgggctac cgcggcacgc gcttctaccg cggtcatacc agcagccgcc gccgcaagac 16800 caccactcgc cgccgccgtc gccgcaccgc cgctgcaacc acccctgccg ccctggtgcg 16860 gagagtgtac cgccgcggcc gcgcacctct gaccctgccg cgcgcgcgct accacccgag 16920 catcgccatt taaactttcg cctgctttgc agatcaatgg ccctcacatg ccgccttcgc 16980 gttcccatta cgggctaccg aggaagaaaa ccgcgccgta gaaggctggc ggggaacggg 17040 atgcgtcgcc accaccaccg gcggcggcgc gccatcagca agcggttggg gggaggcttc 17100 ctgcccgcgc tgatccccat catcgccgcg gcgatcgggg cgatccccgg cattgcttcc 17160 gtggcggtgc aggcctctca gcgccactga gacacacttg gaaacatctt gtaataaacc 17220 aatggactct gacgctcctg gtcctgtgat gtgttttcgt agacagatgg aagacatcaa 17280 tttttcgtcc ctggctccgc gacacggcac gcggccgttc atgggcacct ggagcgacat 17340 cggcaccagc caactgaacg ggggcgcctt caattggagc agtctctgga gcgggcttaa 17400 gaatttcggg tccacgctta aaacctatgg cagcaaggcg tggaacagca ccacagggca 17460 ggcgctgagg gataagctga aagagcagaa cttccagcag aaggtggtcg atgggctcgc 17520 ctcgggcatc aacggggtgg tggacctggc caaccaggcc gtgcagcggc agatcaacag 17580 ccgcctggac ccggtgccgc ccgccggctc cgtggagatg ccgcaggtgg aggaggagct 17640 gcctcccctg gacaagcggg gcgagaagcg accccgcccc gatgcggagg agacgctgct 17700 gacgcacacg gacgagccgc ccccgtacga ggaggcggtg aaactgggtc tgcccaccac 17760 gcggcccatc gcgcccctgg ccaccggggt gctgaaaccc gaaaagcccg cgaccctgga 17820 cttgcctcct ccccagcctt cccgcccctc tacagtggct aagcccctgc cgccggtggc 17880 cgtggcccgc gcgcgacccg ggggcaccgc ccgccctcat gcgaactggc agagcactct 17940 gaacagcatc gtgggtctgg gagtgcagag tgtgaagcgc cgccgctgct attaaaccta 18000 ccgtagcgct taacttgctt gtctgtgtgt gtatgtatta tgtcgccgcc gccgctgtcc 18060 accagaagga ggagtgaaga ggcgcgtcgc cgagttgcaa gatggccacc ccatcgatgc 18120 tgccccagtg ggcgtacatg cacatcgccg gacaggacgc ttcggagtac ctgagtccgg 18180 gtctggtgca gtttgcccgc gccacagaca cctacttcag tctggggaac aagtttagga 18240 accccacggt ggcgcccacg cacgatgtga ccaccgaccg cagccagcgg ctgacgctgc 18300 gcttcgtgcc cgtggaccgc gaggacaaca cctactcgta caaagtgcgc tacacgctgg 18360 ccgtgggcga caaccgcgtg ctggacatgg ccagcaccta ctttgacatc cgcggcgtgc 18420 tggatcgggg ccctagcttc aaaccctact ccggcaccgc ctacaacagt ctggccccca 18480 agggagcacc caacacttgt cagtggacat ataaagccga tggtgaaact gccacagaaa 18540 aaacctatac atatggaaat gcacccgtgc agggcattaa catcacaaaa gatggtattc 18600 aacttggaac tgacaccgat gatcagccaa tctacgcaga taaaacctat cagcctgaac 18660 ctcaagtggg tgatgctgaa tggcatgaca tcactggtac tgatgaaaag tatggaggca 18720 gagctcttaa gcctgatacc aaaatgaagc cttgttatgg ttcttttgcc aagcctacta 18780 ataaagaagg aggtcaggca aatgtgaaaa caggaacagg cactactaaa gaatatgaca 18840 tagacatggc tttctttgac aacagaagtg cggctgctgc tggcctagct ccagaaattg 18900 ttttgtatac tgaaaatgtg gatttggaaa ctccagatac ccatattgta tacaaagcag 18960 gcacagatga cagcagctct tctattaatt tgggtcagca agccatgccc aacagaccta 19020 actacattgg tttcagagac aactttatcg ggctcatgta ctacaacagc actggcaata 19080 tgggggtgct ggccggtcag gcttctcagc tgaatgctgt ggttgacttg caagacagaa 19140 acaccgagct gtcctaccag ctcttgcttg actctctggg tgacagaacc cggtatttca 19200 gtatgtggaa tcaggcggtg gacagctatg atcctgatgt gcgcattatt gaaaatcatg 19260 gtgtggagga tgaacttccc aactattgtt tccctctgga tgctgttggc agaacagata 19320 cttatcaggg aattaaggct aatggaactg atcaaaccac atggaccaaa gatgacagtg 19380 tcaatgatgc taatgagata ggcaagggta atccattcgc catggaaatc aacatccaag 19440 ccaacctgtg gaggaacttc ctctacgcca acgtggccct gtacctgccc gactcttaca 19500 agtacacgcc ggccaatgtt accctgccca ccaacaccaa cacctacgat tacatgaacg 19560 gccgggtggt ggcgccctcg ctggtggact cctacatcaa catcggggcg cgctggtcgc 19620 tggatcccat ggacaacgtg aaccccttca accaccaccg caatgcgggg ctgcgctacc 19680 gctccatgct cctgggcaac gggcgctacg tgcccttcca catccaggtg ccccagaaat 19740 ttttcgccat caagagcctc ctgctcctgc ccgggtccta cacctacgag tggaacttcc 19800 gcaaggacgt caacatgatc ctgcagagct ccctcggcaa cgacctgcgc acggacgggg 19860 cctccatctc cttcaccagc atcaacctct acgccacctt cttccccatg gcgcacaaca 19920 cggcctccac gctcgaggcc atgctgcgca acgacaccaa cgaccagtcc ttcaacgact 19980 acctctcggc ggccaacatg ctctacccca tcccggccaa cgccaccaac gtgcccatct 20040 ccatcccctc gcgcaactgg gccgccttcc gcggctggtc cttcacgcgt ctcaagacca 20100 aggagacgcc ctcgctgggc tccgggttcg acccctactt cgtctactcg ggctccatcc 20160 cctacctcga cggcaccttc tacctcaacc acaccttcaa gaaggtctcc atcaccttcg 20220 actcctccgt cagctggccc ggcaacgacc ggctcctgac gcccaacgag ttcgaaatca 20280 agcgcaccgt cgacggcgag ggctacaacg tggcccagtg caacatgacc aaggactggt 20340 tcctggtcca gatgctggcc cactacaaca tcggctacca gggcttctac gtgcccgagg 20400 gctacaagga ccgcatgtac tccttcttcc gcaacttcca gcccatgagc cgccaggtgg 20460 tggacgaggt caactacaag gactaccagg ccgtcaccct ggcctaccag cacaacaact 20520 cgggcttcgt cggctacctc gcgcccacca tgcgccaggg ccagccctac cccgccaact 20580 acccctaccc gctcatcggc aagagcgccg tcaccagcgt cacccagaaa aagttcctct 20640 gcgacagggt catgtggcgc atccccttct ccagcaactt catgtccatg ggcgcgctca 20700 ccgacctcgg ccagaacatg ctctatgcca actccgccca cgcgctagac atgaatttcg 20760 aagtcgaccc catggatgag tccacccttc tctatgttgt cttcgaagtc ttcgacgtcg 20820 tccgagtgca ccagccccac cgcggcgtca tcgaggccgt ctacctgcgc acccccttct 20880 cggccggtaa cgccaccacc taagctcttg cttcttgcaa gccatggccg cgggctccgg 20940 cgagcaggag ctcagggcca tcatccgcga cctgggctgc gggccctact tcctgggcac 21000 cttcgataag cgcttcccgg gattcatggc cccgcacaag ctggcctgcg ccatcgtcaa 21060 cacggccggc cgcgagaccg ggggcgagca ctggctggcc ttcgcctgga acccgcgctc 21120 gaacacctgc tacctcttcg accccttcgg gttctcggac gagcgcctca agcagatcta 21180 ccagttcgag tacgagggcc tgctgcgccg cagcgccctg gccaccgagg accgctgcgt 21240 caccctggaa aagtccaccc agaccgtgca gggtccgcgc tcggccgcct gcgggctctt 21300 ctgctgcatg ttcctgcacg ccttcgtgca ctggcccgac cgccccatgg acaagaaccc 21360 caccatgaac ttgctgacgg gggtgcccaa cggcatgctc cagtcgcccc aggtggaacc 21420 caccctgcgc cgcaaccagg aggcgctcta ccgcttcctc aactcccact ccgcctactt 21480 tcgctcccac cgcgcgcgca tcgagaaggc caccgccttc gaccgcatga atcaagacat 21540 gtaaaccgtg tgtgtatgtt aaatgtcttt aataaacagc actttcatgt tacacatgca 21600 tctgagatga tttatttaga aatcgaaagg gttctgccgg gtctcggcat ggcccgcggg 21660 cagggacacg ttgcggaact ggtacttggc cagccacttg aactcgggga tcagcagttt 21720 gggcagcggg gtgtcgggga aggagtcggt ccacagcttc cgcgtcagtt gcagggcgcc 21780 cagcaggtcg ggcgcggaga tcttgaaatc gcagttggga cccgcgttct gcgcgcggga 21840 gttgcggtac acggggttgc agcactggaa caccatcagg gccgggtgct tcacgctcgc 21900 cagcaccgtc gcgtcggtga tgctctccac gtcgaggtcc tcggcgttgg ccatcccgaa 21960 gggggtcatc ttgcaggtct gccttcccat ggtgggcacg cacccgggct tgtggttgca 22020 atcgcagtgc agggggatca gcatcatctg ggcctggtcg gcgttcatcc ccgggtacat 22080 ggccttcatg aaagcctcca attgcctgaa cgcctgctgg gccttggctc cctcggtgaa 22140 gaagaccccg caggacttgc tagagaactg gttggtggcg cacccggcgt cgtgcacgca 22200 gcagcgcgcg tcgttgttgg ccagctgcac cacgctgcgc ccccagcggt tctgggtgat 22260 cttggcccgg tcggggttct ccttcagcgc gcgctgcccg ttctcgctcg ccacatccat 22320 ctcgatcatg tgctccttct ggatcatggt ggtcccgtgc aggcaccgca gcttgccctc 22380 ggcctcggtg cacccgtgca gccacagcgc gcacccggtg cactcccagt tcttgtgggc 22440 gatctgggaa tgcgcgtgca cgaagccctg caggaagcgg cccatcatgg tggtcagggt 22500 cttgttgcta gtgaaggtca gcggaatgcc gcggtgctcc tcgttgatgt acaggtggca 22560 gatgcggcgg tacacctcgc cctgctcggg catcagctgg aagttggctt tcaggtcggt 22620 ctccacgcgg tagcggtcca tcagcatagt catgatttcc atacccttct cccaggccga 22680 gacgatgggc aggctcatag ggttcttcac catcatctta gcgctagcag ccgcggccag 22740 ggggtcgctc tcgtccaggg tctcaaagct ccgcttgccg tccttctcgg tgatccgcac 22800 cggggggtag ctgaagccca cggccgccag ctcctcctcg gcctgtcttt cgtcctcgct 22860 gtcctggctg acgtcctgca ggaccacatg cttggtcttg cggggtttct tcttgggcgg 22920 cagcggcggc ggagatgttg gagatggcga gggggagcgc gagttctcgc tcaccactac 22980 tatctcttcc tcttcttggt ccgaggccac gcggcggtag gtatgtctct tcgggggcag 23040 aggcggaggc gacgggctct cgccgccgcg acttggcgga tggctggcag agccccttcc 23100 gcgttcgggg gtgcgctccc ggcggcgctc tgactgactt cctccgcggc cggccattgt 23160 gttctcctag ggaggaacaa caagcatgga gactcagcca tcgccaacct cgccatctgc 23220 ccccaccgcc gacgagaagc agcagcagca gaatgaaagc ttaaccgccc cgccgcccag 23280 ccccgccacc tccgacgcgg ccgtcccaga catgcaagag atggaggaat ccatcgagat 23340 tgacctgggc tatgtgacgc ccgcggagca cgaggaggag ctggcagtgc gcttttcaca 23400 agaagagata caccaagaac agccagagca ggaagcagag aatgagcaga gtcaggctgg 23460 gctcgagcat gacggcgact acctccacct gagcgggggg gaggacgcgc tcatcaagca 23520 tctggcccgg caggccacca tcgtcaagga tgcgctgctc gaccgcaccg aggtgcccct 23580 cagcgtggag gagctcagcc gcgcctacga gttgaacctc ttctcgccgc gcgtgccccc 23640 caagcgccag cccaatggca cctgcgagcc caacccgcgc ctcaacttct acccggtctt 23700 cgcggtgccc gaggccctgg ccacctacca catctttttc aagaaccaaa agatccccgt 23760 ctcctgccgc gccaaccgca cccgcgccga cgcccttttc aacctgggtc ccggcgcccg 23820 cctacctgat atcgcctcct tggaagaggt tcccaagatc ttcgagggtc tgggcagcga 23880 cgagactcgg gccgcgaacg ctctgcaagg agaaggagga gagcatgagc accacagcgc 23940 cctggtcgag ttggaaggcg acaacgcgcg gctggcggtg ctcaaacgca cggtcgagct 24000 gacccatttc gcctacccgg ctctgaacct gccccccaaa gtcatgagcg cggtcatgga 24060 ccaggtgctc atcaagcgcg cgtcgcccat ctccgaggac gagggcatgc aagactccga 24120 ggagggcaag cccgtggtca gcgacgagca gctggcccgg tggctgggtc ctaatgctag 24180 tccccagagt ttggaagagc ggcgcaaact catgatggcc gtggtcctgg tgaccgtgga 24240 gctggagtgc ctgcgccgct tcttcgccga cgcggagacc ctgcgcaagg tcgaggagaa 24300 cctgcactac ctcttcaggc acgggttcgt gcgccaggcc tgcaagatct ccaacgtgga 24360 gctgaccaac ctggtctcct acatgggcat cttgcacgag aaccgcctgg ggcagaacgt 24420 gctgcacacc accctgcgcg gggaggcccg gcgcgactac atccgcgact gcgtctacct 24480 ctacctctgc cacacctggc agacgggcat gggcgtgtgg cagcagtgtc tggaggagca 24540 gaacctgaaa gagctctgca agctcctgca gaagaacctc aagggtctgt ggaccgggtt 24600 cgacgagcgc accaccgcct cggacctggc cgacctcatt ttccccgagc gcctcaggct 24660 gacgctgcgc aacggcctgc ccgactttat gagccaaagc atgttgcaaa actttcgctc 24720 tttcatcctc gaacgctccg gaatcctgcc cgccacctgc tccgcgctgc cctcggactt 24780 cgtgccgctg accttccgcg agtgcccccc gccgctgtgg agccactgct acctgctgcg 24840 cctggccaac tacctggcct accactcgga cgtgatcgag gacgtcagcg gcgagggcct 24900 gctcgagtgc cactgccgct gcaacctctg cacgccgcac cgctccctgg cctgcaaccc 24960 ccagctgctg agcgagaccc agatcatcgg caccttcgag ttgcaagggc ccagcgaagg 25020 cgagggttca gccgccaagg ggggtctgaa actcaccccg gggctgtgga cctcggccta 25080 cttgcgcaag ttcgtgcccg aggactacca tcccttcgag atcaggttct acgaggacca 25140 atcccatccg cccaaggccg agctgtcggc ctgcgtcatc acccaggggg cgatcctggc 25200 ccaattgcaa gccatccaga aatcccgcca agaattcttg ctgaaaaagg gccgcggggt 25260 ctacctcgac ccccagaccg gtgaggagct caaccccggc ttcccccagg atgccccgag 25320 gaaacaagaa gctgaaagtg gagctgccgc ccgtggagga tttggaggaa gactgggaga 25380 acagcagtca ggcagaggag gaggagatgg aggaagactg ggacagcact caggcagagg 25440 aggacagcct gcaagacagt ctggaggaag acgaggagga ggcagaggag gaggtggaag 25500 aagcagccgc cgccagaccg tcgtcctcgg cgggggagaa agcaagcagc acggatacca 25560 tctccgctcc gggtcggggt cccgctcgac cacacagtag atgggacgag accggacgat 25620 tcccgaaccc caccacccag accggtaaga aggagcggca gggatacaag tcctggcggg 25680 ggcacaaaaa cgccatcgtc tcctgcttgc aggcctgcgg gggcaacatc tccttcaccc 25740 ggcgctacct gctcttccac cgcggggtga actttccccg caacatcttg cattactacc 25800 gtcacctcca cagcccctac tacttccaag aagaggcagc agcagcagaa aaagaccagc 25860 agaaaaccag cagctagaaa atccacagcg gcggcagcag gtggactgag gatcgcggcg 25920 aacgagccgg cgcaaacccg ggagctgagg aaccggatct ttcccaccct ctatgccatc 25980 ttccagcaga gtcgggggca ggagcaggaa ctgaaagtca agaaccgttc tctgcgctcg 26040 ctcacccgca gttgtctgta tcacaagagc gaagaccaac ttcagcgcac tctcgaggac 26100 gccgaggctc tcttcaacaa gtactgcgcg ctcactctta aagagtagcc cgcgcccgcc 26160 cagtcgcaga aaaaggcggg aattacgtca cctgtgccct tcgccctagc cgcctccacc 26220 catcatcatg agcaaagaga ttcccacgcc ttacatgtgg agctaccagc cccagatggg 26280 cctggccgcc ggtgccgccc aggactactc cacccgcatg aattggctca gcgccgggcc 26340 cgcgatgatc tcacgggtga atgacatccg cgcccaccga aaccagatac tcctagaaca 26400 gtcagcgctc accgccacgc cccgcaatca cctcaatccg cgtaattggc ccgccgccct 26460 ggtgtaccag gaaattcccc agcccacgac cgtactactt ccgcgagacg cccaggccga 26520 agtccagctg actaactcag gtgtccagct ggcgggcggc gccaccctgt gtcgtcaccg 26580 ccccgctcag ggtataaagc ggctggtgat ccggggcaga ggcacacagc tcaacgacga 26640 ggtggtgagc tcttcgctgg gtctgcgacc tgacggagtc ttccaactcg ccggatcggg 26700 gagatcttcc ttcacgcctc gtcaggccgt cctgactttg gagagttcgt cctcgcagcc 26760 ccgctcgggt ggcatcggca ctctccagtt cgtggaggag ttcactccct cggtctactt 26820 caaccccttc tccggctccc ccggccacta cccggacgag ttcatcccga acttcgacgc 26880 catcagcgag tcggtggacg gctacgattg aatgtcccat ggtggcgcag ctgacctagc 26940 tcggcttcga cacctggacc actgccgccg cttccgctgc ttcgctcggg atctcgccga 27000 gtttgcctac tttgagctgc ccgaggagca ccctcagggc ccggcccacg gagtgcggat 27060 cgtcgtcgaa gggggcctcg actcccacct gcttcggatc ttcagccagc gtccgatcct 27120 ggtcgagcgc gagcaaggac agacccttct gactctgtac tgcatctgca accaccccgg 27180 cctgcatgaa agtctttgtt gtctgctgtg tactgagtat aataaaagct gagatcagcg 27240 actactccgg acttccgtgt gttcctgaat ccatcaacca gtctttgttc ttcaccggga 27300 acgagaccga gctccagctc cagtgtaagc cccacaagaa gtacctcacc tggctgttcc 27360 agggctcccc gatcgccgtt gtcaaccact gcgacaacga cggagtcctg ctgagcggcc 27420 ctgccaacct tactttttcc acccgcagaa gcaagctcca gctcttccaa cccttcctcc 27480 ccgggaccta tcagtgcgtc tcgggaccct gccatcacac cttccacctg atcccgaata 27540 ccacagcgtc gctccccgct actaacaacc aaactaacct ccaccaacgc caccgtcgcg 27600 acggccacaa tacatgccca tattagacta tgaggccgag ccacagcgac ccatgctccc 27660 cgctattagt tacttcaatc taaccggcgg agatgactga cccactggcc aacaacaacg 27720 tcaacgacct tctcctggac atggacggcc gcgcctcgga gcagcgactc gcccaacttc 27780 gcattcgcca gcagcaggag agagccgtca aggagctgca ggatgcggtg gccatccacc 27840 agtgcaagag aggcatcttc tgcctggtga aacaggccaa gatctcctac gaggtcactc 27900 caaacgacca tcgcctctcc tacgagctcc tgcagcagcg ccagaagttc acctgcctgg 27960 tcggagtcaa ccccatcgtc atcacccagc agtctggcga taccaagggg tgcatccact 28020 gctcctgcga ctcccccgac tgcgtccaca ctctgatcaa gaccctctgc ggcctccgcg 28080 acctcctccc catgaactaa tcaccccctt atccagtgaa ataaagatca tattgatgat 28140 gattttacag aaataaaaaa taatcatttg atttgaaata aagatacaat catattgatg 28200 atttgagttt aacaaaaaaa taaagaatca cttacttgaa atctgatacc aggtctctgt 28260 ccatgttttc tgccaacacc acttcactcc cctcttccca gctctggtac tgcaggcccc 28320 ggcgggctgc aaacttcctc cacacgctga aggggatgtc aaattcctcc tgtccctcaa 28380 tcttcatttt atcttctatc agatgtccaa aaagcgcgtc cgggtggatg atgacttcga 28440 ccccgtctac ccctacgatg cagacaacgc accgaccgtg cccttcatca accccccctt 28500 cgtctcttca gatggattcc aagagaagcc cctgggggtg ttgtccctgc gactggccga 28560 ccccgtcacc accaagaacg gggaaatcac cctcaagctg ggagaggggg tggacctcga 28620 ttcctcggga aaactcatct ccaacacggc caccaaggcc gccgcccctc tcagtttttc 28680 caacaacacc atttccctta acatggatca ccccttttac actaaagatg gaaaattatc 28740 cttacaagtt tctccaccat taaatatact gagaacaagc attctaaaca cactagcttt 28800 aggttttgga tcaggtttag gactccgtgg ctctgccttg gcagtacagt tagtctctcc 28860 acttacattt gatactgatg gaaacataaa gcttacctta gacagaggtt tgcatgttac 28920 aacaggagat gcaattgaaa gcaacataag ctgggctaaa ggtttaaaat ttgaagatgg 28980 agccatagca accaacattg gaaatgggtt agagtttgga agcagtagta cagaaacagg 29040 tgttgatgat gcttacccaa tccaagttaa acttggatct ggccttagct ttgacagtac 29100 aggagccata atggctggta acaaagaaga cgataaactc actttgtgga caacacctga 29160 tccatcacca aactgtcaaa tactcgcaga aaatgatgca aaactaacac tttgcttgac 29220 taaatgtggt agtcaaatac tggccactgt gtcagtctta gttgtaggaa gtggaaacct 29280 aaaccccatt actggcaccg taagcagtgc tcaggtgttt ctacgttttg atgcaaacgg 29340 tgttctttta acagaacatt ctacactaaa aaaatactgg gggtataggc agggagatag 29400 catagatggc actccatata ccaatgctgt aggattcatg cccaatttaa aagcttatcc 29460 aaagtcacaa agttctacta ctaaaaataa tatagtaggg caagtataca tgaatggaga 29520 tgtttcaaaa cctatgcttc tcactataac cctcaatggt actgatgaca gcaacagtac 29580 atattcaatg tcattttcat acacctggac taatggaagc tatgttggag caacatttgg 29640 ggctaactct tataccttct catacatcgc ccaagaatga acactgtatc ccaccctgca 29700 tgccaaccct tcccacccca ctctgtggaa caaactctga aacacaaaat aaaataaagt 29760 tcaagtgttt tattgattca acagttttac aggattcgag cagttatttt tcctccaccc 29820 tcccaggaca tggaatacac caccctctcc ccccgcacag ccttgaacat ctgaatgcca 29880 ttggtgatgg acatgctttt ggtctccacg ttccacacag tttcagagcg agccagtctc 29940 gggtcggtca gggagatgaa accctccggg cactcccgca tctgcacctc acagctcaac 30000 agctgaggat tgtcctcggt ggtcgggatc acggttatct ggaagaagca gaagagcggc 30060 ggtgggaatc atagtccgcg aacgggatcg gccggtggtg tcgcatcagg ccccgcagca 30120 gtcgctgccg ccgccgctcc gtcaagctgc tgctcagggg gtccgggtcc agggactccc 30180 tcagcatgat gcccacggcc ctcagcatca gtcgtctggt gcggcgggcg cagcagcgca 30240 tgcggatctc gctcaggtcg ctgcagtacg tgcaacacag aaccaccagg ttgttcaaca 30300 gtccatagtt caacacgctc cagccgaaac tcatcgcggg aaggatgcta cccacgtggc 30360 cgtcgtacca gatcctcagg taaatcaagt ggtgccccct ccagaacacg ctgcccacgt 30420 acatgatctc cttgggcatg tggcggttca ccacctcccg gtaccacatc accctctggt 30480 tgaacatgca gccccggatg atcctgcgga accacagggc cagcaccgcc ccgcccgcca 30540 tgcagcgaag agaccccggg tcccggcaat ggcaatggag gacccaccgc tcgtacccgt 30600 ggatcatctg ggagctgaac aagtctatgt tggcacagca caggcatatg ctcatgcatc 30660 tcttcagcac tctcaactcc tcgggggtca aaaccatatc ccagggcacg gggaactctt 30720 gcaggacagc gaaccccgca gaacagggca atcctcgcac agaacttaca ttgtgcatgg 30780 acagggtatc gcaatcaggc agcaccgggt gatcctccac cagagaagcg cgggtctcgg 30840 tctcctcaca gcgtggtaag ggggccggcc gatacgggtg atggcgggac gcggctgatc 30900 gtgttcgcga ccgtgtcatg atgcagttgc tttcggacat tttcgtactt gctgtagcag 30960 aacctggtcc gggcgctgca caccgatcgc cggcggcggt ctcggcgctt ggaacgctcg 31020 gtgttgaaat tgtaaaacag ccactctctc agaccgtgca gcagatctag ggcctcagga 31080 gtgatgaaga tcccatcatg cctgatggct ctgatcacat cgaccaccgt ggaatgggcc 31140 agacccagcc agatgatgca attttgttgg gtttcggtga cggcggggga gggaagaaca 31200 ggaagaacca tgattaactt ttaatccaaa cggtctcgga gtacttcaaa atgaagatcg 31260 cggagatggc acctctcgcc cccgctgtgt tggtggaaaa taacagccag gtcaaaggtg 31320 atacggttct cgagatgttc cacggtggct tccagcaaag cctccacgcg cacatccaga 31380 aacaagacaa tagcgaaagc gggagggttc tctaattcct caatcatcat gttacactcc 31440 tgcaccatcc ccagataatt ttcatttttc cagccttgaa tgattcgaac tagttcgtga 31500 ggtaaatcca agccagccat gataaagagc tcgcgcagag cgccctccac cggcattctt 31560 aagcacaccc tcataattcc aagatattct gctcctggtt cacctgcagc agattgacaa 31620 gcggaatatc aaaatctctg ccgcgatccc tgagctcctc cctcagcaat aactgtaagt 31680 actctttcat atcctctccg aaatttttag ccataggacc accaggaata agattagggc 31740 aagccacagt acagataaac cgaagtcctc cccagtgagc attgccaaat gcaagactgc 31800 tataagcatg ctggctagac ccggtgatat cttccagata actggacaga aaatcgccca 31860 ggcaattttt aagaaaatca acaaaagaaa aatcctccag gtggacgttt agagcctcgg 31920 gaacaacgat gaagtaaatg caagcggtgc gttccagcat ggttagttag ctgatctgta 31980 gaaaaaacaa aaatgaacat taaaccatgc tagcctggcg aacaggtggg taaatcgttc 32040 tctccagcac caggcaggcc acggggtctc cggcgcgacc ctcgtaaaaa ttgtcgctat 32100 gattgaaaac catcacagag agacgttccc ggtggccggc gtgaatgatt cgacaagatg 32160 aatacacccc cggaacattg gcgtccgcga gtgaaaaaaa gcgcccgagg aagcaataag 32220 gcactacaat gctcagtctc aagtccagca aagcgatgcc atgcggatga agcacaaaat 32280 tctcaggtgc gtacaaaatg taattactcc cctcctgcac aggcagcaaa gcccccgatc 32340 cctccaggta cacatacaaa gcctcagcgt ccatagctta ccgagcagca gcacacaaca 32400 ggcgcaagag tcagagaaag gctgagctct aacctgtcca cccgctctct gctcaatata 32460 tagcccagat ctacactgac gtaaaggcca aagtctaaaa atacccgcca aataatcaca 32520 cacgcccagc acacgcccag aaaccggtga cacactcaaa aaaatacgcg cacttcctca 32580 aacgcccaaa actgccgtca tttccgggtt cccacgctac gtcatcaaaa cacgactttc 32640 aaattccgtc gaccgttaaa aacgtcaccc gccccgcccc taacggtcgc ccgtctctca 32700 gccaatcagc gccccgcatc cccaaattca aacacctcat ttgcatatta acgcgcacaa 32760 aaagtttgag gtatattatt gatgatgg 32788 <210> 13 <211> 30684 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 13 ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60 aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120 gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180 tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240 aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300 gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360 gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420 tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480 atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540 tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600 gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840 atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900 atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960 tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200 cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260 tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg 1320 acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca 1380 agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg 1440 tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 1500 acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 1560 aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga 1620 accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc 1680 tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca 1740 tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc 1800 actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc 1860 tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc 1920 tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctttac aagtagtgag 1980 tttaaactcc catttaaatg tgagggttaa tgcttcgagc agacatgata agatacattg 2040 atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 2100 gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 2160 attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 2220 aaaacctcta caaatgtggt aaaataacta taacggtcct aaggtagcga gtgagtagtg 2280 ttctggggcg ggggaggacc tgcatgaggg ccagaataac tgaaatctgt gcttttctgt 2340 gtgttgcagc agcatgagcg gaagcggctc ctttgaggga ggggtattca gcccttatct 2400 gacggggcgt ctcccctcct gggcgggagt gcgtcagaat gtgatgggat ccacggtgga 2460 cggccggccc gtgcagcccg cgaactcttc aaccctgacc tatgcaaccc tgagctcttc 2520 gtcgttggac gcagctgccg ccgcagctgc tgcatctgcc gccagcgccg tgcgcggaat 2580 ggccatgggc gccggctact acggcactct ggtggccaac tcgagttcca ccaataatcc 2640 cgccagcctg aacgaggaga agctgttgct gctgatggcc cagctcgagg ccttgaccca 2700 gcgcctgggc gagctgaccc agcaggtggc tcagctgcag gagcagacgc gggccgcggt 2760 tgccacggtg aaatccaaat aaaaaatgaa tcaataaata aacggagacg gttgttgatt 2820 ttaacacaga gtctgaatct ttatttgatt tttcgcgcgc ggtaggccct ggaccaccgg 2880 tctcgatcat tgagcacccg gtggatcttt tccaggaccc ggtagaggtg ggcttggatg 2940 ttgaggtaca tgggcatgag cccgtcccgg gggtggaggt agctccattg cagggcctcg 3000 tgctcggggg tggtgttgta aatcacccag tcatagcagg ggcgcagggc atggtgttgc 3060 acaatatctt tgaggaggag actgatggcc acgggcagcc ctttggtgta ggtgtttaca 3120 aatctgttga gctgggaggg atgcatgcgg ggggagatga ggtgcatctt ggcctggatc 3180 ttgagattgg cgatgttacc gcccagatcc cgcctggggt tcatgttgtg caggaccacc 3240 agcacggtgt atccggtgca cttggggaat ttatcatgca acttggaagg gaaggcgtga 3300 aagaatttgg cgacgccttt gtgcccgccc aggttttcca tgcactcatc catgatgatg 3360 gcgatgggcc cgtgggcggc ggcctgggca aagacgtttc gggggtcgga cacatcatag 3420 ttgtggtcct gggtgaggtc atcataggcc attttaatga atttggggcg gagggtgccg 3480 gactggggga caaaggtacc ctcgatcccg ggggcgtagt tcccctcaca gatctgcatc 3540 tcccaggctt tgagctcgga gggggggatc atgtccacct gcggggcgat aaagaacacg 3600 gtttccgggg cgggggagat gagctgggcc gaaagcaagt tccggagcag ctgggacttg 3660 ccgcagccgg tggggccgta gatgaccccg atgaccggct gcaggtggta gttgagggag 3720 agacagctgc cgtcctcccg gaggaggggg gccacctcgt tcatcatctc gcgcacgtgc 3780 atgttctcgc gcaccagttc cgccaggagg cgctctcccc ccagggatag gagctcctgg 3840 agcgaggcga agtttttcag cggcttgagt ccgtcggcca tgggcatttt ggagagggtt 3900 tgttgcaaga gttccaggcg gtcccagagc tcggtgatgt gctctacggc atctcgatcc 3960 agcagacctc ctcgtttcgc gggttgggac ggctgcggga gtagggcacc agacgatggg 4020 cgtccagcgc agccagggtc cggtccttcc agggtcgcag cgtccgcgtc agggtggtct 4080 ccgtcacggt gaaggggtgc gcgccgggct gggcgcttgc gagggtgcgc ttcaggctca 4140 tccggctggt cgaaaaccgc tcccgatcgg cgccctgcgc gtcggccagg tagcaattga 4200 ccatgagttc gtagttgagc gcctcggccg cgtggccttt ggcgcggagc ttacctttgg 4260 aagtctgccc gcaggcggga cagaggaggg acttgagggc gtagagcttg ggggcgagga 4320 agacggactc gggggcgtag gcgtccgcgc cgcagtgggc gcagacggtc tcgcactcca 4380 cgagccaggt gaggtcgggc tggtcggggt caaaaaccag tttcccgccg ttctttttga 4440 tgcgtttctt acctttggtc tccatgagct cgtgtccccg ctgggtgaca aagaggctgt 4500 ccgtgtcccc gtagaccgac tttatgggcc ggtcctcgag cggtgtgccg cggtcctcct 4560 cgtagaggaa ccccgcccac tccgagacga aagcccgggt ccaggccagc acgaaggagg 4620 ccacgtggga cgggtagcgg tcgttgtcca ccagcgggtc caccttttcc agggtatgca 4680 aacacatgtc cccctcgtcc acatccagga aggtgattgg cttgtaagtg taggccacgt 4740 gaccgggggt cccggccggg ggggtataaa agggtgcggg tccctgctcg tcctcactgt 4800 cttccggatc gctgtccagg agcgccagct gttggggtag gtattccctc tcgaaggcgg 4860 gcatgacctc ggcactcagg ttgtcagttt ctagaaacga ggaggatttg atattgacgg 4920 tgccggcgga gatgcctttc aagagcccct cgtccatctg gtcagaaaag acgatctttt 4980 tgttgtcgag cttggtggcg aaggagccgt agagggcgtt ggagaggagc ttggcgatgg 5040 agcgcatggt ctggtttttt tccttgtcgg cgcgctcctt ggcggcgatg ttgagctgca 5100 cgtactcgcg cgccacgcac ttccattcgg ggaagacggt ggtcagctcg tcgggcacga 5160 ttctgacctg ccagccccga ttatgcaggg tgatgaggtc cacactggtg gccacctcgc 5220 cgcgcagggg ctcattagtc cagcagaggc gtccgccctt gcgcgagcag aaggggggca 5280 gggggtccag catgacctcg tcgggggggt cggcatcgat ggtgaagatg ccgggcagga 5340 ggtcggggtc aaagtagctg atggaagtgg ccagatcgtc cagggcagct tgccattcgc 5400 gcacggccag cgcgcgctcg tagggactga ggggcgtgcc ccagggcatg ggatgggtaa 5460 gcgcggaggc gtacatgccg cagatgtcgt agacgtagag gggctcctcg aggatgccga 5520 tgtaggtggg gtagcagcgc cccccgcgga tgctggcgcg cacgtagtca tacagctcgt 5580 gcgagggggc gaggagcccc gggcccaggt tggtgcgact gggcttttcg gcgcggtaga 5640 cgatctggcg gaaaatggca tgcgagttgg aggagatggt gggcctttgg aagatgttga 5700 agtgggcgtg gggcagtccg accgagtcgc ggatgaagtg ggcgtaggag tcttgcagct 5760 tggcgacgag ctcggcggtg actaggacgt ccagagcgca gtagtcgagg gtctcctgga 5820 tgatgtcata cttgagctgt cccttttgtt tccacagctc gcggttgaga aggaactctt 5880 cgcggtcctt ccagtactct tcgaggggga acccgtcctg atctgcacgg taagagccta 5940 gcatgtagaa ctggttgacg gccttgtagg cgcagcagcc cttctccacg gggagggcgt 6000 aggcctgggc ggccttgcgc agggaggtgt gcgtgagggc gaaagtgtcc ctgaccatga 6060 ccttgaggaa ctggtgcttg aagtcgatat cgtcgcagcc cccctgctcc cagagctgga 6120 agtccgtgcg cttcttgtag gcggggttgg gcaaagcgaa agtaacatcg ttgaagagga 6180 tcttgcccgc gcggggcata aagttgcgag tgatgcggaa aggttggggc acctcggccc 6240 ggttgttgat gacctgggcg gcgagcacga tctcgtcgaa gccgttgatg ttgtggccca 6300 cgatgtagag ttccacgaat cgcggacggc ccttgacgtg gggcagtttc ttgagctcct 6360 cgtaggtgag ctcgtcgggg tcgctgagcc cgtgctgctc gagcgcccag tcggcgagat 6420 gggggttggc gcggaggaag gaagtccaga gatccacggc cagggcggtt tgcagacggt 6480 cccggtactg acggaactgc tgcccgacgg ccattttttc gggggtgacg cagtagaagg 6540 tgcgggggtc cccgtgccag cgatcccatt tgagctggag ggcgagatcg agggcgagct 6600 cgacgagccg gtcgtccccg gagagtttca tgaccagcat gaaggggacg agctgcttgc 6660 cgaaggaccc catccaggtg taggtttcca catcgtaggt gaggaagagc ctttcggtgc 6720 gaggatgcga gccgatgggg aagaactgga tctcctgcca ccaattggag gaatggctgt 6780 tgatgtgatg gaagtagaaa tgccgacggc gcgccgaaca ctcgtgcttg tgtttataca 6840 agcggccaca gtgctcgcaa cgctgcacgg gatgcacgtg ctgcacgagc tgtacctgag 6900 ttcctttgac gaggaatttc agtgggaagt ggagtcgtgg cgcctgcatc tcgtgctgta 6960 ctacgtcgtg gtggtcggcc tggccctctt ctgcctcgat ggtggtcatg ctgacgagcc 7020 cgcgcgggag gcaggtccag acctcggcgc gagcgggtcg gagagcgagg acgagggcgc 7080 gcaggccgga gctgtccagg gtcctgagac gctgcggagt caggtcagtg ggcagcggcg 7140 gcgcgcggtt gacttgcagg agtttttcca gggcgcgcgg gaggtccaga tggtacttga 7200 tctccaccgc gccattggtg gcgacgtcga tggcttgcag ggtcccgtgc ccctggggtg 7260 tgaccaccgt cccccgtttc ttcttgggcg gctggggcga cgggggcggt gcctcttcca 7320 tggttagaag cggcggcgag gacgcgcgcc gggcggcagg ggcggctcgg ggcccggagg 7380 caggggcggc aggggcacgt cggcgccgcg cgcgggtagg ttctggtact gcgcccggag 7440 aagactggcg tgagcgacga cgcgacggtt gacgtcctgg atctgacgcc tctgggtgaa 7500 ggccacggga cccgtgagtt tgaacctgaa agagagttcg acagaatcaa tctcggtatc 7560 gttgacggcg gcctgccgca ggatctcttg cacgtcgccc gagttgtcct ggtaggcgat 7620 ctcggtcatg aactgctcga tctcctcctc ttgaaggtct ccgcggccgg cgcgctccac 7680 ggtggccgcg aggtcgttgg agatgcggcc catgagctgc gagaaggcgt tcatgcccgc 7740 ctcgttccag acgcggctgt agaccacgac gccctcggga tcgcgggcgc gcatgaccac 7800 ctgggcgagg ttgagctcca cgtggcgcgt gaagaccgcg tagttgcaga ggcgctggta 7860 gaggtagttg agcgtggtgg cgatgtgctc ggtgacgaag aaatacatga tccagcggcg 7920 gagcggcatc tcgctgacgt cgcccagcgc ctccaaacgt tccatggcct cgtaaaagtc 7980 cacggcgaag ttgaaaaact gggagttgcg cgccgagacg gtcaactcct cctccagaag 8040 acggatgagc tcggcgatgg tggcgcgcac ctcgcgctcg aaggcccccg ggagttcctc 8100 cacttcctct tcttcctcct ccactaacat ctcttctact tcctcctcag gcggcagtgg 8160 tggcggggga gggggcctgc gtcgccggcg gcgcacgggc agacggtcga tgaagcgctc 8220 gatggtctcg ccgcgccggc gtcgcatggt ctcggtgacg gcgcgcccgt cctcgcgggg 8280 ccgcagcgtg aagacgccgc cgcgcatctc caggtggccg ggggggtccc cgttgggcag 8340 ggagagggcg ctgacgatgc atcttatcaa ttgccccgta gggactccgc gcaaggacct 8400 gagcgtctcg agatccacgg gatctgaaaa ccgctgaacg aaggcttcga gccagtcgca 8460 gtcgcaaggt aggctgagca cggtttcttc tggcgggtca tgttggttgg gagcggggcg 8520 ggcgatgctg ctggtgatga agttgaaata ggcggttctg agacggcgga tggtggcgag 8580 gagcaccagg tctttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc 8640 gtggtcctga cacctggcca ggtccttgta gtagtcctgc atgagccgct ccacgggcac 8700 ctcctcctcg cccgcgcggc cgtgcatgcg cgtgagcccg aagccgcgct ggggctggac 8760 gagcgccagg tcggcgacga cgcgctcggc gaggatggct tgctggatct gggtgagggt 8820 ggtctggaag tcatcaaagt cgacgaagcg gtggtaggct ccggtgttga tggtgtagga 8880 gcagttggcc atgacggacc agttgacggt ctggtggccc ggacgcacga gctcgtggta 8940 cttgaggcgc gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggtgc gcaccaggta 9000 ctggtagccg atgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc 9060 gggggcgccg ggcgcgaggt cctcgagcat ggtgcggtgg tagccgtaga tgtacctgga 9120 catccaggtg atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca 9180 gatgttgcgc agcggcagga agtagttcat ggtgggcacg gtctggcccg tgaggcgcgc 9240 gcagtcgtgg atgctctata cgggcaaaaa cgaaagcggt cagcggctcg actccgtggc 9300 ctggaggcta agcgaacggg ttgggctgcg cgtgtacccc ggttcgaatc tcgaatcagg 9360 ctggagccgc agctaacgtg gtattggcac tcccgtctcg acccaagcct gcaccaaccc 9420 tccaggatac ggaggcgggt cgttttgcaa cttttttttg gaggccggat gagactagta 9480 agcgcggaaa gcggccgacc gcgatggctc gctgccgtag tctggagaag aatcgccagg 9540 gttgcgttgc ggtgtgcccc ggttcgaggc cggccggatt ccgcggctaa cgagggcgtg 9600 gctgccccgt cgtttccaag accccatagc cagccgactt ctccagttac ggagcgagcc 9660 cctcttttgt tttgtttgtt tttgccagat gcatcccgta ctgcggcaga tgcgccccca 9720 ccaccctcca ccgcaacaac agccccctcc acagccggcg cttctgcccc cgccccagca 9780 gcaacttcca gccacgaccg ccgcggccgc cgtgagcggg gctggacaga gttatgatca 9840 ccagctggcc ttggaagagg gcgaggggct ggcgcgcctg ggggcgtcgt cgccggagcg 9900 gcacccgcgc gtgcagatga aaagggacgc tcgcgaggcc tacgtgccca agcagaacct 9960 gttcagagac aggagcggcg aggagcccga ggagatgcgc gcggcccggt tccacgcggg 10020 gcgggagctg cggcgcggcc tggaccgaaa gagggtgctg agggacgagg atttcgaggc 10080 ggacgagctg acggggatca gccccgcgcg cgcgcacgtg gccgcggcca acctggtcac 10140 ggcgtacgag cagaccgtga aggaggagag caacttccaa aaatccttca acaaccacgt 10200 gcgcaccctg atcgcgcgcg aggaggtgac cctgggcctg atgcacctgt gggacctgct 10260 ggaggccatc gtgcagaacc ccaccagcaa gccgctgacg gcgcagctgt tcctggtggt 10320 gcagcatagt cgggacaacg aagcgttcag ggaggcgctg ctgaatatca ccgagcccga 10380 gggccgctgg ctcctggacc tggtgaacat tctgcagagc atcgtggtgc aggagcgcgg 10440 gctgccgctg tccgagaagc tggcggccat caacttctcg gtgctgagtt tgggcaagta 10500 ctacgctagg aagatctaca agaccccgta cgtgcccata gacaaggagg tgaagatcga 10560 cgggttttac atgcgcatga ccctgaaagt gctgaccctg agcgacgatc tgggggtgta 10620 ccgcaacgac aggatgcacc gtgcggtgag cgccagcagg cggcgcgagc tgagcgacca 10680 ggagctgatg catagtctgc agcgggccct gaccggggcc gggaccgagg gggagagcta 10740 ctttgacatg ggcgcggacc tgcactggca gcccagccgc cgggccttgg aggcggcggc 10800 aggaccctac gtagaagagg tggacgatga ggtggacgag gagggcgagt acctggaaga 10860 ctgatggcgc gaccgtattt ttgctagatg caacaacaac agccacctcc tgatcccgcg 10920 atgcgggcgg cgctgcagag ccagccgtcc ggcattaact cctcggacga ttggacccag 10980 gccatgcaac gcatcatggc gctgacgacc cgcaaccccg aagcctttag acagcagccc 11040 caggccaacc ggctctcggc catcctggag gccgtggtgc cctcgcgctc caaccccacg 11100 cacgagaagg tcctggccat cgtgaacgcg ctggtggaga acaaggccat ccgcggcgac 11160 gaggccggcc tggtgtacaa cgcgctgctg gagcgcgtgg cccgctacaa cagcaccaac 11220 gtgcagacca acctggaccg catggtgacc gacgtgcgcg aggccgtggc ccagcgcgag 11280 cggttccacc gcgagtccaa cctgggatcc atggtggcgc tgaacgcctt cctcagcacc 11340 cagcccgcca acgtgccccg gggccaggag gactacacca acttcatcag cgccctgcgc 11400 ctgatggtga ccgaggtgcc ccagagcgag gtgtaccagt ccgggccgga ctacttcttc 11460 cagaccagtc gccagggctt gcagaccgtg aacctgagcc aggctttcaa gaacttgcag 11520 ggcctgtggg gcgtgcaggc cccggtcggg gaccgcgcga cggtgtcgag cctgctgacg 11580 ccgaactcgc gcctgctgct gctgctggtg gcccccttca cggacagcgg cagcatcaac 11640 cgcaactcgt acctgggcta cctgattaac ctgtaccgcg aggccatcgg ccaggcgcac 11700 gtggacgagc agacctacca ggagatcacc cacgtgagcc gcgccctggg ccaggacgac 11760 ccgggcaacc tggaagccac cctgaacttt ttgctgacca accggtcgca gaagatcccg 11820 ccccagtacg cgctcagcac cgaggaggag cgcatcctgc gttacgtgca gcagagcgtg 11880 ggcctgttcc tgatgcagga gggggccacc cccagcgccg cgctcgacat gaccgcgcgc 11940 aacatggagc ccagcatgta cgccagcaac cgcccgttca tcaataaact gatggactac 12000 ttgcatcggg cggccgccat gaactctgac tatttcacca acgccatcct gaatccccac 12060 tggctcccgc cgccggggtt ctacacgggc gagtacgaca tgcccgaccc caatgacggg 12120 ttcctgtggg acgatgtgga cagcagcgtg ttctcccccc gaccgggtgc taacgagcgc 12180 cccttgtgga agaaggaagg cagcgaccga cgcccgtcct cggcgctgtc cggccgcgag 12240 ggtgctgccg cggcggtgcc cgaggccgcc agtcctttcc cgagcttgcc cttctcgctg 12300 aacagtatcc gcagcagcga gctgggcagg atcacgcgcc cgcgcttgct gggcgaagag 12360 gagtacttga atgactcgct gttgagaccc gagcgggaga agaacttccc caataacggg 12420 atagaaagcc tggtggacaa gatgagccgc tggaagacgt atgcgcagga gcacagggac 12480 gatccccggg cgtcgcaggg ggccacgagc cggggcagcg ccgcccgtaa acgccggtgg 12540 cacgacaggc agcggggaca gatgtgggac gatgaggact ccgccgacga cagcagcgtg 12600 ttggacttgg gtgggagtgg taacccgttc gctcacctgc gcccccgtat cgggcgcatg 12660 atgtaagaga aaccgaaaat aaatgatact caccaaggcc atggcgacca gcgtgcgttc 12720 gtttcttctc tgttgttgtt gtatctagta tgatgaggcg tgcgtacccg gagggtcctc 12780 ctccctcgta cgagagcgtg atgcagcagg cgatggcggc ggcggcgatg cagcccccgc 12840 tggaggctcc ttacgtgccc ccgcggtacc tggcgcctac ggaggggcgg aacagcattc 12900 gttactcgga gctggcaccc ttgtacgata ccacccggtt gtacctggtg gacaacaagt 12960 cggcggacat cgcctcgctg aactaccaga acgaccacag caacttcctg accaccgtgg 13020 tgcagaacaa tgacttcacc cccacggagg ccagcaccca gaccatcaac tttgacgagc 13080 gctcgcggtg gggcggccag ctgaaaacca tcatgcacac caacatgccc aacgtgaacg 13140 agttcatgta cagcaacaag ttcaaggcgc gggtgatggt ctcccgcaag acccccaatg 13200 gggtgacagt gacagaggat tatgatggta gtcaggatga gctgaagtat gaatgggtgg 13260 aatttgagct gcccgaaggc aacttctcgg tgaccatgac catcgacctg atgaacaacg 13320 ccatcatcga caattacttg gcggtggggc ggcagaacgg ggtgctggag agcgacatcg 13380 gcgtgaagtt cgacactagg aacttcaggc tgggctggga ccccgtgacc gagctggtca 13440 tgcccggggt gtacaccaac gaggctttcc atcccgatat tgtcttgctg cccggctgcg 13500 gggtggactt caccgagagc cgcctcagca acctgctggg cattcgcaag aggcagccct 13560 tccaggaagg cttccagatc atgtacgagg atctggaggg gggcaacatc cccgcgctcc 13620 tggatgtcga cgcctatgag aaaagcaagg aggatgcagc agctgaagca actgcagccg 13680 tagctaccgc ctctaccgag gtcaggggcg ataattttgc aagcgccgca gcagtggcag 13740 cggccgaggc ggctgaaacc gaaagtaaga tagtcattca gccggtggag aaggatagca 13800 agaacaggag ctacaacgta ctaccggaca agataaacac cgcctaccgc agctggtacc 13860 tagcctacaa ctatggcgac cccgagaagg gcgtgcgctc ctggacgctg ctcaccacct 13920 cggacgtcac ctgcggcgtg gagcaagtct actggtcgct gcccgacatg atgcaagacc 13980 cggtcacctt ccgctccacg cgtcaagtta gcaactaccc ggtggtgggc gccgagctcc 14040 tgcccgtcta ctccaagagc ttcttcaacg agcaggccgt ctactcgcag cagctgcgcg 14100 ccttcacctc gcttacgcac gtcttcaacc gcttccccga gaaccagatc ctcgtccgcc 14160 cgcccgcgcc caccattacc accgtcagtg aaaacgttcc tgctctcaca gatcacggga 14220 ccctgccgct gcgcagcagt atccggggag tccagcgcgt gaccgttact gacgccagac 14280 gccgcacctg cccctacgtc tacaaggccc tgggcatagt cgcgccgcgc gtcctctcga 14340 gccgcacctt ctaaatgtcc attctcatct cgcccagtaa taacaccggt tggggcctgc 14400 gcgcgcccag caagatgtac ggaggcgctc gccaacgctc cacgcaacac cccgtgcgcg 14460 tgcgcgggca cttccgcgct ccctggggcg ccctcaaggg ccgcgtgcgg tcgcgcacca 14520 ccgtcgacga cgtgatcgac caggtggtgg ccgacgcgcg caactacacc cccgccgccg 14580 cgcccgtctc caccgtggac gccgtcatcg acagcgtggt ggccgacgcg cgccggtacg 14640 cccgcgccaa gagccggcgg cggcgcatcg cccggcggca ccggagcacc cccgccatgc 14700 gcgcggcgcg agccttgctg cgcagggcca ggcgcacggg acgcagggcc atgctcaggg 14760 cggccagacg cgcggcttca ggcgccagcg ccggcaggac ccggagacgc gcggccacgg 14820 cggcggcagc ggccatcgcc agcatgtccc gcccgcggcg agggaacgtg tactgggtgc 14880 gcgacgccgc caccggtgtg cgcgtgcccg tgcgcacccg cccccctcgc acttgaagat 14940 gttcacttcg cgatgttgat gtgtcccagc ggcgaggagg atgtccaagc gcaaattcaa 15000 ggaagagatg ctccaggtca tcgcgcctga gatctacggc cctgcggtgg tgaaggagga 15060 aagaaagccc cgcaaaatca agcgggtcaa aaaggacaaa aaggaagaag aaagtgatgt 15120 ggacggattg gtggagtttg tgcgcgagtt cgccccccgg cggcgcgtgc agtggcgcgg 15180 gcggaaggtg caaccggtgc tgagacccgg caccaccgtg gtcttcacgc ccggcgagcg 15240 ctccggcacc gcttccaagc gctcctacga cgaggtgtac ggggatgatg atattctgga 15300 gcaggcggcc gagcgcctgg gcgagtttgc ttacggcaag cgcagccgtt ccgcaccgaa 15360 ggaagaggcg gtgtccatcc cgctggacca cggcaacccc acgccgagcc tcaagcccgt 15420 gaccttgcag caggtgctgc cgaccgcggc gccgcgccgg gggttcaagc gcgagggcga 15480 ggatctgtac cccaccatgc agctgatggt gcccaagcgc cagaagctgg aagacgtgct 15540 ggagaccatg aaggtggacc cggacgtgca gcccgaggtc aaggtgcggc ccatcaagca 15600 ggtggccccg ggcctgggcg tgcagaccgt ggacatcaag attcccacgg agcccatgga 15660 aacgcagacc gagcccatga tcaagcccag caccagcacc atggaggtgc agacggatcc 15720 ctggatgcca tcggctccta gtcgaagacc ccggcgcaag tacggcgcgg ccagcctgct 15780 gatgcccaac tacgcgctgc atccttccat catccccacg ccgggctacc gcggcacgcg 15840 cttctaccgc ggtcatacca gcagccgccg ccgcaagacc accactcgcc gccgccgtcg 15900 ccgcaccgcc gctgcaacca cccctgccgc cctggtgcgg agagtgtacc gccgcggccg 15960 cgcacctctg accctgccgc gcgcgcgcta ccacccgagc atcgccattt aaactttcgc 16020 ctgctttgca gatcaatggc cctcacatgc cgccttcgcg ttcccattac gggctaccga 16080 ggaagaaaac cgcgccgtag aaggctggcg gggaacggga tgcgtcgcca ccaccaccgg 16140 cggcggcgcg ccatcagcaa gcggttgggg ggaggcttcc tgcccgcgct gatccccatc 16200 atcgccgcgg cgatcggggc gatccccggc attgcttccg tggcggtgca ggcctctcag 16260 cgccactgag acacacttgg aaacatcttg taataaacca atggactctg acgctcctgg 16320 tcctgtgatg tgttttcgta gacagatgga agacatcaat ttttcgtccc tggctccgcg 16380 acacggcacg cggccgttca tgggcacctg gagcgacatc ggcaccagcc aactgaacgg 16440 gggcgccttc aattggagca gtctctggag cgggcttaag aatttcgggt ccacgcttaa 16500 aacctatggc agcaaggcgt ggaacagcac cacagggcag gcgctgaggg ataagctgaa 16560 agagcagaac ttccagcaga aggtggtcga tgggctcgcc tcgggcatca acggggtggt 16620 ggacctggcc aaccaggccg tgcagcggca gatcaacagc cgcctggacc cggtgccgcc 16680 cgccggctcc gtggagatgc cgcaggtgga ggaggagctg cctcccctgg acaagcgggg 16740 cgagaagcga ccccgccccg atgcggagga gacgctgctg acgcacacgg acgagccgcc 16800 cccgtacgag gaggcggtga aactgggtct gcccaccacg cggcccatcg cgcccctggc 16860 caccggggtg ctgaaacccg aaaagcccgc gaccctggac ttgcctcctc cccagccttc 16920 ccgcccctct acagtggcta agcccctgcc gccggtggcc gtggcccgcg cgcgacccgg 16980 gggcaccgcc cgccctcatg cgaactggca gagcactctg aacagcatcg tgggtctggg 17040 agtgcagagt gtgaagcgcc gccgctgcta ttaaacctac cgtagcgctt aacttgcttg 17100 tctgtgtgtg tatgtattat gtcgccgccg ccgctgtcca ccagaaggag gagtgaagag 17160 gcgcgtcgcc gagttgcaag atggccaccc catcgatgct gccccagtgg gcgtacatgc 17220 acatcgccgg acaggacgct tcggagtacc tgagtccggg tctggtgcag tttgcccgcg 17280 ccacagacac ctacttcagt ctggggaaca agtttaggaa ccccacggtg gcgcccacgc 17340 acgatgtgac caccgaccgc agccagcggc tgacgctgcg cttcgtgccc gtggaccgcg 17400 aggacaacac ctactcgtac aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc 17460 tggacatggc cagcacctac tttgacatcc gcggcgtgct ggatcggggc cctagcttca 17520 aaccctactc cggcaccgcc tacaacagtc tggcccccaa gggagcaccc aacacttgtc 17580 agtggacata taaagccgat ggtgaaactg ccacagaaaa aacctataca tatggaaatg 17640 cacccgtgca gggcattaac atcacaaaag atggtattca acttggaact gacaccgatg 17700 atcagccaat ctacgcagat aaaacctatc agcctgaacc tcaagtgggt gatgctgaat 17760 ggcatgacat cactggtact gatgaaaagt atggaggcag agctcttaag cctgatacca 17820 aaatgaagcc ttgttatggt tcttttgcca agcctactaa taaagaagga ggtcaggcaa 17880 atgtgaaaac aggaacaggc actactaaag aatatgacat agacatggct ttctttgaca 17940 acagaagtgc ggctgctgct ggcctagctc cagaaattgt tttgtatact gaaaatgtgg 18000 atttggaaac tccagatacc catattgtat acaaagcagg cacagatgac agcagctctt 18060 ctattaattt gggtcagcaa gccatgccca acagacctaa ctacattggt ttcagagaca 18120 actttatcgg gctcatgtac tacaacagca ctggcaatat gggggtgctg gccggtcagg 18180 cttctcagct gaatgctgtg gttgacttgc aagacagaaa caccgagctg tcctaccagc 18240 tcttgcttga ctctctgggt gacagaaccc ggtatttcag tatgtggaat caggcggtgg 18300 acagctatga tcctgatgtg cgcattattg aaaatcatgg tgtggaggat gaacttccca 18360 actattgttt ccctctggat gctgttggca gaacagatac ttatcaggga attaaggcta 18420 atggaactga tcaaaccaca tggaccaaag atgacagtgt caatgatgct aatgagatag 18480 gcaagggtaa tccattcgcc atggaaatca acatccaagc caacctgtgg aggaacttcc 18540 tctacgccaa cgtggccctg tacctgcccg actcttacaa gtacacgccg gccaatgtta 18600 ccctgcccac caacaccaac acctacgatt acatgaacgg ccgggtggtg gcgccctcgc 18660 tggtggactc ctacatcaac atcggggcgc gctggtcgct ggatcccatg gacaacgtga 18720 accccttcaa ccaccaccgc aatgcggggc tgcgctaccg ctccatgctc ctgggcaacg 18780 ggcgctacgt gcccttccac atccaggtgc cccagaaatt tttcgccatc aagagcctcc 18840 tgctcctgcc cgggtcctac acctacgagt ggaacttccg caaggacgtc aacatgatcc 18900 tgcagagctc cctcggcaac gacctgcgca cggacggggc ctccatctcc ttcaccagca 18960 tcaacctcta cgccaccttc ttccccatgg cgcacaacac ggcctccacg ctcgaggcca 19020 tgctgcgcaa cgacaccaac gaccagtcct tcaacgacta cctctcggcg gccaacatgc 19080 tctaccccat cccggccaac gccaccaacg tgcccatctc catcccctcg cgcaactggg 19140 ccgccttccg cggctggtcc ttcacgcgtc tcaagaccaa ggagacgccc tcgctgggct 19200 ccgggttcga cccctacttc gtctactcgg gctccatccc ctacctcgac ggcaccttct 19260 acctcaacca caccttcaag aaggtctcca tcaccttcga ctcctccgtc agctggcccg 19320 gcaacgaccg gctcctgacg cccaacgagt tcgaaatcaa gcgcaccgtc gacggcgagg 19380 gctacaacgt ggcccagtgc aacatgacca aggactggtt cctggtccag atgctggccc 19440 actacaacat cggctaccag ggcttctacg tgcccgaggg ctacaaggac cgcatgtact 19500 ccttcttccg caacttccag cccatgagcc gccaggtggt ggacgaggtc aactacaagg 19560 actaccaggc cgtcaccctg gcctaccagc acaacaactc gggcttcgtc ggctacctcg 19620 cgcccaccat gcgccagggc cagccctacc ccgccaacta cccctacccg ctcatcggca 19680 agagcgccgt caccagcgtc acccagaaaa agttcctctg cgacagggtc atgtggcgca 19740 tccccttctc cagcaacttc atgtccatgg gcgcgctcac cgacctcggc cagaacatgc 19800 tctatgccaa ctccgcccac gcgctagaca tgaatttcga agtcgacccc atggatgagt 19860 ccacccttct ctatgttgtc ttcgaagtct tcgacgtcgt ccgagtgcac cagccccacc 19920 gcggcgtcat cgaggccgtc tacctgcgca cccccttctc ggccggtaac gccaccacct 19980 aagctcttgc ttcttgcaag ccatggccgc gggctccggc gagcaggagc tcagggccat 20040 catccgcgac ctgggctgcg ggccctactt cctgggcacc ttcgataagc gcttcccggg 20100 attcatggcc ccgcacaagc tggcctgcgc catcgtcaac acggccggcc gcgagaccgg 20160 gggcgagcac tggctggcct tcgcctggaa cccgcgctcg aacacctgct acctcttcga 20220 ccccttcggg ttctcggacg agcgcctcaa gcagatctac cagttcgagt acgagggcct 20280 gctgcgccgc agcgccctgg ccaccgagga ccgctgcgtc accctggaaa agtccaccca 20340 gaccgtgcag ggtccgcgct cggccgcctg cgggctcttc tgctgcatgt tcctgcacgc 20400 cttcgtgcac tggcccgacc gccccatgga caagaacccc accatgaact tgctgacggg 20460 ggtgcccaac ggcatgctcc agtcgcccca ggtggaaccc accctgcgcc gcaaccagga 20520 ggcgctctac cgcttcctca actcccactc cgcctacttt cgctcccacc gcgcgcgcat 20580 cgagaaggcc accgccttcg accgcatgaa tcaagacatg taaaccgtgt gtgtatgtta 20640 aatgtcttta ataaacagca ctttcatgtt acacatgcat ctgagatgat ttatttagaa 20700 atcgaaaggg ttctgccggg tctcggcatg gcccgcgggc agggacacgt tgcggaactg 20760 gtacttggcc agccacttga actcggggat cagcagtttg ggcagcgggg tgtcggggaa 20820 ggagtcggtc cacagcttcc gcgtcagttg cagggcgccc agcaggtcgg gcgcggagat 20880 cttgaaatcg cagttgggac ccgcgttctg cgcgcgggag ttgcggtaca cggggttgca 20940 gcactggaac accatcaggg ccgggtgctt cacgctcgcc agcaccgtcg cgtcggtgat 21000 gctctccacg tcgaggtcct cggcgttggc catcccgaag ggggtcatct tgcaggtctg 21060 ccttcccatg gtgggcacgc acccgggctt gtggttgcaa tcgcagtgca gggggatcag 21120 catcatctgg gcctggtcgg cgttcatccc cgggtacatg gccttcatga aagcctccaa 21180 ttgcctgaac gcctgctggg ccttggctcc ctcggtgaag aagaccccgc aggacttgct 21240 agagaactgg ttggtggcgc acccggcgtc gtgcacgcag cagcgcgcgt cgttgttggc 21300 cagctgcacc acgctgcgcc cccagcggtt ctgggtgatc ttggcccggt cggggttctc 21360 cttcagcgcg cgctgcccgt tctcgctcgc cacatccatc tcgatcatgt gctccttctg 21420 gatcatggtg gtcccgtgca ggcaccgcag cttgccctcg gcctcggtgc acccgtgcag 21480 ccacagcgcg cacccggtgc actcccagtt cttgtgggcg atctgggaat gcgcgtgcac 21540 gaagccctgc aggaagcggc ccatcatggt ggtcagggtc ttgttgctag tgaaggtcag 21600 cggaatgccg cggtgctcct cgttgatgta caggtggcag atgcggcggt acacctcgcc 21660 ctgctcgggc atcagctgga agttggcttt caggtcggtc tccacgcggt agcggtccat 21720 cagcatagtc atgatttcca tacccttctc ccaggccgag acgatgggca ggctcatagg 21780 gttcttcacc atcatcttag cgctagcagc cgcggccagg gggtcgctct cgtccagggt 21840 ctcaaagctc cgcttgccgt ccttctcggt gatccgcacc ggggggtagc tgaagcccac 21900 ggccgccagc tcctcctcgg cctgtctttc gtcctcgctg tcctggctga cgtcctgcag 21960 gaccacatgc ttggtcttgc ggggtttctt cttgggcggc agcggcggcg gagatgttgg 22020 agatggcgag ggggagcgcg agttctcgct caccactact atctcttcct cttcttggtc 22080 cgaggccacg cggcggtagg tatgtctctt cgggggcaga ggcggaggcg acgggctctc 22140 gccgccgcga cttggcggat ggctggcaga gccccttccg cgttcggggg tgcgctcccg 22200 gcggcgctct gactgacttc ctccgcggcc ggccattgtg ttctcctagg gaggaacaac 22260 aagcatggag actcagccat cgccaacctc gccatctgcc cccaccgccg acgagaagca 22320 gcagcagcag aatgaaagct taaccgcccc gccgcccagc cccgccacct ccgacgcggc 22380 cgtcccagac atgcaagaga tggaggaatc catcgagatt gacctgggct atgtgacgcc 22440 cgcggagcac gaggaggagc tggcagtgcg cttttcacaa gaagagatac accaagaaca 22500 gccagagcag gaagcagaga atgagcagag tcaggctggg ctcgagcatg acggcgacta 22560 cctccacctg agcggggggg aggacgcgct catcaagcat ctggcccggc aggccaccat 22620 cgtcaaggat gcgctgctcg accgcaccga ggtgcccctc agcgtggagg agctcagccg 22680 cgcctacgag ttgaacctct tctcgccgcg cgtgcccccc aagcgccagc ccaatggcac 22740 ctgcgagccc aacccgcgcc tcaacttcta cccggtcttc gcggtgcccg aggccctggc 22800 cacctaccac atctttttca agaaccaaaa gatccccgtc tcctgccgcg ccaaccgcac 22860 ccgcgccgac gcccttttca acctgggtcc cggcgcccgc ctacctgata tcgcctcctt 22920 ggaagaggtt cccaagatct tcgagggtct gggcagcgac gagactcggg ccgcgaacgc 22980 tctgcaagga gaaggaggag agcatgagca ccacagcgcc ctggtcgagt tggaaggcga 23040 caacgcgcgg ctggcggtgc tcaaacgcac ggtcgagctg acccatttcg cctacccggc 23100 tctgaacctg ccccccaaag tcatgagcgc ggtcatggac caggtgctca tcaagcgcgc 23160 gtcgcccatc tccgaggacg agggcatgca agactccgag gagggcaagc ccgtggtcag 23220 cgacgagcag ctggcccggt ggctgggtcc taatgctagt ccccagagtt tggaagagcg 23280 gcgcaaactc atgatggccg tggtcctggt gaccgtggag ctggagtgcc tgcgccgctt 23340 cttcgccgac gcggagaccc tgcgcaaggt cgaggagaac ctgcactacc tcttcaggca 23400 cgggttcgtg cgccaggcct gcaagatctc caacgtggag ctgaccaacc tggtctccta 23460 catgggcatc ttgcacgaga accgcctggg gcagaacgtg ctgcacacca ccctgcgcgg 23520 ggaggcccgg cgcgactaca tccgcgactg cgtctacctc tacctctgcc acacctggca 23580 gacgggcatg ggcgtgtggc agcagtgtct ggaggagcag aacctgaaag agctctgcaa 23640 gctcctgcag aagaacctca agggtctgtg gaccgggttc gacgagcgca ccaccgcctc 23700 ggacctggcc gacctcattt tccccgagcg cctcaggctg acgctgcgca acggcctgcc 23760 cgactttatg agccaaagca tgttgcaaaa ctttcgctct ttcatcctcg aacgctccgg 23820 aatcctgccc gccacctgct ccgcgctgcc ctcggacttc gtgccgctga ccttccgcga 23880 gtgccccccg ccgctgtgga gccactgcta cctgctgcgc ctggccaact acctggccta 23940 ccactcggac gtgatcgagg acgtcagcgg cgagggcctg ctcgagtgcc actgccgctg 24000 caacctctgc acgccgcacc gctccctggc ctgcaacccc cagctgctga gcgagaccca 24060 gatcatcggc accttcgagt tgcaagggcc cagcgaaggc gagggttcag ccgccaaggg 24120 gggtctgaaa ctcaccccgg ggctgtggac ctcggcctac ttgcgcaagt tcgtgcccga 24180 ggactaccat cccttcgaga tcaggttcta cgaggaccaa tcccatccgc ccaaggccga 24240 gctgtcggcc tgcgtcatca cccagggggc gatcctggcc caattgcaag ccatccagaa 24300 atcccgccaa gaattcttgc tgaaaaaggg ccgcggggtc tacctcgacc cccagaccgg 24360 tgaggagctc aaccccggct tcccccagga tgccccgagg aaacaagaag ctgaaagtgg 24420 agctgccgcc cgtggaggat ttggaggaag actgggagaa cagcagtcag gcagaggagg 24480 aggagatgga ggaagactgg gacagcactc aggcagagga ggacagcctg caagacagtc 24540 tggaggaaga cgaggaggag gcagaggagg aggtggaaga agcagccgcc gccagaccgt 24600 cgtcctcggc gggggagaaa gcaagcagca cggataccat ctccgctccg ggtcggggtc 24660 ccgctcgacc acacagtaga tgggacgaga ccggacgatt cccgaacccc accacccaga 24720 ccggtaagaa ggagcggcag ggatacaagt cctggcgggg gcacaaaaac gccatcgtct 24780 cctgcttgca ggcctgcggg ggcaacatct ccttcacccg gcgctacctg ctcttccacc 24840 gcggggtgaa ctttccccgc aacatcttgc attactaccg tcacctccac agcccctact 24900 acttccaaga agaggcagca gcagcagaaa aagaccagca gaaaaccagc agctagaaaa 24960 tccacagcgg cggcagcagg tggactgagg atcgcggcga acgagccggc gcaaacccgg 25020 gagctgagga accggatctt tcccaccctc tatgccatct tccagcagag tcgggggcag 25080 gagcaggaac tgaaagtcaa gaaccgttct ctgcgctcgc tcacccgcag ttgtctgtat 25140 cacaagagcg aagaccaact tcagcgcact ctcgaggacg ccgaggctct cttcaacaag 25200 tactgcgcgc tcactcttaa agagtagccc gcgcccgccc agtcgcagaa aaaggcggga 25260 attacgtcac ctgtgccctt cgccctagcc gcctccaccc atcatcatga gcaaagagat 25320 tcccacgcct tacatgtgga gctaccagcc ccagatgggc ctggccgccg gtgccgccca 25380 ggactactcc acccgcatga attggctcag cgccgggccc gcgatgatct cacgggtgaa 25440 tgacatccgc gcccaccgaa accagatact cctagaacag tcagcgctca ccgccacgcc 25500 ccgcaatcac ctcaatccgc gtaattggcc cgccgccctg gtgtaccagg aaattcccca 25560 gcccacgacc gtactacttc cgcgagacgc ccaggccgaa gtccagctga ctaactcagg 25620 tgtccagctg gcgggcggcg ccaccctgtg tcgtcaccgc cccgctcagg gtataaagcg 25680 gctggtgatc cggggcagag gcacacagct caacgacgag gtggtgagct cttcgctggg 25740 tctgcgacct gacggagtct tccaactcgc cggatcgggg agatcttcct tcacgcctcg 25800 tcaggccgtc ctgactttgg agagttcgtc ctcgcagccc cgctcgggtg gcatcggcac 25860 tctccagttc gtggaggagt tcactccctc ggtctacttc aaccccttct ccggctcccc 25920 cggccactac ccggacgagt tcatcccgaa cttcgacgcc atcagcgagt cggtggacgg 25980 ctacgattga aactaatcac ccccttatcc agtgaaataa agatcatatt gatgatgatt 26040 ttacagaaat aaaaaataat catttgattt gaaataaaga tacaatcata ttgatgattt 26100 gagtttaaca aaaaaataaa gaatcactta cttgaaatct gataccaggt ctctgtccat 26160 gttttctgcc aacaccactt cactcccctc ttcccagctc tggtactgca ggccccggcg 26220 ggctgcaaac ttcctccaca cgctgaaggg gatgtcaaat tcctcctgtc cctcaatctt 26280 cattttatct tctatcagat gtccaaaaag cgcgtccggg tggatgatga cttcgacccc 26340 gtctacccct acgatgcaga caacgcaccg accgtgccct tcatcaaccc ccccttcgtc 26400 tcttcagatg gattccaaga gaagcccctg ggggtgttgt ccctgcgact ggccgacccc 26460 gtcaccacca agaacgggga aatcaccctc aagctgggag agggggtgga cctcgattcc 26520 tcgggaaaac tcatctccaa cacggccacc aaggccgccg cccctctcag tttttccaac 26580 aacaccattt cccttaacat ggatcacccc ttttacacta aagatggaaa attatcctta 26640 caagtttctc caccattaaa tatactgaga acaagcattc taaacacact agctttaggt 26700 tttggatcag gtttaggact ccgtggctct gccttggcag tacagttagt ctctccactt 26760 acatttgata ctgatggaaa cataaagctt accttagaca gaggtttgca tgttacaaca 26820 ggagatgcaa ttgaaagcaa cataagctgg gctaaaggtt taaaatttga agatggagcc 26880 atagcaacca acattggaaa tgggttagag tttggaagca gtagtacaga aacaggtgtt 26940 gatgatgctt acccaatcca agttaaactt ggatctggcc ttagctttga cagtacagga 27000 gccataatgg ctggtaacaa agaagacgat aaactcactt tgtggacaac acctgatcca 27060 tcaccaaact gtcaaatact cgcagaaaat gatgcaaaac taacactttg cttgactaaa 27120 tgtggtagtc aaatactggc cactgtgtca gtcttagttg taggaagtgg aaacctaaac 27180 cccattactg gcaccgtaag cagtgctcag gtgtttctac gttttgatgc aaacggtgtt 27240 cttttaacag aacattctac actaaaaaaa tactgggggt ataggcaggg agatagcata 27300 gatggcactc catataccaa tgctgtagga ttcatgccca atttaaaagc ttatccaaag 27360 tcacaaagtt ctactactaa aaataatata gtagggcaag tatacatgaa tggagatgtt 27420 tcaaaaccta tgcttctcac tataaccctc aatggtactg atgacagcaa cagtacatat 27480 tcaatgtcat tttcatacac ctggactaat ggaagctatg ttggagcaac atttggggct 27540 aactcttata ccttctcata catcgcccaa gaatgaacac tgtatcccac cctgcatgcc 27600 aacccttccc accccactct gtggaacaaa ctctgaaaca caaaataaaa taaagttcaa 27660 gtgttttatt gattcaacag ttttacagga ttcgagcagt tatttttcct ccaccctccc 27720 aggacatgga atacaccacc ctctcccccc gcacagcctt gaacatctga atgccattgg 27780 tgatggacat gcttttggtc tccacgttcc acacagtttc agagcgagcc agtctcgggt 27840 cggtcaggga gatgaaaccc tccgggcact cccgcatctg cacctcacag ctcaacagct 27900 gaggattgtc ctcggtggtc gggatcacgg ttatctggaa gaagcagaag agcggcggtg 27960 ggaatcatag tccgcgaacg ggatcggccg gtggtgtcgc atcaggcccc gcagcagtcg 28020 ctgccgccgc cgctccgtca agctgctgct cagggggtcc gggtccaggg actccctcag 28080 catgatgccc acggccctca gcatcagtcg tctggtgcgg cgggcgcagc agcgcatgcg 28140 gatctcgctc aggtcgctgc agtacgtgca acacagaacc accaggttgt tcaacagtcc 28200 atagttcaac acgctccagc cgaaactcat cgcgggaagg atgctaccca cgtggccgtc 28260 gtaccagatc ctcaggtaaa tcaagtggtg ccccctccag aacacgctgc ccacgtacat 28320 gatctccttg ggcatgtggc ggttcaccac ctcccggtac cacatcaccc tctggttgaa 28380 catgcagccc cggatgatcc tgcggaacca cagggccagc accgccccgc ccgccatgca 28440 gcgaagagac cccgggtccc ggcaatggca atggaggacc caccgctcgt acccgtggat 28500 catctgggag ctgaacaagt ctatgttggc acagcacagg catatgctca tgcatctctt 28560 cagcactctc aactcctcgg gggtcaaaac catatcccag ggcacgggga actcttgcag 28620 gacagcgaac cccgcagaac agggcaatcc tcgcacagaa cttacattgt gcatggacag 28680 ggtatcgcaa tcaggcagca ccgggtgatc ctccaccaga gaagcgcggg tctcggtctc 28740 ctcacagcgt ggtaaggggg ccggccgata cgggtgatgg cgggacgcgg ctgatcgtgt 28800 tcgcgaccgt gtcatgatgc agttgctttc ggacattttc gtacttgctg tagcagaacc 28860 tggtccgggc gctgcacacc gatcgccggc ggcggtctcg gcgcttggaa cgctcggtgt 28920 tgaaattgta aaacagccac tctctcagac cgtgcagcag atctagggcc tcaggagtga 28980 tgaagatccc atcatgcctg atggctctga tcacatcgac caccgtggaa tgggccagac 29040 ccagccagat gatgcaattt tgttgggttt cggtgacggc gggggaggga agaacaggaa 29100 gaaccatgat taacttttaa tccaaacggt ctcggagtac ttcaaaatga agatcgcgga 29160 gatggcacct ctcgcccccg ctgtgttggt ggaaaataac agccaggtca aaggtgatac 29220 ggttctcgag atgttccacg gtggcttcca gcaaagcctc cacgcgcaca tccagaaaca 29280 agacaatagc gaaagcggga gggttctcta attcctcaat catcatgtta cactcctgca 29340 ccatccccag ataattttca tttttccagc cttgaatgat tcgaactagt tcctgaggta 29400 aatccaagcc agccatgata aagagctcgc gcagagcgcc ctccaccggc attcttaagc 29460 acaccctcat aattccaaga tattctgctc ctggttcacc tgcagcagat tgacaagcgg 29520 aatatcaaaa tctctgccgc gatccctgag ctcctccctc agcaataact gtaagtactc 29580 tttcatatcc tctccgaaat ttttagccat aggaccacca ggaataagat tagggcaagc 29640 cacagtacag ataaaccgaa gtcctcccca gtgagcattg ccaaatgcaa gactgctata 29700 agcatgctgg ctagacccgg tgatatcttc cagataactg gacagaaaat cgcccaggca 29760 atttttaaga aaatcaacaa aagaaaaatc ctccaggtgg acgtttagag cctcgggaac 29820 aacgatgaag taaatgcaag cggtgcgttc cagcatggtt agttagctga tctgtagaaa 29880 aaacaaaaat gaacattaaa ccatgctagc ctggcgaaca ggtgggtaaa tcgttctctc 29940 cagcaccagg caggccacgg ggtctccggc gcgaccctcg taaaaattgt cgctatgatt 30000 gaaaaccatc acagagagac gttcccggtg gccggcgtga atgattcgac aagatgaata 30060 cacccccgga acattggcgt ccgcgagtga aaaaaagcgc ccgaggaagc aataaggcac 30120 tacaatgctc agtctcaagt ccagcaaagc gatgccatgc ggatgaagca caaaattctc 30180 aggtgcgtac aaaatgtaat tactcccctc ctgcacaggc agcaaagccc ccgatccctc 30240 caggtacaca tacaaagcct cagcgtccat agcttaccga gcagcagcac acaacaggcg 30300 caagagtcag agaaaggctg agctctaacc tgtccacccg ctctctgctc aatatatagc 30360 ccagatctac actgacgtaa aggccaaagt ctaaaaatac ccgccaaata atcacacacg 30420 cccagcacac gcccagaaac cggtgacaca ctcaaaaaaa tacgcgcact tcctcaaacg 30480 cccaaaactg ccgtcatttc cgggttccca cgctacgtca tcaaaacacg actttcaaat 30540 tccgtcgacc gttaaaaacg tcacccgccc cgcccctaac ggtcgcccgt ctctcagcca 30600 atcagcgccc cgcatcccca aattcaaaca cctcatttgc atattaacgc gcacaaaaag 30660 tttgaggtat attattgatg atgg 30684 <210> 14 <211> 8602 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 14 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gactctagaa tagtctttaa 7560 ttaaagtccg ccatatgagg ccaccatgca gatcttcgtg aagaccctga ccggcaagac 7620 catcacccta gaggtggagc ccagtgacac catcgagaac gtgaaggcca agatccagga 7680 taaagagggc atcccccctg accagcagag gctgatcttt gccggcaagc agctggaaga 7740 tggccgcacc ctctctgatt acaacatcca gaaggagtca accctgcacc tggtccttcg 7800 cctgagaggt ggcgctgctt acagtataat caactttgaa aaactggctg cttacggcat 7860 cctgggcttt gtgtttacac tggctgccta cctgctgttt ggctatcctg tgtacgtggc 7920 cgcttatgga ctgtgtaccc tggtggccat gctggctgct tacaatctgg tgcctatggt 7980 ggccacagtg gccgcctatt gtcttggcgg actgctgaca atggtggcag cctacagccc 8040 gagctatgcg tatcatcagt ttgcagccta cggcccagga ccaggcgcta aatttgtggc 8100 tgcctggaca ctgaaagccg ccgctggacc aggtcctgga cagtacatca aggccaacag 8160 caagttcatc ggcatcaccg aactcggccc aggaccaggc tatccctacg atgtgcctga 8220 ttacgcctga tagtgatgat tcgaacggcc gtatcacgcc caaacattta cagccgcggt 8280 gtcaaaaacc gcgtggacgt ggttaacatc cctgctggga ggatcagccg taattattat 8340 aattggcttg gtgctggcta ctattgtggc catgtacgtg ctgaccaacc agaaacataa 8400 ttgaatacag cagcaattgg caagctgctt acatagaact cgcggcgatt ggcatgccgc 8460 cttaaaattt ttattttatt ttttcttttc ttttccgaat cggattttgt ttttaatatt 8520 tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 8580 aaaaaaaaaa aaaaaaaaaa aa 8602 <210> 15 <211> 9595 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 15 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gactctagaa tagtctttaa 7560 ttaaagtccg ccatatgaga tggaagatgc caaaaacatt aagaagggcc cagcgccatt 7620 ctacccactc gaagacggga ccgccggcga gcagctgcac aaagccatga agcgctacgc 7680 cctggtgccc ggcaccatcg cctttaccga cgcacatatc gaggtggaca ttacctacgc 7740 cgagtacttc gagatgagcg ttcggctggc agaagctatg aagcgctatg ggctgaatac 7800 aaaccatcgg atcgtggtgt gcagcgagaa tagcttgcag ttcttcatgc ccgtgttggg 7860 tgccctgttc atcggtgtgg ctgtggcccc agctaacgac atctacaacg agcgcgagct 7920 gctgaacagc atgggcatca gccagcccac cgtcgtattc gtgagcaaga aagggctgca 7980 aaagatcctc aacgtgcaaa agaagctacc gatcatacaa aagatcatca tcatggatag 8040 caagaccgac taccagggct tccaaagcat gtacaccttc gtgacttccc atttgccacc 8100 cggcttcaac gagtacgact tcgtgcccga gagcttcgac cgggacaaaa ccatcgccct 8160 gatcatgaac agtagtggca gtaccggatt gcccaagggc gtagccctac cgcaccgcac 8220 cgcttgtgtc cgattcagtc atgcccgcga ccccatcttc ggcaaccaga tcatccccga 8280 caccgctatc ctcagcgtgg tgccatttca ccacggcttc ggcatgttca ccacgctggg 8340 ctacttgatc tgcggctttc gggtcgtgct catgtaccgc ttcgaggagg agctattctt 8400 gcgcagcttg caagactata agattcaatc tgccctgctg gtgcccacac tatttagctt 8460 cttcgctaag agcactctca tcgacaagta cgacctaagc aacttgcacg agatcgccag 8520 cggcggggcg ccgctcagca aggaggtagg tgaggccgtg gccaaacgct tccacctacc 8580 aggcatccgc cagggctacg gcctgacaga aacaaccagc gccattctga tcacccccga 8640 aggggacgac aagcctggcg cagtaggcaa ggtggtgccc ttcttcgagg ctaaggtggt 8700 ggacttggac accggtaaga cactgggtgt gaaccagcgc ggcgagctgt gcgtccgtgg 8760 ccccatgatc atgagcggct acgttaacaa ccccgaggct acaaacgctc tcatcgacaa 8820 ggacggctgg ctgcacagcg gcgacatcgc ctactgggac gaggacgagc acttcttcat 8880 cgtggaccgg ctgaagagcc tgatcaaata caagggctac caggtagccc cagccgaact 8940 ggagagcatc ctgctgcaac accccaacat cttcgacgcc ggggtcgccg gcctgcccga 9000 cgacgatgcc ggcgagctgc ccgccgcagt cgtcgtgctg gaacacggta aaaccatgac 9060 cgagaaggag atcgtggact atgtggccag ccaggttaca accgccaaga agctgcgcgg 9120 tggtgttgtg ttcgtggacg aggtgcctaa aggactgacc ggcaagttgg acgcccgcaa 9180 gatccgcgag attctcatta aggccaagaa gggcggcaag atcgccgtgt aattcgaacg 9240 gccgtatcac gcccaaacat ttacagccgc ggtgtcaaaa accgcgtgga cgtggttaac 9300 atccctgctg ggaggatcag ccgtaattat tataattggc ttggtgctgg ctactattgt 9360 ggccatgtac gtgctgacca accagaaaca taattgaata cagcagcaat tggcaagctg 9420 cttacataga actcgcggcg attggcatgc cgccttaaaa tttttatttt attttttctt 9480 ttcttttccg aatcggattt tgtttttaat atttcaaaaa aaaaaaaaaa aaaaaaaaaa 9540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 9595 <210> 16 <211> 139 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 16 Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys 1 5 10 15 Arg Ala Ser Gln Ser Ile Asn Ser Tyr Leu Asp Trp Tyr Gln Gln Lys 20 25 30 Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Ser Leu Gln 35 40 45 Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe 50 55 60 Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr 65 70 75 80 Cys Gln Gln Tyr Tyr Ser Thr Pro Phe Thr Phe Gly Pro Gly Thr Lys 85 90 95 Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro 100 105 110 Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu 115 120 125 Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val 130 135 <210> 17 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 17 Gly Val Val Gln Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser 1 5 10 15 Gly Phe Thr Phe Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro 20 25 30 Gly Lys Gly Leu Glu Trp Val Ala Val Ile Trp Tyr Asp Gly Ser Asn 35 40 45 Lys Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp 50 55 60 Asn Ser Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu 65 70 75 80 Asp Thr Ala Val Tyr Tyr Cys Ala Arg Asp Pro Arg Gly Ala Thr Leu 85 90 95 Tyr Tyr Tyr Tyr Tyr Gly Met Asp Val Trp Gly Gln Gly Thr Thr Val 100 105 110 Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala 115 120 125 Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu 130 135 140 Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly 145 150 155 160 Ala Leu Thr Ser Gly Val His 165 <210> 18 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 18 Gly Phe Thr Phe Ser Ser Tyr Gly Met His 1 5 10 <210> 19 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 19 Val Ile Trp Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala Asp Ser Val 1 5 10 15 <210> 20 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 20 Asp Pro Arg Gly Ala Thr Leu Tyr Tyr Tyr Tyr Tyr Gly Met Asp Val 1 5 10 15 <210> 21 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 21 Arg Ala Ser Gln Ser Ile Asn Ser Tyr Leu Asp 1 5 10 <210> 22 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 22 Ala Ala Ser Ser Leu Gln Ser 1 5 <210> 23 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 23 Gln Gln Tyr Tyr Ser Thr Pro Phe Thr 1 5 <210> 24 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 24 Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly 1 5 10 15 Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Arg Val Ser Ser Ser 20 25 30 Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu 35 40 45 Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser 50 55 60 Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu 65 70 75 80 Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Ser Leu Pro 85 90 95 Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 25 <211> 121 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 25 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Arg Tyr 20 25 30 Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Asn Ile Lys Gln Asp Gly Ser Glu Lys Tyr Tyr Val Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Glu Gly Gly Trp Phe Gly Glu Leu Ala Phe Asp Tyr Trp Gly 100 105 110 Gln Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 26 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 26 Arg Tyr Trp Met Ser 1 5 <210> 27 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 27 Asn Ile Lys Gln Asp Gly Ser Glu Lys Tyr Tyr Val Asp Ser Val Lys 1 5 10 15 Gly <210> 28 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 28 Glu Gly Gly Trp Phe Gly Glu Leu Ala Phe Asp Tyr 1 5 10 <210> 29 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 29 Arg Ala Ser Gln Arg Val Ser Ser Ser Tyr Leu Ala 1 5 10 <210> 30 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 30 Asp Ala Ser Ser Arg Ala Thr 1 5 <210> 31 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 31 Gln Gln Tyr Gly Ser Leu Pro Trp Thr 1 5 <210> 32 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 32 gcccgggcat ttaaatgcga tcgcatcgat tacgactcta gaatagtcta gtccgcaggc 60 caccatgcag atcttcgtga agaccctgac cggcaagacc atcaccctag aggtggagcc 120 cagtgacacc atcgagaacg tgaaggccaa gatccaggat aaagagggca tcccccctga 180 ccagcagagg ctgatctttg ccggcaagca gctggaagat ggccgcaccc tctctgatta 240 caacatccag aaggagtcaa ccctgcacct ggtccttcgc ctgagaggtg ccatgtttca 300 ggcgctgagc gaaggctgca ccccgtatga tattaaccag atgctgaacg tgctgggcga 360 tcatcaggtc tcaggccttg agcagcttga gagtataatc aactttgaaa aactgactga 420 atggaccagt tctaatgtta tgcctatcct gtctcctctg acaaagggca tcctgggctt 480 cgtgtttacc ctgaccgtgc cttctgagag aggacttagc tgcattagcg aagcggatgc 540 gaccaccccg gaaagcgcga acctgggcga agaaattctg agccagctgt atctttggcc 600 aagggtgacc taccattccc ctagttatgc ttaccaccaa tttgaaagac gagccaaata 660 taaaagacac ttccccggct ttggccagag cctgctgttt ggctaccctg tgtacgtgtt 720 cggcgattgc gtgcagggcg attgggatgc gattcgcttt cgctattgcg cgccgccggg 780 ctatgcgctg ctgcgctgca acgataccaa ctatagcgct ctgctggctg tgggggccct 840 agaaggaccc aggaatcagg actggcttgg tgtcccaaga caacttgtaa ctcggatgca 900 ggctattcag aatgccggcc tgtgtaccct ggtggccatg ctggaagaga caatcttctg 960 gctgcaagcg tttctgatgg cgctgaccga tagcggcccg aaaaccaaca ttattgtgga 1020 tagccagtat gtgatgggca ttagcaaacc gagctttcag gaatttgtgg attgggaaaa 1080 cgtgagcccg gaactgaaca gcaccgatca gccgttttgg caagccggaa tcctggccag 1140 aaatctggtg cctatggtgg ccacagtgca gggccagaac ctgaagtacc agggtcagtc 1200 actagtcatc tctgcttcta tcattgtctt caacctgctg gaactggaag gtgattatcg 1260 agatgatggc aacgtgtggg tgcatacccc gctgagcccg cgcaccctga acgcgtgggt 1320 gaaagcggtg gaagaaaaaa aaggtattcc agttcaccta gagctggcca gtatgaccaa 1380 catggagctc atgagcagta ttgtgcatca gcaggtcaga acatacggcc ccgtgttcat 1440 gtgtctcggc ggactgctta caatggtggc tggtgctgtg tggctgacag tgcgagtgct 1500 cgagctgttc cgggccgcgc agctggccaa cgacgtggtc ctccagatca tggagctttg 1560 tggtgcagcg tttcgccagg tgtgccatac caccgtgccg tggccgaacg cgagcctgac 1620 cccgaaatgg aacaacgaaa ccacccagcc ccagatcgcc aactgcagcg tgtatgactt 1680 ttttgtgtgg ctccattatt attctgttcg agacacactt tggccaaggg tgacctacca 1740 tatgaacaaa tatgcgtatc atatgctgga aagacgagcc aaatataaaa gaggaccagg 1800 acctggcgct aaatttgtgg ccgcctggac actgaaagcc gctgctggtc ctggacctgg 1860 ccagtacatc aaggccaaca gcaagttcat cggcatcacc gaactcggac ccggaccagg 1920 ctgatgattt cgaaatttaa ataagcttgc ggccgctagg gataacaggg taattatcac 1980 gcccaaacat ttacagccgc ggtgtcaaaa accgcgtgg 2019 <210> 33 <211> 619 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 33 Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu 1 5 10 15 Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp 20 25 30 Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys 35 40 45 Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu 50 55 60 Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Ala Met Phe Gln Ala 65 70 75 80 Leu Ser Glu Gly Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Asn Val 85 90 95 Leu Gly Asp His Gln Val Ser Gly Leu Glu Gln Leu Glu Ser Ile Ile 100 105 110 Asn Phe Glu Lys Leu Thr Glu Trp Thr Ser Ser Asn Val Met Pro Ile 115 120 125 Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe Thr Leu Thr 130 135 140 Val Pro Ser Glu Arg Gly Leu Ser Cys Ile Ser Glu Ala Asp Ala Thr 145 150 155 160 Thr Pro Glu Ser Ala Asn Leu Gly Glu Glu Ile Leu Ser Gln Leu Tyr 165 170 175 Leu Trp Pro Arg Val Thr Tyr His Ser Pro Ser Tyr Ala Tyr His Gln 180 185 190 Phe Glu Arg Arg Ala Lys Tyr Lys Arg His Phe Pro Gly Phe Gly Gln 195 200 205 Ser Leu Leu Phe Gly Tyr Pro Val Tyr Val Phe Gly Asp Cys Val Gln 210 215 220 Gly Asp Trp Asp Ala Ile Arg Phe Arg Tyr Cys Ala Pro Pro Gly Tyr 225 230 235 240 Ala Leu Leu Arg Cys Asn Asp Thr Asn Tyr Ser Ala Leu Leu Ala Val 245 250 255 Gly Ala Leu Glu Gly Pro Arg Asn Gln Asp Trp Leu Gly Val Pro Arg 260 265 270 Gln Leu Val Thr Arg Met Gln Ala Ile Gln Asn Ala Gly Leu Cys Thr 275 280 285 Leu Val Ala Met Leu Glu Glu Thr Ile Phe Trp Leu Gln Ala Phe Leu 290 295 300 Met Ala Leu Thr Asp Ser Gly Pro Lys Thr Asn Ile Ile Val Asp Ser 305 310 315 320 Gln Tyr Val Met Gly Ile Ser Lys Pro Ser Phe Gln Glu Phe Val Asp 325 330 335 Trp Glu Asn Val Ser Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Trp 340 345 350 Gln Ala Gly Ile Leu Ala Arg Asn Leu Val Pro Met Val Ala Thr Val 355 360 365 Gln Gly Gln Asn Leu Lys Tyr Gln Gly Gln Ser Leu Val Ile Ser Ala 370 375 380 Ser Ile Ile Val Phe Asn Leu Leu Glu Leu Glu Gly Asp Tyr Arg Asp 385 390 395 400 Asp Gly Asn Val Trp Val His Thr Pro Leu Ser Pro Arg Thr Leu Asn 405 410 415 Ala Trp Val Lys Ala Val Glu Glu Lys Lys Gly Ile Pro Val His Leu 420 425 430 Glu Leu Ala Ser Met Thr Asn Met Glu Leu Met Ser Ser Ile Val His 435 440 445 Gln Gln Val Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu 450 455 460 Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Arg Val Leu Glu 465 470 475 480 Leu Phe Arg Ala Ala Gln Leu Ala Asn Asp Val Val Leu Gln Ile Met 485 490 495 Glu Leu Cys Gly Ala Ala Phe Arg Gln Val Cys His Thr Thr Val Pro 500 505 510 Trp Pro Asn Ala Ser Leu Thr Pro Lys Trp Asn Asn Glu Thr Thr Gln 515 520 525 Pro Gln Ile Ala Asn Cys Ser Val Tyr Asp Phe Phe Val Trp Leu His 530 535 540 Tyr Tyr Ser Val Arg Asp Thr Leu Trp Pro Arg Val Thr Tyr His Met 545 550 555 560 Asn Lys Tyr Ala Tyr His Met Leu Glu Arg Arg Ala Lys Tyr Lys Arg 565 570 575 Gly Pro Gly Pro Gly Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala 580 585 590 Ala Ala Gly Pro Gly Pro Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe 595 600 605 Ile Gly Ile Thr Glu Leu Gly Pro Gly Pro Gly 610 615 <210> 34 <211> 1638 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 34 atggccggga tgttccaggc actgtccgaa ggctgcacac cctatgatat taaccagatg 60 ctgaatgtcc tgggagacca ccaggtctct ggcctggagc agctggagag catcatcaac 120 ttcgagaagc tgaccgagtg gacaagctcc aatgtgatgc ctatcctgtc cccactgacc 180 aagggcatcc tgggcttcgt gtttaccctg acagtgcctt ctgagcgggg cctgtcttgc 240 atcagcgagg cagacgcaac cacaccagag tccgccaatc tgggcgagga gatcctgtct 300 cagctgtacc tgtggccccg ggtgacatat cactcccctt cttacgccta tcaccagttc 360 gagcggagag ccaagtacaa gagacacttc ccaggctttg gccagtctct gctgttcggc 420 taccccgtgt acgtgttcgg cgattgcgtg cagggcgact gggatgccat ccggtttaga 480 tactgcgcac cacctggata tgcactgctg aggtgtaacg acaccaatta ttccgccctg 540 ctggcagtgg gcgccctgga gggccctcgc aatcaggatt ggctgggcgt gccaaggcag 600 ctggtgacac gcatgcaggc catccagaac gcaggcctgt gcaccctggt ggcaatgctg 660 gaggagacaa tcttctggct gcaggccttt ctgatggccc tgaccgacag cggccccaag 720 acaaacatca tcgtggattc ccagtacgtg atgggcatct ccaagccttc tttccaggag 780 tttgtggact gggagaacgt gagcccagag ctgaattcca ccgatcagcc attctggcag 840 gcaggaatcc tggcaaggaa cctggtgcct atggtggcca cagtgcaggg ccagaatctg 900 aagtaccagg gccagagcct ggtcatcagc gcctccatca tcgtgtttaa cctgctggag 960 ctggagggcg actatcggga cgatggcaac gtgtgggtgc acaccccact gagccccaga 1020 acactgaacg cctgggtgaa ggccgtggag gagaagaagg gcatcccagt gcacctggag 1080 ctggcctcca tgaccaatat ggagctgatg tctagcatcg tgcaccagca ggtgaggaca 1140 tacggacccg tgttcatgtg cctgggaggc ctgctgacca tggtggcagg agccgtgtgg 1200 ctgacagtgc gggtgctgga gctgttcaga gccgcccagc tggccaacga tgtggtgctg 1260 cagatcatgg agctgtgcgg agcagccttt cgccaggtgt gccacaccac agtgccatgg 1320 cccaatgcct ccctgacccc caagtggaac aatgagacaa cacagcctca gatcgccaac 1380 tgtagcgtgt acgacttctt cgtgtggctg cactactata gcgtgaggga taccctgtgg 1440 ccccgcgtga cataccacat gaataagtac gcctatcaca tgctggagag gcgcgccaag 1500 tataagagag gccctggccc aggcgcaaag tttgtggcag catggaccct gaaggccgcc 1560 gccggccccg gccccggcca gtatatcaag gctaacagta agttcattgg aatcacagag 1620 ctgggacccg gacctgga 1638 <210> 35 <211> 546 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 35 Met Ala Gly Met Phe Gln Ala Leu Ser Glu Gly Cys Thr Pro Tyr Asp 1 5 10 15 Ile Asn Gln Met Leu Asn Val Leu Gly Asp His Gln Val Ser Gly Leu 20 25 30 Glu Gln Leu Glu Ser Ile Ile Asn Phe Glu Lys Leu Thr Glu Trp Thr 35 40 45 Ser Ser Asn Val Met Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu 50 55 60 Gly Phe Val Phe Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Ser Cys 65 70 75 80 Ile Ser Glu Ala Asp Ala Thr Thr Pro Glu Ser Ala Asn Leu Gly Glu 85 90 95 Glu Ile Leu Ser Gln Leu Tyr Leu Trp Pro Arg Val Thr Tyr His Ser 100 105 110 Pro Ser Tyr Ala Tyr His Gln Phe Glu Arg Arg Ala Lys Tyr Lys Arg 115 120 125 His Phe Pro Gly Phe Gly Gln Ser Leu Leu Phe Gly Tyr Pro Val Tyr 130 135 140 Val Phe Gly Asp Cys Val Gln Gly Asp Trp Asp Ala Ile Arg Phe Arg 145 150 155 160 Tyr Cys Ala Pro Pro Gly Tyr Ala Leu Leu Arg Cys Asn Asp Thr Asn 165 170 175 Tyr Ser Ala Leu Leu Ala Val Gly Ala Leu Glu Gly Pro Arg Asn Gln 180 185 190 Asp Trp Leu Gly Val Pro Arg Gln Leu Val Thr Arg Met Gln Ala Ile 195 200 205 Gln Asn Ala Gly Leu Cys Thr Leu Val Ala Met Leu Glu Glu Thr Ile 210 215 220 Phe Trp Leu Gln Ala Phe Leu Met Ala Leu Thr Asp Ser Gly Pro Lys 225 230 235 240 Thr Asn Ile Ile Val Asp Ser Gln Tyr Val Met Gly Ile Ser Lys Pro 245 250 255 Ser Phe Gln Glu Phe Val Asp Trp Glu Asn Val Ser Pro Glu Leu Asn 260 265 270 Ser Thr Asp Gln Pro Phe Trp Gln Ala Gly Ile Leu Ala Arg Asn Leu 275 280 285 Val Pro Met Val Ala Thr Val Gln Gly Gln Asn Leu Lys Tyr Gln Gly 290 295 300 Gln Ser Leu Val Ile Ser Ala Ser Ile Ile Val Phe Asn Leu Leu Glu 305 310 315 320 Leu Glu Gly Asp Tyr Arg Asp Asp Gly Asn Val Trp Val His Thr Pro 325 330 335 Leu Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Ala Val Glu Glu Lys 340 345 350 Lys Gly Ile Pro Val His Leu Glu Leu Ala Ser Met Thr Asn Met Glu 355 360 365 Leu Met Ser Ser Ile Val His Gln Gln Val Arg Thr Tyr Gly Pro Val 370 375 380 Phe Met Cys Leu Gly Gly Leu Leu Thr Met Val Ala Gly Ala Val Trp 385 390 395 400 Leu Thr Val Arg Val Leu Glu Leu Phe Arg Ala Ala Gln Leu Ala Asn 405 410 415 Asp Val Val Leu Gln Ile Met Glu Leu Cys Gly Ala Ala Phe Arg Gln 420 425 430 Val Cys His Thr Thr Val Pro Trp Pro Asn Ala Ser Leu Thr Pro Lys 435 440 445 Trp Asn Asn Glu Thr Thr Gln Pro Gln Ile Ala Asn Cys Ser Val Tyr 450 455 460 Asp Phe Phe Val Trp Leu His Tyr Tyr Ser Val Arg Asp Thr Leu Trp 465 470 475 480 Pro Arg Val Thr Tyr His Met Asn Lys Tyr Ala Tyr His Met Leu Glu 485 490 495 Arg Arg Ala Lys Tyr Lys Arg Gly Pro Gly Pro Gly Ala Lys Phe Val 500 505 510 Ala Ala Trp Thr Leu Lys Ala Ala Ala Gly Pro Gly Pro Gly Gln Tyr 515 520 525 Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu Gly Pro Gly 530 535 540 Pro Gly 545 <210> 36 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 36 gcccgggcat ttaaatgcga tcgcatcgat tacgactcta gaatagtcta gtccgcaggc 60 caccatgcag atcttcgtga agaccctgac cggcaagacc atcaccctag aggtggagcc 120 cagtgacacc atcgagaacg tgaaggccaa gatccaggat aaagagggca tcccccctga 180 ccagcagagg ctgatctttg ccggcaagca gctggaagat ggccgcaccc tctctgatta 240 caacatccag aaggagtcaa ccctgcacct ggtccttcgc ctgagaggtg ccatgtttca 300 ggcgctgagc gaaggctgca ccccgtatga tattaaccag atgctgaacg tgctgggcga 360 tcatcagttt aagcacatca aagcctttga ccggacattt gctaacaacc caggtcccat 420 ggttgtgttt gccacacctg ggcctatcct gtctcctctg acaaagggca tcctgggctt 480 cgtgtttacc ctgaccgtgc cttctgagag aggacttagc tgcattagcg aagcggatgc 540 gaccaccccg gaaagcgcga acctgggcga agaaattctg agccagctgt atctttggcc 600 aagggtgacc taccattccc ctagttatgc ttaccaccaa tttgaaagac gagccaaata 660 taaaagacac ttccccggct ttggccagag cctgctgttt ggctaccctg tgtacgtgtt 720 cggcgattgc gtgcagggcg attgggatgc gattcgcttt cgctattgcg cgccgccggg 780 ctatgcgctg ctgcgctgca acgataccaa ctatagcgct ctgctggctg tgggggccct 840 agaaggaccc aggaatcagg actggcttgg tgtcccaaga caacttgtaa ctcggatgca 900 ggctattcag aatgccggcc tgtgtaccct ggtggccatg ctggaagaga caatcttctg 960 gctgcaagcg tttctgatgg cgctgaccga tagcggcccg aaaaccaaca ttattgtgga 1020 tagccagtat gtgatgggca ttagcaaacc gagctttcag gaatttgtgg attgggaaaa 1080 cgtgagcccg gaactgaaca gcaccgatca gccgttttgg caagccggaa tcctggccag 1140 aaatctggtg cctatggtgg ccacagtgca gggccagaac ctgaagtacc agggtcagtc 1200 actagtcatc tctgcttcta tcattgtctt caacctgctg gaactggaag gtgattatcg 1260 agatgatggc aacgtgtggg tgcatacccc gctgagcccg cgcaccctga acgcgtgggt 1320 gaaagcggtg gaagaaaaaa aaggtattcc agttcaccta gagctggcca gtatgaccaa 1380 catggagctc atgagcagta ttgtgcatca gcaggtcaga acatacggcc ccgtgttcat 1440 gtgtctcggc ggactgctta caatggtggc tggtgctgtg tggctgacag tgcgagtgct 1500 cgagctgttc cgggccgcgc agctggccaa cgacgtggtc ctccagatca tggagctttg 1560 tggtgcagcg tttcgccagg tgtgccatac caccgtgccg tggccgaacg cgagcctgac 1620 cccgaaatgg aacaacgaaa ccacccagcc ccagatcgcc aactgcagcg tgtatgactt 1680 ttttgtgtgg ctccattatt attctgttcg agacacactt tggccaaggg tgacctacca 1740 tatgaacaaa tatgcgtatc atatgctgga aagacgagcc aaatataaaa gaggaccagg 1800 acctggcgct aaatttgtgg ccgcctggac actgaaagcc gctgctggtc ctggacctgg 1860 ccagtacatc aaggccaaca gcaagttcat cggcatcacc gaactcggac ccggaccagg 1920 ctgatgattt cgaaatttaa ataagcttgc ggccgctagg gataacaggg taattatcac 1980 gcccaaacat ttacagccgc ggtgtcaaaa accgcgtgg 2019 <210> 37 <211> 619 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 37 Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu 1 5 10 15 Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp 20 25 30 Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys 35 40 45 Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu 50 55 60 Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Ala Met Phe Gln Ala 65 70 75 80 Leu Ser Glu Gly Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Asn Val 85 90 95 Leu Gly Asp His Gln Phe Lys His Ile Lys Ala Phe Asp Arg Thr Phe 100 105 110 Ala Asn Asn Pro Gly Pro Met Val Val Phe Ala Thr Pro Gly Pro Ile 115 120 125 Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe Thr Leu Thr 130 135 140 Val Pro Ser Glu Arg Gly Leu Ser Cys Ile Ser Glu Ala Asp Ala Thr 145 150 155 160 Thr Pro Glu Ser Ala Asn Leu Gly Glu Glu Ile Leu Ser Gln Leu Tyr 165 170 175 Leu Trp Pro Arg Val Thr Tyr His Ser Pro Ser Tyr Ala Tyr His Gln 180 185 190 Phe Glu Arg Arg Ala Lys Tyr Lys Arg His Phe Pro Gly Phe Gly Gln 195 200 205 Ser Leu Leu Phe Gly Tyr Pro Val Tyr Val Phe Gly Asp Cys Val Gln 210 215 220 Gly Asp Trp Asp Ala Ile Arg Phe Arg Tyr Cys Ala Pro Pro Gly Tyr 225 230 235 240 Ala Leu Leu Arg Cys Asn Asp Thr Asn Tyr Ser Ala Leu Leu Ala Val 245 250 255 Gly Ala Leu Glu Gly Pro Arg Asn Gln Asp Trp Leu Gly Val Pro Arg 260 265 270 Gln Leu Val Thr Arg Met Gln Ala Ile Gln Asn Ala Gly Leu Cys Thr 275 280 285 Leu Val Ala Met Leu Glu Glu Thr Ile Phe Trp Leu Gln Ala Phe Leu 290 295 300 Met Ala Leu Thr Asp Ser Gly Pro Lys Thr Asn Ile Ile Val Asp Ser 305 310 315 320 Gln Tyr Val Met Gly Ile Ser Lys Pro Ser Phe Gln Glu Phe Val Asp 325 330 335 Trp Glu Asn Val Ser Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Trp 340 345 350 Gln Ala Gly Ile Leu Ala Arg Asn Leu Val Pro Met Val Ala Thr Val 355 360 365 Gln Gly Gln Asn Leu Lys Tyr Gln Gly Gln Ser Leu Val Ile Ser Ala 370 375 380 Ser Ile Ile Val Phe Asn Leu Leu Glu Leu Glu Gly Asp Tyr Arg Asp 385 390 395 400 Asp Gly Asn Val Trp Val His Thr Pro Leu Ser Pro Arg Thr Leu Asn 405 410 415 Ala Trp Val Lys Ala Val Glu Glu Lys Lys Gly Ile Pro Val His Leu 420 425 430 Glu Leu Ala Ser Met Thr Asn Met Glu Leu Met Ser Ser Ile Val His 435 440 445 Gln Gln Val Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu 450 455 460 Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Arg Val Leu Glu 465 470 475 480 Leu Phe Arg Ala Ala Gln Leu Ala Asn Asp Val Val Leu Gln Ile Met 485 490 495 Glu Leu Cys Gly Ala Ala Phe Arg Gln Val Cys His Thr Thr Val Pro 500 505 510 Trp Pro Asn Ala Ser Leu Thr Pro Lys Trp Asn Asn Glu Thr Thr Gln 515 520 525 Pro Gln Ile Ala Asn Cys Ser Val Tyr Asp Phe Phe Val Trp Leu His 530 535 540 Tyr Tyr Ser Val Arg Asp Thr Leu Trp Pro Arg Val Thr Tyr His Met 545 550 555 560 Asn Lys Tyr Ala Tyr His Met Leu Glu Arg Arg Ala Lys Tyr Lys Arg 565 570 575 Gly Pro Gly Pro Gly Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala 580 585 590 Ala Ala Gly Pro Gly Pro Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe 595 600 605 Ile Gly Ile Thr Glu Leu Gly Pro Gly Pro Gly 610 615 <210> 38 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 38 atgcagatct tcgtgaagac cctgaccggc aagaccatca ccctagaggt ggagcccagt 60 gacaccatcg agaacgtgaa ggccaagatc caggataaag agggcatccc ccctgaccag 120 cagaggctga tctttgccgg caagcagctg gaagatggcc gcaccctctc tgattacaac 180 atccagaagg agtcaaccct gcacctggtc cttcgcctga gaggtggc 228 <210> 39 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 39 atgcagatct tcgtgaagac cctgaccggc aagaccatca ccctagaggt ggagcccagt 60 gacaccatcg agaacgtgaa ggccaagatc caggataaag agggcatccc ccctgaccag 120 cagaggctga tctttgccgg caagcagctg gaagatggcc gcaccctctc tgattacaac 180 atccagaagg agtcaaccct gcacctggtc cttcgcctga gaggtgcc 228 <210> 40 <211> 78 <212> DNA <213> Homo sapiens <400> 40 atggccgtca tggcgccccg aaccctcgtc ctgctactct cgggggctct ggccctgacc 60 cagacctggg cgggctct 78 <210> 41 <211> 201 <212> DNA <213> Homo sapiens <400> 41 ccgtcttccc agcccaccat ccccatcgtg ggcatcattg ctggcctggt tctctttgga 60 gctgtgatca ctggagctgt ggtcgctgct gtgatgtgga ggaggaagag ctcagataga 120 aaaggaggga gctactctca ggctgcaagc agtgacagtg cccagggctc tgatgtgtct 180 ctcacagctt gtaaagtgtg a 201 <210> 42 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 42 atggagaccg atacactgct gctgtgggtg ctgctcctgt gggtgccagg aagcacaggc 60 <210> 43 <211> 3178 <212> DNA <213> Homo sapiens <400> 43 ggcaccgatt cggggcctgc ccggacttcg ccgcacgctg cagaacctcg cccagcgccc 60 accatgcccc ggcagctcag cgcggcggcc gcgctcttcg cgtccctggc cgtaattttg 120 cacgatggca gtcaaatgag agcaaaagca tttccagaaa ccagagatta ttctcaacct 180 actgcagcag caacagtaca ggacataaaa aaacctgtcc agcaaccagc taagcaagca 240 cctcaccaaa ctttagcagc aagattcatg gatggtcata tcacctttca aacagcggcc 300 acagtaaaaa ttccaacaac taccccagca actacaaaaa acactgcaac caccagccca 360 attacctaca ccctggtcac aacccaggcc acacccaaca actcacacac agctcctcca 420 gttactgaag ttacagtcgg ccctagctta gccccttatt cactgccacc caccatcacc 480 ccaccagctc atacagctgg aaccagttca tcaaccgtca gccacacaac tgggaacacc 540 actcaaccca gtaaccagac cacccttcca gcaactttat cgatagcact gcacaaaagc 600 acaaccggtc agaagcctga tcaacccacc catgccccag gaacaacggc agctgcccac 660 aataccaccc gcacagctgc acctgcctcc acggttcctg ggcccaccct tgcacctcag 720 ccatcgtcag tcaagactgg aatttatcag gttctaaacg gaagcagact ctgtataaaa 780 gcagagatgg ggatacagct gattgttcaa gacaaggagt cggttttttc acctcggaga 840 tacttcaaca tcgaccccaa cgcaacgcaa gcctctggga actgtggcac ccgaaaatcc 900 aaccttctgt tgaattttca gggcggattt gtgaatctca catttaccaa ggatgaagaa 960 tcatattata tcagtgaagt gggagcctat ttgaccgtct cagatccaga gacagtttac 1020 caaggaatca aacatgcggt ggtgatgttc cagacagcag tcgggcattc cttcaagtgc 1080 gtgagtgaac agagcctcca gttgtcagcc cacctgcagg tgaaaacaac cgatgtccaa 1140 cttcaagcct ttgattttga agatgaccac tttggaaatg tggatgagtg ctcgtctgac 1200 tacacaattg tgcttcctgt gattggggcc atcgtggttg gtctctgcct tatgggtatg 1260 ggtgtctata aaatccgcct aaggtgtcaa tcatctggat accagagaat ctaattgttg 1320 cccgggggga atgaaaataa tggaatttag agaactcttt catcccttcc aggatggatg 1380 ttgggaaatt ccctcagagt gtgggtcctt caaacaatgt aaaccaccat cttctattca 1440 aatgaagtga gtcatgtgtg atttaagttc aggcagcaca tcaatttcta aatacttttt 1500 gtttatttta tgaaagatat agtgagctgt ttattttcta gtttccttta gaatatttta 1560 gccactcaaa gtcaacattt gagatatgtt gaattaacat aatatatgta aagtagaata 1620 agccttcaaa ttataaacca agggtcaatt gtaactaata ctactgtgtg tgcattgaag 1680 attttatttt acccttgatc ttaacaaagc ctttgctttg ttatcaaatg gactttcagt 1740 gcttttacta tctgtgtttt atggtttcat gtaacataca tattcctggt gtagcactta 1800 actccttttc cactttaaat ttgtttttgt tttttgagac ggagtttcac tcttgtcacc 1860 caggctggag tacagtggca cgatctcggc ttatggcaac ctccgcctcc cgggttcaag 1920 tgattctcct gcttcagctt cccgagtagc tgggattaca ggcacacact accacgcctg 1980 gctaattttt gtatttttat tatagacggg tttcaccatg ttggccagac tggtcttgaa 2040 ctcttgacct caggtgatcc acccacctca gcctcccaaa gtgctgggat tacaggcatg 2100 agccattgcg cccggcctta aatgtttttt ttaatcatca aaaagaacaa catatctcag 2160 gttgtctaag tgtttttatg taaaaccaac aaaaagaaca aatcagctta tattttttat 2220 cttgatgact cctgctccag aattgctaga ctaagaatta ggtggctaca gatggtagaa 2280 ctaaacaata agcaagagac aataataatg gcccttaatt attaacaaag tgccagagtc 2340 taggctaagc actttatcta tatctcattt cattctcaca acttataagt gaatgagtaa 2400 actgagactt aagggaactg aatcacttaa atgtcacctg gctaactgat ggcagagcca 2460 gagcttgaat tcatgttggt ctgacatcaa ggtctttggt cttctcccta caccaagtta 2520 cctacaagaa caatgacacc acactctgcc tgaaggctca cacctcatac cagcatacgc 2580 tcaccttaca gggaaatggg tttatccagg atcatgagac attagggtag atgaaaggag 2640 agctttgcag ataacaaaat agcctatcct taataaatcc tccactctct ggaaggagac 2700 tgaggggctt tgtaaaacat tagtcagttg ctcattttta tgggattgct tagctgggct 2760 gtaaagatga aggcatcaaa taaactcaaa gtatttttaa atttttttga taatagagaa 2820 acttcgctaa ccaactgttc tttcttgagt gtatagcccc atcttgtggt aacttgctgc 2880 ttctgcactt catatccata tttcctattg ttcactttat tctgtagagc agcctgccaa 2940 gaattttatt tctgctgttt tttttgctgc taaagaaagg aactaagtca ggatgttaac 3000 agaaaagtcc acataaccct agaattctta gtcaaggaat aattcaagtc agcctagaga 3060 ccatgttgac tttcctcatg tgtttcctta tgactcagta agttggcaag gtcctgactt 3120 tagtcttaat aaaacattga attgtagtaa aggtttttgc aataaaaact tactttgg 3178 <210> 44 <211> 1858 <212> DNA <213> Mus sp. <400> 44 attccggagg tgaaaaacaa tggcacaacg tgtataatgg ccagcttctc tgcctccttt 60 ctgaccacct acgagactgc gaatggttct cagatcgtga acatttccct gccagcctct 120 gcagaagtac tgaaaaatgg cagttcttgt ggtaaagaaa atgtttctga ccccagcctc 180 acaattactt ttggaagagg atatttactg acactcaact tcacaaaaaa tacaacacgt 240 tacagtgtcc agcatatgta ttttacatat aacttgtcag atacagaaca ttttcccaat 300 gccatcagca aagagatcta caccatggat tccacaactg acatcaaggc agacatcaac 360 aaagcatacc ggtgtgtcag tgatatccgg gtctacatga agaatgtgac cgttgtgctc 420 cgggatgcca ctatccaggc ctacctgtcg agtggcaact tcagcaagga agagacacac 480 tgcacacagg atggaccttc cccaaccact gggccaccca gcccctcacc accacttgtg 540 cccacaaacc ccactgtatc caagtacaat gttactggta acaacggaac ctgcctgctg 600 gcctctatgg cactgcaact gaatatcacc tacctgaaaa aggacaacaa gacggtgacc 660 agagcgttca acatcagccc aaatgacaca tctagtggga gttgcggtat caacttggtg 720 accctgaaag tggagaacaa gaacagagcc ctggaattgc agtttgggat gaatgccagc 780 tctagcctgt ttttcttgca aggagtgcgc ttgaatatga ctcttcctga tgccctagtg 840 cccacattca gcatctccaa ccattcactg aaagctcttc aggccactgt gggaaactca 900 tacaagtgca acactgagga acacatcttt gtcagcaaga tgctctccct caatgtcttc 960 agtgtgcagg tccaggcttt caaggtggac agtgacaggt ttgggtctgt ggaagagtgt 1020 gttcaggatg gtaacaacat gttgatcccc attgctgtgg gcggtgccct ggcagggctg 1080 atcctcatcg tcctcattgc ctacctcatt ggcaggaaga ggagtcacgc cggctatcag 1140 accatctagc ctggtgggca ggtgcaccag agatgcacag gggcctgttc tcacatcccc 1200 aagcttagat aggtgtggaa gggaggcaca ctttctggca aactgtttta aaatctgctt 1260 tatcaaatgt gaagttcatc ttgcaacatt tactatgcac aaaggaataa ctattgaaat 1320 gacggtgtta attttgctaa ctgggttaaa tattgatgag aaggctccac tgatttgact 1380 tttaagactt ggtgtttggt tcttcattct tttactcaga tttaagccta tcaaagggat 1440 actctggtcc agaccttggc ctggcaaggg tggctgatgg ttaggctgca cacacttaag 1500 aagcaacggg agcagggaag gcttgcacac aggcacgcac agggtcaacc tctggacact 1560 tggcttgggc tacctggcct tgggggggct gaactctggc atctggctgg gtacacaccc 1620 ccccaatttc tgtgctctgc cacccgtgag ctgccacttt cctaaataga aaatggcatt 1680 atttttattt acttttttgt aaagtgattt ccagtcttgt gttggcgttc agggtggccc 1740 tgtctctgca ctgtgtacaa taatagattc acactgctga cgtgtcttgc agcgtaggtg 1800 ggttgtacac tgggcatcag ctcacgtaat gcattgcctg taacgatgct aataaaaa 1858 <210> 45 <211> 2339 <212> DNA <213> Homo sapiens <400> 45 ggcccaaccg ccgcccgcgc ccccgctctc cgcaccgtac ccggccgcct cgcgccatgg 60 cggcccccgg cagcgcccgg cgacccctgc tgctgctact gctgttgctg ctgctcggcc 120 tcatgcattg tgcgtcagca gcaatgttta tggtgaaaaa tggcaacggg accgcgtgca 180 taatggccaa cttctctgct gccttctcag tgaactacga caccaagagt ggccctaaga 240 acatgacctt tgacctgcca tcagatgcca cagtggtgct caaccgcagc tcctgtggaa 300 aagagaacac ttctgacccc agtctcgtga ttgcttttgg aagaggacat acactcactc 360 tcaatttcac gagaaatgca acacgttaca gcgtccagct catgagtttt gtttataact 420 tgtcagacac acaccttttc cccaatgcga gctccaaaga aatcaagact gtggaatcta 480 taactgacat cagggcagat atagataaaa aatacagatg tgttagtggc acccaggtcc 540 acatgaacaa cgtgaccgta acgctccatg atgccaccat ccaggcgtac ctttccaaca 600 gcagcttcag caggggagag acacgctgtg aacaagacag gccttcccca accacagcgc 660 cccctgcgcc acccagcccc tcgccctcac ccgtgcccaa gagcccctct gtggacaagt 720 acaacgtgag cggcaccaac gggacctgcc tgctggccag catggggctg cagctgaacc 780 tcacctatga gaggaaggac aacacgacgg tgacaaggct tctcaacatc aaccccaaca 840 agacctcggc cagcgggagc tgcggcgccc acctggtgac tctggagctg cacagcgagg 900 gcaccaccgt cctgctcttc cagttcggga tgaatgcaag ttctagccgg tttttcctac 960 aaggaatcca gttgaataca attcttcctg acgccagaga ccctgccttt aaagctgcca 1020 acggctccct gcgagcgctg caggccacag tcggcaattc ctacaagtgc aacgcggagg 1080 agcacgtccg tgtcacgaag gcgttttcag tcaatatatt caaagtgtgg gtccaggctt 1140 tcaaggtgga aggtggccag tttggctctg tggaggagtg tctgctggac gagaacagca 1200 tgctgatccc catcgctgtg ggtggtgccc tggcggggct ggtcctcatc gtcctcatcg 1260 cctacctcgt cggcaggaag aggagtcacg caggctacca gactatctag cctggtgcac 1320 gcaggcacag cagctgcagg ggcctctgtt cctttctctg ggcttagggt cctgtcgaag 1380 gggaggcaca ctttctggca aacgtttctc aaatctgctt catccaatgt gaagttcatc 1440 ttgcagcatt tactatgcac aacagagtaa ctatcgaaat gacggtgtta attttgctaa 1500 ctgggttaaa tattttgcta actggttaaa cattaatatt taccaaagta ggattttgag 1560 ggtgggggtg ctctctctga gggggtgggg gtgccgctgt ctctgagggg tgggggtgcc 1620 gctgtctctg aggggtgggg gtgccgctct ctctgagggg gtgggggtgc cgctttctct 1680 gagggggtgg gggtgccgct ctctctgagg gggtgggggt gctgctctct ccgaggggtg 1740 gaatgccgct gtctctgagg ggtgggggtg ccgctctaaa ttggctccat atcatttgag 1800 tttagggttc tggtgtttgg tttcttcatt ctttactgca ctcagattta agccttacaa 1860 agggaaagcc tctggccgtc acacgtagga cgcatgaagg tcactcgtgg tgaggctgac 1920 atgctcacac attacaacag tagagaggga aaatcctaag acagaggaac tccagagatg 1980 agtgtctgga gcgcttcagt tcagctttaa aggccaggac gggccacacg tggctggcgg 2040 cctcgttcca gtggcggcac gtccttgggc gtctctaatg tctgcagctc aagggctggc 2100 acttttttaa atataaaaat gggtgttatt tttatttttt tttgtaaagt gatttttggt 2160 cttctgttga cattcggggt gatcctgttc tgcgctgtgt acaatgtgag atcggtgcgt 2220 tctcctgatg ttttgccgtg gcttggggat tgtacacggg accagctcac gtaatgcatt 2280 gcctgtaaca atgtaataaa aagcctcttt cttttaaaaa aaaaaaaaaa aaaaaaaaa 2339 <210> 46 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 46 cagtacatca aggccaacag caagttcatc ggcatcaccg aactc 45 <210> 47 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 47 Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu 1 5 10 15 <210> 48 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 48 gctaaatttg tggctgcctg gacactgaaa gccgccgct 39 <210> 49 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 49 Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala 1 5 10 <210> 50 <211> 593 <212> DNA <213> Woodchuck hepatitis virus <400> 50 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tgt 593 <210> 51 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 51 tctccccccc ccccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa 60 taaggccggt gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat 120 gtgagggccc ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct 180 ctcgccaaag gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct 240 tcttgaagac aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc 300 gacaggtgcc tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa 360 ccccagtgcc acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc 420 gtattcaaca aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg 480 gggcctcggt gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc 540 ccgaaccacg gggacgtggt tttcctttga aaaacacgat gataatatg 589 <210> 52 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 52 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480 ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtag 720 <210> 53 <211> 1563 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 53 atgctgctgc tgctgctgct gctgggcctg aggctacagc tctccctggg catcatccca 60 gttgaggagg agaacccgga cttctggaac cgcgaggcag ccgaggccct gggtgccgcc 120 aagaagctgc agcctgcaca gacagccgcc aagaacctca tcatcttcct gggcgatggg 180 atgggggtgt ctacggtgac agctgccagg atcctaaaag ggcagaagaa ggacaaactg 240 gggcctgaga tacccctggc catggaccgc ttcccatatg tggctctgtc caagacatac 300 aatgtagaca aacatgtgcc agacagtgga gccacagcca cggcctacct gtgcggggtc 360 aagggcaact tccagaccat tggcttgagt gcagccgccc gctttaacca gtgcaacacg 420 acacgcggca acgaggtcat ctccgtgatg aatcgggcca agaaagcagg gaagtcagtg 480 ggagtggtaa ccaccacacg agtgcagcac gcctcgccag ccggcaccta cgcccacacg 540 gtgaaccgca actggtactc ggacgccgac gtgcctgcct cggcccgcca ggaggggtgc 600 caggacatcg ctacgcagct catctccaac atggacattg acgtgatcct aggtggaggc 660 cgaaagtaca tgtttcgcat gggaacccca gaccctgagt acccagatga ctacagccaa 720 ggtgggacca ggctggacgg gaagaatctg gtgcaggaat ggctggcgaa gcgccagggt 780 gcccggtatg tgtggaaccg cactgagctc atgcaggctt ccctggaccc gtctgtgacc 840 catctcatgg gtctctttga gcctggagac atgaaatacg agatccaccg agactccaca 900 ctggacccct ccctgatgga gatgacagag gctgccctgc gcctgctgag caggaacccc 960 cgcggcttct tcctcttcgt ggagggtggt cgcatcgacc atggtcatca tgaaagcagg 1020 gcttaccggg cactgactga gacgatcatg ttcgacgacg ccattgagag ggcgggccag 1080 ctcaccagcg aggaggacac gctgagcctc gtcactgccg accactccca cgtcttctcc 1140 ttcggaggct accccctgcg agggagctcc atcttcgggc tggcccctgg caaggcccgg 1200 gacaggaagg cctacacggt cctcctatac ggaaacggtc caggctatgt gctcaaggac 1260 ggcgcccggc cggatgttac cgagagcgag agcgggagcc ccgagtatcg gcagcagtca 1320 gcagtgcccc tggacgaaga gacccacgca ggcgaggacg tggcggtgtt cgcgcgcggc 1380 ccgcaggcgc acctggttca cggcgtgcag gagcagacct tcatagcgca cgtcatggcc 1440 ttcgccgcct gcctggagcc ctacaccgcc tgcgacctgg cgccccccgc cggcaccacc 1500 gacgccgcgc acccgggtta ctctagagtc ggggcggccg gccgcttcga gcagacatga 1560 taa 1563 <210> 54 <211> 1653 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 54 atggaagatg ccaaaaacat taagaagggc ccagcgccat tctacccact cgaagacggg 60 accgccggcg agcagctgca caaagccatg aagcgctacg ccctggtgcc cggcaccatc 120 gcctttaccg acgcacatat cgaggtggac attacctacg ccgagtactt cgagatgagc 180 gttcggctgg cagaagctat gaagcgctat gggctgaata caaaccatcg gatcgtggtg 240 tgcagcgaga atagcttgca gttcttcatg cccgtgttgg gtgccctgtt catcggtgtg 300 gctgtggccc cagctaacga catctacaac gagcgcgagc tgctgaacag catgggcatc 360 agccagccca ccgtcgtatt cgtgagcaag aaagggctgc aaaagatcct caacgtgcaa 420 aagaagctac cgatcataca aaagatcatc atcatggata gcaagaccga ctaccagggc 480 ttccaaagca tgtacacctt cgtgacttcc catttgccac ccggcttcaa cgagtacgac 540 ttcgtgcccg agagcttcga ccgggacaaa accatcgccc tgatcatgaa cagtagtggc 600 agtaccggat tgcccaaggg cgtagcccta ccgcaccgca ccgcttgtgt ccgattcagt 660 catgcccgcg accccatctt cggcaaccag atcatccccg acaccgctat cctcagcgtg 720 gtgccatttc accacggctt cggcatgttc accacgctgg gctacttgat ctgcggcttt 780 cgggtcgtgc tcatgtaccg cttcgaggag gagctattct tgcgcagctt gcaagactat 840 aagattcaat ctgccctgct ggtgcccaca ctatttagct tcttcgctaa gagcactctc 900 atcgacaagt acgacctaag caacttgcac gagatcgcca gcggcggggc gccgctcagc 960 aaggaggtag gtgaggccgt ggccaaacgc ttccacctac caggcatccg ccagggctac 1020 ggcctgacag aaacaaccag cgccattctg atcacccccg aaggggacga caagcctggc 1080 gcagtaggca aggtggtgcc cttcttcgag gctaaggtgg tggacttgga caccggtaag 1140 acactgggtg tgaaccagcg cggcgagctg tgcgtccgtg gccccatgat catgagcggc 1200 tacgttaaca accccgaggc tacaaacgct ctcatcgaca aggacggctg gctgcacagc 1260 ggcgacatcg cctactggga cgaggacgag cacttcttca tcgtggaccg gctgaagagc 1320 ctgatcaaat acaagggcta ccaggtagcc ccagccgaac tggagagcat cctgctgcaa 1380 caccccaaca tcttcgacgc cggggtcgcc ggcctgcccg acgacgatgc cggcgagctg 1440 cccgccgcag tcgtcgtgct ggaacacggt aaaaccatga ccgagaagga gatcgtggac 1500 tatgtggcca gccaggttac aaccgccaag aagctgcgcg gtggtgttgt gttcgtggac 1560 gaggtgccta aaggactgac cggcaagttg gacgcccgca agatccgcga gattctcatt 1620 aaggccaaga agggcggcaa gatcgccgtg taa 1653 <210> 55 <211> 66 <212> DNA <213> Foot-and-mouth disease virus <400> 55 gtaaagcaaa cactgaactt tgaccttctc aagttggctg gagacgttga gtccaatcct 60 gggccc 66 <210> 56 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 56 Gly Pro Gly Pro Gly 1 5 <210> 57 <211> 34363 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 57 catcatcaat aatatacctc aaactttttg tgcgcgttaa tatgcaaatg aggcgtttga 60 atttggggag gaagggcggt gattggtcga gggatgagcg accgttaggg gcggggcgag 120 tgacgttttg atgacgtggt tgcgaggagg agccagtttg caagttctcg tgggaaaagt 180 gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca 240 ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg 300 aatgaggaag tgaaaatctg agtaatttcg cgtttatggc agggaggagt atttgccgag 360 ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtgtttt tcacctaaat 420 ttccgcgtac ggtgtcaaag tccggtgttt ttacgtaggt gtcagctgat cgccagggta 480 tttaaacctg cgctctccag tcaagaggcc actcttgagt gccagcgaga agagttttct 540 cctccgcgcc gcgagtcaga tctacacttt gaaagtaggg ataacagggt aatgacattg 600 attattgact agttgttaat agtaatcaat tacggggtca ttagttcata gcccatatat 660 ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc 720 ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca 780 ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta 840 tcatatgcca agtccgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta 900 tgcccagtac atgaccttac gggactttcc tacttggcag tacatctacg tattagtcat 960 cgctattacc atggtgatgc ggttttggca gtacaccaat gggcgtggat agcggtttga 1020 ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca 1080 aaatcaacgg gactttccaa aatgtcgtaa taaccccgcc ccgttgacgc aaatgggcgg 1140 taggcgtgta cggtgggagg tctatataag cagagctcgt ttagtgaacc gtcagatcgc 1200 ctggaacgcc atccacgctg ttttgacctc catagaagac agcgatcgcg ccaccatggc 1260 cgggatgttc caggcactgt ccgaaggctg cacaccctat gatattaacc agatgctgaa 1320 tgtcctggga gaccaccagg tctctggcct ggagcagctg gagagcatca tcaacttcga 1380 gaagctgacc gagtggacaa gctccaatgt gatgcctatc ctgtccccac tgaccaaggg 1440 catcctgggc ttcgtgttta ccctgacagt gccttctgag cggggcctgt cttgcatcag 1500 cgaggcagac gcaaccacac cagagtccgc caatctgggc gaggagatcc tgtctcagct 1560 gtacctgtgg ccccgggtga catatcactc cccttcttac gcctatcacc agttcgagcg 1620 gagagccaag tacaagagac acttcccagg ctttggccag tctctgctgt tcggctaccc 1680 cgtgtacgtg ttcggcgatt gcgtgcaggg cgactgggat gccatccggt ttagatactg 1740 cgcaccacct ggatatgcac tgctgaggtg taacgacacc aattattccg ccctgctggc 1800 agtgggcgcc ctggagggcc ctcgcaatca ggattggctg ggcgtgccaa ggcagctggt 1860 gacacgcatg caggccatcc agaacgcagg cctgtgcacc ctggtggcaa tgctggagga 1920 gacaatcttc tggctgcagg cctttctgat ggccctgacc gacagcggcc ccaagacaaa 1980 catcatcgtg gattcccagt acgtgatggg catctccaag ccttctttcc aggagtttgt 2040 ggactgggag aacgtgagcc cagagctgaa ttccaccgat cagccattct ggcaggcagg 2100 aatcctggca aggaacctgg tgcctatggt ggccacagtg cagggccaga atctgaagta 2160 ccagggccag agcctggtca tcagcgcctc catcatcgtg tttaacctgc tggagctgga 2220 gggcgactat cgggacgatg gcaacgtgtg ggtgcacacc ccactgagcc ccagaacact 2280 gaacgcctgg gtgaaggccg tggaggagaa gaagggcatc ccagtgcacc tggagctggc 2340 ctccatgacc aatatggagc tgatgtctag catcgtgcac cagcaggtga ggacatacgg 2400 acccgtgttc atgtgcctgg gaggcctgct gaccatggtg gcaggagccg tgtggctgac 2460 agtgcgggtg ctggagctgt tcagagccgc ccagctggcc aacgatgtgg tgctgcagat 2520 catggagctg tgcggagcag cctttcgcca ggtgtgccac accacagtgc catggcccaa 2580 tgcctccctg acccccaagt ggaacaatga gacaacacag cctcagatcg ccaactgtag 2640 cgtgtacgac ttcttcgtgt ggctgcacta ctatagcgtg agggataccc tgtggccccg 2700 cgtgacatac cacatgaata agtacgccta tcacatgctg gagaggcgcg ccaagtataa 2760 gagaggccct ggcccaggcg caaagtttgt ggcagcatgg accctgaagg ccgccgccgg 2820 ccccggcccc ggccagtata tcaaggctaa cagtaagttc attggaatca cagagctggg 2880 acccggacct ggataatgag tttaaaccgt tactggccga agccgcttgg aataaggccg 2940 gtgtgcgttt gtctatatgt tattttccac catattgccg tcttttggca atgtgagggc 3000 ccggaaacct ggccctgtct tcttgacgag cattcctagg ggtctttccc ctctcgccaa 3060 aggaatgcaa ggtctgttga atgtcgtgaa ggaagcagtt cctctggaag cttcttgaag 3120 acaaacaacg tctgtagcga ccctttgcag gcagcggaac cccccacctg gcgacaggtg 3180 cctctgcggc caaaagccac gtgtataaga tacacctgca aaggcggcac aaccccagtg 3240 ccacgttgtg agttggatag ttgtggaaag agtcaaatgg ctctcctcaa gcgtattcaa 3300 caaggggctg aaggatgccc agaaggtacc ccattgtatg ggatctgatc tggggcctcg 3360 gtgcacatgc tttacatgtg tttagtcgag gttaaaaaac gtctaggccc cccgaaccac 3420 ggggacgtgg ttttcctttg aaaaacacga tgataatatg ggatggagct ggatctttct 3480 cttcctcctg tcaggaactg caggagtgca ttctgaggcc aagttacagg agtctggacc 3540 tgtgctggtt aaacctggag cttctgtgaa gatgagctgt aaggccagcg gctacacctt 3600 taccgactac tacatgaact gggtgaagca gtctcacgga aagtctctgg agtggatcgg 3660 cgtgatcaac ccctacaatg gcgatacaag ctacaaccag aagttcaagg gcaaggccac 3720 cctgaccgtg gataagagca gctctacagc ctatatggag ctgaatagcc tgacaagcga 3780 ggattctgcc gtgtactact gcgcccggta ttatggcagc tggtttgcct attggggaca 3840 aggaacactg attaccgtgt ctacagccaa aacaacaccc ccatcagtct atccactggc 3900 ccctgggtgt ggagatacaa ctggttcctc cgtgactctg ggatgcctgg tcaagggcta 3960 cttccctgag tcagtgactg tgacttggaa ctctggatcc ctgtccagca gtgtgcacac 4020 cttcccagct ctcctgcagt ctggactcta cactatgagc agctcagtga ctgtcccctc 4080 cagcacctgg ccaagtcaga ccgtcacctg cagcgttgct cacccagcca gcagcaccac 4140 ggtggacaaa aaacttgagc ccagcgggcc catttcaaca atcaacccct gtcctccatg 4200 caaggagtgt cacaaatgcc cagctcctaa cctggagggt ggaccatccg tcttcatctt 4260 ccctccaaat atcaaggatg tactcatgat ctccctgaca cccaaggtca cgtgtgtggt 4320 ggtggatgtg agcgaggatg acccagacgt ccagatcagc tggtttgtga acaacgtgga 4380 agtacacaca gctcagacac aaacccatag agaggattac aacagtacta tccgggtggt 4440 cagcaccctc cccatccagc accaggactg gatgagtggc aaggagttca aatgcaaggt 4500 caacaacaaa gacctcccat cacccatcga gagaaccatc tcaaaaatta aagggctagt 4560 cagagctcca caagtataca tcttgccgcc accagcagag cagttgtcca ggaaagatgt 4620 cagtctcact tgcctggtcg tgggcttcaa ccctggagac atcagtgtgg agtggaccag 4680 caatgggcat acagaggaga actacaagga caccgcacca gtcctggact ctgacggttc 4740 ttacttcata tatagcaagc tcaatatgaa aacaagcaag tgggagaaaa cagattcctt 4800 ctcatgcaac gtgagacacg agggtctgaa aaattactac ctgaagaaga ccatctcccg 4860 gtctccgggt aaacgcaaac ggagaggcgt cagagctgaa ggtagaggct ctttgctcac 4920 ctgtggagat gtggaagaga accctggacc catgaagttg cctgttaggc tgttggtgct 4980 gatgttctgg attcctggag ctagatgcga tatcgtgatg acccagacaa cactgtctct 5040 gcctgtgtct ctgggagatc aggcctctat cagctgtaga tctagccaga gcattgtgca 5100 ctctaacggc aacacctacc tggagtggta cctgcagaaa ccaggacaaa gccctaagct 5160 gctgatctac aaagtgagca accggtttag cggcgtgccc gacagatttt ctggatctgg 5220 ctctggcacc gattttacac tgaagatcag cagagtggag gccgaggatc tgggagtgta 5280 ctactgcttt cagggctctc atgtgcctta cacatttgga ggaggaacca agctggagat 5340 caagcgggct gatgctgcac caactgtatc catcttccca ccatccagtg agcagttaac 5400 atctggaggt gcctcagtcg tgtgcttctt gaacaacttc taccccaaag acatcaatgt 5460 caagtggaag attgatggca gtgaacgaca aaatggcgtc ctgaacagtt ggactgatca 5520 ggacagcaaa gacagcacct acagcatgag cagcaccctc acgttgacca aggacgagta 5580 tgaacgacat aacagctata cctgtgaggc cactcacaag acatcaactt cacccattgt 5640 caagagcttc aacaggaatg agtgttgata gatttaaatg tgagggttaa tgcttcgagc 5700 agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa 5760 atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa 5820 taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg gggagatgtg 5880 ggaggttttt taaagcaagt aaaacctcta caaatgtggt aaaataacta taacggtcct 5940 aaggtagcga gtgagtagtg ttctggggcg ggggaggacc tgcatgaggg ccagaataac 6000 tgaaatctgt gcttttctgt gtgttgcagc agcatgagcg gaagcggctc ctttgaggga 6060 ggggtattca gcccttatct gacggggcgt ctcccctcct gggcgggagt gcgtcagaat 6120 gtgatgggat ccacggtgga cggccggccc gtgcagcccg cgaactcttc aaccctgacc 6180 tatgcaaccc tgagctcttc gtcgttggac gcagctgccg ccgcagctgc tgcatctgcc 6240 gccagcgccg tgcgcggaat ggccatgggc gccggctact acggcactct ggtggccaac 6300 tcgagttcca ccaataatcc cgccagcctg aacgaggaga agctgttgct gctgatggcc 6360 cagctcgagg ccttgaccca gcgcctgggc gagctgaccc agcaggtggc tcagctgcag 6420 gagcagacgc gggccgcggt tgccacggtg aaatccaaat aaaaaatgaa tcaataaata 6480 aacggagacg gttgttgatt ttaacacaga gtctgaatct ttatttgatt tttcgcgcgc 6540 ggtaggccct ggaccaccgg tctcgatcat tgagcacccg gtggatcttt tccaggaccc 6600 ggtagaggtg ggcttggatg ttgaggtaca tgggcatgag cccgtcccgg gggtggaggt 6660 agctccattg cagggcctcg tgctcggggg tggtgttgta aatcacccag tcatagcagg 6720 ggcgcagggc atggtgttgc acaatatctt tgaggaggag actgatggcc acgggcagcc 6780 ctttggtgta ggtgtttaca aatctgttga gctgggaggg atgcatgcgg ggggagatga 6840 ggtgcatctt ggcctggatc ttgagattgg cgatgttacc gcccagatcc cgcctggggt 6900 tcatgttgtg caggaccacc agcacggtgt atccggtgca cttggggaat ttatcatgca 6960 acttggaagg gaaggcgtga aagaatttgg cgacgccttt gtgcccgccc aggttttcca 7020 tgcactcatc catgatgatg gcgatgggcc cgtgggcggc ggcctgggca aagacgtttc 7080 gggggtcgga cacatcatag ttgtggtcct gggtgaggtc atcataggcc attttaatga 7140 atttggggcg gagggtgccg gactggggga caaaggttcc ctcgatcccg ggggcgtagt 7200 tcccctcaca gatctgcatc tcccaggctt tgagctcgga gggggggatc atgtccacct 7260 gcggggcgat aaagaacacg gtttccgggg cgggggagat gagctgggcc gaaagcaagt 7320 tccggagcag ctgggacttg ccgcagccgg tggggccgta gatgaccccg atgaccggct 7380 gcaggtggta gttgagggag agacagctgc cgtcctcccg gaggaggggg gccacctcgt 7440 tcatcatctc gcgcacgtgc atgttctcgc gcaccagttc cgccaggagg cgctctcccc 7500 ccagggatag gagctcctgg agcgaggcga agtttttcag cggcttgagt ccgtcggcca 7560 tgggcatttt ggagagggtt tgttgcaaga gttccaggcg gtcccagagc tcggtgatgt 7620 gctctacggc atctcgatcc agcagacctc ctcgtttcgc gggttgggac ggctgcggga 7680 gtagggcacc agacgatggg cgtccagcgc agccagggtc cggtccttcc agggtcgcag 7740 cgtccgcgtc agggtggtct ccgtcacggt gaaggggtgc gcgccgggct gggcgcttgc 7800 gagggtgcgc ttcaggctca tccggctggt cgaaaaccgc tcccgatcgg cgccctgcgc 7860 gtcggccagg tagcaattga ccatgagttc gtagttgagc gcctcggccg cgtggccttt 7920 ggcgcggagc ttacctttgg aagtctgccc gcaggcggga cagaggaggg acttgagggc 7980 gtagagcttg ggggcgagga agacggactc gggggcgtag gcgtccgcgc cgcagtgggc 8040 gcagacggtc tcgcactcca cgagccaggt gaggtcgggc tggtcggggt caaaaaccag 8100 tttcccgccg ttctttttga tgcgtttctt acctttggtc tccatgagct cgtgtccccg 8160 ctgggtgaca aagaggctgt ccgtgtcccc gtagaccgac tttatgggcc ggtcctcgag 8220 cggtgtgccg cggtcctcct cgtagaggaa ccccgcccac tccgagacga aagcccgggt 8280 ccaggccagc acgaaggagg ccacgtggga cgggtagcgg tcgttgtcca ccagcgggtc 8340 caccttttcc agggtatgca aacacatgtc cccctcgtcc acatccagga aggtgattgg 8400 cttgtaagtg taggccacgt gaccgggggt cccggccggg ggggtataaa agggtgcggg 8460 tccctgctcg tcctcactgt cttccggatc gctgtccagg agcgccagct gttggggtag 8520 gtattccctc tcgaaggcgg gcatgacctc ggcactcagg ttgtcagttt ctagaaacga 8580 ggaggatttg atattgacgg tgccggcgga gatgcctttc aagagcccct cgtccatctg 8640 gtcagaaaag acgatctttt tgttgtcgag cttggtggcg aaggagccgt agagggcgtt 8700 ggagaggagc ttggcgatgg agcgcatggt ctggtttttt tccttgtcgg cgcgctcctt 8760 ggcggcgatg ttgagctgca cgtactcgcg cgccacgcac ttccattcgg ggaagacggt 8820 ggtcagctcg tcgggcacga ttctgacctg ccagccccga ttatgcaggg tgatgaggtc 8880 cacactggtg gccacctcgc cgcgcagggg ctcattagtc cagcagaggc gtccgccctt 8940 gcgcgagcag aaggggggca gggggtccag catgacctcg tcgggggggt cggcatcgat 9000 ggtgaagatg ccgggcagga ggtcggggtc aaagtagctg atggaagtgg ccagatcgtc 9060 cagggcagct tgccattcgc gcacggccag cgcgcgctcg tagggactga ggggcgtgcc 9120 ccagggcatg ggatgggtaa gcgcggaggc gtacatgccg cagatgtcgt agacgtagag 9180 gggctcctcg aggatgccga tgtaggtggg gtagcagcgc cccccgcgga tgctggcgcg 9240 cacgtagtca tacagctcgt gcgagggggc gaggagcccc gggcccaggt tggtgcgact 9300 gggcttttcg gcgcggtaga cgatctggcg gaaaatggca tgcgagttgg aggagatggt 9360 gggcctttgg aagatgttga agtgggcgtg gggcagtccg accgagtcgc ggatgaagtg 9420 ggcgtaggag tcttgcagct tggcgacgag ctcggcggtg actaggacgt ccagagcgca 9480 gtagtcgagg gtctcctgga tgatgtcata cttgagctgt cccttttgtt tccacagctc 9540 gcggttgaga aggaactctt cgcggtcctt ccagtactct tcgaggggga acccgtcctg 9600 atctgcacgg taagagccta gcatgtagaa ctggttgacg gccttgtagg cgcagcagcc 9660 cttctccacg gggagggcgt aggcctgggc ggccttgcgc agggaggtgt gcgtgagggc 9720 gaaagtgtcc ctgaccatga ccttgaggaa ctggtgcttg aagtcgatat cgtcgcagcc 9780 cccctgctcc cagagctgga agtccgtgcg cttcttgtag gcggggttgg gcaaagcgaa 9840 agtaacatcg ttgaagagga tcttgcccgc gcggggcata aagttgcgag tgatgcggaa 9900 aggttggggc acctcggccc ggttgttgat gacctgggcg gcgagcacga tctcgtcgaa 9960 gccgttgatg ttgtggccca cgatgtagag ttccacgaat cgcggacggc ccttgacgtg 10020 gggcagtttc ttgagctcct cgtaggtgag ctcgtcgggg tcgctgagcc cgtgctgctc 10080 gagcgcccag tcggcgagat gggggttggc gcggaggaag gaagtccaga gatccacggc 10140 cagggcggtt tgcagacggt cccggtactg acggaactgc tgcccgacgg ccattttttc 10200 gggggtgacg cagtagaagg tgcgggggtc cccgtgccag cgatcccatt tgagctggag 10260 ggcgagatcg agggcgagct cgacgagccg gtcgtccccg gagagtttca tgaccagcat 10320 gaaggggacg agctgcttgc cgaaggaccc catccaggtg taggtttcca catcgtaggt 10380 gaggaagagc ctttcggtgc gaggatgcga gccgatgggg aagaactgga tctcctgcca 10440 ccaattggag gaatggctgt tgatgtgatg gaagtagaaa tgccgacggc gcgccgaaca 10500 ctcgtgcttg tgtttataca agcggccaca gtgctcgcaa cgctgcacgg gatgcacgtg 10560 ctgcacgagc tgtacctgag ttcctttgac gaggaatttc agtgggaagt ggagtcgtgg 10620 cgcctgcatc tcgtgctgta ctacgtcgtg gtggtcggcc tggccctctt ctgcctcgat 10680 ggtggtcatg ctgacgagcc cgcgcgggag gcaggtccag acctcggcgc gagcgggtcg 10740 gagagcgagg acgagggcgc gcaggccgga gctgtccagg gtcctgagac gctgcggagt 10800 caggtcagtg ggcagcggcg gcgcgcggtt gacttgcagg agtttttcca gggcgcgcgg 10860 gaggtccaga tggtacttga tctccaccgc gccattggtg gcgacgtcga tggcttgcag 10920 ggtcccgtgc ccctggggtg tgaccaccgt cccccgtttc ttcttgggcg gctggggcga 10980 cgggggcggt gcctcttcca tggttagaag cggcggcgag gacgcgcgcc gggcggcagg 11040 ggcggctcgg ggcccggagg caggggcggc aggggcacgt cggcgccgcg cgcgggtagg 11100 ttctggtact gcgcccggag aagactggcg tgagcgacga cgcgacggtt gacgtcctgg 11160 atctgacgcc tctgggtgaa ggccacggga cccgtgagtt tgaacctgaa agagagttcg 11220 acagaatcaa tctcggtatc gttgacggcg gcctgccgca ggatctcttg cacgtcgccc 11280 gagttgtcct ggtaggcgat ctcggtcatg aactgctcga tctcctcctc ttgaaggtct 11340 ccgcggccgg cgcgctccac ggtggccgcg aggtcgttgg agatgcggcc catgagctgc 11400 gagaaggcgt tcatgcccgc ctcgttccag acgcggctgt agaccacgac gccctcggga 11460 tcgcgggcgc gcatgaccac ctgggcgagg ttgagctcca cgtggcgcgt gaagaccgcg 11520 tagttgcaga ggcgctggta gaggtagttg agcgtggtgg cgatgtgctc ggtgacgaag 11580 aaatacatga tccagcggcg gagcggcatc tcgctgacgt cgcccagcgc ctccaaacgt 11640 tccatggcct cgtaaaagtc cacggcgaag ttgaaaaact gggagttgcg cgccgagacg 11700 gtcaactcct cctccagaag acggatgagc tcggcgatgg tggcgcgcac ctcgcgctcg 11760 aaggcccccg ggagttcctc cacttcctct tcttcctcct ccactaacat ctcttctact 11820 tcctcctcag gcggcagtgg tggcggggga gggggcctgc gtcgccggcg gcgcacgggc 11880 agacggtcga tgaagcgctc gatggtctcg ccgcgccggc gtcgcatggt ctcggtgacg 11940 gcgcgcccgt cctcgcgggg ccgcagcgtg aagacgccgc cgcgcatctc caggtggccg 12000 ggggggtccc cgttgggcag ggagagggcg ctgacgatgc atcttatcaa ttgccccgta 12060 gggactccgc gcaaggacct gagcgtctcg agatccacgg gatctgaaaa ccgctgaacg 12120 aaggcttcga gccagtcgca gtcgcaaggt aggctgagca cggtttcttc tggcgggtca 12180 tgttggttgg gagcggggcg ggcgatgctg ctggtgatga agttgaaata ggcggttctg 12240 agacggcgga tggtggcgag gagcaccagg tctttgggcc cggcttgctg gatgcgcaga 12300 cggtcggcca tgccccaggc gtggtcctga cacctggcca ggtccttgta gtagtcctgc 12360 atgagccgct ccacgggcac ctcctcctcg cccgcgcggc cgtgcatgcg cgtgagcccg 12420 aagccgcgct ggggctggac gagcgccagg tcggcgacga cgcgctcggc gaggatggct 12480 tgctggatct gggtgagggt ggtctggaag tcatcaaagt cgacgaagcg gtggtaggct 12540 ccggtgttga tggtgtagga gcagttggcc atgacggacc agttgacggt ctggtggccc 12600 ggacgcacga gctcgtggta cttgaggcgc gagtaggcgc gcgtgtcgaa gatgtagtcg 12660 ttgcaggtgc gcaccaggta ctggtagccg atgaggaagt gcggcggcgg ctggcggtag 12720 agcggccatc gctcggtggc gggggcgccg ggcgcgaggt cctcgagcat ggtgcggtgg 12780 tagccgtaga tgtacctgga catccaggtg atgccggcgg cggtggtgga ggcgcgcggg 12840 aactcgcgga cgcggttcca gatgttgcgc agcggcagga agtagttcat ggtgggcacg 12900 gtctggcccg tgaggcgcgc gcagtcgtgg atgctctata cgggcaaaaa cgaaagcggt 12960 cagcggctcg actccgtggc ctggaggcta agcgaacggg ttgggctgcg cgtgtacccc 13020 ggttcgaatc tcgaatcagg ctggagccgc agctaacgtg gtattggcac tcccgtctcg 13080 acccaagcct gcaccaaccc tccaggatac ggaggcgggt cgttttgcaa cttttttttg 13140 gaggccggat gagactagta agcgcggaaa gcggccgacc gcgatggctc gctgccgtag 13200 tctggagaag aatcgccagg gttgcgttgc ggtgtgcccc ggttcgaggc cggccggatt 13260 ccgcggctaa cgagggcgtg gctgccccgt cgtttccaag accccatagc cagccgactt 13320 ctccagttac ggagcgagcc cctcttttgt tttgtttgtt tttgccagat gcatcccgta 13380 ctgcggcaga tgcgccccca ccaccctcca ccgcaacaac agccccctcc acagccggcg 13440 cttctgcccc cgccccagca gcaacttcca gccacgaccg ccgcggccgc cgtgagcggg 13500 gctggacaga gttatgatca ccagctggcc ttggaagagg gcgaggggct ggcgcgcctg 13560 ggggcgtcgt cgccggagcg gcacccgcgc gtgcagatga aaagggacgc tcgcgaggcc 13620 tacgtgccca agcagaacct gttcagagac aggagcggcg aggagcccga ggagatgcgc 13680 gcggcccggt tccacgcggg gcgggagctg cggcgcggcc tggaccgaaa gagggtgctg 13740 agggacgagg atttcgaggc ggacgagctg acggggatca gccccgcgcg cgcgcacgtg 13800 gccgcggcca acctggtcac ggcgtacgag cagaccgtga aggaggagag caacttccaa 13860 aaatccttca acaaccacgt gcgcaccctg atcgcgcgcg aggaggtgac cctgggcctg 13920 atgcacctgt gggacctgct ggaggccatc gtgcagaacc ccaccagcaa gccgctgacg 13980 gcgcagctgt tcctggtggt gcagcatagt cgggacaacg aagcgttcag ggaggcgctg 14040 ctgaatatca ccgagcccga gggccgctgg ctcctggacc tggtgaacat tctgcagagc 14100 atcgtggtgc aggagcgcgg gctgccgctg tccgagaagc tggcggccat caacttctcg 14160 gtgctgagtt tgggcaagta ctacgctagg aagatctaca agaccccgta cgtgcccata 14220 gacaaggagg tgaagatcga cgggttttac atgcgcatga ccctgaaagt gctgaccctg 14280 agcgacgatc tgggggtgta ccgcaacgac aggatgcacc gtgcggtgag cgccagcagg 14340 cggcgcgagc tgagcgacca ggagctgatg catagtctgc agcgggccct gaccggggcc 14400 gggaccgagg gggagagcta ctttgacatg ggcgcggacc tgcactggca gcccagccgc 14460 cgggccttgg aggcggcggc aggaccctac gtagaagagg tggacgatga ggtggacgag 14520 gagggcgagt acctggaaga ctgatggcgc gaccgtattt ttgctagatg caacaacaac 14580 agccacctcc tgatcccgcg atgcgggcgg cgctgcagag ccagccgtcc ggcattaact 14640 cctcggacga ttggacccag gccatgcaac gcatcatggc gctgacgacc cgcaaccccg 14700 aagcctttag acagcagccc caggccaacc ggctctcggc catcctggag gccgtggtgc 14760 cctcgcgctc caaccccacg cacgagaagg tcctggccat cgtgaacgcg ctggtggaga 14820 acaaggccat ccgcggcgac gaggccggcc tggtgtacaa cgcgctgctg gagcgcgtgg 14880 cccgctacaa cagcaccaac gtgcagacca acctggaccg catggtgacc gacgtgcgcg 14940 aggccgtggc ccagcgcgag cggttccacc gcgagtccaa cctgggatcc atggtggcgc 15000 tgaacgcctt cctcagcacc cagcccgcca acgtgccccg gggccaggag gactacacca 15060 acttcatcag cgccctgcgc ctgatggtga ccgaggtgcc ccagagcgag gtgtaccagt 15120 ccgggccgga ctacttcttc cagaccagtc gccagggctt gcagaccgtg aacctgagcc 15180 aggctttcaa gaacttgcag ggcctgtggg gcgtgcaggc cccggtcggg gaccgcgcga 15240 cggtgtcgag cctgctgacg ccgaactcgc gcctgctgct gctgctggtg gcccccttca 15300 cggacagcgg cagcatcaac cgcaactcgt acctgggcta cctgattaac ctgtaccgcg 15360 aggccatcgg ccaggcgcac gtggacgagc agacctacca ggagatcacc cacgtgagcc 15420 gcgccctggg ccaggacgac ccgggcaacc tggaagccac cctgaacttt ttgctgacca 15480 accggtcgca gaagatcccg ccccagtacg cgctcagcac cgaggaggag cgcatcctgc 15540 gttacgtgca gcagagcgtg ggcctgttcc tgatgcagga gggggccacc cccagcgccg 15600 cgctcgacat gaccgcgcgc aacatggagc ccagcatgta cgccagcaac cgcccgttca 15660 tcaataaact gatggactac ttgcatcggg cggccgccat gaactctgac tatttcacca 15720 acgccatcct gaatccccac tggctcccgc cgccggggtt ctacacgggc gagtacgaca 15780 tgcccgaccc caatgacggg ttcctgtggg acgatgtgga cagcagcgtg ttctcccccc 15840 gaccgggtgc taacgagcgc cccttgtgga agaaggaagg cagcgaccga cgcccgtcct 15900 cggcgctgtc cggccgcgag ggtgctgccg cggcggtgcc cgaggccgcc agtcctttcc 15960 cgagcttgcc cttctcgctg aacagtatcc gcagcagcga gctgggcagg atcacgcgcc 16020 cgcgcttgct gggcgaagag gagtacttga atgactcgct gttgagaccc gagcgggaga 16080 agaacttccc caataacggg atagaaagcc tggtggacaa gatgagccgc tggaagacgt 16140 atgcgcagga gcacagggac gatccccggg cgtcgcaggg ggccacgagc cggggcagcg 16200 ccgcccgtaa acgccggtgg cacgacaggc agcggggaca gatgtgggac gatgaggact 16260 ccgccgacga cagcagcgtg ttggacttgg gtgggagtgg taacccgttc gctcacctgc 16320 gcccccgtat cgggcgcatg atgtaagaga aaccgaaaat aaatgatact caccaaggcc 16380 atggcgacca gcgtgcgttc gtttcttctc tgttgttgtt gtatctagta tgatgaggcg 16440 tgcgtacccg gagggtcctc ctccctcgta cgagagcgtg atgcagcagg cgatggcggc 16500 ggcggcgatg cagcccccgc tggaggctcc ttacgtgccc ccgcggtacc tggcgcctac 16560 ggaggggcgg aacagcattc gttactcgga gctggcaccc ttgtacgata ccacccggtt 16620 gtacctggtg gacaacaagt cggcggacat cgcctcgctg aactaccaga acgaccacag 16680 caacttcctg accaccgtgg tgcagaacaa tgacttcacc cccacggagg ccagcaccca 16740 gaccatcaac tttgacgagc gctcgcggtg gggcggccag ctgaaaacca tcatgcacac 16800 caacatgccc aacgtgaacg agttcatgta cagcaacaag ttcaaggcgc gggtgatggt 16860 ctcccgcaag acccccaatg gggtgacagt gacagaggat tatgatggta gtcaggatga 16920 gctgaagtat gaatgggtgg aatttgagct gcccgaaggc aacttctcgg tgaccatgac 16980 catcgacctg atgaacaacg ccatcatcga caattacttg gcggtggggc ggcagaacgg 17040 ggtgctggag agcgacatcg gcgtgaagtt cgacactagg aacttcaggc tgggctggga 17100 ccccgtgacc gagctggtca tgcccggggt gtacaccaac gaggctttcc atcccgatat 17160 tgtcttgctg cccggctgcg gggtggactt caccgagagc cgcctcagca acctgctggg 17220 cattcgcaag aggcagccct tccaggaagg cttccagatc atgtacgagg atctggaggg 17280 gggcaacatc cccgcgctcc tggatgtcga cgcctatgag aaaagcaagg aggatgcagc 17340 agctgaagca actgcagccg tagctaccgc ctctaccgag gtcaggggcg ataattttgc 17400 aagcgccgca gcagtggcag cggccgaggc ggctgaaacc gaaagtaaga tagtcattca 17460 gccggtggag aaggatagca agaacaggag ctacaacgta ctaccggaca agataaacac 17520 cgcctaccgc agctggtacc tagcctacaa ctatggcgac cccgagaagg gcgtgcgctc 17580 ctggacgctg ctcaccacct cggacgtcac ctgcggcgtg gagcaagtct actggtcgct 17640 gcccgacatg atgcaagacc cggtcacctt ccgctccacg cgtcaagtta gcaactaccc 17700 ggtggtgggc gccgagctcc tgcccgtcta ctccaagagc ttcttcaacg agcaggccgt 17760 ctactcgcag cagctgcgcg ccttcacctc gcttacgcac gtcttcaacc gcttccccga 17820 gaaccagatc ctcgtccgcc cgcccgcgcc caccattacc accgtcagtg aaaacgttcc 17880 tgctctcaca gatcacggga ccctgccgct gcgcagcagt atccggggag tccagcgcgt 17940 gaccgttact gacgccagac gccgcacctg cccctacgtc tacaaggccc tgggcatagt 18000 cgcgccgcgc gtcctctcga gccgcacctt ctaaatgtcc attctcatct cgcccagtaa 18060 taacaccggt tggggcctgc gcgcgcccag caagatgtac ggaggcgctc gccaacgctc 18120 cacgcaacac cccgtgcgcg tgcgcgggca cttccgcgct ccctggggcg ccctcaaggg 18180 ccgcgtgcgg tcgcgcacca ccgtcgacga cgtgatcgac caggtggtgg ccgacgcgcg 18240 caactacacc cccgccgccg cgcccgtctc caccgtggac gccgtcatcg acagcgtggt 18300 ggccgacgcg cgccggtacg cccgcgccaa gagccggcgg cggcgcatcg cccggcggca 18360 ccggagcacc cccgccatgc gcgcggcgcg agccttgctg cgcagggcca ggcgcacggg 18420 acgcagggcc atgctcaggg cggccagacg cgcggcttca ggcgccagcg ccggcaggac 18480 ccggagacgc gcggccacgg cggcggcagc ggccatcgcc agcatgtccc gcccgcggcg 18540 agggaacgtg tactgggtgc gcgacgccgc caccggtgtg cgcgtgcccg tgcgcacccg 18600 cccccctcgc acttgaagat gttcacttcg cgatgttgat gtgtcccagc ggcgaggagg 18660 atgtccaagc gcaaattcaa ggaagagatg ctccaggtca tcgcgcctga gatctacggc 18720 cctgcggtgg tgaaggagga aagaaagccc cgcaaaatca agcgggtcaa aaaggacaaa 18780 aaggaagaag aaagtgatgt ggacggattg gtggagtttg tgcgcgagtt cgccccccgg 18840 cggcgcgtgc agtggcgcgg gcggaaggtg caaccggtgc tgagacccgg caccaccgtg 18900 gtcttcacgc ccggcgagcg ctccggcacc gcttccaagc gctcctacga cgaggtgtac 18960 ggggatgatg atattctgga gcaggcggcc gagcgcctgg gcgagtttgc ttacggcaag 19020 cgcagccgtt ccgcaccgaa ggaagaggcg gtgtccatcc cgctggacca cggcaacccc 19080 acgccgagcc tcaagcccgt gaccttgcag caggtgctgc cgaccgcggc gccgcgccgg 19140 gggttcaagc gcgagggcga ggatctgtac cccaccatgc agctgatggt gcccaagcgc 19200 cagaagctgg aagacgtgct ggagaccatg aaggtggacc cggacgtgca gcccgaggtc 19260 aaggtgcggc ccatcaagca ggtggccccg ggcctgggcg tgcagaccgt ggacatcaag 19320 attcccacgg agcccatgga aacgcagacc gagcccatga tcaagcccag caccagcacc 19380 atggaggtgc agacggatcc ctggatgcca tcggctccta gtcgaagacc ccggcgcaag 19440 tacggcgcgg ccagcctgct gatgcccaac tacgcgctgc atccttccat catccccacg 19500 ccgggctacc gcggcacgcg cttctaccgc ggtcatacca gcagccgccg ccgcaagacc 19560 accactcgcc gccgccgtcg ccgcaccgcc gctgcaacca cccctgccgc cctggtgcgg 19620 agagtgtacc gccgcggccg cgcacctctg accctgccgc gcgcgcgcta ccacccgagc 19680 atcgccattt aaactttcgc ctgctttgca gatcaatggc cctcacatgc cgccttcgcg 19740 ttcccattac gggctaccga ggaagaaaac cgcgccgtag aaggctggcg gggaacggga 19800 tgcgtcgcca ccaccaccgg cggcggcgcg ccatcagcaa gcggttgggg ggaggcttcc 19860 tgcccgcgct gatccccatc atcgccgcgg cgatcggggc gatccccggc attgcttccg 19920 tggcggtgca ggcctctcag cgccactgag acacacttgg aaacatcttg taataaacca 19980 atggactctg acgctcctgg tcctgtgatg tgttttcgta gacagatgga agacatcaat 20040 ttttcgtccc tggctccgcg acacggcacg cggccgttca tgggcacctg gagcgacatc 20100 ggcaccagcc aactgaacgg gggcgccttc aattggagca gtctctggag cgggcttaag 20160 aatttcgggt ccacgcttaa aacctatggc agcaaggcgt ggaacagcac cacagggcag 20220 gcgctgaggg ataagctgaa agagcagaac ttccagcaga aggtggtcga tgggctcgcc 20280 tcgggcatca acggggtggt ggacctggcc aaccaggccg tgcagcggca gatcaacagc 20340 cgcctggacc cggtgccgcc cgccggctcc gtggagatgc cgcaggtgga ggaggagctg 20400 cctcccctgg acaagcgggg cgagaagcga ccccgccccg atgcggagga gacgctgctg 20460 acgcacacgg acgagccgcc cccgtacgag gaggcggtga aactgggtct gcccaccacg 20520 cggcccatcg cgcccctggc caccggggtg ctgaaacccg aaaagcccgc gaccctggac 20580 ttgcctcctc cccagccttc ccgcccctct acagtggcta agcccctgcc gccggtggcc 20640 gtggcccgcg cgcgacccgg gggcaccgcc cgccctcatg cgaactggca gagcactctg 20700 aacagcatcg tgggtctggg agtgcagagt gtgaagcgcc gccgctgcta ttaaacctac 20760 cgtagcgctt aacttgcttg tctgtgtgtg tatgtattat gtcgccgccg ccgctgtcca 20820 ccagaaggag gagtgaagag gcgcgtcgcc gagttgcaag atggccaccc catcgatgct 20880 gccccagtgg gcgtacatgc acatcgccgg acaggacgct tcggagtacc tgagtccggg 20940 tctggtgcag tttgcccgcg ccacagacac ctacttcagt ctggggaaca agtttaggaa 21000 ccccacggtg gcgcccacgc acgatgtgac caccgaccgc agccagcggc tgacgctgcg 21060 cttcgtgccc gtggaccgcg aggacaacac ctactcgtac aaagtgcgct acacgctggc 21120 cgtgggcgac aaccgcgtgc tggacatggc cagcacctac tttgacatcc gcggcgtgct 21180 ggatcggggc cctagcttca aaccctactc cggcaccgcc tacaacagtc tggcccccaa 21240 gggagcaccc aacacttgtc agtggacata taaagccgat ggtgaaactg ccacagaaaa 21300 aacctataca tatggaaatg cacccgtgca gggcattaac atcacaaaag atggtattca 21360 acttggaact gacaccgatg atcagccaat ctacgcagat aaaacctatc agcctgaacc 21420 tcaagtgggt gatgctgaat ggcatgacat cactggtact gatgaaaagt atggaggcag 21480 agctcttaag cctgatacca aaatgaagcc ttgttatggt tcttttgcca agcctactaa 21540 taaagaagga ggtcaggcaa atgtgaaaac aggaacaggc actactaaag aatatgacat 21600 agacatggct ttctttgaca acagaagtgc ggctgctgct ggcctagctc cagaaattgt 21660 tttgtatact gaaaatgtgg atttggaaac tccagatacc catattgtat acaaagcagg 21720 cacagatgac agcagctctt ctattaattt gggtcagcaa gccatgccca acagacctaa 21780 ctacattggt ttcagagaca actttatcgg gctcatgtac tacaacagca ctggcaatat 21840 gggggtgctg gccggtcagg cttctcagct gaatgctgtg gttgacttgc aagacagaaa 21900 caccgagctg tcctaccagc tcttgcttga ctctctgggt gacagaaccc ggtatttcag 21960 tatgtggaat caggcggtgg acagctatga tcctgatgtg cgcattattg aaaatcatgg 22020 tgtggaggat gaacttccca actattgttt ccctctggat gctgttggca gaacagatac 22080 ttatcaggga attaaggcta atggaactga tcaaaccaca tggaccaaag atgacagtgt 22140 caatgatgct aatgagatag gcaagggtaa tccattcgcc atggaaatca acatccaagc 22200 caacctgtgg aggaacttcc tctacgccaa cgtggccctg tacctgcccg actcttacaa 22260 gtacacgccg gccaatgtta ccctgcccac caacaccaac acctacgatt acatgaacgg 22320 ccgggtggtg gcgccctcgc tggtggactc ctacatcaac atcggggcgc gctggtcgct 22380 ggatcccatg gacaacgtga accccttcaa ccaccaccgc aatgcggggc tgcgctaccg 22440 ctccatgctc ctgggcaacg ggcgctacgt gcccttccac atccaggtgc cccagaaatt 22500 tttcgccatc aagagcctcc tgctcctgcc cgggtcctac acctacgagt ggaacttccg 22560 caaggacgtc aacatgatcc tgcagagctc cctcggcaac gacctgcgca cggacggggc 22620 ctccatctcc ttcaccagca tcaacctcta cgccaccttc ttccccatgg cgcacaacac 22680 ggcctccacg ctcgaggcca tgctgcgcaa cgacaccaac gaccagtcct tcaacgacta 22740 cctctcggcg gccaacatgc tctaccccat cccggccaac gccaccaacg tgcccatctc 22800 catcccctcg cgcaactggg ccgccttccg cggctggtcc ttcacgcgtc tcaagaccaa 22860 ggagacgccc tcgctgggct ccgggttcga cccctacttc gtctactcgg gctccatccc 22920 ctacctcgac ggcaccttct acctcaacca caccttcaag aaggtctcca tcaccttcga 22980 ctcctccgtc agctggcccg gcaacgaccg gctcctgacg cccaacgagt tcgaaatcaa 23040 gcgcaccgtc gacggcgagg gctacaacgt ggcccagtgc aacatgacca aggactggtt 23100 cctggtccag atgctggccc actacaacat cggctaccag ggcttctacg tgcccgaggg 23160 ctacaaggac cgcatgtact ccttcttccg caacttccag cccatgagcc gccaggtggt 23220 ggacgaggtc aactacaagg actaccaggc cgtcaccctg gcctaccagc acaacaactc 23280 gggcttcgtc ggctacctcg cgcccaccat gcgccagggc cagccctacc ccgccaacta 23340 cccctacccg ctcatcggca agagcgccgt caccagcgtc acccagaaaa agttcctctg 23400 cgacagggtc atgtggcgca tccccttctc cagcaacttc atgtccatgg gcgcgctcac 23460 cgacctcggc cagaacatgc tctatgccaa ctccgcccac gcgctagaca tgaatttcga 23520 agtcgacccc atggatgagt ccacccttct ctatgttgtc ttcgaagtct tcgacgtcgt 23580 ccgagtgcac cagccccacc gcggcgtcat cgaggccgtc tacctgcgca cccccttctc 23640 ggccggtaac gccaccacct aagctcttgc ttcttgcaag ccatggccgc gggctccggc 23700 gagcaggagc tcagggccat catccgcgac ctgggctgcg ggccctactt cctgggcacc 23760 ttcgataagc gcttcccggg attcatggcc ccgcacaagc tggcctgcgc catcgtcaac 23820 acggccggcc gcgagaccgg gggcgagcac tggctggcct tcgcctggaa cccgcgctcg 23880 aacacctgct acctcttcga ccccttcggg ttctcggacg agcgcctcaa gcagatctac 23940 cagttcgagt acgagggcct gctgcgccgc agcgccctgg ccaccgagga ccgctgcgtc 24000 accctggaaa agtccaccca gaccgtgcag ggtccgcgct cggccgcctg cgggctcttc 24060 tgctgcatgt tcctgcacgc cttcgtgcac tggcccgacc gccccatgga caagaacccc 24120 accatgaact tgctgacggg ggtgcccaac ggcatgctcc agtcgcccca ggtggaaccc 24180 accctgcgcc gcaaccagga ggcgctctac cgcttcctca actcccactc cgcctacttt 24240 cgctcccacc gcgcgcgcat cgagaaggcc accgccttcg accgcatgaa tcaagacatg 24300 taaaccgtgt gtgtatgtta aatgtcttta ataaacagca ctttcatgtt acacatgcat 24360 ctgagatgat ttatttagaa atcgaaaggg ttctgccggg tctcggcatg gcccgcgggc 24420 agggacacgt tgcggaactg gtacttggcc agccacttga actcggggat cagcagtttg 24480 ggcagcgggg tgtcggggaa ggagtcggtc cacagcttcc gcgtcagttg cagggcgccc 24540 agcaggtcgg gcgcggagat cttgaaatcg cagttgggac ccgcgttctg cgcgcgggag 24600 ttgcggtaca cggggttgca gcactggaac accatcaggg ccgggtgctt cacgctcgcc 24660 agcaccgtcg cgtcggtgat gctctccacg tcgaggtcct cggcgttggc catcccgaag 24720 ggggtcatct tgcaggtctg ccttcccatg gtgggcacgc acccgggctt gtggttgcaa 24780 tcgcagtgca gggggatcag catcatctgg gcctggtcgg cgttcatccc cgggtacatg 24840 gccttcatga aagcctccaa ttgcctgaac gcctgctggg ccttggctcc ctcggtgaag 24900 aagaccccgc aggacttgct agagaactgg ttggtggcgc acccggcgtc gtgcacgcag 24960 cagcgcgcgt cgttgttggc cagctgcacc acgctgcgcc cccagcggtt ctgggtgatc 25020 ttggcccggt cggggttctc cttcagcgcg cgctgcccgt tctcgctcgc cacatccatc 25080 tcgatcatgt gctccttctg gatcatggtg gtcccgtgca ggcaccgcag cttgccctcg 25140 gcctcggtgc acccgtgcag ccacagcgcg cacccggtgc actcccagtt cttgtgggcg 25200 atctgggaat gcgcgtgcac gaagccctgc aggaagcggc ccatcatggt ggtcagggtc 25260 ttgttgctag tgaaggtcag cggaatgccg cggtgctcct cgttgatgta caggtggcag 25320 atgcggcggt acacctcgcc ctgctcgggc atcagctgga agttggcttt caggtcggtc 25380 tccacgcggt agcggtccat cagcatagtc atgatttcca tacccttctc ccaggccgag 25440 acgatgggca ggctcatagg gttcttcacc atcatcttag cgctagcagc cgcggccagg 25500 gggtcgctct cgtccagggt ctcaaagctc cgcttgccgt ccttctcggt gatccgcacc 25560 ggggggtagc tgaagcccac ggccgccagc tcctcctcgg cctgtctttc gtcctcgctg 25620 tcctggctga cgtcctgcag gaccacatgc ttggtcttgc ggggtttctt cttgggcggc 25680 agcggcggcg gagatgttgg agatggcgag ggggagcgcg agttctcgct caccactact 25740 atctcttcct cttcttggtc cgaggccacg cggcggtagg tatgtctctt cgggggcaga 25800 ggcggaggcg acgggctctc gccgccgcga cttggcggat ggctggcaga gccccttccg 25860 cgttcggggg tgcgctcccg gcggcgctct gactgacttc ctccgcggcc ggccattgtg 25920 ttctcctagg gaggaacaac aagcatggag actcagccat cgccaacctc gccatctgcc 25980 cccaccgccg acgagaagca gcagcagcag aatgaaagct taaccgcccc gccgcccagc 26040 cccgccacct ccgacgcggc cgtcccagac atgcaagaga tggaggaatc catcgagatt 26100 gacctgggct atgtgacgcc cgcggagcac gaggaggagc tggcagtgcg cttttcacaa 26160 gaagagatac accaagaaca gccagagcag gaagcagaga atgagcagag tcaggctggg 26220 ctcgagcatg acggcgacta cctccacctg agcggggggg aggacgcgct catcaagcat 26280 ctggcccggc aggccaccat cgtcaaggat gcgctgctcg accgcaccga ggtgcccctc 26340 agcgtggagg agctcagccg cgcctacgag ttgaacctct tctcgccgcg cgtgcccccc 26400 aagcgccagc ccaatggcac ctgcgagccc aacccgcgcc tcaacttcta cccggtcttc 26460 gcggtgcccg aggccctggc cacctaccac atctttttca agaaccaaaa gatccccgtc 26520 tcctgccgcg ccaaccgcac ccgcgccgac gcccttttca acctgggtcc cggcgcccgc 26580 ctacctgata tcgcctcctt ggaagaggtt cccaagatct tcgagggtct gggcagcgac 26640 gagactcggg ccgcgaacgc tctgcaagga gaaggaggag agcatgagca ccacagcgcc 26700 ctggtcgagt tggaaggcga caacgcgcgg ctggcggtgc tcaaacgcac ggtcgagctg 26760 acccatttcg cctacccggc tctgaacctg ccccccaaag tcatgagcgc ggtcatggac 26820 caggtgctca tcaagcgcgc gtcgcccatc tccgaggacg agggcatgca agactccgag 26880 gagggcaagc ccgtggtcag cgacgagcag ctggcccggt ggctgggtcc taatgctagt 26940 ccccagagtt tggaagagcg gcgcaaactc atgatggccg tggtcctggt gaccgtggag 27000 ctggagtgcc tgcgccgctt cttcgccgac gcggagaccc tgcgcaaggt cgaggagaac 27060 ctgcactacc tcttcaggca cgggttcgtg cgccaggcct gcaagatctc caacgtggag 27120 ctgaccaacc tggtctccta catgggcatc ttgcacgaga accgcctggg gcagaacgtg 27180 ctgcacacca ccctgcgcgg ggaggcccgg cgcgactaca tccgcgactg cgtctacctc 27240 tacctctgcc acacctggca gacgggcatg ggcgtgtggc agcagtgtct ggaggagcag 27300 aacctgaaag agctctgcaa gctcctgcag aagaacctca agggtctgtg gaccgggttc 27360 gacgagcgca ccaccgcctc ggacctggcc gacctcattt tccccgagcg cctcaggctg 27420 acgctgcgca acggcctgcc cgactttatg agccaaagca tgttgcaaaa ctttcgctct 27480 ttcatcctcg aacgctccgg aatcctgccc gccacctgct ccgcgctgcc ctcggacttc 27540 gtgccgctga ccttccgcga gtgccccccg ccgctgtgga gccactgcta cctgctgcgc 27600 ctggccaact acctggccta ccactcggac gtgatcgagg acgtcagcgg cgagggcctg 27660 ctcgagtgcc actgccgctg caacctctgc acgccgcacc gctccctggc ctgcaacccc 27720 cagctgctga gcgagaccca gatcatcggc accttcgagt tgcaagggcc cagcgaaggc 27780 gagggttcag ccgccaaggg gggtctgaaa ctcaccccgg ggctgtggac ctcggcctac 27840 ttgcgcaagt tcgtgcccga ggactaccat cccttcgaga tcaggttcta cgaggaccaa 27900 tcccatccgc ccaaggccga gctgtcggcc tgcgtcatca cccagggggc gatcctggcc 27960 caattgcaag ccatccagaa atcccgccaa gaattcttgc tgaaaaaggg ccgcggggtc 28020 tacctcgacc cccagaccgg tgaggagctc aaccccggct tcccccagga tgccccgagg 28080 aaacaagaag ctgaaagtgg agctgccgcc cgtggaggat ttggaggaag actgggagaa 28140 cagcagtcag gcagaggagg aggagatgga ggaagactgg gacagcactc aggcagagga 28200 ggacagcctg caagacagtc tggaggaaga cgaggaggag gcagaggagg aggtggaaga 28260 agcagccgcc gccagaccgt cgtcctcggc gggggagaaa gcaagcagca cggataccat 28320 ctccgctccg ggtcggggtc ccgctcgacc acacagtaga tgggacgaga ccggacgatt 28380 cccgaacccc accacccaga ccggtaagaa ggagcggcag ggatacaagt cctggcgggg 28440 gcacaaaaac gccatcgtct cctgcttgca ggcctgcggg ggcaacatct ccttcacccg 28500 gcgctacctg ctcttccacc gcggggtgaa ctttccccgc aacatcttgc attactaccg 28560 tcacctccac agcccctact acttccaaga agaggcagca gcagcagaaa aagaccagca 28620 gaaaaccagc agctagaaaa tccacagcgg cggcagcagg tggactgagg atcgcggcga 28680 acgagccggc gcaaacccgg gagctgagga accggatctt tcccaccctc tatgccatct 28740 tccagcagag tcgggggcag gagcaggaac tgaaagtcaa gaaccgttct ctgcgctcgc 28800 tcacccgcag ttgtctgtat cacaagagcg aagaccaact tcagcgcact ctcgaggacg 28860 ccgaggctct cttcaacaag tactgcgcgc tcactcttaa agagtagccc gcgcccgccc 28920 agtcgcagaa aaaggcggga attacgtcac ctgtgccctt cgccctagcc gcctccaccc 28980 atcatcatga gcaaagagat tcccacgcct tacatgtgga gctaccagcc ccagatgggc 29040 ctggccgccg gtgccgccca ggactactcc acccgcatga attggctcag cgccgggccc 29100 gcgatgatct cacgggtgaa tgacatccgc gcccaccgaa accagatact cctagaacag 29160 tcagcgctca ccgccacgcc ccgcaatcac ctcaatccgc gtaattggcc cgccgccctg 29220 gtgtaccagg aaattcccca gcccacgacc gtactacttc cgcgagacgc ccaggccgaa 29280 gtccagctga ctaactcagg tgtccagctg gcgggcggcg ccaccctgtg tcgtcaccgc 29340 cccgctcagg gtataaagcg gctggtgatc cggggcagag gcacacagct caacgacgag 29400 gtggtgagct cttcgctggg tctgcgacct gacggagtct tccaactcgc cggatcgggg 29460 agatcttcct tcacgcctcg tcaggccgtc ctgactttgg agagttcgtc ctcgcagccc 29520 cgctcgggtg gcatcggcac tctccagttc gtggaggagt tcactccctc ggtctacttc 29580 aaccccttct ccggctcccc cggccactac ccggacgagt tcatcccgaa cttcgacgcc 29640 atcagcgagt cggtggacgg ctacgattga aactaatcac ccccttatcc agtgaaataa 29700 agatcatatt gatgatgatt ttacagaaat aaaaaataat catttgattt gaaataaaga 29760 tacaatcata ttgatgattt gagtttaaca aaaaaataaa gaatcactta cttgaaatct 29820 gataccaggt ctctgtccat gttttctgcc aacaccactt cactcccctc ttcccagctc 29880 tggtactgca ggccccggcg ggctgcaaac ttcctccaca cgctgaaggg gatgtcaaat 29940 tcctcctgtc cctcaatctt cattttatct tctatcagat gtccaaaaag cgcgtccggg 30000 tggatgatga cttcgacccc gtctacccct acgatgcaga caacgcaccg accgtgccct 30060 tcatcaaccc ccccttcgtc tcttcagatg gattccaaga gaagcccctg ggggtgttgt 30120 ccctgcgact ggccgacccc gtcaccacca agaacgggga aatcaccctc aagctgggag 30180 agggggtgga cctcgattcc tcgggaaaac tcatctccaa cacggccacc aaggccgccg 30240 cccctctcag tttttccaac aacaccattt cccttaacat ggatcacccc ttttacacta 30300 aagatggaaa attatcctta caagtttctc caccattaaa tatactgaga acaagcattc 30360 taaacacact agctttaggt tttggatcag gtttaggact ccgtggctct gccttggcag 30420 tacagttagt ctctccactt acatttgata ctgatggaaa cataaagctt accttagaca 30480 gaggtttgca tgttacaaca ggagatgcaa ttgaaagcaa cataagctgg gctaaaggtt 30540 taaaatttga agatggagcc atagcaacca acattggaaa tgggttagag tttggaagca 30600 gtagtacaga aacaggtgtt gatgatgctt acccaatcca agttaaactt ggatctggcc 30660 ttagctttga cagtacagga gccataatgg ctggtaacaa agaagacgat aaactcactt 30720 tgtggacaac acctgatcca tcaccaaact gtcaaatact cgcagaaaat gatgcaaaac 30780 taacactttg cttgactaaa tgtggtagtc aaatactggc cactgtgtca gtcttagttg 30840 taggaagtgg aaacctaaac cccattactg gcaccgtaag cagtgctcag gtgtttctac 30900 gttttgatgc aaacggtgtt cttttaacag aacattctac actaaaaaaa tactgggggt 30960 ataggcaggg agatagcata gatggcactc catataccaa tgctgtagga ttcatgccca 31020 atttaaaagc ttatccaaag tcacaaagtt ctactactaa aaataatata gtagggcaag 31080 tatacatgaa tggagatgtt tcaaaaccta tgcttctcac tataaccctc aatggtactg 31140 atgacagcaa cagtacatat tcaatgtcat tttcatacac ctggactaat ggaagctatg 31200 ttggagcaac atttggggct aactcttata ccttctcata catcgcccaa gaatgaacac 31260 tgtatcccac cctgcatgcc aacccttccc accccactct gtggaacaaa ctctgaaaca 31320 caaaataaaa taaagttcaa gtgttttatt gattcaacag ttttacagga ttcgagcagt 31380 tatttttcct ccaccctccc aggacatgga atacaccacc ctctcccccc gcacagcctt 31440 gaacatctga atgccattgg tgatggacat gcttttggtc tccacgttcc acacagtttc 31500 agagcgagcc agtctcgggt cggtcaggga gatgaaaccc tccgggcact cccgcatctg 31560 cacctcacag ctcaacagct gaggattgtc ctcggtggtc gggatcacgg ttatctggaa 31620 gaagcagaag agcggcggtg ggaatcatag tccgcgaacg ggatcggccg gtggtgtcgc 31680 atcaggcccc gcagcagtcg ctgccgccgc cgctccgtca agctgctgct cagggggtcc 31740 gggtccaggg actccctcag catgatgccc acggccctca gcatcagtcg tctggtgcgg 31800 cgggcgcagc agcgcatgcg gatctcgctc aggtcgctgc agtacgtgca acacagaacc 31860 accaggttgt tcaacagtcc atagttcaac acgctccagc cgaaactcat cgcgggaagg 31920 atgctaccca cgtggccgtc gtaccagatc ctcaggtaaa tcaagtggtg ccccctccag 31980 aacacgctgc ccacgtacat gatctccttg ggcatgtggc ggttcaccac ctcccggtac 32040 cacatcaccc tctggttgaa catgcagccc cggatgatcc tgcggaacca cagggccagc 32100 accgccccgc ccgccatgca gcgaagagac cccgggtccc ggcaatggca atggaggacc 32160 caccgctcgt acccgtggat catctgggag ctgaacaagt ctatgttggc acagcacagg 32220 catatgctca tgcatctctt cagcactctc aactcctcgg gggtcaaaac catatcccag 32280 ggcacgggga actcttgcag gacagcgaac cccgcagaac agggcaatcc tcgcacagaa 32340 cttacattgt gcatggacag ggtatcgcaa tcaggcagca ccgggtgatc ctccaccaga 32400 gaagcgcggg tctcggtctc ctcacagcgt ggtaaggggg ccggccgata cgggtgatgg 32460 cgggacgcgg ctgatcgtgt tcgcgaccgt gtcatgatgc agttgctttc ggacattttc 32520 gtacttgctg tagcagaacc tggtccgggc gctgcacacc gatcgccggc ggcggtctcg 32580 gcgcttggaa cgctcggtgt tgaaattgta aaacagccac tctctcagac cgtgcagcag 32640 atctagggcc tcaggagtga tgaagatccc atcatgcctg atggctctga tcacatcgac 32700 caccgtggaa tgggccagac ccagccagat gatgcaattt tgttgggttt cggtgacggc 32760 gggggaggga agaacaggaa gaaccatgat taacttttaa tccaaacggt ctcggagtac 32820 ttcaaaatga agatcgcgga gatggcacct ctcgcccccg ctgtgttggt ggaaaataac 32880 agccaggtca aaggtgatac ggttctcgag atgttccacg gtggcttcca gcaaagcctc 32940 cacgcgcaca tccagaaaca agacaatagc gaaagcggga gggttctcta attcctcaat 33000 catcatgtta cactcctgca ccatccccag ataattttca tttttccagc cttgaatgat 33060 tcgaactagt tcctgaggta aatccaagcc agccatgata aagagctcgc gcagagcgcc 33120 ctccaccggc attcttaagc acaccctcat aattccaaga tattctgctc ctggttcacc 33180 tgcagcagat tgacaagcgg aatatcaaaa tctctgccgc gatccctgag ctcctccctc 33240 agcaataact gtaagtactc tttcatatcc tctccgaaat ttttagccat aggaccacca 33300 ggaataagat tagggcaagc cacagtacag ataaaccgaa gtcctcccca gtgagcattg 33360 ccaaatgcaa gactgctata agcatgctgg ctagacccgg tgatatcttc cagataactg 33420 gacagaaaat cgcccaggca atttttaaga aaatcaacaa aagaaaaatc ctccaggtgg 33480 acgtttagag cctcgggaac aacgatgaag taaatgcaag cggtgcgttc cagcatggtt 33540 agttagctga tctgtagaaa aaacaaaaat gaacattaaa ccatgctagc ctggcgaaca 33600 ggtgggtaaa tcgttctctc cagcaccagg caggccacgg ggtctccggc gcgaccctcg 33660 taaaaattgt cgctatgatt gaaaaccatc acagagagac gttcccggtg gccggcgtga 33720 atgattcgac aagatgaata cacccccgga acattggcgt ccgcgagtga aaaaaagcgc 33780 ccgaggaagc aataaggcac tacaatgctc agtctcaagt ccagcaaagc gatgccatgc 33840 ggatgaagca caaaattctc aggtgcgtac aaaatgtaat tactcccctc ctgcacaggc 33900 agcaaagccc ccgatccctc caggtacaca tacaaagcct cagcgtccat agcttaccga 33960 gcagcagcac acaacaggcg caagagtcag agaaaggctg agctctaacc tgtccacccg 34020 ctctctgctc aatatatagc ccagatctac actgacgtaa aggccaaagt ctaaaaatac 34080 ccgccaaata atcacacacg cccagcacac gcccagaaac cggtgacaca ctcaaaaaaa 34140 tacgcgcact tcctcaaacg cccaaaactg ccgtcatttc cgggttccca cgctacgtca 34200 tcaaaacacg actttcaaat tccgtcgacc gttaaaaacg tcacccgccc cgcccctaac 34260 ggtcgcccgt ctctcagcca atcagcgccc cgcatcccca aattcaaaca cctcatttgc 34320 atattaacgc gcacaaaaag tttgaggtat attattgatg atg 34363 <210> 58 <211> 656 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 58 gacattgatt attgactagt tgttaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtgatgcggt tttggcagta caccaatggg cgtggatagc 420 ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480 ggcaccaaaa tcaacgggac tttccaaaat gtcgtaataa ccccgccccg ttgacgcaaa 540 tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctcgttta gtgaaccgtc 600 agatcgcctg gaacgccatc cacgctgttt tgacctccat agaagacagc gatcgc 656 <210> 59 <211> 550 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 59 cgttactggc cgaagccgct tggaataagg ccggtgtgcg tttgtctata tgttattttc 60 caccatattg ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac 120 gagcattcct aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt 180 gaaggaagca gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg 240 caggcagcgg aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata 300 agatacacct gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga 360 aagagtcaaa tggctctcct caagcgtatt caacaagggg ctgaaggatg cccagaaggt 420 accccattgt atgggatctg atctggggcc tcggtgcaca tgctttacat gtgtttagtc 480 gaggttaaaa aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca 540 cgatgataat 550 <210> 60 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 60 atgggctggt ccctgatcct gctgttcctg gtggctgtgg ccacc 45 <210> 61 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 61 atgggatgga gctggatctt tctcttcctc ctgtcaggaa ctgca 45 <210> 62 <211> 366 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 62 ggagtgcatt ctgaggccaa gttacaggag tctggacctg tgctggttaa acctggagct 60 tctgtgaaga tgagctgtaa ggccagcggc tacaccttta ccgactacta catgaactgg 120 gtgaagcagt ctcacggaaa gtctctggag tggatcggcg tgatcaaccc ctacaatggc 180 gatacaagct acaaccagaa gttcaagggc aaggccaccc tgaccgtgga taagagcagc 240 tctacagcct atatggagct gaatagcctg acaagcgagg attctgccgt gtactactgc 300 gcccggtatt atggcagctg gtttgcctat tggggacaag gaacactgat taccgtgtct 360 acagcc 366 <210> 63 <211> 1005 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 63 aaaacaacac ccccatcagt ctatccactg gcccctgggt gtggagatac aactggttcc 60 tccgtgactc tgggatgcct ggtcaagggc tacttccctg agtcagtgac tgtgacttgg 120 aactctggat ccctgtccag cagtgtgcac accttcccag ctctcctgca gtctggactc 180 tacactatga gcagctcagt gactgtcccc tccagcacct ggccaagtca gaccgtcacc 240 tgcagcgttg ctcacccagc cagcagcacc acggtggaca aaaaacttga gcccagcggg 300 cccatttcaa caatcaaccc ctgtcctcca tgcaaggagt gtcacaaatg cccagctcct 360 aacctggagg gtggaccatc cgtcttcatc ttccctccaa atatcaagga tgtactcatg 420 atctccctga cacccaaggt cacgtgtgtg gtggtggatg tgagcgagga tgacccagac 480 gtccagatca gctggtttgt gaacaacgtg gaagtacaca cagctcagac acaaacccat 540 agagaggatt acaacagtac tatccgggtg gtcagcaccc tccccatcca gcaccaggac 600 tggatgagtg gcaaggagtt caaatgcaag gtcaacaaca aagacctccc atcacccatc 660 gagagaacca tctcaaaaat taaagggcta gtcagagctc cacaagtata catcttgccg 720 ccaccagcag agcagttgtc caggaaagat gtcagtctca cttgcctggt cgtgggcttc 780 aaccctggag acatcagtgt ggagtggacc agcaatgggc atacagagga gaactacaag 840 gacaccgcac cagtcctgga ctctgacggt tcttacttca tatatagcaa gctcaatatg 900 aaaacaagca agtgggagaa aacagattcc ttctcatgca acgtgagaca cgagggtctg 960 aaaaattact acctgaagaa gaccatctcc cggtctccgg gtaaa 1005 <210> 64 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 64 cgcaaacgga ga 12 <210> 65 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 65 ggcgtcagag ctgaaggtag aggctctttg ctcacctgtg gagatgtgga agagaaccct 60 ggaccc 66 <210> 66 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 66 atggacatga gagtgcctgc tcaacttctg ggactgctgt tactgtggct tcctg 55 <210> 67 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 67 atgaagttgc ctgttaggct gttggtgctg atgttctgga ttcctg 46 <210> 68 <211> 668 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 68 gagctagatg cgatatcgtg atgacccaga caacactgtc tctgcctgtg tctctgggag 60 atcaggcctc tatcagctgt agatctagcc agagcattgt gcactctaac ggcaacacct 120 acctggagtg gtacctgcag aaaccaggac aaagccctaa gctgctgatc tacaaagtga 180 gcaaccggtt tagcggcgtg cccgacagat tttctggatc tggctctggc accgatttta 240 cactgaagat cagcagagtg gaggccgagg atctgggagt gtactactgc tttcagggct 300 ctcatgtgcc ttacacattt ggaggaggaa ccaagctgga gatcaagcgg gctgatgctg 360 caccaactgt atccatcttc ccaccatcca gtgagcagtt aacatctgga ggtgcctcag 420 tcgtgtgctt cttgaacaac ttctacccca aagacatcaa tgtcaagtgg aagattgatg 480 gcagtgaacg acaaaatggc gtcctgaaca gttggactga tcaggacagc aaagacagca 540 cctacagcat gagcagcacc ctcacgttga ccaaggacga gtatgaacga cataacagct 600 atacctgtga ggccactcac aagacatcaa cttcacccat tgtcaagagc ttcaacagga 660 atgagtgt 668 <210> 69 <211> 224 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 69 agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa 60 atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa 120 taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg gggagatgtg 180 ggaggttttt taaagcaagt aaaacctcta caaatgtggt aaaa 224 <210> 70 <211> 3483 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 70 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480 ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct ttacaagtag 720 tgagtttaaa ctccaagtcc ctgtaccgtt actggccgaa gccgcttgga ataaggccgg 780 tgtgcgtttg tctatatgtt attttccacc atattgccgt cttttggcaa tgtgagggcc 840 cggaaacctg gccctgtctt cttgacgagc attcctaggg gtctttcccc tctcgccaaa 900 ggaatgcaag gtctgttgaa tgtcgtgaag gaagcagttc ctctggaagc ttcttgaaga 960 caaacaacgt ctgtagcgac cctttgcagg cagcggaacc ccccacctgg cgacaggtgc 1020 ctctgcggcc aaaagccacg tgtataagat acacctgcaa aggcggcaca accccagtgc 1080 cacgttgtga gttggatagt tgtggaaaga gtcaaatggc tctcctcaag cgtattcaac 1140 aaggggctga aggatgccca gaaggtaccc cattgtatgg gatctgatct ggggcctcgg 1200 tgcacatgct ttacatgtgt ttagtcgagg ttaaaaaacg tctaggcccc ccgaaccacg 1260 gggacgtggt tttcctttga aaaacacgat gataatatgg agttcggcct ctcttgggtt 1320 ttcttggtcg ctttgcttag aggggtacaa tgtcaagtcc aattggttga gtctggtggt 1380 ggtgtagttc aaccaggacg gtcacttcgg ctctcctgtg ccgcatccgg gttcactttc 1440 agttcttaca caatgcactg ggttagacaa gcccctggta agggtttgga gtgggtaacg 1500 ttcatctcct acgacgggaa taataagtac tacgccgact cagtcaaggg gcgattcacg 1560 atatcccgag acaattcaaa gaatacactc tatctccaaa tgaattcact ccgggctgag 1620 gacactgcaa tctactactg tgcacggaca ggttggttgg gacccttcga ctactggggt 1680 caaggaacac tcgtaacagt ctcatccgcc tctacaaagg gtccatctgt attcccattg 1740 gcaccttcct ctaagagtac atcaggcggg acagctgctc ttggttgttt ggtcaaggac 1800 tacttccctg agcctgtaac tgtatcttgg aattctggtg cactcacttc tggagtacac 1860 actttccccg ccgtcttgca atcatccggg ctctactcac tctcttcagt agtaacggta 1920 ccatcaagta gtctcggaac tcaaacgtac atctgtaatg ttaatcacaa gccttctaat 1980 actaaggtcg acaagagagt cgagcccaag agttgtgaca agacacacac ttgtccacct 2040 tgtcccgccc ctgagttgct cggtggacca tcagtcttct tgtttccccc aaagccaaag 2100 gacacactca tgatctcccg tactccagag gttacttgtg tcgtcgtcga cgtctcccac 2160 gaggaccctg aggttaagtt caattggtac gtcgacggtg tcgaggtcca caatgcaaag 2220 acaaagccta gggaagagca atacaattcc acgtaccggg tagtctccgt tctcacagtt 2280 ctccaccaag actggttgaa tggaaaggag tacaagtgta aggtcagtaa taaggccctt 2340 cccgccccta tcgagaagac aatctccaag gctaaggggc aacctagaga gccccaagta 2400 tacacattgc ccccaagtcg ggacgagctc acaaagaatc aagtttcctt gacatgtctt 2460 gttaaggggt tctacccatc agacatcgca gttgagtggg agtccaatgg gcaacctgag 2520 aataattaca agactacacc acccgtcctt gacagtgacg gttcattctt cctctacagt 2580 aagttgacgg ttgacaagag tcggtggcaa caaggaaatg tcttctcctg ttcagtaatg 2640 cacgaggctc tccacaatca ctacactcaa aagtccttgt ccctttctcc cggtaagcgg 2700 aagagacgag gggtcagggc cgaggggcgg ggttctcttc tcacatgtgg agacgtcgag 2760 gagaatcctg gtcctatgga gactcccgcc caattgttgt tcttgctcct cttgtggctt 2820 cccgacacaa ctggggagat cgtcctcaca caatctcccg ggacgctttc actctctcca 2880 ggagagcggg ccacgctcag ttgtagagca agtcaaagtg tcgggtcatc atacttggcc 2940 tggtaccaac aaaagccagg gcaagccccc agacttttga tctacggggc cttctcccga 3000 gccacaggta tacccgaccg gttctccgga tccggttcag gaacggactt cacactcact 3060 atctcaagat tggagcccga ggacttcgcc gtatactact gtcaacaata cggttccagt 3120 ccctggacgt tcggtcaagg gacaaaggtt gagataaagc ggacagtcgc cgctccgtcc 3180 gtcttcatct tcccaccttc cgacgagcaa ctcaagtctg gaacagcttc tgtcgtttgt 3240 ctcctcaata atttctaccc ccgcgaggca aaggttcaat ggaaggtaga caatgctctc 3300 caaagtggga atagtcaaga gtctgttaca gagcaagaca gtaaggactc tacatacagt 3360 ttgtcatcta cacttacact ttctaaggcc gactacgaga agcacaaggt atacgcctgt 3420 gaggtcactc accaaggatt gtcaagtcca gtcacgaagt cattcaatcg aggagagtgt 3480 taa 3483 <210> 71 <211> 34363 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 71 catcatcaat aatatacctc aaactttttg tgcgcgttaa tatgcaaatg aggcgtttga 60 atttggggag gaagggcggt gattggtcga gggatgagcg accgttaggg gcggggcgag 120 tgacgttttg atgacgtggt tgcgaggagg agccagtttg caagttctcg tgggaaaagt 180 gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca 240 ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg 300 aatgaggaag tgaaaatctg agtaatttcg cgtttatggc agggaggagt atttgccgag 360 ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtgtttt tcacctaaat 420 ttccgcgtac ggtgtcaaag tccggtgttt ttacgtaggt gtcagctgat cgccagggta 480 tttaaacctg cgctctccag tcaagaggcc actcttgagt gccagcgaga agagttttct 540 cctccgcgcc gcgagtcaga tctacacttt gaaagtaggg ataacagggt aatgacattg 600 attattgact agttgttaat agtaatcaat tacggggtca ttagttcata gcccatatat 660 ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc 720 ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca 780 ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta 840 tcatatgcca agtccgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta 900 tgcccagtac atgaccttac gggactttcc tacttggcag tacatctacg tattagtcat 960 cgctattacc atggtgatgc ggttttggca gtacaccaat gggcgtggat agcggtttga 1020 ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca 1080 aaatcaacgg gactttccaa aatgtcgtaa taaccccgcc ccgttgacgc aaatgggcgg 1140 taggcgtgta cggtgggagg tctatataag cagagctcgt ttagtgaacc gtcagatcgc 1200 ctggaacgcc atccacgctg ttttgacctc catagaagac agcgatcgcg ccaccatggc 1260 cgggatgttc caggcactgt ccgaaggctg cacaccctat gatattaacc agatgctgaa 1320 tgtcctggga gaccaccagg tctctggcct ggagcagctg gagagcatca tcaacttcga 1380 gaagctgacc gagtggacaa gctccaatgt gatgcctatc ctgtccccac tgaccaaggg 1440 catcctgggc ttcgtgttta ccctgacagt gccttctgag cggggcctgt cttgcatcag 1500 cgaggcagac gcaaccacac cagagtccgc caatctgggc gaggagatcc tgtctcagct 1560 gtacctgtgg ccccgggtga catatcactc cccttcttac gcctatcacc agttcgagcg 1620 gagagccaag tacaagagac acttcccagg ctttggccag tctctgctgt tcggctaccc 1680 cgtgtacgtg ttcggcgatt gcgtgcaggg cgactgggat gccatccggt ttagatactg 1740 cgcaccacct ggatatgcac tgctgaggtg taacgacacc aattattccg ccctgctggc 1800 agtgggcgcc ctggagggcc ctcgcaatca ggattggctg ggcgtgccaa ggcagctggt 1860 gacacgcatg caggccatcc agaacgcagg cctgtgcacc ctggtggcaa tgctggagga 1920 gacaatcttc tggctgcagg cctttctgat ggccctgacc gacagcggcc ccaagacaaa 1980 catcatcgtg gattcccagt acgtgatggg catctccaag ccttctttcc aggagtttgt 2040 ggactgggag aacgtgagcc cagagctgaa ttccaccgat cagccattct ggcaggcagg 2100 aatcctggca aggaacctgg tgcctatggt ggccacagtg cagggccaga atctgaagta 2160 ccagggccag agcctggtca tcagcgcctc catcatcgtg tttaacctgc tggagctgga 2220 gggcgactat cgggacgatg gcaacgtgtg ggtgcacacc ccactgagcc ccagaacact 2280 gaacgcctgg gtgaaggccg tggaggagaa gaagggcatc ccagtgcacc tggagctggc 2340 ctccatgacc aatatggagc tgatgtctag catcgtgcac cagcaggtga ggacatacgg 2400 acccgtgttc atgtgcctgg gaggcctgct gaccatggtg gcaggagccg tgtggctgac 2460 agtgcgggtg ctggagctgt tcagagccgc ccagctggcc aacgatgtgg tgctgcagat 2520 catggagctg tgcggagcag cctttcgcca ggtgtgccac accacagtgc catggcccaa 2580 tgcctccctg acccccaagt ggaacaatga gacaacacag cctcagatcg ccaactgtag 2640 cgtgtacgac ttcttcgtgt ggctgcacta ctatagcgtg agggataccc tgtggccccg 2700 cgtgacatac cacatgaata agtacgccta tcacatgctg gagaggcgcg ccaagtataa 2760 gagaggccct ggcccaggcg caaagtttgt ggcagcatgg accctgaagg ccgccgccgg 2820 ccccggcccc ggccagtata tcaaggctaa cagtaagttc attggaatca cagagctggg 2880 acccggacct ggataatgag tttaaactcc aagtccctgt accgttactg gccgaagccg 2940 cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat tgccgtcttt 3000 tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc ctaggggtct 3060 ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct 3120 ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc ggaacccccc 3180 acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac ctgcaaaggc 3240 ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca aatggctctc 3300 ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt gtatgggatc 3360 tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa aaaacgtcta 3420 ggccccccga accacgggga cgtggttttc ctttgaaaaa cacgatgata atatggagtt 3480 cggcctctct tgggttttct tggtcgcttt gcttagaggg gtacaatgtc aagtccaatt 3540 ggttgagtct ggtggtggtg tagttcaacc aggacggtca cttcggctct cctgtgccgc 3600 atccgggttc actttcagtt cttacacaat gcactgggtt agacaagccc ctggtaaggg 3660 tttggagtgg gtaacgttca tctcctacga cgggaataat aagtactacg ccgactcagt 3720 caaggggcga ttcacgatat cccgagacaa ttcaaagaat acactctatc tccaaatgaa 3780 ttcactccgg gctgaggaca ctgcaatcta ctactgtgca cggacaggtt ggttgggacc 3840 cttcgactac tggggtcaag gaacactcgt aacagtctca tccgcctcta caaagggtcc 3900 atctgtattc ccattggcac cttcctctaa gagtacatca ggcgggacag ctgctcttgg 3960 ttgtttggtc aaggactact tccctgagcc tgtaactgta tcttggaatt ctggtgcact 4020 cacttctgga gtacacactt tccccgccgt cttgcaatca tccgggctct actcactctc 4080 ttcagtagta acggtaccat caagtagtct cggaactcaa acgtacatct gtaatgttaa 4140 tcacaagcct tctaatacta aggtcgacaa gagagtcgag cccaagagtt gtgacaagac 4200 acacacttgt ccaccttgtc ccgcccctga gttgctcggt ggaccatcag tcttcttgtt 4260 tcccccaaag ccaaaggaca cactcatgat ctcccgtact ccagaggtta cttgtgtcgt 4320 cgtcgacgtc tcccacgagg accctgaggt taagttcaat tggtacgtcg acggtgtcga 4380 ggtccacaat gcaaagacaa agcctaggga agagcaatac aattccacgt accgggtagt 4440 ctccgttctc acagttctcc accaagactg gttgaatgga aaggagtaca agtgtaaggt 4500 cagtaataag gcccttcccg cccctatcga gaagacaatc tccaaggcta aggggcaacc 4560 tagagagccc caagtataca cattgccccc aagtcgggac gagctcacaa agaatcaagt 4620 ttccttgaca tgtcttgtta aggggttcta cccatcagac atcgcagttg agtgggagtc 4680 caatgggcaa cctgagaata attacaagac tacaccaccc gtccttgaca gtgacggttc 4740 attcttcctc tacagtaagt tgacggttga caagagtcgg tggcaacaag gaaatgtctt 4800 ctcctgttca gtaatgcacg aggctctcca caatcactac actcaaaagt ccttgtccct 4860 ttctcccggt aagcggaaga gacgaggggt cagggccgag gggcggggtt ctcttctcac 4920 atgtggagac gtcgaggaga atcctggtcc tatggagact cccgcccaat tgttgttctt 4980 gctcctcttg tggcttcccg acacaactgg ggagatcgtc ctcacacaat ctcccgggac 5040 gctttcactc tctccaggag agcgggccac gctcagttgt agagcaagtc aaagtgtcgg 5100 gtcatcatac ttggcctggt accaacaaaa gccagggcaa gcccccagac ttttgatcta 5160 cggggccttc tcccgagcca caggtatacc cgaccggttc tccggatccg gttcaggaac 5220 ggacttcaca ctcactatct caagattgga gcccgaggac ttcgccgtat actactgtca 5280 acaatacggt tccagtccct ggacgttcgg tcaagggaca aaggttgaga taaagcggac 5340 agtcgccgct ccgtccgtct tcatcttccc accttccgac gagcaactca agtctggaac 5400 agcttctgtc gtttgtctcc tcaataattt ctacccccgc gaggcaaagg ttcaatggaa 5460 ggtagacaat gctctccaaa gtgggaatag tcaagagtct gttacagagc aagacagtaa 5520 ggactctaca tacagtttgt catctacact tacactttct aaggccgact acgagaagca 5580 caaggtatac gcctgtgagg tcactcacca aggattgtca agtccagtca cgaagtcatt 5640 caatcgagga gagtgttaat gaatttaaat gtgagggtta atgcttcgag cagacatgat 5700 aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat 5760 ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt 5820 taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt 5880 ttaaagcaag taaaacctct acaaatgtgg taaaataact ataacggtcc taaggtagcg 5940 agtgagtagt gttctggggc gggggaggac ctgcatgagg gccagaataa ctgaaatctg 6000 tgcttttctg tgtgttgcag cagcatgagc ggaagcggct cctttgaggg aggggtattc 6060 agcccttatc tgacggggcg tctcccctcc tgggcgggag tgcgtcagaa tgtgatggga 6120 tccacggtgg acggccggcc cgtgcagccc gcgaactctt caaccctgac ctatgcaacc 6180 ctgagctctt cgtcgttgga cgcagctgcc gccgcagctg ctgcatctgc cgccagcgcc 6240 gtgcgcggaa tggccatggg cgccggctac tacggcactc tggtggccaa ctcgagttcc 6300 accaataatc ccgccagcct gaacgaggag aagctgttgc tgctgatggc ccagctcgag 6360 gccttgaccc agcgcctggg cgagctgacc cagcaggtgg ctcagctgca ggagcagacg 6420 cgggccgcgg ttgccacggt gaaatccaaa taaaaaatga atcaataaat aaacggagac 6480 ggttgttgat tttaacacag agtctgaatc tttatttgat ttttcgcgcg cggtaggccc 6540 tggaccaccg gtctcgatca ttgagcaccc ggtggatctt ttccaggacc cggtagaggt 6600 gggcttggat gttgaggtac atgggcatga gcccgtcccg ggggtggagg tagctccatt 6660 gcagggcctc gtgctcgggg gtggtgttgt aaatcaccca gtcatagcag gggcgcaggg 6720 catggtgttg cacaatatct ttgaggagga gactgatggc cacgggcagc cctttggtgt 6780 aggtgtttac aaatctgttg agctgggagg gatgcatgcg gggggagatg aggtgcatct 6840 tggcctggat cttgagattg gcgatgttac cgcccagatc ccgcctgggg ttcatgttgt 6900 gcaggaccac cagcacggtg tatccggtgc acttggggaa tttatcatgc aacttggaag 6960 ggaaggcgtg aaagaatttg gcgacgcctt tgtgcccgcc caggttttcc atgcactcat 7020 ccatgatgat ggcgatgggc ccgtgggcgg cggcctgggc aaagacgttt cgggggtcgg 7080 acacatcata gttgtggtcc tgggtgaggt catcataggc cattttaatg aatttggggc 7140 ggagggtgcc ggactggggg acaaaggttc cctcgatccc gggggcgtag ttcccctcac 7200 agatctgcat ctcccaggct ttgagctcgg agggggggat catgtccacc tgcggggcga 7260 taaagaacac ggtttccggg gcgggggaga tgagctgggc cgaaagcaag ttccggagca 7320 gctgggactt gccgcagccg gtggggccgt agatgacccc gatgaccggc tgcaggtggt 7380 agttgaggga gagacagctg ccgtcctccc ggaggagggg ggccacctcg ttcatcatct 7440 cgcgcacgtg catgttctcg cgcaccagtt ccgccaggag gcgctctccc cccagggata 7500 ggagctcctg gagcgaggcg aagtttttca gcggcttgag tccgtcggcc atgggcattt 7560 tggagagggt ttgttgcaag agttccaggc ggtcccagag ctcggtgatg tgctctacgg 7620 catctcgatc cagcagacct cctcgtttcg cgggttggga cggctgcggg agtagggcac 7680 cagacgatgg gcgtccagcg cagccagggt ccggtccttc cagggtcgca gcgtccgcgt 7740 cagggtggtc tccgtcacgg tgaaggggtg cgcgccgggc tgggcgcttg cgagggtgcg 7800 cttcaggctc atccggctgg tcgaaaaccg ctcccgatcg gcgccctgcg cgtcggccag 7860 gtagcaattg accatgagtt cgtagttgag cgcctcggcc gcgtggcctt tggcgcggag 7920 cttacctttg gaagtctgcc cgcaggcggg acagaggagg gacttgaggg cgtagagctt 7980 gggggcgagg aagacggact cgggggcgta ggcgtccgcg ccgcagtggg cgcagacggt 8040 ctcgcactcc acgagccagg tgaggtcggg ctggtcgggg tcaaaaacca gtttcccgcc 8100 gttctttttg atgcgtttct tacctttggt ctccatgagc tcgtgtcccc gctgggtgac 8160 aaagaggctg tccgtgtccc cgtagaccga ctttatgggc cggtcctcga gcggtgtgcc 8220 gcggtcctcc tcgtagagga accccgccca ctccgagacg aaagcccggg tccaggccag 8280 cacgaaggag gccacgtggg acgggtagcg gtcgttgtcc accagcgggt ccaccttttc 8340 cagggtatgc aaacacatgt ccccctcgtc cacatccagg aaggtgattg gcttgtaagt 8400 gtaggccacg tgaccggggg tcccggccgg gggggtataa aagggtgcgg gtccctgctc 8460 gtcctcactg tcttccggat cgctgtccag gagcgccagc tgttggggta ggtattccct 8520 ctcgaaggcg ggcatgacct cggcactcag gttgtcagtt tctagaaacg aggaggattt 8580 gatattgacg gtgccggcgg agatgccttt caagagcccc tcgtccatct ggtcagaaaa 8640 gacgatcttt ttgttgtcga gcttggtggc gaaggagccg tagagggcgt tggagaggag 8700 cttggcgatg gagcgcatgg tctggttttt ttccttgtcg gcgcgctcct tggcggcgat 8760 gttgagctgc acgtactcgc gcgccacgca cttccattcg gggaagacgg tggtcagctc 8820 gtcgggcacg attctgacct gccagccccg attatgcagg gtgatgaggt ccacactggt 8880 ggccacctcg ccgcgcaggg gctcattagt ccagcagagg cgtccgccct tgcgcgagca 8940 gaaggggggc agggggtcca gcatgacctc gtcggggggg tcggcatcga tggtgaagat 9000 gccgggcagg aggtcggggt caaagtagct gatggaagtg gccagatcgt ccagggcagc 9060 ttgccattcg cgcacggcca gcgcgcgctc gtagggactg aggggcgtgc cccagggcat 9120 gggatgggta agcgcggagg cgtacatgcc gcagatgtcg tagacgtaga ggggctcctc 9180 gaggatgccg atgtaggtgg ggtagcagcg ccccccgcgg atgctggcgc gcacgtagtc 9240 atacagctcg tgcgaggggg cgaggagccc cgggcccagg ttggtgcgac tgggcttttc 9300 ggcgcggtag acgatctggc ggaaaatggc atgcgagttg gaggagatgg tgggcctttg 9360 gaagatgttg aagtgggcgt ggggcagtcc gaccgagtcg cggatgaagt gggcgtagga 9420 gtcttgcagc ttggcgacga gctcggcggt gactaggacg tccagagcgc agtagtcgag 9480 ggtctcctgg atgatgtcat acttgagctg tcccttttgt ttccacagct cgcggttgag 9540 aaggaactct tcgcggtcct tccagtactc ttcgaggggg aacccgtcct gatctgcacg 9600 gtaagagcct agcatgtaga actggttgac ggccttgtag gcgcagcagc ccttctccac 9660 ggggagggcg taggcctggg cggccttgcg cagggaggtg tgcgtgaggg cgaaagtgtc 9720 cctgaccatg accttgagga actggtgctt gaagtcgata tcgtcgcagc ccccctgctc 9780 ccagagctgg aagtccgtgc gcttcttgta ggcggggttg ggcaaagcga aagtaacatc 9840 gttgaagagg atcttgcccg cgcggggcat aaagttgcga gtgatgcgga aaggttgggg 9900 cacctcggcc cggttgttga tgacctgggc ggcgagcacg atctcgtcga agccgttgat 9960 gttgtggccc acgatgtaga gttccacgaa tcgcggacgg cccttgacgt ggggcagttt 10020 cttgagctcc tcgtaggtga gctcgtcggg gtcgctgagc ccgtgctgct cgagcgccca 10080 gtcggcgaga tgggggttgg cgcggaggaa ggaagtccag agatccacgg ccagggcggt 10140 ttgcagacgg tcccggtact gacggaactg ctgcccgacg gccatttttt cgggggtgac 10200 gcagtagaag gtgcgggggt ccccgtgcca gcgatcccat ttgagctgga gggcgagatc 10260 gagggcgagc tcgacgagcc ggtcgtcccc ggagagtttc atgaccagca tgaaggggac 10320 gagctgcttg ccgaaggacc ccatccaggt gtaggtttcc acatcgtagg tgaggaagag 10380 cctttcggtg cgaggatgcg agccgatggg gaagaactgg atctcctgcc accaattgga 10440 ggaatggctg ttgatgtgat ggaagtagaa atgccgacgg cgcgccgaac actcgtgctt 10500 gtgtttatac aagcggccac agtgctcgca acgctgcacg ggatgcacgt gctgcacgag 10560 ctgtacctga gttcctttga cgaggaattt cagtgggaag tggagtcgtg gcgcctgcat 10620 ctcgtgctgt actacgtcgt ggtggtcggc ctggccctct tctgcctcga tggtggtcat 10680 gctgacgagc ccgcgcggga ggcaggtcca gacctcggcg cgagcgggtc ggagagcgag 10740 gacgagggcg cgcaggccgg agctgtccag ggtcctgaga cgctgcggag tcaggtcagt 10800 gggcagcggc ggcgcgcggt tgacttgcag gagtttttcc agggcgcgcg ggaggtccag 10860 atggtacttg atctccaccg cgccattggt ggcgacgtcg atggcttgca gggtcccgtg 10920 cccctggggt gtgaccaccg tcccccgttt cttcttgggc ggctggggcg acgggggcgg 10980 tgcctcttcc atggttagaa gcggcggcga ggacgcgcgc cgggcggcag gggcggctcg 11040 gggcccggag gcaggggcgg caggggcacg tcggcgccgc gcgcgggtag gttctggtac 11100 tgcgcccgga gaagactggc gtgagcgacg acgcgacggt tgacgtcctg gatctgacgc 11160 ctctgggtga aggccacggg acccgtgagt ttgaacctga aagagagttc gacagaatca 11220 atctcggtat cgttgacggc ggcctgccgc aggatctctt gcacgtcgcc cgagttgtcc 11280 tggtaggcga tctcggtcat gaactgctcg atctcctcct cttgaaggtc tccgcggccg 11340 gcgcgctcca cggtggccgc gaggtcgttg gagatgcggc ccatgagctg cgagaaggcg 11400 ttcatgcccg cctcgttcca gacgcggctg tagaccacga cgccctcggg atcgcgggcg 11460 cgcatgacca cctgggcgag gttgagctcc acgtggcgcg tgaagaccgc gtagttgcag 11520 aggcgctggt agaggtagtt gagcgtggtg gcgatgtgct cggtgacgaa gaaatacatg 11580 atccagcggc ggagcggcat ctcgctgacg tcgcccagcg cctccaaacg ttccatggcc 11640 tcgtaaaagt ccacggcgaa gttgaaaaac tgggagttgc gcgccgagac ggtcaactcc 11700 tcctccagaa gacggatgag ctcggcgatg gtggcgcgca cctcgcgctc gaaggccccc 11760 gggagttcct ccacttcctc ttcttcctcc tccactaaca tctcttctac ttcctcctca 11820 ggcggcagtg gtggcggggg agggggcctg cgtcgccggc ggcgcacggg cagacggtcg 11880 atgaagcgct cgatggtctc gccgcgccgg cgtcgcatgg tctcggtgac ggcgcgcccg 11940 tcctcgcggg gccgcagcgt gaagacgccg ccgcgcatct ccaggtggcc gggggggtcc 12000 ccgttgggca gggagagggc gctgacgatg catcttatca attgccccgt agggactccg 12060 cgcaaggacc tgagcgtctc gagatccacg ggatctgaaa accgctgaac gaaggcttcg 12120 agccagtcgc agtcgcaagg taggctgagc acggtttctt ctggcgggtc atgttggttg 12180 ggagcggggc gggcgatgct gctggtgatg aagttgaaat aggcggttct gagacggcgg 12240 atggtggcga ggagcaccag gtctttgggc ccggcttgct ggatgcgcag acggtcggcc 12300 atgccccagg cgtggtcctg acacctggcc aggtccttgt agtagtcctg catgagccgc 12360 tccacgggca cctcctcctc gcccgcgcgg ccgtgcatgc gcgtgagccc gaagccgcgc 12420 tggggctgga cgagcgccag gtcggcgacg acgcgctcgg cgaggatggc ttgctggatc 12480 tgggtgaggg tggtctggaa gtcatcaaag tcgacgaagc ggtggtaggc tccggtgttg 12540 atggtgtagg agcagttggc catgacggac cagttgacgg tctggtggcc cggacgcacg 12600 agctcgtggt acttgaggcg cgagtaggcg cgcgtgtcga agatgtagtc gttgcaggtg 12660 cgcaccaggt actggtagcc gatgaggaag tgcggcggcg gctggcggta gagcggccat 12720 cgctcggtgg cgggggcgcc gggcgcgagg tcctcgagca tggtgcggtg gtagccgtag 12780 atgtacctgg acatccaggt gatgccggcg gcggtggtgg aggcgcgcgg gaactcgcgg 12840 acgcggttcc agatgttgcg cagcggcagg aagtagttca tggtgggcac ggtctggccc 12900 gtgaggcgcg cgcagtcgtg gatgctctat acgggcaaaa acgaaagcgg tcagcggctc 12960 gactccgtgg cctggaggct aagcgaacgg gttgggctgc gcgtgtaccc cggttcgaat 13020 ctcgaatcag gctggagccg cagctaacgt ggtattggca ctcccgtctc gacccaagcc 13080 tgcaccaacc ctccaggata cggaggcggg tcgttttgca actttttttt ggaggccgga 13140 tgagactagt aagcgcggaa agcggccgac cgcgatggct cgctgccgta gtctggagaa 13200 gaatcgccag ggttgcgttg cggtgtgccc cggttcgagg ccggccggat tccgcggcta 13260 acgagggcgt ggctgccccg tcgtttccaa gaccccatag ccagccgact tctccagtta 13320 cggagcgagc ccctcttttg ttttgtttgt ttttgccaga tgcatcccgt actgcggcag 13380 atgcgccccc accaccctcc accgcaacaa cagccccctc cacagccggc gcttctgccc 13440 ccgccccagc agcaacttcc agccacgacc gccgcggccg ccgtgagcgg ggctggacag 13500 agttatgatc accagctggc cttggaagag ggcgaggggc tggcgcgcct gggggcgtcg 13560 tcgccggagc ggcacccgcg cgtgcagatg aaaagggacg ctcgcgaggc ctacgtgccc 13620 aagcagaacc tgttcagaga caggagcggc gaggagcccg aggagatgcg cgcggcccgg 13680 ttccacgcgg ggcgggagct gcggcgcggc ctggaccgaa agagggtgct gagggacgag 13740 gatttcgagg cggacgagct gacggggatc agccccgcgc gcgcgcacgt ggccgcggcc 13800 aacctggtca cggcgtacga gcagaccgtg aaggaggaga gcaacttcca aaaatccttc 13860 aacaaccacg tgcgcaccct gatcgcgcgc gaggaggtga ccctgggcct gatgcacctg 13920 tgggacctgc tggaggccat cgtgcagaac cccaccagca agccgctgac ggcgcagctg 13980 ttcctggtgg tgcagcatag tcgggacaac gaagcgttca gggaggcgct gctgaatatc 14040 accgagcccg agggccgctg gctcctggac ctggtgaaca ttctgcagag catcgtggtg 14100 caggagcgcg ggctgccgct gtccgagaag ctggcggcca tcaacttctc ggtgctgagt 14160 ttgggcaagt actacgctag gaagatctac aagaccccgt acgtgcccat agacaaggag 14220 gtgaagatcg acgggtttta catgcgcatg accctgaaag tgctgaccct gagcgacgat 14280 ctgggggtgt accgcaacga caggatgcac cgtgcggtga gcgccagcag gcggcgcgag 14340 ctgagcgacc aggagctgat gcatagtctg cagcgggccc tgaccggggc cgggaccgag 14400 ggggagagct actttgacat gggcgcggac ctgcactggc agcccagccg ccgggccttg 14460 gaggcggcgg caggacccta cgtagaagag gtggacgatg aggtggacga ggagggcgag 14520 tacctggaag actgatggcg cgaccgtatt tttgctagat gcaacaacaa cagccacctc 14580 ctgatcccgc gatgcgggcg gcgctgcaga gccagccgtc cggcattaac tcctcggacg 14640 attggaccca ggccatgcaa cgcatcatgg cgctgacgac ccgcaacccc gaagccttta 14700 gacagcagcc ccaggccaac cggctctcgg ccatcctgga ggccgtggtg ccctcgcgct 14760 ccaaccccac gcacgagaag gtcctggcca tcgtgaacgc gctggtggag aacaaggcca 14820 tccgcggcga cgaggccggc ctggtgtaca acgcgctgct ggagcgcgtg gcccgctaca 14880 acagcaccaa cgtgcagacc aacctggacc gcatggtgac cgacgtgcgc gaggccgtgg 14940 cccagcgcga gcggttccac cgcgagtcca acctgggatc catggtggcg ctgaacgcct 15000 tcctcagcac ccagcccgcc aacgtgcccc ggggccagga ggactacacc aacttcatca 15060 gcgccctgcg cctgatggtg accgaggtgc cccagagcga ggtgtaccag tccgggccgg 15120 actacttctt ccagaccagt cgccagggct tgcagaccgt gaacctgagc caggctttca 15180 agaacttgca gggcctgtgg ggcgtgcagg ccccggtcgg ggaccgcgcg acggtgtcga 15240 gcctgctgac gccgaactcg cgcctgctgc tgctgctggt ggcccccttc acggacagcg 15300 gcagcatcaa ccgcaactcg tacctgggct acctgattaa cctgtaccgc gaggccatcg 15360 gccaggcgca cgtggacgag cagacctacc aggagatcac ccacgtgagc cgcgccctgg 15420 gccaggacga cccgggcaac ctggaagcca ccctgaactt tttgctgacc aaccggtcgc 15480 agaagatccc gccccagtac gcgctcagca ccgaggagga gcgcatcctg cgttacgtgc 15540 agcagagcgt gggcctgttc ctgatgcagg agggggccac ccccagcgcc gcgctcgaca 15600 tgaccgcgcg caacatggag cccagcatgt acgccagcaa ccgcccgttc atcaataaac 15660 tgatggacta cttgcatcgg gcggccgcca tgaactctga ctatttcacc aacgccatcc 15720 tgaatcccca ctggctcccg ccgccggggt tctacacggg cgagtacgac atgcccgacc 15780 ccaatgacgg gttcctgtgg gacgatgtgg acagcagcgt gttctccccc cgaccgggtg 15840 ctaacgagcg ccccttgtgg aagaaggaag gcagcgaccg acgcccgtcc tcggcgctgt 15900 ccggccgcga gggtgctgcc gcggcggtgc ccgaggccgc cagtcctttc ccgagcttgc 15960 ccttctcgct gaacagtatc cgcagcagcg agctgggcag gatcacgcgc ccgcgcttgc 16020 tgggcgaaga ggagtacttg aatgactcgc tgttgagacc cgagcgggag aagaacttcc 16080 ccaataacgg gatagaaagc ctggtggaca agatgagccg ctggaagacg tatgcgcagg 16140 agcacaggga cgatccccgg gcgtcgcagg gggccacgag ccggggcagc gccgcccgta 16200 aacgccggtg gcacgacagg cagcggggac agatgtggga cgatgaggac tccgccgacg 16260 acagcagcgt gttggacttg ggtgggagtg gtaacccgtt cgctcacctg cgcccccgta 16320 tcgggcgcat gatgtaagag aaaccgaaaa taaatgatac tcaccaaggc catggcgacc 16380 agcgtgcgtt cgtttcttct ctgttgttgt tgtatctagt atgatgaggc gtgcgtaccc 16440 ggagggtcct cctccctcgt acgagagcgt gatgcagcag gcgatggcgg cggcggcgat 16500 gcagcccccg ctggaggctc cttacgtgcc cccgcggtac ctggcgccta cggaggggcg 16560 gaacagcatt cgttactcgg agctggcacc cttgtacgat accacccggt tgtacctggt 16620 ggacaacaag tcggcggaca tcgcctcgct gaactaccag aacgaccaca gcaacttcct 16680 gaccaccgtg gtgcagaaca atgacttcac ccccacggag gccagcaccc agaccatcaa 16740 ctttgacgag cgctcgcggt ggggcggcca gctgaaaacc atcatgcaca ccaacatgcc 16800 caacgtgaac gagttcatgt acagcaacaa gttcaaggcg cgggtgatgg tctcccgcaa 16860 gacccccaat ggggtgacag tgacagagga ttatgatggt agtcaggatg agctgaagta 16920 tgaatgggtg gaatttgagc tgcccgaagg caacttctcg gtgaccatga ccatcgacct 16980 gatgaacaac gccatcatcg acaattactt ggcggtgggg cggcagaacg gggtgctgga 17040 gagcgacatc ggcgtgaagt tcgacactag gaacttcagg ctgggctggg accccgtgac 17100 cgagctggtc atgcccgggg tgtacaccaa cgaggctttc catcccgata ttgtcttgct 17160 gcccggctgc ggggtggact tcaccgagag ccgcctcagc aacctgctgg gcattcgcaa 17220 gaggcagccc ttccaggaag gcttccagat catgtacgag gatctggagg ggggcaacat 17280 ccccgcgctc ctggatgtcg acgcctatga gaaaagcaag gaggatgcag cagctgaagc 17340 aactgcagcc gtagctaccg cctctaccga ggtcaggggc gataattttg caagcgccgc 17400 agcagtggca gcggccgagg cggctgaaac cgaaagtaag atagtcattc agccggtgga 17460 gaaggatagc aagaacagga gctacaacgt actaccggac aagataaaca ccgcctaccg 17520 cagctggtac ctagcctaca actatggcga ccccgagaag ggcgtgcgct cctggacgct 17580 gctcaccacc tcggacgtca cctgcggcgt ggagcaagtc tactggtcgc tgcccgacat 17640 gatgcaagac ccggtcacct tccgctccac gcgtcaagtt agcaactacc cggtggtggg 17700 cgccgagctc ctgcccgtct actccaagag cttcttcaac gagcaggccg tctactcgca 17760 gcagctgcgc gccttcacct cgcttacgca cgtcttcaac cgcttccccg agaaccagat 17820 cctcgtccgc ccgcccgcgc ccaccattac caccgtcagt gaaaacgttc ctgctctcac 17880 agatcacggg accctgccgc tgcgcagcag tatccgggga gtccagcgcg tgaccgttac 17940 tgacgccaga cgccgcacct gcccctacgt ctacaaggcc ctgggcatag tcgcgccgcg 18000 cgtcctctcg agccgcacct tctaaatgtc cattctcatc tcgcccagta ataacaccgg 18060 ttggggcctg cgcgcgccca gcaagatgta cggaggcgct cgccaacgct ccacgcaaca 18120 ccccgtgcgc gtgcgcgggc acttccgcgc tccctggggc gccctcaagg gccgcgtgcg 18180 gtcgcgcacc accgtcgacg acgtgatcga ccaggtggtg gccgacgcgc gcaactacac 18240 ccccgccgcc gcgcccgtct ccaccgtgga cgccgtcatc gacagcgtgg tggccgacgc 18300 gcgccggtac gcccgcgcca agagccggcg gcggcgcatc gcccggcggc accggagcac 18360 ccccgccatg cgcgcggcgc gagccttgct gcgcagggcc aggcgcacgg gacgcagggc 18420 catgctcagg gcggccagac gcgcggcttc aggcgccagc gccggcagga cccggagacg 18480 cgcggccacg gcggcggcag cggccatcgc cagcatgtcc cgcccgcggc gagggaacgt 18540 gtactgggtg cgcgacgccg ccaccggtgt gcgcgtgccc gtgcgcaccc gcccccctcg 18600 cacttgaaga tgttcacttc gcgatgttga tgtgtcccag cggcgaggag gatgtccaag 18660 cgcaaattca aggaagagat gctccaggtc atcgcgcctg agatctacgg ccctgcggtg 18720 gtgaaggagg aaagaaagcc ccgcaaaatc aagcgggtca aaaaggacaa aaaggaagaa 18780 gaaagtgatg tggacggatt ggtggagttt gtgcgcgagt tcgccccccg gcggcgcgtg 18840 cagtggcgcg ggcggaaggt gcaaccggtg ctgagacccg gcaccaccgt ggtcttcacg 18900 cccggcgagc gctccggcac cgcttccaag cgctcctacg acgaggtgta cggggatgat 18960 gatattctgg agcaggcggc cgagcgcctg ggcgagtttg cttacggcaa gcgcagccgt 19020 tccgcaccga aggaagaggc ggtgtccatc ccgctggacc acggcaaccc cacgccgagc 19080 ctcaagcccg tgaccttgca gcaggtgctg ccgaccgcgg cgccgcgccg ggggttcaag 19140 cgcgagggcg aggatctgta ccccaccatg cagctgatgg tgcccaagcg ccagaagctg 19200 gaagacgtgc tggagaccat gaaggtggac ccggacgtgc agcccgaggt caaggtgcgg 19260 cccatcaagc aggtggcccc gggcctgggc gtgcagaccg tggacatcaa gattcccacg 19320 gagcccatgg aaacgcagac cgagcccatg atcaagccca gcaccagcac catggaggtg 19380 cagacggatc cctggatgcc atcggctcct agtcgaagac cccggcgcaa gtacggcgcg 19440 gccagcctgc tgatgcccaa ctacgcgctg catccttcca tcatccccac gccgggctac 19500 cgcggcacgc gcttctaccg cggtcatacc agcagccgcc gccgcaagac caccactcgc 19560 cgccgccgtc gccgcaccgc cgctgcaacc acccctgccg ccctggtgcg gagagtgtac 19620 cgccgcggcc gcgcacctct gaccctgccg cgcgcgcgct accacccgag catcgccatt 19680 taaactttcg cctgctttgc agatcaatgg ccctcacatg ccgccttcgc gttcccatta 19740 cgggctaccg aggaagaaaa ccgcgccgta gaaggctggc ggggaacggg atgcgtcgcc 19800 accaccaccg gcggcggcgc gccatcagca agcggttggg gggaggcttc ctgcccgcgc 19860 tgatccccat catcgccgcg gcgatcgggg cgatccccgg cattgcttcc gtggcggtgc 19920 aggcctctca gcgccactga gacacacttg gaaacatctt gtaataaacc aatggactct 19980 gacgctcctg gtcctgtgat gtgttttcgt agacagatgg aagacatcaa tttttcgtcc 20040 ctggctccgc gacacggcac gcggccgttc atgggcacct ggagcgacat cggcaccagc 20100 caactgaacg ggggcgcctt caattggagc agtctctgga gcgggcttaa gaatttcggg 20160 tccacgctta aaacctatgg cagcaaggcg tggaacagca ccacagggca ggcgctgagg 20220 gataagctga aagagcagaa cttccagcag aaggtggtcg atgggctcgc ctcgggcatc 20280 aacggggtgg tggacctggc caaccaggcc gtgcagcggc agatcaacag ccgcctggac 20340 ccggtgccgc ccgccggctc cgtggagatg ccgcaggtgg aggaggagct gcctcccctg 20400 gacaagcggg gcgagaagcg accccgcccc gatgcggagg agacgctgct gacgcacacg 20460 gacgagccgc ccccgtacga ggaggcggtg aaactgggtc tgcccaccac gcggcccatc 20520 gcgcccctgg ccaccggggt gctgaaaccc gaaaagcccg cgaccctgga cttgcctcct 20580 ccccagcctt cccgcccctc tacagtggct aagcccctgc cgccggtggc cgtggcccgc 20640 gcgcgacccg ggggcaccgc ccgccctcat gcgaactggc agagcactct gaacagcatc 20700 gtgggtctgg gagtgcagag tgtgaagcgc cgccgctgct attaaaccta ccgtagcgct 20760 taacttgctt gtctgtgtgt gtatgtatta tgtcgccgcc gccgctgtcc accagaagga 20820 ggagtgaaga ggcgcgtcgc cgagttgcaa gatggccacc ccatcgatgc tgccccagtg 20880 ggcgtacatg cacatcgccg gacaggacgc ttcggagtac ctgagtccgg gtctggtgca 20940 gtttgcccgc gccacagaca cctacttcag tctggggaac aagtttagga accccacggt 21000 ggcgcccacg cacgatgtga ccaccgaccg cagccagcgg ctgacgctgc gcttcgtgcc 21060 cgtggaccgc gaggacaaca cctactcgta caaagtgcgc tacacgctgg ccgtgggcga 21120 caaccgcgtg ctggacatgg ccagcaccta ctttgacatc cgcggcgtgc tggatcgggg 21180 ccctagcttc aaaccctact ccggcaccgc ctacaacagt ctggccccca agggagcacc 21240 caacacttgt cagtggacat ataaagccga tggtgaaact gccacagaaa aaacctatac 21300 atatggaaat gcacccgtgc agggcattaa catcacaaaa gatggtattc aacttggaac 21360 tgacaccgat gatcagccaa tctacgcaga taaaacctat cagcctgaac ctcaagtggg 21420 tgatgctgaa tggcatgaca tcactggtac tgatgaaaag tatggaggca gagctcttaa 21480 gcctgatacc aaaatgaagc cttgttatgg ttcttttgcc aagcctacta ataaagaagg 21540 aggtcaggca aatgtgaaaa caggaacagg cactactaaa gaatatgaca tagacatggc 21600 tttctttgac aacagaagtg cggctgctgc tggcctagct ccagaaattg ttttgtatac 21660 tgaaaatgtg gatttggaaa ctccagatac ccatattgta tacaaagcag gcacagatga 21720 cagcagctct tctattaatt tgggtcagca agccatgccc aacagaccta actacattgg 21780 tttcagagac aactttatcg ggctcatgta ctacaacagc actggcaata tgggggtgct 21840 ggccggtcag gcttctcagc tgaatgctgt ggttgacttg caagacagaa acaccgagct 21900 gtcctaccag ctcttgcttg actctctggg tgacagaacc cggtatttca gtatgtggaa 21960 tcaggcggtg gacagctatg atcctgatgt gcgcattatt gaaaatcatg gtgtggagga 22020 tgaacttccc aactattgtt tccctctgga tgctgttggc agaacagata cttatcaggg 22080 aattaaggct aatggaactg atcaaaccac atggaccaaa gatgacagtg tcaatgatgc 22140 taatgagata ggcaagggta atccattcgc catggaaatc aacatccaag ccaacctgtg 22200 gaggaacttc ctctacgcca acgtggccct gtacctgccc gactcttaca agtacacgcc 22260 ggccaatgtt accctgccca ccaacaccaa cacctacgat tacatgaacg gccgggtggt 22320 ggcgccctcg ctggtggact cctacatcaa catcggggcg cgctggtcgc tggatcccat 22380 ggacaacgtg aaccccttca accaccaccg caatgcgggg ctgcgctacc gctccatgct 22440 cctgggcaac gggcgctacg tgcccttcca catccaggtg ccccagaaat ttttcgccat 22500 caagagcctc ctgctcctgc ccgggtccta cacctacgag tggaacttcc gcaaggacgt 22560 caacatgatc ctgcagagct ccctcggcaa cgacctgcgc acggacgggg cctccatctc 22620 cttcaccagc atcaacctct acgccacctt cttccccatg gcgcacaaca cggcctccac 22680 gctcgaggcc atgctgcgca acgacaccaa cgaccagtcc ttcaacgact acctctcggc 22740 ggccaacatg ctctacccca tcccggccaa cgccaccaac gtgcccatct ccatcccctc 22800 gcgcaactgg gccgccttcc gcggctggtc cttcacgcgt ctcaagacca aggagacgcc 22860 ctcgctgggc tccgggttcg acccctactt cgtctactcg ggctccatcc cctacctcga 22920 cggcaccttc tacctcaacc acaccttcaa gaaggtctcc atcaccttcg actcctccgt 22980 cagctggccc ggcaacgacc ggctcctgac gcccaacgag ttcgaaatca agcgcaccgt 23040 cgacggcgag ggctacaacg tggcccagtg caacatgacc aaggactggt tcctggtcca 23100 gatgctggcc cactacaaca tcggctacca gggcttctac gtgcccgagg gctacaagga 23160 ccgcatgtac tccttcttcc gcaacttcca gcccatgagc cgccaggtgg tggacgaggt 23220 caactacaag gactaccagg ccgtcaccct ggcctaccag cacaacaact cgggcttcgt 23280 cggctacctc gcgcccacca tgcgccaggg ccagccctac cccgccaact acccctaccc 23340 gctcatcggc aagagcgccg tcaccagcgt cacccagaaa aagttcctct gcgacagggt 23400 catgtggcgc atccccttct ccagcaactt catgtccatg ggcgcgctca ccgacctcgg 23460 ccagaacatg ctctatgcca actccgccca cgcgctagac atgaatttcg aagtcgaccc 23520 catggatgag tccacccttc tctatgttgt cttcgaagtc ttcgacgtcg tccgagtgca 23580 ccagccccac cgcggcgtca tcgaggccgt ctacctgcgc acccccttct cggccggtaa 23640 cgccaccacc taagctcttg cttcttgcaa gccatggccg cgggctccgg cgagcaggag 23700 ctcagggcca tcatccgcga cctgggctgc gggccctact tcctgggcac cttcgataag 23760 cgcttcccgg gattcatggc cccgcacaag ctggcctgcg ccatcgtcaa cacggccggc 23820 cgcgagaccg ggggcgagca ctggctggcc ttcgcctgga acccgcgctc gaacacctgc 23880 tacctcttcg accccttcgg gttctcggac gagcgcctca agcagatcta ccagttcgag 23940 tacgagggcc tgctgcgccg cagcgccctg gccaccgagg accgctgcgt caccctggaa 24000 aagtccaccc agaccgtgca gggtccgcgc tcggccgcct gcgggctctt ctgctgcatg 24060 ttcctgcacg ccttcgtgca ctggcccgac cgccccatgg acaagaaccc caccatgaac 24120 ttgctgacgg gggtgcccaa cggcatgctc cagtcgcccc aggtggaacc caccctgcgc 24180 cgcaaccagg aggcgctcta ccgcttcctc aactcccact ccgcctactt tcgctcccac 24240 cgcgcgcgca tcgagaaggc caccgccttc gaccgcatga atcaagacat gtaaaccgtg 24300 tgtgtatgtt aaatgtcttt aataaacagc actttcatgt tacacatgca tctgagatga 24360 tttatttaga aatcgaaagg gttctgccgg gtctcggcat ggcccgcggg cagggacacg 24420 ttgcggaact ggtacttggc cagccacttg aactcgggga tcagcagttt gggcagcggg 24480 gtgtcgggga aggagtcggt ccacagcttc cgcgtcagtt gcagggcgcc cagcaggtcg 24540 ggcgcggaga tcttgaaatc gcagttggga cccgcgttct gcgcgcggga gttgcggtac 24600 acggggttgc agcactggaa caccatcagg gccgggtgct tcacgctcgc cagcaccgtc 24660 gcgtcggtga tgctctccac gtcgaggtcc tcggcgttgg ccatcccgaa gggggtcatc 24720 ttgcaggtct gccttcccat ggtgggcacg cacccgggct tgtggttgca atcgcagtgc 24780 agggggatca gcatcatctg ggcctggtcg gcgttcatcc ccgggtacat ggccttcatg 24840 aaagcctcca attgcctgaa cgcctgctgg gccttggctc cctcggtgaa gaagaccccg 24900 caggacttgc tagagaactg gttggtggcg cacccggcgt cgtgcacgca gcagcgcgcg 24960 tcgttgttgg ccagctgcac cacgctgcgc ccccagcggt tctgggtgat cttggcccgg 25020 tcggggttct ccttcagcgc gcgctgcccg ttctcgctcg ccacatccat ctcgatcatg 25080 tgctccttct ggatcatggt ggtcccgtgc aggcaccgca gcttgccctc ggcctcggtg 25140 cacccgtgca gccacagcgc gcacccggtg cactcccagt tcttgtgggc gatctgggaa 25200 tgcgcgtgca cgaagccctg caggaagcgg cccatcatgg tggtcagggt cttgttgcta 25260 gtgaaggtca gcggaatgcc gcggtgctcc tcgttgatgt acaggtggca gatgcggcgg 25320 tacacctcgc cctgctcggg catcagctgg aagttggctt tcaggtcggt ctccacgcgg 25380 tagcggtcca tcagcatagt catgatttcc atacccttct cccaggccga gacgatgggc 25440 aggctcatag ggttcttcac catcatctta gcgctagcag ccgcggccag ggggtcgctc 25500 tcgtccaggg tctcaaagct ccgcttgccg tccttctcgg tgatccgcac cggggggtag 25560 ctgaagccca cggccgccag ctcctcctcg gcctgtcttt cgtcctcgct gtcctggctg 25620 acgtcctgca ggaccacatg cttggtcttg cggggtttct tcttgggcgg cagcggcggc 25680 ggagatgttg gagatggcga gggggagcgc gagttctcgc tcaccactac tatctcttcc 25740 tcttcttggt ccgaggccac gcggcggtag gtatgtctct tcgggggcag aggcggaggc 25800 gacgggctct cgccgccgcg acttggcgga tggctggcag agccccttcc gcgttcgggg 25860 gtgcgctccc ggcggcgctc tgactgactt cctccgcggc cggccattgt gttctcctag 25920 ggaggaacaa caagcatgga gactcagcca tcgccaacct cgccatctgc ccccaccgcc 25980 gacgagaagc agcagcagca gaatgaaagc ttaaccgccc cgccgcccag ccccgccacc 26040 tccgacgcgg ccgtcccaga catgcaagag atggaggaat ccatcgagat tgacctgggc 26100 tatgtgacgc ccgcggagca cgaggaggag ctggcagtgc gcttttcaca agaagagata 26160 caccaagaac agccagagca ggaagcagag aatgagcaga gtcaggctgg gctcgagcat 26220 gacggcgact acctccacct gagcgggggg gaggacgcgc tcatcaagca tctggcccgg 26280 caggccacca tcgtcaagga tgcgctgctc gaccgcaccg aggtgcccct cagcgtggag 26340 gagctcagcc gcgcctacga gttgaacctc ttctcgccgc gcgtgccccc caagcgccag 26400 cccaatggca cctgcgagcc caacccgcgc ctcaacttct acccggtctt cgcggtgccc 26460 gaggccctgg ccacctacca catctttttc aagaaccaaa agatccccgt ctcctgccgc 26520 gccaaccgca cccgcgccga cgcccttttc aacctgggtc ccggcgcccg cctacctgat 26580 atcgcctcct tggaagaggt tcccaagatc ttcgagggtc tgggcagcga cgagactcgg 26640 gccgcgaacg ctctgcaagg agaaggagga gagcatgagc accacagcgc cctggtcgag 26700 ttggaaggcg acaacgcgcg gctggcggtg ctcaaacgca cggtcgagct gacccatttc 26760 gcctacccgg ctctgaacct gccccccaaa gtcatgagcg cggtcatgga ccaggtgctc 26820 atcaagcgcg cgtcgcccat ctccgaggac gagggcatgc aagactccga ggagggcaag 26880 cccgtggtca gcgacgagca gctggcccgg tggctgggtc ctaatgctag tccccagagt 26940 ttggaagagc ggcgcaaact catgatggcc gtggtcctgg tgaccgtgga gctggagtgc 27000 ctgcgccgct tcttcgccga cgcggagacc ctgcgcaagg tcgaggagaa cctgcactac 27060 ctcttcaggc acgggttcgt gcgccaggcc tgcaagatct ccaacgtgga gctgaccaac 27120 ctggtctcct acatgggcat cttgcacgag aaccgcctgg ggcagaacgt gctgcacacc 27180 accctgcgcg gggaggcccg gcgcgactac atccgcgact gcgtctacct ctacctctgc 27240 cacacctggc agacgggcat gggcgtgtgg cagcagtgtc tggaggagca gaacctgaaa 27300 gagctctgca agctcctgca gaagaacctc aagggtctgt ggaccgggtt cgacgagcgc 27360 accaccgcct cggacctggc cgacctcatt ttccccgagc gcctcaggct gacgctgcgc 27420 aacggcctgc ccgactttat gagccaaagc atgttgcaaa actttcgctc tttcatcctc 27480 gaacgctccg gaatcctgcc cgccacctgc tccgcgctgc cctcggactt cgtgccgctg 27540 accttccgcg agtgcccccc gccgctgtgg agccactgct acctgctgcg cctggccaac 27600 tacctggcct accactcgga cgtgatcgag gacgtcagcg gcgagggcct gctcgagtgc 27660 cactgccgct gcaacctctg cacgccgcac cgctccctgg cctgcaaccc ccagctgctg 27720 agcgagaccc agatcatcgg caccttcgag ttgcaagggc ccagcgaagg cgagggttca 27780 gccgccaagg ggggtctgaa actcaccccg gggctgtgga cctcggccta cttgcgcaag 27840 ttcgtgcccg aggactacca tcccttcgag atcaggttct acgaggacca atcccatccg 27900 cccaaggccg agctgtcggc ctgcgtcatc acccaggggg cgatcctggc ccaattgcaa 27960 gccatccaga aatcccgcca agaattcttg ctgaaaaagg gccgcggggt ctacctcgac 28020 ccccagaccg gtgaggagct caaccccggc ttcccccagg atgccccgag gaaacaagaa 28080 gctgaaagtg gagctgccgc ccgtggagga tttggaggaa gactgggaga acagcagtca 28140 ggcagaggag gaggagatgg aggaagactg ggacagcact caggcagagg aggacagcct 28200 gcaagacagt ctggaggaag acgaggagga ggcagaggag gaggtggaag aagcagccgc 28260 cgccagaccg tcgtcctcgg cgggggagaa agcaagcagc acggatacca tctccgctcc 28320 gggtcggggt cccgctcgac cacacagtag atgggacgag accggacgat tcccgaaccc 28380 caccacccag accggtaaga aggagcggca gggatacaag tcctggcggg ggcacaaaaa 28440 cgccatcgtc tcctgcttgc aggcctgcgg gggcaacatc tccttcaccc ggcgctacct 28500 gctcttccac cgcggggtga actttccccg caacatcttg cattactacc gtcacctcca 28560 cagcccctac tacttccaag aagaggcagc agcagcagaa aaagaccagc agaaaaccag 28620 cagctagaaa atccacagcg gcggcagcag gtggactgag gatcgcggcg aacgagccgg 28680 cgcaaacccg ggagctgagg aaccggatct ttcccaccct ctatgccatc ttccagcaga 28740 gtcgggggca ggagcaggaa ctgaaagtca agaaccgttc tctgcgctcg ctcacccgca 28800 gttgtctgta tcacaagagc gaagaccaac ttcagcgcac tctcgaggac gccgaggctc 28860 tcttcaacaa gtactgcgcg ctcactctta aagagtagcc cgcgcccgcc cagtcgcaga 28920 aaaaggcggg aattacgtca cctgtgccct tcgccctagc cgcctccacc catcatcatg 28980 agcaaagaga ttcccacgcc ttacatgtgg agctaccagc cccagatggg cctggccgcc 29040 ggtgccgccc aggactactc cacccgcatg aattggctca gcgccgggcc cgcgatgatc 29100 tcacgggtga atgacatccg cgcccaccga aaccagatac tcctagaaca gtcagcgctc 29160 accgccacgc cccgcaatca cctcaatccg cgtaattggc ccgccgccct ggtgtaccag 29220 gaaattcccc agcccacgac cgtactactt ccgcgagacg cccaggccga agtccagctg 29280 actaactcag gtgtccagct ggcgggcggc gccaccctgt gtcgtcaccg ccccgctcag 29340 ggtataaagc ggctggtgat ccggggcaga ggcacacagc tcaacgacga ggtggtgagc 29400 tcttcgctgg gtctgcgacc tgacggagtc ttccaactcg ccggatcggg gagatcttcc 29460 ttcacgcctc gtcaggccgt cctgactttg gagagttcgt cctcgcagcc ccgctcgggt 29520 ggcatcggca ctctccagtt cgtggaggag ttcactccct cggtctactt caaccccttc 29580 tccggctccc ccggccacta cccggacgag ttcatcccga acttcgacgc catcagcgag 29640 tcggtggacg gctacgattg aaactaatca cccccttatc cagtgaaata aagatcatat 29700 tgatgatgat tttacagaaa taaaaaataa tcatttgatt tgaaataaag atacaatcat 29760 attgatgatt tgagtttaac aaaaaaataa agaatcactt acttgaaatc tgataccagg 29820 tctctgtcca tgttttctgc caacaccact tcactcccct cttcccagct ctggtactgc 29880 aggccccggc gggctgcaaa cttcctccac acgctgaagg ggatgtcaaa ttcctcctgt 29940 ccctcaatct tcattttatc ttctatcaga tgtccaaaaa gcgcgtccgg gtggatgatg 30000 acttcgaccc cgtctacccc tacgatgcag acaacgcacc gaccgtgccc ttcatcaacc 30060 cccccttcgt ctcttcagat ggattccaag agaagcccct gggggtgttg tccctgcgac 30120 tggccgaccc cgtcaccacc aagaacgggg aaatcaccct caagctggga gagggggtgg 30180 acctcgattc ctcgggaaaa ctcatctcca acacggccac caaggccgcc gcccctctca 30240 gtttttccaa caacaccatt tcccttaaca tggatcaccc cttttacact aaagatggaa 30300 aattatcctt acaagtttct ccaccattaa atatactgag aacaagcatt ctaaacacac 30360 tagctttagg ttttggatca ggtttaggac tccgtggctc tgccttggca gtacagttag 30420 tctctccact tacatttgat actgatggaa acataaagct taccttagac agaggtttgc 30480 atgttacaac aggagatgca attgaaagca acataagctg ggctaaaggt ttaaaatttg 30540 aagatggagc catagcaacc aacattggaa atgggttaga gtttggaagc agtagtacag 30600 aaacaggtgt tgatgatgct tacccaatcc aagttaaact tggatctggc cttagctttg 30660 acagtacagg agccataatg gctggtaaca aagaagacga taaactcact ttgtggacaa 30720 cacctgatcc atcaccaaac tgtcaaatac tcgcagaaaa tgatgcaaaa ctaacacttt 30780 gcttgactaa atgtggtagt caaatactgg ccactgtgtc agtcttagtt gtaggaagtg 30840 gaaacctaaa ccccattact ggcaccgtaa gcagtgctca ggtgtttcta cgttttgatg 30900 caaacggtgt tcttttaaca gaacattcta cactaaaaaa atactggggg tataggcagg 30960 gagatagcat agatggcact ccatatacca atgctgtagg attcatgccc aatttaaaag 31020 cttatccaaa gtcacaaagt tctactacta aaaataatat agtagggcaa gtatacatga 31080 atggagatgt ttcaaaacct atgcttctca ctataaccct caatggtact gatgacagca 31140 acagtacata ttcaatgtca ttttcataca cctggactaa tggaagctat gttggagcaa 31200 catttggggc taactcttat accttctcat acatcgccca agaatgaaca ctgtatccca 31260 ccctgcatgc caacccttcc caccccactc tgtggaacaa actctgaaac acaaaataaa 31320 ataaagttca agtgttttat tgattcaaca gttttacagg attcgagcag ttatttttcc 31380 tccaccctcc caggacatgg aatacaccac cctctccccc cgcacagcct tgaacatctg 31440 aatgccattg gtgatggaca tgcttttggt ctccacgttc cacacagttt cagagcgagc 31500 cagtctcggg tcggtcaggg agatgaaacc ctccgggcac tcccgcatct gcacctcaca 31560 gctcaacagc tgaggattgt cctcggtggt cgggatcacg gttatctgga agaagcagaa 31620 gagcggcggt gggaatcata gtccgcgaac gggatcggcc ggtggtgtcg catcaggccc 31680 cgcagcagtc gctgccgccg ccgctccgtc aagctgctgc tcagggggtc cgggtccagg 31740 gactccctca gcatgatgcc cacggccctc agcatcagtc gtctggtgcg gcgggcgcag 31800 cagcgcatgc ggatctcgct caggtcgctg cagtacgtgc aacacagaac caccaggttg 31860 ttcaacagtc catagttcaa cacgctccag ccgaaactca tcgcgggaag gatgctaccc 31920 acgtggccgt cgtaccagat cctcaggtaa atcaagtggt gccccctcca gaacacgctg 31980 cccacgtaca tgatctcctt gggcatgtgg cggttcacca cctcccggta ccacatcacc 32040 ctctggttga acatgcagcc ccggatgatc ctgcggaacc acagggccag caccgccccg 32100 cccgccatgc agcgaagaga ccccgggtcc cggcaatggc aatggaggac ccaccgctcg 32160 tacccgtgga tcatctggga gctgaacaag tctatgttgg cacagcacag gcatatgctc 32220 atgcatctct tcagcactct caactcctcg ggggtcaaaa ccatatccca gggcacgggg 32280 aactcttgca ggacagcgaa ccccgcagaa cagggcaatc ctcgcacaga acttacattg 32340 tgcatggaca gggtatcgca atcaggcagc accgggtgat cctccaccag agaagcgcgg 32400 gtctcggtct cctcacagcg tggtaagggg gccggccgat acgggtgatg gcgggacgcg 32460 gctgatcgtg ttcgcgaccg tgtcatgatg cagttgcttt cggacatttt cgtacttgct 32520 gtagcagaac ctggtccggg cgctgcacac cgatcgccgg cggcggtctc ggcgcttgga 32580 acgctcggtg ttgaaattgt aaaacagcca ctctctcaga ccgtgcagca gatctagggc 32640 ctcaggagtg atgaagatcc catcatgcct gatggctctg atcacatcga ccaccgtgga 32700 atgggccaga cccagccaga tgatgcaatt ttgttgggtt tcggtgacgg cgggggaggg 32760 aagaacagga agaaccatga ttaactttta atccaaacgg tctcggagta cttcaaaatg 32820 aagatcgcgg agatggcacc tctcgccccc gctgtgttgg tggaaaataa cagccaggtc 32880 aaaggtgata cggttctcga gatgttccac ggtggcttcc agcaaagcct ccacgcgcac 32940 atccagaaac aagacaatag cgaaagcggg agggttctct aattcctcaa tcatcatgtt 33000 acactcctgc accatcccca gataattttc atttttccag ccttgaatga ttcgaactag 33060 ttcctgaggt aaatccaagc cagccatgat aaagagctcg cgcagagcgc cctccaccgg 33120 cattcttaag cacaccctca taattccaag atattctgct cctggttcac ctgcagcaga 33180 ttgacaagcg gaatatcaaa atctctgccg cgatccctga gctcctccct cagcaataac 33240 tgtaagtact ctttcatatc ctctccgaaa tttttagcca taggaccacc aggaataaga 33300 ttagggcaag ccacagtaca gataaaccga agtcctcccc agtgagcatt gccaaatgca 33360 agactgctat aagcatgctg gctagacccg gtgatatctt ccagataact ggacagaaaa 33420 tcgcccaggc aatttttaag aaaatcaaca aaagaaaaat cctccaggtg gacgtttaga 33480 gcctcgggaa caacgatgaa gtaaatgcaa gcggtgcgtt ccagcatggt tagttagctg 33540 atctgtagaa aaaacaaaaa tgaacattaa accatgctag cctggcgaac aggtgggtaa 33600 atcgttctct ccagcaccag gcaggccacg gggtctccgg cgcgaccctc gtaaaaattg 33660 tcgctatgat tgaaaaccat cacagagaga cgttcccggt ggccggcgtg aatgattcga 33720 caagatgaat acacccccgg aacattggcg tccgcgagtg aaaaaaagcg cccgaggaag 33780 caataaggca ctacaatgct cagtctcaag tccagcaaag cgatgccatg cggatgaagc 33840 acaaaattct caggtgcgta caaaatgtaa ttactcccct cctgcacagg cagcaaagcc 33900 cccgatccct ccaggtacac atacaaagcc tcagcgtcca tagcttaccg agcagcagca 33960 cacaacaggc gcaagagtca gagaaaggct gagctctaac ctgtccaccc gctctctgct 34020 caatatatag cccagatcta cactgacgta aaggccaaag tctaaaaata cccgccaaat 34080 aatcacacac gcccagcaca cgcccagaaa ccggtgacac actcaaaaaa atacgcgcac 34140 ttcctcaaac gcccaaaact gccgtcattt ccgggttccc acgctacgtc atcaaaacac 34200 gactttcaaa ttccgtcgac cgttaaaaac gtcacccgcc ccgcccctaa cggtcgcccg 34260 tctctcagcc aatcagcgcc ccgcatcccc aaattcaaac acctcatttg catattaacg 34320 cgcacaaaaa gtttgaggta tattattgat gatggttaat taa 34363 <210> 72 <211> 34360 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 72 catcatcaat aatatacctc aaactttttg tgcgcgttaa tatgcaaatg aggcgtttga 60 atttggggag gaagggcggt gattggtcga gggatgagcg accgttaggg gcggggcgag 120 tgacgttttg atgacgtggt tgcgaggagg agccagtttg caagttctcg tgggaaaagt 180 gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca 240 ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg 300 aatgaggaag tgaaaatctg agtaatttcg cgtttatggc agggaggagt atttgccgag 360 ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtgtttt tcacctaaat 420 ttccgcgtac ggtgtcaaag tccggtgttt ttacgtaggt gtcagctgat cgccagggta 480 tttaaacctg cgctctccag tcaagaggcc actcttgagt gccagcgaga agagttttct 540 cctccgcgcc gcgagtcaga tctacacttt gaaagtaggg ataacagggt aatgacattg 600 attattgact agttgttaat agtaatcaat tacggggtca ttagttcata gcccatatat 660 ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc 720 ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca 780 ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta 840 tcatatgcca agtccgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta 900 tgcccagtac atgaccttac gggactttcc tacttggcag tacatctacg tattagtcat 960 cgctattacc atggtgatgc ggttttggca gtacaccaat gggcgtggat agcggtttga 1020 ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca 1080 aaatcaacgg gactttccaa aatgtcgtaa taaccccgcc ccgttgacgc aaatgggcgg 1140 taggcgtgta cggtgggagg tctatataag cagagctcgt ttagtgaacc gtcagatcgc 1200 ctggaacgcc atccacgctg ttttgacctc catagaagac agcgatcgcg ccaccatggc 1260 cgggatgttc caggcactgt ccgaaggctg cacaccctat gatattaacc agatgctgaa 1320 tgtcctggga gaccaccagg tctctggcct ggagcagctg gagagcatca tcaacttcga 1380 gaagctgacc gagtggacaa gctccaatgt gatgcctatc ctgtccccac tgaccaaggg 1440 catcctgggc ttcgtgttta ccctgacagt gccttctgag cggggcctgt cttgcatcag 1500 cgaggcagac gcaaccacac cagagtccgc caatctgggc gaggagatcc tgtctcagct 1560 gtacctgtgg ccccgggtga catatcactc cccttcttac gcctatcacc agttcgagcg 1620 gagagccaag tacaagagac acttcccagg ctttggccag tctctgctgt tcggctaccc 1680 cgtgtacgtg ttcggcgatt gcgtgcaggg cgactgggat gccatccggt ttagatactg 1740 cgcaccacct ggatatgcac tgctgaggtg taacgacacc aattattccg ccctgctggc 1800 agtgggcgcc ctggagggcc ctcgcaatca ggattggctg ggcgtgccaa ggcagctggt 1860 gacacgcatg caggccatcc agaacgcagg cctgtgcacc ctggtggcaa tgctggagga 1920 gacaatcttc tggctgcagg cctttctgat ggccctgacc gacagcggcc ccaagacaaa 1980 catcatcgtg gattcccagt acgtgatggg catctccaag ccttctttcc aggagtttgt 2040 ggactgggag aacgtgagcc cagagctgaa ttccaccgat cagccattct ggcaggcagg 2100 aatcctggca aggaacctgg tgcctatggt ggccacagtg cagggccaga atctgaagta 2160 ccagggccag agcctggtca tcagcgcctc catcatcgtg tttaacctgc tggagctgga 2220 gggcgactat cgggacgatg gcaacgtgtg ggtgcacacc ccactgagcc ccagaacact 2280 gaacgcctgg gtgaaggccg tggaggagaa gaagggcatc ccagtgcacc tggagctggc 2340 ctccatgacc aatatggagc tgatgtctag catcgtgcac cagcaggtga ggacatacgg 2400 acccgtgttc atgtgcctgg gaggcctgct gaccatggtg gcaggagccg tgtggctgac 2460 agtgcgggtg ctggagctgt tcagagccgc ccagctggcc aacgatgtgg tgctgcagat 2520 catggagctg tgcggagcag cctttcgcca ggtgtgccac accacagtgc catggcccaa 2580 tgcctccctg acccccaagt ggaacaatga gacaacacag cctcagatcg ccaactgtag 2640 cgtgtacgac ttcttcgtgt ggctgcacta ctatagcgtg agggataccc tgtggccccg 2700 cgtgacatac cacatgaata agtacgccta tcacatgctg gagaggcgcg ccaagtataa 2760 gagaggccct ggcccaggcg caaagtttgt ggcagcatgg accctgaagg ccgccgccgg 2820 ccccggcccc ggccagtata tcaaggctaa cagtaagttc attggaatca cagagctggg 2880 acccggacct ggataatgag tttaaaccgt tactggccga agccgcttgg aataaggccg 2940 gtgtgcgttt gtctatatgt tattttccac catattgccg tcttttggca atgtgagggc 3000 ccggaaacct ggccctgtct tcttgacgag cattcctagg ggtctttccc ctctcgccaa 3060 aggaatgcaa ggtctgttga atgtcgtgaa ggaagcagtt cctctggaag cttcttgaag 3120 acaaacaacg tctgtagcga ccctttgcag gcagcggaac cccccacctg gcgacaggtg 3180 cctctgcggc caaaagccac gtgtataaga tacacctgca aaggcggcac aaccccagtg 3240 ccacgttgtg agttggatag ttgtggaaag agtcaaatgg ctctcctcaa gcgtattcaa 3300 caaggggctg aaggatgccc agaaggtacc ccattgtatg ggatctgatc tggggcctcg 3360 gtgcacatgc tttacatgtg tttagtcgag gttaaaaaac gtctaggccc cccgaaccac 3420 ggggacgtgg ttttcctttg aaaaacacga tgataatatg ggctggtcct gcatcatcct 3480 gtttctggtg gctacagcca caggcgtgca ctctcaggtg caactggttg aatctggtgg 3540 cggagtggtg cagcctggca gatctctgag actgtcttgt gctgccagcg gcttcacctt 3600 cagcagctat ggcatgcact gggttcgaca ggcccctggc aaaggactgg aatgggttgc 3660 cgtgatttgg tacgacggca gcaacaagta ctacgccgac agcgtgaagg gcagattcac 3720 catctccaga gacaacagca agaacaccct gtacctgcag atgaacagcc tgagagccga 3780 ggacaccgcc gtgtactatt gcgctagaga tcctagaggc gccacactgt actactacta 3840 ttacggcatg gacgtgtggg gccagggcac cacagttaca gtgtctagcg cctctacaaa 3900 gggcccctcc gtttttcctc tggctccttg ttctagaagc accagcgagt ctacagccgc 3960 tctgggctgt ctggtcaagg actactttcc tgagcctgtg accgtgtcct ggaattctgg 4020 tgctctgaca agcggcgtgc acacctttcc agccgtgctg caaagcagcg gcctgtactc 4080 tctgtctagc gtggtcaccg tgcctagcag caatttcggc acccagacct acacctgtaa 4140 cgtggaccac aagcctagca acaccaaggt ggacaagacc gtggaacgga agtgctgcgt 4200 ggaatgccct ccttgtcctg ctcctccagt ggccggacct tccgtgtttc tgttccctcc 4260 aaagcctaag gacaccctga tgatcagcag aacccctgaa gtgacctgcg tggtggtgga 4320 tgtgtctcac gaggatcccg aggtgcagtt caattggtac gtggacggcg tggaagtgca 4380 caacgccaag accaagccta gagaggaaca gttcaactcc accttcagag tggtgtccgt 4440 gctgaccgtg gtgcatcagg actggctgaa cggcaaagag tacaagtgca aggtgtccaa 4500 caagggcctg cctgctccta tcgagaaaac catcagcaag accaaaggcc agcctcgcga 4560 gcctcaggtt tacacactgc ctccaagccg ggaagagatg accaagaatc aggtgtccct 4620 gacctgcctg gttaagggct tctaccccag cgacatctcc gtggaatggg agtctaatgg 4680 ccagccagag aacaactaca agaccacacc tcctatgctg gactccgatg gctcattctt 4740 cctgtacagc aagctgacag tggacaagtc cagatggcag cagggcaacg tgttcagctg 4800 ttctgtgatg cacgaggccc tgcacaacca ctacacccag aagtctctgt ctctgagccc 4860 cggcaaacgg aagagaagag gcgttagagc cgaaggcaga ggctctctgc tgacatgcgg 4920 agatgtggaa gagaaccccg gacctatgga catgagagtg cctgctcaac tgctgggact 4980 gctgcttctt tggctgcctg gcgctagatg cgacatccag atgacacaga gccctagcag 5040 cctgtctgcc tctgtgggcg atagagtgac catcacctgt cgggcctctc agagcatcaa 5100 cagctacctg gactggtatc agcaaaagcc cggcaaggcc cctaagctgc tgatctatgc 5160 cgctagctct ctgcagtctg gcgtgccaag cagattttct ggcagcggct ctggcaccga 5220 cttcaccctg acaatttcta gcctgcagcc tgaggacttc gccacctact actgccagca 5280 gtactacagc acccctttca cattcggccc tggcacaaag gtggaaatca agagaacagt 5340 ggccgctccg agcgtgttca tctttccacc tagcgacgag cagctgaaaa gcggcacagc 5400 ctctgtcgtg tgcctgctga acaacttcta ccctcgggaa gccaaggtgc agtggaaagt 5460 ggataatgcc ctgcagagcg gcaacagcca agagagcgtg acagagcagg atagcaagga 5520 cagcacctat agcctgagca gcacactgac cctgagcaag gccgactacg agaagcacaa 5580 ggtgtacgcc tgcgaagtga cacaccaggg actgagcagc cctgtgacca agagcttcaa 5640 cagaggcgag tgctgataga tttaaatgtg agggttaatg cttcgagcag acatgataag 5700 atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg 5760 tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa 5820 caacaacaat tgcattcatt ttatgtttca ggttcagggg gagatgtggg aggtttttta 5880 aagcaagtaa aacctctaca aatgtggtaa aataactata acggtcctaa ggtagcgagt 5940 gagtagtgtt ctggggcggg ggaggacctg catgagggcc agaataactg aaatctgtgc 6000 ttttctgtgt gttgcagcag catgagcgga agcggctcct ttgagggagg ggtattcagc 6060 ccttatctga cggggcgtct cccctcctgg gcgggagtgc gtcagaatgt gatgggatcc 6120 acggtggacg gccggcccgt gcagcccgcg aactcttcaa ccctgaccta tgcaaccctg 6180 agctcttcgt cgttggacgc agctgccgcc gcagctgctg catctgccgc cagcgccgtg 6240 cgcggaatgg ccatgggcgc cggctactac ggcactctgg tggccaactc gagttccacc 6300 aataatcccg ccagcctgaa cgaggagaag ctgttgctgc tgatggccca gctcgaggcc 6360 ttgacccagc gcctgggcga gctgacccag caggtggctc agctgcagga gcagacgcgg 6420 gccgcggttg ccacggtgaa atccaaataa aaaatgaatc aataaataaa cggagacggt 6480 tgttgatttt aacacagagt ctgaatcttt atttgatttt tcgcgcgcgg taggccctgg 6540 accaccggtc tcgatcattg agcacccggt ggatcttttc caggacccgg tagaggtggg 6600 cttggatgtt gaggtacatg ggcatgagcc cgtcccgggg gtggaggtag ctccattgca 6660 gggcctcgtg ctcgggggtg gtgttgtaaa tcacccagtc atagcagggg cgcagggcat 6720 ggtgttgcac aatatctttg aggaggagac tgatggccac gggcagccct ttggtgtagg 6780 tgtttacaaa tctgttgagc tgggagggat gcatgcgggg ggagatgagg tgcatcttgg 6840 cctggatctt gagattggcg atgttaccgc ccagatcccg cctggggttc atgttgtgca 6900 ggaccaccag cacggtgtat ccggtgcact tggggaattt atcatgcaac ttggaaggga 6960 aggcgtgaaa gaatttggcg acgcctttgt gcccgcccag gttttccatg cactcatcca 7020 tgatgatggc gatgggcccg tgggcggcgg cctgggcaaa gacgtttcgg gggtcggaca 7080 catcatagtt gtggtcctgg gtgaggtcat cataggccat tttaatgaat ttggggcgga 7140 gggtgccgga ctgggggaca aaggtaccct cgatcccggg ggcgtagttc ccctcacaga 7200 tctgcatctc ccaggctttg agctcggagg gggggatcat gtccacctgc ggggcgataa 7260 agaacacggt ttccggggcg ggggagatga gctgggccga aagcaagttc cggagcagct 7320 gggacttgcc gcagccggtg gggccgtaga tgaccccgat gaccggctgc aggtggtagt 7380 tgagggagag acagctgccg tcctcccgga ggaggggggc cacctcgttc atcatctcgc 7440 gcacgtgcat gttctcgcgc accagttccg ccaggaggcg ctctcccccc agggatagga 7500 gctcctggag cgaggcgaag tttttcagcg gcttgagtcc gtcggccatg ggcattttgg 7560 agagggtttg ttgcaagagt tccaggcggt cccagagctc ggtgatgtgc tctacggcat 7620 ctcgatccag cagacctcct cgtttcgcgg gttgggacgg ctgcgggagt agggcaccag 7680 acgatgggcg tccagcgcag ccagggtccg gtccttccag ggtcgcagcg tccgcgtcag 7740 ggtggtctcc gtcacggtga aggggtgcgc gccgggctgg gcgcttgcga gggtgcgctt 7800 caggctcatc cggctggtcg aaaaccgctc ccgatcggcg ccctgcgcgt cggccaggta 7860 gcaattgacc atgagttcgt agttgagcgc ctcggccgcg tggcctttgg cgcggagctt 7920 acctttggaa gtctgcccgc aggcgggaca gaggagggac ttgagggcgt agagcttggg 7980 ggcgaggaag acggactcgg gggcgtaggc gtccgcgccg cagtgggcgc agacggtctc 8040 gcactccacg agccaggtga ggtcgggctg gtcggggtca aaaaccagtt tcccgccgtt 8100 ctttttgatg cgtttcttac ctttggtctc catgagctcg tgtccccgct gggtgacaaa 8160 gaggctgtcc gtgtccccgt agaccgactt tatgggccgg tcctcgagcg gtgtgccgcg 8220 gtcctcctcg tagaggaacc ccgcccactc cgagacgaaa gcccgggtcc aggccagcac 8280 gaaggaggcc acgtgggacg ggtagcggtc gttgtccacc agcgggtcca ccttttccag 8340 ggtatgcaaa cacatgtccc cctcgtccac atccaggaag gtgattggct tgtaagtgta 8400 ggccacgtga ccgggggtcc cggccggggg ggtataaaag ggtgcgggtc cctgctcgtc 8460 ctcactgtct tccggatcgc tgtccaggag cgccagctgt tggggtaggt attccctctc 8520 gaaggcgggc atgacctcgg cactcaggtt gtcagtttct agaaacgagg aggatttgat 8580 attgacggtg ccggcggaga tgcctttcaa gagcccctcg tccatctggt cagaaaagac 8640 gatctttttg ttgtcgagct tggtggcgaa ggagccgtag agggcgttgg agaggagctt 8700 ggcgatggag cgcatggtct ggtttttttc cttgtcggcg cgctccttgg cggcgatgtt 8760 gagctgcacg tactcgcgcg ccacgcactt ccattcgggg aagacggtgg tcagctcgtc 8820 gggcacgatt ctgacctgcc agccccgatt atgcagggtg atgaggtcca cactggtggc 8880 cacctcgccg cgcaggggct cattagtcca gcagaggcgt ccgcccttgc gcgagcagaa 8940 ggggggcagg gggtccagca tgacctcgtc gggggggtcg gcatcgatgg tgaagatgcc 9000 gggcaggagg tcggggtcaa agtagctgat ggaagtggcc agatcgtcca gggcagcttg 9060 ccattcgcgc acggccagcg cgcgctcgta gggactgagg ggcgtgcccc agggcatggg 9120 atgggtaagc gcggaggcgt acatgccgca gatgtcgtag acgtagaggg gctcctcgag 9180 gatgccgatg taggtggggt agcagcgccc cccgcggatg ctggcgcgca cgtagtcata 9240 cagctcgtgc gagggggcga ggagccccgg gcccaggttg gtgcgactgg gcttttcggc 9300 gcggtagacg atctggcgga aaatggcatg cgagttggag gagatggtgg gcctttggaa 9360 gatgttgaag tgggcgtggg gcagtccgac cgagtcgcgg atgaagtggg cgtaggagtc 9420 ttgcagcttg gcgacgagct cggcggtgac taggacgtcc agagcgcagt agtcgagggt 9480 ctcctggatg atgtcatact tgagctgtcc cttttgtttc cacagctcgc ggttgagaag 9540 gaactcttcg cggtccttcc agtactcttc gagggggaac ccgtcctgat ctgcacggta 9600 agagcctagc atgtagaact ggttgacggc cttgtaggcg cagcagccct tctccacggg 9660 gagggcgtag gcctgggcgg ccttgcgcag ggaggtgtgc gtgagggcga aagtgtccct 9720 gaccatgacc ttgaggaact ggtgcttgaa gtcgatatcg tcgcagcccc cctgctccca 9780 gagctggaag tccgtgcgct tcttgtaggc ggggttgggc aaagcgaaag taacatcgtt 9840 gaagaggatc ttgcccgcgc ggggcataaa gttgcgagtg atgcggaaag gttggggcac 9900 ctcggcccgg ttgttgatga cctgggcggc gagcacgatc tcgtcgaagc cgttgatgtt 9960 gtggcccacg atgtagagtt ccacgaatcg cggacggccc ttgacgtggg gcagtttctt 10020 gagctcctcg taggtgagct cgtcggggtc gctgagcccg tgctgctcga gcgcccagtc 10080 ggcgagatgg gggttggcgc ggaggaagga agtccagaga tccacggcca gggcggtttg 10140 cagacggtcc cggtactgac ggaactgctg cccgacggcc attttttcgg gggtgacgca 10200 gtagaaggtg cgggggtccc cgtgccagcg atcccatttg agctggaggg cgagatcgag 10260 ggcgagctcg acgagccggt cgtccccgga gagtttcatg accagcatga aggggacgag 10320 ctgcttgccg aaggacccca tccaggtgta ggtttccaca tcgtaggtga ggaagagcct 10380 ttcggtgcga ggatgcgagc cgatggggaa gaactggatc tcctgccacc aattggagga 10440 atggctgttg atgtgatgga agtagaaatg ccgacggcgc gccgaacact cgtgcttgtg 10500 tttatacaag cggccacagt gctcgcaacg ctgcacggga tgcacgtgct gcacgagctg 10560 tacctgagtt cctttgacga ggaatttcag tgggaagtgg agtcgtggcg cctgcatctc 10620 gtgctgtact acgtcgtggt ggtcggcctg gccctcttct gcctcgatgg tggtcatgct 10680 gacgagcccg cgcgggaggc aggtccagac ctcggcgcga gcgggtcgga gagcgaggac 10740 gagggcgcgc aggccggagc tgtccagggt cctgagacgc tgcggagtca ggtcagtggg 10800 cagcggcggc gcgcggttga cttgcaggag tttttccagg gcgcgcggga ggtccagatg 10860 gtacttgatc tccaccgcgc cattggtggc gacgtcgatg gcttgcaggg tcccgtgccc 10920 ctggggtgtg accaccgtcc cccgtttctt cttgggcggc tggggcgacg ggggcggtgc 10980 ctcttccatg gttagaagcg gcggcgagga cgcgcgccgg gcggcagggg cggctcgggg 11040 cccggaggca ggggcggcag gggcacgtcg gcgccgcgcg cgggtaggtt ctggtactgc 11100 gcccggagaa gactggcgtg agcgacgacg cgacggttga cgtcctggat ctgacgcctc 11160 tgggtgaagg ccacgggacc cgtgagtttg aacctgaaag agagttcgac agaatcaatc 11220 tcggtatcgt tgacggcggc ctgccgcagg atctcttgca cgtcgcccga gttgtcctgg 11280 taggcgatct cggtcatgaa ctgctcgatc tcctcctctt gaaggtctcc gcggccggcg 11340 cgctccacgg tggccgcgag gtcgttggag atgcggccca tgagctgcga gaaggcgttc 11400 atgcccgcct cgttccagac gcggctgtag accacgacgc cctcgggatc gcgggcgcgc 11460 atgaccacct gggcgaggtt gagctccacg tggcgcgtga agaccgcgta gttgcagagg 11520 cgctggtaga ggtagttgag cgtggtggcg atgtgctcgg tgacgaagaa atacatgatc 11580 cagcggcgga gcggcatctc gctgacgtcg cccagcgcct ccaaacgttc catggcctcg 11640 taaaagtcca cggcgaagtt gaaaaactgg gagttgcgcg ccgagacggt caactcctcc 11700 tccagaagac ggatgagctc ggcgatggtg gcgcgcacct cgcgctcgaa ggcccccggg 11760 agttcctcca cttcctcttc ttcctcctcc actaacatct cttctacttc ctcctcaggc 11820 ggcagtggtg gcgggggagg gggcctgcgt cgccggcggc gcacgggcag acggtcgatg 11880 aagcgctcga tggtctcgcc gcgccggcgt cgcatggtct cggtgacggc gcgcccgtcc 11940 tcgcggggcc gcagcgtgaa gacgccgccg cgcatctcca ggtggccggg ggggtccccg 12000 ttgggcaggg agagggcgct gacgatgcat cttatcaatt gccccgtagg gactccgcgc 12060 aaggacctga gcgtctcgag atccacggga tctgaaaacc gctgaacgaa ggcttcgagc 12120 cagtcgcagt cgcaaggtag gctgagcacg gtttcttctg gcgggtcatg ttggttggga 12180 gcggggcggg cgatgctgct ggtgatgaag ttgaaatagg cggttctgag acggcggatg 12240 gtggcgagga gcaccaggtc tttgggcccg gcttgctgga tgcgcagacg gtcggccatg 12300 ccccaggcgt ggtcctgaca cctggccagg tccttgtagt agtcctgcat gagccgctcc 12360 acgggcacct cctcctcgcc cgcgcggccg tgcatgcgcg tgagcccgaa gccgcgctgg 12420 ggctggacga gcgccaggtc ggcgacgacg cgctcggcga ggatggcttg ctggatctgg 12480 gtgagggtgg tctggaagtc atcaaagtcg acgaagcggt ggtaggctcc ggtgttgatg 12540 gtgtaggagc agttggccat gacggaccag ttgacggtct ggtggcccgg acgcacgagc 12600 tcgtggtact tgaggcgcga gtaggcgcgc gtgtcgaaga tgtagtcgtt gcaggtgcgc 12660 accaggtact ggtagccgat gaggaagtgc ggcggcggct ggcggtagag cggccatcgc 12720 tcggtggcgg gggcgccggg cgcgaggtcc tcgagcatgg tgcggtggta gccgtagatg 12780 tacctggaca tccaggtgat gccggcggcg gtggtggagg cgcgcgggaa ctcgcggacg 12840 cggttccaga tgttgcgcag cggcaggaag tagttcatgg tgggcacggt ctggcccgtg 12900 aggcgcgcgc agtcgtggat gctctatacg ggcaaaaacg aaagcggtca gcggctcgac 12960 tccgtggcct ggaggctaag cgaacgggtt gggctgcgcg tgtaccccgg ttcgaatctc 13020 gaatcaggct ggagccgcag ctaacgtggt attggcactc ccgtctcgac ccaagcctgc 13080 accaaccctc caggatacgg aggcgggtcg ttttgcaact tttttttgga ggccggatga 13140 gactagtaag cgcggaaagc ggccgaccgc gatggctcgc tgccgtagtc tggagaagaa 13200 tcgccagggt tgcgttgcgg tgtgccccgg ttcgaggccg gccggattcc gcggctaacg 13260 agggcgtggc tgccccgtcg tttccaagac cccatagcca gccgacttct ccagttacgg 13320 agcgagcccc tcttttgttt tgtttgtttt tgccagatgc atcccgtact gcggcagatg 13380 cgcccccacc accctccacc gcaacaacag ccccctccac agccggcgct tctgcccccg 13440 ccccagcagc aacttccagc cacgaccgcc gcggccgccg tgagcggggc tggacagagt 13500 tatgatcacc agctggcctt ggaagagggc gaggggctgg cgcgcctggg ggcgtcgtcg 13560 ccggagcggc acccgcgcgt gcagatgaaa agggacgctc gcgaggccta cgtgcccaag 13620 cagaacctgt tcagagacag gagcggcgag gagcccgagg agatgcgcgc ggcccggttc 13680 cacgcggggc gggagctgcg gcgcggcctg gaccgaaaga gggtgctgag ggacgaggat 13740 ttcgaggcgg acgagctgac ggggatcagc cccgcgcgcg cgcacgtggc cgcggccaac 13800 ctggtcacgg cgtacgagca gaccgtgaag gaggagagca acttccaaaa atccttcaac 13860 aaccacgtgc gcaccctgat cgcgcgcgag gaggtgaccc tgggcctgat gcacctgtgg 13920 gacctgctgg aggccatcgt gcagaacccc accagcaagc cgctgacggc gcagctgttc 13980 ctggtggtgc agcatagtcg ggacaacgaa gcgttcaggg aggcgctgct gaatatcacc 14040 gagcccgagg gccgctggct cctggacctg gtgaacattc tgcagagcat cgtggtgcag 14100 gagcgcgggc tgccgctgtc cgagaagctg gcggccatca acttctcggt gctgagtttg 14160 ggcaagtact acgctaggaa gatctacaag accccgtacg tgcccataga caaggaggtg 14220 aagatcgacg ggttttacat gcgcatgacc ctgaaagtgc tgaccctgag cgacgatctg 14280 ggggtgtacc gcaacgacag gatgcaccgt gcggtgagcg ccagcaggcg gcgcgagctg 14340 agcgaccagg agctgatgca tagtctgcag cgggccctga ccggggccgg gaccgagggg 14400 gagagctact ttgacatggg cgcggacctg cactggcagc ccagccgccg ggccttggag 14460 gcggcggcag gaccctacgt agaagaggtg gacgatgagg tggacgagga gggcgagtac 14520 ctggaagact gatggcgcga ccgtattttt gctagatgca acaacaacag ccacctcctg 14580 atcccgcgat gcgggcggcg ctgcagagcc agccgtccgg cattaactcc tcggacgatt 14640 ggacccaggc catgcaacgc atcatggcgc tgacgacccg caaccccgaa gcctttagac 14700 agcagcccca ggccaaccgg ctctcggcca tcctggaggc cgtggtgccc tcgcgctcca 14760 accccacgca cgagaaggtc ctggccatcg tgaacgcgct ggtggagaac aaggccatcc 14820 gcggcgacga ggccggcctg gtgtacaacg cgctgctgga gcgcgtggcc cgctacaaca 14880 gcaccaacgt gcagaccaac ctggaccgca tggtgaccga cgtgcgcgag gccgtggccc 14940 agcgcgagcg gttccaccgc gagtccaacc tgggatccat ggtggcgctg aacgccttcc 15000 tcagcaccca gcccgccaac gtgccccggg gccaggagga ctacaccaac ttcatcagcg 15060 ccctgcgcct gatggtgacc gaggtgcccc agagcgaggt gtaccagtcc gggccggact 15120 acttcttcca gaccagtcgc cagggcttgc agaccgtgaa cctgagccag gctttcaaga 15180 acttgcaggg cctgtggggc gtgcaggccc cggtcgggga ccgcgcgacg gtgtcgagcc 15240 tgctgacgcc gaactcgcgc ctgctgctgc tgctggtggc ccccttcacg gacagcggca 15300 gcatcaaccg caactcgtac ctgggctacc tgattaacct gtaccgcgag gccatcggcc 15360 aggcgcacgt ggacgagcag acctaccagg agatcaccca cgtgagccgc gccctgggcc 15420 aggacgaccc gggcaacctg gaagccaccc tgaacttttt gctgaccaac cggtcgcaga 15480 agatcccgcc ccagtacgcg ctcagcaccg aggaggagcg catcctgcgt tacgtgcagc 15540 agagcgtggg cctgttcctg atgcaggagg gggccacccc cagcgccgcg ctcgacatga 15600 ccgcgcgcaa catggagccc agcatgtacg ccagcaaccg cccgttcatc aataaactga 15660 tggactactt gcatcgggcg gccgccatga actctgacta tttcaccaac gccatcctga 15720 atccccactg gctcccgccg ccggggttct acacgggcga gtacgacatg cccgacccca 15780 atgacgggtt cctgtgggac gatgtggaca gcagcgtgtt ctccccccga ccgggtgcta 15840 acgagcgccc cttgtggaag aaggaaggca gcgaccgacg cccgtcctcg gcgctgtccg 15900 gccgcgaggg tgctgccgcg gcggtgcccg aggccgccag tcctttcccg agcttgccct 15960 tctcgctgaa cagtatccgc agcagcgagc tgggcaggat cacgcgcccg cgcttgctgg 16020 gcgaagagga gtacttgaat gactcgctgt tgagacccga gcgggagaag aacttcccca 16080 ataacgggat agaaagcctg gtggacaaga tgagccgctg gaagacgtat gcgcaggagc 16140 acagggacga tccccgggcg tcgcaggggg ccacgagccg gggcagcgcc gcccgtaaac 16200 gccggtggca cgacaggcag cggggacaga tgtgggacga tgaggactcc gccgacgaca 16260 gcagcgtgtt ggacttgggt gggagtggta acccgttcgc tcacctgcgc ccccgtatcg 16320 ggcgcatgat gtaagagaaa ccgaaaataa atgatactca ccaaggccat ggcgaccagc 16380 gtgcgttcgt ttcttctctg ttgttgttgt atctagtatg atgaggcgtg cgtacccgga 16440 gggtcctcct ccctcgtacg agagcgtgat gcagcaggcg atggcggcgg cggcgatgca 16500 gcccccgctg gaggctcctt acgtgccccc gcggtacctg gcgcctacgg aggggcggaa 16560 cagcattcgt tactcggagc tggcaccctt gtacgatacc acccggttgt acctggtgga 16620 caacaagtcg gcggacatcg cctcgctgaa ctaccagaac gaccacagca acttcctgac 16680 caccgtggtg cagaacaatg acttcacccc cacggaggcc agcacccaga ccatcaactt 16740 tgacgagcgc tcgcggtggg gcggccagct gaaaaccatc atgcacacca acatgcccaa 16800 cgtgaacgag ttcatgtaca gcaacaagtt caaggcgcgg gtgatggtct cccgcaagac 16860 ccccaatggg gtgacagtga cagaggatta tgatggtagt caggatgagc tgaagtatga 16920 atgggtggaa tttgagctgc ccgaaggcaa cttctcggtg accatgacca tcgacctgat 16980 gaacaacgcc atcatcgaca attacttggc ggtggggcgg cagaacgggg tgctggagag 17040 cgacatcggc gtgaagttcg acactaggaa cttcaggctg ggctgggacc ccgtgaccga 17100 gctggtcatg cccggggtgt acaccaacga ggctttccat cccgatattg tcttgctgcc 17160 cggctgcggg gtggacttca ccgagagccg cctcagcaac ctgctgggca ttcgcaagag 17220 gcagcccttc caggaaggct tccagatcat gtacgaggat ctggaggggg gcaacatccc 17280 cgcgctcctg gatgtcgacg cctatgagaa aagcaaggag gatgcagcag ctgaagcaac 17340 tgcagccgta gctaccgcct ctaccgaggt caggggcgat aattttgcaa gcgccgcagc 17400 agtggcagcg gccgaggcgg ctgaaaccga aagtaagata gtcattcagc cggtggagaa 17460 ggatagcaag aacaggagct acaacgtact accggacaag ataaacaccg cctaccgcag 17520 ctggtaccta gcctacaact atggcgaccc cgagaagggc gtgcgctcct ggacgctgct 17580 caccacctcg gacgtcacct gcggcgtgga gcaagtctac tggtcgctgc ccgacatgat 17640 gcaagacccg gtcaccttcc gctccacgcg tcaagttagc aactacccgg tggtgggcgc 17700 cgagctcctg cccgtctact ccaagagctt cttcaacgag caggccgtct actcgcagca 17760 gctgcgcgcc ttcacctcgc ttacgcacgt cttcaaccgc ttccccgaga accagatcct 17820 cgtccgcccg cccgcgccca ccattaccac cgtcagtgaa aacgttcctg ctctcacaga 17880 tcacgggacc ctgccgctgc gcagcagtat ccggggagtc cagcgcgtga ccgttactga 17940 cgccagacgc cgcacctgcc cctacgtcta caaggccctg ggcatagtcg cgccgcgcgt 18000 cctctcgagc cgcaccttct aaatgtccat tctcatctcg cccagtaata acaccggttg 18060 gggcctgcgc gcgcccagca agatgtacgg aggcgctcgc caacgctcca cgcaacaccc 18120 cgtgcgcgtg cgcgggcact tccgcgctcc ctggggcgcc ctcaagggcc gcgtgcggtc 18180 gcgcaccacc gtcgacgacg tgatcgacca ggtggtggcc gacgcgcgca actacacccc 18240 cgccgccgcg cccgtctcca ccgtggacgc cgtcatcgac agcgtggtgg ccgacgcgcg 18300 ccggtacgcc cgcgccaaga gccggcggcg gcgcatcgcc cggcggcacc ggagcacccc 18360 cgccatgcgc gcggcgcgag ccttgctgcg cagggccagg cgcacgggac gcagggccat 18420 gctcagggcg gccagacgcg cggcttcagg cgccagcgcc ggcaggaccc ggagacgcgc 18480 ggccacggcg gcggcagcgg ccatcgccag catgtcccgc ccgcggcgag ggaacgtgta 18540 ctgggtgcgc gacgccgcca ccggtgtgcg cgtgcccgtg cgcacccgcc cccctcgcac 18600 ttgaagatgt tcacttcgcg atgttgatgt gtcccagcgg cgaggaggat gtccaagcgc 18660 aaattcaagg aagagatgct ccaggtcatc gcgcctgaga tctacggccc tgcggtggtg 18720 aaggaggaaa gaaagccccg caaaatcaag cgggtcaaaa aggacaaaaa ggaagaagaa 18780 agtgatgtgg acggattggt ggagtttgtg cgcgagttcg ccccccggcg gcgcgtgcag 18840 tggcgcgggc ggaaggtgca accggtgctg agacccggca ccaccgtggt cttcacgccc 18900 ggcgagcgct ccggcaccgc ttccaagcgc tcctacgacg aggtgtacgg ggatgatgat 18960 attctggagc aggcggccga gcgcctgggc gagtttgctt acggcaagcg cagccgttcc 19020 gcaccgaagg aagaggcggt gtccatcccg ctggaccacg gcaaccccac gccgagcctc 19080 aagcccgtga ccttgcagca ggtgctgccg accgcggcgc cgcgccgggg gttcaagcgc 19140 gagggcgagg atctgtaccc caccatgcag ctgatggtgc ccaagcgcca gaagctggaa 19200 gacgtgctgg agaccatgaa ggtggacccg gacgtgcagc ccgaggtcaa ggtgcggccc 19260 atcaagcagg tggccccggg cctgggcgtg cagaccgtgg acatcaagat tcccacggag 19320 cccatggaaa cgcagaccga gcccatgatc aagcccagca ccagcaccat ggaggtgcag 19380 acggatccct ggatgccatc ggctcctagt cgaagacccc ggcgcaagta cggcgcggcc 19440 agcctgctga tgcccaacta cgcgctgcat ccttccatca tccccacgcc gggctaccgc 19500 ggcacgcgct tctaccgcgg tcataccagc agccgccgcc gcaagaccac cactcgccgc 19560 cgccgtcgcc gcaccgccgc tgcaaccacc cctgccgccc tggtgcggag agtgtaccgc 19620 cgcggccgcg cacctctgac cctgccgcgc gcgcgctacc acccgagcat cgccatttaa 19680 actttcgcct gctttgcaga tcaatggccc tcacatgccg ccttcgcgtt cccattacgg 19740 gctaccgagg aagaaaaccg cgccgtagaa ggctggcggg gaacgggatg cgtcgccacc 19800 accaccggcg gcggcgcgcc atcagcaagc ggttgggggg aggcttcctg cccgcgctga 19860 tccccatcat cgccgcggcg atcggggcga tccccggcat tgcttccgtg gcggtgcagg 19920 cctctcagcg ccactgagac acacttggaa acatcttgta ataaaccaat ggactctgac 19980 gctcctggtc ctgtgatgtg ttttcgtaga cagatggaag acatcaattt ttcgtccctg 20040 gctccgcgac acggcacgcg gccgttcatg ggcacctgga gcgacatcgg caccagccaa 20100 ctgaacgggg gcgccttcaa ttggagcagt ctctggagcg ggcttaagaa tttcgggtcc 20160 acgcttaaaa cctatggcag caaggcgtgg aacagcacca cagggcaggc gctgagggat 20220 aagctgaaag agcagaactt ccagcagaag gtggtcgatg ggctcgcctc gggcatcaac 20280 ggggtggtgg acctggccaa ccaggccgtg cagcggcaga tcaacagccg cctggacccg 20340 gtgccgcccg ccggctccgt ggagatgccg caggtggagg aggagctgcc tcccctggac 20400 aagcggggcg agaagcgacc ccgccccgat gcggaggaga cgctgctgac gcacacggac 20460 gagccgcccc cgtacgagga ggcggtgaaa ctgggtctgc ccaccacgcg gcccatcgcg 20520 cccctggcca ccggggtgct gaaacccgaa aagcccgcga ccctggactt gcctcctccc 20580 cagccttccc gcccctctac agtggctaag cccctgccgc cggtggccgt ggcccgcgcg 20640 cgacccgggg gcaccgcccg ccctcatgcg aactggcaga gcactctgaa cagcatcgtg 20700 ggtctgggag tgcagagtgt gaagcgccgc cgctgctatt aaacctaccg tagcgcttaa 20760 cttgcttgtc tgtgtgtgta tgtattatgt cgccgccgcc gctgtccacc agaaggagga 20820 gtgaagaggc gcgtcgccga gttgcaagat ggccacccca tcgatgctgc cccagtgggc 20880 gtacatgcac atcgccggac aggacgcttc ggagtacctg agtccgggtc tggtgcagtt 20940 tgcccgcgcc acagacacct acttcagtct ggggaacaag tttaggaacc ccacggtggc 21000 gcccacgcac gatgtgacca ccgaccgcag ccagcggctg acgctgcgct tcgtgcccgt 21060 ggaccgcgag gacaacacct actcgtacaa agtgcgctac acgctggccg tgggcgacaa 21120 ccgcgtgctg gacatggcca gcacctactt tgacatccgc ggcgtgctgg atcggggccc 21180 tagcttcaaa ccctactccg gcaccgccta caacagtctg gcccccaagg gagcacccaa 21240 cacttgtcag tggacatata aagccgatgg tgaaactgcc acagaaaaaa cctatacata 21300 tggaaatgca cccgtgcagg gcattaacat cacaaaagat ggtattcaac ttggaactga 21360 caccgatgat cagccaatct acgcagataa aacctatcag cctgaacctc aagtgggtga 21420 tgctgaatgg catgacatca ctggtactga tgaaaagtat ggaggcagag ctcttaagcc 21480 tgataccaaa atgaagcctt gttatggttc ttttgccaag cctactaata aagaaggagg 21540 tcaggcaaat gtgaaaacag gaacaggcac tactaaagaa tatgacatag acatggcttt 21600 ctttgacaac agaagtgcgg ctgctgctgg cctagctcca gaaattgttt tgtatactga 21660 aaatgtggat ttggaaactc cagataccca tattgtatac aaagcaggca cagatgacag 21720 cagctcttct attaatttgg gtcagcaagc catgcccaac agacctaact acattggttt 21780 cagagacaac tttatcgggc tcatgtacta caacagcact ggcaatatgg gggtgctggc 21840 cggtcaggct tctcagctga atgctgtggt tgacttgcaa gacagaaaca ccgagctgtc 21900 ctaccagctc ttgcttgact ctctgggtga cagaacccgg tatttcagta tgtggaatca 21960 ggcggtggac agctatgatc ctgatgtgcg cattattgaa aatcatggtg tggaggatga 22020 acttcccaac tattgtttcc ctctggatgc tgttggcaga acagatactt atcagggaat 22080 taaggctaat ggaactgatc aaaccacatg gaccaaagat gacagtgtca atgatgctaa 22140 tgagataggc aagggtaatc cattcgccat ggaaatcaac atccaagcca acctgtggag 22200 gaacttcctc tacgccaacg tggccctgta cctgcccgac tcttacaagt acacgccggc 22260 caatgttacc ctgcccacca acaccaacac ctacgattac atgaacggcc gggtggtggc 22320 gccctcgctg gtggactcct acatcaacat cggggcgcgc tggtcgctgg atcccatgga 22380 caacgtgaac cccttcaacc accaccgcaa tgcggggctg cgctaccgct ccatgctcct 22440 gggcaacggg cgctacgtgc ccttccacat ccaggtgccc cagaaatttt tcgccatcaa 22500 gagcctcctg ctcctgcccg ggtcctacac ctacgagtgg aacttccgca aggacgtcaa 22560 catgatcctg cagagctccc tcggcaacga cctgcgcacg gacggggcct ccatctcctt 22620 caccagcatc aacctctacg ccaccttctt ccccatggcg cacaacacgg cctccacgct 22680 cgaggccatg ctgcgcaacg acaccaacga ccagtccttc aacgactacc tctcggcggc 22740 caacatgctc taccccatcc cggccaacgc caccaacgtg cccatctcca tcccctcgcg 22800 caactgggcc gccttccgcg gctggtcctt cacgcgtctc aagaccaagg agacgccctc 22860 gctgggctcc gggttcgacc cctacttcgt ctactcgggc tccatcccct acctcgacgg 22920 caccttctac ctcaaccaca ccttcaagaa ggtctccatc accttcgact cctccgtcag 22980 ctggcccggc aacgaccggc tcctgacgcc caacgagttc gaaatcaagc gcaccgtcga 23040 cggcgagggc tacaacgtgg cccagtgcaa catgaccaag gactggttcc tggtccagat 23100 gctggcccac tacaacatcg gctaccaggg cttctacgtg cccgagggct acaaggaccg 23160 catgtactcc ttcttccgca acttccagcc catgagccgc caggtggtgg acgaggtcaa 23220 ctacaaggac taccaggccg tcaccctggc ctaccagcac aacaactcgg gcttcgtcgg 23280 ctacctcgcg cccaccatgc gccagggcca gccctacccc gccaactacc cctacccgct 23340 catcggcaag agcgccgtca ccagcgtcac ccagaaaaag ttcctctgcg acagggtcat 23400 gtggcgcatc cccttctcca gcaacttcat gtccatgggc gcgctcaccg acctcggcca 23460 gaacatgctc tatgccaact ccgcccacgc gctagacatg aatttcgaag tcgaccccat 23520 ggatgagtcc acccttctct atgttgtctt cgaagtcttc gacgtcgtcc gagtgcacca 23580 gccccaccgc ggcgtcatcg aggccgtcta cctgcgcacc cccttctcgg ccggtaacgc 23640 caccacctaa gctcttgctt cttgcaagcc atggccgcgg gctccggcga gcaggagctc 23700 agggccatca tccgcgacct gggctgcggg ccctacttcc tgggcacctt cgataagcgc 23760 ttcccgggat tcatggcccc gcacaagctg gcctgcgcca tcgtcaacac ggccggccgc 23820 gagaccgggg gcgagcactg gctggccttc gcctggaacc cgcgctcgaa cacctgctac 23880 ctcttcgacc ccttcgggtt ctcggacgag cgcctcaagc agatctacca gttcgagtac 23940 gagggcctgc tgcgccgcag cgccctggcc accgaggacc gctgcgtcac cctggaaaag 24000 tccacccaga ccgtgcaggg tccgcgctcg gccgcctgcg ggctcttctg ctgcatgttc 24060 ctgcacgcct tcgtgcactg gcccgaccgc cccatggaca agaaccccac catgaacttg 24120 ctgacggggg tgcccaacgg catgctccag tcgccccagg tggaacccac cctgcgccgc 24180 aaccaggagg cgctctaccg cttcctcaac tcccactccg cctactttcg ctcccaccgc 24240 gcgcgcatcg agaaggccac cgccttcgac cgcatgaatc aagacatgta aaccgtgtgt 24300 gtatgttaaa tgtctttaat aaacagcact ttcatgttac acatgcatct gagatgattt 24360 atttagaaat cgaaagggtt ctgccgggtc tcggcatggc ccgcgggcag ggacacgttg 24420 cggaactggt acttggccag ccacttgaac tcggggatca gcagtttggg cagcggggtg 24480 tcggggaagg agtcggtcca cagcttccgc gtcagttgca gggcgcccag caggtcgggc 24540 gcggagatct tgaaatcgca gttgggaccc gcgttctgcg cgcgggagtt gcggtacacg 24600 gggttgcagc actggaacac catcagggcc gggtgcttca cgctcgccag caccgtcgcg 24660 tcggtgatgc tctccacgtc gaggtcctcg gcgttggcca tcccgaaggg ggtcatcttg 24720 caggtctgcc ttcccatggt gggcacgcac ccgggcttgt ggttgcaatc gcagtgcagg 24780 gggatcagca tcatctgggc ctggtcggcg ttcatccccg ggtacatggc cttcatgaaa 24840 gcctccaatt gcctgaacgc ctgctgggcc ttggctccct cggtgaagaa gaccccgcag 24900 gacttgctag agaactggtt ggtggcgcac ccggcgtcgt gcacgcagca gcgcgcgtcg 24960 ttgttggcca gctgcaccac gctgcgcccc cagcggttct gggtgatctt ggcccggtcg 25020 gggttctcct tcagcgcgcg ctgcccgttc tcgctcgcca catccatctc gatcatgtgc 25080 tccttctgga tcatggtggt cccgtgcagg caccgcagct tgccctcggc ctcggtgcac 25140 ccgtgcagcc acagcgcgca cccggtgcac tcccagttct tgtgggcgat ctgggaatgc 25200 gcgtgcacga agccctgcag gaagcggccc atcatggtgg tcagggtctt gttgctagtg 25260 aaggtcagcg gaatgccgcg gtgctcctcg ttgatgtaca ggtggcagat gcggcggtac 25320 acctcgccct gctcgggcat cagctggaag ttggctttca ggtcggtctc cacgcggtag 25380 cggtccatca gcatagtcat gatttccata cccttctccc aggccgagac gatgggcagg 25440 ctcatagggt tcttcaccat catcttagcg ctagcagccg cggccagggg gtcgctctcg 25500 tccagggtct caaagctccg cttgccgtcc ttctcggtga tccgcaccgg ggggtagctg 25560 aagcccacgg ccgccagctc ctcctcggcc tgtctttcgt cctcgctgtc ctggctgacg 25620 tcctgcagga ccacatgctt ggtcttgcgg ggtttcttct tgggcggcag cggcggcgga 25680 gatgttggag atggcgaggg ggagcgcgag ttctcgctca ccactactat ctcttcctct 25740 tcttggtccg aggccacgcg gcggtaggta tgtctcttcg ggggcagagg cggaggcgac 25800 gggctctcgc cgccgcgact tggcggatgg ctggcagagc cccttccgcg ttcgggggtg 25860 cgctcccggc ggcgctctga ctgacttcct ccgcggccgg ccattgtgtt ctcctaggga 25920 ggaacaacaa gcatggagac tcagccatcg ccaacctcgc catctgcccc caccgccgac 25980 gagaagcagc agcagcagaa tgaaagctta accgccccgc cgcccagccc cgccacctcc 26040 gacgcggccg tcccagacat gcaagagatg gaggaatcca tcgagattga cctgggctat 26100 gtgacgcccg cggagcacga ggaggagctg gcagtgcgct tttcacaaga agagatacac 26160 caagaacagc cagagcagga agcagagaat gagcagagtc aggctgggct cgagcatgac 26220 ggcgactacc tccacctgag cgggggggag gacgcgctca tcaagcatct ggcccggcag 26280 gccaccatcg tcaaggatgc gctgctcgac cgcaccgagg tgcccctcag cgtggaggag 26340 ctcagccgcg cctacgagtt gaacctcttc tcgccgcgcg tgccccccaa gcgccagccc 26400 aatggcacct gcgagcccaa cccgcgcctc aacttctacc cggtcttcgc ggtgcccgag 26460 gccctggcca cctaccacat ctttttcaag aaccaaaaga tccccgtctc ctgccgcgcc 26520 aaccgcaccc gcgccgacgc ccttttcaac ctgggtcccg gcgcccgcct acctgatatc 26580 gcctccttgg aagaggttcc caagatcttc gagggtctgg gcagcgacga gactcgggcc 26640 gcgaacgctc tgcaaggaga aggaggagag catgagcacc acagcgccct ggtcgagttg 26700 gaaggcgaca acgcgcggct ggcggtgctc aaacgcacgg tcgagctgac ccatttcgcc 26760 tacccggctc tgaacctgcc ccccaaagtc atgagcgcgg tcatggacca ggtgctcatc 26820 aagcgcgcgt cgcccatctc cgaggacgag ggcatgcaag actccgagga gggcaagccc 26880 gtggtcagcg acgagcagct ggcccggtgg ctgggtccta atgctagtcc ccagagtttg 26940 gaagagcggc gcaaactcat gatggccgtg gtcctggtga ccgtggagct ggagtgcctg 27000 cgccgcttct tcgccgacgc ggagaccctg cgcaaggtcg aggagaacct gcactacctc 27060 ttcaggcacg ggttcgtgcg ccaggcctgc aagatctcca acgtggagct gaccaacctg 27120 gtctcctaca tgggcatctt gcacgagaac cgcctggggc agaacgtgct gcacaccacc 27180 ctgcgcgggg aggcccggcg cgactacatc cgcgactgcg tctacctcta cctctgccac 27240 acctggcaga cgggcatggg cgtgtggcag cagtgtctgg aggagcagaa cctgaaagag 27300 ctctgcaagc tcctgcagaa gaacctcaag ggtctgtgga ccgggttcga cgagcgcacc 27360 accgcctcgg acctggccga cctcattttc cccgagcgcc tcaggctgac gctgcgcaac 27420 ggcctgcccg actttatgag ccaaagcatg ttgcaaaact ttcgctcttt catcctcgaa 27480 cgctccggaa tcctgcccgc cacctgctcc gcgctgccct cggacttcgt gccgctgacc 27540 ttccgcgagt gccccccgcc gctgtggagc cactgctacc tgctgcgcct ggccaactac 27600 ctggcctacc actcggacgt gatcgaggac gtcagcggcg agggcctgct cgagtgccac 27660 tgccgctgca acctctgcac gccgcaccgc tccctggcct gcaaccccca gctgctgagc 27720 gagacccaga tcatcggcac cttcgagttg caagggccca gcgaaggcga gggttcagcc 27780 gccaaggggg gtctgaaact caccccgggg ctgtggacct cggcctactt gcgcaagttc 27840 gtgcccgagg actaccatcc cttcgagatc aggttctacg aggaccaatc ccatccgccc 27900 aaggccgagc tgtcggcctg cgtcatcacc cagggggcga tcctggccca attgcaagcc 27960 atccagaaat cccgccaaga attcttgctg aaaaagggcc gcggggtcta cctcgacccc 28020 cagaccggtg aggagctcaa ccccggcttc ccccaggatg ccccgaggaa acaagaagct 28080 gaaagtggag ctgccgcccg tggaggattt ggaggaagac tgggagaaca gcagtcaggc 28140 agaggaggag gagatggagg aagactggga cagcactcag gcagaggagg acagcctgca 28200 agacagtctg gaggaagacg aggaggaggc agaggaggag gtggaagaag cagccgccgc 28260 cagaccgtcg tcctcggcgg gggagaaagc aagcagcacg gataccatct ccgctccggg 28320 tcggggtccc gctcgaccac acagtagatg ggacgagacc ggacgattcc cgaaccccac 28380 cacccagacc ggtaagaagg agcggcaggg atacaagtcc tggcgggggc acaaaaacgc 28440 catcgtctcc tgcttgcagg cctgcggggg caacatctcc ttcacccggc gctacctgct 28500 cttccaccgc ggggtgaact ttccccgcaa catcttgcat tactaccgtc acctccacag 28560 cccctactac ttccaagaag aggcagcagc agcagaaaaa gaccagcaga aaaccagcag 28620 ctagaaaatc cacagcggcg gcagcaggtg gactgaggat cgcggcgaac gagccggcgc 28680 aaacccggga gctgaggaac cggatctttc ccaccctcta tgccatcttc cagcagagtc 28740 gggggcagga gcaggaactg aaagtcaaga accgttctct gcgctcgctc acccgcagtt 28800 gtctgtatca caagagcgaa gaccaacttc agcgcactct cgaggacgcc gaggctctct 28860 tcaacaagta ctgcgcgctc actcttaaag agtagcccgc gcccgcccag tcgcagaaaa 28920 aggcgggaat tacgtcacct gtgcccttcg ccctagccgc ctccacccat catcatgagc 28980 aaagagattc ccacgcctta catgtggagc taccagcccc agatgggcct ggccgccggt 29040 gccgcccagg actactccac ccgcatgaat tggctcagcg ccgggcccgc gatgatctca 29100 cgggtgaatg acatccgcgc ccaccgaaac cagatactcc tagaacagtc agcgctcacc 29160 gccacgcccc gcaatcacct caatccgcgt aattggcccg ccgccctggt gtaccaggaa 29220 attccccagc ccacgaccgt actacttccg cgagacgccc aggccgaagt ccagctgact 29280 aactcaggtg tccagctggc gggcggcgcc accctgtgtc gtcaccgccc cgctcagggt 29340 ataaagcggc tggtgatccg gggcagaggc acacagctca acgacgaggt ggtgagctct 29400 tcgctgggtc tgcgacctga cggagtcttc caactcgccg gatcggggag atcttccttc 29460 acgcctcgtc aggccgtcct gactttggag agttcgtcct cgcagccccg ctcgggtggc 29520 atcggcactc tccagttcgt ggaggagttc actccctcgg tctacttcaa ccccttctcc 29580 ggctcccccg gccactaccc ggacgagttc atcccgaact tcgacgccat cagcgagtcg 29640 gtggacggct acgattgaaa ctaatcaccc ccttatccag tgaaataaag atcatattga 29700 tgatgatttt acagaaataa aaaataatca tttgatttga aataaagata caatcatatt 29760 gatgatttga gtttaacaaa aaaataaaga atcacttact tgaaatctga taccaggtct 29820 ctgtccatgt tttctgccaa caccacttca ctcccctctt cccagctctg gtactgcagg 29880 ccccggcggg ctgcaaactt cctccacacg ctgaagggga tgtcaaattc ctcctgtccc 29940 tcaatcttca ttttatcttc tatcagatgt ccaaaaagcg cgtccgggtg gatgatgact 30000 tcgaccccgt ctacccctac gatgcagaca acgcaccgac cgtgcccttc atcaaccccc 30060 ccttcgtctc ttcagatgga ttccaagaga agcccctggg ggtgttgtcc ctgcgactgg 30120 ccgaccccgt caccaccaag aacggggaaa tcaccctcaa gctgggagag ggggtggacc 30180 tcgattcctc gggaaaactc atctccaaca cggccaccaa ggccgccgcc cctctcagtt 30240 tttccaacaa caccatttcc cttaacatgg atcacccctt ttacactaaa gatggaaaat 30300 tatccttaca agtttctcca ccattaaata tactgagaac aagcattcta aacacactag 30360 ctttaggttt tggatcaggt ttaggactcc gtggctctgc cttggcagta cagttagtct 30420 ctccacttac atttgatact gatggaaaca taaagcttac cttagacaga ggtttgcatg 30480 ttacaacagg agatgcaatt gaaagcaaca taagctgggc taaaggttta aaatttgaag 30540 atggagccat agcaaccaac attggaaatg ggttagagtt tggaagcagt agtacagaaa 30600 caggtgttga tgatgcttac ccaatccaag ttaaacttgg atctggcctt agctttgaca 30660 gtacaggagc cataatggct ggtaacaaag aagacgataa actcactttg tggacaacac 30720 ctgatccatc accaaactgt caaatactcg cagaaaatga tgcaaaacta acactttgct 30780 tgactaaatg tggtagtcaa atactggcca ctgtgtcagt cttagttgta ggaagtggaa 30840 acctaaaccc cattactggc accgtaagca gtgctcaggt gtttctacgt tttgatgcaa 30900 acggtgttct tttaacagaa cattctacac taaaaaaata ctgggggtat aggcagggag 30960 atagcataga tggcactcca tataccaatg ctgtaggatt catgcccaat ttaaaagctt 31020 atccaaagtc acaaagttct actactaaaa ataatatagt agggcaagta tacatgaatg 31080 gagatgtttc aaaacctatg cttctcacta taaccctcaa tggtactgat gacagcaaca 31140 gtacatattc aatgtcattt tcatacacct ggactaatgg aagctatgtt ggagcaacat 31200 ttggggctaa ctcttatacc ttctcataca tcgcccaaga atgaacactg tatcccaccc 31260 tgcatgccaa cccttcccac cccactctgt ggaacaaact ctgaaacaca aaataaaata 31320 aagttcaagt gttttattga ttcaacagtt ttacaggatt cgagcagtta tttttcctcc 31380 accctcccag gacatggaat acaccaccct ctccccccgc acagccttga acatctgaat 31440 gccattggtg atggacatgc ttttggtctc cacgttccac acagtttcag agcgagccag 31500 tctcgggtcg gtcagggaga tgaaaccctc cgggcactcc cgcatctgca cctcacagct 31560 caacagctga ggattgtcct cggtggtcgg gatcacggtt atctggaaga agcagaagag 31620 cggcggtggg aatcatagtc cgcgaacggg atcggccggt ggtgtcgcat caggccccgc 31680 agcagtcgct gccgccgccg ctccgtcaag ctgctgctca gggggtccgg gtccagggac 31740 tccctcagca tgatgcccac ggccctcagc atcagtcgtc tggtgcggcg ggcgcagcag 31800 cgcatgcgga tctcgctcag gtcgctgcag tacgtgcaac acagaaccac caggttgttc 31860 aacagtccat agttcaacac gctccagccg aaactcatcg cgggaaggat gctacccacg 31920 tggccgtcgt accagatcct caggtaaatc aagtggtgcc ccctccagaa cacgctgccc 31980 acgtacatga tctccttggg catgtggcgg ttcaccacct cccggtacca catcaccctc 32040 tggttgaaca tgcagccccg gatgatcctg cggaaccaca gggccagcac cgccccgccc 32100 gccatgcagc gaagagaccc cgggtcccgg caatggcaat ggaggaccca ccgctcgtac 32160 ccgtggatca tctgggagct gaacaagtct atgttggcac agcacaggca tatgctcatg 32220 catctcttca gcactctcaa ctcctcgggg gtcaaaacca tatcccaggg cacggggaac 32280 tcttgcagga cagcgaaccc cgcagaacag ggcaatcctc gcacagaact tacattgtgc 32340 atggacaggg tatcgcaatc aggcagcacc gggtgatcct ccaccagaga agcgcgggtc 32400 tcggtctcct cacagcgtgg taagggggcc ggccgatacg ggtgatggcg ggacgcggct 32460 gatcgtgttc gcgaccgtgt catgatgcag ttgctttcgg acattttcgt acttgctgta 32520 gcagaacctg gtccgggcgc tgcacaccga tcgccggcgg cggtctcggc gcttggaacg 32580 ctcggtgttg aaattgtaaa acagccactc tctcagaccg tgcagcagat ctagggcctc 32640 aggagtgatg aagatcccat catgcctgat ggctctgatc acatcgacca ccgtggaatg 32700 ggccagaccc agccagatga tgcaattttg ttgggtttcg gtgacggcgg gggagggaag 32760 aacaggaaga accatgatta acttttaatc caaacggtct cggagtactt caaaatgaag 32820 atcgcggaga tggcacctct cgcccccgct gtgttggtgg aaaataacag ccaggtcaaa 32880 ggtgatacgg ttctcgagat gttccacggt ggcttccagc aaagcctcca cgcgcacatc 32940 cagaaacaag acaatagcga aagcgggagg gttctctaat tcctcaatca tcatgttaca 33000 ctcctgcacc atccccagat aattttcatt tttccagcct tgaatgattc gaactagttc 33060 ctgaggtaaa tccaagccag ccatgataaa gagctcgcgc agagcgccct ccaccggcat 33120 tcttaagcac accctcataa ttccaagata ttctgctcct ggttcacctg cagcagattg 33180 acaagcggaa tatcaaaatc tctgccgcga tccctgagct cctccctcag caataactgt 33240 aagtactctt tcatatcctc tccgaaattt ttagccatag gaccaccagg aataagatta 33300 gggcaagcca cagtacagat aaaccgaagt cctccccagt gagcattgcc aaatgcaaga 33360 ctgctataag catgctggct agacccggtg atatcttcca gataactgga cagaaaatcg 33420 cccaggcaat ttttaagaaa atcaacaaaa gaaaaatcct ccaggtggac gtttagagcc 33480 tcgggaacaa cgatgaagta aatgcaagcg gtgcgttcca gcatggttag ttagctgatc 33540 tgtagaaaaa acaaaaatga acattaaacc atgctagcct ggcgaacagg tgggtaaatc 33600 gttctctcca gcaccaggca ggccacgggg tctccggcgc gaccctcgta aaaattgtcg 33660 ctatgattga aaaccatcac agagagacgt tcccggtggc cggcgtgaat gattcgacaa 33720 gatgaataca cccccggaac attggcgtcc gcgagtgaaa aaaagcgccc gaggaagcaa 33780 taaggcacta caatgctcag tctcaagtcc agcaaagcga tgccatgcgg atgaagcaca 33840 aaattctcag gtgcgtacaa aatgtaatta ctcccctcct gcacaggcag caaagccccc 33900 gatccctcca ggtacacata caaagcctca gcgtccatag cttaccgagc agcagcacac 33960 aacaggcgca agagtcagag aaaggctgag ctctaacctg tccacccgct ctctgctcaa 34020 tatatagccc agatctacac tgacgtaaag gccaaagtct aaaaataccc gccaaataat 34080 cacacacgcc cagcacacgc ccagaaaccg gtgacacact caaaaaaata cgcgcacttc 34140 ctcaaacgcc caaaactgcc gtcatttccg ggttcccacg ctacgtcatc aaaacacgac 34200 tttcaaattc cgtcgaccgt taaaaacgtc acccgccccg cccctaacgg tcgcccgtct 34260 ctcagccaat cagcgccccg catccccaaa ttcaaacacc tcatttgcat attaacgcgc 34320 acaaaaagtt tgaggtatat tattgatgat ggttaattaa 34360 <210> 73 <211> 2184 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 73 atggagttcg gcctctcttg ggttttcttg gtcgctttgc ttagaggggt acaatgtcaa 60 gtccaattgg ttgagtctgg tggtggtgta gttcaaccag gacggtcact tcggctctcc 120 tgtgccgcat ccgggttcac tttcagttct tacacaatgc actgggttag acaagcccct 180 ggtaagggtt tggagtgggt aacgttcatc tcctacgacg ggaataataa gtactacgcc 240 gactcagtca aggggcgatt cacgatatcc cgagacaatt caaagaatac actctatctc 300 caaatgaatt cactccgggc tgaggacact gcaatctact actgtgcacg gacaggttgg 360 ttgggaccct tcgactactg gggtcaagga acactcgtaa cagtctcatc cgcctctaca 420 aagggtccat ctgtattccc attggcacct tcctctaaga gtacatcagg cgggacagct 480 gctcttggtt gtttggtcaa ggactacttc cctgagcctg taactgtatc ttggaattct 540 ggtgcactca cttctggagt acacactttc cccgccgtct tgcaatcatc cgggctctac 600 tcactctctt cagtagtaac ggtaccatca agtagtctcg gaactcaaac gtacatctgt 660 aatgttaatc acaagccttc taatactaag gtcgacaaga gagtcgagcc caagagttgt 720 gacaagacac acacttgtcc accttgtccc gcccctgagt tgctcggtgg accatcagtc 780 ttcttgtttc ccccaaagcc aaaggacaca ctcatgatct cccgtactcc agaggttact 840 tgtgtcgtcg tcgacgtctc ccacgaggac cctgaggtta agttcaattg gtacgtcgac 900 ggtgtcgagg tccacaatgc aaagacaaag cctagggaag agcaatacaa ttccacgtac 960 cgggtagtct ccgttctcac agttctccac caagactggt tgaatggaaa ggagtacaag 1020 tgtaaggtca gtaataaggc ccttcccgcc cctatcgaga agacaatctc caaggctaag 1080 gggcaaccta gagagcccca agtatacaca ttgcccccaa gtcgggacga gctcacaaag 1140 aatcaagttt ccttgacatg tcttgttaag gggttctacc catcagacat cgcagttgag 1200 tgggagtcca atgggcaacc tgagaataat tacaagacta caccacccgt ccttgacagt 1260 gacggttcat tcttcctcta cagtaagttg acggttgaca agagtcggtg gcaacaagga 1320 aatgtcttct cctgttcagt aatgcacgag gctctccaca atcactacac tcaaaagtcc 1380 ttgtcccttt ctcccggtaa gcggaagaga cgaggggtca gggccgaggg gcggggttct 1440 cttctcacat gtggagacgt cgaggagaat cctggtccta tggagactcc cgcccaattg 1500 ttgttcttgc tcctcttgtg gcttcccgac acaactgggg agatcgtcct cacacaatct 1560 cccgggacgc tttcactctc tccaggagag cgggccacgc tcagttgtag agcaagtcaa 1620 agtgtcgggt catcatactt ggcctggtac caacaaaagc cagggcaagc ccccagactt 1680 ttgatctacg gggccttctc ccgagccaca ggtatacccg accggttctc cggatccggt 1740 tcaggaacgg acttcacact cactatctca agattggagc ccgaggactt cgccgtatac 1800 tactgtcaac aatacggttc cagtccctgg acgttcggtc aagggacaaa ggttgagata 1860 aagcggacag tcgccgctcc gtccgtcttc atcttcccac cttccgacga gcaactcaag 1920 tctggaacag cttctgtcgt ttgtctcctc aataatttct acccccgcga ggcaaaggtt 1980 caatggaagg tagacaatgc tctccaaagt gggaatagtc aagagtctgt tacagagcaa 2040 gacagtaagg actctacata cagtttgtca tctacactta cactttctaa ggccgactac 2100 gagaagcaca aggtatacgc ctgtgaggtc actcaccaag gattgtcaag tccagtcacg 2160 aagtcattca atcgaggaga gtgt 2184 <210> 74 <211> 109 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 74 Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly 1 5 10 15 Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Gly Ser Ser 20 25 30 Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu 35 40 45 Ile Tyr Gly Ala Phe Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser 50 55 60 Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu 65 70 75 80 Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Ser Ser Pro 85 90 95 Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg 100 105 <210> 75 <211> 115 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 75 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr 20 25 30 Thr Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Thr Phe Ile Ser Tyr Asp Gly Asn Asn Lys Tyr Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Ile Tyr Tyr Cys 85 90 95 Ala Arg Thr Gly Trp Leu Gly Pro Phe Asp Tyr Trp Gly Gln Gly Thr 100 105 110 Leu Val Thr 115 <210> 76 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 76 Gln Ser Val Gly Ser Ser Tyr Leu 1 5 <210> 77 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 77 Gly Ala Phe Ser 1 <210> 78 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 78 Gln Gln Tyr Gly Ser Ser Pro Trp Thr 1 5 <210> 79 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 79 Ser Val Gly Ser Ser Tyr Leu 1 5 <210> 80 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 80 Gly Ala Phe Ser 1 <210> 81 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 81 Gln Gln Tyr Gly Ser Ser Pro Trp Thr 1 5 <210> 82 <211> 2199 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 82 atgggctggt cctgcatcat cctgtttctg gtggctacag ccacaggcgt gcactctcag 60 gtgcaactgg ttgaatctgg tggcggagtg gtgcagcctg gcagatctct gagactgtct 120 tgtgctgcca gcggcttcac cttcagcagc tatggcatgc actgggttcg acaggcccct 180 ggcaaaggac tggaatgggt tgccgtgatt tggtacgacg gcagcaacaa gtactacgcc 240 gacagcgtga agggcagatt caccatctcc agagacaaca gcaagaacac cctgtacctg 300 cagatgaaca gcctgagagc cgaggacacc gccgtgtact attgcgctag agatcctaga 360 ggcgccacac tgtactacta ctattacggc atggacgtgt ggggccaggg caccacagtt 420 acagtgtcta gcgcctctac aaagggcccc tccgtttttc ctctggctcc ttgttctaga 480 agcaccagcg agtctacagc cgctctgggc tgtctggtca aggactactt tcctgagcct 540 gtgaccgtgt cctggaattc tggtgctctg acaagcggcg tgcacacctt tccagccgtg 600 ctgcaaagca gcggcctgta ctctctgtct agcgtggtca ccgtgcctag cagcaatttc 660 ggcacccaga cctacacctg taacgtggac cacaagccta gcaacaccaa ggtggacaag 720 accgtggaac ggaagtgctg cgtggaatgc cctccttgtc ctgctcctcc agtggccgga 780 ccttccgtgt ttctgttccc tccaaagcct aaggacaccc tgatgatcag cagaacccct 840 gaagtgacct gcgtggtggt ggatgtgtct cacgaggatc ccgaggtgca gttcaattgg 900 tacgtggacg gcgtggaagt gcacaacgcc aagaccaagc ctagagagga acagttcaac 960 tccaccttca gagtggtgtc cgtgctgacc gtggtgcatc aggactggct gaacggcaaa 1020 gagtacaagt gcaaggtgtc caacaagggc ctgcctgctc ctatcgagaa aaccatcagc 1080 aagaccaaag gccagcctcg cgagcctcag gtttacacac tgcctccaag ccgggaagag 1140 atgaccaaga atcaggtgtc cctgacctgc ctggttaagg gcttctaccc cagcgacatc 1200 tccgtggaat gggagtctaa tggccagcca gagaacaact acaagaccac acctcctatg 1260 ctggactccg atggctcatt cttcctgtac agcaagctga cagtggacaa gtccagatgg 1320 cagcagggca acgtgttcag ctgttctgtg atgcacgagg ccctgcacaa ccactacacc 1380 cagaagtctc tgtctctgag ccccggcaaa cggaagagaa gaggcgttag agccgaaggc 1440 agaggctctc tgctgacatg cggagatgtg gaagagaacc ccggacctat ggacatgaga 1500 gtgcctgctc aactgctggg actgctgctt ctttggctgc ctggcgctag atgcgacatc 1560 cagatgacac agagccctag cagcctgtct gcctctgtgg gcgatagagt gaccatcacc 1620 tgtcgggcct ctcagagcat caacagctac ctggactggt atcagcaaaa gcccggcaag 1680 gcccctaagc tgctgatcta tgccgctagc tctctgcagt ctggcgtgcc aagcagattt 1740 tctggcagcg gctctggcac cgacttcacc ctgacaattt ctagcctgca gcctgaggac 1800 ttcgccacct actactgcca gcagtactac agcacccctt tcacattcgg ccctggcaca 1860 aaggtggaaa tcaagagaac agtggccgct ccgagcgtgt tcatctttcc acctagcgac 1920 gagcagctga aaagcggcac agcctctgtc gtgtgcctgc tgaacaactt ctaccctcgg 1980 gaagccaagg tgcagtggaa agtggataat gccctgcaga gcggcaacag ccaagagagc 2040 gtgacagagc aggatagcaa ggacagcacc tatagcctga gcagcacact gaccctgagc 2100 aaggccgact acgagaagca caaggtgtac gcctgcgaag tgacacacca gggactgagc 2160 agccctgtga ccaagagctt caacagaggc gagtgctga 2199 <210> 83 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 83 Ser Ile Ile Asn Phe Glu Lys Leu 1 5 <210> 84 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 84 Ser Pro Ser Tyr Ala Tyr His Gln Phe 1 5 <210> 85 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 85 Tyr Val Tyr Val Ala Asp Val Ala Ala Lys 1 5 10 <210> 86 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 86 Asn Leu Val Pro Met Val Ala Thr Val 1 5 <210> 87 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 87 Cys Leu Gly Gly Leu Leu Thr Met Val 1 5 <210> 88 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 88 Gly Ile Leu Gly Phe Val Phe Thr Leu 1 5 <210> 89 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 89 Leu Leu Phe Gly Tyr Pro Val Tyr Val 1 5 <210> 90 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 90 Gly Leu Cys Thr Leu Val Ala Met Leu 1 5 <210> 91 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 91 Trp Leu Ser Leu Leu Val Pro Phe Val 1 5 <210> 92 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 92 Phe Leu Leu Thr Arg Ile Cys Thr 1 5 <210> 93 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 93 Trp Gln Ala Gly Ile Leu Ala Arg 1 5 <210> 94 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 94 Gln Gly Gln Asn Leu Lys Tyr Gln 1 5 <210> 95 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 95 Trp Gln Ala Gly Ile Leu Ala Arg Asn Leu Val Pro Met Val Ala Thr 1 5 10 15 Val Gln Gly Gln Asn Leu Lys Tyr Gln 20 25 <210> 96 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 96 Ser Ile Asn Asn Phe Glu Lys Leu 1 5 <210> 97 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 97 gtggtgtgca gcgagaatag 20 <210> 98 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 98 cgctcgttgt agatgtcgtt ag 22 <210> 99 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 99 ttcatgcccg tgttg 15 <210> 100 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 100 gtttttgatc cagacccaga tg 22 <210> 101 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 101 gcccattatt cagagcgagt a 21 <210> 102 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 102 tcaccaggat ccac 14 <210> 103 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 103 ccttgcacat gccggag 17 <210> 104 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 104 acagagcctc gcctttg 17 <210> 105 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 105 gtgagctggc gg 12 <210> 106 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 106 ctgaaagctc ggtttgctaa tg 22 <210> 107 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 107 ccatgctgga agagacaatc t 21 <210> 108 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 108 tggcgctgac cgata 15 <210> 109 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 109 tatgcctatc ctgtctcctc tg 22 <210> 110 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 110 gctaatgcag ctaagtcctc tc 22 <210> 111 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 111 tgaccgtgcc ttctg 15 <210> 112 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 112 Ser Pro Ser Tyr Val Tyr His Gln Phe 1 5 <210> 113 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MISC_FEATURE <222> (1)..(10) <223> This sequence may encompass 2-10 residues <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 113 Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly 1 5 10 <210> 114 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MISC_FEATURE <222> (1)..(10) <223> This sequence may encompass 2-10 residues <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 114 Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 1 5 10 <210> 115 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 115 Asn Thr Asp Asn Asn Leu Ala Val Tyr 1 5 <210> 116 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 116 Glu Val Asp Pro Ile Gly His Val Tyr 1 5 <210> 117 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 117 Leu Leu Ala Ser Ser Ile Leu Cys Ala 1 5 <210> 118 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 118 Ala Ile Phe Pro Gly Ala Val Pro Ala Ala 1 5 10 <210> 119 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 119 Val Tyr Asp Leu Ser Arg Asp Ile Leu 1 5 <210> 120 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 120 Ala Ser Ser Leu Pro Thr Thr Met Asn Tyr 1 5 10 <210> 121 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 121 Pro Lys Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr 1 5 10 <210> 122 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 122 Leu Pro Leu Lys Met Leu Asn Ile Pro Ser Ile Asn Val His 1 5 10 <210> 123 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 123 Pro Glu Gln Trp Met Phe Gln Gly Ala Pro Pro Ser Gln Gly Thr 1 5 10 15 <210> 124 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 124 Glu His Pro Thr Phe Thr Ser Gln Tyr Arg Ile Gln Gly Lys Leu 1 5 10 15 <210> 125 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 125 Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe Thr 1 5 10 15 Leu Thr Val Pro Ser Glu Arg Gly Leu 20 25 <210> 126 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 126 His Phe Pro Gly Phe Gly Gln Ser Leu Leu Phe Gly Tyr Pro Val Tyr 1 5 10 15 Val Phe Gly Asp Cys Val Gln Gly Asp 20 25 <210> 127 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 127 Arg Met Gln Ala Ile Gln Asn Ala Gly Leu Cys Thr Leu Val Ala Met 1 5 10 15 Leu Glu Glu Thr Ile Phe Trp Leu Gln 20 25 <210> 128 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 128 Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu Leu Thr Met 1 5 10 15 Val Ala Gly Ala Val Trp Leu Thr Val 20 25 <210> 129 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 129 Ser Ser Ser Gly Leu Ile Asn Ser Asn Thr Asp Asn Asn Leu Ala Val 1 5 10 15 Tyr Asp Leu Ser Arg Asp Ile Leu Asn 20 25 <210> 130 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 130 Leu Val Phe Gly Ile Glu Leu Met Glu Val Asp Pro Ile Gly His Val 1 5 10 15 Tyr Ile Phe Ala Thr Cys Leu Gly Leu 20 25 <210> 131 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 131 Met Asn Phe Tyr Leu Leu Leu Ala Ser Ser Ile Leu Cys Ala Leu Ile 1 5 10 15 Val Phe Trp Lys Tyr Arg Arg Phe Gln 20 25 <210> 132 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 132 Ala Ala Ala Ala Ala Ala Ala Ala Ile Phe Pro Gly Ala Val Pro Ala 1 5 10 15 Ala Arg Pro Pro Tyr Pro Gly Ala Val 20 25 <210> 133 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 133 Ser Asn Thr Asp Asn Asn Leu Ala Val Tyr Asp Leu Ser Arg Asp Ile 1 5 10 15 Leu Asn Asn Phe Pro His Ser Ile Ala 20 25 <210> 134 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 134 Asp Pro Pro Gln Ser Pro Gln Gly Ala Ser Ser Leu Pro Thr Thr Met 1 5 10 15 Asn Tyr Pro Leu Trp Ser Gln Ser Tyr 20 25 <210> 135 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 135 Ile Thr Tyr Gly Ala Cys Pro Lys Tyr Val Lys Gln Asn Thr Leu Lys 1 5 10 15 Leu Ala Thr Gly Met Arg Asn Val Pro 20 25 <210> 136 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 136 Ser Ile Tyr Val Tyr Ala Leu Pro Leu Lys Met Leu Asn Ile Pro Ser 1 5 10 15 Ile Asn Val His His Tyr Pro Ser Ala 20 25 <210> 137 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 137 Glu Gly Pro Trp Val Pro Glu Gln Trp Met Phe Gln Gly Ala Pro Pro 1 5 10 15 Ser Gln Gly Thr Asp Val Val Gln His 20 25 <210> 138 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 138 Arg Gly Pro Gln Tyr Ser Glu His Pro Thr Phe Thr Ser Gln Tyr Arg 1 5 10 15 Ile Gln Gly Lys Leu Glu Tyr Arg His 20 25 <210> 139 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 139 Cys Thr Pro Tyr Asp Ile Asn Gln Met 1 5 <210> 140 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 140 Thr Thr Pro Glu Ser Ala Asn Leu 1 5 <210> 141 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 141 Cys Ala Pro Pro Gly Tyr Ala Leu Leu 1 5 <210> 142 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 142 Ser Gly Pro Lys Thr Asn Ile Ile Val 1 5 <210> 143 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 143 Leu Ser Pro Arg Thr Leu Asn Ala Trp 1 5 <210> 144 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 144 Thr Val Pro Trp Pro Asn Ala Ser Leu 1 5 <210> 145 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 145 Pro Asn Gly Thr His Ser Trp Glu Tyr Trp Gly Ala Gln Leu Asn 1 5 10 15 <210> 146 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 146 Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val 1 5 10 <210> 147 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 147 Thr Glu Glu Ala Lys Gln Ile Val Gln Arg His Leu Val Val Glu 1 5 10 15 <210> 148 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 148 Ala Gly Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly 1 5 10 <210> 149 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 149 Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg Ala 1 5 10 15 <210> 150 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 150 Arg Pro Lys Gln Ala Trp Cys Trp Phe 1 5 <210> 151 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 151 Arg Pro Lys Val Pro Leu Arg Thr Met 1 5 <210> 152 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 152 Gly Pro Arg Lys Pro Ile Lys Cys Trp 1 5 <210> 153 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 153 Leu Asn Met Ala Asp Lys Lys Glu Thr 1 5 <210> 154 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 154 Met Phe Gln Ala Leu Ser Glu Gly Cys Thr Pro Tyr Asp Ile Asn Gln 1 5 10 15 Met Leu Asn Val Leu Gly Asp His Gln 20 25 <210> 155 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 155 Ser Cys Ile Ser Glu Ala Asp Ala Thr Thr Pro Glu Ser Ala Asn Leu 1 5 10 15 Gly Glu Glu Ile Leu Ser Gln Leu Tyr 20 25 <210> 156 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 156 Trp Asp Ala Ile Arg Phe Arg Tyr Cys Ala Pro Pro Gly Tyr Ala Leu 1 5 10 15 Leu Arg Cys Asn Asp Thr Asn Tyr Ser 20 25 <210> 157 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 157 Ala Phe Leu Met Ala Leu Thr Asp Ser Gly Pro Lys Thr Asn Ile Ile 1 5 10 15 Val Asp Ser Gln Tyr Val Met Gly Ile 20 25 <210> 158 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 158 Gly Asn Val Trp Val His Thr Pro Leu Ser Pro Arg Thr Leu Asn Ala 1 5 10 15 Trp Val Lys Ala Val Glu Glu Lys Lys 20 25 <210> 159 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 159 Ala Phe Arg Gln Val Cys His Thr Thr Val Pro Trp Pro Asn Ala Ser 1 5 10 15 Leu Thr Pro Lys Trp Asn Asn Glu Thr 20 25 <210> 160 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 160 Val Phe Asn Phe Pro Pro Asn Gly Thr His Ser Trp Glu Tyr Trp Gly 1 5 10 15 Ala Gln Leu Asn Ala Met Lys Gly Asp 20 25 <210> 161 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 161 Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro 1 5 10 15 Leu Gly Val Ala Pro Thr Lys Ala Lys 20 25 <210> 162 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 162 Glu Lys Val Lys His Thr Glu Glu Ala Lys Gln Ile Val Gln Arg His 1 5 10 15 Leu Val Val Glu Thr Gly Thr Thr Glu 20 25 <210> 163 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 163 Asp Gln Val Glu Ser Thr Ala Gly Ser Leu Gln Gly Gln Trp Arg Gly 1 5 10 15 Ala Ala Gly Thr Ala Ala Gln Ala Ala 20 25 <210> 164 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 164 Gln Glu Leu Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln 1 5 10 15 Tyr Ser Arg Ala Asp Glu Glu Gln Gln 20 25 <210> 165 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 165 Phe His Ser Gln Pro Ile Asn Glu Arg Pro Lys Gln Ala Trp Cys Trp 1 5 10 15 Phe Gly Gly Ser Trp Lys Glu Ala Ile 20 25 <210> 166 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 166 Asp Asp Ile Asp Glu Glu Asp Asp Asp Leu Val Gly Val Ser Val Arg 1 5 10 15 Pro Lys Val Pro Leu Arg Thr Met Ser 20 25 <210> 167 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 167 Pro Phe Ala Ala Ala Gln Gln Arg Gly Pro Arg Lys Pro Ile Lys Cys 1 5 10 15 Trp Asn Cys Gly Lys Glu Gly His Ser 20 25 <210> 168 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 168 Arg Arg Leu Thr Ala Arg Gly Leu Leu Asn Met Ala Asp Lys Lys Glu 1 5 10 15 Thr Arg Thr Pro Lys Lys Ala Lys Ala 20 25 <210> 169 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 169 Glu Gly Pro Arg Asn Gln Asp Trp Leu 1 5 <210> 170 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 170 Thr Ala Pro Asp Asn Leu Gly Tyr Met 1 5 <210> 171 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 171 Ser Val Tyr Asp Phe Phe Val Trp Leu 1 5 <210> 172 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 172 Met Asn Lys Tyr Ala Tyr His Met Leu 1 5 <210> 173 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 173 Ser Ile Ile Val Phe Asn Leu Leu 1 5 <210> 174 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 174 Ala Ser Met Thr Asn Met Glu Leu Met 1 5 <210> 175 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 175 Ala Gln Leu Ala Asn Asp Val Val Leu 1 5 <210> 176 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 176 Leu Pro Tyr Leu Gly Trp Leu Val Phe 1 5 <210> 177 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 177 Gly Tyr Cys Gly Leu Arg Gly Thr Gly Val 1 5 10 <210> 178 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 178 Leu Ser Ile Phe Lys His Lys Leu 1 5 <210> 179 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 179 Leu Ile Trp Ile Pro Ala Leu Leu 1 5 <210> 180 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 180 Ser Ser Gly His Asn Glu Cys Pro Val 1 5 <210> 181 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 181 Gly Gln Lys Met Asn Ala Gln Ala Ile 1 5 <210> 182 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 182 Ile Ser Gln Ala Val His Ala Ala His Ala Glu Ile Asn Glu Ala Gly 1 5 10 15 Arg <210> 183 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 183 Met Thr Glu Gln Gln Trp Asn Phe Ala Gly Ile Glu Ala Ala Ala Ser 1 5 10 15 Ala Ile Gln <210> 184 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 184 Phe Asn Asn Phe Thr Val Ser Phe Trp Leu Arg Val Pro Lys Val Ser 1 5 10 15 Ala Ser His Leu 20 <210> 185 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 185 Asp Gly Ser Thr Asp Tyr Gly Ile Leu Gln Ile Asn Ser Arg Trp 1 5 10 15 <210> 186 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 186 Met Glu Val Gly Trp Tyr Arg Ser Pro Phe Ser Arg Val Val His Leu 1 5 10 15 Tyr Arg Asn <210> 187 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 187 Val Ser Gly Leu Glu Gln Leu Glu Ser Ile Ile Asn Phe Glu Lys Leu 1 5 10 15 Thr Glu Trp Thr Ser Ser Asn Val Met 20 25 <210> 188 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 188 Ala Leu Leu Ala Val Gly Ala Leu Glu Gly Pro Arg Asn Gln Asp Trp 1 5 10 15 Leu Gly Val Pro Arg Gln Leu Val Thr 20 25 <210> 189 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 189 Val Thr Asn Thr Glu Met Phe Val Thr Ala Pro Asp Asn Leu Gly Tyr 1 5 10 15 Met Tyr Glu Val Gln Trp Pro Gly Gln 20 25 <210> 190 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 190 Thr Gln Pro Gln Ile Ala Asn Cys Ser Val Tyr Asp Phe Phe Val Trp 1 5 10 15 Leu His Tyr Tyr Ser Val Arg Asp Thr 20 25 <210> 191 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 191 Leu Trp Pro Arg Val Thr Tyr His Ser Pro Ser Tyr Ala Tyr His Gln 1 5 10 15 Phe Glu Arg Arg Ala Lys Tyr Lys Arg 20 25 <210> 192 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 192 Leu Trp Pro Arg Val Thr Tyr His Met Asn Lys Tyr Ala Tyr His Met 1 5 10 15 Leu Glu Arg Arg Ala Lys Tyr Lys Arg 20 25 <210> 193 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 193 Gly Gln Ser Leu Val Ile Ser Ala Ser Ile Ile Val Phe Asn Leu Leu 1 5 10 15 Glu Leu Glu Gly Asp Tyr Arg Asp Asp 20 25 <210> 194 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 194 Gly Ile Pro Val His Leu Glu Leu Ala Ser Met Thr Asn Met Glu Leu 1 5 10 15 Met Ser Ser Ile Val His Gln Gln Val 20 25 <210> 195 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 195 Arg Val Leu Glu Leu Phe Arg Ala Ala Gln Leu Ala Asn Asp Val Val 1 5 10 15 Leu Gln Ile Met Glu Leu Cys Gly Ala 20 25 <210> 196 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 196 His Arg Tyr Ser Leu Glu Glu Ile Leu Pro Tyr Leu Gly Trp Leu Val 1 5 10 15 Phe Ala Val Val Thr Thr Ser Phe Leu 20 25 <210> 197 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 197 Tyr Leu Ser Lys Asn Pro Asp Gly Tyr Cys Gly Leu Arg Gly Thr Gly 1 5 10 15 Val Ser Cys Pro Met Ala Ile Lys Lys 20 25 <210> 198 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 198 Asn Glu Ile Pro Phe Thr Tyr Glu Gln Leu Ser Ile Phe Lys His Lys 1 5 10 15 Leu Asp Lys Thr Tyr Pro Gln Gly Tyr 20 25 <210> 199 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 199 Ser Arg Ala Ser Leu Leu Gly Pro Gly Phe Val Leu Ile Trp Ile Pro 1 5 10 15 Ala Leu Leu Pro Ala Leu Arg Leu Ser 20 25 <210> 200 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 200 Asn Trp His Lys Gly Trp Asn Trp Ser Ser Gly His Asn Glu Cys Pro 1 5 10 15 Val Gly Ala Ser Cys His Pro Phe Thr 20 25 <210> 201 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 201 Lys Thr Leu Leu Lys Val Ser Lys Gly Gln Lys Met Asn Ala Gln Ala 1 5 10 15 Ile Ala Leu Val Ala Cys Tyr Leu Arg 20 25 <210> 202 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 202 Glu Ser Leu Lys Ile Ser Gln Ala Val His Ala Ala His Ala Glu Ile 1 5 10 15 Asn Glu Ala Gly Arg Glu Val Val Gly 20 25 <210> 203 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 203 Met Thr Glu Gln Gln Trp Asn Phe Ala Gly Ile Glu Ala Ala Ala Ser 1 5 10 15 Ala Ile Gln Gly Asn Val Thr Ser Ile 20 25 <210> 204 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 204 Asp Met Phe Asn Asn Phe Thr Val Ser Phe Trp Leu Arg Val Pro Lys 1 5 10 15 Val Ser Ala Ser His Leu Glu Gln Tyr 20 25 <210> 205 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 205 Thr Asn Arg Asn Thr Asp Gly Ser Thr Asp Tyr Gly Ile Leu Gln Ile 1 5 10 15 Asn Ser Arg Trp Trp Cys Asn Asp Gly 20 25 <210> 206 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 206 Thr Gly Met Glu Val Gly Trp Tyr Arg Ser Pro Phe Ser Arg Val Val 1 5 10 15 His Leu Tyr Arg Asn Gly Lys Asp Gln 20 25 <210> 207 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 207 Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala 1 5 10 <210> 208 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 208 Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu 1 5 10 <210> 209 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 209 Asp Leu Met Gly Tyr Ile Pro Ala Val 1 5 <210> 210 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 210 Phe Leu Pro Ser Asp Phe Phe Pro Ser Val 1 5 10 <210> 211 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 211 Phe Leu Leu Thr Arg Ile Leu Thr Ile 1 5 <210> 212 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 212 Phe Leu Leu Ser Leu Gly Ile His Leu 1 5 <210> 213 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 213 Ile Leu Lys Glu Pro Val His Gly Val 1 5 <210> 214 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 214 Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr 1 5 10 <210> 215 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 215 Cys Ile Asn Gly Val Cys Trp Thr Val 1 5 <210> 216 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 216 Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu 1 5 10 <210> 217 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 217 Phe Leu Tyr Ala Leu Ala Leu Leu Leu 1 5 <210> 218 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 218 Ala Ala Gly Ile Gly Ile Leu Thr Val 1 5 <210> 219 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 219 Ser Leu Leu Met Trp Ile Thr Gln Val 1 5 <210> 220 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 220 Lys Leu Gly Gly Ala Leu Gln Ala Lys 1 5 <210> 221 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 221 Arg Leu Arg Ala Glu Ala Gln Val Lys 1 5 <210> 222 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 222 Glu Glu Asn Leu Leu Asp Phe Val Arg Phe 1 5 10 <210> 223 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 223 Glu Glu Tyr Leu Gln Ala Phe Thr Tyr 1 5 <210> 224 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 224 Asp Trp Glu Asn Val Ser Pro Glu Leu 1 5 <210> 225 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 225 Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu 1 5 10 15

Claims (94)

  1. 항원 카세트를 포함하는 벡터 시스템으로서,
    상기 항원 카세트는,
    (1) 다음을 포함하는 대상체 내에 존재하는 종양과 관련된 적어도 하나의 항원-인코딩 핵산 서열:
    적어도 하나의 항원-인코딩 핵산 서열, 선택적으로 MHC 부류 I 항원-인코딩 핵산 서열을 포함하는 적어도 하나의 항원-인코딩 핵산 서열, 각각은,
    a. 선택적으로 인코딩된 펩티드 서열을 야생형 핵산 서열에 의해 인코딩된 상응하는 펩티드 서열과 구별되게하는 적어도 하나의 변경을 포함하는, 에피토프 인코딩 핵산 서열,
    b. 선택적으로 5' 링커 서열, 및
    c. 선택적으로 3' 링커 서열을 포함하고;
    (2) 적어도 하나의 항원-인코딩 핵산 서열에 작동 가능하게 연결된 적어도 하나의 프로모터 서열,
    (3) 선택적으로, 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열;
    (4) 선택적으로, 적어도 하나의 GPGPG 링커 서열 (서열 번호 56);
    (5) 선택적으로, 적어도 하나의 폴리아데닐화 서열;
    을 포함하고,
    상기 벡터는 선택적으로 카세트 내에 적어도 하나의 면역 조절제를 인코딩하는 핵산 서열을 추가로 포함하고, 선택적으로 상기 적어도 하나의 면역 조절제를 인코딩하는 핵산 서열은,
    (1) 상기 적어도 하나의 면역 조절제를 인코딩하는 서열과 적어도 하나의 항원-인코딩 핵산 서열을 분리하는 내부 리보솜 진입 서열 (IRES) 서열을 갖는 적어도 하나의 항원-인코딩 핵산 서열과 동일한 전사체, 또는
    (2) 적어도 하나의 항원-인코딩 핵산 서열과 다른 전사체, 여기서 적어도 하나의 제2 프로모터 서열은 적어도 하나의 면역 조절제를 인코딩하는 서열에 작동가능하게 연결되는, 벡터 시스템.
  2. 침팬지 아데노바이러스 벡터로서,
    a. E1 (nt 577 내지 3403) 결실 및 E3 (nt 27,125-31,825) 결실을 갖는 서열 번호 1의 서열을 포함하는 변형된 ChAdV68 서열;
    b. CMV 프로모터 서열;
    c. SV40 폴리아데닐화 신호 뉴클레오티드 서열;
    d. 면역 체크포인트 억제제를 인코딩하는 핵산 서열, 및
    e. 항원 카세트로서, 상기 항원 카세트는
    (1) 대상체 내에 존재하는 종양으로부터 유래된 적어도 하나의 항원-인코딩 핵산 서열로서, 상기 적어도 하나의 항원-인코딩 핵산 서열은,
    서로 선형으로 연결된 적어도 10 개의 종양 특이적 및 대상체-특이적 MHC 부류 I 항원-인코딩 핵산 서열을 포함하되, 각각은,
    (A) 인코딩된 펩티드 서열을 야생형 핵산 서열에 의해 인코딩된 상응하는 펩티드 서열과 구별되게 하는 적어도 하나의 변형을 갖는 핵산 서열을 인코딩하는 MHC 부류 I 에피토프로서, 여기서 상기 MHC I 에피토프 인코딩 핵산 서열은 MHC 부류 I 에피토프 7-15 아미노산 길이을 인코딩하는 상기 MHC 부류 I 에피토프,
    (B) 5' 링커 서열로서, 여기서 상기 5' 링커 서열은 MHC I 에피토프의 천연 N-말단 아미노산 서열을 인코딩하고, 여기서 상기 5' 링커 서열은 길이가 3개 이상의 아미노산인 펩티드를 인코딩하는, 5' 링커 서열,
    (C) 3' 링커 서열, 여기서 상기 3' 링커 서열은 MHC I 에피토프의 천연 C-말단 산 서열을 인코딩하고, 여기서 상기 3' 링커 서열은 길이가 3개 이상의 아미노산인 펩티드를 인코딩하는, 3' 링커 서열을 포함하며,
    여기서 각각의 MHC 부류 I 항원-인코딩 핵산 서열은 길이가 25개 아미노산 인 폴리펩티드를 인코딩하고, 여기서 각각의 MHC 부류 I 항원-인코딩 핵산 서열의 각각의 3' 말단은 최종 MHC 부류 항원-인코딩 핵산 서열을 제외하고 MHC 부류 I 항원-인코딩 핵산 서열을 따르는, 적어도 하나의 항원-인코딩 핵산 서열; 및
    (2) 적어도 2개의 MHC 부류 II 항원-인코딩 핵산 서열로서,
    (A) PADRE MHC 부류 II 서열 (서열 번호: 48),
    (B) 파상풍 변독소 MHC 부류 II 서열 (서열 번호: 46),
    (C) PADRE MHC 부류 II 서열과 파상풍 변독소 MHC 부류 II 서열을 연결하는 GPGPG 아미노산 링커 서열을 인코딩하는 제1 핵산 서열,
    (D) 적어도 2개의 MHC 부류 II 항원-인코딩 핵산 서열의 5' 말단을 적어도 10개의 종양-특이적 및 개체-특이적 MHC 부류 I 신생항원-인코딩 핵산 서열에 연결되는 GPGPG 아미노산 링커 서열을 인코딩하는 제2 핵산 서열,
    (E) 선택적으로, 적어도 2개의 MHC 부류 II 항원-인코딩 핵산 서열의 3' 말단에서 GPGPG 아미노산 링커 서열을 인코딩하는 제3 핵산 서열을 포함하고,
    상기 항원 카세트는 E1 결실 내에 삽입되고 상기 CMV 프로모터 서열은 항원 카세트에 작동가능하게 연결되고, 상기 체크포인트 억제제를 인코딩하는 핵산 서열은 전사되며:
    (1) 상기 체크포인트 억제제를 인코딩하는 서열과 적어도 하나의 항원-인코딩 핵산 서열을 분리하는 내부 리보솜 진입 서열 (IRES) 서열을 갖는 적어도 하나의 항원-인코딩 핵산 서열과 동일한 전사체, 또는
    (2) 상기 적어도 하나의 항원-인코딩 핵산 서열과 다른 전사체에서, 선택적으로 제2 CMV 프로모터 서열은 적어도 하나의 면역 조절제를 인코딩하는 서열에 작동가능하게 연결되거나, 선택적으로 적어도 하나의 면역 조절제는 E3 결실 내에 삽입되는, 침팬지 아데노바이러스 벡터.
  3. 제1항에 있어서, 상기 벡터의 각 요소의 순서화된 서열은 5' 내지 3'의 하기 공식에 기술되며, 하기를 포함하는, 벡터:
    Figure pct00098

    여기서 P는 적어도 하나의 항원-인코딩 핵산 서열 중 적어도 하나에 작동가능하게 연결된 적어도 하나의 프로모터 서열을 포함하며, 여기서 a = 1이고,
    N은 상기 인코딩된 펩티드 서열을 야생형 핵산 서열에 의해 인코딩된 상응하는 펩티드 서열과 구별되는 적어도 하나의 변형을 갖는 에피토프 인코딩 핵산 서열 중 하나를 포함하며, 여기서 c = 1이고,
    L5는 상기 5’링커 서열을 포함하며, b = 0 또는 1,
    L3은 상기 3’링커 서열을 포함하며, d = 0 또는 1,
    G5는 GPGPG 아미노산 링커를 인코딩하는 상기 적어도 하나의 핵산 서열 중 하나를 포함하며, e = 0 또는 1,
    G3은 GPGPG 아미노산 링커를 인코딩하는 상기 적어도 하나의 핵산 서열 중 하나를 포함하며, g = 0 또는 1,
    U는 상기 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열 중 하나를 포함하며, f = 1,
    A는 적어도 하나의 폴리아데닐화 서열 중 하나를 포함하며, h = 0 또는 1이고,
    X = 2 내지 400, 여기서 각각의 X에 대해 상응하는 Nc는 에피토프 인코딩 핵산 서열이고, 선택적으로 각각의 X에 대해 상응하는 Nc는 별개의 MHC 부류 I 에피토프 인코딩 핵산 서열이고,
    Y = 0-2, 여기서 각각의 Y에 대해 상응하는 Uf는 항원-인코딩 핵산 서열이고, 선택적으로 각각의 Y에 대해 상응하는 Uf는 별개의 MHC 부류 II 항원-인코딩 핵산 서열이다.
  4. 제3항에 있어서, 식 중,
    b = 1, d = 1, e = 1, g = 1, h = 1, X = 10, Y = 2,
    P는 CMV 프로모터 서열이고,
    각 N은 길이가 7-15개의 아미노산인 MHC 부류 I 에피토프를 인코딩하고,
    L5는 상기 MHC I 에피토프의 천연 N-말단 아미노산 서열을 인코딩하고, 상기 5' 링커 서열은 적어도 3개의 아미노산 길이의 펩티드를 인코딩하고,
    L3은 MHC I 에피토프의 천연 C-말단 아미노산 서열을 인코딩하고, 상기 3' 링커 서열은 적어도 3개의 아미노산 길이의 펩티드를 인코딩하고,
    U는 각각 PADRE 부류 II 서열 및 파상풍 변독소 MHC 부류 II 서열이고,
    상기 벡터는 E1 (nt 577 내지 3403) 결실 및 E3 (nt 27,125-31,825) 결실을 갖는 서열번호: 1의 서열을 포함하는 변형된 ChAdV68 서열을 포함하고 상기 신생항원 카세트가 E1 결실 내에 삽입되고,
    각각의 상기 MHC 부류 I 항원-인코딩 핵산 서열은 25개 아미노산 길이의 폴리펩티드를 인코딩하는, 벡터.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 항원-인코딩 핵산 서열 중 적어도 하나는 종양 세포 표면에 MHC 부류 I에 의해 제시되는 폴리펩티드 서열 또는 그의 일부를 인코딩하는, 벡터.
  6. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 각각의 항원-인코딩 핵산 서열은 서로 직접 연결되는, 벡터.
  7. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 적어도 하나의 항원-인코딩 핵산 서열 중 적어도 하나는 링커를 인코딩하는 핵산 서열과 별개의 항원-인코딩 핵산 서열에 연결되는, 벡터.
  8. 제7항에 있어서, 상기 링커는 두개의 MHC 부류 I 서열 또는 MHC 부류 I 서열을 MHC 부류 II 서열에 연결되는, 벡터.
  9. 제8항에 있어서, 상기 링커는, (1) 길이가 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 잔기인 연속 글리신 잔기; (2) 길이가 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 잔기인 연속 알라닌 잔기; (3) 두개의 아르기닌 잔기 (RR); (4) 알라닌, 알라닌, 타이로신 (AAY); (5) 포유류의 프로테아솜에 의해 효율적으로 처리되는, 길이가 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 아미노산 잔기인 공통 서열; 및 (6) 기원의 상기 동족 단백질로부터 유래된 상기 항원에 측면에 위치하는 하나 이상의 천연 서열이고 길이가 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 2-20 아미노산 잔기로 이루어진 군으로부터 선택되는, 벡터.
  10. 제7항에 있어서, 상기 링커는 두개의 MHC 부류 II 서열 또는 MHC 부류 II 서열을 MHC 부류 I 서열에 연결되는, 벡터.
  11. 제10에 있어서, 상기 링커는 상기 서열 GPGPG를 포함하는, 벡터.
  12. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-인코딩 핵산 서열의 적어도 하나는 발현, 안정성, 세포 수송, 가공 및 제시, 및/또는 상기 적어도 하나의 항원-인코딩 핵산 서열의 면역원성을 향상시키는 별개의 또는 이접한 서열에 작동가능하게 또는 직접적으로 연결되는, 벡터.
  13. 제12항에 있어서, 상기 분리 또는 연속 서열은 유비퀴틴 서열, 프로테아솜 표적화를 증가시키기 위해 변형된 유비퀴틴 서열 (예를 들어, 상기 유비퀴틴 서열은 위치 76에서 Gly 대 Ala 치환체를 함유한다), 면역글로불린 신호 서열 (예를 들어, IgK), 주요 조직적합성 부류 I 서열, 리소좀-관련 막 단백질 (LAMP)-1, 인간 수지상 세포 리소좀-관련 막 단백질, 및 주요 조직적합성 부류 II 서열 중 적어도 하나를 포함하며, 선택적으로 프로테아솜 표적화를 증가시키도록 변형된 상기 유비퀴틴 서열은 A76인, 벡터.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 항원-인코딩 핵산 서열 중 적어도 하나는 상기 번역된, 대응하는 야생형 핵산 서열에 비해 그의 대응하는 MHC 대립유전자에 증가된 결합 친화성을 갖는 폴리펩티드 서열 또는 그의 일부를 인코딩하는, 벡터.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 항원-인코딩 핵산 서열 중 적어도 하나는 상기 번역된, 대응하는 야생형 핵산 서열에 비해 그의 대응하는 MHC 대립유전자에 증가된 결합 안정성을 갖는 폴리펩티드 서열 또는 그의 일부를 인코딩하는, 벡터.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 항원-인코딩 핵산 서열 중 적어도 하나는 상기 번역된, 상응하는 야생형 핵산 서열에 비해 그의 상응하는 MHC 대립유전자 상에 증가된 제시 가능성을 갖는 폴리펩티드 서열 또는 그의 일부를 인코딩하는, 벡터.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 적어도 하나의 변경은 점 돌연변이, 틀이동 돌연변이, 비-틀이동 돌연변이, 결손 돌연변이, 삽입 돌연변이, 접합 변이체, 게놈 재배열, 또는 프로테아솜-생성된 접합된 항원을 포함하는, 벡터.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 종양은 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 대장암, 고환암, 두경부암, 췌장암, 뇌암, B-세포 림프종, 급성 골수성 백혈병, 만성 골수성 백혈병, 만성 림프성 백혈병, T 세포 림프성 백혈병, 비-소세포 폐암, 및 소세포 폐암으로 이루어진 군으로부터 선택되는, 벡터.
  19. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 각각의 적어도 하나의 항원-인코딩 핵산 서열의 발현이 적어도 하나의 프로모터에 의해 유도되는, 벡터.
  20. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-인코딩 핵산 서열은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 핵산 서열을 포함하는, 벡터.
  21. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-인코딩 핵산 서열은 적어도 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 최대 400개의 핵산 서열을 포함하는, 벡터.
  22. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-인코딩 핵산 서열은 적어도 2-400개의 핵산 서열을 포함하고, 상기 항원-인코딩 핵산 서열 중 적어도 2개는 상기 종양 세포 표면 상에서 MHC 부류 I에 의해 제시된 폴리펩티드 서열 또는 이의 부분을 인코딩하는, 벡터.
  23. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-인코딩 핵산 서열은 적어도 2-400개의 핵산 서열을 포함하고, 여기서 대상체에게 투여되고 번역될 때, 적어도 하나의 항원은 항원 제시 세포에 제시되어 종양 세포 표면의 항원 중 적어도 하나를 표적으로하는 면역 반응을 일으키는, 벡터.
  24. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-인코딩 핵산 서열은 적어도 2-400 MHC 부류 I 및/또는 부류 II 항원-인코딩 핵산 서열을 포함하고, 상기 대상체에게 투여되고 번역될 때, MHC 부류 I 또는 부류 II 항원 중 적어도 하나는 항원 제시 세포 상에 제시되어 종양 세포 표면상의 항원 중 적어도 하나를 표적화하는 면역 반응을 일으키고, 선택적으로 각각의 적어도 2-400 개의 MHC 부류 I 또는 부류 II 항원-인코딩 핵산 서열의 발현은 적어도 하나의 프로모터에 의해 구동되는, 벡터.
  25. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 각각의 MHC 부류 I 항원-인코딩 핵산 서열은 폴리펩티드 서열 길이가 8 내지 35개의 아미노산, 선택적으로 길이가 9-17, 9-25, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개의 아미노산인 폴리펩티드서열을 인코딩하는, 벡터.
  26. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열이 존재하는, 벡터.
  27. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열이 존재하고 상기 인코딩된 펩티드 서열이 야생형 핵산 서열에 의해 인코딩된 상응하는 상기 펩티드 서열과 구별되게하는 적어도 하나의 변경을 포함하는 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열을 포함하는, 벡터.
  28. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열을 길이가 12-20, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 20-40 아미노산인, 벡터.
  29. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 MHC 부류 II 항원-인코딩 핵산 서열은 적어도 하나의 범용 MHC 부류 II 항원-인코딩 핵산 서열이 존재하고 그리고 이를 포함하며, 선택적으로 상기 적어도 하나의 범용 서열은 파상풍 변독소 및 PADRE 중 적어도 하나를 포함하는, 벡터.
  30. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 서열은 유도성인, 벡터.
  31. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 서열은 비-유도성인, 벡터.
  32. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 서열은 CMV, SV40, EF-1, RSV, PGK, HSA, MCK, 또는 EBV 프로모터 서열인, 벡터.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 항원 카세트는 적어도 하나의 항원-인코딩 핵산 서열 중 적어도 하나에 작동가능하게 연결된 적어도 하나의 폴리-아데닐화 (폴리A) 서열을 추가로 포함하고, 선택적으로 상기 폴리A 서열은 적어도 하나의 항원-인코딩 핵산 서열의 3'에 위치하는, 벡터.
  34. 제33항에 있어서, 상기 폴리A 서열은 또는 소 성장 호르몬 (BGH) SV40 폴리A 서열을 포함하는, 벡터.
  35. 제1항 내지 제34항 중 어느 한 항에 있어서, 상기 항원 카세트는 인트론 서열, 우드척 간염 바이러스 전사 후 조절 요소 (WPRE) 서열, 내부 리보솜 엔트리 서열 (IRES) 서열, 2A 자가 절단 펩티드 서열을 인코딩하는 뉴클레오티드 서열; 푸린 절단 부위를 인코딩하는 뉴클레오티드 서열, 또는 상기 적어도 하나의 항원-인코딩 핵산 서열 중 적어도 하나에 실시가능하게 연결된 mRNA의 상기 핵 이동, 안정성 또는 번역 효율을 향상시키는 것으로 알려진 5' 또는 3' 비-코딩 영역의 서열 중 적어도 하나를 추가로 포함하는, 벡터.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 상기 항원 카세트는 비제한적으로, 녹색 형광 단백질 (GFP), GFP 변이체, 분비 알칼리성 포스파타아제, 루시페라아제, 또는 루시페라아제 변이체를 포함하여, 리포터 유전자를 추가로 포함하는, 벡터.
  37. 제1항 내지 제36항 중 어느 한 항에 있어서, 상기 적어도 하나의 적어도 하나의 면역 조절제는 면역 체크포인트 분자를 억제하는, 벡터.
  38. 제37항에 있어서, 상기 면역 조절제는 항-CTLA4 항체 또는 이의 항원-결합 단편, 항-PD-1 항체 또는 이의 항원-결합 단편, 항-PD-L1 항체 또는 이의 항원-결합 단편, 항-4-1BB 항체 또는 이의 항원-결합 단편, 또는 항-OX-40 항체 또는 이의 항원-결합 단편인, 벡터.
  39. 제38항에 있어서, 상기 항체 또는 이의 항원-결합 단편은 Fab 단편, Fab' 단편, 단일 사슬 Fv (scFv), 단일 특이성 또는 서로 연결된 다중 특이성으로서 단일 도메인 항체 (sdAb) (예를 들어, 낙타과 항체 도메인), 또는 전장 단일-사슬 항체 (예를 들어, 유연한 링커로 연결된 중쇄 및 경쇄 보유 전장 IgG)인, 벡터.
  40. 제38항 또는 제39항에 있어서, 상기 항체의 중쇄 및 경쇄 서열은 2A와 같은자가-절단 서열에 의해 분리된 인접 서열이고, 선택적으로 상기 자가-절단 서열 또는 IRES 서열의 푸린 절단 부위 서열 5'를 갖거나; 또는 항체의 중쇄 및 경쇄 서열은 연속 글리신 잔기와 같은 유연한 링커에 의해 연결되는, 벡터.
  41. 제37항에 있어서, 상기 면역 조절제는 사이토카인인, 벡터.
  42. 제41항에 있어서, 상기 사이토카인은 IL-2, IL-7, IL-12, IL-15, 또는 IL-21 중 적어도 하나 또는 각각의 이의 변이체인, 벡터.
  43. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 벡터가 침팬지 아데노바이러스 벡터이고, 선택적으로 상기 침팬지 아데노바이러스 벡터가 ChAdV68 벡터 또는 srRNA 벡터이고, 선택적으로 상기 srRNA 벡터가 베네수엘라 마뇌염 바이러스 srRNA 벡터인, 벡터.
  44. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 벡터는 서열 번호 1에 제시된 서열을 포함하는, 벡터.
  45. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 벡터는 서열 번호: 1에 제시된 서열의 침팬지 아데노바이러스 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자로 구성된 군으로부터 선택된 적어도 하나의 유전자에서 서열이 완전히 결실되거나 기능적으로 결실된 것을 제외하고는, 서열번호: 1에 제시된 서열의 유전자을 포함하고, 선택적으로 상기 서열이 서열 번호: 1에 제시된 서열의 (1) E1A 및 E1B; (2) E1A, E1B 및 E3; 또는 (3) E1A, E1B, E3 및 E4에서 완전히 결실되거나 기능적으로 결실되는, 벡터.
  46. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 벡터가 서열 번호 1의 서열로부터 수득된 유전자 또는 조절 서열을 포함하고, 선택적으로 상기 유전자가 서열 번호 1에 제시된 서열의 침팬지 아데노바이러스 역 말단 반복 (ITR), E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4, 및 L5 유전자로 구성된 군으로부터 선택되는, 벡터.
  47. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 항원 카세트가 E1 영역, E3 영역, 및/또는 항원 카세트의 통합을 허용하는 임의의 결실 된 AdV 영역에서 벡터에 삽입되는, 벡터.
  48. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 벡터는 제1 세대, 제2 세대, 또는 헬퍼-의존성 아데노바이러스 벡터 중 하나로부터 생성되는, 벡터.
  49. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 벡터는 염기쌍 번호 577과 3403 사이 또는 염기쌍 456과 3014 사이에 하나 이상의 결실을 포함하고, 선택적으로 상기 벡터는 서열번호: 1에 제시된 서열의 염기쌍 27,125와 31,825 사이 또는 염기쌍 27,816과 31,333 사이의 하나 이상의 결실을 포함하는, 벡터.
  50. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 벡터는 서열번호: 1에 지시된 서열의 염기쌍 번호 3957 및 10346, 염기쌍 번호 21787 및 23370, 및 염기쌍 번호 33486 및 36193 사이의 하나 이상의 결실을 추가로 포함하는, 벡터.
  51. 제2항 또는 제4항을 제외한 상기 청구항 중 어느 한 항에 있어서, 상기 하나 이상의 항원-인코딩 핵산 서열이 하기 단계를 수행함으로써 선택되는, 벡터:
    상기 종양으로부터 엑솜, 전사체, 또는 전체 게놈 종양 뉴클레오티드 염기서열 분석 데이터의 적어도 하나를 얻는 단계로서, 상기 종양 뉴클레오티드 염기서열 분석 데이터는 항원의 각각의 세트의 펩티드 서열을 나타내는 데이터를 얻는데 사용되는, 상기 얻는 단계;
    각각의 항원의 상기 펩티드 서열을 제시 모델에 입력하여, 상기 항원의 각각이 상기 종양의 상기 종양 세포 표면 상에 상기 MHC 대립유전자 중 하나 이상에 의해 제시되는, 수치적 가능성 세트를 생성하는 단계로서, 상기 수치적 가능성 세트는 적어도 수신된 질량 분석 데이터를 기초로 하여 동정되는, 상기 생성하는 단계; 및
    상기 적어도 하나의 항원-인코딩 핵산 서열을 생성하는데 사용되는 선택된 항원의 세트를 생성하기 위해 상기 수치적 가능성 세트를 기초로 상기 항원의 세트의 서브셋을 선택하는 단계.
  52. 제2항에 있어서, 상기 MHC 부류 I 에피토프 인코딩 핵산 서열 각각은 하기 단계를 수행함으로써 선택되는, 벡터:
    상기 종양으로부터 엑솜, 전사체, 또는 전체 게놈 종양 뉴클레오티드 염기서열 분석 데이터의 적어도 하나를 얻는 단계로서, 상기 종양 뉴클레오티드 염기서열 분석 데이터는 항원의 각각의 세트의 펩티드 서열을 나타내는 데이터를 얻는데 사용되는, 상기 얻는 단계;
    각각의 항원의 상기 펩티드 서열을 제시 모델에 입력하여, 상기 항원의 각각이 상기 종양의 상기 종양 세포 표면 상에 상기 MHC 대립유전자 중 하나 이상에 의해 제시되는, 수치적 가능성 세트를 생성하는 단계로서, 상기 수치적 가능성 세트는 적어도 수신된 질량 분석 데이터를 기초로 하여 동정되는, 상기 생성하는 단계; 및
    상기 적어도 2개의 MHC 부류 I 항원-인코딩 핵산 서열을 생성하는데 사용되는 선택된 항원의 세트를 생성하기 위해 상기 수치적 가능성 세트를 기초로 상기 항원의 세트의 서브셋을 선택하는 단계.
  53. 제51항에 있어서, 선택된 항원의 상기 세트의 수는 2-20인, 벡터.
  54. 제51항 또는 제52항에 있어서, 상기 제시 모델은 하기 사이에 의존성을 나타내는, 벡터:
    특정한 하나의 MHC 대립유전자 쌍 및 펩티드 서열의 특정한 위치에서의 특정한 아미노산의 존재; 및
    특정한 하나의 MHC 대립유전자 쌍에 의한, 상기 특정한 위치에 상기 특정한 아미노산을 포함하는 이러한 펩티드 서열의 상기 종양 세포 표면상의 제시 가능성.
  55. 제51항 또는 제52항에 있어서, 상기 선택된 항원의 세트를 선택하는 단계는상기 제시 모델을 기초하여 선택되지 않는 항원에 비해 상기 종양 세포 표면 상에 제시될 가능성이 증가된 항원을 선택하는 것을 포함하는, 벡터.
  56. 제51항 또는 제52항에 있어서, 상기 선택된 항원의 세트를 선택하는 단계는 상기 제시 모델을 기초하여 선택되지 않는 항원에 비해 상기 대상체에서 종양-특이적 면역 반응을 유도할 수 있는 가능성이 증가된 항원을 선택하는 단계를 포함하는, 벡터.
  57. 제51항 또는 제52항에 있어서, 상기 선택된 항원의 세트를 선택하는 단계는 상기 제시 모델을 기초하여 선택되지 않는 항원에 비해 전문 항원 제시 세포 (APC)에 의해 미접촉 T 세포에 제시될 수 있는 증가된 가능성을 갖는 항원을 선택하는 단계를 포함하며, 상기 APC는 수지상 세포 (DC)인, 벡터.
  58. 제51항 또는 제52항에 있어서, 상기 선택된 항원의 세트를 선택하는 단계는 상기 제시 모델을 기초하여 선택되지 않는 항원에 비해 중심 또는 말초 내성을 통해 대상체에 억제될 가능성이 감소된 항원을 선택하는 단계를 포함하는, 벡터.
  59. 제51항 또는 제52항에 있어서, 상기 선택된 항원의 세트를 선택하는 단계는 상기 제시 모델을 기초하여 선택되지 않는 항원에 비해 상기 대상체에서 정상 조직에 대한 자가면역 반응을 유도할 수 있는 가능성이 감소된 항원을 선택하는 단계를 포함하는, 벡터.
  60. 제51항 또는 제52항에 있어서, 엑솜 또는 전사체 뉴클레오티드 염기서열 분석 데이터는 상기 종양 조직 상에 염기서열 분석을 수행함으로써 얻어지는, 벡터.
  61. 제51항 또는 제52항에 있어서, 상기 염기서열 분석은 차세대 염기서열 분석 (NGS) 또는 임의의 대규모 병렬 염기서열 분석 접근법인, 벡터.
  62. 제1항 내지 제61항 중 어느 한 항에 있어서, 상기 항원 카세트는 상기 항원 카세트의 인접한 서열에 의해 형성된 접합 에피토프 서열을 포함하는, 벡터.
  63. 제62항에 있어서, 적어도 하나의 또는 각각의 접합 에피토프 서열은 MHC에 대해 500 nM 초과의 친화성을 갖는, 벡터.
  64. 제62항 또는 제63항에 있어서, 각 접합 에피토프 서열은 비-자체인, 벡터.
  65. 제1항 내지 제64항 중 어느 한 항에 있어서, 상기 항원 카세트는 번역된, 야생형 핵산 서열을 포함하는 비-치료 MHC 부류 I 또는 부류 II 에피토프 핵산 서열을 인코딩하지 않으며, 상기 비-치료 에피토프는 상기 대상체의 MHC 대립유전자에 표시될 것으로 예측되는, 벡터.
  66. 제65항에 있어서, 상기 비-치료 예측 MHC 부류 I 또는 부류 II 에피토프 서열은 상기 항원 카세트 내의 인접한 서열에 의해 형성된 접합 에피토프 서열인, 벡터.
  67. 제62항 또는 제66항에 있어서, 상기 예측은 상기 비-치료 에피토프의 서열을 제시 모델에 입력함으로써 생성되는 제시 가능성에 기초한, 벡터.
  68. 제62항 내지 제67항 중 어느 한 항에 있어서, 상기 항원 카세트 내의 상기 적어도 하나의 항원-인코딩 핵산 서열의 순서는 하기 단계에 의해 결정되는, 벡터:
    1. 상기 적어도 하나의 항원-인코딩 핵산 서열의 상이한 순서에 상응하는 후보 항원 카세트 서열의 세트를 생성하는 단계;
    2. 상기 후보 항원 카세트 서열에서 비-치료 에피토프의 제시를 기초한 제시 스코어를 각각의 후보 항원 카세트 서열에 대해 결정하는 단계; 및
    3. 항원 백신에 대한 상기 항원 카세트 서열로서 미리 결정된 임계값 미만의 제시 스코어와 관련된 후보 카세트 서열을 선택하는 단계.
  69. 제1항 내지 제68항 중 어느 한 항의 벡터 및 약제학적으로 허용가능한 담체를 포함하는, 약제학적 조성물.
  70. 제69항에 있어서, 상기 조성물은 아쥬반트를 추가로 포함하는, 약제학적 조성물.
  71. 제69항 또는 제70항에 있어서, 상기 조성물은 면역 조절제를 추가로 포함하는, 약제학적 조성물.
  72. 제71항에 있어서, 상기 면역 조절제는 항-CTLA4 항체 또는 이의 항원-결합 단편, 항-PD-1 항체 또는 이의 항원-결합 단편, 항-PD-L1 항체 또는 이의 항원-결합 단편, 항-4-1BB 항체 또는 이의 항원-결합 단편, 또는 항-OX-40 항체 또는 이의 항원-결합 단편인, 약제학적 조성물.
  73. 제1항 내지 제72항 중 어느 한 항의 항원 카세트 및 서열 번호: 1의 서열로부터 수득된 유전자를 포함하는 단리된 뉴클레오티드 서열로서, 선택적으로 상기 유전자는 서열 번호 1에 제시된 서열의 침팬지 아데노바이러스 ITR, E1A, E1B, E2A E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자로 이루어진 군으로부터 선택되고, 선택적으로 상기 뉴클레오티드 서열은 cDNA인, 단리된 뉴클레오티드 서열.
  74. 선택적으로 상기 세포는 CHO, HEK293 또는 이의 변이체, 911, 헬라(HeLa), A549, LP-293, PER.C6, 또는 AE1-2a 세포인, 제73항의 뉴클레오티드 서열을 포함하는 단리된 세포.
  75. 제73항의 뉴클레오티드 서열을 포함하는, 벡터.
  76. 상기 벡터 청구항 중 어느 한 항의 벡터를 포함하는 키트 및 이를 사용하기 위한 지침.
  77. 암에 걸린 대상체를 치료하기 위한 방법으로서, 상기 벡터 청구항 중 어느 한 항의 벡터 및 제69항 내지 제70항 중 어느 한 항의 약제학적 조성물을 상기 대상체에 투여하는 단계를 포함하는, 방법.
  78. 제77항에 있어서, 상기 벡터 및 조성물은 근육내 (IM), 피내 (ID), 피하 (SC) 투여되는, 방법.
  79. 제77항 또는 제78항에 있어서, 상기 대상체에 면역 조절제를 투여하는 단계를 추가로 포함하고, 선택적으로 상기 면역 조절제는 상기 벡터 또는 약제학적 조성물의 투여 전, 동시에 또는 후에 투여되는, 방법.
  80. 제79항에 있어서, 상기 면역 조절제는 항-CTLA4 항체 또는 이의 항원-결합 단편, 항-PD-1 항체 또는 이의 항원-결합 단편, 항-PD-L1 항체 또는 이의 항원-결합 단편, 항-4-1BB 항체 또는 이의 항원-결합 단편, 또는 항-OX-40 항체 또는 이의 항원-결합 단편인, 방법.
  81. 제79항에 있어서, 상기 면역 조절제는 정맥내 (IV), 근육내 (IM), 피내 (ID), 또는 피하 (SC)로 투여되는, 방법.
  82. 제81항에 있어서, 상기 피하 투여는 벡터 또는 조성물 투여 부위 근처에 있거나 또는 하나 이상의 벡터 또는 조성물 배출 림프절에 매우 근접한, 방법.
  83. 제77항 내지 제82항 중 어느 한 항에 있어서, 제2 백신 조성물을 상기 대상체에 투여하는 단계를 추가로 포함하는, 방법.
  84. 제83항에 있어서, 상기 제2 백신 조성물은 제77항 내지 제82항 중 어느 한 항의 벡터 또는 약제학적 조성물의 투여 이전에 투여하는, 방법.
  85. 제83항에 있어서, 상기 제2 백신 조성물은 제77항 내지 제82항 중 어느 한 항의 조성물 또는 약제학적 조성물의 투여 이후에 투여하는, 방법.
  86. 제84항 또는 제85항에 있어서, 상기 제2 백신 조성물이 제77항 내지 제82항 중 어느 한 항의 조성물 또는 약제학적 조성물과 동일한, 방법.
  87. 제84항 또는 제85항에 있어서, 제2 백신 조성물이 제77항 내지 제82항 중 어느 한 항의 벡터 또는 약제학적 조성물과 상이한, 방법.
  88. 제87항에 있어서, 상기 제2 백신 조성물이 침팬지 아데노바이러스 벡터를 포함하고, 선택적으로 상기 침팬지 아데노바이러스 벡터가 ChAdV68 벡터 또는 srRNA 벡터이고, 선택적으로 상기 srRNA 벡터가 베네수엘라 마뇌염 바이러스 벡터이고,
    선택적으로 상기 침팬지 아데노바이러스 벡터 또는 srRNA 벡터는 적어도 하나의 면역 조절제를 인코딩하는 핵산 서열을 포함하는, 방법.
  89. 제88항에 있어서, 상기 침팬지 아데노 바이러스 벡터 또는 srRNA 벡터에 의해 인코딩된 적어도 하나의 항원-인코딩 핵산 서열이 상기 벡터 청구항 중 어느 한 항의 적어도 하나의 항원-인코딩 핵산 서열과 동일하고, 선택적으로 상기 침팬지 아데노바이러스 벡터 또는 srRNA 벡터에 의해 인코딩된 적어도 하나의 면역 조절제를 인코딩하는 핵산 서열은 상기 청구항 중 어느 한 항의 적어도 하나의 면역 조절제와 동일한, 방법.
  90. 상기 벡터 청구항 중 어느 한 항의 벡터를 제조하는 방법으로서, 상기 방법은,
    적어도 하나의 프로모터 서열 및 항원 카세트를 포함하는 플라스미드 서열을 수득하는 단계;
    상기 플라스미드 서열을 하나 이상의 숙주 세포로 형질 감염시키는 단계; 및
    상기 하나 이상의 숙주 세포에서 벡터를 단리하는 단계를 포함하는, 방법.
  91. 청구항의 제조 방법에 있어서, 상기 단리하는 단계는
    상기 하나 이상의 숙주 세포를 용해하여 벡터를 포함하는 세포 용해물을 수득하는 단계; 및
    상기 세포 용해물 및 선택적으로 또한 하나 이상의 숙주 세포를 배양하는 데 사용되는 배지로부터 벡터를 정제하는 단계를 포함하는, 방법.
  92. 제90항 또는 제91항에 있어서, 상기 플라스미드 서열이 DNA 재조합 또는 박테리아 재조합 또는 전체 게놈 DNA 합성 또는 박테리아 세포에서 합성된 DNA의 증폭을 통한 전체 게놈 DNA 합성 중 하나를 사용하여 생성되는 제조 방법.
  93. 제90항 내지 제92항 중 어느 한 항에 있어서, 상기 하나 이상의 숙주 세포가 CHO, HEK293 또는 이의 변이체, 911, HeLa, A549, LP-293, PER.C6 및 AE1-2a 세포 중 하나 이상인 제조 방법.
  94. 제91항 내지 제93항 중 어느 한 항에 있어서, 상기 세포 용해물로부터 벡터를 정제하는 단계가 크로마토그래피 분리, 원심분리, 바이러스 침전, 및 여과 중 하나 이상을 포함하는, 제조 방법.
KR1020207036367A 2018-05-23 2019-05-23 면역 체크포인트 억제제 공동-발현 벡터 KR20210013589A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862675624P 2018-05-23 2018-05-23
US62/675,624 2018-05-23
PCT/US2019/033828 WO2019226939A1 (en) 2018-05-23 2019-05-23 Immune checkpoint inhibitor co-expression vectors

Publications (1)

Publication Number Publication Date
KR20210013589A true KR20210013589A (ko) 2021-02-04

Family

ID=68617211

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207036367A KR20210013589A (ko) 2018-05-23 2019-05-23 면역 체크포인트 억제제 공동-발현 벡터

Country Status (9)

Country Link
US (1) US20210213122A1 (ko)
EP (1) EP3796930A4 (ko)
JP (1) JP2021524247A (ko)
KR (1) KR20210013589A (ko)
CN (1) CN112351793A (ko)
AU (1) AU2019275070A1 (ko)
CA (1) CA3099642A1 (ko)
TW (1) TW202000906A (ko)
WO (1) WO2019226939A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020518648A (ja) 2017-05-08 2020-06-25 グリットストーン オンコロジー インコーポレイテッド アルファウイルス新生抗原ベクター
CA3119752A1 (en) * 2018-11-07 2020-05-14 Gritstone Oncology, Inc. Alphavirus neoantigen vectors and interferon inhibitors
TW202043256A (zh) 2019-01-10 2020-12-01 美商健生生物科技公司 前列腺新抗原及其用途
CA3140019A1 (en) 2019-05-30 2020-12-03 Gritstone Bio, Inc. Modified adenoviruses
WO2021099906A1 (en) 2019-11-18 2021-05-27 Janssen Biotech, Inc. Vaccines based on mutant calr and jak2 and their uses
WO2022032196A2 (en) 2020-08-06 2022-02-10 Gritstone Bio, Inc. Multiepitope vaccine cassettes
WO2022229966A1 (en) 2021-04-29 2022-11-03 Yeda Research And Development Co. Ltd. T cell receptors directed against ras-derived recurrent neoantigens and methods of identifying same

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0803573A1 (en) * 1996-04-25 1997-10-29 Gesellschaft für Biotechnologische Forschung mbH (GBF) Polycistronic expression construct with cytokines for multivalent vaccines
EP1363660A4 (en) * 2001-02-01 2006-06-21 Univ Johns Hopkins HIGHER MOLECULAR VACCINE BASED ON AUTOMPLICATIVE RNA, SUICIDE DNA OR UNDNA DNA VECTOR, WHICH LINKS ANTIGEN WITH A POLYPEPTIDE WHICH PROMOTES THE PRESENTATION OF THE ANTIGEN
EP1434859A2 (en) * 2001-07-25 2004-07-07 New York University Use of glycosylceramides as adjuvants for vaccines against infections and cancer
KR20050083719A (ko) * 2002-10-03 2005-08-26 에피뮨 인코포레이티드 최적화된 멀티-에피토프 구성체 및 이의 용도
US9402888B2 (en) * 2013-03-14 2016-08-02 The Wistar Institute Of Anatomy And Biology Methods and compositions for treating cancer
KR20160101073A (ko) * 2013-12-20 2016-08-24 더 브로드 인스티튜트, 인코퍼레이티드 신생항원 백신과의 병용 요법
US10561722B2 (en) * 2014-09-03 2020-02-18 Bavarian Nordic A/S Methods and compositions for enhancing immune responses
MX2018004544A (es) * 2015-10-12 2018-11-09 Nantomics Llc Composiciones y métodos para los neoepítopos de cáncer viral.
WO2017151940A2 (en) * 2016-03-03 2017-09-08 Cue Biopharma, Inc. T-cell modulatory multimeric polypeptides and methods of use thereof
CA3015530A1 (en) * 2016-03-04 2017-09-08 New York University Virus vectors expressing multiple epitopes of tumor associated antigens for inducing antitumor immunity
CA3022267A1 (en) * 2016-05-04 2017-11-09 Fred Hutchinson Cancer Research Center Cell-based neoantigen vaccines and uses thereof
EP3544607A4 (en) * 2016-11-23 2020-10-14 Gritstone Oncology, Inc. VIRAL ADMINISTRATION OF NEO-ANTIGENS
US20200377598A1 (en) * 2017-03-03 2020-12-03 New York University Induction and Enhancement of Antitumor Immunity Involving Virus Vectors Expressing Multiple Epitopes of Tumor Associated Antigens and Immune Checkpoint Inhibitors or Proteins

Also Published As

Publication number Publication date
CN112351793A (zh) 2021-02-09
JP2021524247A (ja) 2021-09-13
CA3099642A1 (en) 2019-11-28
US20210213122A1 (en) 2021-07-15
WO2019226939A1 (en) 2019-11-28
EP3796930A4 (en) 2022-05-04
WO2019226939A8 (en) 2020-11-19
AU2019275070A1 (en) 2021-01-14
TW202000906A (zh) 2020-01-01
EP3796930A1 (en) 2021-03-31

Similar Documents

Publication Publication Date Title
JP2023123766A (ja) アルファウイルス新生抗原ベクター
KR20210013105A (ko) 공유 항원
KR20190098147A (ko) 신생항원의 바이러스성 전달
JP2024073576A (ja) 改変アデノウイルス
KR20210013589A (ko) 면역 체크포인트 억제제 공동-발현 벡터
CN109312309B (zh) 工程化的病毒
KR20210090650A (ko) 알파바이러스 신생항원 벡터 및 인터페론 억제제
BE1023916B1 (fr) Nouvel adenovirus
AU2013295647B2 (en) Multimeric fusion protein vaccine and immunotherapeutic
AU2018203259A1 (en) Recombinant HCMV and RhCMV vectors and uses thereof
DK2753355T3 (en) ONCOLYTIC HERP SIMPLEX VIRUSES AND THERAPEUTIC APPLICATIONS THEREOF
KR20220098379A (ko) 공유 네오항원을 표적으로 하는 항원-결합 단백질
KR101668163B1 (ko) Cmv용 백신으로서의 조건부 복제 시토메갈로바이러스
KR20220041844A (ko) Hiv 항원 및 mhc 복합체
SA516371030B1 (ar) نواقل لإظهار مولدات مضاد مصاحبة للبروستاتا
KR20180012857A (ko) 아데노바이러스 폴리뉴클레오티드 및 폴리펩티드
EP3256140B1 (en) Compositions for ebola virus vaccination
KR20230015914A (ko) 캡핑 화합물, 조성물 및 이의 사용 방법
KR20230014694A (ko) 항원-코딩 카세트
KR20230046313A (ko) 다중에피토프 백신 카세트
KR20200066349A (ko) 복제 가능 아데노바이러스 벡터
WO2021092095A1 (en) Neoantigen vaccine therapy
KR20230006825A (ko) 전염성 질병 항원 및 백신
JPH10512242A (ja) 組み合わせ遺伝子送達ビヒクル
CN111065408A (zh) 免疫原性组合物