KR20240047977A - 탈최적화된 sars-cov-2 변이체 및 그의 방법 및 용도 - Google Patents

탈최적화된 sars-cov-2 변이체 및 그의 방법 및 용도 Download PDF

Info

Publication number
KR20240047977A
KR20240047977A KR1020247004613A KR20247004613A KR20240047977A KR 20240047977 A KR20240047977 A KR 20240047977A KR 1020247004613 A KR1020247004613 A KR 1020247004613A KR 20247004613 A KR20247004613 A KR 20247004613A KR 20240047977 A KR20240047977 A KR 20240047977A
Authority
KR
South Korea
Prior art keywords
various embodiments
seq
cov
sars
variant
Prior art date
Application number
KR1020247004613A
Other languages
English (en)
Inventor
스테펜 뮐러
존 로버트 콜맨
잉 왕
첸 양
유통 송
Original Assignee
코다제닉스 인코포레이티드
세럼 인스티튜트 오브 인디아 프라이비트 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코다제닉스 인코포레이티드, 세럼 인스티튜트 오브 인디아 프라이비트 리미티드 filed Critical 코다제닉스 인코포레이티드
Publication of KR20240047977A publication Critical patent/KR20240047977A/ko

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/215Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0043Nose
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5254Virus avirulent or attenuated
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/54Medicinal preparations containing antigens or antibodies characterised by the route of administration
    • A61K2039/541Mucosal route
    • A61K2039/543Mucosal route intranasal
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/545Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20021Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Communicable Diseases (AREA)
  • Epidemiology (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Mycology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pulmonology (AREA)
  • Otolaryngology (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

변형된 SARS-CoV-2 변이체가 본원에 기술된다. 이들 바이러스는 재코딩되었고, 예를 들어, 코돈-탈최적화 또는 코돈-쌍 편향(codon pair bias) 탈최적화되었고, SARS-CoV-2 변이체 감염의 가능성이나 중증도를 감소시키거나, SARS-CoV-2 변이체 감염을 예방하거나, 면역 반응을 유도하거나, 또는 SARS-CoV-2 변이체 감염을 치료하는데 유용하다.

Description

탈최적화된 SARS-COV-2 변이체 및 그의 방법 및 용도
관련 출원에 대한 상호 참조
본 출원은 그 전체가 참조에 의해 본원에 포함된, 2021년 7월 7일에 출원된 미국 임시 특허출원 63/219,263에 대한 우선권을 포함한다.
서열 목록에 대한 참조
본 출원은 2022년 6월 30일에 생성되고 바이트 단위 크기가 277,718바이트인 "SequenceListing_064955_000051WO00_ST25"라는 명칭의 전자 텍스트 파일로 제출된 서열 목록을 포함한다. 이 전자 파일에 포함된 정보는 그 전체가 참조에 의해 본원에 포함된다.
발명의 분야
본 발명은 변형된 SARS-CoV-2 코로나바이러스 변이체, 면역 반응을 유도하기 위한 조성물 및 보호 면역, 예방 및 치료를 제공하기 위한 백신에 관한 것이다.
본원의 모든 간행물은 각각의 개별 간행물 또는 특허 출원이 구체적이고 개별적으로 참조에 의해 포함되는 것으로 표시된 것과 동일한 정도로 참조로 포함된다. 하기 설명은 본 발명을 이해하는 데 유용할 수 있는 정보를 포함한다. 이는 본원에 제공된 임의의 정보가 현재 청구된 발명에 대해 선행 기술이거나 관련이 있거나, 구체적으로 또는 묵시적으로 참조된 임의의 간행물이 선행 기술이라는 것을 인정하는 것은 아니다.
2019년 12월 중순 중국 중부 우한시에서 새로운 코로나바이러스의 발생이 확인되었다. 현재 SARS-CoV-2로 지정된, 코로나바이러스의 신규한 균주가 확인되었다. 치명적인 코로나바이러스는 WHO에 의해 팬데믹(세계적 대유행)으로 선언되었다. 이 바이러스로 인한 공중 보건 위기는 2020년 1월 말 기준 수십 명의 목숨을 앗아가고 천 명 이상을 감염시키는 수준에서 2021년 7월 초 기준 400만 명 이상의 목숨을 앗아가고, 1억 8,500만 명 이상을 감염시켰고, 2022년 6월 현재 630만 명 이상의 목숨을 앗아가는 수준까지 빠르게 확대되었다.
발생 이후, SARS-CoV-2 변이체의 출현은 특히 심각했고, 모든 사람에게 면역력을 제공하려는 백신 노력을 방해했다. 따라서, SARS-CoV-2 변이체에 효과적인 예방 및 치료 처치가 여전히 매우 시급하게 요구된다.
발명의 요약
하기 구체예 및 그의 양태는 예시적이고 설명적인 것으로 의도되는 조성물 및 방법과 함께 기술되고, 예시되며, 범위를 한정하지 않다.
본 발명의 다양한 구체예는 모 SARS-CoV-2 변이체(parent SARS-CoV-2 variant)의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편을 코딩하는 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드로서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩된 것이고(recoded), 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편의 아미노산 서열은 동일하게 유지되거나, 또는 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편의 아미노산 서열은 최대 20개의 아미노산 치환, 첨가 또는 결실을 포함하고, 상기 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편은 스파이크 단백질 또는 그의 단편을 포함하는 것인 폴리뉴클레오티드를 제공한다.
다양한 구체예에서, 상기 모 SARS-CoV-2 변이체는 서열번호 1을 포함하거나, 또는 상기 모 SARS-CoV-2 변이체는 서열번호 1을 포함할 수 있거나, 상기 모 SARS-CoV-2 변이체는 nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1을 포함할 수 있거나, 또는 상기 모 SARS-CoV-2 변이체는 서열번호 1에 하나 이상의 돌연변이가 있는 것인 서열번호 1을 포함할 수 있고; 및 서열번호 1, 또는 nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 하나 이상의 돌연변이가 있는 서열번호 1의 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다.
다양한 구체예에서, 상기 SARS-CoV-2 변이체는 UK 변이체, 남아프리카 변이체, 브라질 변이체, 델타(Delta) 변이체, 및 오미크론(Omicron) 변이체로 구성된 군으로부터 선택될 수 있다.
다양한 구체예에서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈-쌍 편향(CPB)을 감소시키거나 코돈 사용빈도 편향(codon usage bias)을 감소시키는 것에 의해 재코딩될 수 있다. 다양한 구체예에서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 CpG 또는 UpA 디뉴클레오티드의 수를 증가시키는 것에 의해 재코딩될 수 있다. 다양한 구체예에서, 각각의 재코딩된 하나 이상의 바이러스 단백질 또는 각각의 재코딩된 그의 하나 이상의 단편은 -0.05 미만, -0.1 미만, -0.2 미만, -0.3 미만, 또는 -0.4 미만의 코돈-쌍 편향을 가질 수 있다. 다양한 구체예에서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드에 비해 CPB 탈최적화될(deoptimized) 수 있다. 다양한 구체예에서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드에 비해 코돈-탈최적화될 수 있다. 다양한 구체예에서, 상기 코돈-탈최적화 또는 CPB 탈최적화는 인간에서 빈번하게 사용되는 코돈 또는 CPB에 근거한 것일 수 있다. 다양한 구체예에서, 상기 코돈-탈최적화 또는 CPB 탈최적화는 코로나바이러스에서 빈번하게 사용되는 코돈 또는 CPB에 근거한 것일 수 있다. 다양한 구체예에서, 상기 코돈-탈최적화 또는 CPB 탈최적화는 야생형 SARS-CoV-2 코로나바이러스에서 빈번하게 사용되는 코돈 또는 CPB에 근거한 것일 수 있다. 다양한 구체예에서, 푸린 절단 부위(furin cleavage site)가 제거될 수 있다.
다양한 구체예는 본원에 기술된 본 발명의 폴리뉴클레오티드를 포함하는 벡터를 제공한다.
다양한 구체예는 본원에 기술된 본 발명의 폴리뉴클레오티드, 또는 본원에 기술된 본 발명의 벡터를 포함하는 세포를 제공한다. 다양한 구체예에서, 상기 세포는 베로(Vero) 세포 또는 BHK(baby hamster kidney) 세포일 수 있다.
다양한 구체예는 본원에 기술된 본 발명의 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드를 제공한다.
다양한 구체예는 본원에 기술된 본 발명의 폴리뉴클레오티드를 포함하는, 변형된 SARS-CoV-2 변이체를 제공한다. 다양한 구체예는 본원에 기술된 본 발명의 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하는, 변형된 SARS-CoV-2 변이체를 제공한다. 다양한 구체예는 본원에 기술된 본 발명의 변형된 SARS-CoV-2 변이체로서, 그의 하나 이상의 바이러스 단백질의 발현이 모 SARS-CoV-2 변이체에 비해 감소된 것인 변형된 SARS-CoV-2 변이체를 제공한다. 다양한 구체예는 본원에 기술된 본 발명의 변형된 SARS-CoV-2 변이체로서, 그의 하나 이상의 바이러스 단백질의 발현 감소는 스파이크 단백질 또는 그의 단편을 재코딩한 결과로서 감소될 수 있는 것인 변형된 SARS-CoV-2 변이체를 제공한다.
다양한 구체예는 본원에 기술된 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체(subject)에서 면역 반응을 유도하기 위한 면역 조성물 또는 백신 조성물을 제공한다. 다양한 구체예에서, 본원에 기술된 본 발명의 면역 조성물 또는 백신 조성물은 약학적으로 허용되는 담체 또는 부형제를 추가로 포함할 수 있다.
다양한 구체예는 본원에 기술된 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 다가 면역 조성물 또는 백신 조성물을 제공한다. 다양한 구체예에서, 본원에 기술된 본 발명의 다가 면역 조성물 또는 본원에 기술된 본 발명의 다가 백신 조성물은 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드로서, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 상기 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않은 것인 폴리뉴클레오티드를 포함하는 변형된 SARS-CoV-2 코로나바이러스를 추가로 포함한다. 다양한 구체예에서, 본원에 기술된 본 발명의 다가 면역 조성물 또는 본원에 기술된 본 발명의 다가 백신 조성물은 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드로서, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 상기 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않은 것인 폴리펩티드를 포함하는 변형된 SARS-CoV-2 코로나바이러스를 추가로 포함할 수 있다. 다양한 구체예에서, 본원에 기술된 본 발명의 다가 면역 조성물 또는 본원에 기술된 본 발명의 다가 백신 조성물은 약학적으로 허용되는 담체 또는 부형제를 추가로 포함할 수 있다.
다양한 구체예는 대상체에서 면역 반응을 유도하는 방법으로서, 본원에 기술된 본 발명의 변형된 SARS-CoV-2 변이체의 용량을 상기 대상체에게 투여하는 단계를 포함하는 것인 방법을 제공한다.
다양한 구체예는 대상체에서 면역 반응을 유도하는 방법으로서, 본원에 기술된 본 발명의 면역 조성물의 용량을 상기 대상체에게 투여하는 단계를 포함하는 것인 방법을 제공한다.
다양한 구체예는 대상체에서 면역 반응을 유도하는 방법으로서, 본원에 기술된 본 발명의 백신 조성물의 용량을 상기 대상체에게 투여하는 단계를 포함하는 것인 방법을 제공한다.
다양한 구체예는 대상체에서 면역 반응을 유도하는 방법으로서, 본원에 기술된 본 발명의 다가 면역 조성물 또는 다가 백신 조성물의 용량을 상기 대상체에게 투여하는 단계를 포함하는 것인 방법을 제공한다.
다양한 구체예는 대상체에서 면역 반응을 유도하는 방법으로서, 본원에 기술된 본 발명의 변형된 SARS-CoV-2 코로나바이러스, 또는 본원에 기술된 본 발명의 백신 조성물, 또는 본원에 기술된 본 발명의 면역 조성물, 또는 본원에 기술된 본 발명의 다가 면역 또는 백신 조성물의 프라임 용량(prime dose)을 상기 대상체에게 투여하는 단계, 및 본원에 기술된 본 발명의 변형된 SARS-CoV-2 코로나바이러스, 또는 본원에 기술된 본 발명의 백신 조성물, 또는 본원에 기술된 본 발명의 면역 조성물, 또는 본원에 기술된 본 발명의 다가 면역 또는 백신 조성물의 1회 이상의 부스트 용량(boost dose)을 상기 대상체에게 투여하는 단계를 포함하는 것인 방법을 제공한다.
다양한 구체예에서, 상기 면역 반응은 보호 면역(protective immunne) 반응일 수 있다. 다양한 구체예에서, 상기 용량은 예방적 유효량(prophylactically effective dose) 또는 치료적 유효량(therapeutically effective dose)이다.
다양한 구체예에서, 투여는 비강 경로를 통해 이루어질 수 있다. 다양한 구체예에서, 투여는 점비(nasal drop)를 통해 이루어질 수 있다. 다양한 구체예에서, 투여는 비강 스프레이를 통해 이루어질 수 있다.
다양한 구체예에서, 상기 용량은 약 104-106 PFU일 수 있거나, 또는 상기 프라임 용량은 약 약 104-106 PFU이고, 상기 하나 이상의 부스트 용량은 약 104-106 PFU일 수 있다. 1회 이상의 부스트 용량이 약 104-106 PFU일 수 있다.
다양한 구체예는 탈최적화된(deoptimized) SARS-CoV-2 변이체을 제조하는 방법으로서, 모 SARS-CoV-2 변이체의 하나 이상의 단백질 또는 그의 하나 이상의 단편을 코딩하는 뉴클레오티드 서열을 수득하는 단계; 상기 하나 이상의 단백질 또는 상기 그의 하나 이상의 단편의 단백질 발현을 감소시키기 위해 뉴클레오티드 서열을 재코딩하는 단계; 및 재코딩된 뉴클레오티드 서열을 갖는 핵산을 모 SARS-CoV-2 변이체 게놈 내로 치환하여 탈최적화된 SARS-CoV-2 변이체 게놈을 제조하는 단계를 포함하고, 상기 재코딩된 뉴클레오티드 서열의 발현은 모 바이러스에 비해 감소된 것인 방법을 제공한다. 다양한 구체예에서, 상기 탈최적화된 SARS-CoV-2 변이체는 본원에 기술된 탈최적화된 SARS-CoV-2 변이체일 수 있다.
본 발명의 다른 특징 및 장점은 본 발명의 구체예의 다양한 특징을 예로서 예시하는 첨부 도면과 함께 취해진 하기의 상세한 설명으로부터 명백해질 것이다.
발명의 설명
본원에 인용된 모든 참조 문헌은 완전히 설명된 것처럼 그 전체가 참조에 의해 포함된다. 달리 정의되지 않는 한, 본원에서 사용되는 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. Singleton et al., Dictionary of Microbiology and Molecular Biology 3 rd ed., Revised, J. Wiley & Sons (New York, NY 2006); March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 7 th ed., J. Wiley & Sons (New York, NY 2013); 및 Sambrook and Russel, Molecular Cloning: A Laboratory Manual 4 th ed., Cold Spring Harbor Laboratory Press (Cold Spring Harbor, NY 2012)는 본 출원에서 사용되는 많은 용어에 대한 일반적인 가이드를 당업자에게 제공한다.
당업자는 본 발명의 실시에 사용될 수 있는 본원에 기재된 것과 유사하거나 균등한 많은 방법 및 재료를 인식할 것이다. 실제로, 본 발명은 기술된 방법 및 재료에 한정되지 않다. 본 발명의 목적을 위해, 다음 용어가 하기에 정의된다.
참조된 숫자 표시와 관련하여 사용될 때 본원에 사용된 용어 "약"은, 본원에서 달리 구체적으로 제공되지 않는 한, 참조된 숫자 표시에서 그 참조된 숫자 표시의 최대 5%를 더하거나 빼는 것을 의미한다. 예를 들어, "약 50%"라는 언어는 45% 내지 55%의 범위를 포함한다. 다양한 구체예에서, 참조된 숫자 표시와 관련하여 사용될 때 용어 "약"은 청구항에 구체적으로 제공된 경우, 참조된 숫자 표시에서 그 참조된 숫자 표시의 최대 4%, 3%, 2%, 1%, 또는 0.5%를 더하거나 빼는 것을 의미할 수 있다.
본원에 사용된 "모 바이러스(parent virus)"는 동일하거나 유사한 아미노산 서열을 코딩하기 위해 재코딩된 뉴클레오티드 서열이 비교되는 기준(reference) 바이러스를 의미한다.
본원에 사용된 "SARS-CoV-2" 및 "2019-nCoV"는 상호교환 가능하고, COVID-19를 유발하는 야생형 서열, 천연 분리주 서열(natural isolate sequence), 또는 상기 야생형 서열 또는 상기 천연 분리주 서열의 돌연변이 형태를 갖는 코로나바이러스를 의미한다. 돌연변이 형태는 바이러스의 복제 사이클을 통해 자연적으로, 또는 유전 공학을 통해 발생한다.
본원에 사용된 "SARS-CoV-2 변이체(SARS-CoV-2 variant)"는 인간과 같은 숙주 내에서 복제되고 및/또는 숙주 간에 전파될 때 바이러스의 복제 사이클을 통해 자연적으로 발생한 SARS-CoV-2의 돌연변이 형태를 지칭한다. SARS-CoV-2 변이체의 예는 알파 변이체 (UK 변이체, 20I/501Y.V1, VOC 202012/01, 또는 B.1.1.7로도 알려짐), 베타 변이체(남아프리카 변이체, 20H/501Y.V2 또는 B.1.351로도 알려짐), 델타 변이체 (B.1.617.2), 감마 변이체 (브라질 변이체 또는 P.1로도 알려짐), 오미크론 변이체 (B.1.1.529), 오미크론 변이체 계통(Omicron variant lineages) (BA.1, BA.1.1, BA.2, BA.3, BA.4 및 BA.5)를 포함하나, 이에 한정되지 않다.
SARS-CoV-2와 관련하여 본원에 사용된 "천연 분리주(natural isolate)"는 숙주 (예를 들어, 인간, 박쥐, 고양이, 돼지, 또는 임의의 다른 숙주) 또는 천연 저장소(reservoir)로부터 분리된 SARS-CoV-2와 같은 바이러스를 지칭한다. 천연 분리주의 서열은 동일하거나 숙주, 예를 들어 인간에서 복제되고 및/또는 숙주 간에 전달될 때 바이러스의 복제 사이클을 통해 자연적으로 발생한 돌연변이를 가질 수 있다.
본원에 사용된 "워싱턴 코로나바이러스 분리주" 또는 "워싱턴 분리주"는 그 전체가 완전히 설명된 것처럼 본원에 참고로 포함된, 2020년 7월 5일 기준 GenBank 수탁 번호 MN985325.1를 갖는 SARS-CoV-2의 야생형 분리주를 지칭한다.
"WW-WWD", "CDX-005" 및 "COVI-VAC"는 상호교환적으로 사용된다. "COVI-VAC"은 이전에 우선권 기초 출원(priority application)에서 CDX-005를 기술하기 위해 사용된 명칭이었다.
본원에 사용된 "빈번하게 사용되는 코돈(frequently used codon)" 또는 "코돈 사용빈도 편향(codon usage bias)"은 특정 종, 예를 들어, 인간, 코로나바이러스, 또는 SARS-CoV-2에 대한 코딩 DNA에서 동의 코돈(synonymous codon)의 발생 빈도의 차이를 지칭한다.
본원에 사용된 "코돈-쌍 편향(codon pair bias)"은 특정 종, 예를 들어, 인간, 코로나바이러스, 또는 SARS-CoV-2에서 통계적으로 예측된 것보다 더 빈번하게 또는 덜 빈번하게 사용되는 동의 코돈 쌍을 지칭한다.
본원에 사용된 "대상체(subject)"는 임의의 동물 또는 인공적으로 변형된 동물을 의미한다. 동물은 인간, 인간이 아닌 영장류, 원숭이, 소, 말, 양, 돼지, 개, 고양이, 토끼, 흰 족제비, 설치류, 예를 들면, 마우스, 랫트 및 기니피그, 박쥐, 뱀 및 새를 포함하나, 이에 한정되지 않다. 인공적으로 변형된 동물은 인간 면역계를 가진 SCID 마우스를 포함하나, 이에 한정되지 않다. 바람직한 구체예에서, 대상체는 인간이다.
"바이러스 숙주"는 바이러스가 감염시킬 수 있는 모든 동물 또는 인공적으로 변형된 동물을 의미한다. 동물은 인간, 인간이 아닌 영장류, 소, 말, 양, 돼지, 개, 고양이, 토끼, 흰 족제비, 마우스, 랫트 및 기니피그와 같은 설치류 및 조류를 포함하나, 이에 한정되지 않다. 인공적으로 변형된 동물은 인간 면역계를 가진 SCID 마우스를 포함하나, 이에 한정되지 않다. 다양한 구체예에서, 바이러스 숙주는 포유동물이다. 다양한 구체예에서, 바이러스 숙주는 영장류이다. 다양한 구체예에서, 바이러스 숙주는 인간이다. 조류의 구체예는 닭, 칠면조, 오리 및 거위를 포함하지만 이에 한정되지 않는 가축화된(domesticated) 가금류 종이다.
"예방적 유효량(prophylactically effective dose)"은 바이러스에 감염되기 쉽거나, 바이러스-관련 장애에 걸리기 쉬운 대상체에 투여될 때, 대상체에서 대상체를 바이러스에 감염되거나 상기 장애에 걸리는 것으로부터 보호하는 면역 반응을 유도하는 백신 또는 바이러스 조성물의 임의의 양이다. 대상체를 "보호"한다는 것은 대상체가 바이러스에 감염될 가능성을 줄이거나 대상체에서 장애의 발병 가능성을 적어도 2배, 바람직하게는 적어도 10배, 25배, 50배, 또는 100배 감소시키는 것을 의미한다. 예를 들어, 대상체가 바이러스에 감염될 가능성이 1%인 경우, 대상체가 바이러스에 감염될 가능성이 2배 감소하면 대상체가 바이러스에 감염될 가능성이 0.5%가 된다.
본원에 사용된, "치료적 유효량(therapeutically effective dose)"은 백신이 효과적으로 작용하는 장애를 앓는 대상체에게 투여될 때, 대상체에서 대상체가 상기 장애 및/또는 그 증상의 감소, 관해(remission) 또는 경감(regression)을 경험하게 하는 면역 반응을 유도하는 백신 또는 바이러스 조성물의 임의의 양이다. 바람직한 구체예에서, 장애 및/또는 그의 증상의 재발이 예방된다. 다른 바람직한 구체예에서, 대상체는 장애 및/또는 그의 증상이 치유된다.
본원에 사용된 "상응하는 서열(corresponding sequence)"은 변형된 서열이 비교 서열의 동일하거나 유사한 아미노산 서열을 코딩하는 경우의 비교 서열을 의미한다. 다양한 구체예에서, 상응하는 서열은 바이러스 단백질을 코딩하는 서열이다. 다양한 구체예에서, 상응하는 서열은 적어도 50개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 100개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 150개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 200개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 250개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 300개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 350개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 400개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 450개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 500개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 바이러스 단백질 서열이다. 다양한 구체예에서, 상응하는 서열은 전체 바이러스의 서열이다.
다양한 구체예에서, 본원에 사용된 "유사한 아미노산 서열(similar amino acid sequence)"은 비교 서열과 비교하여 2% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, "유사한 아미노산 서열"은 비교 서열과 비교하여 1.75% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, 비교 서열과 비교하여 1.5% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, 비교 서열과 비교하여 1.25% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, 비교 서열과 비교하여 1% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, 비교 서열과 비교하여 0.75% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, 비교 서열과 비교하여 0.5% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, 비교 서열과 비교하여 0.25% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다.
본 면역화 및 치료 방법의 특정 구체예는 적어도 하나의 보조제를 대상체에게 투여하는 것을 추가로 포함한다. "보조제(adjuvant)"는 항원의 면역원성을 증진시키고 대상체에서 면역 반응을 증가(boost)시키는데 적합한 임의의 작용제를 의미할 것이다. 단백질- 및 핵산-기반 백신 모두와 함께 사용하기에 적합한 입자성(particulate) 보조제를 포함한, 많은 보조제, 및 항원과 보조제를 조합하는 방법이 당업자에게 잘 알려져 있다. 핵산 기반 백신에 적합한 보조제는 Quil A, 이미퀴모드, 레시퀴모드 및 정제된 단백질 또는 핵산 형태로 전달되는 인터루킨-12를 포함하나, 이에 한정되지 않다. 단백질 면역화와 함께 사용하기에 적합한 보조제는 명반(alum), 프로인트 불완전 보조제 (FIA), 사포닌, Quil A, 및 QS-21을 포함하나, 이에 한정되지 않다.
그의 유전자가 재코딩된, 예를 들어, 코돈-쌍 편향 탈최적화되거나 코돈 사용빈도 탈최적화된 SARS-CoV-2 변이체가 본원에 기술된다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 가지나; 뉴클레오티드 서열은 재코딩된 것이다. 본 발명에 따른 뉴클레오티드 서열의 재코딩(recoding)은 감소된 단백질 발현, 약독화(attenuation) 또는 둘 모두를 초래한다. 이들 재코딩된 SARS-CoV-2 변이체는 백신으로서, 특히 약독화 생백신으로 사용하기에 유용하다.
본 발명자들은 이전에 wt SARS-CoV-2로부터 합성 고 약독화 생백신(synthetic highly attenuated live vaccine) 후보, CDX-005를 생성하였다. 임의의 특정한 이론에 얽매이지 않기를 바라면서, 본 발명자들은 약독화에 대해 가장 가능성 있는 메커니즘은 미스폴딩(misfoled) 단백질을 초래하는 번역의 오류를 통한 둔화된 번역이고, RNA 2차 구조의 변화, 또는 변경된 조절 신호 모두가 단백질 생산 감소에 기여할 것이라 믿는다. 메커니즘이 무엇이든, 약독화된 CDX-005 바이러스는 모든 바이러스 항원을 그의 wt 형태로 제시하여, 광범위한 면역 반응에 대한 잠재력을 제공하고, 표적 균주에 유전적 부동(genetic drift)이 있는 경우에도 효능을 유지할 가능성이 있다. CDX-005는 수백 개의 침묵 (동의) 돌연변이가 표현형에 기여하기 때문에 병원성으로의 복귀에 대해 높은 내성을 가질 것으로 예상된다. 본 발명자의 복귀(reversion) 테스트는 후기 계대 바이러스(late passage viru)의 벌크 시퀀싱 및 푸린 절단 부위의 잠재적 변화의 평가에 의해 평가된 바와 같이 백신이 안정하다는 나타낸다.
본 발명자의 햄스터 연구는 CDX-005가 이 동물들에게 안전하다는 것을 입증한다. CDX-00는 고도로 약독화되어, 폐 및 후신경구(olfactory bulb)에서 더 낮은 총 바이러스 부하를 유도하고 뇌에서 완전히 제거하고, wt WA1이 접종된 동물보다 CDX-005가 접종된 동물의 폐에서 더 낮은 살아있는 바이러스 부하를 유도한다. wt 바이러스와 달리, CDX-005는 접종된 햄스터에서 체중 감소 또는 심각한 폐 병리를 유도하지 않았다.
햄스터 연구는 또한 CDX-005가 SARS CoV-2로부터 효과적으로 보호한다고 시사한다. Ab 역가의 평가는 혈청 IgG 및 중화 Ab의 유도에서 wt 바이러스만큼 효과적이라는 것을 보여준다. CDX-005는 wt 챌린지로부터 보호하고; CDX-005 접종은 폐 바이러스 역가를 낮추고, 뇌에서 바이러스에 대한 완전한 보호를 가져온다. CDX-005로 접종한 햄스터는 또한 비히클 접종 동물에서 관찰된 체중 감소를 나타내지 않다. 또한, 질환 강화(disease enhancement)의 증거가 없다.
전체적으로, 본 발명자의 데이터는 CDX-005가 현재 동물 및 인간에서 사용하기 위해 개발 중인 중요한 새로운 종류의 약독화 생백신의 일부라는 것을 나타낸다. CDX-005는 원형(native) 아미노산 서열과 유사한 모든 바이러스 항원을 제시하고, 비강 내 투여될 수 있고, 소동물 모델에서 단일 용량으로 안전하고 효과적이며, 복귀에 내성이 있고, 허용 온도에서 높은 역가로 성장할 수 있다. 현재 인간에서 안전성과 효능을 테스트하기 위한 임상 시험이 진행 중이다.
탈최적화된 CDX-005 (예를 들어, 서열번호 1을 포함함) 약독화 생백신 후보를 구축하기 위해, 먼저 야생형 WA1 공여자 바이러스의 게놈을 인 실리코(in silico)로 19개의 중첩 단편으로 분석하였다(parse). 각 단편은 각 인접 단편과 약 200 bp의 서열 중첩을 공유한다. F1-F19를 RT-PCR로 야생형 WA1 바이러스 RNA의 cDNA로부터 생성하였다. 단편을 생거 시퀀싱(Sanger sequencing)에 의해 서열 확인하였다. 그 후, 본 발명자들은 CDX-005의 cDNA 게놈을 생성하기 위해 WT WA1 바이러스의 단편 16을 탈최적화된 스파이크 유전자 서열을 가진 단편 16으로 교환했다.
다양한 구체예에서, 표적 SARS-CoV-2 및 그의 변이체를 RT-PCR을 통해 각각 약 50 내지 300 bp 중첩을 갖는 작은 단편으로 분자 분석하고(molecular parsing) 이들 단편 중 임의의 단편을 교환하는 것이 임의의 코돈 또는 코돈 쌍 탈최적화 바이러스의 cDNA 게놈 또는 게놈 단편을 구성하는 데 이용될 수 있는 과정이다. 그 후, 탈최적화된 카세트를 갖는 이 cDNA 게놈을 역유전학(reverse genetics)을 통해 탈최적화된 바이러스를 복구하는 데 사용할 수 있다.
CDX-005의 경우, 본 발명자들은 공개된 WA1 서열 (Vero 세포 계대 4)과 비교하여 본 발명자들의 WA1 공여자 바이러스 (Vero 세포 계대 6)의 서열에서 한 가지 주목할 만한 차이점을 확인했다. BEI Resources로부터 받은 WA1 바이러스의 Codagenix에서 Vero E6 세포에 대한 2회의 추가 WA1 바이러스 계대 동안, 스파이크 유전자 (게놈 위치 23594-23629)에서 36 nt 결실이 발생했다. 결실은 다염기성 푸린 절단 부위(polybasic furin cleavage site)를 포함하는 12개 아미노산 TNSPRRARSVAS (서열 번호 13)를 포함한다. SARS-CoV2 스파이크의 푸린 절단 부위는 인간 숙주에서 SARS-CoV2의 고병원성 표현형의 잠재적인 동인(driver)으로 제안되었다. 임의의 어떤 특정한 이론에 얽매이지 않기를 바라면서, 본 발명자들은 푸린 절단 부위의 부재가 시험관내 Vero 세포에서 SARS-CoV-2 바이러스 및 그의 변이체의 성장에 유익하고, 결실이 Vero 세포 배양에서 계대하는 동안 진화했다고 믿는다. 본 발명자들은 또한 푸린 절단 부위의 부재가 인간 숙주에서 그러한 돌연변이를 지닌 SARS-CoV-2 바이러스 또는 그의 변이체의 약독화에 기여할 수 있다고 믿는다. 따라서, 본 발명자들은 백신 후보 CDX-005 내로 유래된 푸린 절단 부위 결실을 통합하기로 결정했다. 푸린 절단 부위 결실은 어셈블리 단편 F15에 위치한다.
그러나, SARS-CoV-2 변이체의 출현 이후, 변이체 형태에 대한 강력한 보호를 보장하기 위해서는 새로운 백신이 필요하다. 따라서, 본 발명자들은 SARS-CoV-2 변이체에 대한 더 강한 보호를 위해, 탈최적화 SARS-CoV-2 변이체를 생성하기 시작했다.
본 발명은 적어도 부분적으로 전술한 내용 및 본원에 기술된 추가 정보에 기초한다.
다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 최대 약 20개 아미노산 결실(들), 치환(들), 또는 첨가(들)가 있다. 그러나, 뉴클레오티드 서열이 재코딩되어, 단백질 발현 감소, 약독화 또는 둘 모두를 초래한다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 최대 약 10개 아미노산 결실(들), 치환(들), 또는 첨가(들)가 있다;그러나, 뉴클레오티드 서열이 재코딩되어, 단백질 발현 감소, 약독화 또는 둘 모두를 초래한다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 1-5개 아미노산 결실(들), 치환(들), 또는 첨가(들)가 있다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 6-10개 아미노산 결실(들), 치환(들), 또는 첨가(들)가 있다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 11-15개 아미노산 결실(들), 치환(들), 또는 첨가(들)가 있다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 16-20개 아미노산 결실(들), 치환(들), 또는 첨가(들)가 있다. 그러나 다시, 뉴클레오티드 서열이 재코딩되어서, 단백질 발현 감소, 약독화 또는 둘 모두를 초래한다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 12개의 아미노산 결실, 치환 또는 첨가를 갖고; 그러나 뉴클레오티드 서열이 재코딩되어, 단백질 발현 감소, 약독화 또는 둘 모두를 초래한다. 다양한 구체예에서, 아미노산 결실, 치환 또는 첨가는 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 앞의 핵산 결실(들), 치환(들) 또는 첨가(들)로부터 초래된다.
다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 12개의 아미노산 결실을 갖는다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 1-5개 아미노산 결실, 또는 6-10개 아미노산 결실, 또는 11-15개 아미노산 결실, 또는 16-20개 아미노산 결실을 갖는다. 다양한 구체예에서, 아미노산 결실은 푸린 절단 부위를 제거하는 스파이크 단백질에 있다. 다양한 특정 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 스파이크 단백질 상의 푸린 절단 부위의 제거를 초래하는 12개 아미노산 결실을 갖는다. 다양한 구체예에서, 아미노산 결실, 치환, 또는 첨가는 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 앞의 핵산 결실(들), 치환(들) 또는 첨가(들)로부터 초래된다.
다양한 구체예에서, SARS-CoV-2 변이체의 스파이크 단백질을 코딩하는 핵산(S 유전자로도 알려짐)이 재코딩된다. 다양한 구체예에서, 재코딩된 스파이크 단백질은 푸린 절단 부위를 제거하는 뉴클레오티드; 예를 들어, 하기 서열 actaattctcctcggcgggcacgtagtgtagctagt(서열번호 14)를 갖는 36개 뉴클레오티드 서열 또는 TNSPRRARSVAS(서열번호 13)를 코딩하는 핵산 서열의 결실을 포함한다.
본 발명의 약독화된 바이러스의 스파이크 단백질 코딩 서열의 재코딩은 본원에 논의된 개시에 비추어 당업자에 의해 이루어졌거나 이루어질 수 있다. 본 발명의 다양한 구체예에 따르면, 뉴클레오티드 치환은 스파이크 단백질 코딩 서열의 복수의 위치에서 조작되며, 상기 치환은 게놈 내로 복수의 동의 코돈(synonymous codon)을 도입한다. 특정 구체예에서, 동의 코돈 치환은 게놈에서 코돈 편향, 코돈-쌍 편향, 드문(infrequent) 코돈 또는 드물게 발생하는(infrequently occurring) 코돈 쌍의 밀도, RNA 2차 구조, CG 및/또는 TA (또는 UA) 디뉴클레오티드 함량, C+G 함량, 번역 프레임쉬프트 부위(translation frameshift site), 번역 정지 부위(translation pause site), 마이크로RNA 인식 서열의 존재 또는 부재 또는 이들의 임의의 조합을 변경한다. 코돈 치환은 스파이크 단백질 코딩 서열 전체에 걸쳐 분포된 복수의 위치, 또는 스파이크 단백질 코딩 서열의 일부로 제한된 복수의 위치에 조작될 수 있다. 관련된 다수의 결함 (즉, 뉴클레오티드 치환)으로 인해, 본 발명은 안정적으로 약독화된 바이러스 및 생백신의 생산을 가능하게 한다.
일부 구체예에서, 바이러스 코돈 쌍은 코돈-쌍 편향을 감소시키기 위해(즉, 그 값을 낮추기 위해) 재코딩된다. 특정 구체예에서, 코돈-쌍 편향은 감소될 수 있는 코돈-쌍 점수(codon-pair score)를 갖는 코돈-쌍을 스파이크 코딩 서열에서 확인하고, 상기 코돈-쌍을 더 낮은 코돈-쌍 점수를 갖는 코돈 쌍으로 치환함으로써 코돈-쌍 편향을 감소시키는 것에 의해 감소된다. 일부 구체예에서, 코돈 쌍의 이러한 치환은 서열의 기존 코돈을 재배열하는 형태를 취한다. 일부 이러한 구체예에서, 코돈 쌍의 서브세트는 동의 코돈의 서브세트를 재배열함으로써 치환된다. 다른 구체예에서, 코돈 쌍은 재배열된 동의 코돈의 수를 최대화하는 것에 의해 치환된다. 코돈의 재배열은 전체적으로 바이러스 코딩 서열에 대해 감소된 (더 음성으로 만드는) 코돈-쌍 편향을 초래하고, 재배열은 다수의 위치에서 감소된 CPS를 초래하는 반면, 다른 위치에서는 수반되는 CPS 증가가 있을 수 있지만, 평균적으로, 변형된 서열의 코돈 쌍 점수, 따라서 CPB는 감소된다는 것에 주목한다. 일부 구체예에서, 코돈 또는 코돈-쌍의 재코딩은 스파이크 코딩 서열의 G+C 함량의 변경을 고려할 수 있다. 일부 구체예에서, 코돈 또는 코돈-쌍의 재코딩은 스파이크 코딩 서열에서 CG 및/또는 TA 디뉴클레오티드의 빈도를 변경하는 것을 고려할 수 있다.
특정 구체예에서, 재코딩된 스파이크 단백질-코딩 서열은 -0.1 미만, 또는 -0.2 미만, 또는 -0.3 미만, 또는 -0.4 미만의 코돈-쌍 편향을 갖는다. 일부 구체예에서, 재코딩된 스파이크 단백질-코딩 서열은 -0.01 미만, -0.02 미만, -0.03 미만, 또는 -0.04 미만의 코돈-쌍 편향을 갖는다. 일부 구체예에서, 재코딩된 스파이크 단백질-코딩 서열은 -0.05 미만, 또는 -0.06 미만, 또는 -0.07 미만, 또는 -0.08 미만, 또는 -0.09 미만, 또는 -0.1 미만, 또는 -0.11 미만, 또는 -0.12 미만, 또는 -0.13 미만, 또는 -0.14 미만, 또는 -0.15 미만, 또는 -0.16 미만, 또는 -0.17 미만, 또는 -0.18 미만, 또는 -0.19 미만, 또는 -0.2 미만, 또는 -0.25 미만, 또는 -0.3 미만, 또는 -0.35 미만, 또는 -0.4 미만, 또는 -0.45 미만, 또는 -0.5 미만의 코돈-쌍 편향을 갖는다.
특정 구체예에서, 재코딩된 스파이크 단백질 코딩 서열의 코돈-쌍 편향은 그것이 유래된 모 스파이크 단백질 코딩 서열 (예를 들어, 모 서열 스파이크 단백질 코딩 서열, 변이체 스파이크 단백질 코딩 서열)과 비교하여 적어도 0.1, 또는 적어도 0.2, 또는 적어도 0.3, 또는 적어도 0.4 만큼 감소된다. 특정 구체예에서, 스파이크 단백질-코딩 서열의 동의 코돈의 재배열은 그것이 유래된 모 스파이크 단백질 코딩 서열과 비교하여 적어도 0.1, 또는 적어도 0.2, 또는 적어도 0.3, 또는 적어도 0.4의 코돈-쌍 편향 감소를 제공한다. 특정 구체예에서, 스파이크 단백질-코딩 서열의 동의 코돈의 재배열은 그것이 유래된 모 스파이크 단백질 코딩 서열과 비교하여 적어도 0.1, 또는 적어도 0.2, 또는 적어도 0.3, 또는 적어도 0.4의 코돈-쌍 편향 감소를 제공한다. 특정 구체예에서, 재코딩된 스파이크 단백질-코딩 서열의 코돈-쌍 편향은 모 바이러스 상의 상응하는 서열과 비교하여 적어도 0.05, 또는 적어도 0.06, 또는 적어도 0.07, 또는 적어도 0.08, 또는 적어도 0.09, 또는 적어도 0.1, 또는 적어도 0.11, 또는 적어도 0.12, 또는 적어도 0.13, 또는 적어도 0.14, 또는 적어도 0.15, 또는 적어도 0.16, 또는 적어도 0.17, 또는 적어도 0.18, 또는 적어도 0.19, 또는 적어도 0.2, 또는 적어도 0.25, 또는 적어도 0.3, 또는 적어도 0.35, 또는 적어도 0.4, 또는 적어도 0.45, 또는 적어도 0.5 만큼 감소된다. 특정 구체예에서, 그것은 계산이 이루어질 상응하는 서열, 예를 들어, 변이체 바이러스의 상응하는 서열 (예를 들어, 변이체 바이러스 상의 스파이크 단백질-코딩 서열)과의 비교이다.
일부 구체예에서, 바이러스 코딩 서열은 하나 이상의 코돈을 SARS-CoV-2 코로나바이러스 숙주(예: 인간, 뱀, 박쥐)에서 덜 빈번하게 사용되는 동의 코돈으로 치환하는 것에 의해 재코딩된다. 일부 구체예에서, 바이러스 코딩 서열은 하나 이상의 코돈을 코로나바이러스, 예를 들어, SARS-CoV-2 코로나바이러스에서 덜 빈번하게 사용되는 동의 코돈으로 치환하는 것에 의해 재코딩된다. 특정 구체예에서, 동의 코돈으로 치환된 코돈의 수는 5개 이상이다. 일부 구체예에서, 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 250, 300, 350, 400, 450 또는 500개의 코돈이 숙주에서 덜 빈번하게 사용되는 동의 코돈으로 치환된다. 특정 구체예에서, 변형된 서열은 덜 빈번하게 사용되는 동의 코돈으로 치환된 적어도 20개의 코돈을 포함한다. 특정 구체예에서, 변형된 서열은 덜 빈번하게 사용되는 동의 코돈으로 치환된 적어도 50개의 코돈을 포함한다. 특정 구체예에서, 변형된 서열은 덜 빈번하게 사용되는 동의 코돈으로 치환된 적어도 100개의 코돈을 포함한다. 특정 구체예에서, 변형된 서열은 덜 빈번하게 사용되는 동의 코돈으로 치환된 적어도 250개의 코돈을 포함한다. 특정 구체예에서, 변형된 서열은 덜 빈번하게 사용되는 동의 코돈으로 치환된 적어도 500개의 코돈을 포함한다.
예를 들어, 재코딩된 스파이크 단백질의 경우, 숙주에서 덜 빈번하게 사용되는 동의 코돈으로 치환된 코돈의 수는 적어도 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450 또는 500개의 코돈이다.
일부 구체예에서, 동의 코돈의 치환은 바이러스 숙주, 예를 들어 인간에서 덜 빈번한 코돈으로 이루어진다. 바이러스 숙주의 다른 예는 전술된 것을 포함하나, 이에 한정되지 않다. 일부 구체예에서, 동의 코돈의 치환은 바이러스 자체, 예를 들어, SARS-CoV-2 코로나바이러스에서 덜 빈번한 것들로 이루어진다.
변형된 서열이 모 바이러스의 상응하는 서열과 비교하여 증가된 수의 CpG 또는 UpA 디뉴클레오티드를 포함하는 것인 구체예에서, 증가는 상응하는 서열과 비교하여 약 15-55개의 CpG 또는 UpA 디뉴클레오티드이다. 다양한 구체예에서, 증가는 상응하는 서열과 비교하여 약 15, 20, 25, 30, 35, 40, 45 또는 55개의 CpG 또는 UpA 디뉴클레오티드이다. 일부 구체예에서, 상응하는 서열과 비교하여 증가된 CpG 또는 UpA 디뉴클레오티드의 수는 상응하는 서열과 비교하여 약 10-75, 15-25, 25-50 또는 50-75개의 CpG 또는 UpA 디뉴클레오티드이다.
일반적으로, 이러한 치환 및 변경은 코딩된 단백질의 아미노산 서열을 변경하지 않으면서 이루어지고, 코딩된 바이러스 단백질의 발현을 감소시킨다. 특정 구체예에서, 본 발명은 또한 보존적일 수도 있고 그렇지 않을 수도 있는, 코딩된 단백질에서 비-동의(non-synonysmous) 코돈의 치환 및 아미노산 치환을 초래하는 스파이크 코딩 서열의 변경을 포함한다. 일부 구체예에서, 이러한 치환 및 변경은 아미노산 결실, 첨가, 치환을 초래하는 치환 또는 변경을 추가로 포함한다. 예를 들어, 스파이크 단백질은 푸린 절단 부위의 제거를 초래하는 36개 뉴클레오티드 결실을 갖도록 재코딩될 수 있다.
다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 3/4이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되고, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 1/2이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되고, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 1/3이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되고, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 1/4이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되고, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 1/5이다.
다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 10-20%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 20-30%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 25-35%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 30-40%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 35-45%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 40-50%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 45-55%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 50-60%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 55-65%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 60-70%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 70-80%이다.
대부분의 아미노산은 2개 이상의(more than one) 코돈에 의해 코딩된다. 표 1의 유전자 코드(genetic code)를 참조한다. 예를 들어, 알라닌은 GCU, GCC, GCA, 및 GCG에 의해 코딩된다. 3개의 아미노산 (Leu, Ser, 및 Arg)은 6개의 상이한 코돈에 의해 코딩되나, Trp 및 Met만 고유한 코돈을 갖는다. "동의" 코돈은 동일한 아미노산을 코딩하는 코돈이다. 따라서, 예를 들어, CUU, CUC, CUA, CUG, UUA, 및 UUG는 Leu를 코딩하는 동의 코돈이다. 동의 코돈은 동일한 빈도로 사용되지 않다. 일반적으로, 특정 유기체에서 가장 빈번하게 사용되는 코돈은 동족 tRNA가 풍부한 코돈이며, 이러한 코돈을 사용하면 단백질 번역의 속도 및/또는 정확도가 증진된다. 반대로, 드물게 사용되는 코돈에 대한 tRNA는 상대적으로 낮은 수준으로 발견되며, 희귀 코돈을 사용하면 번역 속도 및/또는 정확도가 감소하는 것으로 생각된다.
표 1. 유전자 코드
a 특정 아미노산을 코딩하는 각 코돈의 첫 번째 뉴클레오티드가 맨 왼쪽 열에 표시되고; 두 번째 뉴클레오티드는 맨 위 행에 표시되며; 세 번째 뉴클레오티드는 맨 오른쪽 열에 표시된다.
코돈 편향 (Codon Bias)
본원에 사용된, "희귀(rare)" 코돈은 해당 아미노산에 대해 가장 빈번하게 사용되는 코돈보다 훨씬 더 낮은 빈도로 mRNA에 존재하는 특정 아미노산을 코딩하는 적어도 2개의 동의 코돈 중 하나이다. 따라서, 희귀 코돈은 가장 빈번하게 사용되는 코돈보다 약 2배 낮은 빈도로 존재할 수 있다. 바람직하게는, 희귀 코돈은 해당 아미노산에 대해 가장 빈번하게 사용되는 코돈보다 적어도 3배, 더욱 바람직하게는 적어도 5배 더 낮은 빈도로 존재한다. 반대로, "빈번한(frequent)" 코돈은 해당 아미노산에 대해 가장 낮은 빈도로 사용되는 코돈보다 훨씬 더 높은 빈도로 mRNA에 존재하는 특정 아미노산을 코딩하는 적어도 2개의 동의 코돈 중 하나이다. 빈번한 코돈은 해당 아미노산에 대해 가장 낮은 빈도로 사용되는 코돈보다 약 2배, 바람직하게는 적어도 3배, 더욱 바람직하게는 적어도 5배 더 높은 빈도로 존재할 수 있다. 예를 들어, 인간 유전자는 사용의 40%로 루이신 코돈 CTG를 사용하지만, 동의 CTA를 단지 사용의 7%로 사용한다 (표 2 참조). 따라서, CTG는 빈번한 코돈인 반면, CTA는 희귀 코돈이다. 이러한 사용의 빈도와 대략 일치하게, 게놈에 CTG를 인식하는 tRNA에 대한 유전자의 6개의 카피가 있으나, CTA를 인식하는 tRNA에 대한 유전자는 2개의 카피만 있다. 유사하게, 인간 유전자는 각각 사용의 18% 및 22%로 세린에 대한 빈번한 코돈 TCT 및 TCC를 사용하나, 희귀 코돈 TCG는 단지 사용의 5%로 사용한다. TCT와 TCC는 게놈에 10개의 유전자 카피가 있는, 동일한 tRNA에 의해 워블(wobble)을 통해 해독되는 반면 TCG는 4개의 카피만 있는 tRNA에 의해 해독된다. 매우 활발하게 번역되는 mRNA는 가장 빈번한 코돈만을 사용하도록 강하게 편향되어 있다는 것은 잘 알려져 있다. 이는 리보솜 단백질 및 해당 효소에 대한 유전자를 포함한다. 반면에, 상대적으로 풍부하지 않은 단백질의 mRNA는 희귀 코돈을 사용할 수 있다.
표 2. 호모 사피엔스의 코돈 사용빈도(usage) (출처: www.kazusa.or.jp/codon/)
고도로 발현된 유전자가 빈번한 코돈을 사용하는 경향을 "코돈 편향"이라고 한다. 리보솜 단백질에 대한 유전자는 61개 코돈 중 가장 빈번하게 사용되는 20~25개의 코돈만을 사용하고, 높은 코돈 편향 (1에 가까운 코돈 편향)을 갖는 반면, 불충분하게 발현되는(poorly expressed) 유전자는 61개의 코돈을 모두 사용하고 거의 코돈 편향이 없다 (0에 가까운 코돈 편향). 빈번하게 사용되는 코돈은 더 많은 양의 동족 tRNA가 발현되는 코돈이며, 이러한 코돈을 사용하면 번역이 더 빠르게, 더 정확하게, 또는 더 빠르고 더 정확하게 진행될 수 있게 하는 것으로 사료된다.
코돈-쌍 편향
또한, 주어진 유기체는 주어진 코돈 A의 가장 가까운 코돈 이웃에 대한 선호도를 가지며, 이를 코돈 쌍 활용(codon pair utilization)의 편향이라고 한다. 기존 코돈을 변경하지 않으면서, 코돈-쌍 편향의 변경은 단백질 합성 및 단백질 생산 속도에 영향을 줄 수 있다.
코돈-쌍 편향은 8개의 상이한 코돈 쌍에 의해 코딩될 수 있는 아미노산 쌍 Ala-Glu를 고려하여 설명할 수 있다. 각 개별 코돈의 빈도 (표 2에 표시됨) 이외의 요인이 코돈 쌍의 빈도에 영향을 미치지 않는 경우, 8개의 코딩 각각의 예상 빈도는 2개의 관련 코돈의 빈도를 곱하여 계산할 수 있다. 예를 들어, 이 계산에 의해, 코돈 쌍 GCA-GAA는 모든 Ala-Glu 코딩 쌍 중 0.097의 빈도(0.23×0.42; 표 2의 빈도에 기초함)로 발생할 것으로 예상된다. 각 코돈 쌍의 예상(가상) 빈도를 인간 게놈에서 실제로 관찰된 빈도와 관련시키기 위해, 총 14,795개의 인간 유전자를 포함하는 일관되게 주석이 달린(consistently annotated) 인간 코딩 영역의 CCDS(Consensus CDS) 데이터베이스를 사용하였다. 이 유전자 세트는 인간 코딩 서열의 가장 포괄적인 표시(representation)이다. 이 유전자 세트를 사용하여, 코돈의 발생 횟수를 동일한 아미노산을 코딩하는 모든 동의 코돈의 수로 나누어 코돈 사용(codon usage)의 빈도를 재계산했다. 예상대로, 빈도는 표 2에 나와 있는 것과 같이 이전에 발표된 빈도와 밀접하게 상관되었다. 약간의 빈도 변동은 84949개(인간 유전자의 실제 수보다 훨씬 많음)의 인간 코딩 서열이 계산에 포함된 Kazusa DNA Research Institute (www.kazusa.or.jp/codon/codon.html)의 코돈 사용빈도 데이터베이스에 의해 제공된 데이터에서 가능하게는 오버샘플링(oversampling) 효과로 인한 것이다. 그에 따라 계산된 코돈 빈도를 먼저 두 개의 관련 코돈의 빈도를 상호 간에 곱하고(표 3 예상 빈도 참조), 이 결과를 (전체 CCDS 데이터 세트에서) 해당하는 코돈 쌍에 의해 코딩된 아미노산 쌍이 발생하는 것으로 관찰된 빈도로 곱하는 것에 의해 예상 코돈-쌍 빈도를 계산하는 데 사용하였다. 코돈 쌍 GCA-GAA의 예에서, 이 두 번째 계산은 (Kazusa 데이터 세트를 사용한 첫 번째 계산의 0.097과 비교하여)0.098의 예상 빈도를 제공한다. 마지막으로, 14,795개 인간 유전자의 세트에서 관찰된 실제 코돈 쌍 빈도는 이 세트에서 각 코돈 쌍의 총 발생 횟수를 계수하고, 이를 이 세트에서 동일한 아미노산 쌍을 코딩하는 모든 동의 동의 코딩 쌍의 수로 나누는 것에 의해 결정하였다(표 3; 관찰 빈도). 14,795개 인간 유전자의 세트를 기반으로 한, 완전한 3721개 (612) 코돈 쌍의 세트에 대한 빈도 및 관찰/예상 값이 표 3에 제공된다.
표 3. 아미노 쌍 Ala-Glu로 예시된 코돈 쌍 점수
코돈 쌍의 관찰 빈도/예상 빈도의 비율이 1보다 크면, 그 코돈 쌍은 과대표된(overrepresented) 것이라고 한다. 상기 비율이 1보다 작으면 저대표된(underrepresented) 것이라고 한다. 예에서, 코돈 쌍 GCA-GAA는 1.65배 과대표되고, 코딩 쌍 GCC-GAA는 5배 이상 저대표된다.
다수의 기타 코돈 쌍은 매우 강한 편향을 나타낸다; 일부 쌍은 저대표되고, 다른 쌍은 과대표된다. 예를 들어, 코돈 쌍 GCCGAA (AlaGlu) 및 GATCTG (AspLeu)는 3 내지 6배 저대표되고(바람직한 쌍은 각각 GCAGAG 및 GACCTG임), 코돈 쌍 GCCAAG (AlaLys) 및 AATGAA (AsnGlu)는 약 2배 이상 과대표된다. 코돈-쌍 편향은 아미노산 쌍의 빈도나 개별 코돈의 빈도와 관련이 없다는 점에 주목해야 한다. 예를 들어, 저대표된 쌍 GATCTG (AspLeu)는 가장 빈번한 Leu 코돈, (CTG)을 사용한다.
하기에서 더 자세히 논의되는 바와 같이, 코돈-쌍 편향은 코딩 서열의 전체 길이에 걸쳐 평균화된 코딩 서열의 각 코돈 쌍에 대한 점수를 고려한다. 본 발명에 따르면, 코돈-쌍 편향은 하기 식에 의해 결정된다:
.
따라서, 코딩 서열에 대한 유사한 코돈-쌍 편향이, 예를 들어, 서브서열(subsequence)에 대한 최소화된 코돈 쌍 점수, 또는 코딩 서열의 전체 길이에 대한 적당히 감소된 코돈 쌍 점수에 의해 수득될 수 있다.
코돈-쌍 편향의 계산
가능한 3721개 비-"정지(STOP)" 함유 코돈 쌍 (예를 들어, GTT-GCT)의 모든 개별 코돈 쌍은 유전자의 주어진 "트레이닝 세트(training set)"에 특이적인 할당된(assigned) "코돈 쌍 점수(codon pair score)," 또는 "CPS"를 갖는다. 주어진 코돈 쌍의 CPS는 이 유전자 세트 (이 예에서는 인간 게놈)에서 예상되었을 발생의 횟수에 대한 관찰된 발생의 횟수의 로그 비율로 정의된다. 특정 코돈 쌍의 실제 발생 횟수 (또는 특정 아미노산 쌍이 특정 코돈 쌍에 의해 코딩될 가능성)를 결정하는 것은 단순히 코딩 서열의 특정 세트에서 코돈 쌍의 실제 발생 횟수를 계수하는 문제이다. 그러나, 예상 숫자를 결정하려면 추가 계산이 필요하다. 예상 숫자는 Gutman and Hatfield와 유사하게 아미노산 빈도 및 코돈 편향 모두에 독립적이도록 계산된다. 즉, 아미노산이 특정 코돈에 의해 코딩되는 횟수의 상대적인 비율을 기반으로 예상 빈도를 계산한다. 양의 CPS 값은 주어진 코돈 쌍이 통계적으로 과대표된다는 것을 의미하고, 음의 CPS는 해당 쌍이 인간 게놈에서 통계적으로 저대표된다는 것을 나타낸다.
인간 맥락(context) 내에서 이러한 계산을 수행하기 위해, 총 14,795개의 유전자를 포함하는 일관되게 주석이 달린 인간 코딩 영역의 가장 최근의 CCDS(Consensus CDS) 데이터베이스를 사용하였다. 이 데이터 세트는 게놈 스케일에서, 코돈 및 코돈 쌍, 따라서 아미노산 및 아미노산 쌍 빈도를 제공했다.
Federov et al. (2002)의 패러다임을 이용하여 Gutman and Hatfield (1989)의 접근 방식을 더욱 향상시켰다. 이는 특정 아미노산 쌍을 코딩하는 인접한(neighboring) 코돈의 비-무작위 연관 및 코돈 빈도와 무관하게, 주어진 코돈 쌍의 예상 빈도를 계산할 수 있게 했다. CPB를 계산하기 위해 사용된 상세한 식은 WO 2008/121992 및 WO 2011/044561에 개시되며, 이들은 참조에 의해 포함된다.
계산에서, Pij는 그의 동의 그룹(synonymous group)에서 NO(Pij)의 빈도로 발생하는 코돈 쌍이다. Ci 및 Cj 각각 그들의 동의 그룹에서 빈도 F(Ci) 및 F(Cj)로 발생하는, Pij를 포함하는 2개의 코돈이다. 보다 명시적으로, F(Ci)는 상응하는 아미노산 Xi가 모든 코딩 영역에 걸쳐 코돈 Ci에 의해 코딩되는 빈도이고 F(Ci)=NO(Cj)/NO(Xi)이며, 식 중에서, NO(Ci) 및 NO(Xi)는 각각 코돈 Ci 및 아미노산 Xi의 관찰 발생 횟수이다. 이에 따라 F(Cj)가 계산된다. 또한, NO(Xij)는 모든 코딩 영역에 걸친 아미노산 쌍 Xij의 발생 횟수이다. Pij의 코돈-쌍 편향 점수 S(Pij)는 Ne(Pij)의 예상 발생 횟수에 대한 관찰 빈도 No(Pij)의 로그-오즈비(log-odds ratio)로 계산되었다.
전술된 식을 사용하여, 전체 인간 CCDS 데이터 세트를 사용하여 계산된 상응하는 게놈 Ne(Pij) 값과 비교할 때 개별 코딩 서열의 개별 코돈 쌍이 과대표되는지 또는 저대표되는지 여부를 결정하였다. 이 계산은 인간 코딩 영역에서 과대표된 코돈 쌍에 대해 양의 S(Pij) 점수 값 및 저대표된 코돈 쌍에 대한 음성 값을 초래했다.
개별 코딩 서열의 "결합(combined)" 코돈-쌍 편향은 하기 식에 따라 모든 코돈 쌍 점수를 평균하여 계산되었다:
따라서 전체 코딩 영역의 코돈-쌍 편향은 영역을 구성하는 모든 개별 코돈 쌍 점수를 더하고, 이 합계를 코딩 서열의 길이로 나누는 것에 의해 계산된다.
코돈-쌍 편향의 계산, 코돈-쌍 편향을 변경하기 위한 알고리즘 구현.
코돈-쌍 편향을 정량화하기 위한 알고리즘이 개발되었다. 모든 가능한 개별 코돈 쌍에 "코돈 쌍 점수" 또는 "CPS"가 주어졌다. CPS는 모든 인간 코딩 영역에 대한 각 코돈 쌍의 예상 발생 횟수에 대한 관찰된 발생 횟수의 비율의 자연 로그로 정의되며, 여기서 인간은 재코딩될 해당 백신 바이러스(instant vaccine virus)의 숙주 종을 나타낸다.
특정 코돈 쌍의 관찰된 발생 횟수(occurrences)의 계산은 간단하지만(유전자 세트 내의 실제 카우트), 코돈 쌍의 예상된 발생 횟수는 추가 계산이 필요하다. 본 발명자들은 이 예상되는 횟수를 Gutman and Hatfield와 유사하게, 아미노산 빈도 및 코돈 편향 모두에 독립적이도록 계산한다. 즉, 예상 빈도는 아미노산이 특정 코돈에 의해 코딩되는 횟수의 상대적 비율에 근거하여 계산된다. CPS 값이 양수이면 인간 게놈에서 주어진 코돈 쌍이 통계적으로 과대표된다는 것을 의미하고, CPS가 음수이면 해당 쌍이 인간 게놈에서 통계적으로 저대표된다는 것을 나타낸다.
이러한 계산된 CPS를 사용하여, 모든 코딩 영역은 코돈 쌍 점수의 평균을 취하여 전체 유전자에 대한 코돈-쌍 편향 (CPB)을 제공함으로써 과대표된 또는 저대표된 코돈 쌍을 사용하는 것으로 평가될 수 있다.
표시되고 플롯팅된 식을 이용하여 모든 주석이 달린 인간 유전자에 대해 CPB가 계산되었다. 그래프의 각 포인트는 단일 인간 유전자의 CPB에 해당한다. 분포의 피크는 0.07의 양성 코돈-쌍 편향을 가지며, 이는 주석이 달린 모든 인간 유전자에 대한 평균 점수이다. 또한 음성 코돈-쌍 편향을 갖는 유전자는 거의 없다. 그 후, CPB를 정의하고 계산하기 위해 설정된 식을 이용하여 이 편향을 처리했다.
코돈-쌍 편향을 감소시키는 알고리즘.
단백질 코딩 서열의 재코딩은 예를 들어, 구배 하강법(gradient descent), 또는 모의 어닐링(simulated annealing) 또는 기타 최소화 루틴을 이용하여, 컴퓨터의 도움을 받거나 받지 않고 수행할 수 있다. 출발 서열에 있는 코돈을 재배열하는 절차의 예는 하기 단계들로 나타낼 수 있다:
1) 야생형 바이러스 게놈 서열을 수득하는 단계.
2) 약독화된 설계를 표적으로 하는 단백질 코딩 서열을 선택하는 단계.
3) 비-코딩(non-coding) 기능을 갖는, 공지된 또는 추측된 DNA 단편을 봉쇄시키는(lock down) 단계.
4) 재설계된 단백질의 나머지 아미노산에 대해 원하는 코돈 분포를 선택하는 단계.
5) 적어도 두 개의 동의 비봉쇄(unlocked) 코돈 위치의 랜덤 셔플(random shuffle)을 수행하고 코돈 쌍 점수를 계산하는 단계.
6) 선택적으로, 모의 어닐링 절차를 사용하여, 코돈 쌍 점수를 추가로 감소 (또는 증가)시키는 단계.
7) 결과적으로 수득된 설계를 과도한 2차 구조 및 원치 않는 제한 부위에 대해 검사하는 단계:
-예(Yes)인 경우 -> 단계 (5)로 이동하거나 문제 영역을 야생형 서열로 교체하여 설계를 수정하고 단계 (8)로 이동한다.
8) 바이러스 설계에 상응하는 DNA 서열을 합성하는 단계.
9) 바이러스 구조체(viral construct)를 제조하고, 바이러스 표현형을 평가하는 단계:
- 과도하게 약독화된 경우, 서브클론 구조체(subclone construct)를 제조하고, 9로 이동하고;
- 약독화가 충분하지 않은 경우, 2로 이동한다.
코돈-쌍 편향을 감소시키는 것에 의한 바이러스의 약독화가 WO 2008/121992 및 WO 2011/044561에 개시되어 있으며, 이들은 완전히 설명된 것처럼 참조에 의해 본원에 포함된다.
야생형 SARS-CoV-2 게놈 서열 (또는 COVID-19를 유발하는 야생형 서열의 돌연변이 형태)에 내재된(embedded) 전장 SARS-CoV-2 게놈 서열 또는 코돈 쌍 탈최적화된 서열을 수득하는 방법은 예를 들어, 감염성 cDNA 클론을 구축하거나, BAC 벡터를 이용하거나, 오버랩 신장(overlap extension) PCR 전략을 이용하거나, 긴 PCR 기반 융합 전략을 이용하는 것을 포함할 수 있다.
코딩된 폴리뉴클레오티드
본 발명의 다양한 구체예는 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편을 코딩하는 폴리뉴클레오티드로서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩되고, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 동일하게 유지되는 것인 폴리뉴클레오티드를 제공한다. 다양한 구체예에서, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 전에 동일하게 유지된다.
본 발명의 다양한 구체예는 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편을 코딩하는 폴리뉴클레오티드로서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩되고, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 최대 20개의 아미노산 치환, 첨가, 또는 결실을 포함하는 것인 폴리뉴클레오티드를 제공한다. 다양한 구체예에서, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 전에 최대 20개의 아미노산 치환, 첨가, 또는 결실을 포함한다.
본 발명의 다양한 구체예는 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편을 코딩하는 폴리뉴클레오티드로서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩되고, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 최대 10개의 아미노산 치환, 첨가, 또는 결실을 포함하는 것인 폴리뉴클레오티드를 제공한다. 다양한 구체예에서, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 전에 최대 10개의 아미노산 치환, 첨가, 또는 결실을 포함한다.
본 발명의 다양한 구체예는 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편을 코딩하는 폴리뉴클레오티드로서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩되고, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 최대 12개의 아미노산 치환, 첨가, 또는 결실을 포함하는 것인 폴리뉴클레오티드를 제공한다. 다양한 구체예에서, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 전에 최대 12개의 아미노산 치환, 첨가, 또는 결실을 포함한다.
다양한 구체예에서, 상기 아미노산 서열은 최대 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 아미노산 치환, 첨가, 또는 결실을 포함한다. 다양한 구체예에서, 상기 아미노산 서열은 1-5, 6-10, 11-15 또는 16-20개의 아미노산 치환, 첨가, 또는 결실을 포함한다. 다양한 구체예에서, 상기 아미노산 결실, 치환 또는 첨가는 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 앞의 핵산 결실(들), 치환(들) 또는 첨가(들)로부터 초래된다.
다양한 구체예에서, 상기 아미노산 서열은 12개의 아미노산 결실을 포함한다. 다양한 구체예에서, 상기 아미노산 서열은 1-5, 6-10, 11-15, 또는 16-20개의 아미노산 결실을 포함한다. 다양한 구체예에서, 상기 아미노산 치환, 첨가 또는 결실은 재코딩된 서열에서 하나 이상의 점 돌연변이로 인한 것일 수 있다. 다양한 구체예에서, 상기 아미노산 결실, 치환, 또는 첨가는 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 앞의 핵산 결실(들), 치환(들) 또는 첨가(들)로부터 초래된다.
따라서, (핵산 결실(들), 치환(들) 또는 첨가(들)를 포함하거나 포함하지 않는) 이러한 재코딩된 폴리뉴클레오티드에 대한 다양한 구체예에서, 재코딩된 폴리뉴클레오티드는 폴리A 테일에 대해 상이한 길이; 예를 들면, 3' 말단에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 49, 50, 51, 52, 53 또는 54개의 연속적인 아데닌; 또는 예를 들어, 3' 말단에 1-6, 7-12, 13-18, 19-24, 25-30, 31-36, 37-42, 43-48 또는 49-54개의 연속적인 아데닌; 또는 예를 들어, 3' 말단에 9-37, 12-34, 15-33, 18-30 또는 21-27개의 연속적인 아데닌; 또는 예를 들어, 3' 말단에 19-25개의 연속적인 아데닌을 가질 수 있다.
다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈-쌍 편향(CPB)을 감소시킴으로써 재코딩된다. 다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈 사용빈도 편향(codon usage bias)을 감소시킴으로써 재코딩된다. 다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 CpG 또는 UpA 디뉴클레오티드의 수를 증가시킴으로써 재코딩된다.
다양한 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편은 -0.05 미만, -0.1 미만, -0.2 미만, -0.3 미만, 또는 -0.4 미만의 코돈-쌍 편향을 갖는다.
특정 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편은 -0.05 미만, 또는 -0.06 미만, 또는 -0.07 미만, 또는 -0.08 미만, 또는 -0.09 미만, 또는 -0.1 미만, 또는 -0.11 미만, 또는 -0.12 미만, 또는 -0.13 미만, 또는 -0.14 미만, 또는 -0.15 미만, 또는 -0.16 미만, 또는 -0.17 미만, 또는 -0.18 미만, 또는 -0.19 미만, 또는 -0.2 미만, 또는 -0.25 미만, 또는 -0.3 미만, 또는 -0.35 미만, 또는 -0.4 미만, 또는 -0.45 미만, 또는 -0.5 미만의 코돈-쌍 편향을 갖는다.
특정 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편은 모 서열 상의 상응하는 서열과 비교하여 적어도 0.05, 또는 적어도 0.06, 또는 적어도 0.07, 또는 적어도 0.08, 또는 적어도 0.09, 또는 적어도 0.1, 또는 적어도 0.11, 또는 적어도 0.12, 또는 적어도 0.13, 또는 적어도 0.14, 또는 적어도 0.15, 또는 적어도 0.16, 또는 적어도 0.17, 또는 적어도 0.18, 또는 적어도 0.19, 또는 적어도 0.2, 또는 적어도 0.25, 또는 적어도 0.3, 또는 적어도 0.35, 또는 적어도 0.4, 또는 적어도 0.45, 또는 적어도 0.5 감소된다. 특정 구체예에서, 이는 계산이 이루어질 모 서열의 상응하는 서열, 예를 들면, 변이체 바이러스의 상응하는 서열과의 비교이다.
다양한 구체예에서, 모 SARS-CoV-2 코로나바이러스는 SARS-CoV-2 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 영국(U.K.) 변이체이다. 일부 구체예에서, SARS-CoV-2 변이체는 남아프리카 변이체이다. 일부 구체예에서, SARS-CoV-2 변이체는 브라질 변이체이다. 일부 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 일부 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 일부 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계열(sub-lineage) BA.1, BA.1.1, BA.2, BA.3, BA.4 또는 BA.5이다. 일부 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계열 BA.4이다. 일부 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계열 BA.5이다.
영국 변이체의 예는 2021년 1월 19일자 GenBank 수탁 번호 MW462650(SARS-CoV-2/human/USA/MN-MDH-2252/2020), MW463056(SARS-CoV-2/human/USA/FL-BPHL-2270/2020) 및 MW440433(SARS-CoV-2/human/USA/NY-Wadsworth- 291673-01/2020)을 포함하나, 이에 한정되지 않고, 이들은 모두 그 전체가 설명된 것처럼 본원에 참조에 의해 포함된다. 영국 변이체의 추가 예는 GISAID ID 번호 EPI_ISL_778842(hCoV-19/USA/TX-CDC-9KXP-8438/2020; 2020-12-28), EPI_ISL_802609(hCoV-19/USA/CA-CDC-STM-050/2020; 2020-12-28), EPI_ISL_802647 (hCoV-19/미국/FL-CDC-STM-043/2020; 2020-12-26), EPI_ISL_832014(hCoV-19/USA/UT-UPHL-2101178518/2020; 2020-12-31), EPI_ISL_850618(hCoV-19/USA/IN-CDC-STM-183/2020; 2020-12-31) 및 EPI_ISL_850960(hCoV-19/미국/FL-CDC-STM-A100002/2021; 2021-01-04)을 포함하나, 이에 한정되지 않고, 이들은 모두 2021년 1월 20일자 기준이고, 모두 그 전체가 설명된 것처럼 본원에 참조에 의해 포함된다. 영국 변이체의 추가 예는 GISAID ID 번호, 2021년 1월 20일 기준인 EPI_ISL_778842(hCoV-19/USA/TX-CDC-9KXP-8438/2020; 2020-12-28), EPI_ISL_802609(hCoV-19/USA/CA-CDC-STM-050/2020; 2020-12-28), EPI_ISL_802647 (hCoV-19/USA/FL-CDC-STM-043/2020; 2020-12-26), EPI_ISL_832014 (hCoV-19/USA/UT-UPHL-2101178518/2020; 2020-12-31), EPI_ISL_850618(hCoV-19/USA/IN-CDC-STM-183/2020; 2020-12-31) 및 EPI_ISL_850960(hCoV-19/USA/FL-CDC-STM-A100002/2021), 2021-01-04), 및 2021년 6월 28일 기준인 EPI_ISL_581117, EPI_ISL_596982, EPI_ISL_599956, EPI_ISL_600093, EPI_ISL_606375, EPI_ISL_606415, EPI_ISL_606424, EPI_ISL_608363 및 EPI_ISL_608430을 포함하나, 이에 한정되지 않고, 모두 그 전체가 설명된 것처럼 본원에 참조에 의해 포함된다.
남아프리카 변이체의 예는 GISAID ID 번호 EPI_ISL_766709(hCoV-19/Sweden/20-13194/2020; 2020-12-24), EPI_ISL_768828(hCoV-19/France/PAC-NRC2933/2020; 2020-12-22), EPI_ISL_770441(hCoV-19/Englan/205280030/2020; 2020-12-24) 및 EPI_ISL_819798(hCoV-19/England/OXON-F440A7/2020; 2020-12-18)를 포함하나, 이에 한정되지 않고, 모두 2021년 1월 20일 기준이며, 모두 그 전체가 설명된 것처럼 본원에 참조에 의해 포함된다. 추가의 예는 모두 2021년 6월 28일 기준인 hCoV-19/Sweden/20-13194/2020 (EPI_ISL_766709), hCoV-19/England/205280030/2020 (EPI_ISL_770441), hCoV-19/France/PAC- NRC2933/2020 (EPI_ISL_768828), hCoV-19/South Korea/KDCA0463/2020 (EPI_ISL_762992), hCoV-19/Japan/IC-0433/2020 (EPI_ISL_768642), hCoV-19/Australia/NSW3876/2021 (EPI_ISL_775242), hCoV-19/Australia/NSW3872/2021 (EPI_ISL_775245), hCoV-19/France/PAC-NRC2929/2020 (EPI_ISL_768827), hCoV-19/England/205300109/2020 (EPI_ISL_770467), hCoV-19/England/205320747/2020 (EPI_ISL_770469), hCoV-19/England/205261884/2020 (EPI_ISL_770438), hCoV-19/England/205260233/2020 (EPI_ISL_770437), hCoV-19/England/ALDP-C8FEC7/2020 (EPI_ISL_777292), hCoV-19/England/205221138/2020 (EPI_ISL_766245), hCoV-19/England/205300065/2020 (EPI_ISL_770463), hCoV-19/Botswana/1217-IN1699/2020 (EPI_ISL_770472), hCoV-19/Botswana/1217-IN1660/2020 (EPI_ISL_770471), hCoV-19/England/ALDP-C8E7FA/2020 (EPI_ISL_777266), hCoV-19/England/MILK-C90388/2020 (EPI_ISL_777229), hCoV-19/Botswana/CV1615722/2020 (EPI_ISL_770474), hCoV-19/Botswana/CV1605828/2020 (EPI_ISL_770473), hCoV-19/Scotland/EDB11343/2020 (EPI_ISL_764279), hCoV-19/Scotland/EDB11342/2020 (EPI_ISL_764278), hCoV-19/England/ALDP-C690AF/2020 (EPI_ISL_777190), hCoV-19/Botswana/1223-IN1490/2020 (EPI_ISL_770475), hCoV-19/England/MILK-CA9C09/2020 (EPI_ISL_762362), hCoV-19/England/ALDP-CB4807/2020 (EPI_ISL_761052), hCoV-19/England/205300064/2020 (EPI_ISL_770462), hCoV-19/England/MILK-CA9BB1/2020 (EPI_ISL_762499), hCoV-19/England/MILK-CAE2B7/2020 (EPI_ISL_761059), hCoV-19/England/205390867/2021 (EPI_ISL_768815), hCoV-19/Botswana/1224-IN462/2020| (EPI_ISL_770470), hCoV-19/England/205280028/2020(EPI_ISL_770439), 및 hCoV-19/England/205280029/2020 (EPI_ISL_770440)을 포함하나, 이에 한정되지 않고, 모두 그 전체가 설명된 것처럼 본원에 참조에 의해 포함된다.
브라질 변이체의 예는 모두 2021년 1월 20일 기준인 GISAID ID 번호 EPI_ISL_677212(hCoV-19/USA/VA-DCLS-2187/2020; 2020-11-12), EPI_ISL_723494(hCoV-19/USA/VA-DCLS-2191/2020; 2020-11-12), EPI_ISL_845768(hCoV- 19/USA/GA-EHC-458R/2021; 2021-01-05), EPI_ISL_848196(hCoV-19/Canada/LTRI-1192/2020; 2020-12-24) 및 EPI_ISL_848197(hCoV-19/Canada/LTRI-1258/2020; 2020-12-24)를 포함하나, 이에 한정되지 않고, 모두 그 전체가 설명된 것처럼 본원에 참조에 의해 포함된다.
델타(B1.617.2) 변이체의 예는 모두 2021년 6월 28일 기준인 GISAID ID 번호 EPI_ISL_1653403, EPI_ISL_1697977, EPI_ISL_1718959, EPI_ISL_1719027, EPI_ISL_2121225, EPI_ISL_2121637, EPI_ISL_2121989, EPI_ISL_2122659, EPI_ISL_212546 3, EPI_ISL_2126212, EPI_ISL_2126374, EPI_ISL_2127610, EPI_ISL_2127624, EPI_ISL_2127831 및 EPI_ISL_2131345를 포함하나, 이에 한정되지 않다.
다양한 구체예에서, 모 SARS-CoV-2 변이체는 이전에 변형된 바이러스 핵산이거나 이전에 약독화된 바이러스 핵산이다.
다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 CPB 탈최적화된다. 다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈 사용빈도 최적화된다.
다양한 구체예에서, 탈최적화된 CPB는 인간의 CPB를 기반으로 한다. 다양한 구체예에서, 탈최적화된 CPB는 코로나바이러스의 CPB를 기반으로 한다. 다양한 구체예에서, 탈최적화된 CPB는 SARS-CoV-2 코로나바이러스의 CPB를 기반으로 한다. 다양한 구체예에서, 탈최적화된 CPB는 야생형 SARS-CoV-2 코로나바이러스의 CPB를 기반으로 한다. 야생형 SARS-CoV-2 코로나바이러스는 본원에서 논의된 다양한 구체예에 따른 SARS-CoV-2 변이체 코로나바이러스일 수 있다.
다양한 구체예에서, 탈최적화된 코돈 사용 빈도는 인간에서 빈번하게 사용되는 코돈에 기초한다. 다양한 구체예에서, 탈최적화된 코돈 사용빈도는 코로나바이러스에서 빈번하게 사용되는 코돈을 기반으로 한다. 다양한 구체예에서, 역최적화된 코돈 사용빈도는 빈번하게 사용되는 코돈 또는 SARS-CoV-2 코로나바이러스를 기반으로 한다. 다양한 구체예에서, 역최적화된 코돈 사용빈도는 야생형 SARS-CoV-2 코로나바이러스에서 빈번하게 사용되는 코돈 또는 CPB를 기반으로 한다. 야생형 SARS-CoV-2 코로나바이러스는 본 문서에 논의된 다양한 실시예에 따른 SARS-CoV-2 변이체 코로나바이러스일 수 있다.
다양한 구체예에서, 폴리뉴클레오티드는 재코딩된 스파이크 단백질, 스파이크 단백질의 단편, 및 이들의 조합을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 스파이크 단백질에서 푸린 절단 부위를 제거하는 아미노산의 결실을 초래하는 뉴클레오티드의 결실을 포함한다. 특정 이론에 얽매이고 싶지는 않지만, 본 발명자들은 푸린 절단 부위를 제거하는 것이 백신 및/또는 면역 조성물의 안전성의 동인(driver) 중 하나라고 믿는다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경되며, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 하나 이상의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 2개 이상의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 5개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 10개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 20개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 30개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 40개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 50개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 60개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 70개의 돌연변이가 존재한다. 다양한 구체예에서, 서열번호 1의 돌연변이는 알파 변이체, 베타 변이체, 델타 변이체, 감마 변이체 또는 오미크론 변이체가 아니다.
서열번호 1은 야생형 WA-1 서열(완전히 설명된 것처럼 본원에 참조로 포함된 GenBank: MN985325.1)과 비교하여 탈최적화된 서열이다.
다양한 구체예에서, SARS-CoV-2 변이체는 알파 변이체이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 감마 변이체이다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하며, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
전장 재코딩된 서열(full length recoded sequence)
다양한 구체예에서, 폴리뉴클레오티드는 천연 분리주로부터의 SARS-CoV-2 변이체 서열을 포함하며, 상기 SARS-CoV-2 변이체 서열 중 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다. 다양한 구체예에서, SARS-CoV-2 변이체는 알파 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 감마 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.1, BA.1.1, BA.2, BA.3, BA.4 또는 BA.5이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.4 또는 BA.5이다. 이들 변이체의 예시적인 서열은 본원에 제공된 바와 같다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 폴리뉴클레오티드는 3' 말단에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 49, 50, 51, 52, 53 또는 54개의 연속적인 아데닌이 존재한다.
벡터, 세포, 폴리펩티드
다양한 구체예는 본 발명의 폴리뉴클레오티드를 포함하는 벡터를 제공한다. 본 발명의 폴리뉴클레오티드는 본원에서 논의된 바와 같은 재코딩된 폴리펩티드이다.
다양한 구체예는 본 발명의 폴리뉴클레오티드를 포함하는 벡터를 포함하는 세포를 제공한다. 본 발명의 폴리뉴클레오티드를 포함하는 벡터는 본원에서 논의된 것들이다.
다양한 구체예는 본 발명의 폴리뉴클레오티드를 포함하는 박테리아 인공 염색체(bacterial artificial chromosome: BAC)를 제공한다. 본 발명의 폴리뉴클레오티드는 본원에 논의된 바와 같이 재코딩된 폴리펩티드이다.
다양한 구체예는 본 발명의 폴리뉴클레오티드를 포함하는 세포를 제공한다. 다양한 구체예는 본 발명의 변형된/탈최적화된 감염성 SARS-CoV-2 변이체 RNA를 포함하는 세포를 제공한다.
다양한 구체예에서, 세포는 Vero 세포, HeLa 세포, BHK(baby hamster kidney) 세포, MA104 세포, 293T 세포, BSR-T7 세포, MRC-5 세포, CHO 세포, 또는 PER.C6 세포이다. 특정 구체예에서, 세포는 Vero 세포 또는 BHK 세포이다.
다양한 구체예는 본 발명의 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 제공한다. 본 발명의 폴리뉴클레오티드는 본원에서 논의된 바와 같은 재코딩된 폴리펩티드이다. 이 폴리펩티드는 천연 분리주로부터의 SARS-CoV-2 변이체에 의해 코딩된 폴리펩티드와 다른 특성을 나타낸다. 예를 들어, 본원에 논의된 바와 같이 재코딩된 폴리뉴클레오티드 및 탈최적화된 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 바이러스에 대해 약독화 특성을 발휘할 수 있다.
변형된 바이러스
본 발명의 다양한 구체예는 본 발명의 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드를 포함하는 변형된 SARS-CoV-2 변이체를 제공한다. 본 발명의 폴리뉴클레오티드는 본원에 논의된 바와 같은 재코딩된 폴리펩티드이다.
본 발명의 다양한 구체예는 본 발명의 폴리뉴클레오티드를 포함하는 변형된 SARS-CoV-2 변이체를 제공한다. 본 발명의 폴리뉴클레오티드는 본원에서 논의된 재코딩된 폴리펩티드 중 어느 하나이다.
다양한 구체예에서, 하나 이상의 바이러스 단백질의 발현은 모 SARS-CoV-2 변이체에 비해 감소된다.
다양한 구체예에서, 모 SARS-CoV-2 코로나바이러스는 SARS-CoV-2 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 영국 변이체, 남아프리카 변이체, 브라질 변이체, 델타 변이체, 또는 오미크론 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.1, BA.1.1, BA.2, BA.3, BA.4 또는 BA.5이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.4 또는 BA.5이다.
영국 변이체, 남아프리카 변이체, 브라질 변이체, 델타 변이체, 및 오미크론 변이체의 예는 본원에서 논의된 것들을 포함하나, 이에 한정되지 않다.
다양한 구체예에서, 모 SARS-CoV-2 변이체는 이전에 변형된 바이러스 핵산이거나 이전에 약독화된 바이러스 핵산이다.
다양한 구체예에서, 바이러스 단백질 중 하나 이상의 발현 감소는 스파이크 단백질의 재코딩 결과로서 감소된다.
다양한 구체예에서, 폴리뉴클레오티드는 모 SARS-CoV-2 변이체의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편을 코딩하고, 상기 폴리뉴클레오티드는 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩되고, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 동일하게 유지된다.
다양한 구체예에서, 폴리뉴클레오티드는 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편을 코딩하고, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩되고, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 최대 15개의 아미노산 치환, 첨가 또는 결실을 포함한다. 다양한 구체예에서, 아미노산 서열은 최대 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개의 아미노산 치환, 첨가 또는 삭제를 포함한다. 다양한 구체예에서, 아미노산 서열은 12개의 아미노산 결실을 포함한다. 다양한 구체예에서, 아미노산 서열은 1-3, 4-6, 7-9, 10-12 또는 13-15개의 아미노산 결실을 포함한다. 아미노산 치환, 첨가 또는 결실은 재코딩된 서열의 하나 이상의 점 돌연변이로 인한 것일 수 있다. 다양한 구체예에서, 아미노산 결실, 치환 또는 첨가는 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 전 핵산 결실, 치환 또는 첨가로부터 초래된다.
다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈-쌍 편향(CPB)을 감소시키거나 코돈 사용빈도 편향(codon usage bias)을 감소시킴으로써 재코딩된다.
다양한 구체예에서, 폴리뉴클레오티드는 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 CpG 또는 UpA 디뉴클레오티드의 수를 증가시킴으로써 재코딩된다.
다양한 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편 각각은 -0.05 미만, -0.1 미만, -0.2 미만, -0.3 미만, 또는 -0.4 미만의 코돈-쌍 편향을 갖는다.
다양한 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편 각각은 -0.01 미만, -0.02 미만, -0.03 미만, 또는 -0.04 미만의 코돈-쌍 편향을 갖는다. 다양한 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편 각각은 -0.05 미만, 또는 -0.06 미만, 또는 -0.07 미만, 또는 -0.08 미만, 또는 -0.09 미만, 또는 -0.1 미만, 또는 -0.11 미만, 또는 -0.12 미만, 또는 -0.13 미만, 또는 -0.14 미만, 또는 -0.15 미만, 또는 -0.16 미만, 또는 -0.17 미만, 또는 -0.18 미만, 또는 -0.19 미만, 또는 -0.2 미만, 또는 -0.25 미만, 또는 -0.3 미만, 또는 -0.35 미만, 또는 -0.4 미만, 또는 -0.45 미만, 또는 -0.5 미만의 코돈-쌍 편향을 갖는다.
다양한 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편 각각의 코돈-쌍 편향은 적어도 0.01, 또는 적어도 0.02, 또는 적어도 0.03, 또는 적어도 0.04만큼 감소된다. 다양한 구체예에서, 코딩된 스파이크 단백질 또는 그의 단편 각각의 코돈-쌍 편향은 스파이크 단백질 또는 그의 단편을 코딩하는 상응하는 핵산과 비교하여, 적어도 0.05, 또는 적어도 0.06, 또는 적어도 0.07, 또는 적어도 0.08, 또는 적어도 0.09, 또는 적어도 0.1, 또는 적어도 0.11, 또는 적어도 0.12, 또는 적어도 0.13, 또는 적어도 0.14, 또는 적어도 0.15, 또는 적어도 0.16, 또는 적어도 0.17, 또는 적어도 0.18, 또는 적어도 0.19, 또는 적어도 0.2, 또는 적어도 0.25, 또는 적어도 0.3, 또는 적어도 0.35, 또는 적어도 0.4, 또는 적어도 0.45, 또는 적어도 0.5 만큼 감소된다. 특정 구체예에서, 이는 계산이 이루어질 상응하는 서열, 예를 들면, SARS-CoV-2 변이체의 스파이크 코딩 핵산의 상응하는 서열과 비교된다.
다양한 구체예에서, 모 SARS-CoV-2 코로나바이러스는 SARS-CoV-2 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 영국 변이체, 남아프리카 변이체, 브라질 변이체, 델타 변이체, 또는 오미크론 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.1, BA.1.1, BA.2, BA.3, BA.4 또는 BA.5이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.4 또는 BA.5이다.
영국 변이체, 남아프리카 변이체, 브라질 변이체, 델타 변이체, 및 오미크론 변이체의 예는 본원에서 논의된 것들을 포함하나, 이에 한정되지 않다.
다양한 구체예에서, 모 SARS-CoV-2 변이체는 이전에 변형된 바이러스 핵산이거나 이전에 약독화된 바이러스 핵산이다.
다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 CPB 탈최적화된다. 다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈 탈최적화된다.
다양한 구체예에서, 탈최적화된 CPB는 인간의 CPB를 기반으로 한다. 다양한 구체예에서, 탈최적화된 CPB는 코로나바이러스의 CPB를 기반으로 한다. 다양한 구체예에서, 탈최적화된 CPB는 SARS-CoV-2 코로나바이러스의 CPB를 기반으로 한다. 다양한 구체예에서, 탈최적화된 CPB는 야생형 SARS-CoV-2 코로나바이러스의 CPB를 기반으로 한다. 야생형 SARS-CoV-2 코로나바이러스는 본원에서 논의된 다양한 구체예에 따른 SARS-CoV-2 변이체 코로나바이러스일 수 있다.
다양한 구체예에서, 탈최적화된 코돈 사용빈도는 인간에서 빈번하게 사용되는 코돈에 기초한다. 다양한 구체예에서, 탈최적화된 코돈 사용빈도는 코로나바이러스에서 빈번하게 사용되는 코돈을 기반으로 한다. 다양한 구체예에서, 탈최적화된 코돈 사용빈도는 SARS-CoV-2 코로나바이러스에서 빈번하게 사용되는 코돈을 기반으로 한다. 다양한 구체예에서, 탈최적화된 코돈 사용빈도는 야생형 SARS-CoV-2 코로나바이러스에서 빈번하게 사용되는 코돈을 기반으로 한다. 일부 구체예에서, 야생형 SARS-CoV-2 코로나바이러스는 본원에서 논의된 다양한 구체예에 따른 SARS-CoV-2 변이체 코로나바이러스일 수 있다.
다양한 구체예에서, 폴리뉴클레오티드는 스파이크 단백질 또는 그의 단편을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 스파이크 단백질에서 푸린 절단 부위를 제거하는 아미노산의 결실을 초래하는 뉴클레오티드의 결실을 포함한다. 특정 이론에 얽매이기를 원치 않으나, 본 발명자들은 푸린 절단 부위를 제거하는 것이 백신 및/또는 면역 조성물의 안전성의 동인 중 하나가 될 것이라고 믿는다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하며, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다.
다양한 구체예에서, 폴리뉴클레오티드는 nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 하나 이상의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 2개 이상의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 5개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 10개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 20개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 30개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 40개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 50개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 60개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 70개의 돌연변이가 존재한다. 다양한 구체예에서, 서열번호 1의 돌연변이는 알파 변이체, 베타 변이체, 델타 변이체, 감마 변이체 또는 오미크론 변이체가 아니다.
다양한 구체예에서, SARS-CoV-2 변이체는 알파 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 감마 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.1, BA.1.1, BA.2, BA.3, BA.4 또는 BA.5이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.4 또는 BA.5이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 천연 분리주로부터의 SARS-CoV-2 변이체 서열을 포함하고, 상기 SARS-CoV-2 변이체 서열에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다. 다양한 구체예에서, SARS-CoV-2 변이체는 알파 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 감마 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통이다. 이들 변이체의 예시적인 서열은 본원에 제공된 바와 같다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 폴리뉴클레오티드는 3' 말단에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 49, 50, 51, 52, 53 또는 54개의 연속적인 아데닌을 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 2(재코딩된 스파이크 단백질)를 코딩한다. 다양한 구체예에서, 폴리뉴클레오티드는 최대 10개의 돌연변이를 갖는, 서열번호 2(재코딩된 스파이크 단백질)를 인코딩한다.
다양한 구체예에서, 이들 변형된 변이체에 대한 최대 10개의 돌연변이를 갖는 재코딩된 스파이크 단백질 코딩 서열은 서열번호 1의 스파이크 코딩 서열이 아니다. 다양한 구체예에서, 이들 변형된 변이체에 대한 최대 10개의 돌연변이를 갖는 재코딩된 스파이크 단백질 코딩 서열은 nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1의 스파이크 코딩 서열이 아니다.
면역 및/또는 백신 조성물
다양한 구체예는 본 발명의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 면역 조성물을 제공한다. 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12에 최대 20개의 돌연변이가 있는, 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 본 발명의 변형된 SARS-CoV-2 변이체는 생-약독화 바이러스(live-attenuated virus)이다.
다양한 구체예는 본 발명의 2개 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 보호 면역 반응을 유도하기 위한 다가 면역 조성물을 제공한다.
다양한 구체예는 원래의(original) SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 보호 면역 반응을 유도하기 위한 다가 면역 조성물을 제공한다. 즉, 원래의 SARS-CoV-2 코로나바이러스에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주(Washington Isolate)에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
일부 구체예에서 면역 조성물은 본원에 기술된 바와 같은 허용되는 부형제 또는 담체를 추가로 포함한다. 일부 구체예에서, 면역 조성물은 본원에 기술된 안정화제를 추가로 포함한다. 일부 구체예에서, 면역 조성물은 본원에 기술된 바와 같은 보조제(adjuvant)를 추가로 포함한다. 일부 구체예에서, 면역 조성물은 수크로오스, 글리신 또는 둘 다를 추가로 포함한다. 다양한 구체예에서, 면역 조성물은 수크로오스(약 5%) 및 글리신(약 5%)을 추가로 포함한다. 다양한 구체예에서, 허용되는 담체 또는 부형제는 당, 아미노산, 계면활성제 및 이들의 조합으로 이루어진 군으로부터 선택된다. 다양한 구체예에서, 아미노산은 약 5% w/v의 농도로 존재한다. 적합한 아미노산의 비한정적 예는 아르기닌 및 히스티딘을 포함한다. 적합한 담체의 비한정적 예는 젤라틴 및 인간 혈청 알부민을 포함한다. 적합한 계면활성제의 비한정적 예는 0.01-0.05%의 매우 낮은 농도의 폴리소르베이트 80과 같은 비이온성 계면활성제를 포함한다.
다양한 구체예에서, 면역 조성물은 약 103-107 PFU의 투여량(dosage)으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 104-106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 103 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 104 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 105 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 108 PFU의 투여량으로 제공된다.
다양한 구체예에서, 면역 조성물은 약 5x103 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x104 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x105 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x108 PFU의 투여량으로 제공된다.
다양한 구체예는 본 발명의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 백신 조성물을 제공한다. 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 본 발명의 변형된 SARS-CoV-2 변이체는 생-약독화 바이러스이다.
다양한 구체예는 본 발명의 2개 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 다가 백신 조성물을 제공한다.
다양한 구체예는 원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 보호 면역 반응을 유도하기 위한 다가 면역 조성물을 제공한다. 즉, 원래의 SARS-CoV-2 코로나바이러스에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
일부 구체예에서 면역 조성물은 본원에 기술된 바와 같은 허용되는 부형제 또는 담체를 추가로 포함한다. 일부 구체예에서, 면역 조성물은 본원에 기술된 안정화제를 추가로 포함한다. 일부 구체예에서, 면역 조성물은 본원에 기술된 바와 같은 보조제를 추가로 포함한다. 일부 구체예에서, 면역 조성물은 수크로오스, 글리신 또는 둘 다를 추가로 포함한다. 다양한 구체예에서, 면역 조성물은 수크로오스(5%) 및 글리신(5%)을 추가로 포함한다. 다양한 구체예에서, 허용되는 담체 또는 부형제는 당, 아미노산, 계면활성제 및 이들의 조합으로 이루어진 군으로부터 선택된다. 다양한 구체예에서, 아미노산은 약 5% w/v의 농도로 존재한다. 적합한 아미노산의 비한정적 예는 아르기닌 및 히스티딘을 포함한다. 적합한 담체의 비한정적 예는 젤라틴 및 인간 혈청 알부민을 포함한다. 적합한 계면활성제의 비한정적 예는 0.01-0.05%의 매우 낮은 농도의 폴리소르베이트 80과 같은 비이온성 계면활성제를 포함한다.
다양한 구체예에서, 백신 조성물은 약 103-107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 104-106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 103 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 104 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 105 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 108 PFU의 투여량으로 제공된다.
다양한 구체예에서, 면역 조성물은 약 5x103 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x104 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 5x105 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x108 PFU의 투여량으로 제공된다.
다양한 구체예는 본 발명의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 백신 조성물을 제공한다. 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 본 발명의 변형된 SARS-CoV-2 변이체는 생-약독화 바이러스이다.
다양한 구체예는 본 발명의 2개 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 다가 백신 조성물을 제공한다.
다양한 구체예는 원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 보호 면역 반응을 유도하기 위한 다가 면역 조성물을 제공한다. 즉, 원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 상기 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
일부 구체예에서, 백신 조성물은 본원에 기술된 바와 같은 허용되는 부형제 또는 담체를 추가로 포함한다. 일부 구체예에서, 백신 조성물은 본원에 기술된 안정화제를 추가로 포함한다. 일부 구체예에서, 백신 조성물은 본원에 기술된 바와 같은 보조제를 추가로 포함한다. 일부 구체예에서, 백신 조성물은 수크로오스, 글리신 또는 둘 다를 추가로 포함한다. 다양한 구체예에서, 백신 조성물은 수크로오스(5%) 및 글리신(5%)을 추가로 포함한다. 다양한 구체예에서, 허용되는 담체 또는 부형제는 당, 아미노산, 계면활성제 및 이들의 조합으로 이루어진 군으로부터 선택된다. 다양한 구체예에서, 아미노산은 약 5% w/v의 농도로 존재한다. 적합한 아미노산의 비한정적 예는 아르기닌 및 히스티딘을 포함한다. 적합한 담체의 비한정적 예는 젤라틴 및 인간 혈청 알부민을 포함한다. 적합한 계면활성제의 비한정적 예는 0.01-0.05%의 매우 낮은 농도의 폴리소르베이트 80과 같은 비이온성 계면활성제를 포함한다.
다양한 구체예에서, 백신 조성물은 약 103-107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 104-106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 103 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 104 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 105 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 108 PFU의 투여량으로 제공된다.
다양한 구체예에서, 면역 조성물은 약 5x103 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x104 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 5x105 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x108 PFU의 투여량으로 제공된다.
대상체에서 면역 반응(또는 보호 면역 반응)을 유도하거나 대상체가 바이러스-관련 질병에 걸리는 것을 예방하거나, 또는 그 가능성을 감소시키기 위해 사용되는 경우, 본 발명의 약독화 바이러스는 약학적으로 허용되는 담체 또는 부형제를 추가로 포함하는 조성물의 형태로 대상체에게 투여될 수 있는 것으로 이해되어야 한다. 약학적으로 허용되는 담체 및 부형제는 당업자에게 공지되어 있으며, 0.01-0.1M, 바람직하게는 0.05M 인산염 완충액, 인산염 완충 식염수(PBS), DMEM, L-15, PBS 중 10-25% 수크로오스 용액, DMEM 중 10-25% 수크로오스 용액 또는 0.9% 식염수(saline)을 포함하나, 이에 한정되지 않는다. 이러한 담체는 또한 수성 또는 비수성 용액, 현탁액 및 에멀전을 포함한다. 수성 담체는 물, 알코올성/수성 용액, 에멀전 또는 현탁액, 식염수 및 완충된 매질(buffered media)을 포함한다. 비-수성 용매의 예로는 프로필렌 글리콜, 폴리에틸렌 글리콜, 올리브유와 같은 식물성 오일, 및 에틸 올레에이트(ethyl oleate)와 같은 주사 가능한 유기 에스테르가 있다. 비경구 비히클에는 염화나트륨 용액, 링거 덱스트로오스(Ringer's dextrose), 덱스트로오스 및 염화나트륨, 젖산 링거(lactated Ringer's) 및 고정 오일이 포함된다. 정맥 비히클에는 체액 및 영양 보충제(fluid and nutrient replenisher), 전해질 보충제, 예를 들면, 링거 덱스트로오스에 기반한 보충제 등이 포함된다. 고체 조성물은 예를 들어 글루코오스, 수크로오스, 만니톨, 소르비톨, 락토스, 전분, 스테아르산 마그네슘, 셀룰로오스 또는 셀룰로오스 유도체, 탄산나트륨, 젤라틴, 재조합 인간 혈청 알부민, 인간 혈청 알부민 및/또는 탄산마그네슘과 같은 무독성 고체 담체를 포함할 수 있다. 폐 및/또는 비강내 전달과 같은 에어로졸 투여를 위해, 작용제(agent) 또는 조성물은 바람직하게는 무독성 계면활성제, 예를 들어 C6 내지 C22 지방산의 에스테르 또는 부분 에스테르 또는 천연 글리세리드, 및 추진제와 함께 제제화된다. 비강내 전달을 촉진하기 위해 레시틴과 같은 추가 담체가 포함될 수 있다. 약학적으로 허용되는 담체 또는 부형제는 소량의 보조 물질, 예를 들면, 습윤제 또는 유화제, 보존제 및 기타 첨가제, 예를 들면, 항미생물제, 항산화제 및 킬레이트제를 추가로 포함할 수 있고, 이들은 유효 기간 및/또는 활성 성분의 효과를 증진시킨다. 본 발명의 조성물은 당업계에 널리 공지된 바와 같이, 대상체에게 투여한 후 활성 성분의 신속, 지속 또는 지연 방출을 제공하도록 제형화될 수 있다.
다양한 구체예에서, 백신 조성물 또는 면역 조성물은 정맥내, 또는 척수강내, 피하, 근육내, 피내 또는 비강내 전달을 위해 제형화된다. 다양한 구체예에서, 백신 조성물 또는 면역 조성물은 비강내 전달을 위해 제형화된다. 다양한 구체예에서, 백신 조성물 또는 면역 조성물은 점비제(nasal drop) 또는 비강 스프레이(nasal spray)를 통해 전달되도록 제형화된다.
본 발명의 조성물을 사용하는 방법.
본 발명의 면역 조성물의 용량(dose)을 대상체에게 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 면역 조성물은 본원에서 논의된 면역 조성물 중 하나이다. 다양한 구체예에서, 상기 용량은 예방적 유효량 또는 치료적 유효량이다.
본 발명의 다가 면역 조성물의 용량을 대상체에게 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다가 면역 조성물은 본원에서 논의된 면역 조성물 중 하나이다. 다양한 구체예에서, 상기 용량은 예방적 유효량 또는 치료적 유효량이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하며, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 다가 면역 조성물은 원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함한다. 즉, 원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
다양한 구체예에서, 면역 조성물은 정맥내, 척수강내, 피하, 근육내, 피내 또는 비강내로 투여된다. 다양한 구체예에서, 면역 조성물은 비강내로 투여된다. 다양한 구체예에서, 면역 조성물은 점비액 또는 점비 스프레이를 통해 투여된다.
다양한 구체예는 대상체에게 본 발명의 백신 조성물의 용량을 투여하는 것을 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 백신 조성물은 본원에 논의된 백신 조성물 중 어느 하나이다.
다양한 구체예는 대상체에게 본 발명의 다가 백신 조성물의 용량을 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다가 백신 조성물은 본원에 논의된 백신 조성물 중 어느 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 다가 백신 조성물은 원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함한다. 즉, 원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 상기 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
다양한 구체예에서, 면역 반응은 보호 면역 반응이다. 다양한 구체예에서, 상기 용량은 예방적 유효량 또는 치료적 유효량이다.
다양한 구체예에서, 백신 조성물은 정맥내, 척수강내, 피하, 근육내, 피내 또는 비강내로 투여된다. 다양한 구체예에서, 백신 조성물은 비강내로 투여된다. 다양한 실시 형태에서, 백신 조성물은 점비제 또는 점비 스프레이를 통해 투여된다.
다양한 구체예는 대상체에게 본 발명의 변형된 SARS-CoV-2 변이체의 용량을 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하며, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 면역 반응은 보호 면역 반응이다. 다양한 구체예에서, 용량은 예방적 유효량 또는 치료적 유효량이다.
다양한 구체예에서, 상기 용량은 약 103-107 PFU이다. 다양한 구체예에서, 상기 용량은 약 104-106 PFU이다. 다양한 구체예에서, 상기 용량은 약 103 PFU이다. 다양한 구체예에서, 상기 용량은 약 104 PFU이다. 다양한 구체예에서, 상기 용량은 약 105 PFU이다. 다양한 구체예에서, 상기 용량은 약 106 PFU이다. 다양한 구체예에서, 상기 용량은 약 107 PFU이다. 다양한 구체예에서, 상기 용량은 약 108 PFU이다.
다양한 구체예에서, 상기 용량은 약 5x103 PFU이다. 다양한 구체예에서, 상기 용량은 약 5x104 PFU이다. 다양한 구체예에서, 상기 용량은 약 5x105 PFU이다. 다양한 구체예에서, 상기 용량은 약 5x106 PFU이다. 다양한 구체예에서, 상기 용량은 약 5x107 PFU이다. 다양한 구체예에서, 상기 용량은 약 5x108 PFU이다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 정맥내, 또는 척수강내, 피하, 근육내, 피내 또는 비강내로 투여된다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 비강내로 투여된다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 점비제 또는 점비 스프레이를 통해 투여된다.
다양한 구체예는 본 발명의 변형된 SARS-CoV-2 변이체의 프라임 용량(prime dose)을 상기 대상체에게 투여하는 단계, 및 본 발명의 변형된 SARS-CoV-2 변이체의 1회 이상의 부스트 용량(boost dose)을 상기 대상체에게 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 본원에 논의된 변형된 SARS-CoV-2 변이체 중 어느 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하며, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 프라임 용량 및 1회 이상의 부스트 용량은 동일한 변형된 SARS-CoV-2 변이체를 이용한다. 다양한 구체예에서, 프라임 용량 및 1회 이상의 부스트 용량은 상이한 변형된 SARS-CoV-2 변이체를 이용한다. 다양한 구체예에서, 용량은 예방적 유효량 또는 치료적 유효량이다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체의 프라임 용량 및/또는 1회 이상의 부스트 용량은 정맥내로, 또는 척수강내로, 피하로, 근육내로, 피내로 또는 비강내로 투여된다. 다양한 구체예에서, 변형된 SARS-CoV-2 변이체의 프라임 용량 및/또는 1회 이상의 부스트 용량은 비강내로 투여된다. 다양한 구체예에서, 변형된 SARS-CoV-2 변이체의 프라임 용량 및/또는 1회 이상의 부스트 용량은 점비제 또는 점비 스프레이를 통해 투여된다.
다양한 구체예는 대상체에게 본 발명의 면역 조성물의 프라임 용량을 투여하는 단계; 및 대상체에게 본 발명의 면역 조성물의 1회 이상의 부스트 용량을 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다양한 구체예에서, 면역 조성물은 본원에 논의된 면역 조성물 중 어느 하나이다.
다양한 구체예는 대상체에게 본 발명의 다가 면역 조성물의 프라임 용량을 투여하는 단계; 및 대상체에게 본 발명의 다가 면역 조성물의 1회 이상의 부스트 용량을 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다양한 구체예에서, 다가 면역 조성물은 본원에 논의된 면역 조성물 중 어느 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 다가 백신 조성물은 원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함한다. 즉, 원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 상기 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
다양한 구체예에서, 프라임 용량 및 1회 이상의 부스트 용량은 동일한 변형된 SARS-CoV-2 변이체를 포함하는 동일한 면역 조성물을 이용한다. 다양한 구체예에서, 프라임 용량 및 1회 이상의 부스트 용량은 상이한 변형된 SARS-CoV-2 변이체를 포함하는 상이한 면역 조성물을 이용한다. 다양한 구체예에서, 용량은 예방적 유효량 또는 치료적 유효량이다.
다양한 구체예에서, 면역 조성물의 프라임 용량 및/또는 1회 이상의 부스트 용량은 정맥내로, 또는 척수강내, 피하, 근육내, 피내 또는 비강내로 투여된다. 다양한 구체예에서, 면역 조성물의 프라임 용량 및/또는 1회 이상의 부스트 용량은 비강내로 투여된다. 다양한 구체예에서, 면역 조성물의 프라임 용량 및/또는 1회 이상의 부스트 용량은 점비제 또는 점비 스프레이를 통해 투여된다.
다양한 구체예는 대상체에게 본 발명의 백신 조성물의 프라임 용량을 투여하는 단계; 및 대상체에게 본 발명의 백신 조성물의 1회 이상의 부스트 용량을 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다양한 구체예에서, 백신 조성물은 본원에 논의된 백신 조성물 중 어느 하나이다.
다양한 구체예는 대상체에게 본 발명의 다가 백신 조성물의 프라임 용량을 투여하는 단계; 및 대상체에게 본 발명의 다가 백신 조성물의 1회 이상의 부스트 용량을 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다양한 구체예에서, 백신 조성물은 본원에 논의된 백신 조성물 중 어느 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하며, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 다가 백신 조성물은 원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함한다. 즉, 원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 상기 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
다양한 구체예에서, 기본 용량 및 1회 이상의 추가 부스트 용량은 동일한 변형된 SARS-CoV-2 변이체를 포함하는 동일한 백신 조성물을 활용한다. 다양한 구체예에서, 프라임 용량 및 1회 이상의 추가 부스트 용량은 상이한 변형된 SARS-CoV-2 변이체를 포함하는 상이한 백신 조성물을 활용한다. 다양한 구체예에서, 용량은 예방적으로 유효하거나 치료적으로 효과적인 용량이다.
다양한 구체예에서, 프라임 용량 및 1회 이상의 부스트 용량은 동일한 변형된 SARS-CoV-2 변이체를 포함하는 동일한 백신 조성물을 이용한다. 다양한 구체예에서, 프라임 용량 및 1회 이상의 부스트 용량은 상이한 변형된 SARS-CoV-2 변이체를 포함하는 상이한 백신 조성물을 이용한다. 다양한 구체예에서, 용량은 예방적 유효량 또는 치료적 유효량이다.
다양한 구체예에서, 백신 조성물의 프라임 용량 및/또는 1회 이상의 부스트 용량은 정맥내로, 또는 척수강내, 피하, 근육내, 피내 또는 비강내로 투여된다. 다양한 구체예에서, 백신 조성물의 프라임 용량 및/또는 1회 이상의 부스트 용량은 비강내로 투여된다. 다양한 구체예에서, 백신 조성물의 프라임 용량 및/또는 1회 이상의 부스트 용량은 점비제 또는 점비 스프레이를 통해 투여된다.
프라임 투여량과 부스트 투여량 사이의 시간 간격(timing)은, 예를 들어 감염 또는 질병의 단계(예를 들면, 비-감염, 감염, 감염 후 일수) 및 환자의 건강에 따라 달라질 수 있다. 다양한 구체예에서, 1회 이상의 부스트 용량은 프라임 용량의 투여 약 2주 후에 투여된다. 즉, 프라임 용량이 투여되고, 약 2주 후에 부스트 용량이 투여된다. 다양한 구체예에서, 1회 이상의 부스트 용량은 프라임 용량의 투여 약 4주 후에 투여된다. 다양한 구체예에서, 1회 이상의 부스트 용량은 프라임 용량의 투여 약 6주 후에 투여된다. 다양한 구체예에서, 1회 이상의 부스트 용량은 프라임 용량의 투여 약 8주 후에 투여된다. 다양한 구체예에서, 1회 이상의 부스트 용량은 프라임 용량의 투여 약 12주 후에 투여된다. 다양한 구체예에서, 1회 이상의 부스트 용량은 프라임 용량의 투여 약 1-12주 후에 투여된다.
다양한 구체예에서, 1회 이상의 부스트 용량은 1회 부스트 용량으로 제공될 수 있다. 다른 구체예에서, 1회 이상의 부스트 용량은 주기적으로 부스트 용량으로 제공될 수 있다. 예를 들어, 분기별, 4개월마다, 6개월마다, 매년, 2년마다, 3년마다, 4년마다, 5년마다, 6년마다, 7년마다, 8년마다, 9년마다 또는 10년마다 제공될 수 있다.
다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 103-107 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 104-106 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 103 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 104 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 105 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 106 PFU이다. 다양한 구체예에서, 용량은 약 107 PFU이다. 다양한 구체예에서, 용량은 약 108 PFU이다.
다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 5x103 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 5x104 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 각각 약 5x105 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 각각 약 5x106 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 각각 약 5x107 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 5x108 PFU이다.
다양한 구체예에서, 프라임 용량 및 부스트 용량의 투여량은 동일하다.
다양한 구체예에서, 투여량(dosage amount)은 프라임 투여량과 부스트 투여량 간에 달라질 수 있다. 비한정적인 예로서, 프라임 용량은 부스트 용량에 비해 더 적은 수의 바이러스 카피를 포함할 수 있다. 예를 들어, 프라임 용량은 약 103 PFU이고 부스트 용량은 약 104-106 PFU이거나, 또는 프라임 용량은 약 104이고 부스트 용량은 약 105-107 PFU이다.
부스트 용량이 주기적으로 투여되는 것인 다양한 구체예에서, 후속 부스트 용량은 최초 부스트 용량보다 적을 수 있다.
또 다른 비한정적인 예로서, 프라임 용량은 부스트 용량에 비해 더 많은 바이러스 카피를 포함할 수 있다.
다양한 구체예에서, 면역 반응은 보호 면역 반응이다.
다양한 구체예에서, 용량은 예방적 유효량이거나, 또는 치료적 유효량이다.
다양한 구체예에서, 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 면역 조성물, 본 발명의 백신 조성물, 본 발명의 다가 면역 조성물, 또는 본 발명의 다가 백신 조성물의 비강내 투여는 대상체에게 코를 풀고 머리를 뒤로 젖히도록 지시하는 단계; 선택적으로, 조성물이 코 외부 또는 목 아래로 떨어지는 것을 방지하기 위해 대상체에게 머리 위치를 변경하도록 지시하는 단계; 각 콧구멍에 투여량을 포함하는 약 0.25 mL를 투여하는 단계; 상기 대상체에게 부드럽게 흡입(sniff)하도록 지시하는 단계; 및 대상체에게 일정 기간, 예를 들면, 약 60분 동안 코를 풀지 말라고 지시하는 단계를 포함한다.
일부 구체예에서, 대상체는 어떠한 면역억제 약물도 복용하지 않는다. 다양한 구체예에서, 대상체는 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 면역 조성물 또는 본 발명의 백신 조성물의 투여 전 약 180일, 150일, 120일, 90일, 75일, 60일, 45일, 30일, 15일 또는 7일 동안 면역억제 약물을 복용하지 않는다. 다양한 구체예에서, 대상체는 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 면역 조성물 또는 본 발명의 백신 조성물의 투여 후 약 1일, 7일, 14일, 30일, 45일, 60일, 75일, 90일, 120일, 150일, 180일, 9개월, 12개월, 15개월, 18개월, 21개월 또는 24개월 동안 어떠한 면역억제 약물도 복용하지 않는다.
면역억제 약물은 하기를 포함하나, 그에 한정되지 않는다: 코르티코스테로이드(예를 들면, 프레드니손(Deltasone, Orasone), 부데소니드(Entocort EC), 프레드니솔론(Millipred)), 칼시뉴린 억제제(예를 들면, 사이클로스포린(Neoral, Sandimmune, SangCya), 타크롤리무스(Astagraf XL, Envarsus XR, Prograf), mTOR(Mechanistic target of rapamycin) 억제제(예를 들면, 시롤리무스(Rapamune), 에베롤리무스(Afinitor, Zortress)), 이노신 모노포스페이트 탈수소효소(IMDH) 억제제(예를 들면, 아자티오프린 (Azasan, Imuran), 레플루노미드(Arava), 미코페놀레이트 (CellCept, Myfortic)), 생물 제제(biologics) (예를 들면, 아바타셉트 (Orencia), 아달리무맙 (Humira), 아나킨라 (Kineret), 세르톨리주맙 (Cimzia), 에타네르셉트 (Enbrel), 골리무맙 (Simponi), 인플릭시맙(Remicade), 익세키주맙(ixekizumab) (Taltz), 나탈리주맙(Tysabri), 리툭시맙(Rituxan), 세쿠키누맙(Cosentyx), 토실리주맙(Actemra), 우스테키누맙(Stelara), 베돌리주맙(Entyvio)), 단일클론 항체(예를 들면, 바실릭시맙 (Simulect), 다클리주맙 (Zinbryta), 무로모납 (Orthoclone OKT3)).
의약 용도
본 발명의 다양한 구체예는 면역 반응을 유도하는 데 사용하거나 COVID-19의 치료 또는 예방적 치료를 위한 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물을 제공한다.
본 발명의 다양한 구체예는 면역 반응의 유도에서의 용도를 위한 COVID-19의 치료 또는 예방적 치료의 용도를 위한 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물로서, 상기 용도는 본 발명의 변형된 SARS-CoV-2 변이체, 또는 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물의 프라임 용량 및 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물의 1회 이상의 부스트 용량을 포함하는 것인 COVID-19의 치료 또는 예방적 치료의 용도를 위한 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물을 제공한다.
본 발명의 다양한 구체예는 면역 반응을 유도하거나 COVID-19의 치료 또는 예방적 치료를 위한 약제의 제조에서 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물 또는 본 발명의 면역 조성물의 용도를 제공한다.
본 발명의 다양한 구체예는 면역 반응을 유도하거나 COVID-19의 치료 또는 예방적 치료를 위한 약제의 제조에서 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물 또는 본 발명의 면역 조성물의 용도로서, 본 발명의 변형된 SARS-CoV-2 변이체, 또는 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물의 프라임 용량 및 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물의 1회 이상의 부스트 용량을 포함하는 것인 용도를 제공한다.
다양한 구체예에서, 면역 조성물은 본원에 기술된 다가 면역 조성물이다.
다양한 구체예에서, 백신 조성물은 본원에 기술된 다가 백신 조성물이다.
본 발명의 변형된 SARS-CoV-2 변이체는 본원에 논의된 변형된 SARS-CoV-2 코로나바이러스 중 어느 하나이다. 본 발명의 백신 조성물은 본원에 논의된 백신 조성물 중 어느 하나이다. 본 발명의 면역 조성물은 본원에 논의된 면역 조성물 중 어느 하나이다.
다양한 구체예에서, 면역 반응은 보호 면역 반응이다.
제조 방법
다양한 구체예는 모 SARS-CoV-2 변이체의 하나 이상의 단백질 또는 그의 하나 이상의 단편을 코딩하는 뉴클레오티드 서열을 수득하는 단계; 상기 하나 이상의 단백질 또는 그의 하나 이상의 단편의 단백질 발현을 감소시키기 위해 뉴클레오티드 서열을 재코딩하는 단계, 및 상기 재코딩된 뉴클레오티드 서열을 갖는 핵산을 모 SARS-CoV-2 변이체 게놈 내로 치환하여 변형된 SARS-CoV-2 변이체 게놈을 제조하는 단계를 포함하는, 변형된 SARS-CoV-2 변이체를 제조하는 방법으로서, 상기 재코딩된 뉴클레오티드 서열의 발현은 모 바이러스에 비해 감소된 것인 방법을 제공한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체 게놈을 제조하는 것은 클로닝 숙주를 사용하는 것을 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체 게놈을 제조하는 것은 BAC 벡터를 사용하거나, 오버랩 신장(overlap extension) PCR 전략 또는 긴 PCR 기반 융합(long PCR-based fusion) 전략을 사용하여 감염성 cDNA 클론을 구축하는 것을 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체 게놈은 결실, 치환 및 첨가를 포함한, 하나 이상의 돌연변이를 추가로 포함한다. 하나 이상은 1-5, 6-10, 11-15, 16-20, 21-25, 26-30, 31-35, 36-40, 41-45, 46-50, 51-60, 61-70, 71-80, 81-90 또는 91-100개의 돌연변이일 수 있다.
다양한 구체예에서, 상기 하나 이상의 단백질 또는 그의 하나 이상의 단편의 단백질 발현을 감소시키기 위해 뉴클레오티드 서열을 재코딩하는 것은 본원에서 논의된 바와 같이, 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈-쌍 편향(CPB)을 감소시키거나, 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈 사용빈도 편향을 감소시키거나, 모 SARS-CoV-2 변이 폴리뉴클레오티드와 비교하여 CpG 또는 UpA 디뉴클레오티드의 수를 증가시키는 것에 의해 이루어진다.
본 발명의 다양한 구체예는 SARS-CoV-2 변이체의 바이러스 RNA에 대해 역전사 중합효소 연쇄 반응("RT-PCR")을 수행하여 cDNA를 생성하는 단계; 중합효소 연쇄 반응("PCR")을 수행하여 cDNA로부터 2개 이상의 중첩(overlapping) cDNA 단편을 생성하고 증폭하는 단계로서, 상기 2개 이상의 중첩 cDNA 단편은 전체적으로 SARS-CoV-2 변이체를 코딩하는 것인 단계; 바이러스 RNA로부터 생성된 하나 이상의 상응하는 중첩 cDNA 단편을 변형된 서열을 포함하는 하나 이상의 중첩 cDNA 단편으로 치환하는 단계; 및 중첩 및 증폭 PCR을 수행하여 변형된 바이러스 게놈을 구축하는 단계로서, 상기 변형된 바이러스 게놈은 하나 이상의 변형된 서열을 포함하는 것인 단계를 포함하는, 변형된 바이러스 게놈을 생성하는 방법을 포함한다. 다양한 구체예에서, 이 방법은 cDNA를 생성하기 위해 SARS-CoV-2 변이체의 바이러스 RNA에 대해 RT-PCR을 수행하기 전에 허용 세포(permissive cell)에서 SARS-CoV-2 변이체 RNA 바이러스 분리물의 적어도 1회 계대를 수행하는 단계를 포함한다.
중합효소 연쇄 반응("PCR")을 수행하여, SARS-CoV-2 변이체의 바이러스 RNA를 코딩하는 cDNA로부터 2개 이상의 중첩 PCR을 생성하고 증폭시키는 단계로서, 상기 2개 이상의 중첩 cDNA 단편은 전체적으로(collectively) SARS-CoV-2 변이체를 코딩하고, 하나 이상의 상응하는 중첩 cDNA 단편을 변형된 서열을 포함하는 하나 이상의 중첩 cDNA 단편은 변형된 서열을 코딩하는 것인 단계; 및 중첩 및 증폭 PCR을 수행하여 변형된 바이러스 게놈을 구축하는 단계로서, 상기 변형된 바이러스 게놈은 하나 이상의 변형된 서열을 포함하는 것인 단계를 포함하는, 변형된 바이러스 게놈을 생성하는 방법을 포함한다.
본 발명의 다양한 구체예는 중합효소 연쇄 반응("PCR")을 수행하여, SARS-CoV-2 변이체의 바이러스 RNA를 코딩하는 cDNA로부터 2개 이상의 중첩 PCR을 생성하고 증폭시키는 단계로서, 상기 2개 이상의 중첩 cDNA 단편은 전체적으로 SARS-CoV-2 변이체를 코딩하는 것인 단계; 하나 이상의 상응하는 중첩 cDNA 단편을 변형된 서열을 포함하는 하나 이상의 중첩 cDNA 단편으로 치환하는 단계; 중첩 및 증폭 PCR을 수행하여 변형된 바이러스 게놈을 구축하는 단계로서, 상기 변형된 바이러스 게놈은 하나 이상의 변형된 서열을 포함하는 것인 단계를 포함하는, 변형된 바이러스 게놈을 생성하는 방법을 제공한다.
다양한 구체예에서, cDNA로부터 2개 이상의 중첩 cDNA 단편을 생성 및 증폭하기 위해 PCR을 수행하는 것은 2개 이상의 프라이머 쌍을 사용하는 것을 포함하고, 각 쌍은 각각의 중첩 cDNA 단편에 특이적이다. 다양한 구체예에서, cDNA로부터 2개 이상의 중첩 cDNA 단편을 생성하고 증폭시키기 위해 PCR을 수행하는 것은 표 4에서 선택된 2개 이상의 프라이머 쌍을 사용하는 것을 포함한다.
다양한 구체예에서, cDNA로부터 두 개 이상의 중첩 cDNA 단편을 생성 및 증폭하기 위해 PCR을 수행하는 것은 5개 이상의 프라이머 쌍을 사용하는 것을 포함하고, 각 쌍은 각각의 중첩 cDNA 단편에 특이적이다. 다양한 구체예에서, cDNA로부터의 2개 이상의 중첩 cDNA 단편은 5개 이상의 중첩 cDNA 단편이고, 5개 이상의 중첩 cDNA 단편은 전체적으로 RNA 바이러스를 코딩한다. 다양한 구체예에서, cDNA로부터 5개 이상의 중첩 cDNA 단편을 생성하고 증폭시키기 위해 PCR을 수행하는 것은 표 4에서 선택된 5개 이상의 프라이머 쌍을 사용하는 것을 포함한다.
다양한 구체예에서, cDNA로부터 2개 이상의 중첩 cDNA 단편을 생성 및 증폭하기 위해 PCR을 수행하는 것은 10개 이상의 프라이머 쌍을 사용하는 것을 포함하고, 각 쌍은 각각의 중첩 cDNA 단편에 특이적이다. 다양한 구체예에서, cDNA로부터의 2개 이상의 중첩 cDNA 단편은 10개 이상의 중첩 cDNA 단편이고, 10개 이상의 중첩 cDNA 단편은 전체적으로 RNA 바이러스를 코딩한다. 다양한 구체예에서, cDNA로부터 10개 이상의 중첩 cDNA 단편을 생성하고 증폭시키기 위해 PCR을 수행하는 것은 표 4에서 선택된 10개 이상의 프라이머 쌍을 사용하는 것을 포함한다.
다양한 구체예에서, cDNA로부터 두 개 이상의 중첩 cDNA 단편을 생성하고 증폭하기 위해 PCR을 수행하는 것은 15개 이상의 프라이머 쌍을 사용하는 것을 포함하고, 각 쌍은 각각의 중첩 cDNA 단편에 특이적이다. 다양한 구체예에서, cDNA로부터의 2개 이상의 중첩 cDNA 단편은 15개 이상의 중첩 cDNA 단편이고, 15개 이상의 중첩 cDNA 단편은 전체적으로 RNA 바이러스를 코딩한다. 다양한 구체예에서, cDNA로부터 15개 이상의 중첩 cDNA 단편을 생성하고 증폭시키기 위해 PCR을 수행하는 것은 표 4에서 선택된 15개 이상의 프라이머 쌍을 사용하는 것을 포함한다.
다양한 구체예에서, cDNA로부터의 2개 이상의 중첩 cDNA 단편은 20개 이상의 중첩 cDNA 단편이고, 20개 이상의 중첩 cDNA 단편은 전체적으로 RNA 바이러스를 코딩한다. 다양한 구체예에서, cDNA로부터 20개 이상의 중첩 cDNA 단편을 생성하고 증폭시키기 위해 PCR을 수행하는 것은 20개 이상의 프라이머 쌍을 사용하는 것을 포함하며, 각 쌍은 각각의 중첩 cDNA 단편에 특이적이다.
다양한 구체예에서, cDNA로부터의 2개 이상의 중첩 cDNA 단편은 25개 이상의 중첩 cDNA 단편이고, 25개 이상의 중첩 cDNA 단편은 전체적으로 RNA 바이러스를 코딩한다. 다양한 구체예에서, cDNA로부터 25개 이상의 중첩 cDNA 단편을 생성하고 증폭시키기 위해 PCR을 수행하는 것은 25개 이상의 프라이머 쌍을 사용하는 것을 포함하며, 각 쌍은 각각의 중첩 cDNA 단편에 특이적이다.
다양한 구체예에서, cDNA로부터의 2개 이상의 중첩 cDNA 단편은 19개의 중첩 cDNA 단편이고, 19개의 중첩 cDNA 단편은 전체적으로 SARS-CoV-2 변이체, 예를 들어, 본원에 논의된 알파, 베타, 델타 또는 감마를 코딩한다. 다양한 구체예에서, PCR을 수행하여 제1 cDNA로부터 19개의 중첩 cDNA 단편을 생성하고 증폭시키는 것은 표 4의 19개 프라이머 쌍 모두를 사용하는 것을 포함한다.
다양한 구체예에서, 중첩(overlap) 길이는 약 40-400bp이다. 다양한 구체예에서, 중첩 길이는 약 200bp이다. 다양한 구체예에서, 중첩 길이는 약 40-100bp이다. 다양한 구체예에서, 중첩 길이는 약 100-200bp이다. 다양한 구체예에서, 중첩 길이는 약 100-150bp이다. 다양한 구체예에서, 중첩 길이는 약 150-200bp이다. 다양한 구체예에서, 중첩 길이는 약 200-250bp이다. 다양한 구체예에서, 중첩 길이는 약 200-300bp이다. 다양한 구체예에서, 중첩 길이는 약 300-400bp이다.
다양한 구체예에서, 프라이머의 길이는 약 15-55 염기쌍(bp) 길이이다. 다양한 구체예에서, 프라이머의 길이는 약 19-55bp 길이이다. 다양한 구체예에서, 프라이머의 길이는 약 10-65bp 길이이다. 다양한 구체예에서, 프라이머의 길이는 약 16-20, 21-25, 26-30, 31-35, 36-40, 41-45, 46-50, 51-55, 56-60 또는 61-65bp 길이이다.
다양한 구체예에서, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 2개 이상의 중첩 cDNA 단편에 대해 동시에 수행된다. 따라서, 5개 이상의 중첩 cDNA 단편이 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 5개의 단편에 대해 동시에 수행된다. 추가 예로서, 중첩 cDNA 단편이 8개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 8개의 단편에 대해 동시에 수행되고; 중첩 cDNA 단편이 10개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 10개의 단편에 대해 동시에 수행되며; 중첩 cDNA 단편이 15개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 15개의 단편에 대해 동시에 수행되고; 중첩 cDNA 단편이 19개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 19개의 단편에 대해 동시에 수행되고; 중첩 cDNA 단편이 20개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 20개의 단편에 대해 동시에 수행되며; 중첩 cDNA 단편이 25개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 25개의 단편에 대해 동시에 수행되고; 중첩 cDNA 단편이 30개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 30개의 단편에 대해 동시에 수행된다.
다양한 구체예에서, 본 발명의 방법은 플라스미드, BAC 또는 YAC와 같은 중간 DNA 클론을 사용하지 않는다. 다양한 구체예에서, 본 발명의 방법은 클로닝 숙주를 사용하지 않는다. 다양한 구체예에서, 본 발명의 방법은 서열에 인공 인트론을 포함하지 않으며; 예를 들어, 문제가 되는 서열 유전자좌를 중단시키기 위한 인공 인트론을 포함하지 않는다.
약독화된 바이러스 생성
본 발명의 다양한 구체예는 변형된 SARS-CoV-2 변이체를 생성하는 방법을 제공한다.
다양한 구체예에서, 상기 방법은 본 발명의 바이러스 게놈을 포함하는 벡터로 세포 집단을 형질감염시키는 단계; 세포 배양에서 상기 세포 집단을 적어도 1회 계대시키는 단계; 세포 배양에서 상층액을 수집하는 단계를 포함한다.
다양한 구체예에서, 상기 방법은 세포 집단을 본 발명의 변형된 감염성 SARS-CoV-2 변이체 RNA로 형질감염시키는 단계; 세포 집단을 배양하는 단계; 및 변형된 SARS-CoV-2 변이체를 포함하는 감염 배지를 수집하는 단계를 포함한다. 다양한 구체예에서, 세포 집단을 배양하는 단계는 세포 배양에서 세포 집단을 1회 이상 계대시키는 것을 포함한다.
다양한 실시 양태에서, 상기 방법은 상층액 또는 감염 배지를 농축하는 단계를 추가로 포함한다.
다양한 구체예에서, 상기 방법은 세포 집단을 2 내지 15회 계대시키는 단계; 및 세포 집단의 세포 배양물로부터 상층액을 수집하는 단계를 포함한다. 다양한 구체예에서, 방법은 세포 집단을 2 내지 10회 계대배양시키는 단계; 및 세포 집단의 세포 배양물로부터 상층액을 수집하는 단계를 포함한다. 다양한 구체예에서, 방법은 세포 집단을 2 내지 7회 계대시키는 단계; 및 세포 집단의 세포 배양물로부터 상층액을 수집하는 단계를 포함한다. 다양한 구체예에서, 방법은 세포 집단을 2 내지 5회 계대시키는 단계; 및 세포 집단의 세포 배양물로부터 상층액을 수집하는 단계를 포함한다. 다양한 구체예에서, 방법은 세포 집단을 2, 3, 4, 5, 6, 7, 8 또는 10회 계대시키는 단계; 및 세포 집단의 세포 배양물로부터 상층액을 수집하는 단계를 포함한다. 다양한 구체예에서, 세포 배양물로부터 상층액을 수집하는 단계는 세포 집단의 각 계대 동안 수행된다. 다른 구체예에서, 세포 배양물로부터 상층액을 수집하는 단계는 세포 집단의 1회 이상의 계대 동안 수행된다. 예를 들어, 이는 격 계대로, 2계대 마다, 또는 3계대 마다 등으로 수행될 수 있다.
본 발명의 다양한 구체예는 일정량의(a quantity of) 탈최적화된 감염성 RNA로 숙주 세포를 형질감염시키는 단계; 숙주 세포를 배양하는 단계; 및 탈최적화된 바이러스를 포함하는 감염 배지를 수집하는 단계를 포함하는, 탈최적화된 SARS-CoV-2 변이체를 생성하는 방법을 제공한다.
다양한 구체예에서, 이 방법은 SARS-CoV-2 변이체의 바이러스 RNA에 대해 역전사 중합효소 연쇄 반응("RT-PCR")을 수행하여 cDNA를 생성하는 단계; 중합효소 연쇄 반응("PCR")을 수행하여 cDNA로부터 2개 이상의 중첩 cDNA 단편을 생성하고 증폭시키는 단계로서, 상기 2개 이상의 중첩 cDNA 단편은 전체적으로 SARS-CoV-2 변이체를 코딩하는 것인 단계; 바이러스 RNA로부터 생성된 하나 이상의 상응하는 중첩 cDNA 단편을 탈최적화된 서열을 포함하는 하나 이상의 중첩 cDNA 단편으로 치환하는 단계; 중첩 및 증폭 PCR을 수행하여 탈최적화된 바이러스 게놈을 구축하는 단계로서, 상기 탈최적화된 바이러스 게놈은 하나 이상의 탈최적화된 서열을 포함하는 것인 단계; 탈최적화된 게놈의 시험관내(in vitro) 전사를 수행하여 탈최적화된 RNA 전사체를 생성하는 단계; 및 탈최적화된 바이러스를 포함하는 감염 배지를 수집하는 단계를 포함한다.
다양한 구체예에서, 방법은 일정량의 탈최적화된 감염성 RNA으로 숙주 세포를 형질감염시키기 전에 일정량의 본 발명의 다양한 구체예에 따른 탈최적화된 감염성 RNA를 생성하는 단계를 추가로 포함한다. 따라서, 본 발명은 탈최적화된 바이러스 게놈의 시험관내 전사를 수행하여 탈최적화된 RNA 전사체를 생성하는 단계; 및 일정량의 탈최적화된 감염성 RNA로 숙주 세포를 형질감염시키는 단계; 숙주 세포를 배양하는 단계; 및 탈최적화된 바이러스를 포함하는 감염 배지를 수집하는 단계를 포함한다.
다른 구체예에서, 방법은 중합효소 연쇄 반응("PCR")을 수행하여 SARS-CoV-2 변이체의 바이러스 RNA를 코딩하는 cDNA로부터 2개 이상의 중첩 cDNA 단편을 생성하고 증폭시키는 단계로서, 상기 2개 이상의 중첩 cDNA는 단편은 전체적으로 SARS-CoV-2 변이체를 코딩하고, 하나 이상의 중첩 cDNA 단편은 탈최적화된 서열을 포함하는 것인 단계; 중첩 및 증폭 PCR을 수행하여 탈최적화된 바이러스 게놈을 구축하는 단계로서, 상기 탈최적화된 바이러스 게놈은 하나 이상의 탈최적화된 서열을 포함하는 것인 단계; 및 탈최적화된 바이러스 게놈의 시험관내 전사를 수행하여 탈최적화된 RNA 전사체를 생성하는 단계; 숙주 세포를 배양하는 단계; 및 탈최적화된 바이러스를 포함하는 감염 배지를 수집하는 단계를 포함한다.
다른 구체예에서, 방법은 중합효소 연쇄 반응("PCR")을 수행하여 SARS-CoV-2 변이체의 바이러스 RNA를 코딩하는 cDNA로부터 2개 이상의 중첩 cDNA 단편을 생성하고 증폭시키는 단계로서, 상기 2개 이상의 중첩 cDNA는 단편은 전체적으로 SARS-CoV-2 변이체를 코딩하는 단계; 바이러스 RNA로부터 생성된 하나 이상의 상응하는 중첩 cDNA 단편을 탈최적화된 서열을 포함하는 하나 이상의 중첩 cDNA 단편으로 치환하는 단계; 중첩 및 증폭 PCR을 수행하여 탈최적화된 바이러스 게놈을 구축하는 단계로서, 상기 탈최적화된 바이러스 게놈은 하나 이상의 탈최적화된 서열을 포함하는 것인 단계; 및 탈최적화된 바이러스 게놈의 시험관내 전사를 수행하여 탈최적화된 RNA 전사체를 생성하는 단계; 숙주 세포를 배양하는 단계; 및 탈최적화된 바이러스를 포함하는 감염 배지를 수집하는 단계를 포함한다.
다양한 구체예에서, 상기 방법은 cDNA를 생성하기 위해 SARS-CoV-2 변이체의 바이러스 RNA에 대해 RT-PCR을 수행하기 전에 허용 세포에서 야생형 RNA 바이러스 분리주의 적어도 1회 계대를 수행하는 단계를 포함한다.
다양한 구체예에서, 상기 방법은 RT-PCR을 수행하기 전에 SARS-CoV-2 변이체로부터 바이러스 RNA를 추출하는 단계를 추가로 포함한다.
변형된 바이러스 게놈 및 변형된 바이러스 게놈을 생성하는 방법의 특정한 구체예는 본원에 제공되는 바와 같으며 변형된 SARS-CoV-2 변이체의 생성의 이러한 구체예에 포함된다.
키트
본 발명은 또한 대상체에 백신을 접종하거나, 면역 반응을 유도하거나, 대상체에서 보호 면역 반응을 유도하기 위한 키트에 관한 것이다. 키트는 면역 반응을 유도하거나 보호 면역 반응을 유도하는 본 발명의 방법을 실시하는 데 유용하다. 키트는 본 발명의 조성물 중 하나 이상을 포함하는 재료 또는 구성요소의 집합(assemblage)이다. 따라서, 일부 구체예에서, 키트는 본 발명의 본원에 논의된 변형 SARS-CoV-2 변이체 중 어느 하나를 포함하는 조성물, 본원에 논의된 면역 조성물 중 어느 하나, 또는 본원에 논의된 백신 조성물 중 어느 하나를 포함한다. 따라서, 일부 구체예에서 키트는 본원에 기술된 바와 같은 본 발명의 변형된 SARS-CoV-2 변이체를 포함하는 조성물, 면역 조성물 또는 백신 조성물의 단위화된(unitized) 단일 투여량을 포함하고; 예를 들어, 각 바이알은 약 103-107 PFU의 변형된 SARS-CoV-2 변이체, 더 구체적으로는 104-106 PFU의 변형된 SARS-CoV-2 변이체, 104 PFU의 변형된 SARS-CoV-2 변이체, 105 PFU의 변형된 SARS-CoV-2 변이체 또는 106 PFU의 변형된 SARS-CoV-2 변이체, 또는 더 구체적으로는 5x104-5x106 PFU의 변형된 SARS-CoV-2 변이체, 5x104 PFU의 변형된 SARS-CoV-2 변이체, 5x105 PFU의 변형된 SARS-CoV-2 변이체, 또는 5x106 PFU CoV-2 변이체 또는 5x107 PFU의 변형된 SARS-CoV-2 변이체의 용량을 위해 충분한 양을 포함한다. 다양한 구체예에서, 키트는 본원에 기술된 바와 같은 본 발명의 변형된 SARS-CoV-2 변이체를 포함하는 조성물, 면역 조성물, 백신 조성물, 다가 면역 조성물 또는 다가 백신 조성물을 포함하는 조성물의 다중 투여량을 포함하고; 예를 들어, 키트가 바이알당 10회의 투여량을 포함하는 경우, 각 바이알은 약 10 x 103-107 PFU의 변형된 SARS-CoV-2 변이체, 더 구체적으로는 10 x 104-106 PFU의 변형된 SARS-CoV-2 변이체, 10 x 104 PFU의 변형된 SARS-CoV-2 변이체, 10 x 105 PFU의 변형된 SARS-CoV-2 변이체 또는 10 x 106 PFU의 변형된 SARS-CoV-2 변이체, 또는 더 구체적으로는 50x104-50x106 PFU의 변형된 SARS-CoV-2 변이체, 50x104 PFU의 변형된 SARS-CoV-2 변이체, 50x105 PFU의 변형된 SARS-CoV-2 변이체, 또는 50x106 PFU CoV-2 변이체 또는 50x107 PFU의 변형된 SARS-CoV-2 변이체를 포함한다.
본 발명의 키트에 설계된(configured) 구성요소의 정확한 특성은 의도된 목적에 따라 달라진다. 예를 들어, 일부 구체예는 대상체에게 백신을 접종하거나, 면역 반응을 유도하거나, 대상체에서 보호 면역 반응을 유도할 목적으로 설계된다. 일 구체예에서, 키트는 구체적으로 포유동물 대상체를 예방적으로 치료할 목적으로 설계된다. 또 다른 구체예에서, 키트는 구체적으로 인간 대상체를 예방적으로 치료할 목적으로 설계된다. 추가 구체예에서, 키트는 농장 동물, 가축 및 실험실 동물과 같은, 그러나 이에 한정되지 않는 대상체를 치료하는 수의학적 적용을 위해 설계된다.
사용 설명서가 키트에 포함될 수 있다. "사용 설명서(instructions for use)"는 일반적으로 대상체에게 백신을 접종하거나, 대상체에서 면역 반응을 유도하거나 또는 보호 면역 반응을 유도하는 것과 같은 원하는 결과를 얻기 위해 키트의 구성요소를 사용하는 데 이용되는 기술을 설명하는 유형의 표현을 포함한다. 예를 들어, 비강 투여의 경우, 사용 설명서는 대상체가 코를 풀고 머리를 뒤로 젖히라는 설명, 대상체가 조성물이 코 외부 또는 목 아래로 떨어지는 것을 방지하기 위해 머리의 위치를 바꾸라는 설명, 각 콧구멍에 투여량을 포함하는 약 0.25 mL를 투여하라는 설명; 대상체가 부드럽게 흡입(sniff)하라는 설명 및/또는 대상체가 일정 기간 동안, 예를 들면, 약 60분 동안 코를 풀지 말라는 설명을 포함할 수 있으나, 그에 한정되지 않는다. 추가 설명은 대상체가 면역억제 약물을 복용하지 말라는 설명을 포함할 수 있다.
선택적으로, 키트는 기타 유용한 구성 요소, 예를 들면, 희석제, 완충제, 약학적으로 허용되는 담체, 주사기, 점적기(dropper), 카테터, 애플리케이터(applicator), 피펫팅 또는 측정 도구, 붕대 재료 또는 당업자에 의해 용이하게 인식될 기타 유용한 도구를 포함한다.
키트로 조립된 재료 또는 구성요소는 작동성과 유용성을 보존하는 임의의 편리하고 적합한 방식으로 보관되어 의사에게 제공될 수 있다. 예를 들어, 구성요소는 용해된 형태, 탈수된 형태 또는 동결건조된 형태일 수 있고, 실온, 냉장 또는 냉동 온도에서 제공될 수 있다. 구성요소는 일반적으로 적합한 포장재에 들어 있다. 본원에 사용된 문구 "포장재(packaging material)"는 본 발명의 조성물 등과 같은 키트의 내용물을 수용하는 데 사용되는 하나 이상의 물리적 구조를 의미한다. 포장재는 공지된 방법에 의해 구축되며, 바람직하게는 무균, 무오염 환경을 제공하도록 구축된다. 키트에 사용되는 포장재는 백신에 일반적으로 사용되는 포장재이다. 본원에 사용된 용어 "패키지(package)"는 개별 키트 구성요소를 수용할 수 있는 유리, 플라스틱, 종이, 호일 등과 같은 적합한 고체 매트릭스 또는 재료를 의미하다. 따라서, 예를 들어, 패키지는 본원에 기술된 본 발명의 변형된 SARS-CoV-2 변이체를 포함하는 조성물, 면역 조성물 또는 백신 조성물의 적합한 양을 포함하는 데 사용되는 유리 바이알일 수 있다. 포장재에는 일반적으로 키트 및/또는 그의 구성요소의 내용물 및/또는 목적을 나타내는 외부 라벨이 있다.
서열
서열번호 1(워싱턴 분리주(GenBank: MN985325.1)에 대해 탈최적화됨, 스파이크 단백질에 36개 뉴클레오티드 결실이 있고 폴리A 테일이 없음).
서열번호 2 (USA/WA1/2020 야생형 스파이크와 비교하여 재코딩된 스파이크 단백질)
전형적인 구체예가 참조된 도면에 예시된다. 본원에 개시된 구체예 및 도면은 제한적인 것이 아니라 예시적인 것으로 간주되어야 한다.
도 1a는 CDX-005(탈최적화 SARS-CoV-2 "워싱턴 분리주(Washington Isolate)" 바이러스)가 온도 민감성이고, 즉, 더 높은 온도에서 더 약독화된다는 것을 도시한다. 동일한 양의 CDX-005 바이러스(예를 들면, 100,000/5log 희석 또는 10,000/4log 희석)는 37℃에서 플라크를 형성하나, 40℃에서는 플라크를 형성하지 않을 것이다. 40℃에서는 플라크를 보려면 훨씬 더 많은 바이러스(즉, 100/2log 희석과 같은 더 낮은 희석)가 필요하며 그들은 매우 작다. 반면에, wt 바이러스는 온도 민감성으로 보이지 않다; 두 온도 모두에서 동일하게 잘 기능한다.
도 1b는 CDX-005, CDX-005.1(베타 변이체)에 대한 플라크 형성을 도시한다. 제1행은 37℃에서 3일간 인큐베이션된 CDX-005를 도시한다. 제2행은 40℃에서 3일간 인큐베이션된 CDX-005를 도시한다. 제3행은 37℃에서 3일간 인큐베이션된 CDX-005.1(베타 변이체)을 도시한다. 제2행은 40℃에서 3일간 인큐베이션된 CDX-005.1(베타 변이체)을 도시한다. 이 도면은 또한 CDX-005와 CDX-005.1이 온도 민감성이고, 즉, 더 높은 온도에서 더 약독화된다는 것을 보여준다. 동일한 양의 CDX-005 및 CDX-005.1 바이러스(예를 들면, 100,000/5log 희석 또는 10,000/4log 희석)는 37℃에서 플라크를 형성하나, 40℃에서는 플라크를 형성하지 않을 것이다. 40℃에서는 플라크를 보려면 훨씬 더 많은 바이러스(즉, 100/2log 희석과 같은 더 낮은 희석)가 필요하며 그들은 매우 작다. 이는 CDX-005.1이 40℃에서 온도에 매우 민감하다는 것을 보여준다. 플라크 분석(plaque assay)은 12-웰 클러스터에서 Vero E6 세포 단층의 동일한 배치에서 동시에 수행하고, 37℃ 또는 40℃에서 3일간 인큐베이션한 후 크리스틸 바이올렛(Crystal Violet)으로 염색하였다. 동일한 바이러스 연속 희석물(dilution series)로부터의 CDX-005(상단 2개의 행) 및 CDX-005.1(하단 2개의 행) 샘플을 사용하여 37℃ 또는 40℃에서 플라크 분석을 수행했다. CDX-005와 CDX-005.1은 모두 37℃에서 유사하게 플라크를 형성하는 반면, 40℃에서 CDX-005 플라크는 훨씬 더 작고, 불규칙한 모양이며, 갯수가 크게 감소되었다(약 1,000배). CDX-005.1은 CDX-005보다 훨씬 더 심하게 온도에 의해 제한되었고, 어떤 희석 비율에서도 40℃에서 가시적인 플라크를 형성하지 않았다. 상승된 온도(사람의 발열과 동등함)에서 온도 민감성 표현형은 일반적으로 약독화 바이러스 생백신의 긍정적인 안전성 특징으로 간주된다. 반면, 도 1a의 wt 바이러스의 경우, 온도 민감성으로 보이지 않다; wt 바이러스는 두 온도 모두에서 동일하게 잘 기능한다. 온도 민감성 표현형은 약독화 생백신의 우수하고 바람직한 특징이다. 이는 "안전 밸브(safety valve)"로 작용할 수 있다. 백신은 백신 접종자의 더 낮은 온도(37℃(정상 체온))에서 면역 반응을 유도하기에 충분히 잘 복제된다. 백신에 과민한 특정 개인에서와 같이, 상황이 계획대로 수행되지 않는 경우, 해당 개인은 열이 발생할 수 있으며, 이는 바이러스 복제/활성을 감소시켜, 상황이 악화되는 것을 방지할 것이다.
도 2는 시리아 골드 햄스터(Syrian Gold hamster)에서 야생형 SARS-COV-2 및 CDX-005의 투여 후 체중 변화를 도시한다.
도 3은 Vero 세포에서 wt WA1 및 CDX-005의 증식(growth)을 도시한다. Vero 세포를 0.01MOI의 wt WA1 또는 CDX-005로 감염시키고 33℃ 또는 37℃에서 최대 96시간 동안 배양했다. 바이러스를 회수하기 위해 상층액을 수집하였다. 역가는 플라크 형성 분석에 의해 측정되고, PFU/ml 배양 배지의 로그로 보고되었다.
도 4a-4d는 햄스터에서 CDX-005의 생체내(in vivo) 약독화를 도시한다. 햄스터에 5x104 또는 5x103 PFU/ml의 wt WA1, 5x104 PFU/ml CDX-005를 접종했다. 바이러스 RNA를 4a) 후신경구(olfactory bulb), 4b) 뇌, 및 4c) 폐에서 PI 2일차 및 4일차에 qPCR로 측정하였다. (N=3/그룹; 막대=SEM). 4d) 접종된 햄스터의 좌측 폐 조직에서 감염성 바이러스 부하(infectious virus load)를 TCID50 분석으로 평가하고 TCID50/ml의 log10으로 표현하였다. CDX-005와 wt WA1 처리 그룹 간의 차이는 유의했다 (N=3/그룹; P<0.001; 막대=SEM). 수평선은 LOD를 표시한다.
도 5a-5c는 햄스터에서 CDX-005의 생체내 약독화를 도시한다. 햄스터에 5x104 또는 5x103 PFU/ml의 wt WA1 또는 5x104 PFU/ml CDX-005를 접종했다. 5a) 햄스터의 중량을 9일 동안 매일 측정하였다. 중량 변화는 CDX-005와 wt WA1 처리 그룹 간에 유의하게 상이하였다 (CDX-005 및 wt WA1 5x104의 경우, N=10-40/그룹; wt WA1 5x103의 경우, N=3-12/그룹; P<0.001; 막대=SEM). 5b & 5c) 헤마톡실린 및 에오신 염색된 폐 절편을 PI 2일차, 4일차 및 6일차에 검사하고 세포 침윤에 대해 점수를 매겼다. (N=3/그룹)
도 6a-6d는 햄스터에서의 효능(efficacy)을 도시한다. 6a) 나이브(naive) 햄스터 대조군 혈청 또는 wt WA1 또는 5x104 PFU CDX-005의 접종 후 16일차에 햄스터로부터 수집한 혈청으로 스파이크-S1 ELISA를 수행했다. CDX-005 접종된 햄스터에서 스파이크 S1 IgG를 또한 18일차 (WA1 챌린지(challenge) 후 2일)에 측정하였다. 종점(endpoint) IgG 역가는 백그라운드보다 5X 높은 희석의 로그로 나타낸다. (N=3/그룹; 막대=SEM) 6b) SARS-CoV-2 WA1에 대한 플라크 감소 중화 역가 (Plaque Reduction Neutralization Titer: PRNT)는 5x104 또는 5x103 PFU의 wt WA1 또는 5x104 PFU의 CDX-005로 접종 후 16일차에 햄스터의 혈청에서 테스트하였다. PRNT는 나이브 햄스터 혈청을 함유하는 웰에 비해 플라크 수를 50, 80 또는 90% 감소시킨 최종 혈청 희석 배율(dilution)의 역수이다. (N=3/그룹; 막대=SD); 6c) 백신 접종 후 16일차에 CDX-005 백신 접종한 햄스터 및 나이브 동물을 5x104 PFU wt SARS-CoV-2로 챌린지하였다. 챌린지 후 2일차에 폐를 채취하고, 바이러스 부하(viral load)를 qPCR로 측정하고 qPCR 게놈/조직 ml의 log10으로 표현하였다. (N=3/그룹; 막대=SD). 6d) 햄스터에 비히클, 5x104 PFU의 wt WA1 또는 5x104 CDX-005로 백신 접종하고, 접종 후 27일차에 비강 내로 5x104 PFU/ml wt WA1로 챌린지하였다. 챌린지 당일 및 그 후 4일 동안 매일 중량을 기록하였다. (0-2일차 N=5-6, 3-4일차 N=3, 막대=SEM). 6a)와 6b)의 결과는 두 개의 개별 햄스터 연구에서 나온 것이다.
도 7은 아프리카 녹색 원숭이(African Green Monkey)의 약독화를 도시한다. 기관 세척액(tracheal lavage fluid)을 106 PFU wt WA1 또는 CDX-005의 접종 후 4일차 및 6일차에 원숭이로부터 수집하였다. 세척액을 RT-qPCR에 적용하여 바이러스를 검출하였다. N=3/그룹 (4일차) 또는 N=2/그룹 (6일차).
도 8은 아프리카 녹색 원숭이에서 106wt SARS-COV2 대 CDX-005 비강내 용량(intranasal dose)을 도시한다.
도 9는 Vero 세포로부터 채취된 CDX-005의 조 벌크 역가(crude bulk titre)를 도시한다. 베로 WHO "10-87" 세포를 1.8 x 104 PFU의 CDX-005 (~0.01 MOI)로 접종하고, 그 후, 48시간 동안 성장시켰다. 표시된 상이한 계획(scheme)을 이용하여 바이러스를 채취하였다.
도 10은 역유전학(Reverse Genetics)을 통한 CDX-005.1 바이러스의 성공적인 구제(rescue)를 보여준다. 2021년 5월 7일, 합성 게놈 DNA에서 유래된 합성 게놈 RNA로 Vero WHO 10-87 세포를 형질감염시킨 후 3일차에, 세포 상층액을 VeroE6 세포에 대한 플라크 분석을 통해 감염성 CDX-005.1 바이러스의 존재에 대해 테스트했다. 감염성 CDX-005.1 바이러스는 4.6 x 105 PFU/mL의 역가로 검출되었고, 플라크 크기는 CDX-005와 구별할 수 없었다.
도 11은 역유전학을 통한 CDX-005.2 바이러스의 성공적인 구제를 보여준다. 합성 게놈 DNA로부터 유래된 합성 게놈 RNA로 Vero WHO 10-87 세포를 형질감염시킨 후 4일차에, 세포 상층액을 VeroE6 세포에 대한 플라크 분석을 통해 감염성 CDX-005.2 바이러스의 존재에 대해 테스트했다. 감염성 CDX-005.2 바이러스는 2.5x105 PFU/mL의 역가로 검출되었rh, 플라크 크기는 CDX-005와 구별할 수 없었다.
도 12는 CDX-005.2가 40℃에서 온도에 민감하다는 것을 보여준다. 플라크 분석은 12-웰 클러스터에서 Vero E6 세포 단층의 동일한 배치에서 동시에 수행하고, 37℃ 또는 40℃에서 4일간 인큐베이션한 후 크리스탈 바이올렛으로 염색하였다. 동일한 바이러스 연속 희석물로부터의 CDX-005.2(상단 행) 및 CDX-005(하단 행) 샘플을 사용하여 37℃ 또는 40℃에서 플라크 분석을 수행했다. 40℃에서, 37℃의 허용 온도(permissive temperature) 대비 두 바이러스 모두에 대한 플라크는 훨씬 더 작고, 불규칙한 모양이며, 갯수가 크게 감소되었다(CDX-005의 경우 약 1,000배, 및 CDX-005.2의 경우 약 10,000배). 상승된 온도(사람의 발열과 동등함)에서 온도 민감성 표현형은 일반적으로 약독화 바이러스 생백신의 긍정적인 안전성 특징으로 간주된다.
도 13은 남아프리카 변이체(S.African variant) B.1.351에 대한 백신으로서 탈최적화 SARS-CoV2 (CDX.005)의 효능을 보여준다.
실시예
하기 실시예는 청구된 발명을 더 잘 설명하기 위해 제공되며 본 발명의 범위를 제한하는 것으로 해석되어서는 안 된다. 특정 재료가 언급되는 정도는, 단지 예시를 위한 것이며 본 발명을 제한하려는 의도는 아니다. 당업자는 발명 능력의 발휘 없이, 본 발명의 범위를 벗어나지 않으면서, 동등한 수단 또는 반응물을 개발할 수 있다.
실시예 1
SARS- CoV -2 알파 변이체, 베타 변이체 및 델타 변이체의 합성
알파 변이체, 베타 변이체 및 델타 변이체의 합성은 각 변이체의 돌연변이를 갖는 단편을 제외하고는, 본원에 기술된 탈최적화된 SARS- CoV -2, 코로나바이러스 균주 2019-nCoV/USA-WA1/2020에 대해 기술된 것과 유사하다.
스파이크 유전자 내의 각 변이체에 대한 주요 돌연변이가 확인되었다. 변이체의 약 6-10개 서열을 GISAID에서 선택하고, BLASTn을 이용한 다중 정렬로 본 발명자들의 원래의 WT 디자인 또는 CDX-005(스파이크의 탈최적화 포함)와 비교하였다.
뉴클레오티드 돌연변이를 확인한 후, (본원에 기술된) 탈최적화된 코로나바이러스 균주 2019-nCoV/USA-WA1/2020 설계의 코돈을 변이체의 코돈으로 대체했다. 돌연변이가 결실을 초래한 경우, 변이체의 탈최적화된 서열에 대해 동일한 결실이 이루어졌다.
그 후, 이러한 돌연변이를 보유하는 DNA 단편을 합성하였다. 스파이크 유전자를 본원에서 F14, F15 및 F16으로 지칭한, 3개의 단편으로 분리하였다. F16은 탈최적화된 영역을 포함했다. 돌연변이의 위치에 따라, 이들 단편 중 2개 또는 3개 모두를 합성하였다.
요약하면, PCR/RT-PCR 과정에 의해 19개의 단편 모두를 수득한 후, 중첩 PCR을 수행하여 바이러스 게놈을 구축하고, 뒤이어 시험관내 전사 및 Vero E6 형질감염을 수행했다. 탈최적화된 SARS-CoV-2의 합성에 사용된 것과 동일한 프라이머 쌍ㅇ을 탈최적화된 SARS-CoV-2 변이체의 합성에 사용하였다.
실시예 2
SARS- CoV -2의 합성
절차
RT- PCR
코로나바이러스 균주 2019-nCoV/USA-WA1/2020("WA1")(BEI Resources NR-52281, Lot 70034262)은 CDC에서 Vero(CCL81)에서의 3회의 계대 및 BEI Resources에서 Vero E6에서의 1회의 계대 후에 BEI Resources에 의해 배포되었다. 4회 계대 후 전체 바이러스 게놈 서열은 CDC에 의해 결정되었고, 그것이 유래된 임상 표본과 비교하여 뉴클레오티드 차이가 없는 것(Harcourt et al., 2020)으로 밝혀졌다(GenBank Accession MN985325). 수령 후에, 37℃에서 2% FBS가 포함된 DMEM에서 Vero E6 세포에서의 추가적인 2회 계대로 WAI를 증폭시켰다.
계대 6 WA1 바이러스를 사용하여, 표준 프로토콜에 따라 Trizol 시약(Thermo Fisher)을 사용한 추출에 의해 바이러스 게놈 RNA를 정제하였다. 요약하면, 1x 10^7 PFU/ml 역가의 0.5ml 바이러스 샘플을 동일한 부피의 Trizol로 추출했다. 이 절차는 이전에 SARS-CoV2 바이러스 감염성을 완전히 불활성화시키기 위한 4개의 개별 실험에서 검증되었다. 0.1ml 클로로포름을 첨가하여 상 분리한 후, 수성 상의 RNA를 동일한 부피의 이소프로판올로 침전시켰다. 침전된 RNA를 70% 에탄올로 세척하고, 건조시키고, 20 ㎕의 RNAse 불포함 물에 재현탁시켰다.
바이러스 cDNA 생성
SuperScript IV First Strand Synthesis 시스템을 사용하여 야생형 cDNA를 합성했다. 튜브 #1의 13 ㎕의 총 반응 부피는 하기와 같이 설정되었다:
1. 50μM 올리고 d(T)20: 1 ㎕(또는 프라이머 #1822(10μM): 1 ㎕)
2. 50ng/㎕ 랜덤 헥사머(Random Hexamer): 1 ㎕
3. 10mM dNTP: 1 ㎕
4. WT RNA: 2-10 ㎕
5. H2O: 13 ㎕까지 첨가함
샘플을 혼합하고 65℃에서 5분간 인큐베이션하고, 즉시 얼음 위에 1분간 두었다. 7 ㎕의 총 반응 부피로 또 다른 튜브(튜브 #2)를 준비했다:
1. 5x 버퍼: 4 ㎕
2. 100mM DTT: 1 ㎕
3. Rnase 억제제(40U/㎕): 1 ㎕(선택적)
4. SuperScript IV 효소: 1 ㎕
본 발명자들은 총 반응 부피가 20㎕가 되도록 튜브 #1과 튜브 #2를 혼합하고, 23℃에서 10분 동안 인큐베이션하고, 뒤이어 50℃에서 50분 및 80℃에서 10분 동안 인큐베이션하여 cDNA를 생성했다.
중첩 중합효소 연쇄 반응 (Overlapping Polymerase Chain Reaction)
Q5 High-Fidelity 2x Master Mixture(NEB, Ipswich, Massachusetts)를 사용하여 cDNA로부터 게놈 단편을 증폭시켰다.
20 ㎕ 반응은 1 ㎕의 신선하게 제조된 cDNA, 1 ㎕의 정방향 및 역방향 프라이머(표 4에 상세하게 기술됨)(0.5μM 농도), 10 ㎕의 2x Q5 마스터 혼합물 및 H2O를 포함했다. 반응 파라미터는 하기와 같았다: 반응 개시를 위한 98℃, 30초, 뒤이은 98℃에서 10초, 60℃에서 30초, 65℃에서 1분의 30회 사이클, 최종 신장을 위한 65℃, 5분. 단편 19(약 1.2Kb)를 제외하고 모두 약 1.8 Kb인 총 19개의 게놈 단편을 수득했고, 이들은 특이적 프라이머를 사용한, 그들 중 2개의 단편간 200bp 중첩 영역으로 전체 바이러스 게놈을 커버했다(표 4). 앰플리콘을 아가로스 겔 전기영동으로 확인하고 QIAquick PCR Purification Kit(Qiagen)를 사용하여 정제했다. 용리물은 Nanodrop으로 정량하였다.
전체 코로나-19 게놈을 재구축하기 위해 Q5® High-Fidelity DNA Polymerase(NEB, Ipswich, Massachusetts)를 사용하였다.
먼저, 전체 게놈을 재구축하기 위해 중첩 반응에서 19개 게놈 단편 모두를 사용했다. 요약하면, 각 DNA 단편 30-40 ng(모든 조각 간의 몰비는 1:1임), 10 ㎕ 5x 반응 완충액, 1 ㎕ 10mM dNTP, 0.5 ㎕ Q5 폴리머라아제 및 최종 부피 50 ㎕까지의 H2O의 혼합물을 준비하였다. 반응은 하기 조건으로 수행했다: 98℃에서 30초, 72℃에서 16분, 30초의 10회 사이클.
다음으로, 2 ㎕ 중첩 반응 산물을 4 ㎕의 5x 반응 완충액, 1 ㎕의 10 mM dNTP, 1 ㎕의 각각의 측접(flanking) 프라이머 0.5μM, 0.2 ㎕ Q5 폴리머라아제 및 H2O와 최종 부피 20 ㎕까지 혼합하고 PCR을 다음과 같이 수행했다: 98℃에서 30초로 반응 개시, 이어서 98℃에서 10초, 60℃에서 45초, 72℃에서 16분 30초의 15회 사이클, 및 65℃에서 5분의 최종 신장. 결과를 확인하기 위해, 5 ㎕ PCR 산물을 0.4% 아가로오스 겔에서 시각화했다.
RT- PCR용 프라이머
서열번호


No.



명칭



올리고 서열 5'-3'
15 2312 2312-Fr1-T7G-F3 GAtaatacgactcactatagATTAAAGGTTTATACCTTCCCAGGTAAC
16 1786 1786-COV-2 GATGCCAAAATAATGGCGATCTC
17 1787 1787-COV-3 GTTGGTTGCCATAACAAGTGTG
18 1788 1788-COV-4 CTAATTGAGGTTGAACCTCAACAATTG
19 1789 1789-COV-5 GAGTATGGTACTGAAGATGATTACCAAG
20 1790 1790-COV-6 CTAGGTGGAATGTGGTAGGATTAC
21 1791 1791-COV-7 GCTGTTACAGCGTATAATGGTTATCTTAC
22 1792 1792-COV-8 GCTGGTTTAAGTATAATGTCTCCTACAAC
23 1793 1793-COV-9 GCACAAAACCAGTTGAAACATCAAATTC
24 1794 1794-COV-10 GCAACTAGTGTTTTGAGTTTTTCCATTG
25 1795 1795-COV-11 GTGAAGAATCATCTGCAAAATCAGC
26 1796 1796-COV-12 CAAATGATATAAGCAATTGTTATCCAGAAAGG
27 1797 1797-COV-13 GCCTTTAATACTTTACTATTCCTTATGTCATTCAC
28 1798 1798-COV-14 CCAGACAAACTAGTATCAACCATATCC
29 1799 1799-COV-15 GCTATGGGTATTATTGCTATGTCTG
30 1800 1800-COV-16 CCTACAAGGTGGTTCCAGTTC
31 1801 1801-COV-17 CGACAGATGTCTTGTGCTG
32 1802 1802-COV-18 GGTATCCAGTTGAAACTACAAATGG
33 1803 1803-COV-19 GATCAGACATACCACCCAAATTG
34 1804 1804-COV-20 CTTATGTATTGTAAGTACAAATGAAAGACATCAG
35 1805 1805-COV-21 GGTGATGATTATGTGTACCTTCCTTAC
36 1806 1806-COV-22 CTGTTAATTGCAGATGAAACATCATGC
37 1807 1807-COV-23 GTGTGTAGACTTATGAAAACTATAGGTCC
38 1808 1808-COV-24 CATACAAACTGCCACCATCAC
39 1809 1809-COV-25 CCTTGTAGTGACAAAGCTTATAAAATAGAAG
40 1810 1810-COV-26 CTGGTGCAACTCCTTTATCAG
41 1811 1811-COV-27 GCAAAGAATGCTATTAGAAAAGTGTGAC
42 1812 1812-COV-28 GATAGATTCCTTTTTCTACAGTGAAGGATTTC
43 1813 1813-COV-29 GACTCCTGGTGATTCTTCTTCAG
44 1814 1814-COV-30 CTCTAGCAGCAATATCACCAAGG
45 1815 1815-COV-31 GCACAAGTCAAACAAATTTACAAAACAC
46 1816 1816-COV-32 CAAAAGGTGTGAGTAAACTGTTACAAAC
47 1817 1817-COV-33 CTCACTCCCTTTCGGATGG
48 1818 1818-COV-34 GAGGTTTATGATGTAATCAAGATTCCAAATGG
49 1819 1819-COV-35 GCTACAGGATTGGCAACTATAAATTAAAC
50 1820 1820-COV-36 CCATTCTAGCAGGAGAAGTTCC
51 1821 1821-COV-37 GCAATCCTGCTAACAATGCTG
52 1822 1822-COV-38 ttttTTTTTTTTTTTTTTTTTTTTTGTCATTCTCCTAAGAAGCTATTAAAATC
시험관내(in vitor) 전사
전장 PCR로부터 증폭된 DNA 주형을 RNA 작업 전에 기존의 페놀/클로로포름 추출 및 뒤이은 3M 아세트산나트륨 존재 하에서의 에탄올 침전을 이용하여 정제하였다. 제조사의 설명서에 따라, 일부 수정으로, HiScribe T7 Transcription Kit(New England Biolabs)를 사용하여 RNA 전사체를 시험관내에서 합성하였다. 500ng DNA 주형 및 2.4 ㎕ 50 mM GTP(캡 유사체(cap analog) 대 GTP 비율은 1:1)를 첨가하여, 20 ㎕ 반응을 구성했다. 반응물을 37℃에서 3시간 동안 인큐베이션하였다. 그 후, 염화리튬 침전에 의해 침전시키고 정제하고, 70% 에탄올로 1회 세척했다. N 유전자 DNA 주형은 또한 특정한 정방향 프라이머(2320-NF: GAAtaatacgactcactataggGACGTTCGTGTTGTTTTAGATTTCATCTAAACG(서열번호 53))(서열에서 소문자 서열은 T7 프로모터를 나타내고 밑줄 친 서열은 N 유전자 ORF의 상류 5' NTR을 나타냄) 및 역방향 프라이머(2130-NR, tttttttttttttttttttttGTCATTCTCCTAAGAAGCTATTAAAATCACATGG(서열번호 54))를 사용한 PCR에 의해 cDNA로부터 준비했다.
RNA 전기천공에 의한 Vero E6 세포의 형질감염
Vero E6 세포는 ATCC(CRL-1586)로부터 얻었고 10% FBS가 보충된 DMEM 고글루코스에서 유지시켰다. 바이러스 RNA를 형질감염시키기 위해, 제조사의 설명서에 따라, Maxcyte ATX 시스템을 사용하여 5 ㎍의 캡핑된 WA1-N mRNA와 함께 10 ㎍의 정제된 전장 게놈 RNA 전사체를 Vero E6 세포에 전기천공했다. 요약하면, 3-4 x 106개의 Vero E6 세포를 Maxcyte 전기천공 완충액으로 1회 세척하고 100 ㎕의 동일한 완충액에 재현탁시켰다. 세포 현탁액을 RNA 샘플과 부드럽게 혼합하고, RNA/세포 혼합물을 Maxcyte OC-100 처리 어셈블리로 옮겼다. 미리 프로그래밍된(pre-programmed) Vero 세포 전기천공 프로토콜을 이용하여 전기천공을 수행했다. 37C/5%CO2에서 형질감염된 세포를 30분 동안 회수한 후, 세포를 가온된(warm) DMEM/10% FBS에 재현탁하고, 다양한 접종 밀도(총 세포의 1/2, 1/3, 1/6)로 3개의 T25 플라스크에 분배했다. 형질감염된 세포를 37℃/5%CO2에서 6일 동안 또는 CPE가 나타날 때까지 인큐베이션했다. 감염 배지는 2일, 4일, 6일차에 수집하고, 2일 및 4일차에 배지를 완전히 교체했다(DMEM/5%FBS). 생성된 바이러스는 빠르게는 형질감염 후 2일 만에 플라크 분석으로 검출할 수 있었고, 최대(peak) 바이러스 생성은 4-6일 사이에 나타났다.
Vero E6 세포에서 SARS- CoV -2의 스톡 바이러스 계대 및 플라크 적정(plaque titration)
DMEM/2%FBS에서 연속 10배 희석액을 제조했다. 각 희석액 0.5ml를 80% 컨플루언시(confluent)인 까지 Vero E6 세포의 12-웰에 첨가했다. 37℃에서 1시간 동안 인큐베이션한 후, 접종물을 제거하고, 1x DMEM, 0.3% 트라가칸트 검(Gum Tragacanth), 2% FBS 및 1x 페니실린/스트렙토마이신을 함유한 반고체 오버레이(semisolid overlay) 2ml를 웰당 첨가했다. 37℃/5%CO2에서 3 또는 4일 동안 인큐베이션한 후, 오버레이를 제거하고, 웰을 PBS로 부드럽게 세정하고, 뒤이어 고정하고, 크리스탈 바이올렛(Crystal Violet)으로 염색했다.
시험관내 전사로부터 수득된 RNA를 사용하여 Vero E6 세포를 wt WA1 및 CDX-005로 형질감염시키고, Vero E6 세포에서 적정된 살아있는 바이러스를 회수했다. 3일 동안 인큐베이션한 후, 플라크 분석을 염색하였다.
다단계 바이러스 성장 역학(Multisetp Virus Growth Kinetics)
Vero 세포(WHO 10-87)를 5% 소태아혈청(FBS)을 포함하는 1ml DMEM을 담은 12 웰 플레이트에서 거의 컨플루언시에 도달할 때까지 3일 동안 성장시켰다. 감염 전, 사용된 세포 배양 배지를 1% FBS 및 30 PFU의 표시된 바이러스(0.0001 MOI)를 포함하는 0.5ml의 신선한 DMEM으로 교체했다. 33℃ 또는 37℃/5% CO2에서 1시간 동안 인큐베이션한 후, 접종물을 버리고, 세포 단층을 Dulbecco PBS 1ml로 1회 세척하고, 뒤이어 1% FBS를 포함하는 DMEM 1 ml를 첨가했다. 감염된 세포를 33℃ 또는 37℃에서 0, 6, 24, 48 또는 72시간 동안 배양했다. 표시된 시점에서, 세포와 상층액을 수집하고(시점당 하나의 웰), -80℃에서 1회 동결시키고, 해동했다. 용해물 중 감염성 바이러스 역가는 37℃에서 Vero E6에서 플라크 분석에 의해 결정하였다.
결과
개별 게놈 단편 1-19의 생성 및 중첩 PCR에 의해 생성된 전체 게놈 DNA는 잘 진행되었고, 0.4% 아가로스 겔에서 투명한 밴드가 관찰되었다.
시험관내 전사는 Vero E6 세포를 S-WWW(WT) 및 S-WWD로 형질감염시키고 Vero E6 세포에서 적정된 살아있는 바이러스를 회수하는 데 사용되는 RNA를 생성했다. 3일 동안 인큐베이션한 후, 플라크 분석을 염색하고, 부분적으로 스파이크가 탈최적화된(spike-deoptimized) S-WWD 후보(도 1)에서 관찰된 더 작은 플라크 및 40% 감소된 최종 역가를 관찰했다.
실시예 3
CDX-005 프리-마스터(pre-master) 바이러스 시드(preMVS)를 하기와 같이 개발했다: SARS-COV-2 BetaCoV/USA/WA1/2020(GenBank: MN985325.1)의 RNA를 감염되고, 특성규명된 Vero E6 세포(ATCC CRL-1586 Lot # 70010177)로부터 추출하고, 시판되는 시약 및 키트를 사용하여 RT-PCR을 통해 19개의 중첩 DNA 단편으로 전환시켰다. 중첩 PCR을 이용하여 19개의 1.8kb wt 게놈 단편을 하나의 탈최적화된 스파이크 유전자 카세트를 이용하여 함께 연결했다. 구체적으로, 스파이크 ORF의 1,272개 뉴클레오티드는 게놈 위치 24115-25387에서 탈최적화된 인간 코돈 쌍이어서, 모 WA1/2020 바이러스 대비 283개의 침묵 돌연변이 변화를 초래했다. 결과적으로 수득된 전장 cDNA를 시험관 내에서 전사하여 전장 바이러스 RNA를 제조했다. 바이러스 회수(viral recovery)는 2020년 4월에 처음으로 의뢰한 Stony Brook University(NY)의 새로운 BSL-3 실험실에서 수행되었고, 본 발명자들의 프로젝트는 그 실험실에서 진행된 유일한 프로젝트였다. 그 후, 이 바이러스 RNA를 특성규명된(특성화된) Vero E6 세포(Lot # 70010177)에 전기천공했다. 이는 CDX-005 바이러스를 생성했고(도 1), 이 바이러스는 후속으로 Vero E6 세포에서 추가적으로 계대되어 계대 1(passage 1), P1(Lot # 1-060820-9-1)을 생성했다. P1 바이러스(P1 material)은 하기 기술되는 햄스터 연구에 사용되었다.
실시예 4
햄스터 연구
COVID-19 모델링에 관한 WHO 임시 전문가 실무 그룹(WHO ad hoc Expert Working Group)은 붉은털원숭이(rhesus macaque)와 흰족제비(white ferret)가 경증 내지 중등도의 인간 질병을 재현하는 것으로 보인다고 결론을 내렸지만, 보다 최근 연구에서는 시리아 골든 햄스터(Syrian Golden Hamster)가 이 감염의 더 심각한 폐 징후(pulmonary manifestation)를 재현하는 데 더 유용한 모델일 수 있다는 것을 시사한다.
5-6주령의 수컷 시리아 햄스터(Charles Rivers) 36마리를 연구에 활용했다. 챌린지를 위해, 햄스터를 복강내 주사를 통해 케타민(100 mg/kg) 및 자일라진(10 mg/kg)으로 마취시키고, 0일차에 5x104 PFU/ml 또는 5x103 PFU/ml wt WA1 SARS-CoV-2 또는 5x104 PFU/ml CDX-005의 명목 용량(nominal dose) 0.05ml를 비강 내로 접종했다(그룹당 12마리). 동물을 매일 2회 관찰하고 체중을 8일차까지 매일 수집하고, 16일차부터 18일차까지 매일 수집했다. 16일차에, 3마리의 CDX-005 접종된 동물에 5x104 PFU/ml wt WA1을 비강내로 챌린지했다. 5x104 PFU/ml(N=3) 또는 5x103 PFU/ml(N=3)의 wt WA1로 접종된 6마리의 나이브(naive) 햄스터가 대조군으로 작용했다. 두 접종 용량에서 역가가 중첩되어, 본 발명자들은 이 두 그룹을 결합했다.
중량
이들 36마리의 햄스터 및 추가의 58마리(반은 암컷/반은 수컷)의 5-6주령 시리아 골든 햄스터(찰스 리버스(Charles Rivers))를 이용하여 중량 감소로 평가된 햄스터 건강에 대한 CDX-005 및 wt WA1 접종의 효과를 연구했다. (이러한 추가 햄스터는 현재 다른 CDX-005 및 wt WA1 매개 효과에 대해 평가되고 있다.) 전체적으로, 40 마리의 5 x 104 PFU CDX-005, 40 마리의 5 x 104 PFU wt WA1 및 12 마리의 5 x 103 PFU wt WA1을 최대 9일 동안 매일 계량했다. 동물들이 접종 후(PI) 다양한 일자에 다른 종점(endpoint)를 위해 희생되므로, 각 그룹에 대해 N은 시간의 경과에 따라 감소했다. 5 x 104 PFU CDX-005 및 5 x 104 PFU wt WA1의 최소 N은 10이었고, 5 x 103 PFU wt WA1의 경우 3이었다.
조직 채취(Tissue Harvesting)
접종 후 2, 4, 6일차에, 각 그룹의 햄스터 3마리와 16일차에 챌린지된 동물 중 햄스터 3마리를 18일차에 뷰타나시아(Beuthanasia) 150mg/kg의 정맥내 주사로 안락사시켰다. 바이러스 부하(viral load) 측정을 위해 좌측 폐를 수집했다. 바이러스 부하를 측정하기 위해, 16일차에 챌린지된 동물에서 18일차에 조직 균질화기(Omni 균질화기)를 사용하여 항생제가 포함된 DMEM에서 10% w/v로 폐를 균질화시켰다. 본 발명자들은 이 소형 동물들에서 비강 세척(nasal wash)을 수행했으나, 재현가능한 세척액을 얻는데 성공하지 못했다.
조직병리학
조직병리학은 맹검 자격을 갖춘 수의 병리학자(blined licensed veterinary pathologist)에 의해 수행되었다. 폐, 뇌, 및 신장을 포르말린으로 고정하고 탈수시킨 후 파라핀에 포매하고 헤마톡실린과 에오신으로 염색했다. 광학현미경 평가는 맹검 공인 수의 병리학자(blinded board-certified veterinary pathologist)에 의해 수행되었다. 각 조직을 여러 병리학적 파라미터에 따라 등급을 평가하고, 절편(section)을 0=정상, 1=최소(Minimal), 2=경증(Mild), 3=중등도(Moderate), 4=현저(Marked) 또는 5=중증(Severe)로 점수를 매겼다. 모든 조직의 평가는 세포 침윤의 평가를 포함했다. 각 기관에 대해 최소 5개의 절편을 검사하고 점수를 평균했다.
바이러스 부하(Viral Load)
채취된 조직에서 qPCR 및 TCID50에 의해 바이러스 부하를 측정했다. 바이러스 부하를 측정하기 위해 조직을 비드 밀 균질화기(bead mill homogenizer)(Omni)를 사용하여 항생제를 포함하는 DMEM에서 10% w/v로 균질화시켰다. 감염성 바이러스 역가는 Vero E6 세포에서 폐 균질액의 10배 연속 희석을 적정하는 50% 조직 배양 감염 용량(50% tissue culture infectious dose: TCID50) 분석에 의해 결정했고, ml당 log10 TCID50 유닛으로 표시된다. 제조사의 프로토콜에 따라 Quick-RNA Viral Kit(Zymo Research)를 사용하여 100 ㎕의 뇌 균질액으로부터 RNA를 추출했다. 하기 PCR 사이클링 조건을 이용하고, iTaq 1-단계 범용 프로브 키트(Bio-Rad)를 사용하여 qRT-PCR을 수행했다: 95℃에서 15초, 60℃에서 15초, 및 72℃에서 20초의 사이클 40회.
항체 - 플라크 감소 중화 역가(Plaque Reduction Neutrailization Titer)
PI 16일차에 수집된 햄스터 혈청을 56℃에서 30분(30') 동안 열 불활성화시켰다. 1:5의 초기 희석으로 시작하여, 96웰 U-바닥 플레이트 중 DMEM/1% FBS에서 50 ㎕ 2배 연속 희석을 수행했다. 50 ㎕ DMEM/1% FBS 중 약 30 PFU의 SARS-CoV-2 Washington/1/2020을 혈청 희석물에 첨가하고, 혼합하여, 중화 웰에서 최종 부피를 100 ㎕로 만들고, 총 초기 혈청 희석을 1:10으로 만들었다. 희석 플레이트를 37℃/5% CO2에서 1시간 동안 인큐베이션시켰다.
Vero E6 세포(1일 전 DMEM/5%FBS에 접종)의 합류성 단층(confluent monolayer)을 포함하는 24-웰 플레이트 상의 세포 성장 배지를 제거하고, 150 ㎕의 신선한 DMEM/1%FBS를 첨가하고, 뒤이어 100 ㎕의 각 중화 반응액을 첨가했다. 37℃/5% CO2에서 1시간 동안 바이러스를 흡착시킨 후, 0.75 ml 반고체 오버레이를 1 ml의 최종 부피 중 1 X DMEM, 1.75% FBS, 0.3% 트라가칸트 검, 1x 페니실린 + 스트렙토마이신의 최종 농도로 24 웰 플레이트에 첨가하였다. 24 웰 플레이트를 37℃에서 48시간 동안 인큐베이션하여 플라크가 형성될 수 있게 했다. 50% 메탄올/4% 포름알데히드 중 1% 크리스탈 바이올렛으로 세포 단층을 고정하고 염색하여 플라크를 시각화했다. 플라크 감소 중화 역가(PRNT)50, 80, 90은 비-중화 웰(나이브 햄스터 혈청 포함) 중 플라크 수와 비교하여 미리 정의된 컷오프(50%, 80%, 90%)에 따라 플라크 수를 감소시킨 마지막 혈청 희석 비율의 역수로 결정되었다. 가장 낮은 희석 비율(1:10)에서 중화에 실패한 혈청에 5의 역가를 부여하고, 가장 높은 테스트 혈청 희석 비율(1:1280)에서 중화된 혈청에는 ≥1280의 역가를 부여했다.
항체 - IgG ELISA
96 웰 플레이트를 50ng/ml BSA/0.05M 탄산염/중탄산염 완충액 pH 9.6에서 30ng/웰의 SARS-CoV-2(2019-nCoV) 스파이크 S1-His(Sino Biological)로 4℃에서 밤새 코팅시켰다. 플레이트를 37℃에서 2시간 동안 PBS 중 10% 염소 혈청으로 차단하고, 세척 완충액(PBS 중 0.1% Tween 20)으로 4회 세척한 후, PBS 중 10% 염소 혈청/0.05% Tween-20에 연속적으로 희석된 혈청(1:10 출발 희석, 그 후 2배)과 37℃에서 1시간 동안 인큐베이션시켰다. 플레이트를 세척 완충액으로 4회 세척한 후 1:10,000 호스래디쉬 퍼옥시다아제(horseradish peroxidase: HRP) 접합 친화도 순수 염소 항-시리아 햄스터 IgG(H & L)(Jackson ImmunoResearch Laboratories, Inc.)와 37℃에서 1시간 동안 인큐베이션시켰다. 인큐베이션 후에, 플레이트를 세척 완충액으로 4회 세척하고 비색 반응을 위해 Thermo Scientific OPD(o-페닐렌디아민 디히드로클로라이드)를 첨가했다. 암소에서 25℃에서 10분간 인큐베이션한 후, 2.5M 황산 용액 50ml를 첨가하여 반응을 정지시키고, 결과적인 흡광도를 마이크로플레이트 판독기에서 490nm에서 판독했다. 다양한 그룹 간의 상대적 IgG 수준을 보고하고, OPD 비색 반응 산물의 강도가 백그라운드(혈청 불포함) 대조군 강도보다 5배 더 높은 수준에 도달한 희석 비율의 로그로 비교했다.
실시예 5
CDX -005 특성
CDX-005는 wt WA1 바이러스와 비교하여 스파이크 유전자에 283개의 침묵 돌연변이를 포함한다. 결과적으로 수득된 전장 wt WA1 및 탈최적화된 cDNA를 시험관 내에서 전사하여 전장 바이러스 RNA를 제조하고, Vero E6 세포에 전기천공했다. 형질감염된 세포를 6일 동안 또는 CPE가 나타날 때까지 인큐베이션했다. 감염 배지를 2일, 4일, 6일차에 수집했다. 바이러스 역가는 Vero E6 세포에 대한 플라크 분석에 의해 결정했다. 플라크는 빠르게는 형질감염 후 2일차에 가시적으로 나타났고, 4-6일차에 최대 바이러스 생성이 이루어졌다. CDX-005 및 CDX-007에 의해 형성된 플라크는 wt보다 작았으나, 둘 다 Vero E6 세포에서 강건하게 성장하여, 그들이 대규모 제조(scale-up manufacturing)에 적합하다는 것을 나타냈다. 따라서, 본 발명자들의 다른 SAVE 백신과 마찬가지로, 본 발명자들은 상이한 약독화 정도를 갖는 여러 백신 후보를 신속하게 생성할 수 있었다.
CDX-005에서, 스파이크 ORF의 1,272개의 뉴클레오티드는 인간 세포에 대해 탈최적화된 코돈 쌍이었고, 283개의 침묵 돌연변이를 생성했다. 부가적인 약독화 및 안전성을 위해 스파이크 단백질에서 다염기성 푸린 절단 부위(polybasic furin cleavage site)를 제거했다.
본 발명자들은 2020년 4분기까지 대규모 백신 생산을 시작할 수 있도록 GMP 특성규명된 AOF(animal origin-free) Vero(WHO-10-87) 세포에서 CDX-005에 대한 성장 최적화 연구를 수행했다. 33℃에서의 성장은 37℃에서보다 CDX-005 및 wt WA1 둘 다에 대해 더 높은 역가를 가져온다. 바이러스는 세포변성 효과(cytopathic effect: CPE)가 관찰되기 전에 피크(peak)에 도달하고, 바이러스의 80-90%가 피크에서 세포와 회합된다. 역학(kinetics)은 다르나, 0.01 MOI와 0.0001 MOI에서 유사한 바이러스 역가를 달성할 수 있다.
본 발명자들은 또한 바이러스 채취를 위한 최적의 조건을 조사했다. Vero WHO 10-87 세포를 37℃/5% CO2에서 5% 소태아혈청(FBS)을 포함하는 DMEM에서 성장시켰다. 33℃ 배양물에서 CDX-005에 의한 감염 후 48시간 차에, 도 9에 기술된 계획(scheme)을 이용하여, 세포 및 상층액을 채취했다.
데이터는 33℃에서 0.01 MOI 감염 후 48시간에 대부분의 CDX-005가 세포와 회합되나(cell-associated)(~80-90%), Vero 세포로부터의 바이러스 회수는 간단하다는 것을 입증한다. 저장액 용해(hypotonic lysis)는 CDX-005를 채취하는 효과적인 수단이고, 넓은 용해 창(lysis window)은 이 방법이 어느 정도 유연성이 유용할 수 있는 대규모 배치(scaled batch)에서 실행 가능할 것이라는 것을 시사한다.
동결/해동 용해(freeze/thaw lysis)도 효과적이고, FBS는 필요하지도 유익하지도 않다. 감염 동안 FBS가 Vero 세포의 과증식을 유발하여 바이러스 수율을 감소시킬 수 있고, FDA는 무혈청 생산을 선호하기 때문에, 이것은 바람직하다. 또한, FBS가 최소한 2회의 동결/해동 사이클 후에 안정화를 거의 또는 전혀 제공하지 않았기 때문에, CDX-005는 일반 DMEM 중에 동결되었을 때 안정한 것으로 보인다. 따라서, 최적의 채취 시기에, 33℃ 또는 37℃에서 성장했는지 여부에 관계없이, 2-3 x 107 PFU/ml의 CDX-005의 조 벌크 역가 또는 약 106 PFU/cm2 성장 표면적(grwoth surface area)이 통상적으로 관찰된다.
이들 연구에 기초하여, 본 발명자들은 현재 Vero(WHO-10-87) 세포에 33℃에서 0.01 MOI로 접종하여 CDX-005를 성장시키고 있다. 본 발명자들은 영국에서 인간에서의 최초 연구(first-in-human study)를 위해 5% 수크로오스 및 5% 글리신을 포함하는 DMEM의 백신 제형을 선택하고 테스트했다. 이 제형에서, CDX-005는 적어도 3회의 동결-해동 주기와 -80℃에서 1개월 동안(현재까지 테스트된 가장 긴 저장 기간) 안정적이다.
마지막으로, CDX-005의 게놈 안정성을 평가하는 첫 번째 단계로서, Vero(WHO 10-87) 세포에서 바이러스를 증식시킨 후 바이러스 계대 1-6을 시퀀싱했다. 데이터는 바이러스가 매우 안정적이라는 것을 나타낸다. 계대 6의 시퀀에서 하위집단(subpopulation)이 나타나지 않았다. 본 발명자들은 9 계대를 성장시키고 채취했다.
실시예 6
CDX-005를 최초 인간 임상 시험으로 전환하기 위한 준비(prelude)로서, 본 발명자들은 백신에 대한 비-인간 영장류의 반응을 조사했다. 본 발명자들은 15마리의 아프리카 녹색 원숭이에, 6마리에는 106 PFU wt WA1, 6마리에는 106 PFU CDX-005, 3마리에는 Dulbecco PBS를 비강 내로 접종했다. 본 결과는 wt WA1 및 CDX-005 접종된 동물의 세척액(lavage fluid) 내 바이러스 역가는 PI 4일차에 유사했고, 바이러스 역가는 wt WA1에서는 높게 유지되었지만 CDX-005 접종된 원숭이에서는 검출할 수 없을 정도로 급감했다는 것을 보여준다. 이 데이터는 SARS-CoV-2 백신으로서의 CDX-005의 잠재력을 더욱 입증한다.
실시예 7
SARS- CoV2 베타 바이러스 CDX .005.1의 회수
CDX-005.1은 이전에 회수된 임상 단계 CDX-005(우한 계통)의 백본을 기반으로 하다. CDX-005 스파이크 유전자에는 Codagenix SAVE(Synthetic Attenuated Virus Engineering) 플랫폼에서 설계한 283개 동의 돌연변이(synonymous mutation)의 코돈-쌍 탈최적화 카세트가 포함되어 있다. 스파이크 유전자는 푸린 절단 부위의 결실(36개 뉴클레오티드 결실)에 의해 추가로 변형되었다. 특정 이론에 얽매이기를 원치 않으나, 푸린 절단 부위의 부재가 그러한 돌연변이를 갖는 SARS-CoV-2의 인간 숙주에서 약독화에 기여할 수 있다고 사료된다. 따라서, 본 발명자들은 CDX-005를 CDX-005.1의 백본으로 사용하기로 결정했다. 푸린 절단 부위 결실은 게놈 단편 F15에 위치한다.
SARS-CoV-2 베타 백신 후보(CDX-005.1)에 대한 서열을 정의하기 위해, GISAID의 다양한 베타 변이체를 선택하고 NCBI Blastn 다중 서열 정렬을 통해 CDX-005와 비교했다. CDX-005 스파이크에 대한 9개의 주요 돌연변이가 본 발명자들이 평가한 대부분의 베타 서열의 스파이크 유전자에 존재했다(표 5).
표 5. CDX-005.1 스파이크를 생성하기 위한 CDX-005 스파이크에 대한 유전자 변형 요약
스파이크 유전자 중 위치 (nt) 원래의
뉴클레오티드
돌연변이
뉴클레오티드
결과적인 아미노산 변화
21614 C T L18 (CTT) → F (TTT)
21801 A C D80 (GAT) → A (GCT)
22206 A G D215 (GAT) → G (GGT)
22286-22294 CTTGCTTTA 결실 Del242-244
22813 G T K417 (AAG) → N (AAT)
23012 G A E484 (GAA) → K (AAA)
23063 A T N501 (AAT) → Y (TAT)
23403 A G D614 (GAT) → G (GGT)
23628 C T A701 (GCA) → V (GTA)
탈최적화된 CDX-005.1 게놈을 구축하기 위해, 본 발명자들은 9개의 확인된 SARS-CoV-2 베타 돌연변이를 포함하는 새로운 단편 F14 및 F15를 신생(de novo) 합성했다. 나머지 17개 단편(F1-F13 및 F16-19)은 CDX-005 1상 임상시험 물질로부터 회수하였다. CDX-005.1의 전장 합성 cDNA 게놈을 조립하기 위해, 19개의 중첩 PCR 단편을 단일 중첩 PCR 반응으로 조합했다.
결과적으로 생성된 전장 PCR-조립된 cDNA 게놈을 F1의 5' 말단에 추가된 T7 프로모터에 의해 구동되는 T7 RNA 폴리머라아제를 사용한 시험관내(in vitro) 전사를 위한 주형으로 사용하였다. 시험관내 전사된 핵단백질(NP) 헬퍼 mRNA와 함께 시험관내 전사된 전장 게놈 RNA를 전기천공에 의해 Vero WHO 10-87 세포에 동시-형질감염시켰다. 이 형질감염으로 인해 생성된 바이러스를 CDX-005.1로 명명한다.
CDX-005(SIIPL 백신 배치 403002)의 바이러스 게놈을 역전사에 의해 cDNA로 전환시키고, 17개의 중첩 서브-게놈(sub-genomic) DNA 단편으로 PCR 증폭시켰다. 또한, 본 발명자들은 두 개의 새로운 베타-특이적 단편 14 및 15를 신생 합성했다. 각 단편은 그의 인접한 단편(들)과 약 200 bp 중첩되었다. 정제된 개별 CDX-005.1 단편 F14, F15 및 CDX-005 게놈 단편 F1-F13 및 F16-F19를 바이러스 게놈을 측접하는(flanking) 2개의 프라이머에 의한 단일 튜브 오버랩 PCR 반응에서 풀링했다. 바이러스 게놈의 5' 말단에 상응하는 정방향 프라이머(2312)는 상류 T7 RNA 폴리머라아제 프로모터를 포함했다. 19-단편 오버랩 PCR은 약 30 kb의 DNA 앰플리콘을 생성하여, 전체 게놈 cDNA가 성공적으로 생성되었다는 것을 시사했고, 0.5% 아가로오스 겔에서 명확한 밴드를 볼 수 있었다. 정제 후, PCR로 조립된 전장 cDNA 게놈을 G 캡-유사체 존재 하에 시험관내 전사에 의한 감염성 바이러스 RNA의 합성을 위한 주형으로 사용했다. 결과적으로 생성된 전사체 RNA는 나란히 전개된 DNA 래더(ladder)와 비교하여 8 kb 내지 1 kb 범위의 끌림(smear)으로 나타났다.
PCR-조립된 전장 cDNA 게놈의 무결성(integrity)을 테스트하기 위해, 제한 엔도뉴클레아제 Nhe I에 의한 분해(digestion)를 이용하였다. CDX-005.1 게놈 cDNA는 스파이크의 탈최적화된 영역에 설계된 추가적인 Nhe I 부위 때문에, 독특하고 구별되는 단편 패턴을 생성했다.
Nhe I 처리된 cDNA 게놈의 단편 패턴은 인 실리코(in silico)-예측 DNA 단편 크기와 일치하여, 바이러스 cDNA 게놈이 정확하게 조립되었다는 것을 나타냈다. 주목되는 것은 아가로오스 겔로 이동하지 않은 PCR 산물의 부분은 Nhe I 분해 후 사라지고 예상 크기의 Nhe I RFLP 단편으로 전환되어, 이 물질도 정확하게 형성된 전장 게놈 cDNA에 해당했다는 것을 시사한다는 것이다.
역유전학-유래(reverse genetics-derived) 합성 CDX-005.1 바이러스는 헬퍼로서 핵단백질 mRNA와 함께 시험관내에서 전사된 게놈 RNA의 Vero 10-87 세포 내로의 동시-전기천공에 의해 구제되었다. CDX-005.1 백신 균주의 바이러스 회수는 승인된 기관 생물안전성 위원회(Institutional Biosafety Committee) 가이드라인에 따라 BSL2+(biosafety level 2 enhanced) 조건 하에서 수행되었다. 감염성 CDX-005.1 바이러스는 전기천공(4.6x105 PFU/ml) 후 3일차에 플라크 분석에 의해 배양 상층액에서 검출되었으며, 6일차까지 꾸준히 약 107 PFU/ml로 증가했다(도 9).
본 발명자들은 이전에 원래의 CDX-005 백신 균주가 인간 체온(human heat)과 동등한 온도에서 바이러스 차단(shutoff)을 그럴듯하게 예측할 수 있기 때문에, 생 약독화 백신에 대한 바람직한 안전성 특징인 40℃에서 플라크 형성에 대해 온도 민감성이라 것을 관찰했다. 그 표현형이 CDX-005.1까지 확장되는지 테스트하기 위해, 허용 온도(37℃) 및 제한 온도(40℃)에서 CDX-005와 CDX-005.1의 병렬(side by side) 플라크 분석을 수행했다. 실제로, 본 발명자들은 두 바이러스 모두의 상당한 온도 민감성 표현형을 관찰했고, CDX-005의 경우 플라크 형성이 약 1,000배 감소하고(이전 관찰 확인), CDX-005.1은 어떤 희석 비율에서도 검출 가능한 플라크를 형성할 수 없었다(도 10).
중첩 PCR을 통한 코로나바이러스 게놈 조립의 확립된 방법을 이용하여, Codagenix는 합성 서열의 접수 후 3주 내에 SARS-CoV-2 변이체 베타(CDX-005.1)에 대한 생백신 후보를 회수했다.
CDX-005.1은 허용 온도(33℃-37℃)에서 CDX-005(1-5 x107 PFU/mL)와 유사한 역가로 성장하고 유사한 플라크 형태를 보인다. CDX-005.1은 모 CDX-005(우한(Wuhan) 계통)에서 이전에 관찰된 특징인 40℃에서 성장에 대해 성장에 대해 심하게 온도 제한되었다(temperature restricted).
실시예 8
계대 1에서 베타( CDX -005. 1)의 시퀀싱
SARS-CoV-2 베타 백신 후보에 대한 서열을 정의하기 위해, GISAID에서 10-20개의 베타 변이체를 선택하고 NCBI Blastn 다중 서열 정렬을 통해 CDX-005와 비교했다. 평가된 모든 베타 서열의 스파이크 유전자에는 10개의 주요 돌연변이가 존재했으며 9개의 뉴클레오티드가 결실되었다. 그 후, 원래의 CDX-005 스파이크 유전자의 10개 뉴클레오티드를 이들 선택된 돌연변이로 치환하여 베타 변이체 스파이크 서열을 수득했다. 바이러스 백본은 푸린 절단 부위가 결실된 CDX-005이다(36-nt 결실).
새로 구축된 전장 베타 바이러스 게놈을 시험관내에서 전사시키고, 뒤이어 RNA를 정제했다. 그 후, 정제된 게놈 RNA를 WHO 10-87 Vero 세포에 형질감염시켰다. 계대 1에서 회수된 바이러스를 채취하고, Trizol 프로토콜에 의해 바이러스 RNA를 추출했다. 표준 RT-PCR을 수행하였고, 19개의 PCR 단편을 PCR 증폭시킨 후 Sanger 시퀀싱을 수행하여 바이러스 정체(identity)를 확인하고 가짜 돌연변이를 파악했다. 시퀀싱 반응물은 BSL2 격리 하에 Codagenix에서 혼합되고 시퀀싱을 위해 Genewiz에 제출되었다. 결과적으로 수득된 서열을 백신 균주 CDX-005의 백본에 있는 COVID-베타 변이체의 설계된 서열과 정렬시켰다.
10개의 뉴클레오티드 돌연변이와 9개의 결실이 하기와 같이 나열된다:
베타 백신 후보의 설계된 서열 CDX.005.1과 비교하여, 계대 1에서 수득된 서열은 3개의 점 돌연변이, 즉 A1870G, A7917U 및 G14540U를 가졌다. 시퀀싱 트레이스(sequencing trace)는 돌연변이된 뉴클레오티드를 가진 게놈이 바이러스 복제 동안 그들의 원래의 대응물을 능가한다는 것을 입증했다. 돌연변이된 뉴클레오티드는 계대 1에서 이미 우세한 종이어서, 이는 그들이 세포 적응(cell-adapted) 돌연변이라는 것을 나타낸다.
A1870G를 제외하고, 2개의 돌연변이는 아미노산 변화를 초래했다. 설계된 서열과 다른 돌연변이가 하기에 열거된다:
실시예 9
CDX -005.2, 델타의 회수
유전자 변형, 생 약독화 SARS-CoV-2 델타 변이체 백신 후보 CDX-005.2를 Codagenix에서 개발한 코로나바이러스(CoV)에 대한 역유전학 접근법에 의해 생성하였다. 본 발명자들의 접근 방식은 전적으로 "테스트 튜브-기반"이며 CoV 게놈을 유전적으로 조작하기 위해 중간 클로닝 숙주(예를 들면, 대장균 또는 효모)의 필요성을 제거한다. 이는 본 발명자들이 전통적인 박테리아- 또는 효모-기반 역유전학 시스템에서 흔히 당면하게 되는 CoV 게놈의 유전적 불안정성/독성 문제를 회피할 수 있게 했다.
CDX-005.2는 이전에 Codagenix에서 회수된 임상 단계 CDX-005(우한 계통)의 백본을 기반으로 한다. SARS-CoV-2 베타 백신 후보(CDX-005.2)에 대한 서열을 정의하기 위해, GISAID의 다양한 베타 변이체를 선택하고 NCBI Blastn 다중 서열 정렬을 통해 CDX-005와 비교했다. CDX-005 스파이크에 대한 8개의 주요 돌연변이가 모든 평가된 델타 서열의 스파이크 유전자에 존재했다(표 6).
표 6. CDX-005.2 스파이크를 생성하기 위한 CDX-005 스파이크에 대한 유전자 변형 요약
탈최적화된 CDX-005.2 게놈을 구축하기 위해, 본 발명자들은 8개의 확인된 SARS-CoV-2 델타 돌연변이를 포함하는 새로운 단편 F14, F15, 및 F16을 신생 합성했다. 나머지 16개 단편(F1-F13 및 F17-19)은 CDX-005 1상 임상시험 물질로부터 회수하였다. CDX-005.2의 전장 합성 cDNA 게놈을 조립하기 위해, 회수된 19개의 중첩 PCR 단편을 단일 중첩 PCR 반응으로 조합했다. F16-Min DNA 주형은 원래의 CDX-005에 존재하는 것과 유사한, 1213개 뉴클레오티드의 코돈 쌍-탈최적화 영역을 포함하도록 설계되었다. 결과적으로 생성된 전장 PCR-조립된 cDNA 게놈을 F1의 5' 말단에 첨가된 T7 프로모터에 의해 구동되는 T7 RNA 폴리머라아제를 사용한 시험관내 전사를 위한 주형으로 사용하였다. 결과적으로 생성된 전장 PCR-조립된 cDNA 게놈을 F1의 5' 말단에 추가된 T7 프로모터에 의해 구동되는 T7 RNA 폴리머라아제를 사용한 시험관내(in vitro) 전사를 위한 주형으로 사용하였다. 시험관내 전사된 핵단백질(NP) 헬퍼 mRNA와 함께 시험관내 전사된 전장 게놈 RNA를 전기천공에 의해 Vero WHO 10-87 세포에 동시-형질감염시켰다. 이 형질감염으로 인해 생성된 바이러스를 CDX-005.2로 명명한다.
CDX-005(SIIPL 백신 배치 403002)의 바이러스 게놈을 역전사에 의해 cDNA로 전환시키고, 16개의 중첩 서브-게놈 DNA 단편으로 PCR 증폭시켰다. 또한, 본 발명자들은 3개의 새로운 델타-특이적 단편 14, 15, 및 16을 신생 합성했다. 각 단편은 그의 인접한 단편(들)과 약 200 bp 중첩되었다. 정제된 개별 CDX-005.2 단편 14-16 및 CDX-005 게놈 단편 1-13 및 17-10를 바이러스 게놈을 측접하는 2개의 프라이머에 의한 단일 튜브 오버랩 PCR 반응에서 풀링했다. 바이러스 게놈의 5' 말단에 상응하는 정방향 프라이머(2312)는 상류 T7 RNA 폴리머라아제 프로모터를 포함했다. 19-단편 오버랩 PCR은 약 30 kb의 DNA 앰플리콘을 생성하여, 전체 게놈 cDNA가 성공적으로 생성되었다는 것을 시사했고, 0.4% 아가로오스 겔에서 명확한 밴드를 볼 수 있었다. 정제 후, PCR로 조립된 전장 cDNA 게놈을 G 캡-유사체 존재 하에 시험관내 전사에 의한 감염성 바이러스 RNA의 합성을 위한 주형으로 사용했다. 결과적으로 생성된 전사체 RNA는 나란히 전개된 DNA 래더와 비교하여 8 kb 내지 1 kb 범위의 끌림으로 나타났다.
PCR-조립된 전장 cDNA 게놈의 무결성을 테스트하기 위해, 제한 엔도뉴클레아제 Nhe I에 의한 분해를 이용하였다. CDX-005.2 게놈 cDNA는 스파이크의 탈최적화된 영역에 설계된 추가적인 Nhe I 부위 때문에, 독특하고 구별되는 단편 패턴을 생성했다. Nhe I 처리된 cDNA 게놈의 단편 패턴은 인 실리코-예측 DNA 단편 크기와 일치하여, 바이러스 cDNA 게놈이 정확하게 조립되었다는 것을 나타냈다. 주목되는 것은 아가로오스 겔로 이동하지 않은 PCR 산물의 부분은 Nhe I 분해 후 사라지고 예상되는 크기의 Nhe I RFLP 단편으로 전환되어, 이 물질도 정확하게 형성된 전장 게놈 cDNA에 해당했다는 것을 시사한다는 것이다.
역유전학-유래 합성 CDX-005.2 바이러스는 헬퍼로서 핵단백질 mRNA와 함께 시험관내에서 전사된 게놈 RNA의 Vero 10-87 세포 내로의 동시-전기천공에 의해 구제되었다. CDX-005.2 백신 균주의 바이러스 회수는 승인된 기관 생물안전성 위원회(Institutional Biosafety Committee) 가이드라인에 따라 BSL2+(biosafety level 2 enhanced) 조건 하에서 수행되었다. 감염성 CDX-005.2 바이러스는 전기천공(2.5x105 PFU/ml) 후 4일차에 플라크 분석에 의해 배양 상층액에서 검출되었으며, 7일차까지 꾸준히 약 107 PFU/ml로 증가했다(도 12).
본 발명자들은 이전에 원래의 CDX-005 백신 균주가 인간 체온과 동등한 온도에서 바이러스 차단을 그럴듯하게 예측할 수 있기 때문에, 생 약독화 백신에 대한 바람직한 안전성 특징인 40℃에서 플라크 형성에 대해 온도 민감성이라 것을 관찰했다. 그 표현형이 CDX-005.2까지 확장되는지 테스트하기 위해, 허용 온도(37℃) 및 제한 온도(40℃)에서 CDX-005와 CDX-005.2의 병렬 플라크 분석을 수행했다. 실제로, 본 발명자들은 CDX-005 및 CDX-005.2에 대해 각각 플라크 형성의 약 1,000배 및 10,000배 감소로, 두 바이러스 모두의 상당한 온도 민감성 표현형을 관찰했다 (도 13).
회수된 CDX-005.2는 모 CDX-005와 유사하게 40℃에서 성장에 대해 온도 민감성이고, CDX-005와 유사한 플라크 형태를 갖는다.
실시예 10
계대 1 및 2에서 SARS- CoV -2 델타 백신 후보( CDX -005. 2)의 시퀀싱 보고
SARS-CoV-2 델타 백신 후보(CDX-005.2)에 대한 서열을 정의하기 위해, GISAID에서 10-20개의 델타 변이체를 선택하고, NCBI Blastn 다중 서열 정렬을 통해 CDX-005와 비교했다. 평가된 모든 델타 서열의 스파이크 유전자에 8개의 주요 돌연변이가 존재했다. 그 후, 원래의 CDX-005 스파이크 유전자의 8개 뉴클레오티드를 이들 선택된 돌연변이로 치환하여 델타 변이체 스파이크 서열을 수득했다.
델타 돌연변이가 탈최적화된 영역에 있는 경우, 탈최적화된 코돈을 야생형 코돈으로 대체하였다. 바이러스 백본은 푸린 절단 부위의 36개 뉴클레오티드 결실을 포함하는 CDX-005이다. 새로 구축된 전장 델타 바이러스 게놈을 전사한 후 RNA 정제를 수행했다.
이어서, 정제된 게놈 RNA를 WHO 10-87 Vero 세포에 형질감염시켰다. 계대 1과 계대 2에서 회수된 바이러스를 채취하고, 제조사의 프로토콜을 통해 TRIzol™(계대 1의 경우) 및 QiaAmp 바이러스 키트(계대 2의 경우)로 바이러스 RNA를 추출했다. 표준 RT-PCR을 수행하고, 19개의 PCR 단편을 추가로 증폭시키고 Sanger 시퀀싱에 의해 분석하여 바이러스 정체를 확인하고 가짜 돌연변이를 파악했다.
시퀀싱 반응물은 BSL2 격리 하에 Codagenix에서 혼합되고 시퀀싱을 위해 Genewiz Inc(South Plainfield, NJ) 및 Eurofins Genomics(Louisville, KY)에 제출되었다. 결과적으로 수득된 서열을 백신 균주 CDX-005의 백본에 있는 COVID-델타 변이체의 설계된 서열과 정렬시켰다.
설계 시에 우세한 SARS-CoV-2 델타 변이체의 아미노산 서열과 일치하는 아미노산 서열을 갖는 CDX-005.2를 생성하기 위해, 11개의 단일 뉴클레오티드 변화 및 1개의 6개 뉴클레오티드 결실을 CDX-005의 스파이크 유전자에 도입하였다(표 7). 모든 델타-특이적 서열 교정(edit)이 계대 1(Lot 1-071521-1) 및 계대 2(Lot 1-073121-1) 모두에서 CDX.005.2 바이러스에서 확인되었다. CDX-005에 존재하는 것과 동일한 12개 아미노산 푸린 절단 부위 결실이 CDX-005.2에서 구현되었고, 본원에서 검증되었다. 계대 1과 계대 2에서 CDX-005.2의 게놈 서열은 동일했다. 계대 1과 계대 2 모두에서 CDX-005.2에서 5개의 자발적(spontaneous) 점 돌연변이가 검출되었다: G1013A, C10833A, A11089G, A12557U, 및 G21668A. 돌연변이가 있는 각 위치의 시퀀싱 트레이스는 일정 수준의 유전적 이질성(genetic heterogeneity)을 보이고, 집단의 일부는 여전히 원래의 뉴클레오티드를 갖는다. 돌연변이된 뉴클레오티드가 계대 1에서 우세한 종이었으나, 그 중 4개가 추가 계대(계대 2)에서 원래의 대응물을 능가했으며, 이는 그들이 세포 배양 적응 돌연변이일 수 있다는 것을 나타낸다. C10833A는 혼합 종으로 남아 있었고, 계대 2에서는 아데닌이 우세했다. 돌연변이 중 4개는 아미노산 변화를 초래한 반면, A11098G는 동일한 아미노산을 유지했다. 설계 서열과의 모든 아미노산 차이는 탈최적화된 영역 외부에 있었고, 세포 배양에 대한 정상적인 바이러스 적응의 결과일 수 있다.
CDX-005(Codagenix Passage 2)와 CDX-005.2(Codagenix Passage 2) 사이의 하나의 추가적인 서열 변이가 게놈 위치 28818에서 검출되었다. 이 위치는 CDX-005 기준(reference) 서열(Codagenix Passage 2)에서 시티딘인 반면, CDX-005.2에서는 우라실이어서, N 핵단백질에서 Ser에서 Leu로의 아미노산 변화를 초래하다.
표 7. CDX-005(P2, Lot 1-061920-1)와 CDX-005.2-델타(P2, Lot 1-073121-1) 간의 서열 비교
게놈 위치(유전자) CDX-005
(P2) 중
뉴클레오티드
CDX-005.2
(P2) 중
뉴클레오티드
결과적인
아미노산 변화
비고
1013 (nsp2) G A Glu (GAA)→Lys (AAA) 자발적
(spontaneous)
10833 (nsp5) C A Ala (GCC)→Asp (GAC) 자발적
11089 (nsp6) A G Glu (GAA→GAG), 불변 자발적
12557 (nsp8) A U Ile (AUC)→Phe (UUC) 자발적
21618 (스파이크) C G Thr (ACA)→Arg (AGA) 델타 특이적
21668 (스파이크) G A Val (GUU)→Ile (AUU) 자발적
21846 (스파이크) U* C Ile (AUU)→Thr (ACU) 델타 특이적
21987 (스파이크) G A Gly (GGU)→Asp (GAU) 델타 특이적
22029 (스파이크) A (del) G Glu (GAG)→Gly (GGA) 델타 특이적
22030 (스파이크) G (del) A 델타 특이적
22296 (스파이크) G* A (22290) Arg (CGU)→His (CAU) 델타 특이적
22917 (스파이크) U G (22911) Leu (CUG)→Arg (CGG) 델타 특이적
22995 (스파이크) C A (22989) Thr (ACA)→Lys (AAA) 델타 특이적
23403 (스파이크) A G (23397) His (CAU)→Arg (CGU) 델타 특이적
24201 (스파이크) U* C (24195) Val (GUA)→Ala (GCA) 델타 특이적
24374 (스파이크) G A (24368) Asp (GAC)→Asn (AAU) 델타 특이적
24376 (스파이크) C U (24370) 델타 특이적
28818 (N) C U (22812) Ser (UCA)→Leu (UUA) SIIPL
Vaccine Lot 중 U
*wt SARS-CoV-2(델타) 특이적 아미노산으로 복원된 CDX-005의 자발적 돌연변이
실시예 11
햄스터에 탈최적화된 SARS-CoV2(CDX.005) 또는 야생형 SARS-CoV2 WA/1를 IN 으로 백신접종했다. 백신접종 후 27일차에 햄스터에 SARS-CoV2 변이체 베타를 IN으로 챌린지했다. SARS-CoV2 변이체 베타에 대한 MN 분석을 통해 중화 항체 역가를 평가했다. 도 14는 WT-감염된 햄스터의 혈청보다 B.1.351에 대한 더 우수한 교차 중화(cross-neutralization)가 있었다는 것을 보여준다.
본 발명의 다양한 구체예는 상세한 설명에 전술된다. 이러한 설명은 전술된 구체예를 직접적으로 설명하나, 당업자는 본원에 표시되고, 기술된 특정한 구체예에 대한 수정 및/또는 변형을 고안할 수 있다는 것이 이해된다. 본 설명의 범위에 속하는 그러한 모든 수정 또는 변형도 본 설명에 포함되도록 의도된다. 구체적으로 언급하지 않는 한, 명세서 및 청구범위의 단어 및 문구에 해당 분야의 통상의 기술자에게 일반적이고 익숙한 의미를 부여하는 것이 발명자의 의도이다.
본원의 출원 당시 출원인에게 알려진 본 발명의 다양한 구체예에 대한 전술된 설명이 제시되었고, 예시 및 설명의 목적으로 의도된다. 본 설명은 완전하거나 개시된 정확한 형태로 본 발명을 한정하는 것으로 의도되지 않으며, 전술된 교시에 비추어 많은 수정 및 변형이 가능하다. 기술된 구체예는 본 발명의 원리 및 그의 실제 응용을 설명하고, 당업자가 다양한 구체예로 및 고려되는 특정 용도에 적합한 다양한 수정을 통해 본 발명을 활용할 수 있게 하는 역할을 한다. 따라서, 본 발명은 본 발명을 수행하기 위해 개시된 특정한 구체예로 한정되지 않는 것으로 의도된다.
본 발명의 특정 구체예가 표시되고 설명되었으나, 본 발명 및 그의 더 넓은 양태로부터 벗어나지 않으면서, 본 명세서의 교시에 기초하여 변경 및 수정이 가능하고, 따라서, 첨부된 청구범위는 본 발명의 진정한 사상 및 범위 내에 있는 모든 변경과 수정을 그 범위 내에 포함한다는 것이 당업자에게 자명할 것이다. 일반적으로, 본원에서 사용된 용어는 일반적으로 "개방형(open)" 용어로 의도된다는 것이 당업자에 의해 이해될 것이다(예를 들어, "포함하는"이라는 용어는 "포함하지만 그에 한정되지 않는"으로 해석되어야 하며, "갖는"이라는 용어는 "적어도 갖는"으로 해석되어야 하며, 용어 "포함한다"는 "포함하지만 그에 한정되지 않는다"로 해석되어야 한다.).
본원에 사용된 용어 "포함하는" 또는 "포함한다"는 구체예에 유용한 조성물, 방법 및 그의 개별적인 성분들과 관련하여 사용되나, 유용성 여부에 관계없이 불특정 요소의 포함에 개방적이다. 일반적으로 본원에 사용된 용어는 일반적으로 "개방형" 용어로 의도된다는 것이 당업자에 의해 이해될 것이다(예를 들어, "포함하는"이라는 용어는 "포함하지만 그에 한정되지 않는"으로 해석되어야 하며, "갖는"이라는 용어는 "적어도 갖는"으로 해석되어야 하며, 용어 "포함한다"는 "포함하지만 그에 한정되지 않는다"로 해석되어야 한다.). 포함하는, 함유하는, 또는 갖는과 같은 용어의 동의어로서, 개방형 용어 "포함하는"이 본 발명을 설명하고 청구하기 위해 본원에서 사용되나, 본 발명, 또는 그의 구체예는 대안적으로 다음과 같은 대체 용어, 예를 들면, "구성되는" 또는 "필수적으로 구성되는(consisting essentially of)"을 이용하여 기술될 수 있다.
SEQUENCE LISTING <110> CODAGENIX INC. MUELLER, Steffen COLEMAN, John Robert WANG, Ying YANG, Chen SONG, Yutong <120> DEOPTIMIZED SARS-CoV-2 VARIANTS AND METHODS AND USES THEREOF <130> 064955-000051WO00 <150> 63/219,263 <151> 2021-07-07 <160> 54 <170> PatentIn version 3.5 <210> 1 <211> 29834 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 1 attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60 gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120 cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180 ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240 cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300 acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360 agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420 cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480 acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540 cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600 cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660 tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720 tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780 actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840 ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900 atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960 tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020 gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080 ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140 gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200 caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260 gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320 aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380 atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440 cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500 ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560 ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620 aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680 gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740 aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800 aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860 tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920 tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980 aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040 taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100 gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160 agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220 ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280 ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340 tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400 ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460 tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520 aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580 agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640 aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700 cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760 agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820 acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880 ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940 actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000 tgagtttata ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060 agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120 agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180 agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240 cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300 agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360 aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420 aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480 aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540 tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600 acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660 gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720 tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780 tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840 aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900 gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960 caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020 cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080 tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140 agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200 gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260 gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320 cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380 ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440 tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500 agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560 gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620 tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680 agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740 ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800 agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860 taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920 ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980 aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040 acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100 acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160 tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220 cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280 caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340 acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400 acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460 gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520 taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580 cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640 agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700 tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760 gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820 acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880 ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940 tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000 tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060 tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120 aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180 taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240 gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300 tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360 cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420 ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480 aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540 cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600 attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660 tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720 aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780 ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840 atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900 ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960 gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020 tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080 ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140 tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200 atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260 tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320 ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380 acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440 tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500 ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560 gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620 tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680 cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740 tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800 ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860 taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920 atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980 agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040 tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100 agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160 ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220 tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280 ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340 tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400 atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460 tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520 tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580 gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640 tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700 tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760 tgattttgac acatggttta gtcagcgtgg tggtagttat actaatgaca aagcttgccc 8820 attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880 gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940 tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000 ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060 ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120 acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180 tgttagagtg gtaacaacct ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240 agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300 atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360 accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420 tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagaa gagcttttgg 9480 tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540 ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600 gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660 cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720 tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780 tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840 gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900 taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960 tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020 accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080 atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140 tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200 gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260 ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320 taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380 acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440 tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500 ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560 tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620 aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680 cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740 ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800 actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860 agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920 tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980 gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040 agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100 accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160 gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220 ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280 tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340 aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400 gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460 catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520 gttcttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580 tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640 ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700 ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760 gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820 tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880 actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940 ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000 ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060 agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120 atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180 ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240 ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300 gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360 gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420 aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480 tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540 atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600 tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660 ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720 gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780 caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840 atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900 ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960 aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020 acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080 tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140 taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200 ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260 ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320 acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380 ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440 gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500 ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560 aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620 gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680 caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740 ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800 aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860 acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920 gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980 cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040 attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100 gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160 ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220 ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280 aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340 tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400 ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460 gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520 ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580 cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640 cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700 gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760 ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820 ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880 gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940 tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000 tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060 caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120 tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180 gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240 atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300 aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360 aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420 caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480 tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540 acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600 cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660 tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720 gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780 aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840 actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900 aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960 ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020 tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080 tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140 gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200 tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260 aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320 tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380 gtttgcagtg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440 agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500 gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560 attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620 agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680 tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740 gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800 aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860 gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920 tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980 attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040 tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100 agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160 tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220 aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280 aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340 gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400 gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460 cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520 atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580 gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640 gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700 aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760 gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820 ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880 accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940 aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000 agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactt 18060 tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120 agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180 gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240 ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300 ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360 cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420 cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480 cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540 caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600 catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660 tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720 catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780 ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840 catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900 aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960 gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020 gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080 tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140 tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200 aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260 aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320 acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380 tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440 ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500 gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560 ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620 agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680 gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740 gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800 cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860 gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920 gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980 gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040 gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100 agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160 aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220 caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280 ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340 agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400 tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460 acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520 gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580 actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640 ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700 tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760 acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820 aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880 gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940 cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000 tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060 aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120 gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180 tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240 actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300 ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360 aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420 aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480 cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540 cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600 tcagtgtgtt aatcttacaa ccagaactca attaccccct gcatacacta attctttcac 21660 acgtggtgtt tattaccctg acaaagtttt cagatcctca gttttacatt caactcagga 21720 cttgttctta cctttctttt ccaatgttac ttggttccat gctatacatg tctctgggac 21780 caatggtact aagaggtttg ataaccctgt cctaccattt aatgatggtg tttattttgc 21840 ttccattgag aagtctaaca taataagagg ctggattttt ggtactactt tagattcgaa 21900 gacccagtcc ctacttattg ttaataacgc tactaatgtt gttattaaag tctgtgaatt 21960 tcaattttgt aatgatccat ttttgggtgt ttattaccac aaaaacaaca aaagttggat 22020 ggaaagtgag ttcagagttt attctagtgc gaataattgc acttttgaat atgtctctca 22080 gccttttctt atggaccttg aaggaaaaca gggtaatttc aaaaatctta gggaatttgt 22140 gtttaagaat attgatggtt attttaaaat atattctaag cacacgccta ttaatttagt 22200 gcgtgatctc cctcagggtt tttcggcttt agaaccattg gtagatttgc caataggtat 22260 taacatcact aggtttcaaa ctttacttgc tttacgtaga agttatttga ctcctggtga 22320 ttcttcttca ggttggacag ctggtgctgc agcttattat gtgggttatc ttcaacctag 22380 gacttttcta ttaaaatata atgaaaatgg aaccattaca gatgctgtag actgtgcact 22440 tgaccctctc tcagaaacaa agtgtacgtt gaaatccttc actgtagaaa aaggaatcta 22500 tcaaacttct aactttagag tccaaccaac agaatctatt gttagatttc ctaatattac 22560 aaacttgtgc ccttttggtg aagtttttaa cgccaccaga tttgcatctg tttatgcttg 22620 gaacaggaag agaatcagca actgtgttgc tgattattct gtcctatata attccgcatc 22680 attttccact tttaagtgtt atggagtgtc tcctactaaa ttaaatgatc tctgctttac 22740 taatgtctat gcagattcat ttgtaattag aggtgatgaa gtcagacaaa tcgctccagg 22800 gcaaactgga aagattgctg attataatta taaattacca gatgatttta caggctgcgt 22860 tatagcttgg aattctaaca atcttgattc taaggttggt ggtaattata attacctgta 22920 tagattgttt aggaagtcta atctcaaacc ttttgagaga gatatttcaa ctgaaatcta 22980 tcaggccggt agcacacctt gtaatggtgt tgaaggtttt aattgttact ttcctttaca 23040 atcatatggt ttccaaccca ctaatggtgt tggttaccaa ccatacagag tagtagtact 23100 ttcttttgaa cttctacatg caccagcaac tgtttgtgga cctaaaaagt ctactaattt 23160 ggttaaaaac aaatgtgtca atttcaactt caatggttta acaggcacag gtgttcttac 23220 tgagtctaac aaaaagtttc tgcctttcca acaatttggc agagacattg ctgacactac 23280 tgatgctgtc cgtgatccac agacacttga gattcttgac attacaccat gttcttttgg 23340 tggtgtcagt gttataacac caggaacaaa tacttctaac caggttgctg ttctttatca 23400 ggatgttaac tgcacagaag tccctgttgc tattcatgca gatcaactta ctcctacttg 23460 gcgtgtttat tctacaggtt ctaatgtttt tcaaacacgt gcaggctgtt taataggggc 23520 tgaacatgtc aacaactcat atgagtgtga catacccatt ggtgcaggta tatgcgctag 23580 ttatcagact cagcaatcca tcattgccta cactatgtca cttggtgcag aaaattcagt 23640 tgcttactct aataactcta ttgccatacc cacaaatttt actattagtg ttaccacaga 23700 aattctacca gtgtctatga ccaagacatc agtagattgt acaatgtaca tttgtggtga 23760 ttcaactgaa tgcagcaatc ttttgttgca atatggcagt ttttgtacac aattaaaccg 23820 tgctttaact ggaatagctg ttgaacaaga caaaaacacc caagaagttt ttgcacaagt 23880 caaacaaatt tacaaaacac caccaattaa agattttggt ggttttaatt tttcacaaat 23940 attaccagat ccatcaaaac caagcaagag gtcatttatt gaagatctac ttttcaacaa 24000 agtgacactt gcagatgctg gcttcatcaa acaatatggt gattgccttg gtgatattgc 24060 tgctagagat ctcatttgcg ctcaaaaatt taacggactt acagttttac cacctttact 24120 tactgacgaa atgattgcgc aatatacatc cgcattgtta gccggaacta ttacatccgg 24180 atggactttt ggcgcaggcg tagcattaca gattccattc gctatgcaaa tggcttatag 24240 gtttaacggt ataggcgtta cgcaaaacgt actttatgag aatcaaaaac ttatcgctaa 24300 ccaatttaat tccgctatcg gtaagattca ggattcattg tctagtactg ctagtgcact 24360 cggtaagttg caagacgtag tgaatcaaaa cgctcaagca cttaatacac tcgttaaaca 24420 gcttagttct aattttggcg caatttctag tgtgcttaac gatatactat ctagactcga 24480 taaagtcgaa gccgaagtgc aaatcgatag attgattacc ggtaggttgc aatcattgca 24540 aacatacgtt acacagcaat tgattagggc cgcagagata cgcgctagcg ctaatctcgc 24600 agctactaaa atgtctgaat gcgtactcgg acaatctaaa cgtgtcgatt tttgcggtaa 24660 gggatatcat cttatgtctt ttccacaatc tgcacctcac ggagtcgtgt ttttacacgt 24720 tacttatgtg ccagctcaag agaaaaattt tacaaccgct cctgctattt gtcatgacgg 24780 taaggcacat tttcctagag agggcgtatt cgtttctaac ggtacacatt ggttcgttac 24840 acaacgtaat ttttacgaac ctcaaattat tactactgat aatacattcg tatcaggtaa 24900 ttgtgacgta gtgataggta tcgttaataa tacagtttac gatccacttc aacctgaact 24960 cgatagtttt aaagaggaac tcgataagta ttttaaaaat catacatcac ctgacgtcga 25020 cttaggcgat atttcaggta ttaacgctag tgtcgttaac attcaaaaag agattgatag 25080 acttaacgaa gtcgctaaaa atcttaacga atcacttatc gatctgcaag agttaggtaa 25140 gtatgagcaa tatattaaat ggccttggta tatttggtta ggctttatag ccggattgat 25200 cgcaatcgtt atggttacaa ttatgttatg ttgtatgaca tcatgttgtt catgtcttaa 25260 gggatgttgt tcatgcggat catgttgtaa atttgacgaa gacgattccg aaccagtgct 25320 taaaggcgtt aagttacatt atacataaac gaacttatgg atttgtttat gagaatcttc 25380 acaattggaa ctgtaacttt gaagcaaggt gaaatcaagg atgctactcc ttcagatttt 25440 gttcgcgcta ctgcaacgat accgatacaa gcctcactcc ctttcggatg gcttattgtt 25500 ggcgttgcac ttcttgctgt ttttcagagc gcttccaaaa tcataaccct caaaaagaga 25560 tggcaactag cactctccaa gggtgttcac tttgtttgca acttgctgtt gttgtttgta 25620 acagtttact cacacctttt gctcgttgct gctggccttg aagccccttt tctctatctt 25680 tatgctttag tctacttctt gcagagtata aactttgtaa gaataataat gaggctttgg 25740 ctttgctgga aatgccgttc caaaaaccca ttactttatg atgccaacta ttttctttgc 25800 tggcatacta attgttacga ctattgtata ccttacaata gtgtaacttc ttcaattgtc 25860 attacttcag gtgatggcac aacaagtcct atttctgaac atgactacca gattggtggt 25920 tatactgaaa aatgggaatc tggagtaaaa gactgtgttg tattacacag ttacttcact 25980 tcagactatt accagctgta ctcaactcaa ttgagtacag acactggtgt tgaacatgtt 26040 accttcttca tctacaataa aattgttgat gagcctgaag aacatgtcca aattcacaca 26100 atcgacggtt catccggagt tgttaatcca gtaatggaac caatttatga tgaaccgacg 26160 acgactacta gcgtgccttt gtaagcacaa gctgatgagt acgaacttat gtactcattc 26220 gtttcggaag agacaggtac gttaatagtt aatagcgtac ttctttttct tgctttcgtg 26280 gtattcttgc tagttacact agccatcctt actgcgcttc gattgtgtgc gtactgctgc 26340 aatattgtta acgtgagtct tgtaaaacct tctttttacg tttactctcg tgttaaaaat 26400 ctgaattctt ctagagttcc tgatcttctg gtctaaacga actaaatatt atattagttt 26460 ttctgtttgg aactttaatt ttagccatgg cagattccaa cggtactatt accgttgaag 26520 agcttaaaaa gctccttgaa caatggaacc tagtaatagg tttcctattc cttacatgga 26580 tttgtcttct acaatttgcc tatgccaaca ggaataggtt tttgtatata attaagttaa 26640 ttttcctctg gctgttatgg ccagtaactt tagcttgttt tgtgcttgct gctgtttaca 26700 gaataaattg gatcaccggt ggaattgcta tcgcaatggc ttgtcttgta ggcttgatgt 26760 ggctcagcta cttcattgct tctttcagac tgtttgcgcg tacgcgttcc atgtggtcat 26820 tcaatccaga aactaacatt cttctcaacg tgccactcca tggcactatt ctgaccagac 26880 cgcttctaga aagtgaactc gtaatcggag ctgtgatcct tcgtggacat cttcgtattg 26940 ctggacacca tctaggacgc tgtgacatca aggacctgcc taaagaaatc actgttgcta 27000 catcacgaac gctttcttat tacaaattgg gagcttcgca gcgtgtagca ggtgactcag 27060 gttttgctgc atacagtcgc tacaggattg gcaactataa attaaacaca gaccattcca 27120 gtagcagtga caatattgct ttgcttgtac agtaagtgac aacagatgtt tcatctcgtt 27180 gactttcagg ttactatagc agagatatta ctaattatta tgaggacttt taaagtttcc 27240 atttggaatc ttgattacat cataaacctc ataattaaaa atttatctaa gtcactaact 27300 gagaataaat attctcaatt agatgaagag caaccaatgg agattgatta aacgaacatg 27360 aaaattattc ttttcttggc actgataaca ctcgctactt gtgagcttta tcactaccaa 27420 gagtgtgtta gaggtacaac agtactttta aaagaacctt gctcttctgg aacatacgag 27480 ggcaattcac catttcatcc tctagctgat aacaaatttg cactgacttg ctttagcact 27540 caatttgctt ttgcttgtcc tgacggcgta aaacacgtct atcagttacg tgccagatca 27600 gtttcaccta aactgttcat cagacaagag gaagttcaag aactttactc tccaattttt 27660 cttattgttg cggcaatagt gtttataaca ctttgcttca cactcaaaag aaagacagaa 27720 tgattgaact ttcattaatt gacttctatt tgtgcttttt agcctttctg ctattccttg 27780 ttttaattat gcttattatc ttttggttct cacttgaact gcaagatcat aatgaaactt 27840 gtcacgccta aacgaacatg aaatttcttg ttttcttagg aatcatcaca actgtagctg 27900 catttcacca agaatgtagt ttacagtcat gtactcaaca tcaaccatat gtagttgatg 27960 acccgtgtcc tattcacttc tattctaaat ggtatattag agtaggagct agaaaatcag 28020 cacctttaat tgaattgtgc gtggatgagg ctggttctaa atcacccatt cagtacatcg 28080 atatcggtaa ttatacagtt tcctgttcac cttttacaat taattgccag gaacctaaat 28140 tgggtagtct tgtagtgcgt tgttcgttct atgaagactt tttagagtat catgacgttc 28200 gtgttgtttt agatttcatc taaacgaaca aactaaaatg tctgataatg gaccccaaaa 28260 tcagcgaaat gcaccccgca ttacgtttgg tggaccctca gattcaactg gcagtaacca 28320 gaatggagaa cgcagtgggg cgcgatcaaa acaacgtcgg ccccaaggtt tacccaataa 28380 tactgcgtct tggttcaccg ctctcactca acatggcaag gaagacctta aattccctcg 28440 aggacaaggc gttccaatta acaccaatag cagtccagat gaccaaattg gctactaccg 28500 aagagctacc agacgaattc gtggtggtga cggtaaaatg aaagatctca gtccaagatg 28560 gtatttctac tacctaggaa ctgggccaga agctggactt ccctatggtg ctaacaaaga 28620 cggcatcata tgggttgcaa ctgagggagc cttgaataca ccaaaagatc acattggcac 28680 ccgcaatcct gctaacaatg ctgcaatcgt gctacaactt cctcaaggaa caacattgcc 28740 aaaaggcttc tacgcagaag ggagcagagg cggcagtcaa gcctcttctc gttcctcatc 28800 acgtagtcgc aacagttcaa gaaattcaac tccaggcagc agtaggggaa cttctcctgc 28860 tagaatggct ggcaatggcg gtgatgctgc tcttgctttg ctgctgcttg acagattgaa 28920 ccagcttgag agcaaaatgt ctggtaaagg ccaacaacaa caaggccaaa ctgtcactaa 28980 gaaatctgct gctgaggctt ctaagaagcc tcggcaaaaa cgtactgcca ctaaagcata 29040 caatgtaaca caagctttcg gcagacgtgg tccagaacaa acccaaggaa attttgggga 29100 ccaggaacta atcagacaag gaactgatta caaacattgg ccgcaaattg cacaatttgc 29160 ccccagcgct tcagcgttct tcggaatgtc gcgcattggc atggaagtca caccttcggg 29220 aacgtggttg acctacacag gtgccatcaa attggatgac aaagatccaa atttcaaaga 29280 tcaagtcatt ttgctgaata agcatattga cgcatacaaa acattcccac caacagagcc 29340 taaaaaggac aaaaagaaga aggctgatga aactcaagcc ttaccgcaga gacagaagaa 29400 acagcaaact gtgactcttc ttcctgctgc agatttggat gatttctcca aacaattgca 29460 acaatccatg agcagtgctg actcaactca ggcctaaact catgcagacc acacaaggca 29520 gatgggctat ataaacgttt tcgcttttcc gtttacgata tatagtctac tcttgtgcag 29580 aatgaattct cgtaactaca tagcacaagt agatgtagtt aactttaatc tcacatagca 29640 atctttaatc agtgtgtaac attagggagg acttgaaaga gccaccacat tttcaccgag 29700 gccacgcgga gtacgatcga gtgtacagtg aacaatgcta gggagagctg cctatatgga 29760 agagccctaa tgtgtaaaat taattttagt agtgctatcc ccatgtgatt ttaatagctt 29820 cttaggagaa tgac 29834 <210> 2 <211> 1261 <212> PRT <213> Coronavirus <400> 2 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu Arg Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly 675 680 685 Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr 690 695 700 Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr 705 710 715 720 Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu 725 730 735 Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn 740 745 750 Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu 755 760 765 Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp 770 775 780 Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro 785 790 795 800 Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu 805 810 815 Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile 820 825 830 Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val 835 840 845 Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala 850 855 860 Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Val 865 870 875 880 Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly 885 890 895 Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala 900 905 910 Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser 915 920 925 Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala 930 935 940 Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala 945 950 955 960 Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu 965 970 975 Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu 980 985 990 Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala 995 1000 1005 Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly 1010 1015 1020 Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met 1025 1030 1035 Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val 1040 1045 1050 Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala 1055 1060 1065 Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe 1070 1075 1080 Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr 1085 1090 1095 Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn 1100 1105 1110 Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro 1115 1120 1125 Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr 1130 1135 1140 Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser 1145 1150 1155 Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg 1160 1165 1170 Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu 1175 1180 1185 Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr 1190 1195 1200 Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val 1205 1210 1215 Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys 1220 1225 1230 Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp 1235 1240 1245 Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr 1250 1255 1260 <210> 3 <211> 3777 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 3 atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatctctggg accaatggta ctaagaggtt tgataaccct 240 gtcctaccat ttaatgatgg tgtttatttt gcttccactg agaagtctaa cataataaga 300 ggctggattt ttggtactac tttagattcg aagacccagt ccctacttat tgttaataac 360 gctactaatg ttgttattaa agtctgtgaa tttcaatttt gtaatgatcc atttttgggt 420 gtttaccaca aaaacaacaa aagttggatg gaaagtgagt tcagagttta ttctagtgcg 480 aataattgca cttttgaata tgtctctcag ccttttctta tggaccttga aggaaaacag 540 ggtaatttca aaaatcttag ggaatttgtg tttaagaata ttgatggtta ttttaaaata 600 tattctaagc acacgcctat taatttagtg cgtgatctcc ctcagggttt ttcggcttta 660 gaaccattgg tagatttgcc aataggtatt aacatcacta ggtttcaaac tttacttgct 720 ttacatagaa gttatttgac tcctggtgat tcttcttcag gttggacagc tggtgctgca 780 gcttattatg tgggttatct tcaacctagg acttttctat taaaatataa tgaaaatgga 840 accattacag atgctgtaga ctgtgcactt gaccctctct cagaaacaaa gtgtacgttg 900 aaatccttca ctgtagaaaa aggaatctat caaacttcta actttagagt ccaaccaaca 960 gaatctattg ttagatttcc taatattaca aacttgtgcc cttttggtga agtttttaac 1020 gccaccagat ttgcatctgt ttatgcttgg aacaggaaga gaatcagcaa ctgtgttgct 1080 gattattctg tcctatataa ttccgcatca ttttccactt ttaagtgtta tggagtgtct 1140 cctactaaat taaatgatct ctgctttact aatgtctatg cagattcatt tgtaattaga 1200 ggtgatgaag tcagacaaat cgctccaggg caaactggaa agattgctga ttataattat 1260 aaattaccag atgattttac aggctgcgtt atagcttgga attctaacaa tcttgattct 1320 aaggttggtg gtaattataa ttacctgtat agattgttta ggaagtctaa tctcaaacct 1380 tttgagagag atatttcaac tgaaatctat caggccggta gcacaccttg taatggtgtt 1440 gaaggtttta attgttactt tcctttacaa tcatatggtt tccaacccac ttatggtgtt 1500 ggttaccaac catacagagt agtagtactt tcttttgaac ttctacatgc accagcaact 1560 gtttgtggac ctaaaaagtc tactaatttg gttaaaaaca aatgtgtcaa tttcaacttc 1620 aatggtttaa caggcacagg tgttcttact gagtctaaca aaaagtttct gcctttccaa 1680 caatttggca gagacattga tgacactact gatgctgtcc gtgatccaca gacacttgag 1740 attcttgaca ttacaccatg ttcttttggt ggtgtcagtg ttataacacc aggaacaaat 1800 acttctaacc aggttgctgt tctttatcag ggtgttaact gcacagaagt ccctgttgct 1860 attcatgcag atcaacttac tcctacttgg cgtgtttatt ctacaggttc taatgttttt 1920 caaacacgtg caggctgttt aataggggct gaacatgtca acaactcata tgagtgtgac 1980 atacccattg gtgcaggtat atgcgctagt tatcagactc agcaatccat cattgcctac 2040 actatgtcac ttggtgcaga aaattcagtt gcttactcta ataactctat tgccataccc 2100 ataaatttta ctattagtgt taccacagaa attctaccag tgtctatgac caagacatca 2160 gtagattgta caatgtacat ttgtggtgat tcaactgaat gcagcaatct tttgttgcaa 2220 tatggcagtt tttgtacaca attaaaccgt gctttaactg gaatagctgt tgaacaagac 2280 aaaaacaccc aagaagtttt tgcacaagtc aaacaaattt acaaaacacc accaattaaa 2340 gattttggtg gttttaattt ttcacaaata ttaccagatc catcaaaacc aagcaagagg 2400 tcatttattg aagatctact tttcaacaaa gtgacacttg cagatgctgg cttcatcaaa 2460 caatatggtg attgccttgg tgatattgct gctagagacc tcatttgcgc tcaaaaattt 2520 aacggactta cagttttacc acctttactt actgacgaaa tgattgcgca atatacatcc 2580 gcattgttag ccggaactat tacatccgga tggacttttg gcgcaggcgc agcattacag 2640 attccattcg ctatgcaaat ggcttatagg tttaacggta taggcgttac gcaaaacgta 2700 ctttatgaga atcaaaaact tatcgctaac caatttaatt ccgctatcgg taagattcag 2760 gattcattgt ctagtactgc tagtgcactc ggtaagttgc aagacgtagt gaatcaaaac 2820 gctcaagcac ttaatacact cgttaaacag cttagttcta attttggcgc aatttctagt 2880 gtgcttaacg atatactagc aagactcgat aaagtcgaag ccgaagtgca aatcgataga 2940 ttgattaccg gtaggttgca atcattgcaa acatacgtta cacagcaatt gattagggcc 3000 gcagagatac gcgctagcgc taatctcgca gctactaaaa tgtctgaatg cgtactcgga 3060 caatctaaac gtgtcgattt ttgcggtaag ggatatcatc ttatgtcttt tccacaatct 3120 gcacctcacg gagtcgtgtt tttacacgtt acttatgtgc cagctcaaga gaaaaatttt 3180 acaaccgctc ctgctatttg tcatgacggt aaggcacatt ttcctagaga gggcgtattc 3240 gtttctaacg gtacacattg gttcgttaca caacgtaatt tttacgaacc tcaaattatt 3300 actactcaca atacattcgt atcaggtaat tgtgacgtag tgataggtat cgttaataat 3360 acagtttacg atccacttca acctgaactc gatagtttta aagaggaact cgataagtat 3420 tttaaaaatc atacatcacc tgacgtcgac ttaggcgata tttcaggtat taacgctagt 3480 gtcgttaaca ttcaaaaaga gattgataga cttaacgaag tcgctaaaaa tcttaacgaa 3540 tcacttatcg atctgcaaga gttaggtaag tatgagcaat atattaaatg gccttggtat 3600 atttggttag gctttatagc cggattgatc gcaatcgtta tggttacaat tatgttatgt 3660 tgtatgacat catgttgttc atgtcttaag ggatgttgtt catgcggatc atgttgtaaa 3720 tttgacgaag acgattccga accagtgctt aaaggcgtta agttacatta tacataa 3777 <210> 4 <211> 3777 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 4 atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa ttttacaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgct 240 aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300 ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360 aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420 ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480 tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540 ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600 tttaaaatat attctaagca cacgcctatt aatttagtgc gtggtctccc tcagggtttt 660 tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720 ttacatagaa gttatttgac tcctggtgat tcttcttcag gttggacagc tggtgctgca 780 gcttattatg tgggttatct tcaacctagg acttttctat taaaatataa tgaaaatgga 840 accattacag atgctgtaga ctgtgcactt gaccctctct cagaaacaaa gtgtacgttg 900 aaatccttca ctgtagaaaa aggaatctat caaacttcta actttagagt ccaaccaaca 960 gaatctattg ttagatttcc taatattaca aacttgtgcc cttttggtga agtttttaac 1020 gccaccagat ttgcatctgt ttatgcttgg aacaggaaga gaatcagcaa ctgtgttgct 1080 gattattctg tcctatataa ttccgcatca ttttccactt ttaagtgtta tggagtgtct 1140 cctactaaat taaatgatct ctgctttact aatgtctatg cagattcatt tgtaattaga 1200 ggtgatgaag tcagacaaat cgctccaggg caaactggaa atattgctga ttataattat 1260 aaattaccag atgattttac aggctgcgtt atagcttgga attctaacaa tcttgattct 1320 aaggttggtg gtaattataa ttacctgtat agattgttta ggaagtctaa tctcaaacct 1380 tttgagagag atatttcaac tgaaatctat caggccggta gcacaccttg taatggtgtt 1440 aaaggtttta attgttactt tcctttacaa tcatatggtt tccaacccac ttatggtgtt 1500 ggttaccaac catacagagt agtagtactt tcttttgaac ttctacatgc accagcaact 1560 gtttgtggac ctaaaaagtc tactaatttg gttaaaaaca aatgtgtcaa tttcaacttc 1620 aatggtttaa caggcacagg tgttcttact gagtctaaca aaaagtttct gcctttccaa 1680 caatttggca gagacattgc tgacactact gatgctgtcc gtgatccaca gacacttgag 1740 attcttgaca ttacaccatg ttcttttggt ggtgtcagtg ttataacacc aggaacaaat 1800 acttctaacc aggttgctgt tctttatcag ggtgttaact gcacagaagt ccctgttgct 1860 attcatgcag atcaacttac tcctacttgg cgtgtttatt ctacaggttc taatgttttt 1920 caaacacgtg caggctgttt aataggggct gaacatgtca acaactcata tgagtgtgac 1980 atacccattg gtgcaggtat atgcgctagt tatcagactc agcaatccat cattgcctac 2040 actatgtcac ttggtgtaga aaattcagtt gcttactcta ataactctat tgccataccc 2100 acaaatttta ctattagtgt taccacagaa attctaccag tgtctatgac caagacatca 2160 gtagattgta caatgtacat ttgtggtgat tcaactgaat gcagcaatct tttgttgcaa 2220 tatggcagtt tttgtacaca attaaaccgt gctttaactg gaatagctgt tgaacaagac 2280 aaaaacaccc aagaagtttt tgcacaagtc aaacaaattt acaaaacacc accaattaaa 2340 gattttggtg gttttaattt ttcacaaata ttaccagatc catcaaaacc aagcaagagg 2400 tcatttattg aagatctact tttcaacaaa gtgacacttg cagatgctgg cttcatcaaa 2460 caatatggtg attgccttgg tgatattgct gctagagatc tcatttgcgc tcaaaaattt 2520 aacggactta cagttttacc acctttactt actgacgaaa tgattgcgca atatacatcc 2580 gcattgttag ccggaactat tacatccgga tggacttttg gcgcaggcgc agcattacag 2640 attccattcg ctatgcaaat ggcttatagg tttaacggta taggcgttac gcaaaacgta 2700 ctttatgaga atcaaaaact tatcgctaac caatttaatt ccgctatcgg taagattcag 2760 gattcattgt ctagtactgc tagtgcactc ggtaagttgc aagacgtagt gaatcaaaac 2820 gctcaagcac ttaatacact cgttaaacag cttagttcta attttggcgc aatttctagt 2880 gtgcttaacg atatactatc tagactcgat aaagtcgaag ccgaagtgca aatcgataga 2940 ttgattaccg gtaggttgca atcattgcaa acatacgtta cacagcaatt gattagggcc 3000 gcagagatac gcgctagcgc taatctcgca gctactaaaa tgtctgaatg cgtactcgga 3060 caatctaaac gtgtcgattt ttgcggtaag ggatatcatc ttatgtcttt tccacaatct 3120 gcacctcacg gagtcgtgtt tttacacgtt acttatgtgc cagctcaaga gaaaaatttt 3180 acaaccgctc ctgctatttg tcatgacggt aaggcacatt ttcctagaga gggcgtattc 3240 gtttctaacg gtacacattg gttcgttaca caacgtaatt tttacgaacc tcaaattatt 3300 actactgata atacattcgt atcaggtaat tgtgacgtag tgataggtat cgttaataat 3360 acagtttacg atccacttca acctgaactc gatagtttta aagaggaact cgataagtat 3420 tttaaaaatc atacatcacc tgacgtcgac ttaggcgata tttcaggtat taacgctagt 3480 gtcgttaaca ttcaaaaaga gattgataga cttaacgaag tcgctaaaaa tcttaacgaa 3540 tcacttatcg atctgcaaga gttaggtaag tatgagcaat atattaaatg gccttggtat 3600 atttggttag gctttatagc cggattgatc gcaatcgtta tggttacaat tatgttatgt 3660 tgtatgacat catgttgttc atgtcttaag ggatgttgtt catgcggatc atgttgtaaa 3720 tttgacgaag acgattccga accagtgctt aaaggcgtta agttacatta tacataa 3777 <210> 5 <211> 3780 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 5 atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttagaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240 aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300 ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360 aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420 ttggatgttt attaccacaa aaacaacaaa agttggatgg aaagtggagt ttattctagt 480 gcgaataatt gcacttttga atatgtctct cagccttttc ttatggacct tgaaggaaaa 540 cagggtaatt tcaaaaatct tagggaattt gtgtttaaga atattgatgg ttattttaaa 600 atatattcta agcacacgcc tattaattta gtgcgtgatc tccctcaggg tttttcggct 660 ttagaaccat tggtagattt gccaataggt attaacatca ctaggtttca aactttactt 720 gctttacata gaagttattt gactcctggt gattcttctt caggttggac agctggtgct 780 gcagcttatt atgtgggtta tcttcaacct aggacttttc tattaaaata taatgaaaat 840 ggaaccatta cagatgctgt agactgtgca cttgaccctc tctcagaaac aaagtgtacg 900 ttgaaatcct tcactgtaga aaaaggaatc tatcaaactt ctaactttag agtccaacca 960 acagaatcta ttgttagatt tcctaatatt acaaacttgt gcccttttgg tgaagttttt 1020 aacgccacca gatttgcatc tgtttatgct tggaacagga agagaatcag caactgtgtt 1080 gctgattatt ctgtcctata taattccgca tcattttcca cttttaagtg ttatggagtg 1140 tctcctacta aattaaatga tctctgcttt actaatgtct atgcagattc atttgtaatt 1200 agaggtgatg aagtcagaca aatcgctcca gggcaaactg gaaagattgc tgattataat 1260 tataaattac cagatgattt tacaggctgc gttatagctt ggaattctaa caatcttgat 1320 tctaaggttg gtggtaatta taattaccgg tatagattgt ttaggaagtc taatctcaaa 1380 ccttttgaga gagatatttc aactgaaatc tatcaggccg gtagcaaacc ttgtaatggt 1440 gttgaaggtt ttaattgtta ctttccttta caatcatatg gtttccaacc cactaatggt 1500 gttggttacc aaccatacag agtagtagta ctttcttttg aacttctaca tgcaccagca 1560 actgtttgtg gacctaaaaa gtctactaat ttggttaaaa acaaatgtgt caatttcaac 1620 ttcaatggtt taacaggcac aggtgttctt actgagtcta acaaaaagtt tctgcctttc 1680 caacaatttg gcagagacat tgctgacact actgatgctg tccgtgatcc acagacactt 1740 gagattcttg acattacacc atgttctttt ggtggtgtca gtgttataac accaggaaca 1800 aatacttcta accaggttgc tgttctttat cagggtgtta actgcacaga agtccctgtt 1860 gctattcatg cagatcaact tactcctact tggcgtgttt attctacagg ttctaatgtt 1920 tttcaaacac gtgcaggctg tttaataggg gctgaacatg tcaacaactc atatgagtgt 1980 gacataccca ttggtgcagg tatatgcgct agttatcaga ctcagcaatc catcattgcc 2040 tacactatgt cacttggtgc agaaaattca gttgcttact ctaataactc tattgccata 2100 cccacaaatt ttactattag tgttaccaca gaaattctac cagtgtctat gaccaagaca 2160 tcagtagatt gtacaatgta catttgtggt gattcaactg aatgcagcaa tcttttgttg 2220 caatatggca gtttttgtac acaattaaac cgtgctttaa ctggaatagc tgttgaacaa 2280 gacaaaaaca cccaagaagt ttttgcacaa gtcaaacaaa tttacaaaac accaccaatt 2340 aaagattttg gtggttttaa tttttcacaa atattaccag atccatcaaa accaagcaag 2400 aggtcattta ttgaagatct acttttcaac aaagtgacac ttgcagatgc tggcttcatc 2460 aaacaatatg gtgattgcct tggtgatatt gctgctagag acctcatttg cgctcaaaaa 2520 tttaacggac ttacagtttt accaccttta cttactgacg aaatgattgc gcaatataca 2580 tccgcattgt tagccggaac tattacatcc ggatggactt ttggcgcagg cgcagcatta 2640 cagattccat tcgctatgca aatggcttat aggtttaacg gtataggcgt tacgcaaaac 2700 gtactttatg agaatcaaaa acttatcgct aaccaattta attccgctat cggtaagatt 2760 caggattcat tgtctagtac tgctagtgca ctcggtaagt tgcaaaatgt agtgaatcaa 2820 aacgctcaag cacttaatac actcgttaaa cagcttagtt ctaattttgg cgcaatttct 2880 agtgtgctta acgatatact atctagactc gataaagtcg aagccgaagt gcaaatcgat 2940 agattgatta ccggtaggtt gcaatcattg caaacatacg ttacacagca attgattagg 3000 gccgcagaga tacgcgctag cgctaatctc gcagctacta aaatgtctga atgcgtactc 3060 ggacaatcta aacgtgtcga tttttgcggt aagggatatc atcttatgtc ttttccacaa 3120 tctgcacctc acggagtcgt gtttttacac gttacttatg tgccagctca agagaaaaat 3180 tttacaaccg ctcctgctat ttgtcatgac ggtaaggcac attttcctag agagggcgta 3240 ttcgtttcta acggtacaca ttggttcgtt acacaacgta atttttacga acctcaaatt 3300 attactactg ataatacatt cgtatcaggt aattgtgacg tagtgatagg tatcgttaat 3360 aatacagttt acgatccact tcaacctgaa ctcgatagtt ttaaagagga actcgataag 3420 tattttaaaa atcatacatc acctgacgtc gacttaggcg atatttcagg tattaacgct 3480 agtgtcgtta acattcaaaa agagattgat agacttaacg aagtcgctaa aaatcttaac 3540 gaatcactta tcgatctgca agagttaggt aagtatgagc aatatattaa atggccttgg 3600 tatatttggt taggctttat agccggattg atcgcaatcg ttatggttac aattatgtta 3660 tgttgtatga catcatgttg ttcatgtctt aagggatgtt gttcatgcgg atcatgttgt 3720 aaatttgacg aagacgattc cgaaccagtg cttaaaggcg ttaagttaca ttatacataa 3780 <210> 6 <211> 3777 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 6 atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa ttttacaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgct 240 aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300 ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360 aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420 ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480 tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540 ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600 tttaaaatat attctaagca cacgcctatt aatttagtgc gtggtctccc tcagggtttt 660 tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720 ttacatagaa gttatttgac tcctggtgat tcttcttcag gttggacagc tggtgctgca 780 gcttattatg tgggttatct tcaacctagg acttttctat taaaatataa tgaaaatgga 840 accattacag atgctgtaga ctgtgcactt gaccctctct cagaaacaaa gtgtacgttg 900 aaatccttca ctgtagaaaa aggaatctat caaacttcta actttagagt ccaaccaaca 960 gaatctattg ttagatttcc taatattaca aacttgtgcc cttttggtga agtttttaac 1020 gccaccagat ttgcatctgt ttatgcttgg aacaggaaga gaatcagcaa ctgtgttgct 1080 gattattctg tcctatataa ttccgcatca ttttccactt ttaagtgtta tggagtgtct 1140 cctactaaat taaatgatct ctgctttact aatgtctatg cagattcatt tgtaattaga 1200 ggtgatgaag tcagacaaat cgctccaggg caaactggaa atattgctga ttataattat 1260 aaattaccag atgattttac aggctgcgtt atagcttgga attctaacaa tcttgattct 1320 aaggttggtg gtaattataa ttacctgtat agattgttta ggaagtctaa tctcaaacct 1380 tttgagagag atatttcaac tgaaatctat caggccggta gcacaccttg taatggtgtt 1440 aaaggtttta attgttactt tcctttacaa tcatatggtt tccaacccac ttatggtgtt 1500 ggttaccaac catacagagt agtagtactt tcttttgaac ttctacatgc accagcaact 1560 gtttgtggac ctaaaaagtc tactaatttg gttaaaaaca aatgtgtcaa tttcaacttc 1620 aatggtttaa caggcacagg tgttcttact gagtctaaca aaaagtttct gcctttccaa 1680 caatttggca gagacattgc tgacactact gatgctgtcc gtgatccaca gacacttgag 1740 attcttgaca ttacaccatg ttcttttggt ggtgtcagtg ttataacacc aggaacaaat 1800 acttctaacc aggttgctgt tctttatcag ggtgttaact gcacagaagt ccctgttgct 1860 attcatgcag atcaacttac tcctacttgg cgtgtttatt ctacaggttc taatgttttt 1920 caaacacgtg caggctgttt aataggggct gaacatgtca acaactcata tgagtgtgac 1980 atacccattg gtgcaggtat atgcgctagt tatcagactc agcaatccat cattgcctac 2040 actatgtcac ttggtgtaga aaattcagtt gcttactcta ataactctat tgccataccc 2100 acaaatttta ctattagtgt taccacagaa attctaccag tgtctatgac caagacatca 2160 gtagattgta caatgtacat ttgtggtgat tcaactgaat gcagcaatct tttgttgcaa 2220 tatggcagtt tttgtacaca attaaaccgt gctttaactg gaatagctgt tgaacaagac 2280 aaaaacaccc aagaagtttt tgcacaagtc aaacaaattt acaaaacacc accaattaaa 2340 gattttggtg gttttaattt ttcacaaata ttaccagatc catcaaaacc aagcaagagg 2400 tcatttattg aagatctact tttcaacaaa gtgacacttg cagatgctgg cttcatcaaa 2460 caatatggtg attgccttgg tgatattgct gctagagatc tcatttgcgc tcaaaaattt 2520 aacggactta cagttttacc acctttactt actgacgaaa tgattgcgca atatacatcc 2580 gcattgttag ccggaactat tacatccgga tggacttttg gcgcaggcgt agcattacag 2640 attccattcg ctatgcaaat ggcttatagg tttaacggta taggcgttac gcaaaacgta 2700 ctttatgaga atcaaaaact tatcgctaac caatttaatt ccgctatcgg taagattcag 2760 gattcattgt ctagtactgc tagtgcactc ggtaagttgc aagacgtagt gaatcaaaac 2820 gctcaagcac ttaatacact cgttaaacag cttagttcta attttggcgc aatttctagt 2880 gtgcttaacg atatactatc tagactcgat aaagtcgaag ccgaagtgca aatcgataga 2940 ttgattaccg gtaggttgca atcattgcaa acatacgtta cacagcaatt gattagggcc 3000 gcagagatac gcgctagcgc taatctcgca gctactaaaa tgtctgaatg cgtactcgga 3060 caatctaaac gtgtcgattt ttgcggtaag ggatatcatc ttatgtcttt tccacaatct 3120 gcacctcacg gagtcgtgtt tttacacgtt acttatgtgc cagctcaaga gaaaaatttt 3180 acaaccgctc ctgctatttg tcatgacggt aaggcacatt ttcctagaga gggcgtattc 3240 gtttctaacg gtacacattg gttcgttaca caacgtaatt tttacgaacc tcaaattatt 3300 actactgata atacattcgt atcaggtaat tgtgacgtag tgataggtat cgttaataat 3360 acagtttacg atccacttca acctgaactc gatagtttta aagaggaact cgataagtat 3420 tttaaaaatc atacatcacc tgacgtcgac ttaggcgata tttcaggtat taacgctagt 3480 gtcgttaaca ttcaaaaaga gattgataga cttaacgaag tcgctaaaaa tcttaacgaa 3540 tcacttatcg atctgcaaga gttaggtaag tatgagcaat atattaaatg gccttggtat 3600 atttggttag gctttatagc cggattgatc gcaatcgtta tggttacaat tatgttatgt 3660 tgtatgacat catgttgttc atgtcttaag ggatgttgtt catgcggatc atgttgtaaa 3720 tttgacgaag acgattccga accagtgctt aaaggcgtta agttacatta tacataa 3777 <210> 7 <211> 3780 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 7 atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttagaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240 aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300 ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360 aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420 ttggatgttt attaccacaa aaacaacaaa agttggatgg aaagtggagt ttattctagt 480 gcgaataatt gcacttttga atatgtctct cagccttttc ttatggacct tgaaggaaaa 540 cagggtaatt tcaaaaatct tagggaattt gtgtttaaga atattgatgg ttattttaaa 600 atatattcta agcacacgcc tattaattta gtgcgtgatc tccctcaggg tttttcggct 660 ttagaaccat tggtagattt gccaataggt attaacatca ctaggtttca aactttactt 720 gctttacata gaagttattt gactcctggt gattcttctt caggttggac agctggtgct 780 gcagcttatt atgtgggtta tcttcaacct aggacttttc tattaaaata taatgaaaat 840 ggaaccatta cagatgctgt agactgtgca cttgaccctc tctcagaaac aaagtgtacg 900 ttgaaatcct tcactgtaga aaaaggaatc tatcaaactt ctaactttag agtccaacca 960 acagaatcta ttgttagatt tcctaatatt acaaacttgt gcccttttgg tgaagttttt 1020 aacgccacca gatttgcatc tgtttatgct tggaacagga agagaatcag caactgtgtt 1080 gctgattatt ctgtcctata taattccgca tcattttcca cttttaagtg ttatggagtg 1140 tctcctacta aattaaatga tctctgcttt actaatgtct atgcagattc atttgtaatt 1200 agaggtgatg aagtcagaca aatcgctcca gggcaaactg gaaagattgc tgattataat 1260 tataaattac cagatgattt tacaggctgc gttatagctt ggaattctaa caatcttgat 1320 tctaaggttg gtggtaatta taattaccgg tatagattgt ttaggaagtc taatctcaaa 1380 ccttttgaga gagatatttc aactgaaatc tatcaggccg gtagcaaacc ttgtaatggt 1440 gttgaaggtt ttaattgtta ctttccttta caatcatatg gtttccaacc cactaatggt 1500 gttggttacc aaccatacag agtagtagta ctttcttttg aacttctaca tgcaccagca 1560 actgtttgtg gacctaaaaa gtctactaat ttggttaaaa acaaatgtgt caatttcaac 1620 ttcaatggtt taacaggcac aggtgttctt actgagtcta acaaaaagtt tctgcctttc 1680 caacaatttg gcagagacat tgctgacact actgatgctg tccgtgatcc acagacactt 1740 gagattcttg acattacacc atgttctttt ggtggtgtca gtgttataac accaggaaca 1800 aatacttcta accaggttgc tgttctttat cagggtgtta actgcacaga agtccctgtt 1860 gctattcatg cagatcaact tactcctact tggcgtgttt attctacagg ttctaatgtt 1920 tttcaaacac gtgcaggctg tttaataggg gctgaacatg tcaacaactc atatgagtgt 1980 gacataccca ttggtgcagg tatatgcgct agttatcaga ctcagcaatc catcattgcc 2040 tacactatgt cacttggtgc agaaaattca gttgcttact ctaataactc tattgccata 2100 cccacaaatt ttactattag tgttaccaca gaaattctac cagtgtctat gaccaagaca 2160 tcagtagatt gtacaatgta catttgtggt gattcaactg aatgcagcaa tcttttgttg 2220 caatatggca gtttttgtac acaattaaac cgtgctttaa ctggaatagc tgttgaacaa 2280 gacaaaaaca cccaagaagt ttttgcacaa gtcaaacaaa tttacaaaac accaccaatt 2340 aaagattttg gtggttttaa tttttcacaa atattaccag atccatcaaa accaagcaag 2400 aggtcattta ttgaagatct acttttcaac aaagtgacac ttgcagatgc tggcttcatc 2460 aaacaatatg gtgattgcct tggtgatatt gctgctagag atctcatttg cgctcaaaaa 2520 tttaacggac ttacagtttt accaccttta cttactgacg aaatgattgc gcaatataca 2580 tccgcattgt tagccggaac tattacatcc ggatggactt ttggcgcagg cgcagcatta 2640 cagattccat tcgctatgca aatggcttat aggtttaacg gtataggcgt tacgcaaaac 2700 gtactttatg agaatcaaaa acttatcgct aaccaattta attccgctat cggtaagatt 2760 caggattcat tgtctagtac tgctagtgca ctcggtaagt tgcaaaatgt agtgaatcaa 2820 aacgctcaag cacttaatac actcgttaaa cagcttagtt ctaattttgg cgcaatttct 2880 agtgtgctta acgatatact atctagactc gataaagtcg aagccgaagt gcaaatcgat 2940 agattgatta ccggtaggtt gcaatcattg caaacatacg ttacacagca attgattagg 3000 gccgcagaga tacgcgctag cgctaatctc gcagctacta aaatgtctga atgcgtactc 3060 ggacaatcta aacgtgtcga tttttgcggt aagggatatc atcttatgtc ttttccacaa 3120 tctgcacctc acggagtcgt gtttttacac gttacttatg tgccagctca agagaaaaat 3180 tttacaaccg ctcctgctat ttgtcatgac ggtaaggcac attttcctag agagggcgta 3240 ttcgtttcta acggtacaca ttggttcgtt acacaacgta atttttacga acctcaaatt 3300 attactactg ataatacatt cgtatcaggt aattgtgacg tagtgatagg tatcgttaat 3360 aatacagttt acgatccact tcaacctgaa ctcgatagtt ttaaagagga actcgataag 3420 tattttaaaa atcatacatc acctgacgtc gacttaggcg atatttcagg tattaacgct 3480 agtgtcgtta acattcaaaa agagattgat agacttaacg aagtcgctaa aaatcttaac 3540 gaatcactta tcgatctgca agagttaggt aagtatgagc aatatattaa atggccttgg 3600 tatatttggt taggctttat agccggattg atcgcaatcg ttatggttac aattatgtta 3660 tgttgtatga catcatgttg ttcatgtctt aagggatgtt gttcatgcgg atcatgttgt 3720 aaatttgacg aagacgattc cgaaccagtg cttaaaggcg ttaagttaca ttatacataa 3780 <210> 8 <211> 29825 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 8 attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60 gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120 cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180 ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240 cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300 acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360 agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420 cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480 acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540 cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600 cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660 tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720 tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780 actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840 ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900 atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960 tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020 gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080 ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140 gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200 caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260 gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320 aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380 atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440 cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500 ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560 ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620 aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680 gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740 aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800 aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860 tctttatgcg tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920 tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980 aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040 taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100 gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160 agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220 ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280 ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340 tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400 ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460 tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520 aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580 agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640 aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700 cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760 agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820 acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880 ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940 actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000 tgagtttata ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060 agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120 agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180 agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240 cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300 agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360 aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420 aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480 aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540 tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600 acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660 gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720 tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780 tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840 aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900 gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960 caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020 cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080 tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140 agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200 gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260 gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320 cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380 ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440 tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500 agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560 gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620 tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680 agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740 ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800 agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860 taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920 ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980 aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040 acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100 acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160 tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220 cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280 caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340 acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400 acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460 gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520 taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580 cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640 agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700 tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760 gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820 acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880 ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940 tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000 tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060 tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120 aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180 taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240 gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300 tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360 cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420 ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480 aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540 cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600 attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660 tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720 aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780 ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840 atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900 ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960 gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020 tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080 ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140 tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200 atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260 tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320 ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380 acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440 tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500 ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560 gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620 tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680 cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740 tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800 ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860 taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagtatc 7920 atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980 agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040 tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100 agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160 ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220 tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280 ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340 tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400 atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460 tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520 tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580 gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640 tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700 tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760 tgattttgac acatggttta gtcagcgtgg tggtagttat actaatgaca aagcttgccc 8820 attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880 gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940 tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000 ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060 ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120 acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180 tgttagagtg gtaacaacct ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240 agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300 atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360 accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420 tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagaa gagcttttgg 9480 tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540 ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600 gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660 cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720 tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780 tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840 gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900 taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960 tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020 accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080 atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140 tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200 gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260 ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320 taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380 acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440 tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500 ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560 tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620 aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680 cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740 ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800 actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860 agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920 tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980 gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040 agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100 accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160 gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220 ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280 tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340 aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400 gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460 catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520 gttcttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580 tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640 ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700 ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760 gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820 tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880 actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940 ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000 ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060 agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120 atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180 ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240 ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300 gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360 gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420 aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480 tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540 atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600 tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660 ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720 gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780 caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840 atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900 ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960 aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020 acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080 tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140 taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200 ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260 ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320 acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380 ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440 gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500 ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560 aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620 gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680 caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740 ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800 aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860 acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920 gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980 cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040 attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100 gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160 ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220 ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280 aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340 tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400 ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460 gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520 ttacatagct ctagacttat ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580 cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640 cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700 gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760 ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820 ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880 gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940 tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000 tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060 caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120 tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180 gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240 atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300 aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360 aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420 caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480 tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540 acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600 cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660 tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720 gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780 aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840 actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900 aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960 ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020 tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080 tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140 gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200 tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260 aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320 tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380 gtttgcagtg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440 agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500 gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560 attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620 agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680 tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740 gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800 aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860 gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920 tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980 attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040 tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100 agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160 tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220 aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280 aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340 gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400 gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460 cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520 atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580 gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640 gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700 aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760 gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820 ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880 accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940 aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000 agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactt 18060 tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120 agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180 gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240 ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300 ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360 cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420 cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480 cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540 caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600 catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660 tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720 catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780 ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840 catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900 aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960 gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020 gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080 tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140 tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200 aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260 aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320 acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380 tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440 ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500 gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560 ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620 agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680 gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740 gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800 cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860 gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920 gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980 gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040 gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100 agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160 aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220 caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280 ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340 agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400 tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460 acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520 gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580 actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640 ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700 tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760 acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820 aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880 gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940 cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000 tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060 aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120 gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180 tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240 actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300 ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360 aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420 aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480 cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540 cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600 tcagtgtgtt aattttacaa ccagaactca attaccccct gcatacacta attctttcac 21660 acgtggtgtt tattaccctg acaaagtttt cagatcctca gttttacatt caactcagga 21720 cttgttctta cctttctttt ccaatgttac ttggttccat gctatacatg tctctgggac 21780 caatggtact aagaggtttg ctaaccctgt cctaccattt aatgatggtg tttattttgc 21840 ttccactgag aagtctaaca taataagagg ctggattttt ggtactactt tagattcgaa 21900 gacccagtcc ctacttattg ttaataacgc tactaatgtt gttattaaag tctgtgaatt 21960 tcaattttgt aatgatccat ttttgggtgt ttattaccac aaaaacaaca aaagttggat 22020 ggaaagtgag ttcagagttt attctagtgc gaataattgc acttttgaat atgtctctca 22080 gccttttctt atggaccttg aaggaaaaca gggtaatttc aaaaatctta gggaatttgt 22140 gtttaagaat attgatggtt attttaaaat atattctaag cacacgccta ttaatttagt 22200 gcgtggtctc cctcagggtt tttcggcttt agaaccattg gtagatttgc caataggtat 22260 taacatcact aggtttcaaa ctttacatag aagttatttg actcctggtg attcttcttc 22320 aggttggaca gctggtgctg cagcttatta tgtgggttat cttcaaccta ggacttttct 22380 attaaaatat aatgaaaatg gaaccattac agatgctgta gactgtgcac ttgaccctct 22440 ctcagaaaca aagtgtacgt tgaaatcctt cactgtagaa aaaggaatct atcaaacttc 22500 taactttaga gtccaaccaa cagaatctat tgttagattt cctaatatta caaacttgtg 22560 cccttttggt gaagttttta acgccaccag atttgcatct gtttatgctt ggaacaggaa 22620 gagaatcagc aactgtgttg ctgattattc tgtcctatat aattccgcat cattttccac 22680 ttttaagtgt tatggagtgt ctcctactaa attaaatgat ctctgcttta ctaatgtcta 22740 tgcagattca tttgtaatta gaggtgatga agtcagacaa atcgctccag ggcaaactgg 22800 aaatattgct gattataatt ataaattacc agatgatttt acaggctgcg ttatagcttg 22860 gaattctaac aatcttgatt ctaaggttgg tggtaattat aattacctgt atagattgtt 22920 taggaagtct aatctcaaac cttttgagag agatatttca actgaaatct atcaggccgg 22980 tagcacacct tgtaatggtg ttaaaggttt taattgttac tttcctttac aatcatatgg 23040 tttccaaccc acttatggtg ttggttacca accatacaga gtagtagtac tttcttttga 23100 acttctacat gcaccagcaa ctgtttgtgg acctaaaaag tctactaatt tggttaaaaa 23160 caaatgtgtc aatttcaact tcaatggttt aacaggcaca ggtgttctta ctgagtctaa 23220 caaaaagttt ctgcctttcc aacaatttgg cagagacatt gctgacacta ctgatgctgt 23280 ccgtgatcca cagacacttg agattcttga cattacacca tgttcttttg gtggtgtcag 23340 tgttataaca ccaggaacaa atacttctaa ccaggttgct gttctttatc agggtgttaa 23400 ctgcacagaa gtccctgttg ctattcatgc agatcaactt actcctactt ggcgtgttta 23460 ttctacaggt tctaatgttt ttcaaacacg tgcaggctgt ttaatagggg ctgaacatgt 23520 caacaactca tatgagtgtg acatacccat tggtgcaggt atatgcgcta gttatcagac 23580 tcagcaatcc atcattgcct acactatgtc acttggtgta gaaaattcag ttgcttactc 23640 taataactct attgccatac ccacaaattt tactattagt gttaccacag aaattctacc 23700 agtgtctatg accaagacat cagtagattg tacaatgtac atttgtggtg attcaactga 23760 atgcagcaat cttttgttgc aatatggcag tttttgtaca caattaaacc gtgctttaac 23820 tggaatagct gttgaacaag acaaaaacac ccaagaagtt tttgcacaag tcaaacaaat 23880 ttacaaaaca ccaccaatta aagattttgg tggttttaat ttttcacaaa tattaccaga 23940 tccatcaaaa ccaagcaaga ggtcatttat tgaagatcta cttttcaaca aagtgacact 24000 tgcagatgct ggcttcatca aacaatatgg tgattgcctt ggtgatattg ctgctagaga 24060 tctcatttgc gctcaaaaat ttaacggact tacagtttta ccacctttac ttactgacga 24120 aatgattgcg caatatacat ccgcattgtt agccggaact attacatccg gatggacttt 24180 tggcgcaggc gtagcattac agattccatt cgctatgcaa atggcttata ggtttaacgg 24240 tataggcgtt acgcaaaacg tactttatga gaatcaaaaa cttatcgcta accaatttaa 24300 ttccgctatc ggtaagattc aggattcatt gtctagtact gctagtgcac tcggtaagtt 24360 gcaagacgta gtgaatcaaa acgctcaagc acttaataca ctcgttaaac agcttagttc 24420 taattttggc gcaatttcta gtgtgcttaa cgatatacta tctagactcg ataaagtcga 24480 agccgaagtg caaatcgata gattgattac cggtaggttg caatcattgc aaacatacgt 24540 tacacagcaa ttgattaggg ccgcagagat acgcgctagc gctaatctcg cagctactaa 24600 aatgtctgaa tgcgtactcg gacaatctaa acgtgtcgat ttttgcggta agggatatca 24660 tcttatgtct tttccacaat ctgcacctca cggagtcgtg tttttacacg ttacttatgt 24720 gccagctcaa gagaaaaatt ttacaaccgc tcctgctatt tgtcatgacg gtaaggcaca 24780 ttttcctaga gagggcgtat tcgtttctaa cggtacacat tggttcgtta cacaacgtaa 24840 tttttacgaa cctcaaatta ttactactga taatacattc gtatcaggta attgtgacgt 24900 agtgataggt atcgttaata atacagttta cgatccactt caacctgaac tcgatagttt 24960 taaagaggaa ctcgataagt attttaaaaa tcatacatca cctgacgtcg acttaggcga 25020 tatttcaggt attaacgcta gtgtcgttaa cattcaaaaa gagattgata gacttaacga 25080 agtcgctaaa aatcttaacg aatcacttat cgatctgcaa gagttaggta agtatgagca 25140 atatattaaa tggccttggt atatttggtt aggctttata gccggattga tcgcaatcgt 25200 tatggttaca attatgttat gttgtatgac atcatgttgt tcatgtctta agggatgttg 25260 ttcatgcgga tcatgttgta aatttgacga agacgattcc gaaccagtgc ttaaaggcgt 25320 taagttacat tatacataaa cgaacttatg gatttgttta tgagaatctt cacaattgga 25380 actgtaactt tgaagcaagg tgaaatcaag gatgctactc cttcagattt tgttcgcgct 25440 actgcaacga taccgataca agcctcactc cctttcggat ggcttattgt tggcgttgca 25500 cttcttgctg tttttcagag cgcttccaaa atcataaccc tcaaaaagag atggcaacta 25560 gcactctcca agggtgttca ctttgtttgc aacttgctgt tgttgtttgt aacagtttac 25620 tcacaccttt tgctcgttgc tgctggcctt gaagcccctt ttctctatct ttatgcttta 25680 gtctacttct tgcagagtat aaactttgta agaataataa tgaggctttg gctttgctgg 25740 aaatgccgtt ccaaaaaccc attactttat gatgccaact attttctttg ctggcatact 25800 aattgttacg actattgtat accttacaat agtgtaactt cttcaattgt cattacttca 25860 ggtgatggca caacaagtcc tatttctgaa catgactacc agattggtgg ttatactgaa 25920 aaatgggaat ctggagtaaa agactgtgtt gtattacaca gttacttcac ttcagactat 25980 taccagctgt actcaactca attgagtaca gacactggtg ttgaacatgt taccttcttc 26040 atctacaata aaattgttga tgagcctgaa gaacatgtcc aaattcacac aatcgacggt 26100 tcatccggag ttgttaatcc agtaatggaa ccaatttatg atgaaccgac gacgactact 26160 agcgtgcctt tgtaagcaca agctgatgag tacgaactta tgtactcatt cgtttcggaa 26220 gagacaggta cgttaatagt taatagcgta cttctttttc ttgctttcgt ggtattcttg 26280 ctagttacac tagccatcct tactgcgctt cgattgtgtg cgtactgctg caatattgtt 26340 aacgtgagtc ttgtaaaacc ttctttttac gtttactctc gtgttaaaaa tctgaattct 26400 tctagagttc ctgatcttct ggtctaaacg aactaaatat tatattagtt tttctgtttg 26460 gaactttaat tttagccatg gcagattcca acggtactat taccgttgaa gagcttaaaa 26520 agctccttga acaatggaac ctagtaatag gtttcctatt ccttacatgg atttgtcttc 26580 tacaatttgc ctatgccaac aggaataggt ttttgtatat aattaagtta attttcctct 26640 ggctgttatg gccagtaact ttagcttgtt ttgtgcttgc tgctgtttac agaataaatt 26700 ggatcaccgg tggaattgct atcgcaatgg cttgtcttgt aggcttgatg tggctcagct 26760 acttcattgc ttctttcaga ctgtttgcgc gtacgcgttc catgtggtca ttcaatccag 26820 aaactaacat tcttctcaac gtgccactcc atggcactat tctgaccaga ccgcttctag 26880 aaagtgaact cgtaatcgga gctgtgatcc ttcgtggaca tcttcgtatt gctggacacc 26940 atctaggacg ctgtgacatc aaggacctgc ctaaagaaat cactgttgct acatcacgaa 27000 cgctttctta ttacaaattg ggagcttcgc agcgtgtagc aggtgactca ggttttgctg 27060 catacagtcg ctacaggatt ggcaactata aattaaacac agaccattcc agtagcagtg 27120 acaatattgc tttgcttgta cagtaagtga caacagatgt ttcatctcgt tgactttcag 27180 gttactatag cagagatatt actaattatt atgaggactt ttaaagtttc catttggaat 27240 cttgattaca tcataaacct cataattaaa aatttatcta agtcactaac tgagaataaa 27300 tattctcaat tagatgaaga gcaaccaatg gagattgatt aaacgaacat gaaaattatt 27360 cttttcttgg cactgataac actcgctact tgtgagcttt atcactacca agagtgtgtt 27420 agaggtacaa cagtactttt aaaagaacct tgctcttctg gaacatacga gggcaattca 27480 ccatttcatc ctctagctga taacaaattt gcactgactt gctttagcac tcaatttgct 27540 tttgcttgtc ctgacggcgt aaaacacgtc tatcagttac gtgccagatc agtttcacct 27600 aaactgttca tcagacaaga ggaagttcaa gaactttact ctccaatttt tcttattgtt 27660 gcggcaatag tgtttataac actttgcttc acactcaaaa gaaagacaga atgattgaac 27720 tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt gttttaatta 27780 tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact tgtcacgcct 27840 aaacgaacat gaaatttctt gttttcttag gaatcatcac aactgtagct gcatttcacc 27900 aagaatgtag tttacagtca tgtactcaac atcaaccata tgtagttgat gacccgtgtc 27960 ctattcactt ctattctaaa tggtatatta gagtaggagc tagaaaatca gcacctttaa 28020 ttgaattgtg cgtggatgag gctggttcta aatcacccat tcagtacatc gatatcggta 28080 attatacagt ttcctgttca ccttttacaa ttaattgcca ggaacctaaa ttgggtagtc 28140 ttgtagtgcg ttgttcgttc tatgaagact ttttagagta tcatgacgtt cgtgttgttt 28200 tagatttcat ctaaacgaac aaactaaaat gtctgataat ggaccccaaa atcagcgaaa 28260 tgcaccccgc attacgtttg gtggaccctc agattcaact ggcagtaacc agaatggaga 28320 acgcagtggg gcgcgatcaa aacaacgtcg gccccaaggt ttacccaata atactgcgtc 28380 ttggttcacc gctctcactc aacatggcaa ggaagacctt aaattccctc gaggacaagg 28440 cgttccaatt aacaccaata gcagtccaga tgaccaaatt ggctactacc gaagagctac 28500 cagacgaatt cgtggtggtg acggtaaaat gaaagatctc agtccaagat ggtatttcta 28560 ctacctagga actgggccag aagctggact tccctatggt gctaacaaag acggcatcat 28620 atgggttgca actgagggag ccttgaatac accaaaagat cacattggca cccgcaatcc 28680 tgctaacaat gctgcaatcg tgctacaact tcctcaagga acaacattgc caaaaggctt 28740 ctacgcagaa gggagcagag gcggcagtca agcctcttct cgttcctcat cacgtagtcg 28800 caacagttca agaaattcaa ctccaggcag cagtagggga acttctcctg ctagaatggc 28860 tggcaatggc ggtgatgctg ctcttgcttt gctgctgctt gacagattga accagcttga 28920 gagcaaaatg tctggtaaag gccaacaaca acaaggccaa actgtcacta agaaatctgc 28980 tgctgaggct tctaagaagc ctcggcaaaa acgtactgcc actaaagcat acaatgtaac 29040 acaagctttc ggcagacgtg gtccagaaca aacccaagga aattttgggg accaggaact 29100 aatcagacaa ggaactgatt acaaacattg gccgcaaatt gcacaatttg cccccagcgc 29160 ttcagcgttc ttcggaatgt cgcgcattgg catggaagtc acaccttcgg gaacgtggtt 29220 gacctacaca ggtgccatca aattggatga caaagatcca aatttcaaag atcaagtcat 29280 tttgctgaat aagcatattg acgcatacaa aacattccca ccaacagagc ctaaaaagga 29340 caaaaagaag aaggctgatg aaactcaagc cttaccgcag agacagaaga aacagcaaac 29400 tgtgactctt cttcctgctg cagatttgga tgatttctcc aaacaattgc aacaatccat 29460 gagcagtgct gactcaactc aggcctaaac tcatgcagac cacacaaggc agatgggcta 29520 tataaacgtt ttcgcttttc cgtttacgat atatagtcta ctcttgtgca gaatgaattc 29580 tcgtaactac atagcacaag tagatgtagt taactttaat ctcacatagc aatctttaat 29640 cagtgtgtaa cattagggag gacttgaaag agccaccaca ttttcaccga ggccacgcgg 29700 agtacgatcg agtgtacagt gaacaatgct agggagagct gcctatatgg aagagcccta 29760 atgtgtaaaa ttaattttag tagtgctatc cccatgtgat tttaatagct tcttaggaga 29820 atgac 29825 <210> 9 <211> 29828 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 9 attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60 gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120 cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180 ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240 cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300 acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360 agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420 cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480 acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540 cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600 cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660 tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720 tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780 actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840 ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900 atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960 tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct ataaattgca 1020 gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080 ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140 gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200 caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260 gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320 aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380 atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440 cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500 ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560 ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620 aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680 gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740 aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800 aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860 tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920 tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980 aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040 taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100 gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160 agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220 ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280 ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340 tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400 ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460 tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520 aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580 agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640 aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700 cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760 agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820 acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880 ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940 actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000 tgagtttata ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060 agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120 agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180 agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240 cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300 agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360 aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420 aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480 aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540 tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600 acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660 gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720 tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780 tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840 aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900 gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960 caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020 cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080 tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140 agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200 gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260 gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320 cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380 ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440 tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500 agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560 gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620 tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680 agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740 ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800 agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860 taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920 ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980 aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040 acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100 acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160 tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220 cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280 caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340 acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400 acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460 gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520 taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580 cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640 agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700 tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760 gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820 acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880 ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940 tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000 tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060 tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120 aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180 taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240 gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300 tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360 cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420 ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480 aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540 cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600 attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660 tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720 aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780 ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840 atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900 ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960 gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020 tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080 ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140 tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200 atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260 tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320 ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380 acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440 tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500 ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560 gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620 tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680 cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740 tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800 ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860 taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920 atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980 agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040 tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100 agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160 ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220 tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280 ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340 tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400 atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460 tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520 tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580 gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640 tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700 tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760 tgattttgac acatggttta gtcagcgtgg tggtagttat actaatgaca aagcttgccc 8820 attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880 gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940 tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000 ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060 ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120 acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180 tgttagagtg gtaacaacct ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240 agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300 atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360 accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420 tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagaa gagcttttgg 9480 tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540 ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600 gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660 cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720 tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780 tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840 gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900 taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960 tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020 accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080 atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140 tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200 gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260 ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320 taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380 acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440 tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500 ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560 tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620 aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680 cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740 ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800 actaggacct ctttctgctc aaactggaat tgacgtttta gatatgtgtg cttcattaaa 10860 agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920 tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980 gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040 agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaga atgccttttt 11100 accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160 gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220 ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280 tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340 aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400 gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460 catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520 gttcttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580 tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640 ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700 ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760 gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820 tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880 actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940 ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000 ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060 agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120 atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180 ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240 ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300 gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360 gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420 aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480 tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540 atcagcattg tgggaattcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600 tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660 ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720 gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780 caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840 atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900 ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960 aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020 acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080 tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140 taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200 ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260 ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320 acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380 ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440 gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500 ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560 aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620 gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680 caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740 ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800 aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860 acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920 gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980 cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040 attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100 gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160 ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220 ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280 aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340 tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400 ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460 gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520 ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580 cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640 cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700 gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760 ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820 ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880 gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940 tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000 tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060 caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120 tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180 gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240 atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300 aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360 aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420 caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480 tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540 acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600 cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660 tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720 gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780 aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840 actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900 aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960 ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020 tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080 tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140 gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200 tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260 aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320 tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380 gtttgcagtg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440 agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500 gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560 attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620 agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680 tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740 gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800 aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860 gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920 tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980 attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040 tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100 agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160 tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220 aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280 aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340 gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400 gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460 cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520 atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580 gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640 gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700 aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760 gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820 ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880 accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940 aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000 agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactt 18060 tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120 agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180 gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240 ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300 ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360 cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420 cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480 cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540 caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600 catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660 tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720 catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780 ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840 catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900 aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960 gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020 gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080 tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140 tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200 aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260 aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320 acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380 tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440 ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500 gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560 ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620 agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680 gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740 gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800 cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860 gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920 gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980 gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040 gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100 agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160 aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220 caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280 ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340 agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400 tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460 acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520 gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580 actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640 ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700 tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760 acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820 aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880 gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940 cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000 tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060 aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120 gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180 tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240 actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300 ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360 aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420 aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480 cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540 cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600 tcagtgtgtt aatcttagaa ccagaactca attaccccct gcatacacta attctttcac 21660 acgtggtatt tattaccctg acaaagtttt cagatcctca gttttacatt caactcagga 21720 cttgttctta cctttctttt ccaatgttac ttggttccat gctatacatg tctctgggac 21780 caatggtact aagaggtttg ataaccctgt cctaccattt aatgatggtg tttattttgc 21840 ttccactgag aagtctaaca taataagagg ctggattttt ggtactactt tagattcgaa 21900 gacccagtcc ctacttattg ttaataacgc tactaatgtt gttattaaag tctgtgaatt 21960 tcaattttgt aatgatccat ttttggatgt ttattaccac aaaaacaaca aaagttggat 22020 ggaaagtgga gtttattcta gtgcgaataa ttgcactttt gaatatgtct ctcagccttt 22080 tcttatggac cttgaaggaa aacagggtaa tttcaaaaat cttagggaat ttgtgtttaa 22140 gaatattgat ggttatttta aaatatattc taagcacacg cctattaatt tagtgcgtga 22200 tctccctcag ggtttttcgg ctttagaacc attggtagat ttgccaatag gtattaacat 22260 cactaggttt caaactttac ttgctttaca tagaagttat ttgactcctg gtgattcttc 22320 ttcaggttgg acagctggtg ctgcagctta ttatgtgggt tatcttcaac ctaggacttt 22380 tctattaaaa tataatgaaa atggaaccat tacagatgct gtagactgtg cacttgaccc 22440 tctctcagaa acaaagtgta cgttgaaatc cttcactgta gaaaaaggaa tctatcaaac 22500 ttctaacttt agagtccaac caacagaatc tattgttaga tttcctaata ttacaaactt 22560 gtgccctttt ggtgaagttt ttaacgccac cagatttgca tctgtttatg cttggaacag 22620 gaagagaatc agcaactgtg ttgctgatta ttctgtccta tataattccg catcattttc 22680 cacttttaag tgttatggag tgtctcctac taaattaaat gatctctgct ttactaatgt 22740 ctatgcagat tcatttgtaa ttagaggtga tgaagtcaga caaatcgctc cagggcaaac 22800 tggaaagatt gctgattata attataaatt accagatgat tttacaggct gcgttatagc 22860 ttggaattct aacaatcttg attctaaggt tggtggtaat tataattacc ggtatagatt 22920 gtttaggaag tctaatctca aaccttttga gagagatatt tcaactgaaa tctatcaggc 22980 cggtagcaaa ccttgtaatg gtgttgaagg ttttaattgt tactttcctt tacaatcata 23040 tggtttccaa cccactaatg gtgttggtta ccaaccatac agagtagtag tactttcttt 23100 tgaacttcta catgcaccag caactgtttg tggacctaaa aagtctacta atttggttaa 23160 aaacaaatgt gtcaatttca acttcaatgg tttaacaggc acaggtgttc ttactgagtc 23220 taacaaaaag tttctgcctt tccaacaatt tggcagagac attgctgaca ctactgatgc 23280 tgtccgtgat ccacagacac ttgagattct tgacattaca ccatgttctt ttggtggtgt 23340 cagtgttata acaccaggaa caaatacttc taaccaggtt gctgttcttt atcagggtgt 23400 taactgcaca gaagtccctg ttgctattca tgcagatcaa cttactccta cttggcgtgt 23460 ttattctaca ggttctaatg tttttcaaac acgtgcaggc tgtttaatag gggctgaaca 23520 tgtcaacaac tcatatgagt gtgacatacc cattggtgca ggtatatgcg ctagttatca 23580 gactcagcaa tccatcattg cctacactat gtcacttggt gcagaaaatt cagttgctta 23640 ctctaataac tctattgcca tacccacaaa ttttactatt agtgttacca cagaaattct 23700 accagtgtct atgaccaaga catcagtaga ttgtacaatg tacatttgtg gtgattcaac 23760 tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt acacaattaa accgtgcttt 23820 aactggaata gctgttgaac aagacaaaaa cacccaagaa gtttttgcac aagtcaaaca 23880 aatttacaaa acaccaccaa ttaaagattt tggtggtttt aatttttcac aaatattacc 23940 agatccatca aaaccaagca agaggtcatt tattgaagat ctacttttca acaaagtgac 24000 acttgcagat gctggcttca tcaaacaata tggtgattgc cttggtgata ttgctgctag 24060 agatctcatt tgcgctcaaa aatttaacgg acttacagtt ttaccacctt tacttactga 24120 cgaaatgatt gcgcaatata catccgcatt gttagccgga actattacat ccggatggac 24180 ttttggcgca ggcgcagcat tacagattcc attcgctatg caaatggctt ataggtttaa 24240 cggtataggc gttacgcaaa acgtacttta tgagaatcaa aaacttatcg ctaaccaatt 24300 taattccgct atcggtaaga ttcaggattc attgtctagt actgctagtg cactcggtaa 24360 gttgcaaaat gtagtgaatc aaaacgctca agcacttaat acactcgtta aacagcttag 24420 ttctaatttt ggcgcaattt ctagtgtgct taacgatata ctatctagac tcgataaagt 24480 cgaagccgaa gtgcaaatcg atagattgat taccggtagg ttgcaatcat tgcaaacata 24540 cgttacacag caattgatta gggccgcaga gatacgcgct agcgctaatc tcgcagctac 24600 taaaatgtct gaatgcgtac tcggacaatc taaacgtgtc gatttttgcg gtaagggata 24660 tcatcttatg tcttttccac aatctgcacc tcacggagtc gtgtttttac acgttactta 24720 tgtgccagct caagagaaaa attttacaac cgctcctgct atttgtcatg acggtaaggc 24780 acattttcct agagagggcg tattcgtttc taacggtaca cattggttcg ttacacaacg 24840 taatttttac gaacctcaaa ttattactac tgataataca ttcgtatcag gtaattgtga 24900 cgtagtgata ggtatcgtta ataatacagt ttacgatcca cttcaacctg aactcgatag 24960 ttttaaagag gaactcgata agtattttaa aaatcataca tcacctgacg tcgacttagg 25020 cgatatttca ggtattaacg ctagtgtcgt taacattcaa aaagagattg atagacttaa 25080 cgaagtcgct aaaaatctta acgaatcact tatcgatctg caagagttag gtaagtatga 25140 gcaatatatt aaatggcctt ggtatatttg gttaggcttt atagccggat tgatcgcaat 25200 cgttatggtt acaattatgt tatgttgtat gacatcatgt tgttcatgtc ttaagggatg 25260 ttgttcatgc ggatcatgtt gtaaatttga cgaagacgat tccgaaccag tgcttaaagg 25320 cgttaagtta cattatacat aaacgaactt atggatttgt ttatgagaat cttcacaatt 25380 ggaactgtaa ctttgaagca aggtgaaatc aaggatgcta ctccttcaga ttttgttcgc 25440 gctactgcaa cgataccgat acaagcctca ctccctttcg gatggcttat tgttggcgtt 25500 gcacttcttg ctgtttttca gagcgcttcc aaaatcataa ccctcaaaaa gagatggcaa 25560 ctagcactct ccaagggtgt tcactttgtt tgcaacttgc tgttgttgtt tgtaacagtt 25620 tactcacacc ttttgctcgt tgctgctggc cttgaagccc cttttctcta tctttatgct 25680 ttagtctact tcttgcagag tataaacttt gtaagaataa taatgaggct ttggctttgc 25740 tggaaatgcc gttccaaaaa cccattactt tatgatgcca actattttct ttgctggcat 25800 actaattgtt acgactattg tataccttac aatagtgtaa cttcttcaat tgtcattact 25860 tcaggtgatg gcacaacaag tcctatttct gaacatgact accagattgg tggttatact 25920 gaaaaatggg aatctggagt aaaagactgt gttgtattac acagttactt cacttcagac 25980 tattaccagc tgtactcaac tcaattgagt acagacactg gtgttgaaca tgttaccttc 26040 ttcatctaca ataaaattgt tgatgagcct gaagaacatg tccaaattca cacaatcgac 26100 ggttcatccg gagttgttaa tccagtaatg gaaccaattt atgatgaacc gacgacgact 26160 actagcgtgc ctttgtaagc acaagctgat gagtacgaac ttatgtactc attcgtttcg 26220 gaagagacag gtacgttaat agttaatagc gtacttcttt ttcttgcttt cgtggtattc 26280 ttgctagtta cactagccat ccttactgcg cttcgattgt gtgcgtactg ctgcaatatt 26340 gttaacgtga gtcttgtaaa accttctttt tacgtttact ctcgtgttaa aaatctgaat 26400 tcttctagag ttcctgatct tctggtctaa acgaactaaa tattatatta gtttttctgt 26460 ttggaacttt aattttagcc atggcagatt ccaacggtac tattaccgtt gaagagctta 26520 aaaagctcct tgaacaatgg aacctagtaa taggtttcct attccttaca tggatttgtc 26580 ttctacaatt tgcctatgcc aacaggaata ggtttttgta tataattaag ttaattttcc 26640 tctggctgtt atggccagta actttagctt gttttgtgct tgctgctgtt tacagaataa 26700 attggatcac cggtggaatt gctatcgcaa tggcttgtct tgtaggcttg atgtggctca 26760 gctacttcat tgcttctttc agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc 26820 cagaaactaa cattcttctc aacgtgccac tccatggcac tattctgacc agaccgcttc 26880 tagaaagtga actcgtaatc ggagctgtga tccttcgtgg acatcttcgt attgctggac 26940 accatctagg acgctgtgac atcaaggacc tgcctaaaga aatcactgtt gctacatcac 27000 gaacgctttc ttattacaaa ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg 27060 ctgcatacag tcgctacagg attggcaact ataaattaaa cacagaccat tccagtagca 27120 gtgacaatat tgctttgctt gtacagtaag tgacaacaga tgtttcatct cgttgacttt 27180 caggttacta tagcagagat attactaatt attatgagga cttttaaagt ttccatttgg 27240 aatcttgatt acatcataaa cctcataatt aaaaatttat ctaagtcact aactgagaat 27300 aaatattctc aattagatga agagcaacca atggagattg attaaacgaa catgaaaatt 27360 attcttttct tggcactgat aacactcgct acttgtgagc tttatcacta ccaagagtgt 27420 gttagaggta caacagtact tttaaaagaa ccttgctctt ctggaacata cgagggcaat 27480 tcaccatttc atcctctagc tgataacaaa tttgcactga cttgctttag cactcaattt 27540 gcttttgctt gtcctgacgg cgtaaaacac gtctatcagt tacgtgccag atcagtttca 27600 cctaaactgt tcatcagaca agaggaagtt caagaacttt actctccaat ttttcttatt 27660 gttgcggcaa tagtgtttat aacactttgc ttcacactca aaagaaagac agaatgattg 27720 aactttcatt aattgacttc tatttgtgct ttttagcctt tctgctattc cttgttttaa 27780 ttatgcttat tatcttttgg ttctcacttg aactgcaaga tcataatgaa acttgtcacg 27840 cctaaacgaa catgaaattt cttgttttct taggaatcat cacaactgta gctgcatttc 27900 accaagaatg tagtttacag tcatgtactc aacatcaacc atatgtagtt gatgacccgt 27960 gtcctattca cttctattct aaatggtata ttagagtagg agctagaaaa tcagcacctt 28020 taattgaatt gtgcgtggat gaggctggtt ctaaatcacc cattcagtac atcgatatcg 28080 gtaattatac agtttcctgt tcacctttta caattaattg ccaggaacct aaattgggta 28140 gtcttgtagt gcgttgttcg ttctatgaag actttttaga gtatcatgac gttcgtgttg 28200 ttttagattt catctaaacg aacaaactaa aatgtctgat aatggacccc aaaatcagcg 28260 aaatgcaccc cgcattacgt ttggtggacc ctcagattca actggcagta accagaatgg 28320 agaacgcagt ggggcgcgat caaaacaacg tcggccccaa ggtttaccca ataatactgc 28380 gtcttggttc accgctctca ctcaacatgg caaggaagac cttaaattcc ctcgaggaca 28440 aggcgttcca attaacacca atagcagtcc agatgaccaa attggctact accgaagagc 28500 taccagacga attcgtggtg gtgacggtaa aatgaaagat ctcagtccaa gatggtattt 28560 ctactaccta ggaactgggc cagaagctgg acttccctat ggtgctaaca aagacggcat 28620 catatgggtt gcaactgagg gagccttgaa tacaccaaaa gatcacattg gcacccgcaa 28680 tcctgctaac aatgctgcaa tcgtgctaca acttcctcaa ggaacaacat tgccaaaagg 28740 cttctacgca gaagggagca gaggcggcag tcaagcctct tctcgttcct catcacgtag 28800 tcgcaacagt ttaagaaatt caactccagg cagcagtagg ggaacttctc ctgctagaat 28860 ggctggcaat ggcggtgatg ctgctcttgc tttgctgctg cttgacagat tgaaccagct 28920 tgagagcaaa atgtctggta aaggccaaca acaacaaggc caaactgtca ctaagaaatc 28980 tgctgctgag gcttctaaga agcctcggca aaaacgtact gccactaaag catacaatgt 29040 aacacaagct ttcggcagac gtggtccaga acaaacccaa ggaaattttg gggaccagga 29100 actaatcaga caaggaactg attacaaaca ttggccgcaa attgcacaat ttgcccccag 29160 cgcttcagcg ttcttcggaa tgtcgcgcat tggcatggaa gtcacacctt cgggaacgtg 29220 gttgacctac acaggtgcca tcaaattgga tgacaaagat ccaaatttca aagatcaagt 29280 cattttgctg aataagcata ttgacgcata caaaacattc ccaccaacag agcctaaaaa 29340 ggacaaaaag aagaaggctg atgaaactca agccttaccg cagagacaga agaaacagca 29400 aactgtgact cttcttcctg ctgcagattt ggatgatttc tccaaacaat tgcaacaatc 29460 catgagcagt gctgactcaa ctcaggccta aactcatgca gaccacacaa ggcagatggg 29520 ctatataaac gttttcgctt ttccgtttac gatatatagt ctactcttgt gcagaatgaa 29580 ttctcgtaac tacatagcac aagtagatgt agttaacttt aatctcacat agcaatcttt 29640 aatcagtgtg taacattagg gaggacttga aagagccacc acattttcac cgaggccacg 29700 cggagtacga tcgagtgtac agtgaacaat gctagggaga gctgcctata tggaagagcc 29760 ctaatgtgta aaattaattt tagtagtgct atccccatgt gattttaata gcttcttagg 29820 agaatgac 29828 <210> 10 <211> 29825 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 10 attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60 gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120 cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180 ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240 cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300 acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360 agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420 cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480 acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540 cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600 cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660 tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720 tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780 actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840 ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900 atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960 tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020 gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080 ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140 gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200 caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260 gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320 aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380 atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440 cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500 ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560 ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620 aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680 gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740 aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800 aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860 tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920 tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980 aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040 taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100 gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160 agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220 ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280 ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340 tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400 ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460 tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520 aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580 agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640 aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700 cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760 agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820 acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880 ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940 actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000 tgagtttata ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060 agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120 agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180 agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240 cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300 agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360 aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420 aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480 aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540 tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600 acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660 gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720 tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780 tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840 aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900 gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960 caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020 cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080 tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140 agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200 gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260 gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320 cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380 ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440 tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500 agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560 gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620 tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680 agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740 ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800 agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860 taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920 ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980 aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040 acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100 acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160 tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220 cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280 caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340 acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400 acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460 gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520 taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580 cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640 agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700 tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760 gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820 acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880 ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940 tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000 tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060 tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120 aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180 taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240 gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300 tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360 cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420 ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480 aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540 cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600 attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660 tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720 aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780 ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840 atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900 ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960 gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020 tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080 ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140 tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200 atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260 tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320 ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380 acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440 tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500 ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560 gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620 tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680 cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740 tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800 ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860 taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920 atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980 agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040 tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100 agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160 ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220 tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280 ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340 tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400 atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460 tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520 tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580 gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640 tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700 tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760 tgattttgac acatggttta gtcagcgtgg tggtagttat actaatgaca aagcttgccc 8820 attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880 gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940 tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000 ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060 ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120 acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180 tgttagagtg gtaacaacct ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240 agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300 atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360 accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420 tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagga gagcttttgg 9480 tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540 ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600 gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660 cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720 tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780 tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840 gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900 taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960 tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020 accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080 atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140 tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200 gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260 ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320 taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380 acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440 tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500 ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560 tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620 aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680 cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740 ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800 actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860 agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920 tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980 gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040 agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100 accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160 gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220 ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280 tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340 aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400 gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460 catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520 gttcttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580 tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640 ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700 ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760 gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820 tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880 actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940 ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000 ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060 agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120 atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180 ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240 ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300 gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360 gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420 aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480 tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540 atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600 tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660 ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720 gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780 caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840 atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900 ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960 aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020 acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080 tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140 taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200 ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260 ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320 acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380 ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440 gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500 ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560 aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620 gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680 caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740 ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800 aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860 acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920 gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980 cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040 attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100 gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160 ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220 ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280 aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340 tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400 ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460 gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520 ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580 cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640 cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700 gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760 ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820 ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880 gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940 tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000 tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060 caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120 tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180 gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240 atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300 aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360 aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420 caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480 tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540 acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600 cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660 tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720 gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780 aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840 actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900 aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960 ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020 tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080 tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140 gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200 tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260 aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320 tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380 gtttgcagtg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440 agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500 gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560 attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620 agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680 tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740 gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800 aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860 gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920 tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980 attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040 tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100 agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160 tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220 aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280 aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340 gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400 gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460 cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520 atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580 gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640 gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700 aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760 gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820 ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880 accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940 aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000 agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactt 18060 tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120 agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180 gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240 ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300 ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360 cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420 cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480 cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540 caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600 catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660 tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720 catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780 ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840 catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900 aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960 gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020 gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080 tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140 tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200 aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260 aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320 acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380 tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440 ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500 gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560 ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620 agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680 gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740 gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800 cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860 gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920 gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980 gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040 gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100 agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160 aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220 caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280 ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340 agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400 tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460 acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520 gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580 actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640 ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700 tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760 acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820 aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880 gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940 cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000 tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060 aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120 gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180 tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240 actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300 ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360 aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420 aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480 cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540 cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600 tcagtgtgtt aatcttacaa ccagaactca attaccccct gcatacacta attctttcac 21660 acgtggtgtt tattaccctg acaaagtttt cagatcctca gttttacatt caactcagga 21720 cttgttctta cctttctttt ccaatgttac ttggttccat gttatctctg ggaccaatgg 21780 tactaagagg tttgataacc ctgtcctacc atttaatgat ggtgtttatt ttgcttccat 21840 tgagaagtct aacataataa gaggctggat ttttggtact actttagatt cgaagaccca 21900 gtccctactt attgttaata acgctactaa tgttgttatt aaagtctgtg aatttcaatt 21960 ttgtaatgat ccatttttgg accacaaaaa caacaaaagt tggatggaaa gtgagttcag 22020 agtttattct agtgcgaata attgcacttt tgaatatgtc tctcagcctt ttcttatgga 22080 ccttgaagga aaacagggta atttcaaaaa tcttagggaa tttgtgttta agaatattga 22140 tggttatttt aaaatatatt ctaagcacac gcctattata gtgcgtgagc cagaagatct 22200 ccctcagggt ttttcggctt tagaaccatt ggtagatttg ccaataggta ttaacatcac 22260 taggtttcaa actttacttg ctttacatag aagttatttg actcctggtg attcttcttc 22320 aggttggaca gctggtgctg cagcttatta tgtgggttat cttcaaccta ggacttttct 22380 attaaaatat aatgaaaatg gaaccattac agatgctgta gactgtgcac ttgaccctct 22440 ctcagaaaca aagtgtacgt tgaaatcctt cactgtagaa aaaggaatct atcaaacttc 22500 taactttaga gtccaaccaa cagaatctat tgttagattt cctaatatta caaacttgtg 22560 cccttttgat gaagttttta acgccaccag atttgcatct gtttatgctt ggaacaggaa 22620 gagaatcagc aactgtgttg ctgattattc tgtcctatat aatctcgcac catttttcac 22680 ttttaagtgt tatggagtgt ctcctactaa attaaatgat ctctgcttta ctaatgtcta 22740 tgcagattca tttgtaatta gaggtgatga agtcagacaa atcgctccag ggcaaactgg 22800 aaatattgct gattataatt ataaattacc agatgatttt acaggctgcg ttatagcttg 22860 gaattctaac aagcttgatt ctaaggttag tggtaattat aattacctgt atagattgtt 22920 taggaagtct aatctcaaac cttttgagag agatatttca actgaaatct atcaggccgg 22980 taacaaacct tgtaatggtg ttgcaggttt taattgttac tttcctttac gatcatatag 23040 tttccgaccc acttatggtg ttggtcacca accatacaga gtagtagtac tttcttttga 23100 acttctacat gcaccagcaa ctgtttgtgg acctaaaaag tctactaatt tggttaaaaa 23160 caaatgtgtc aatttcaact tcaatggttt aaaaggcaca ggtgttctta ctgagtctaa 23220 caaaaagttt ctgcctttcc aacaatttgg cagagacatt gctgacacta ctgatgctgt 23280 ccgtgatcca cagacacttg agattcttga cattacacca tgttcttttg gtggtgtcag 23340 tgttataaca ccaggaacaa atacttctaa ccaggttgct gttctttatc agggtgttaa 23400 ctgcacagaa gtccctgttg ctattcatgc agatcaactt actcctactt ggcgtgttta 23460 ttctacaggt tctaatgttt ttcaaacacg tgcaggctgt ttaatagggg ctgaatatgt 23520 caacaactca tatgagtgtg acatacccat tggtgcaggt atatgcgcta gttatcagac 23580 tcagcaatcc atcattgcct acactatgtc acttggtgca gaaaattcag ttgcttactc 23640 taataactct attgccatac ccacaaattt tactattagt gttaccacag aaattctacc 23700 agtgtctatg accaagacat cagtagattg tacaatgtac atttgtggtg attcaactga 23760 atgcagcaat cttttgttgc aatatggcag tttttgtaca caattaaaac gtgctttaac 23820 tggaatagct gttgaacaag acaaaaacac ccaagaagtt tttgcacaag tcaaacaaat 23880 ttacaaaaca ccaccaatta aatattttgg tggttttaat ttttcacaaa tattaccaga 23940 tccatcaaaa ccaagcaaga ggtcatttat tgaagatcta cttttcaaca aagtgacact 24000 tgcagatgct ggcttcatca aacaatatgg tgattgcctt ggtgatattg ctgctagaga 24060 tctcatttgc gctcaaaaat ttaagggact tacagtttta ccacctttac ttactgacga 24120 aatgattgcg caatatacat ccgcattgtt agccggaact attacatccg gatggacttt 24180 tggcgcaggc gcagcattac agattccatt cgctatgcaa atggcttata ggtttaacgg 24240 tataggcgtt acgcaaaacg tactttatga gaatcaaaaa cttatcgcta accaatttaa 24300 ttccgctatc ggtaagattc aggattcatt gtctagtact gctagtgcac tcggtaagtt 24360 gcaagacgta gtgaatcaca acgctcaagc acttaataca ctcgttaaac agcttagttc 24420 taagtttggc gcaatttcta gtgtgcttaa cgatatattt tcgagactcg ataaagtcga 24480 agccgaagtg caaatcgata gattgattac cggtaggttg caatcattgc aaacatacgt 24540 tacacagcaa ttgattaggg ccgcagagat acgcgctagc gctaatctcg cagctactaa 24600 aatgtctgaa tgcgtactcg gacaatctaa acgtgtcgat ttttgcggta agggatatca 24660 tcttatgtct tttccacaat ctgcacctca cggagtcgtg tttttacacg ttacttatgt 24720 gccagctcaa gagaaaaatt ttacaaccgc tcctgctatt tgtcatgacg gtaaggcaca 24780 ttttcctaga gagggcgtat tcgtttctaa cggtacacat tggttcgtta cacaacgtaa 24840 tttttacgaa cctcaaatta ttactactga taatacattc gtatcaggta attgtgacgt 24900 agtgataggt atcgttaata atacagttta cgatccactt caacctgaac tcgatagttt 24960 taaagaggaa ctcgataagt attttaaaaa tcatacatca cctgacgtcg acttaggcga 25020 tatttcaggt attaacgcta gtgtcgttaa cattcaaaaa gagattgata gacttaacga 25080 agtcgctaaa aatcttaacg aatcacttat cgatctgcaa gagttaggta agtatgagca 25140 atatattaaa tggccttggt atatttggtt aggctttata gccggattga tcgcaatcgt 25200 tatggttaca attatgttat gttgtatgac atcatgttgt tcatgtctta agggatgttg 25260 ttcatgcgga tcatgttgta aatttgacga agacgattcc gaaccagtgc ttaaaggcgt 25320 taagttacat tatacataaa cgaacttatg gatttgttta tgagaatctt cacaattgga 25380 actgtaactt tgaagcaagg tgaaatcaag gatgctactc cttcagattt tgttcgcgct 25440 actgcaacga taccgataca agcctcactc cctttcggat ggcttattgt tggcgttgca 25500 cttcttgctg tttttcagag cgcttccaaa atcataaccc tcaaaaagag atggcaacta 25560 gcactctcca agggtgttca ctttgtttgc aacttgctgt tgttgtttgt aacagtttac 25620 tcacaccttt tgctcgttgc tgctggcctt gaagcccctt ttctctatct ttatgcttta 25680 gtctacttct tgcagagtat aaactttgta agaataataa tgaggctttg gctttgctgg 25740 aaatgccgtt ccaaaaaccc attactttat gatgccaact attttctttg ctggcatact 25800 aattgttacg actattgtat accttacaat agtgtaactt cttcaattgt cattacttca 25860 ggtgatggca caacaagtcc tatttctgaa catgactacc agattggtgg ttatactgaa 25920 aaatgggaat ctggagtaaa agactgtgtt gtattacaca gttacttcac ttcagactat 25980 taccagctgt actcaactca attgagtaca gacactggtg ttgaacatgt taccttcttc 26040 atctacaata aaattgttga tgagcctgaa gaacatgtcc aaattcacac aatcgacggt 26100 tcatccggag ttgttaatcc agtaatggaa ccaatttatg atgaaccgac gacgactact 26160 agcgtgcctt tgtaagcaca agctgatgag tacgaactta tgtactcatt cggttcggaa 26220 gagacaggta cgttaatagt taatagcgta cttctttttc ttgctttcgt ggtattcttg 26280 ctagttacac tagccatcct tactgcgctt cgattgtgtg cgtactgctg caatattgtt 26340 aacgtgagtc ttgtaaaacc ttctttttac gtttactctc gtgttaaaaa tctgaattct 26400 tctagagttc ctgatcttct ggtctaaacg aactaaatat tatattagtt tttctgtttg 26460 gaactttaat tttagccatg gcagattcca acggtactat taccgttgaa gagcttaaaa 26520 agctccttga acaatggaac ctagtaatag gtttcctatt ccttacatgg atttgtcttc 26580 tacaatttgc ctatgccaac aggaataggt ttttgtatat aattaagtta attttcctct 26640 ggctgttatg gccagtaact ttagcttgtt ttgtgcttgc tgctgtttac agaataaatt 26700 ggatcaccgg tggaattgct atcgcaatgg cttgtcttgt aggcttgatg tggctcagct 26760 acttcattgc ttctttcaga ctgtttgcgc gtacgcgttc catgtggtca ttcaatccag 26820 aaactaacat tcttctcaac gtgccactcc atggcactat tctgaccaga ccgcttctag 26880 aaagtgaact cgtaatcgga gctgtgatcc ttcgtggaca tcttcgtatt gctggacacc 26940 atctaggacg ctgtgacatc aaggacctgc ctaaagaaat cactgttgct acatcacgaa 27000 cgctttctta ttacaaattg ggagcttcgc agcgtgtagc aggtgactca ggttttgctg 27060 catacagtcg ctacaggatt ggcaactata aattaaacac agaccattcc agtagcagtg 27120 acaatattgc tttgcttgta cagtaagtga caacagatgt ttcatctcgt tgactttcag 27180 gttactatag cagagatatt actaattatt atgaggactt ttaaagtttc catttggaat 27240 cttgattaca tcataaacct cataattaaa aatttatcta agtcactaac tgagaataaa 27300 tattctcaat tagatgaaga gcaaccaatg gagattgatt aaacgaacat gaaaattatt 27360 cttttcttgg cactgataac actcgctact tgtgagcttt atcactacca agagtgtgtt 27420 agaggtacaa cagtactttt aaaagaacct tgctcttctg gaacatacga gggcaattca 27480 ccatttcatc ctctagctga taacaaattt gcactgactt gctttagcac tcaatttgct 27540 tttgcttgtc ctgacggcgt aaaacacgtc tatcagttac gtgccagatc agtttcacct 27600 aaactgttca tcagacaaga ggaagttcaa gaactttact ctccaatttt tcttattgtt 27660 gcggcaatag tgtttataac actttgcttc acactcaaaa gaaagacaga atgattgaac 27720 tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt gttttaatta 27780 tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact tgtcacgcct 27840 aaacgaacat gaaatttctt gttttcttag gaatcatcac aactgtagct gcatttcacc 27900 aagaatgtag tttacagtca tgtactcaac atcaaccata tgtagttgat gacccgtgtc 27960 ctattcactt ctattctaaa tggtatatta gagtaggagc tagaaaatca gcacctttaa 28020 ttgaattgtg cgtggatgag gctggttcta aatcacccat tcagtacatc gatatcggta 28080 attatacagt ttcctgttca ccttttacaa ttaattgcca ggaacctaaa ttgggtagtc 28140 ttgtagtgcg ttgttcgttc tatgaagact ttttagagta tcatgacgtt cgtgttgttt 28200 tagatttcat ctaaacgaac aaactaaaat gtctgataat ggaccccaaa atcagcgaaa 28260 tgcaccccgc attacgtttg gtggaccctc agattcaact ggcagtaacc agaatggaga 28320 acgcagtggg gcgcgatcaa aacaacgtcg gccccaaggt ttacccaata atactgcgtc 28380 ttggttcacc gctctcactc aacatggcaa ggaagacctt aaattccctc gaggacaagg 28440 cgttccaatt aacaccaata gcagtccaga tgaccaaatt ggctactacc gaagagctac 28500 cagacgaatt cgtggtggtg acggtaaaat gaaagatctc agtccaagat ggtatttcta 28560 ctacctagga actgggccag aagctggact tccctatggt gctaacaaag acggcatcat 28620 atgggttgca actgagggag ccttgaatac accaaaagat cacattggca cccgcaatcc 28680 tgctaacaat gctgcaatcg tgctacaact tcctcaagga acaacattgc caaaaggctt 28740 ctacgcagaa gggagcagag gcggcagtca agcctcttct cgttcctcat cacgtagtcg 28800 caacagttca agaaattcaa ctccaggcag cagtagggga acttctcctg ctagaatggc 28860 tggcaatggc ggtgatgctg ctcttgcttt gctgctgctt gacagattga accagcttga 28920 gagcaaaatg tctggtaaag gccaacaaca acaaggccaa actgtcacta agaaatctgc 28980 tgctgaggct tctaagaagc ctcggcaaaa acgtactgcc actaaagcat acaatgtaac 29040 acaagctttc ggcagacgtg gtccagaaca aacccaagga aattttgggg accaggaact 29100 aatcagacaa ggaactgatt acaaacattg gccgcaaatt gcacaatttg cccccagcgc 29160 ttcagcgttc ttcggaatgt cgcgcattgg catggaagtc acaccttcgg gaacgtggtt 29220 gacctacaca ggtgccatca aattggatga caaagatcca aatttcaaag atcaagtcat 29280 tttgctgaat aagcatattg acgcatacaa aacattccca ccaacagagc ctaaaaagga 29340 caaaaagaag aaggctgatg aaactcaagc cttaccgcag agacagaaga aacagcaaac 29400 tgtgactctt cttcctgctg cagatttgga tgatttctcc aaacaattgc aacaatccat 29460 gagcagtgct gactcaactc aggcctaaac tcatgcagac cacacaaggc agatgggcta 29520 tataaacgtt ttcgcttttc cgtttacgat atatagtcta ctcttgtgca gaatgaattc 29580 tcgtaactac atagcacaag tagatgtagt taactttaat ctcacatagc aatctttaat 29640 cagtgtgtaa cattagggag gacttgaaag agccaccaca ttttcaccga ggccacgcgg 29700 agtacgatcg agtgtacagt gaacaatgct agggagagct gcctatatgg aagagcccta 29760 atgtgtaaaa ttaattttag tagtgctatc cccatgtgat tttaatagct tcttaggaga 29820 atgac 29825 <210> 11 <211> 29825 <212> DNA <213> Artificial <220> <223> Synthetic Construct <400> 11 attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60 gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120 cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180 ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240 cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300 acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360 agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420 cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480 acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540 cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600 cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660 tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720 tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780 actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840 ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900 atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960 tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020 gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080 ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140 gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200 caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260 gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320 aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380 atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440 cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500 ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560 ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620 aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680 gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740 aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800 aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860 tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920 tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980 aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040 taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100 gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160 agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220 ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280 ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340 tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400 ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460 tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520 aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580 agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640 aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700 cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760 agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820 acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880 ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940 actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000 tgagtttata ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060 agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120 agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180 agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240 cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300 agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360 aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420 aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480 aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540 tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600 acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660 gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720 tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780 tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840 aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900 gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960 caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020 cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080 tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140 agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200 gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260 gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320 cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380 ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440 tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500 agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560 gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620 tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680 agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740 ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800 agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860 taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920 ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980 aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040 acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100 acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160 tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220 cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280 caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340 acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400 acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460 gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520 taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580 cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640 agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700 tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760 gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820 acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880 ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940 tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000 tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060 tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120 aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180 taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240 gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300 tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360 cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420 ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480 aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540 cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600 attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660 tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720 aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780 ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840 atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900 ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960 gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020 tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080 ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140 tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200 atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260 tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320 ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380 acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440 tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500 ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560 gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620 tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680 cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740 tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800 ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860 taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920 atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980 agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040 tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100 agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160 ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220 tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280 ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340 tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400 atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460 tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520 tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580 gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640 tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700 tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760 tgattttgac acatggttta gtcagcgtgg tggtagttat actaatgaca aagcttgccc 8820 attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880 gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940 tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000 ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060 ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120 acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180 tgttagagtg gtaacaacct ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240 agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300 atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360 accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420 tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagga gagcttttgg 9480 tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540 ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600 gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660 cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720 tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780 tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840 gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900 taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960 tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020 accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080 atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140 tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200 gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260 ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320 taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380 acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440 tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500 ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560 tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620 aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680 cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740 ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800 actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860 agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920 tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980 gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040 agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100 accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160 gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220 ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280 tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340 aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400 gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460 catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520 gttcttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580 tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640 ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700 ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760 gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820 tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880 actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940 ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000 ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060 agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120 atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180 ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240 ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300 gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360 gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420 aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480 tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540 atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600 tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660 ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720 gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780 caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840 atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900 ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960 aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020 acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080 tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140 taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200 ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260 ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320 acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380 ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440 gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500 ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560 aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620 gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680 caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740 ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800 aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860 acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920 gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980 cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040 attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100 gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160 ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220 ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280 aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340 tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400 ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460 gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520 ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580 cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640 cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700 gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760 ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820 ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880 gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940 tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000 tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060 caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120 tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180 gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240 atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300 aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360 aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420 caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480 tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540 acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600 cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660 tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720 gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780 aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840 actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900 aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960 ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020 tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080 tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140 gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200 tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260 aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320 tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380 gtttgcagtg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440 agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500 gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560 attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620 agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680 tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740 gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800 aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860 gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920 tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980 attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040 tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100 agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160 tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220 aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280 aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340 gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400 gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460 cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520 atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580 gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640 gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700 aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760 gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820 ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880 accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940 aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000 agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactt 18060 tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120 agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180 gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240 ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300 ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360 cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420 cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480 cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540 caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600 catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660 tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720 catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780 ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840 catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900 aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960 gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020 gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080 tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140 tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200 aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260 aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320 acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380 tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440 ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500 gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560 ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620 agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680 gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740 gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800 cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860 gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920 gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980 gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040 gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100 agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160 aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220 caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280 ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340 agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400 tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460 acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520 gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580 actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640 ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700 tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760 acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820 aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880 gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940 cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000 tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060 aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120 gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180 tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240 actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300 ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360 aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420 aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480 cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540 cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600 tcagtgtgtt aatcttataa ccagaactca atcatacact aattctttca cacgtggtgt 21660 ttattaccct gacaaagttt tcagatcctc agttttacat tcaactcagg acttgttctt 21720 acctttcttt tccaatgtta cttggttcca tgctatacat gtctctggga ccaatggtac 21780 taagaggttt gataaccctg tcctaccatt taatgatggt gtttattttg cttccactga 21840 gaagtctaac ataataagag gctggatttt tggtactact ttagattcga agacccagtc 21900 cctacttatt gttaataacg ctactaatgt tgttattaaa gtctgtgaat ttcaattttg 21960 taatgatcca tttttggatg tttattacca caaaaacaac aaaagttgga tggaaagtga 22020 gttcagagtt tattctagtg cgaataattg cacttttgaa tatgtctctc agccttttct 22080 tatggacctt gaaggaaaac agggtaattt caaaaatctt agggaatttg tgtttaagaa 22140 tattgatggt tattttaaaa tatattctaa gcacacgcct attaatttag ggcgtgatct 22200 ccctcagggt ttttcggctt tagaaccatt ggtagatttg ccaataggta ttaacatcac 22260 taggtttcaa actttacttg ctttacatag aagttatttg actcctggtg attcttcttc 22320 aggttggaca gctggtgctg cagcttatta tgtgggttat cttcaaccta ggacttttct 22380 attaaaatat aatgaaaatg gaaccattac agatgctgta gactgtgcac ttgaccctct 22440 ctcagaaaca aagtgtacgt tgaaatcctt cactgtagaa aaaggaatct atcaaacttc 22500 taactttaga gtccaaccaa cagaatctat tgttagattt cctaatatta caaacttgtg 22560 cccttttgat gaagttttta acgccaccag atttgcatct gtttatgctt ggaacaggaa 22620 gagaatcagc aactgtgttg ctgattattc tgtcctatat aatttcgcac catttttcgc 22680 ttttaagtgt tatggagtgt ctcctactaa attaaatgat ctctgcttta ctaatgtcta 22740 tgcagattca tttgtaatta gaggtaatga agtcagccaa atcgctccag ggcaaactgg 22800 aaatattgct gattataatt ataaattacc agatgatttt acaggctgcg ttatagcttg 22860 gaattctaac aagcttgatt ctaaggttgg tggtaattat aattacctgt atagattgtt 22920 taggaagtct aatctcaaac cttttgagag agatatttca actgaaatct atcaggccgg 22980 taacaaacct tgtaatggtg ttgcaggttt taattgttac tttcctttac gatcatatgg 23040 tttccgaccc acttatggtg ttggtcacca accatacaga gtagtagtac tttcttttga 23100 acttctacat gcaccagcaa ctgtttgtgg acctaaaaag tctactaatt tggttaaaaa 23160 caaatgtgtc aatttcaact tcaatggttt aacaggcaca ggtgttctta ctgagtctaa 23220 caaaaagttt ctgcctttcc aacaatttgg cagagacatt gctgacacta ctgatgctgt 23280 ccgtgatcca cagacacttg agattcttga cattacacca tgttcttttg gtggtgtcag 23340 tgttataaca ccaggaacaa atacttctaa ccaggttgct gttctttatc agggtgttaa 23400 ctgcacagaa gtccctgttg ctattcatgc agatcaactt actcctactt ggcgtgttta 23460 ttctacaggt tctaatgttt ttcaaacacg tgcaggctgt ttaatagggg ctgaatatgt 23520 caacaactca tatgagtgtg acatacccat tggtgcaggt atatgcgcta gttatcagac 23580 tcagcaatcc atcattgcct acactatgtc acttggtgca gaaaattcag ttgcttactc 23640 taataactct attgccatac ccacaaattt tactattagt gttaccacag aaattctacc 23700 agtgtctatg accaagacat cagtagattg tacaatgtac atttgtggtg attcaactga 23760 atgcagcaat cttttgttgc aatatggcag tttttgtaca caattaaaac gtgctttaac 23820 tggaatagct gttgaacaag acaaaaacac ccaagaagtt tttgcacaag tcaaacaaat 23880 ttacaaaaca ccaccaatta aatattttgg tggttttaat ttttcacaaa tattaccaga 23940 tccatcaaaa ccaagcaaga ggtcatttat tgaagatcta cttttcaaca aagtgacact 24000 tgcagatgct ggcttcatca aacaatatgg tgattgcctt ggtgatattg ctgctagaga 24060 cctcatttgc gctcaaaaat ttaacggact tacagtttta ccacctttac ttactgacga 24120 aatgattgcg caatatacat ccgcattgtt agccggaact attacatccg gatggacttt 24180 tggcgcaggc gcagcattac agattccatt cgctatgcaa atggcttata ggtttaacgg 24240 tataggcgtt acgcaaaacg tactttatga gaatcaaaaa cttatcgcta accaatttaa 24300 ttccgctatc ggtaagattc aggattcatt gtctagtact gctagtgcac tcggtaagtt 24360 gcaagacgta gtgaatcata acgctcaagc acttaataca ctcgttaaac agcttagttc 24420 taaatttggc gcaatttcta gtgtgcttaa cgatatacta tctagactcg ataaagtcga 24480 agccgaagtg caaatcgata gattgattac cggtaggttg caatcattgc aaacatacgt 24540 tacacagcaa ttgattaggg ccgcagagat acgcgctagc gctaatctcg cagctactaa 24600 aatgtctgaa tgcgtactcg gacaatctaa acgtgtcgat ttttgcggta agggatatca 24660 tcttatgtct tttccacaat ctgcacctca cggagtcgtg tttttacacg ttacttatgt 24720 gccagctcaa gagaaaaatt ttacaaccgc tcctgctatt tgtcatgacg gtaaggcaca 24780 ttttcctaga gagggcgtat tcgtttctaa cggtacacat tggttcgtta cacaacgtaa 24840 tttttacgaa cctcaaatta ttactactga taatacattc gtatcaggta attgtgacgt 24900 agtgataggt atcgttaata atacagttta cgatccactt caacctgaac tcgatagttt 24960 taaagaggaa ctcgataagt attttaaaaa tcatacatca cctgacgtcg acttaggcga 25020 tatttcaggt attaacgcta gtgtcgttaa cattcaaaaa gagattgata gacttaacga 25080 agtcgctaaa aatcttaacg aatcacttat cgatctgcaa gagttaggta agtatgagca 25140 atatattaaa tggccttggt atatttggtt aggctttata gccggattga tcgcaatcgt 25200 tatggttaca attatgttat gttgtatgac atcatgttgt tcatgtctta agggatgttg 25260 ttcatgcgga tcatgttgta aatttgacga agacgattcc gaaccagtgc ttaaaggcgt 25320 taagttacat tatacataaa cgaacttatg gatttgttta tgagaatctt cacaattgga 25380 actgtaactt tgaagcaagg tgaaatcaag gatgctactc cttcagattt tgttcgcgct 25440 actgcaacga taccgataca agcctcactc cctttcggat ggcttattgt tggcgttgca 25500 cttcttgctg tttttcagag cgcttccaaa atcataaccc tcaaaaagag atggcaacta 25560 gcactctcca agggtgttca ctttgtttgc aacttgctgt tgttgtttgt aacagtttac 25620 tcacaccttt tgctcgttgc tgctggcctt gaagcccctt ttctctatct ttatgcttta 25680 gtctacttct tgcagagtat aaactttgta agaataataa tgaggctttg gctttgctgg 25740 aaatgccgtt ccaaaaaccc attactttat gatgccaact attttctttg ctggcatact 25800 aattgttacg actattgtat accttacaat agtgtaactt cttcaattgt cattacttca 25860 ggtgatggca caacaagtcc tatttctgaa catgactacc agattggtgg ttatactgaa 25920 aaatgggaat ctggagtaaa agactgtgtt gtattacaca gttacttcac ttcagactat 25980 taccagctgt actcaactca attgagtaca gacactggtg ttgaacatgt taccttcttc 26040 atctacaata aaattgttga tgagcctgaa gaacatgtcc aaattcacac aatcgacggt 26100 tcatccggag ttgttaatcc agtaatggaa ccaatttatg atgaaccgac gacgactact 26160 agcgtgcctt tgtaagcaca agctgatgag tacgaactta tgtactcatt cggttcggaa 26220 gagacaggta cgttaatagt taatagcgta cttctttttc ttgctttcgt ggtattcttg 26280 ctagttacac tagccatcct tactgcgctt cgattgtgtg cgtactgctg caatattgtt 26340 aacgtgagtc ttgtaaaacc ttctttttac gtttactctc gtgttaaaaa tctgaattct 26400 tctagagttc ctgatcttct ggtctaaacg aactaaatat tatattagtt tttctgtttg 26460 gaactttaat tttagccatg gcagattcca acggtactat taccgttgaa gagcttaaaa 26520 agctccttga acaatggaac ctagtaatag gtttcctatt ccttacatgg atttgtcttc 26580 tacaatttgc ctatgccaac aggaataggt ttttgtatat aattaagtta attttcctct 26640 ggctgttatg gccagtaact ttagcttgtt ttgtgcttgc tgctgtttac agaataaatt 26700 ggatcaccgg tggaattgct atcgcaatgg cttgtcttgt aggcttgatg tggctcagct 26760 acttcattgc ttctttcaga ctgtttgcgc gtacgcgttc catgtggtca ttcaatccag 26820 aaactaacat tcttctcaac gtgccactcc atggcactat tctgaccaga ccgcttctag 26880 aaagtgaact cgtaatcgga gctgtgatcc ttcgtggaca tcttcgtatt gctggacacc 26940 atctaggacg ctgtgacatc aaggacctgc ctaaagaaat cactgttgct acatcacgaa 27000 cgctttctta ttacaaattg ggagcttcgc agcgtgtagc aggtgactca ggttttgctg 27060 catacagtcg ctacaggatt ggcaactata aattaaacac agaccattcc agtagcagtg 27120 acaatattgc tttgcttgta cagtaagtga caacagatgt ttcatctcgt tgactttcag 27180 gttactatag cagagatatt actaattatt atgaggactt ttaaagtttc catttggaat 27240 cttgattaca tcataaacct cataattaaa aatttatcta agtcactaac tgagaataaa 27300 tattctcaat tagatgaaga gcaaccaatg gagattgatt aaacgaacat gaaaattatt 27360 cttttcttgg cactgataac actcgctact tgtgagcttt atcactacca agagtgtgtt 27420 agaggtacaa cagtactttt aaaagaacct tgctcttctg gaacatacga gggcaattca 27480 ccatttcatc ctctagctga taacaaattt gcactgactt gctttagcac tcaatttgct 27540 tttgcttgtc ctgacggcgt aaaacacgtc tatcagttac gtgccagatc agtttcacct 27600 aaactgttca tcagacaaga ggaagttcaa gaactttact ctccaatttt tcttattgtt 27660 gcggcaatag tgtttataac actttgcttc acactcaaaa gaaagacaga atgattgaac 27720 tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt gttttaatta 27780 tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact tgtcacgcct 27840 aaacgaacat gaaatttctt gttttcttag gaatcatcac aactgtagct gcatttcacc 27900 aagaatgtag tttacagtca tgtactcaac atcaaccata tgtagttgat gacccgtgtc 27960 ctattcactt ctattctaaa tggtatatta gagtaggagc tagaaaatca gcacctttaa 28020 ttgaattgtg cgtggatgag gctggttcta aatcacccat tcagtacatc gatatcggta 28080 attatacagt ttcctgttca ccttttacaa ttaattgcca ggaacctaaa ttgggtagtc 28140 ttgtagtgcg ttgttcgttc tatgaagact ttttagagta tcatgacgtt cgtgttgttt 28200 tagatttcat ctaaacgaac aaactaaaat gtctgataat ggaccccaaa atcagcgaaa 28260 tgcaccccgc attacgtttg gtggaccctc agattcaact ggcagtaacc agaatggaga 28320 acgcagtggg gcgcgatcaa aacaacgtcg gccccaaggt ttacccaata atactgcgtc 28380 ttggttcacc gctctcactc aacatggcaa ggaagacctt aaattccctc gaggacaagg 28440 cgttccaatt aacaccaata gcagtccaga tgaccaaatt ggctactacc gaagagctac 28500 cagacgaatt cgtggtggtg acggtaaaat gaaagatctc agtccaagat ggtatttcta 28560 ctacctagga actgggccag aagctggact tccctatggt gctaacaaag acggcatcat 28620 atgggttgca actgagggag ccttgaatac accaaaagat cacattggca cccgcaatcc 28680 tgctaacaat gctgcaatcg tgctacaact tcctcaagga acaacattgc caaaaggctt 28740 ctacgcagaa gggagcagag gcggcagtca agcctcttct cgttcctcat cacgtagtcg 28800 caacagttca agaaattcaa ctccaggcag cagtagggga acttctcctg ctagaatggc 28860 tggcaatggc ggtgatgctg ctcttgcttt gctgctgctt gacagattga accagcttga 28920 gagcaaaatg tctggtaaag gccaacaaca acaaggccaa actgtcacta agaaatctgc 28980 tgctgaggct tctaagaagc ctcggcaaaa acgtactgcc actaaagcat acaatgtaac 29040 acaagctttc ggcagacgtg gtccagaaca aacccaagga aattttgggg accaggaact 29100 aatcagacaa ggaactgatt acaaacattg gccgcaaatt gcacaatttg cccccagcgc 29160 ttcagcgttc ttcggaatgt cgcgcattgg catggaagtc acaccttcgg gaacgtggtt 29220 gacctacaca ggtgccatca aattggatga caaagatcca aatttcaaag atcaagtcat 29280 tttgctgaat aagcatattg acgcatacaa aacattccca ccaacagagc ctaaaaagga 29340 caaaaagaag aaggctgatg aaactcaagc cttaccgcag agacagaaga aacagcaaac 29400 tgtgactctt cttcctgctg cagatttgga tgatttctcc aaacaattgc aacaatccat 29460 gagcagtgct gactcaactc aggcctaaac tcatgcagac cacacaaggc agatgggcta 29520 tataaacgtt ttcgcttttc cgtttacgat atatagtcta ctcttgtgca gaatgaattc 29580 tcgtaactac atagcacaag tagatgtagt taactttaat ctcacatagc aatctttaat 29640 cagtgtgtaa cattagggag gacttgaaag agccaccaca ttttcaccga ggccacgcgg 29700 agtacgatcg agtgtacagt gaacaatgct agggagagct gcctatatgg aagagcccta 29760 atgtgtaaaa ttaattttag tagtgctatc cccatgtgat tttaatagct tcttaggaga 29820 atgac 29825 <210> 12 <211> 29819 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 12 attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60 gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120 cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180 ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240 cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300 acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360 agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420 cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480 acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540 cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600 cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660 tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720 tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780 actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840 ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900 atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960 tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020 gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080 ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140 gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200 caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260 gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320 aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380 atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440 cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500 ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560 ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620 aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680 gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740 aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800 aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860 tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920 tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980 aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040 taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100 gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160 agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220 ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280 ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340 tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400 ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460 tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520 aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580 agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640 aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700 cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760 agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820 acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880 ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940 actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000 tgagtttata ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060 agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120 agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180 agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240 cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300 agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360 aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420 aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480 aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540 tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600 acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660 gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720 tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780 tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840 aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900 gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960 caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020 cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080 tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140 agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200 gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260 gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320 cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380 ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440 tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500 agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560 gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620 tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680 agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740 ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800 agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860 taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920 ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980 aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040 acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100 acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160 tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220 cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280 caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340 acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400 acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460 gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520 taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580 cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640 agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700 tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760 gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820 acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880 ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940 tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000 tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060 tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120 aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180 taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240 gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300 tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360 cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420 ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480 aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540 cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600 attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660 tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720 aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780 ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840 atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900 ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960 gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020 tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080 ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140 tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200 atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260 tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320 ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380 acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440 tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500 ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560 gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620 tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680 cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740 tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800 ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860 taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920 atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980 agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040 tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100 agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160 ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220 tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280 ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340 tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400 atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460 tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520 tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580 gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640 tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700 tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760 tgattttgac acatggttta gtcagcgtgg tggtagttat actaatgaca aagcttgccc 8820 attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880 gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940 tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000 ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060 ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120 acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180 tgttagagtg gtaacaacct ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240 agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300 atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360 accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420 tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagga gagcttttgg 9480 tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540 ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600 gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660 cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720 tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780 tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840 gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900 taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960 tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020 accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080 atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140 tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200 gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260 ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320 taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380 acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440 tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500 ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560 tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620 aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680 cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740 ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800 actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860 agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920 tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980 gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040 agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100 accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160 gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220 ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280 tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340 aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400 gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460 catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520 gttcttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580 tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640 ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700 ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760 gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820 tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880 actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940 ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000 ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060 agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120 atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180 ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240 ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300 gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360 gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420 aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480 tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540 atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600 tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660 ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720 gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780 caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840 atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900 ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960 aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020 acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080 tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140 taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200 ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260 ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320 acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380 ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440 gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500 ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560 aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620 gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680 caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740 ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800 aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860 acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920 gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980 cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040 attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100 gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160 ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220 ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280 aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340 tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400 ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460 gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520 ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580 cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640 cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700 gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760 ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820 ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880 gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940 tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000 tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060 caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120 tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180 gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240 atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300 aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360 aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420 caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480 tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540 acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600 cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660 tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720 gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780 aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840 actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900 aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960 ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020 tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080 tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140 gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200 tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260 aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320 tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380 gtttgcagtg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440 agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500 gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560 attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620 agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680 tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740 gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800 aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860 gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920 tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980 attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040 tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100 agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160 tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220 aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280 aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340 gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400 gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460 cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520 atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580 gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640 gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700 aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760 gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820 ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880 accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940 aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000 agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactt 18060 tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120 agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180 gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240 ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300 ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360 cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420 cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480 cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540 caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600 catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660 tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720 catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780 ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840 catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900 aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960 gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020 gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080 tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140 tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200 aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260 aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320 acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380 tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440 ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500 gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560 ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620 agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680 gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740 gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800 cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860 gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920 gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980 gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040 gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100 agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160 aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220 caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280 ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340 agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400 tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460 acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520 gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580 actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640 ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700 tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760 acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820 aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880 gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940 cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000 tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060 aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120 gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180 tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240 actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300 ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360 aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420 aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480 cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540 cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600 tcagtgtgtt aatcttataa ccagaactca atcatacact aattctttca cacgtggtgt 21660 ttattaccct gacaaagttt tcagatcctc agttttacat tcaactcagg acttgttctt 21720 acctttcttt tccaatgtta cttggttcca tgctatctct gggaccaatg gtactaagag 21780 gtttgataac cctgtcctac catttaatga tggtgtttat tttgcttcca ctgagaagtc 21840 taacataata agaggctgga tttttggtac tactttagat tcgaagaccc agtccctact 21900 tattgttaat aacgctacta atgttgttat taaagtctgt gaatttcaat tttgtaatga 21960 tccatttttg gatgtttatt accacaaaaa caacaaaagt tggatggaaa gtgagttcag 22020 agtttattct agtgcgaata attgcacttt tgaatatgtc tctcagcctt ttcttatgga 22080 ccttgaagga aaacagggta atttcaaaaa tcttagggaa tttgtgttta agaatattga 22140 tggttatttt aaaatatatt ctaagcacac gcctattaat ttagggcgtg atctccctca 22200 gggtttttcg gctttagaac cattggtaga tttgccaata ggtattaaca tcactaggtt 22260 tcaaacttta cttgctttac atagaagtta tttgactcct ggtgattctt cttcaggttg 22320 gacagctggt gctgcagctt attatgtggg ttatcttcaa cctaggactt ttctattaaa 22380 atataatgaa aatggaacca ttacagatgc tgtagactgt gcacttgacc ctctctcaga 22440 aacaaagtgt acgttgaaat ccttcactgt agaaaaagga atctatcaaa cttctaactt 22500 tagagtccaa ccaacagaat ctattgttag atttcctaat attacaaact tgtgcccttt 22560 tgatgaagtt tttaacgcca ccagatttgc atctgtttat gcttggaaca ggaagagaat 22620 cagcaactgt gttgctgatt attctgtcct atataatttc gcaccatttt tcgcttttaa 22680 gtgttatgga gtgtctccta ctaaattaaa tgatctctgc tttactaatg tctatgcaga 22740 ttcatttgta attagaggta atgaagtcag ccaaatcgct ccagggcaaa ctggaaatat 22800 tgctgattat aattataaat taccagatga ttttacaggc tgcgttatag cttggaattc 22860 taacaagctt gattctaagg ttggtggtaa ttataattac cggtatagat tgtttaggaa 22920 gtctaatctc aaaccttttg agagagatat ttcaactgaa atctatcagg ccggtaacaa 22980 accttgtaat ggtgttgcag gtgttaattg ttactttcct ttacaatcat atggtttccg 23040 acccacttat ggtgttggtc accaaccata cagagtagta gtactttctt ttgaacttct 23100 acatgcacca gcaactgttt gtggacctaa aaagtctact aatttggtta aaaacaaatg 23160 tgtcaatttc aacttcaatg gtttaacagg cacaggtgtt cttactgagt ctaacaaaaa 23220 gtttctgcct ttccaacaat ttggcagaga cattgctgac actactgatg ctgtccgtga 23280 tccacagaca cttgagattc ttgacattac accatgttct tttggtggtg tcagtgttat 23340 aacaccagga acaaatactt ctaaccaggt tgctgttctt tatcagggtg ttaactgcac 23400 agaagtccct gttgctattc atgcagatca acttactcct acttggcgtg tttattctac 23460 aggttctaat gtttttcaaa cacgtgcagg ctgtttaata ggggctgaat atgtcaacaa 23520 ctcatatgag tgtgacatac ccattggtgc aggtatatgc gctagttatc agactcagca 23580 atccatcatt gcctacacta tgtcacttgg tgcagaaaat tcagttgctt actctaataa 23640 ctctattgcc atacccacaa attttactat tagtgttacc acagaaattc taccagtgtc 23700 tatgaccaag acatcagtag attgtacaat gtacatttgt ggtgattcaa ctgaatgcag 23760 caatcttttg ttgcaatatg gcagtttttg tacacaatta aaacgtgctt taactggaat 23820 agctgttgaa caagacaaaa acacccaaga agtttttgca caagtcaaac aaatttacaa 23880 aacaccacca attaaatatt ttggtggttt taatttttca caaatattac cagatccatc 23940 aaaaccaagc aagaggtcat ttattgaaga tctacttttc aacaaagtga cacttgcaga 24000 tgctggcttc atcaaacaat atggtgattg ccttggtgat attgctgcta gagacctcat 24060 ttgcgctcaa aaatttaacg gacttacagt tttaccacct ttacttactg acgaaatgat 24120 tgcgcaatat acatccgcat tgttagccgg aactattaca tccggatgga cttttggcgc 24180 aggcgcagca ttacagattc cattcgctat gcaaatggct tataggttta acggtatagg 24240 cgttacgcaa aacgtacttt atgagaatca aaaacttatc gctaaccaat ttaattccgc 24300 tatcggtaag attcaggatt cattgtctag tactgctagt gcactcggta agttgcaaga 24360 cgtagtgaat caaaacgctc aagcacttaa tacactcgtt aaacagctta gttctaattt 24420 tggcgcaatt tctagtgtgc ttaacgatat actatctaga ctcgataaag tcgaagccga 24480 agtgcaaatc gatagattga ttaccggtag gttgcaatca ttgcaaacat acgttacaca 24540 gcaattgatt agggccgcag agatacgcgc tagcgctaat ctcgcagcta ctaaaatgtc 24600 tgaatgcgta ctcggacaat ctaaacgtgt cgatttttgc ggtaagggat atcatcttat 24660 gtcttttcca caatctgcac ctcacggagt cgtgttttta cacgttactt atgtgccagc 24720 tcaagagaaa aattttacaa ccgctcctgc tatttgtcat gacggtaagg cacattttcc 24780 tagagagggc gtattcgttt ctaacggtac acattggttc gttacacaac gtaattttta 24840 cgaacctcaa attattacta ctgataatac attcgtatca ggtaattgtg acgtagtgat 24900 aggtatcgtt aataatacag tttacgatcc acttcaacct gaactcgata gttttaaaga 24960 ggaactcgat aagtatttta aaaatcatac atcacctgac gtcgacttag gcgatatttc 25020 aggtattaac gctagtgtcg ttaacattca aaaagagatt gatagactta acgaagtcgc 25080 taaaaatctt aacgaatcac ttatcgatct gcaagagtta ggtaagtatg agcaatatat 25140 taaatggcct tggtatattt ggttaggctt tatagccgga ttgatcgcaa tcgttatggt 25200 tacaattatg ttatgttgta tgacatcatg ttgttcatgt cttaagggat gttgttcatg 25260 cggatcatgt tgtaaatttg acgaagacga ttccgaacca gtgcttaaag gcgttaagtt 25320 acattataca taaacgaact tatggatttg tttatgagaa tcttcacaat tggaactgta 25380 actttgaagc aaggtgaaat caaggatgct actccttcag attttgttcg cgctactgca 25440 acgataccga tacaagcctc actccctttc ggatggctta ttgttggcgt tgcacttctt 25500 gctgtttttc agagcgcttc caaaatcata accctcaaaa agagatggca actagcactc 25560 tccaagggtg ttcactttgt ttgcaacttg ctgttgttgt ttgtaacagt ttactcacac 25620 cttttgctcg ttgctgctgg ccttgaagcc ccttttctct atctttatgc tttagtctac 25680 ttcttgcaga gtataaactt tgtaagaata ataatgaggc tttggctttg ctggaaatgc 25740 cgttccaaaa acccattact ttatgatgcc aactattttc tttgctggca tactaattgt 25800 tacgactatt gtatacctta caatagtgta acttcttcaa ttgtcattac ttcaggtgat 25860 ggcacaacaa gtcctatttc tgaacatgac taccagattg gtggttatac tgaaaaatgg 25920 gaatctggag taaaagactg tgttgtatta cacagttact tcacttcaga ctattaccag 25980 ctgtactcaa ctcaattgag tacagacact ggtgttgaac atgttacctt cttcatctac 26040 aataaaattg ttgatgagcc tgaagaacat gtccaaattc acacaatcga cggttcatcc 26100 ggagttgtta atccagtaat ggaaccaatt tatgatgaac cgacgacgac tactagcgtg 26160 cctttgtaag cacaagctga tgagtacgaa cttatgtact cattcggttc ggaagagaca 26220 ggtacgttaa tagttaatag cgtacttctt tttcttgctt tcgtggtatt cttgctagtt 26280 acactagcca tccttactgc gcttcgattg tgtgcgtact gctgcaatat tgttaacgtg 26340 agtcttgtaa aaccttcttt ttacgtttac tctcgtgtta aaaatctgaa ttcttctaga 26400 gttcctgatc ttctggtcta aacgaactaa atattatatt agtttttctg tttggaactt 26460 taattttagc catggcagat tccaacggta ctattaccgt tgaagagctt aaaaagctcc 26520 ttgaacaatg gaacctagta ataggtttcc tattccttac atggatttgt cttctacaat 26580 ttgcctatgc caacaggaat aggtttttgt atataattaa gttaattttc ctctggctgt 26640 tatggccagt aactttagct tgttttgtgc ttgctgctgt ttacagaata aattggatca 26700 ccggtggaat tgctatcgca atggcttgtc ttgtaggctt gatgtggctc agctacttca 26760 ttgcttcttt cagactgttt gcgcgtacgc gttccatgtg gtcattcaat ccagaaacta 26820 acattcttct caacgtgcca ctccatggca ctattctgac cagaccgctt ctagaaagtg 26880 aactcgtaat cggagctgtg atccttcgtg gacatcttcg tattgctgga caccatctag 26940 gacgctgtga catcaaggac ctgcctaaag aaatcactgt tgctacatca cgaacgcttt 27000 cttattacaa attgggagct tcgcagcgtg tagcaggtga ctcaggtttt gctgcataca 27060 gtcgctacag gattggcaac tataaattaa acacagacca ttccagtagc agtgacaata 27120 ttgctttgct tgtacagtaa gtgacaacag atgtttcatc tcgttgactt tcaggttact 27180 atagcagaga tattactaat tattatgagg acttttaaag tttccatttg gaatcttgat 27240 tacatcataa acctcataat taaaaattta tctaagtcac taactgagaa taaatattct 27300 caattagatg aagagcaacc aatggagatt gattaaacga acatgaaaat tattcttttc 27360 ttggcactga taacactcgc tacttgtgag ctttatcact accaagagtg tgttagaggt 27420 acaacagtac ttttaaaaga accttgctct tctggaacat acgagggcaa ttcaccattt 27480 catcctctag ctgataacaa atttgcactg acttgcttta gcactcaatt tgcttttgct 27540 tgtcctgacg gcgtaaaaca cgtctatcag ttacgtgcca gatcagtttc acctaaactg 27600 ttcatcagac aagaggaagt tcaagaactt tactctccaa tttttcttat tgttgcggca 27660 atagtgttta taacactttg cttcacactc aaaagaaaga cagaatgatt gaactttcat 27720 taattgactt ctatttgtgc tttttagcct ttctgctatt ccttgtttta attatgctta 27780 ttatcttttg gttctcactt gaactgcaag atcataatga aacttgtcac gcctaaacga 27840 acatgaaatt tcttgttttc ttaggaatca tcacaactgt agctgcattt caccaagaat 27900 gtagtttaca gtcatgtact caacatcaac catatgtagt tgatgacccg tgtcctattc 27960 acttctattc taaatggtat attagagtag gagctagaaa atcagcacct ttaattgaat 28020 tgtgcgtgga tgaggctggt tctaaatcac ccattcagta catcgatatc ggtaattata 28080 cagtttcctg ttcacctttt acaattaatt gccaggaacc taaattgggt agtcttgtag 28140 tgcgttgttc gttctatgaa gactttttag agtatcatga cgttcgtgtt gttttagatt 28200 tcatctaaac gaacaaacta aaatgtctga taatggaccc caaaatcagc gaaatgcacc 28260 ccgcattacg tttggtggac cctcagattc aactggcagt aaccagaatg gagaacgcag 28320 tggggcgcga tcaaaacaac gtcggcccca aggtttaccc aataatactg cgtcttggtt 28380 caccgctctc actcaacatg gcaaggaaga ccttaaattc cctcgaggac aaggcgttcc 28440 aattaacacc aatagcagtc cagatgacca aattggctac taccgaagag ctaccagacg 28500 aattcgtggt ggtgacggta aaatgaaaga tctcagtcca agatggtatt tctactacct 28560 aggaactggg ccagaagctg gacttcccta tggtgctaac aaagacggca tcatatgggt 28620 tgcaactgag ggagccttga atacaccaaa agatcacatt ggcacccgca atcctgctaa 28680 caatgctgca atcgtgctac aacttcctca aggaacaaca ttgccaaaag gcttctacgc 28740 agaagggagc agaggcggca gtcaagcctc ttctcgttcc tcatcacgta gtcgcaacag 28800 ttcaagaaat tcaactccag gcagcagtag gggaacttct cctgctagaa tggctggcaa 28860 tggcggtgat gctgctcttg ctttgctgct gcttgacaga ttgaaccagc ttgagagcaa 28920 aatgtctggt aaaggccaac aacaacaagg ccaaactgtc actaagaaat ctgctgctga 28980 ggcttctaag aagcctcggc aaaaacgtac tgccactaaa gcatacaatg taacacaagc 29040 tttcggcaga cgtggtccag aacaaaccca aggaaatttt ggggaccagg aactaatcag 29100 acaaggaact gattacaaac attggccgca aattgcacaa tttgccccca gcgcttcagc 29160 gttcttcgga atgtcgcgca ttggcatgga agtcacacct tcgggaacgt ggttgaccta 29220 cacaggtgcc atcaaattgg atgacaaaga tccaaatttc aaagatcaag tcattttgct 29280 gaataagcat attgacgcat acaaaacatt cccaccaaca gagcctaaaa aggacaaaaa 29340 gaagaaggct gatgaaactc aagccttacc gcagagacag aagaaacagc aaactgtgac 29400 tcttcttcct gctgcagatt tggatgattt ctccaaacaa ttgcaacaat ccatgagcag 29460 tgctgactca actcaggcct aaactcatgc agaccacaca aggcagatgg gctatataaa 29520 cgttttcgct tttccgttta cgatatatag tctactcttg tgcagaatga attctcgtaa 29580 ctacatagca caagtagatg tagttaactt taatctcaca tagcaatctt taatcagtgt 29640 gtaacattag ggaggacttg aaagagccac cacattttca ccgaggccac gcggagtacg 29700 atcgagtgta cagtgaacaa tgctagggag agctgcctat atggaagagc cctaatgtgt 29760 aaaattaatt ttagtagtgc tatccccatg tgattttaat agcttcttag gagaatgac 29819 <210> 13 <211> 12 <212> PRT <213> Artificial <220> <223> Synthetic construct <400> 13 Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala Ser 1 5 10 <210> 14 <211> 36 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 14 actaattctc ctcggcgggc acgtagtgta gctagt 36 <210> 15 <211> 48 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 15 gataatacga ctcactatag attaaaggtt tataccttcc caggtaac 48 <210> 16 <211> 23 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 16 gatgccaaaa taatggcgat ctc 23 <210> 17 <211> 22 <212> DNA <213> Artificial <220> <223> Synthetic Construct <400> 17 gttggttgcc ataacaagtg tg 22 <210> 18 <211> 27 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 18 ctaattgagg ttgaacctca acaattg 27 <210> 19 <211> 28 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 19 gagtatggta ctgaagatga ttaccaag 28 <210> 20 <211> 24 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 20 ctaggtggaa tgtggtagga ttac 24 <210> 21 <211> 29 <212> DNA <213> Artificial <220> <223> Synthetic Construct <400> 21 gctgttacag cgtataatgg ttatcttac 29 <210> 22 <211> 29 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 22 gctggtttaa gtataatgtc tcctacaac 29 <210> 23 <211> 28 <212> DNA <213> Artificial <220> <223> Synthetic Construct <400> 23 gcacaaaacc agttgaaaca tcaaattc 28 <210> 24 <211> 28 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 24 gcaactagtg ttttgagttt ttccattg 28 <210> 25 <211> 25 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 25 gtgaagaatc atctgcaaaa tcagc 25 <210> 26 <211> 32 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 26 caaatgatat aagcaattgt tatccagaaa gg 32 <210> 27 <211> 35 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 27 gcctttaata ctttactatt ccttatgtca ttcac 35 <210> 28 <211> 27 <212> DNA <213> Artificial <220> <223> Synthetic Construct <400> 28 ccagacaaac tagtatcaac catatcc 27 <210> 29 <211> 25 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 29 gctatgggta ttattgctat gtctg 25 <210> 30 <211> 21 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 30 cctacaaggt ggttccagtt c 21 <210> 31 <211> 19 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 31 cgacagatgt cttgtgctg 19 <210> 32 <211> 25 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 32 ggtatccagt tgaaactaca aatgg 25 <210> 33 <211> 23 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 33 gatcagacat accacccaaa ttg 23 <210> 34 <211> 34 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 34 cttatgtatt gtaagtacaa atgaaagaca tcag 34 <210> 35 <211> 27 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 35 ggtgatgatt atgtgtacct tccttac 27 <210> 36 <211> 27 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 36 ctgttaattg cagatgaaac atcatgc 27 <210> 37 <211> 29 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 37 gtgtgtagac ttatgaaaac tataggtcc 29 <210> 38 <211> 21 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 38 catacaaact gccaccatca c 21 <210> 39 <211> 31 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 39 ccttgtagtg acaaagctta taaaatagaa g 31 <210> 40 <211> 21 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 40 ctggtgcaac tcctttatca g 21 <210> 41 <211> 28 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 41 gcaaagaatg ctattagaaa agtgtgac 28 <210> 42 <211> 32 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 42 gatagattcc tttttctaca gtgaaggatt tc 32 <210> 43 <211> 23 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 43 gactcctggt gattcttctt cag 23 <210> 44 <211> 23 <212> DNA <213> Artificial <220> <223> Synthetic Construct <400> 44 ctctagcagc aatatcacca agg 23 <210> 45 <211> 28 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 45 gcacaagtca aacaaattta caaaacac 28 <210> 46 <211> 28 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 46 caaaaggtgt gagtaaactg ttacaaac 28 <210> 47 <211> 19 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 47 ctcactccct ttcggatgg 19 <210> 48 <211> 32 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 48 gaggtttatg atgtaatcaa gattccaaat gg 32 <210> 49 <211> 29 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 49 gctacaggat tggcaactat aaattaaac 29 <210> 50 <211> 22 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 50 ccattctagc aggagaagtt cc 22 <210> 51 <211> 21 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 51 gcaatcctgc taacaatgct g 21 <210> 52 <211> 53 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 52 tttttttttt tttttttttt tttttgtcat tctcctaaga agctattaaa atc 53 <210> 53 <211> 55 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 53 gaataatacg actcactata gggacgttcg tgttgtttta gatttcatct aaacg 55 <210> 54 <211> 55 <212> DNA <213> Artificial <220> <223> Synthetic construct <400> 54 tttttttttt tttttttttt tgtcattctc ctaagaagct attaaaatca catgg 55

Claims (33)

  1. 모 SARS-CoV-2 변이체(parent SARS-CoV-2 variant)의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편을 코딩하는 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드로서,
    상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩된(recoded) 것이고,
    상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편의 아미노산 서열은 동일하게 유지되거나, 또는
    상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편의 아미노산 서열은 최대 20개의 아미노산 치환, 첨가 또는 결실을 포함하고,
    상기 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편은 스파이크 단백질 또는 그의 단편을 포함하는 것인 폴리뉴클레오티드.
  2. 청구항 1에 있어서,
    상기 모 SARS-CoV-2 변이체는 서열번호 1을 포함하거나, 또는
    상기 모 SARS-CoV-2 변이체는 nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1을 포함하거나, 또는
    상기 모 SARS-CoV-2 변이체는 서열번호 1을 포함하고, 서열번호 1에 하나 이상의 돌연변이가 있고; 및
    서열번호 1, 또는 nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 하나 이상의 돌연변이가 있는 것인 서열번호 1의 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된 것인 폴리뉴클레오티드.
  3. 청구항 1에 있어서, 상기 SARS-CoV-2 변이체는 영국 변이체, 남아프리카 변이체, 브라질 변이체, 델타 변이체, 및 오미크론 변이체로 구성된 군으로부터 선택되는 것인 폴리뉴클레오티드.
  4. 청구항 1 내지 3 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈-쌍 편향(CPB)을 감소시키거나 코돈 사용빈도 편향(codon usage bias)을 감소시키는 것에 의해 재코딩된 것인 폴리뉴클레오티드.
  5. 청구항 1 내지 3 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 CpG 또는 UpA 디뉴클레오티드의 수를 증가시키는 것에 의해 재코딩된 것인 폴리뉴클레오티드.
  6. 전술된 항 중 어느 한 항에 있어서, 각각의 재코딩된 하나 이상의 바이러스 단백질 또는 각각의 재코딩된 그의 하나 이상의 단편은 -0.05 미만, -0.1 미만, -0.2 미만, -0.3 미만, 또는 -0.4 미만의 코돈-쌍 편향을 갖는 것인 폴리뉴클레오티드.
  7. 전술된 항 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드에 비해 CPB 탈최적화된(deoptimized) 것인 폴리뉴클레오티드.
  8. 전술된 항 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드에 비해 코돈-탈최적화된 것인 폴리뉴클레오티드.
  9. 청구항 7 내지 8 중 어느 한 항에 있어서, 상기 코돈-탈최적화 또는 CPB 탈최적화는 인간에서 빈번하게 사용되는 코돈 또는 CPB에 근거한 것인 폴리뉴클레오티드.
  10. 청구항 7 내지 8 중 어느 한 항에 있어서, 상기 코돈-탈최적화 또는 CPB 탈최적화는 코로나바이러스에서 빈번하게 사용되는 코돈 또는 CPB에 근거한 것인 폴리뉴클레오티드.
  11. 청구항 7 내지 8 중 어느 한 항에 있어서, 상기 코돈-탈최적화 또는 CPB 탈최적화는 야생형 SARS-CoV-2 코로나바이러스에서 빈번하게 사용되는 코돈 또는 CPB에 근거한 것인 폴리뉴클레오티드.
  12. 전술된 항 중 어느 한 항에 있어서, 푸린 절단 부위가 제거된 것인 폴리뉴클레오티드.
  13. 청구항 1 내지 12 중 어느 한 항의 폴리뉴클레오티드를 포함하는 벡터.
  14. 청구항 1 내지 12 중 어느 한 항의 폴리뉴클레오티드, 또는 청구항 13의 벡터를 포함하는 세포.
  15. 청구항 14에 있어서, 상기 세포는 Vero 세포 또는 BHK(baby hamster kidney) 세포인 것인 세포.
  16. 청구항 1 내지 12 중 어느 한 항의 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드.
  17. 청구항 1 내지 12 중 어느 한 항의 폴리뉴클레오티드를 포함하는, 변형된 SARS-CoV-2 변이체.
  18. 청구항 1 내지 12 중 어느 한 항의 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하는, 변형된 SARS-CoV-2 변이체.
  19. 청구항 17 내지 19 중 어느 한 항에 있어서, 하나 이상의 바이러스 단백질의 발현이 모 SARS-CoV-2 변이체에 비해 감소된 것인 변형된 SARS-CoV-2 변이체.
  20. 청구항 17 내지 19 중 어느 한 항에 있어서, 하나 이상의 바이러스 단백질의 발현 감소는 스파이크 단백질 또는 그의 단편을 재코딩한 결과에 의한 것인 변형된 SARS-CoV-2 변이체.
  21. 청구항 17 내지 20 중 어느 한 항의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 면역 조성물 또는 백신 조성물.
  22. 청구항 21에 있어서, 변형된 SARS-CoV-2 코로나바이러스를 추가로 포함하고, 상기 변형된 SARS-CoV-2 코로나바이러스는
    서열번호 1, 또는 nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드로서, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 상기 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않은 것인 폴리뉴클레오티드, 또는
    서열번호 1, 또는 nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드로서, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 상기 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않은 것인 폴리펩티드를 포함하고,
    상기 면역 조성물 또는 백신 조성물은 다기 면역 조성물 또는 다가 백신 조성물인 것인 면역 조성물 또는 백신 조성물.
  23. 청구항 21 또는 청구항 22에 있어서, 약학적으로 허용되는 담체 또는 부형제를 추가로 포함하는 것인 면역 조성물 또는 백신 조성물.
  24. 대상체에서 면역 반응을 유도하는 방법으로서,
    청구항 17 내지 20 중 어느 한 항의 변형된 SARS-CoV-2 변이체, 또는
    청구항 21 내지 23 중 어느 한 항의 면역 조성물 또는 백신 조성물의 용량을 상기 대상체에게 투여하는 단계를 포함하는 것인 방법.
  25. 대상체에서 면역 반응을 유도하는 방법으로서,
    청구항 17 내지 20 중 어느 한 항의 변형된 SARS-CoV-2 코로나바이러스, 또는 청구항 21 내지 23 중 어느 한 항의 면역 조성물 또는 백신 조성물의 프라임 용량(prime dose)을 투여하는 단계, 및
    청구항 17 내지 20 중 어느 한 항의 변형된 SARS-CoV-2 코로나바이러스, 또는 청구항 21 내지 23 중 어느 한 항의 면역 조성물 또는 백신 조성물의 1회 이상의 부스트 용량(boost dose)을 투여하는 단계를 포함하는 것인 방법.
  26. 청구항 24 내지 25 중 어느 한 항에 있어서, 상기 면역 반응은 보호 면역 반응인 것인 방법.
  27. 청구항 24 내지 26 중 어느 한 항에 있어서, 상기 용량은 예방적 유효량 또는 치료적 유효량인 것인 방법.
  28. 청구항 24 내지 27 중 어느 한 항에 있어서, 투여가 비강 경로를 통해 이루어지는 것인 방법.
  29. 청구항 24 내지 27 중 어느 한 항에 있어서, 투여가 점비(nasal drop)를 통해 이루어지는 것인 방법.
  30. 청구항 24 내지 27 중 어느 한 항에 있어서, 투여가 비강 스프레이를 통해 이루어지는 것인 방법
  31. 청구항 24 내지 30 중 어느 한 항에 있어서, 상기 용량은 약 104-106 PFU이거나, 상기 프라임 용량은 약 104-106 PFU이고, 상기 1회 이상의 부스트 용량은 약 104-106 PFU인 것인 방법.
  32. 탈최적화된 SARS-CoV-2 변이체를 제조하는 방법으로서,
    모 SARS-CoV-2 변이체의 하나 이상의 단백질 또는 그의 하나 이상의 단편을 코딩하는 뉴클레오티드 서열을 수득하는 단계;
    상기 하나 이상의 단백질 또는 상기 그의 하나 이상의 단편의 단백질 발현을 감소시키기 위해 뉴클레오티드 서열을 재코딩하는 단계; 및
    재코딩된 뉴클레오티드 서열을 갖는 핵산을 모 SARS-CoV-2 변이체 게놈 내로 치환하여 탈최적화된 SARS-CoV-2 변이체 게놈을 제조하는 단계를 포함하고,
    상기 재코딩된 뉴클레오티드 서열의 발현은 모 바이러스에 비해 감소된 것인 방법.
  33. 청구항 32에 있어서, 상기 탈최적화된 SARS-CoV-2 변이체는 청구항 17 내지 20 중 어느 한 항의 변이체인 것인 방법.
KR1020247004613A 2021-07-07 2022-06-30 탈최적화된 sars-cov-2 변이체 및 그의 방법 및 용도 KR20240047977A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163219263P 2021-07-07 2021-07-07
US63/219,263 2021-07-07
PCT/US2022/035824 WO2023283106A1 (en) 2021-07-07 2022-06-30 Deoptimized sars-cov-2 variants and methods and uses thereof

Publications (1)

Publication Number Publication Date
KR20240047977A true KR20240047977A (ko) 2024-04-12

Family

ID=84800983

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247004613A KR20240047977A (ko) 2021-07-07 2022-06-30 탈최적화된 sars-cov-2 변이체 및 그의 방법 및 용도

Country Status (12)

Country Link
US (1) US20240299533A1 (ko)
EP (1) EP4366766A1 (ko)
JP (1) JP2024526316A (ko)
KR (1) KR20240047977A (ko)
CN (1) CN118215499A (ko)
AR (1) AR126396A1 (ko)
AU (1) AU2022306850A1 (ko)
CA (1) CA3229050A1 (ko)
IL (1) IL309956A (ko)
MX (1) MX2024000304A (ko)
TW (1) TW202309290A (ko)
WO (1) WO2023283106A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024052336A1 (en) 2022-09-05 2024-03-14 Freie Universität Berlin A live attenuated sars-cov-2 and a vaccine made thereof
EP4331602A1 (en) * 2022-09-05 2024-03-06 Freie Universität Berlin A live attenuated sars-cov-2 and a vaccine made thereof

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021055467A1 (en) * 2019-09-16 2021-03-25 University Of Miami Orally administrable nano-medicine for viral diseases
US10906944B2 (en) * 2020-06-29 2021-02-02 The Scripps Research Institute Stabilized coronavirus spike (S) protein immunogens and related vaccines

Also Published As

Publication number Publication date
WO2023283106A1 (en) 2023-01-12
EP4366766A1 (en) 2024-05-15
IL309956A (en) 2024-03-01
MX2024000304A (es) 2024-02-02
US20240299533A1 (en) 2024-09-12
AU2022306850A1 (en) 2024-02-01
CN118215499A (zh) 2024-06-18
CA3229050A1 (en) 2023-01-12
AR126396A1 (es) 2023-10-11
JP2024526316A (ja) 2024-07-17
TW202309290A (zh) 2023-03-01

Similar Documents

Publication Publication Date Title
US20240100151A1 (en) Variant strain-based coronavirus vaccines
KR20220132588A (ko) 탈최적화된 SARS-CoV-2 및 이의 방법 및 용도
US20240216500A1 (en) Respiratory virus combination vaccines
Casais et al. Reverse genetics system for the avian coronavirus infectious bronchitis virus
KR20240047977A (ko) 탈최적화된 sars-cov-2 변이체 및 그의 방법 및 용도
CN110079541B (zh) 一种构建冠状病毒感染性克隆的方法及其应用
EP3394085B1 (en) Feline calicivirus vaccine
KR20100019423A (ko) 백신에 유용한 약독화 바이러스
JP2002522078A (ja) 低温適応性ウマインフルエンザウィルス
EP1736539A1 (en) Attenuated SARS-CoV vaccines
JP7198759B2 (ja) 弱毒化表現型を有するヒト呼吸器多核体ウイルス(rsv)のためのワクチン候補
CA2413800A1 (en) Manipulation of negative stranded rna viruses by rearrangement of their genes and uses thereof
Ruan et al. Generation and evaluation of a vaccine candidate of attenuated and heat-resistant genotype VIII Newcastle disease virus
WO2022027749A1 (zh) 耐热表型稳定遗传、携带负标记的重组口蹄疫病毒无毒株及o/a型口蹄疫二价灭活疫苗
CN113073115B (zh) 一种包装重组流感病毒的重组载体和重组流感病毒及其构建方法和应用
KR20230038205A (ko) 키메라 rsv 및 코로나바이러스 단백질, 면역원성 조성물, 및 사용 방법
EP4181956A1 (en) Live-attenuated virus vaccine
CN112111467A (zh) 一种基因vii型新城疫标记疫苗株及其制备方法与应用
Inayoshi et al. Bacterial artificial chromosome-based reverse genetics system for cloning and manipulation of the full-length genome of infectious bronchitis virus
CN118620850B (zh) 一种禽传染性支气管炎病毒弱毒株的制备及其应用
CN111500547A (zh) 一种鸡传染性支气管炎重组病毒及其构建方法和应用
TW202400800A (zh) 用於預防和治療狂犬病毒感染的組合物和方法
CN118620850A (zh) 一种禽传染性支气管炎病毒弱毒株的制备及其应用
Khodabandehloo et al. Cloning of Rota Virus Outer Capsid Protein (VP7) Gene into the pGEM Vector
JP2006121948A (ja) 組換えウイルス